Русский ИТ бизнес 👨
Подписаться
Post media
Еще один интересный инструмент, который готовит данные для ИИ. Называется замысловато Kreuzberg. Вот здесь. На картинке сравнение с другими сервисами.

Если вы делаете что-то типа RAG, то это просто must have. На вход даете массу разного в разных видах, на выходе структурированный материал.

Русский ИТ бизнес

Комментарии (0)

  • P_Zakharevich
    Можно пример что значит "на выходе структурированный материал." ?
    • GroupAnonymousBot
      markdown вытащенный из pdf/jpg
      • P_Zakharevich
        а качество этого markdown ?
        • GroupAnonymousBot
          для ИИ не очень важно. так то.
          • P_Zakharevich
            ну то что на выходе оно же не для ИИ, ведь так?
            • GroupAnonymousBot
              у нас для ИИ. получаем некий фарш из текста, дальше ИИ делает уже семантический разбор
  • mike_kozyakov
    А еще google недавно выкатил search tool, которая вообще любую неструктурированную инфу конвертит в структурированную для RAG, к примеру. Ну, хранение, естественно, платное
    • mike_kozyakov
      Хотя пишут, что бесплатное, плата только за векторизацию. Нужно, короче, пробовать. Я видел информацию, что хранение тоже платное. А так выглядит круто конечно
  • mike_kozyakov
    https://ai.google.dev/gemini-api/docs/file-search?hl=ru
  • solowaved
    это стартап из берлина, и кройцерб один из его центровых районов. не удивлен если они в нем и офис имеют
  • solowaved
    попробую этот тул, у нас свои кастомные парсеры и док билдеры есть, может этот как раз удобнее 🔍