Русский ИТ бизнес
Русский ИТ бизнес
Post media

Еще один интересный инструмент, который готовит данные для ИИ. Называется замысловато Kreuzberg. Вот здесь. На картинке сравнение с другими сервисами.

Если вы делаете что-то типа RAG, то это просто must have. На вход даете массу разного в разных видах, на выходе структурированный материал.

Русский ИТ бизнес
  • Пурпурный Бухгалтер
    Пурпурный Бухгалтер
    Можно пример что значит "на выходе структурированный материал." ?
    • Автор канала
      Автор канала
      markdown вытащенный из pdf/jpg
      • Пурпурный Бухгалтер
        Пурпурный Бухгалтер
        а качество этого markdown ?
        • Автор канала
          Автор канала
          для ИИ не очень важно. так то.
          • Пурпурный Бухгалтер
            Пурпурный Бухгалтер
            ну то что на выходе оно же не для ИИ, ведь так?
            • Автор канала
              Автор канала
              у нас для ИИ. получаем некий фарш из текста, дальше ИИ делает уже семантический разбор
  • Сквознячный Судья
    Сквознячный Судья
    А еще google недавно выкатил search tool, которая вообще любую неструктурированную инфу конвертит в структурированную для RAG, к примеру. Ну, хранение, естественно, платное
    • Сквознячный Судья
      Сквознячный Судья
      Хотя пишут, что бесплатное, плата только за векторизацию. Нужно, короче, пробовать. Я видел информацию, что хранение тоже платное. А так выглядит круто конечно
  • Сквознячный Судья
    Сквознячный Судья
    https://ai.google.dev/gemini-api/docs/file-search?hl=ru
  • Скользящий Червь
    Скользящий Червь
    это стартап из берлина, и кройцерб один из его центровых районов. не удивлен если они в нем и офис имеют
  • Скользящий Червь
    Скользящий Червь
    попробую этот тул, у нас свои кастомные парсеры и док билдеры есть, может этот как раз удобнее 🔍