База данных... или не совсем база данных в привычном понимании (как MySQL или Postgres), - новый подход к архитектуре RAG (Retrieval-Augmented Generation). Если кратко: это «убийца» векторного поиска для сложных документов :)
Проект называется PageIndex от компании VectifyAI. Вот здесь.
Обычный RAG работает так: режет текст на куски (чанки), превращает их в цифры (вектора) и ищет похожие по смыслу фрагменты. PageIndex делает иначе: он имитирует поведение человека. Когда вы открываете сложный отчет, вы не ищете "похожие слова», вы смотрите в оглавление, понимаете структуру и идете в нужный раздел. PageIndex строит иерархическое дерево (Tree Index) документа.
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться

Комментарии (9)
Эх что поделать, гении мыслят одинаково, но кто то делает на этом бабульки