В Manticore Search добавили автоматическое создание эмбендингов.
Указываешь модель и при записи текста в базу сам движок делает автоматическую векторизацию (OpenAI, Hugging Face, Voyage, Jina), а потом позволяет по ней искать.
Почему это важно? Чтобы поиск сделать смыслово- похожим. Например, искать похожие товары. Крутая функция. Вот здесь детали. Выбор Manticore Search для нашего проекта poisk.im было самое умное решение :)
p.s. но это не поможет, если человек ищет "айфон 17", а в базе у нас iphone 17. Я вообще не знаю, как решить такую проблему алгоритмически :)
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться
Комментарии (0)
Подход интересует выбора новостей
Но в любом случае не умаляю заслуг админа.
Один как сейчас второй если не нашел, траслит, если нашел транслитное совпадение, выдает что есть.
Что то типа такого
Вот и ответ, что такое ии агент
Пользователь пишет эйфон 17 пра
LLM понимает что речь идет об IPhone 17 Pro и задает правильный запрос в мантикоре - та возвращает все найденные по ближайшим весам iphone 17 lite, iphone 17 bro, iphone 17 pro
LLM думает что пользователь запрос только один вариант про
Тогда модель делает ещё один запрос по категориям - Pro и остается единственный iphone 17 pro
Также, помимо LLM есть дедлвский способ: алгоритмы левинштейна и стемера портера
"Айфон" = "iPhone"
Вероятно в мантикоре такая же возможность есть
У меня даже название есть, если придумают - LLM