Нашел интересный материал, как очень быстро делать поиск по большому массиву информации... Вот здесь. Описывают, как как на одном сервере искать по 40 миллионам текстов примерно за 200 мс и сразу дают демо (я попробовал, по википедии ищет). Не сильно углублялся, там что-то связанное с векторизацией.
В общем если у вас (как у нас) есть задачи связанные с поиском по гигантским массивам - почитайте. Не знаю, что делаете вы, а я вот пытаюсь понять как эта шляпа работает :)
Русский ИТ бизнес
-
А что там понимать, векторный поиск, работает очень быстро, например, faiss есть либа, в память выгружаются вектора и готово-
Там статья большая с деталями -
Но по точным запросам /незнакомым для эмбеддера терминам ищет очень очень стремно-
Ну это понятно, магии не бывает. По точным перебирает, по неточным прыгает по индексу и берет "примерно похожее".
-
-
-
Очередной бесценный подгон!❤️
