Русский ИТ бизнес
Русский ИТ бизнес
Post media

Нашел интересный материал, как очень быстро делать поиск по большому массиву информации... Вот здесь. Описывают, как как на одном сервере искать по 40 миллионам текстов примерно за 200 мс и сразу дают демо (я попробовал, по википедии ищет). Не сильно углублялся, там что-то связанное с векторизацией.

В общем если у вас (как у нас) есть задачи связанные с поиском по гигантским массивам - почитайте. Не знаю, что делаете вы, а я вот пытаюсь понять как эта шляпа работает :)

Русский ИТ бизнес
  • Бестелесный Крокодил
    Бестелесный Крокодил
    А что там понимать, векторный поиск, работает очень быстро, например, faiss есть либа, в память выгружаются вектора и готово
    • Автор канала
      Автор канала
      Там статья большая с деталями
    • Пушистый Ястреб
      Пушистый Ястреб
      Но по точным запросам /незнакомым для эмбеддера терминам ищет очень очень стремно
      • Пряный Единорог
        Пряный Единорог
        Ну это понятно, магии не бывает. По точным перебирает, по неточным прыгает по индексу и берет "примерно похожее".
  • Легендарный Багет
    Легендарный Багет
    Очередной бесценный подгон!❤️