Русский ИТ бизнес 👨
Подписаться
Manticore Search - все же очень мощная штука для поиска. Например, из коробки поддерживает транслитерацию (я ошибся в написании, он понял и нашел нужное - слово проволока). В новой версии работает с векторизацией и т.п.

А что главное - очень живое и активное русскоязычное соообщество в Телеграмме (легко найдете). В общем - всяческие рекомендую. А т.к. это open source, получается что можете подаваться и в реестр отечественного ПО.

Сейчас в базе poisk.im 6 млн. товаров - работает моментально. Думаю до 15-20 млн. так и будет, а сервер слабоват. Кстати, написан на С++ этот поисковый движок.

Русский ИТ бизнес

Комментарии (0)

  • mtrnkwas
    Сколько памяти на сервере?
    • GroupAnonymousBot
      128 кажется. он не оч мощный
      • mtrnkwas
        128 гб для 10 млн товаров это за глаза. Если вы используете эмбеддинги float32, то можете спокойно квантовать до float16 без потери качества, плюс можете Product Quantization применить. Ваш сервер должен мгновенно искать не то что среди 10 млн товаров, а среди 1 миллиарда.
        • GroupAnonymousBot
          1 млрд мы не осилим :) уже буксуем по парсингу. там же поддержка растет
          • mtrnkwas
            Я к тому, что вам ваш сервер вряд ли удастся перерасти по объемам, который он может переварить. Для векторного поиска важна память. ЦПУ тоже важен, но больше в момент индексации, но для 10 млн записей это тоже не играет никакой роли.