Для создания эмбендингов (векторов) нам посоветовали (спасибо) вот эту ИИ. На русском языке показывает отличные результаты по точности. И бесплатно.
Если коротко - это компактная и быстрая модель эмбеддингов из библиотеки Sentence-Transformers, обученная распознавать смысловое сходство между текстами на многих языках...
Преобразует фразы в векторы фиксированной длины, которые можно сравнивать по сходству: близкие значения означают, что тексты похожи по смыслу.
Подходит для семантического поиска, поиска дубликатов/перефразов, кластеризации и рекомендаций. За счёт MiniLM (12 слоёв) даёт хороший баланс скорость/качество и низкие требования к ресурсам.
Иными словами - вы собрали информацию о товарах, сделали векторизацию и дальше пытаетесь найти схожие товары между собой опираясь на близость векторов :)
Русский ИТ бизнес
Русский ИТ бизнес
22 авг 2025 13:29
-
а качество векторов лучше чем у openai?
-
ну... тут я не скажу точно - но openAI на 12 месте на арене.
-
А hugging face на каком?
-
-
-
Максим, а для кого такой продукт делаете? Примерно представляете ЦА?
-
ох... это вопрос на миллион. честно говоря я до конца сам не понимаю
-
-
а бесплатно, это как? в облаке или на своем сервере?
-
можно на сервере своем.
-
-
Чет не очень на самом деле
-
-
Берите rubert-mini-frida