Русский ИТ бизнес
Русский ИТ бизнес

Для создания эмбендингов (векторов) нам посоветовали (спасибо) вот эту ИИ. На русском языке показывает отличные результаты по точности. И бесплатно.

Если коротко - это компактная и быстрая модель эмбеддингов из библиотеки Sentence-Transformers, обученная распознавать смысловое сходство между текстами на многих языках...

Преобразует фразы в векторы фиксированной длины, которые можно сравнивать по сходству: близкие значения означают, что тексты похожи по смыслу.

Подходит для семантического поиска, поиска дубликатов/перефразов, кластеризации и рекомендаций. За счёт MiniLM (12 слоёв) даёт хороший баланс скорость/качество и низкие требования к ресурсам.

Иными словами - вы собрали информацию о товарах, сделали векторизацию и дальше пытаетесь найти схожие товары между собой опираясь на близость векторов :)

Русский ИТ бизнес
  • Полосатый Павлин Полосатый Павлин
    а качество векторов лучше чем у openai?
    • Автор канала Автор канала
      ну... тут я не скажу точно - но openAI на 12 месте на арене.
      • Солёный Инспектор Солёный Инспектор
        А hugging face на каком?
  • Лазурный Бунтарь Лазурный Бунтарь
    Максим, а для кого такой продукт делаете? Примерно представляете ЦА?
    • Автор канала Автор канала
      ох... это вопрос на миллион. честно говоря я до конца сам не понимаю
  • Лохматый Осьминог Лохматый Осьминог
    а бесплатно, это как? в облаке или на своем сервере?
    • Автор канала Автор канала
      можно на сервере своем.
  • Пушистый Ястреб Пушистый Ястреб
    Чет не очень на самом деле
  • Пушистый Ястреб Пушистый Ястреб
  • Пушистый Ястреб Пушистый Ястреб
    Берите rubert-mini-frida