Русский ИТ бизнес 👨
Подписаться
Обработали 2 млн. товаров (!) с помощью ИИ. За сутки делаем 90к запросов. Сам не верю, но это работает стабильно. В день уходит 1000 р.

Сейчас в планах матчинг. Берем 10 товаров (цена, характеристики, название и т.п.), кидаем в думающую ИИ и просим вернуть % схожести товаров между собой. Это в теории работает, а на практике - хз что будет. Отпишусь, как будут итоги.

ИИ всегда возвращает % схожести от 0 до 1, но вопрос в галлюцинациях.

Русский ИТ бизнес

Комментарии (0)

  • vbelikov
    Может, вам пригодится: https://habr.com/ru/companies/wildberries/articles/911210/
  • mbkux
    кто-то стабильно под постами ставит средний палец) забавно
    • vbelikov
      Это Татьяна Ким не любит когда ее сайт парсят
  • Rusean1
    Какая ИИ?
    • GroupAnonymousBot
      gpt mini
  • yury_webscraping
    Проблема в том что 100%, вы не получите.
  • mtrnkwas
    Это задача регрессии. Берете для начала несколько тысяч товаров. Векторизуете, откладываете это будут features. Потом делаете как вы сейчас делаете - просите LLM выдать % матчинга. Затем все внимательно проверяете и готовый пакет данных используете как датасет для обучения LoghtGBM, CatBoost и т.д. В качестве features подаёте в модель вектора. В итоге у вас будет очень лёгкая модель, которая будет предсказывать целевую переменную мгновенно практически на любых объемах, ей не нужен больше GPU. И как бонус - она будет детерминирована, у неё не будет галлюцинаций. Это обычная задача машинного обучения.
  • username_ls_already_taken
    Пока сотрудники пилят проекты, которые не понятно как будут монетизироваться, какой канал кормит всю галеру?
  • yurimosoha
    Я обрабатывал 400 тысяч товаров , попросили сделать описание на какие-то мелочи, типа саморезов
    Использовал 15 аккаунтов groq ai , модель llama-3.1-8b-instant с лимитом 500 тысяч токенов в день
    Основная фишка была обработка 10 товаров в одном запросе для ускорения и учет лимита запросов на ключ в минуту
    15 ключей groq ai и 15 прокси ipv6 usa, многопоточность python