Стоимость и скорость обработки страниц сайта с помощью ИИ для выделения товаров. Это мы делаем такой сервис на мир.
Делюсь инсайтом, если кто-то хочет сказать спасибо - кидайте мне на лавандовый раф, бугага :) Ведь это живые данные, а не фантазии апологетов ИИ. А если серьезно - то пока довольно дорого выходит, т.к. слишком много токенов надо обрабатывать ИИ, чтобы из html выделять товарные сущности.
Придумываем идеи обнаружить xpath и дальше без ИИ уже выделять сущности.
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться

Комментарии (12)
Кидаешь нейронке html и просишь написать код который будет вытягивать из страницы данные нужные. Код встраиваешь в парсер.
Если алгоритм видит что пошли не релевантные данные (мусор html или пустые или длинные слишком) то снова просит нейронку поправить код!
Универсальный парсер!))
Минимум самый, это js! Он в раз дёргает все с дерева за секунду.. 😂 Аналогично можно построчно упаковать куда вам там надо и отдать текс в ИИ, если надо.
Js для этого и создали, чтоб бегать по html.. 😂
Дальше не скажу, включаем голову и в бой. 😁
Html в ИИ кидать чтоб текст дёрнуть.. Я просто мягкого говоря в ах*е.. 😂
https://habr.com/ru/companies/bothub/news/996090/