Гениально. Парни просто не поняли, что их уже заменили...
Индийские заводчане носят камеры на голове для обучения роботов. Для корпораций это бесплатно, а датасет уникален и не генерируется синтетически. Люди сами создают себе замену и улыбаются :) Довольные.
🟪 MAX ❤ TG

Комментарии (9)
• краулинг (открыть главную страницу, открыть robots.txt, учесть правила обхода страниц, начать двигаться по страницам)
• парсинг (извлечение необходимых сущностей со страниц)
• поведенческая js логика (когда надо предварительно выбрать регион, совершить действия на странице)
ребята типа oxylabs, brightdata сделали изначально акцент на инфраструктуре для краулинга, но, вангую, всё остальное скоро будет на уровне описания необходимого на естественном языке
т.е. все твои головастики окажутся не нужны, потому что по факту только пишут регулярки и выбирают селекторы. Краулинг и сегментация типов страниц — полностью решенная задача.
Единственное что будет спасать — изоляция ру рынка.
Пару лет назад таких ИИ не было, ситуация быстро меняется. Я в fb уже не единожды в своей ленте видел, что люди сами что-то распарсили с ИИ, при том что раньше они выходили на фриланс. Я думаю кормовая база будет снижаться.
Это я к тому, что пора бы уже сейчас думать, что будете делать дальше, ну и рис с сушками купить по комфортной цене можно на будущее