Нам дали фид КОМУС, ребята парсят и отдают нам ежедневно. Уже подключили к проекту poisk.im - прибыль делим 50-50. Парсят только характеристики и цены, а дальше наша ИИ формирует уникальные описание и т.п.
Картинки мы не храним, подгружаем "на лету" с указанием авторства. Моя мечта сделать гипермаркет данных постепенно обретает контуры, хоть и очень медленно.
На подходе еще около 10 крупных магазинов, которые мы не успеваем парсить сами. Объем такой, что одним слона не скушать.
Где деньги? Я думаю в API.
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться

Комментарии (0)
Это не цитирование это кража ресурсов и преследуется законом
https://t.me/Russian_IT_Business/309379
Я уже даже в мемные ролики это оформил.
Услышьте меня горе парсеры! Если вы не хотите утруждать себя и получать согласие донора, то развернете сервера в Индии, Пакистане и храните картинки там
На сайте делайте указание на источник и подсветку прямой ссылки, но фактическая ссылка будет в CDN Индии пусть туда едут и судятся
Коммерческая карточка товара преследует маркетинговую и сбытовую цель, не совпадающую с целями, перечисленными в ст. 1274 (информационные в узком правовом смысле, критика, наука и т.д.); потому ссылка на цитирование чаще отклоняется судами
Минимизировать изжогу
У меня так было. Дернул картинку заведения дал цитирование рекламу ссылку на источник
А в личку постучался фотограф :) хорошо что знакомый
Но я знал что этот фотограф славится успешно выигранными делами и убрал его изображения с сайта
Закон что дышло - куда повернул туда и вышло
А теперь, представьте ситуацию - сотни правообладателей спокойно выжидают момент когда ваш ресурс наберет обороты и вам прилетает 100 млн за нарушение
Может дешевле было бы как сервис Яндекс картинки выгружать исходники куда нибудь в Индию? И попутно сжимать, чтобы ваш сервис летал?
https://t.me/Russian_IT_Business/293494
Вот наглядный пример, как это реализовано в Яндекс картинки для магазина Эльдорадо. Публичная кнопка ведет на сайт донора и цитирует его
А именно рендеринг картинки идет с серверов Индии, где крутится новостной сайт сателлит. Также включено aria-hidden true, чтобы картинка не попала в интерфейс.
Наверняка Яндекс уже отладил свои процессы по всем канонам. Есть смысл изучить его юридические соглашения в части картинок и брать с него пример - запускать сети сайтов сателлитов под разные ниши и там же хранить картинки в CDN
но на практике хватает одного
+ поведенческий антибот с баном по ip
Есть что делить?