Русский ИТ бизнес 👨
Подписаться
Post media
Нам дали фид КОМУС, ребята парсят и отдают нам ежедневно. Уже подключили к проекту poisk.im - прибыль делим 50-50. Парсят только характеристики и цены, а дальше наша ИИ формирует уникальные описание и т.п.

Картинки мы не храним, подгружаем "на лету" с указанием авторства. Моя мечта сделать гипермаркет данных постепенно обретает контуры, хоть и очень медленно.

На подходе еще около 10 крупных магазинов, которые мы не успеваем парсить сами. Объем такой, что одним слона не скушать.

Где деньги? Я думаю в API.

Русский ИТ бизнес

Комментарии (0)

  • Ut4J6
    Вот Комус счастлив наверное
  • dmitry236
    чё там парсить, вы просто не умеете это стабильно делать)
    • Ut4J6
      правильно, начинаем с самого начала, потому что многие еще не слышали этих серий
      • dmitry236
        опять ты
        • Ut4J6
          а ты не ты опять?
          • dmitry236
            с утра посрал и каши с бананом и орехами поел, я сегодня больше чем я
            • Ut4J6
              как у нас много общего
    • GroupAnonymousBot
      умеем, но не можем слишком много уже парсим
  • vxponomarev
    с картинками не поможет такой подход, это всеравно нарушение авторских прав от 10 000 за каждую фотку.
    • 200029589
      Мне жалобы постоянно приходят на картинки китайских товаров, на которых принт, спизженный с shutterstock. Типа, как на пикрелейтид - морда с пандой.
    • GroupAnonymousBot
      нет. вы не правы. это цитирование.
      • vxponomarev
        Я также парсил и также думал. Потом влип на 1500000. Адвокаты за 200000 даже не помогли. Могу прислать номер дела, напишите в личку.
        • alexy_os
          Макс никак не вкурит, что каждое дергание картинки с сайта донора это вызов http запроса и нагрузка на донора. С какой стати он будет делиться своей кровью за бесплатно?

          Это не цитирование это кража ресурсов и преследуется законом

          https://t.me/Russian_IT_Business/309379

          Я уже даже в мемные ролики это оформил.

          Услышьте меня горе парсеры! Если вы не хотите утруждать себя и получать согласие донора, то развернете сервера в Индии, Пакистане и храните картинки там

          На сайте делайте указание на источник и подсветку прямой ссылки, но фактическая ссылка будет в CDN Индии пусть туда едут и судятся
      • actxact
        У цитирования есть строго определенные цели и порядок, см статью 1274 ГК РФ.
        Верховный суд напоминает условия законного использования произведений: использование в научных, полемических, критических, информационных, учебных целях, в целях раскрытия творческого замысла автора; с обязательным указанием автора; с обязательным указанием источника заимствования; в объеме, оправданном целью цитирования.


        Коммерческая карточка товара преследует маркетинговую и сбытовую цель, не совпадающую с целями, перечисленными в ст. 1274 (информационные в узком правовом смысле, критика, наука и т.д.); потому ссылка на цитирование чаще отклоняется судами
        • GroupAnonymousBot
          Вы забываете что мы не продаем и отдаем заказы и клики магазинам.
          • actxact
            Ну тогда вам проще будет на мировое соглашение пойти :)
            • GroupAnonymousBot
              Посмотрим. А вообще я бы магазинам отдааал данные бесплатно . Все. Чтобы у них
              Минимизировать изжогу
              • alexy_os
                Может прилететь откуда не ждали. Например магазин использует не свой сервер хранения картинок а сервер фотографа

                У меня так было. Дернул картинку заведения дал цитирование рекламу ссылку на источник

                А в личку постучался фотограф :) хорошо что знакомый
                • GroupAnonymousBot
                  Еще раз - мы не продаем товары. Мы информационный посредник
                  • alexy_os
                    Я тоже не продавал и это был просто каталог заведений без коммерческой составляющей

                    Но я знал что этот фотограф славится успешно выигранными делами и убрал его изображения с сайта

                    Закон что дышло - куда повернул туда и вышло

                    А теперь, представьте ситуацию - сотни правообладателей спокойно выжидают момент когда ваш ресурс наберет обороты и вам прилетает 100 млн за нарушение

                    Может дешевле было бы как сервис Яндекс картинки выгружать исходники куда нибудь в Индию? И попутно сжимать, чтобы ваш сервис летал?

                    https://t.me/Russian_IT_Business/293494

                    Вот наглядный пример, как это реализовано в Яндекс картинки для магазина Эльдорадо. Публичная кнопка ведет на сайт донора и цитирует его

                    А именно рендеринг картинки идет с серверов Индии, где крутится новостной сайт сателлит. Также включено aria-hidden true, чтобы картинка не попала в интерфейс.

                    Наверняка Яндекс уже отладил свои процессы по всем канонам. Есть смысл изучить его юридические соглашения в части картинок и брать с него пример - запускать сети сайтов сателлитов под разные ниши и там же хранить картинки в CDN
                  • vxponomarev
                    Да да, я тоже на это давил в суде. Итог печальный. И да я не получал с этого прибыль. И картинки были через ембединг. Суду пофиг.
                    • GroupAnonymousBot
                      А можно ссылку на дело? Просто это очень странно 🤔
  • raskrytka
    у нас как-то тащили картинки и создавали нормальную такую паразитную нагрузку на сервер, стали подменять картинки, а у себя все ок. тащить перестали
    • Ut4J6
      что за картинки-то хоть? сами фоткали?
      • raskrytka
        счетчики информеры для сайтов 88-31 тащить начали . на кнопочках появились мигающие картинки. долго объяснять что и как
        • Ut4J6
          а это 242 ук рф?
          • raskrytka
            а как вы боретесь с ворами картинок которые кладут ваши сервера?
            • Ut4J6
              я написал картиночный сервер с ресайзом, кешированием, блекджеком и развернул в пяти экземплярах.
              но на практике хватает одного
              + поведенческий антибот с баном по ip
          • dmitry236
            вроде если нет открытого полового акта, то эксперты не признают за порнографию. Должна быть натуралистичная демонстрация полового акта и гениталий
            • Ut4J6
              тогда не понятно почему перестают брать улучшенные картинки
  • aromanenko
    Прибыль то есть?
    Есть что делить?
    • GroupAnonymousBot
      нету. но заказы на парсингу идут. соответственно нам легче делить 50-50 при заказе, чем тратить время свое. как-то так. но это пока теория
  • Aleksander_1883
    Где почитать про условия и требования к фидам ? .Net senior, готов рассмотреть
    • GroupAnonymousBot
      Я скину детали