Русский ИТ бизнес 👨
Подписаться
Я на днях обсуждал с юристами (оплатил за анализ 50к) как нам обезопасить проект poisk.im от потенциальных претензий правообладетелей контента, который собираем методом парсинга.

Основными выводами поделюсь позже, ну а пока нам посоветовали сделать вкладку "Правообладателям" где расписать что и как мы делаем, плюс более видимо нанести кто владелец изображений на картинки. Сами картинки мы не храним у себя, подгружаем по ссылке.

Радует, что в целом, юристы не нашли ярких нарушений в нашей деятельности, хотя самое узкое место - картинки. Как я понял судебная практика тут разнится - можно ли по ссылке открывать или нет...

Русский ИТ бизнес

Комментарии (0)

  • alexandrmtn
    Вспомнилось 😄
  • 625115967
    А похожи рекомендации юристов на рекомендации нейросетей?
    • GroupAnonymousBot
      Нет
    • rusrich1
      Тоже подумал об этом. Gemini в режиме deep search не хуже бы справился)

      Недавно один юридический аспект нужно было уточнить. Так мне ни бухгалтеры, ни юристы не могли решение предложить.
      Gemini справился лучше них всех вместе взятых и привел ссылку на пояснительную записку от министра в 2022 году.
      Я перепроверил, действительно, такое есть.
      Экономить теперь получится хорошо)
  • parts_soft_ru
    Узкое место с картинками получается. Достаточно лемане ограничить домены которым при запросов с которых отдается изображение и у вас все накроется.
    • alexy_os
      Чтобы не накрылось можно картинки прогонять через конвертор, сжимать, накладывать бренд владельца , переводить в формат webp и др современные и отправлять в CDN сети

      В сжатом состоянии они будут мало весить

      И уже на сайте поиск выводить из CDN

      Да придется повозиться, но оно стоит того
      • bonchb
        Ха ха. Если для парсинга или компаний которые тысячи позиций с картинками загоняют на сайты то мне болезному просто интересно сколько времени займет вот эта лишняя процедура не то чтобы искажать картинки чтобы не прицепились, а просто тупо накладывать свой водяной знак? Вы пробовали сколько по времени занимает одна процедура даже на современном железе? Макс четко указал что они ссылки на картнки парсят. Еще бы, если они еще скачивать эти картинки тысячами будут то будут врежиме постоянно завис. Тут скорее надо петлять так - товарищ клиент, мы вам спарсим все каталоги с ссылками на картинки. Но если вы хотите эти спарсенные картинки товаров использовать у себя то меняйте в генераторах и прочее. Мы умываем руки.
        • alexy_os
          Немного не так

          Макс парсит товарную позицию и там URL на источник

          Отдельный сервис на 5 локациях CDN умеет в API

          Парсер Макса автоматически отправляет URL источника картинки в сервис который возвращает URL CDN сразу с брендированием например url автора

          Это по умолчанию

          Теперь настройки на стороне парсера
          - указывается что брать за бренд url или название компании
          - указывается степень сжатия и формат webp или avif
          - другие настойки например корректировка цвета, яркости, резкости и др

          Все эти настройки передаются в параметрах url rest api

          1 секунда и у тебя ссылка с брендом. Парсер заменяет ссылку источника на ссылку cdn (сохраняя ссылку на источник на случай недоступности)

          Профит
  • bogomis
    Макс, дай задачу проггерам, чтобы подгружали блок текста "Правообладателям" через js, т.к. все карточки могут улететь в МПК из-за массового дублирования.
    • GroupAnonymousBot
      Блок закрыт от индексации
      • bogomis
        В каком месте https://disk.yandex.com/d/NmlGAYgXihkYsw ?
        • dmitry236
          Не пали контору, раз сказали что всё закрыто, значит закрыто
          • bogomis
            Ну, раз Максим решил стать сеошником в 2025 году, то чё б не подсказать юному подавану?!
          • GroupAnonymousBot
            Он успел нахватать . Не сразу поняли
            • bogomis
              Вы и сейчас не поняли 😅. Кстати, Макс, могу помочь тебе устроиться на стажировку в SEO-контору. Правда придется отстегнуть им за воспитание и наставление 25к/мес. (они же тоже время на тебя будут тратить). Ну, сам понимаешь - рынок работодателя нынче.
              • Ut4J6
                дада и родителей привести - тренд нынче такой
                • dmitry236
                  всё началось с совместных походов в поликлинику
                  • Ut4J6
                    после того как я в три года сбежал из детского сада к бабушке, мои родители никуда со мной не ходили, только пару раз в травмпункт
      • dmitry236
        а ты в этом уверен?)
  • bogdansooooo
    можно отправлять любую картинку в нана банана и попросить нарисовать под другим углом. и это будет ваша уникальная картинка именно этого товара
    • GroupAnonymousBot
      Это очень дорого
    • dmitry236
      не будет, таких умельцев как-то нахлобучили, потому что на исходнике остался какой-то значок от правообладателей и иишка просто повернула его
      • bogdansooooo
        это можно решить промптом
        • dmitry236
          не можно, на миллинах товаров будут галлюцинации, а руками проверять никто не будет
          • bogdansooooo
            я не согласен, эту проблему можно решить с nano banana. проблема только в цене
  • bogdansooooo
    юристы такого не посоветуют 😎
  • olegsoko
    Вообще-то картинки этот тоже SEO контент. Идея об отмывке авторских прав вполне здравая, ибо так делают многие на недружественным западе. Атрибуты картинок хорошо индексируются как поисковиками так и нейросетями. Перерисуй мне этот в интерьере дорогой ванны с красивым женским бельем
    • GroupAnonymousBot
      никаких токенов не хватит
      • rusrich1
        Вообще желательно изображения к себе на s3 складывать
        Перед этим преобразования выполнить в разные размеры и форматы: avif webp jpg.
        Во-первых: на сео должно тоже повлиять, что у вас свои урлы на изображения,
        во-вторых: стандартизируете размеры, что обеспечит скорость загрузки страниц.

        Это всё актуально, если я правильно понял, что урлы на картинки вы подтягиваете со стороны
        • GroupAnonymousBot
          нельзя. это нарушение закона. мы щас не храним картинки у себя. это сильная позиция.
          • rusrich1
            Понимаю
            Но, думаю вам стоит Gemini помучить, возможно что-нибудь предложит стоящее.

            Если площадка убирает позицию, то вероятно и картинки становятся недоступны. Поисковики видят это и понижают рейтинг страницы.
            Хотя вам виднее.
            • GroupAnonymousBot
              я понимаю. и хотел бы хранить картинки у нас :)
        • alexy_os
          Как Вам бизнес идея?

          https://t.me/Russian_IT_Business/293263

          Решает проблему страха владельцев чтобы «не хранить у себя». Полностью изолированный сервис CDN на 5 локациях для начала - Питер - Мск.

          Сервис даже можно согласовать с минцифры обосновать тем что каждая картинка с ссылкой на первоисточник с ьоендлм поверх + записью в мета данных EXIF, IPTC, XMP

          Получается единый каталог легальных картинок доступных по cdn и rest api

          При этом права на картинки не нарушены и все сайты являются источниками которые ссылаются на донорами
          • alextezin
            Только кому это надо и кто будет за это платить ?
            • alexy_os
              Все кому прилетит .5 млн за нарушение интеллектуальной собственности
          • KraftDev
            Дак а как это поможет юридически?
            Нельзя распространять "чужие" фото. Сохранить себе и не кому не показывать можно, распространять нельзя, особенно если конечная цель получение прибыли хотя бы косвенно полученной благодаря чужим фотографиям.
            Хоть как то сгладить этот момент помогает загрузка в браузере клиента оригинала фотографии с оригинального url, то есть оригинального сервера предполагаемого правообладателя, то есть самого интернет магазина + указание этого факта прям текстом.
            А вы предлагаете взять фото, ещё наложить на него допустим логотип магазина, а ещё сохранить к себе, пусть да же на сторонний домен. Ну это точный залет.
            • alexy_os
              Вопросов однозначно много с учетом новых законов

              Отталкиваюсь исключительно от советов юристов


              https://t.me/bezsmuzi/11072

              расписать что и как мы делаем, плюс более видимо нанести кто владелец изображений на картинки

              А так-то конечно молча тырить не вариант. И вот такой промежуточный сервис как раз мог взять на удар себя. Что лучше забанить сервис который тут же открыть на другом домене или если забанят poisk im? Что лучше - предъявят нанайцу (ип) или ооо?

              Вопросов все еще много

              Я поэтому и предлагаю запилить пробную версию и сразу согласовать с минцифры
      • olegsoko
        RPA + индиец с 10 акаунтами нейросеток
      • olegsoko
        И не надо делать все сразу 100-1000-10000 и тп
        • GroupAnonymousBot
          а что такое RPA? про индуса поня
          • olegsoko
            Настройка повторяющихся действий браузерным путем
          • olegsoko
            индийца
  • alexy_os
    Идея прогонять картинки через cdn взята не с потолка

    Так делает яндекс. При наведении на кнопку открыть - ссылка ведет на правообладателя

    Рендер по факту работает через промежуточный cdn

    Так что можно и нужно изучить политики яндекса в отношении правообладателей

    P.S. Информация носит справочный характер и может быть недостоверной )
    • alexy_os
      И вишенка на торте

      Промежуточный cdn вылет на новостной сайт индусов

      Кому предъявлять штраф?
    • mtrnkwas
      Кстати, резонное замечание. Чем продукт Макса отличается от Яндекса? И тот и другой поисковик, она действует в том же самом правовом пространстве.
      • alexy_os
        Сейчас проверил ещё несколько картинок и там идет разные сети cdn где то даже прямые сервера яндекса

        То есть, они даже это регулируют

        Вредина и упертый прогоняется через Индию и острова Манилы

        А безопасный с точки зрения штрафов через свои сервера ))

        P.S. Информация носит справочный характер и не хочет нанести вред госу, на которого найдется другой гос
  • Gesbes
    И, какая стоимость будет 1 позиции товара ?
  • KhanvasSvoy
    Прям реально картинки у вас это гиперссылка на сайт Лемана про ?)) без кеширования на ваших сайтах ? В коде страницы вашей прямая ссылка ?
    • GroupAnonymousBot
      нет. все ссылки на сайт леруа