Русский ИТ бизнес
Русский ИТ бизнес

Я на днях обсуждал с юристами (оплатил за анализ 50к) как нам обезопасить проект poisk.im от потенциальных претензий правообладетелей контента, который собираем методом парсинга.

Основными выводами поделюсь позже, ну а пока нам посоветовали сделать вкладку "Правообладателям" где расписать что и как мы делаем, плюс более видимо нанести кто владелец изображений на картинки. Сами картинки мы не храним у себя, подгружаем по ссылке.

Радует, что в целом, юристы не нашли ярких нарушений в нашей деятельности, хотя самое узкое место - картинки. Как я понял судебная практика тут разнится - можно ли по ссылке открывать или нет...

Русский ИТ бизнес
  • Органический Андроид Органический Андроид
    Вспомнилось 😄
  • Неоновый Клон Неоновый Клон
    А похожи рекомендации юристов на рекомендации нейросетей?
    • Автор канала Автор канала
      Нет
    • Пухлый Воробей Пухлый Воробей
      Тоже подумал об этом. Gemini в режиме deep search не хуже бы справился)

      Недавно один юридический аспект нужно было уточнить. Так мне ни бухгалтеры, ни юристы не могли решение предложить.
      Gemini справился лучше них всех вместе взятых и привел ссылку на пояснительную записку от министра в 2022 году.
      Я перепроверил, действительно, такое есть.
      Экономить теперь получится хорошо)
  • Сказочный Пёс Сказочный Пёс
    Узкое место с картинками получается. Достаточно лемане ограничить домены которым при запросов с которых отдается изображение и у вас все накроется.
    • Робкий Киллер Робкий Киллер
      Чтобы не накрылось можно картинки прогонять через конвертор, сжимать, накладывать бренд владельца , переводить в формат webp и др современные и отправлять в CDN сети

      В сжатом состоянии они будут мало весить

      И уже на сайте поиск выводить из CDN

      Да придется повозиться, но оно стоит того
      • Закатный Писатель Закатный Писатель
        Ха ха. Если для парсинга или компаний которые тысячи позиций с картинками загоняют на сайты то мне болезному просто интересно сколько времени займет вот эта лишняя процедура не то чтобы искажать картинки чтобы не прицепились, а просто тупо накладывать свой водяной знак? Вы пробовали сколько по времени занимает одна процедура даже на современном железе? Макс четко указал что они ссылки на картнки парсят. Еще бы, если они еще скачивать эти картинки тысячами будут то будут врежиме постоянно завис. Тут скорее надо петлять так - товарищ клиент, мы вам спарсим все каталоги с ссылками на картинки. Но если вы хотите эти спарсенные картинки товаров использовать у себя то меняйте в генераторах и прочее. Мы умываем руки.
        • Робкий Киллер Робкий Киллер
          Немного не так

          Макс парсит товарную позицию и там URL на источник

          Отдельный сервис на 5 локациях CDN умеет в API

          Парсер Макса автоматически отправляет URL источника картинки в сервис который возвращает URL CDN сразу с брендированием например url автора

          Это по умолчанию

          Теперь настройки на стороне парсера
          - указывается что брать за бренд url или название компании
          - указывается степень сжатия и формат webp или avif
          - другие настойки например корректировка цвета, яркости, резкости и др

          Все эти настройки передаются в параметрах url rest api

          1 секунда и у тебя ссылка с брендом. Парсер заменяет ссылку источника на ссылку cdn (сохраняя ссылку на источник на случай недоступности)

          Профит
  • Покинутый Вепрь Покинутый Вепрь
    Макс, дай задачу проггерам, чтобы подгружали блок текста "Правообладателям" через js, т.к. все карточки могут улететь в МПК из-за массового дублирования.
    • Автор канала Автор канала
      Блок закрыт от индексации