Русский ИТ бизнес
Русский ИТ бизнес

Статья про парсинг. Питон. Обход защиты и т.п.

"Универсальный парсинг сайтов на Python: requests vs headless, токены, куки, прокси и ротация IP"

Но я вот так скажу, это все конечно здорово, но когда к вам приходят клиенты и говорят, что нам надо делать в сутки около 3 млн. запросов на каждый маркетплейс, начинаешь понимать, что речь идет о совершенно других мощностях- ресурсах - подходах ит.п.

Вообще маркетплейсам пора просто продавать дампы своей базы и будет им счастье :)

Русский ИТ бизнес
  • Глухой Гуру
    Глухой Гуру
    Низкотехнологичная статья) Я вам говорю как человек, который в сутки парсил на Python в разы больше. Скажем к примеру все открытые данные одной социальной сети.
    • Океанический Гоблин
      Океанический Гоблин
      соцсеть карьерного роста?
      • Глухой Гуру
        Глухой Гуру
        Нет, больше. На тот момент там помню было 190млн пабликов из которых 20-30 стоили внимания. Но по резюме были партнеры…для сопоставлений
    • Дымящийся Гриб
      Дымящийся Гриб
      Вся соль в СЕОшке чтобы привлечь кого угодно, от клиентов, до начинающих программистов.
  • Танцующий Единорог
    Танцующий Единорог
    Так у большинства МП сейчас есть платное API, по которому можно всё получать.
    • Автор канала
      Автор канала
      Полагаю вопрос цены ?
  • Тусклый Орангутан
    Тусклый Орангутан
    Странная статья. Ничего не сказано про продукт, который продвигается. Что это такое и как им пользоваться
  • Пушистый Грифон
    Пушистый Грифон
    Дожились... Заворачиваем статью с хабра в PDF и получаем новый пост для канала
    • Длинный Огнетушитель
      Длинный Огнетушитель
      это топ, реально)
    • Тёмный Боярин
      Тёмный Боярин
      Ай, да Максим тут бывает и запрещенку прорекламирует, нашли повод охереть 🤣
      • Пушистый Грифон
        Пушистый Грифон
        Что рекламировать - эт дело хозяйское. А тут я открыл файл и почувствовал себя идиотом
    • Колючий Маг
      Колючий Маг
      Подождите, на CD дисках распространять будут.