Приложение УмноЕд про экономию и муки создания
Приложение УмноЕд про экономию и муки создания

Парсер отправлен на сервер и наконец я могу выключить ноутбук

Парсер отправлен на сервер и наконец я могу выключить ноутбук
Парсер отправлен на сервер и наконец я могу выключить ноутбук. Сбор данных запущен в самостоятельное плавание. По Метро он собрал 31 тыс. товаров и сейчас заходит в каждый из них и скачивает данные о составе, нутриентах, сроках годности и пр.. С перекрестком боюсь так не получится и придется запускать его на ноутбуке (пока).
Как это работает. На сервере есть специальная служба очередей. Сам парсер (программа сбора данных) может быть запущен или на другом сервере или ноутбуке (не имеет значения). В парсере указан адрес куда он должен поступаться и с каким паролем, для получения задачи из очереди. Он её получает и начинает работать.
Т.е. на сервере запускается команда по которой на ноутбуке или другом сервере оживает парсер.
Почему я не запустил туда же на сервер Перекресток? Там парсер немного сложнее и потребляет гораздо больше ресурсов. Есть риск, что сервер затупит.
К тому же если сборе данных с Метро мы собираем только 30 товаров за один раз, то Перекресток отдаёт до 500 за один заход на страницу (быстрее в 500/30 раз), но очень не любит такие программы сбора данных. Поэтому мне проще собрать данные с ноутбука под контролем, чем получить бан от них.
PS. пока писал парсер обошел 200 товаров. Прям радует.

Комментариев пока нет.