Русский ИТ бизнес
Русский ИТ бизнес
Post media

Так xmldatafeed.com зовут в тендер. Сразу упоминая тех, кто еще играет в эту игру. Задача сложная, надо парсить аптеки. Постоплата. Попробуем, но наполнен скепсисом. Там надо делать матчинг, а это ... скажем так, ну очень непростая задача.

Прикиньте 20 сайтов аптек, 30 регионов в каждой, матчинг около 5000 товаров. Все это регулярно и точно.

Русский ИТ бизнес
  • Вышитый Пирожок
    Вышитый Пирожок
    какой бюджет?) я бы несколько лямов зарядил)
    • Автор канала
      Автор канала
      мы не смогли пока посчитать т.к. очень сложно
      • Сквознячный Судья
        Сквознячный Судья
        С матчингом там сложно будет. Разные упаковки, какие-то в дефектуре, придется сильно вникать.
        • Автор канала
          Автор канала
          в том то и дело. и это все очень плохо поддается прогнозированию по точности.
        • Раздутый Строитель
          Раздутый Строитель
          Ага, разная дозировка, разное количество, разные торговые названия
          • Сквознячный Судья
            Сквознячный Судья
            Точно:) я пробовал собирать свою эталонную базу на базе РЛС и потом к ней уже матчить. Ну, что-то получилось. Но сейчас с нейронками этими лучше выйдет. У меня там то, что не матчилось, матчил оператор вручную, нужно было похожее выбрать из вариантов.
      • Коралловый Автор
        Коралловый Автор
        а начальная максимальная цена какая?)
        • Автор канала
          Автор канала
          а ее нет. ты подаешь свои предложения.
      • Вышитый Пирожок
        Вышитый Пирожок
        в мультах?
  • Дымящийся Гриб
    Дымящийся Гриб
    И зачем они такие нужны?
  • Глухой Гуру
    Глухой Гуру
    То чувство, когда у тебя 30к аптек, 100к наименований (20к активных), синк остатков и цен со складами и точками каждые 2–3 часа. Сарян, парни, сразу скажу, что данных дать не могу)
  • Размалёванный Краб
    Размалёванный Краб
    А в чем сложность матчинга? Поясните профану. Я думал это лет 5 назад уже решалось довольно неплохо. А с нейронками сейчас всяко лучше.
    • Автор канала
      Автор канала
      точность... сложности нет, есть точность которая не всегда высокая.
    • Сквознячный Судья
      Сквознячный Судья
      С нейронками задачка, думаю, неплохо решается. Я считал расстояние Левенштейна:)