Русский ИТ бизнес 👨
Подписаться
Post media
Так xmldatafeed.com зовут в тендер. Сразу упоминая тех, кто еще играет в эту игру. Задача сложная, надо парсить аптеки. Постоплата. Попробуем, но наполнен скепсисом. Там надо делать матчинг, а это ... скажем так, ну очень непростая задача.

Прикиньте 20 сайтов аптек, 30 регионов в каждой, матчинг около 5000 товаров. Все это регулярно и точно.

Русский ИТ бизнес

Комментарии (0)

  • jromka68
    какой бюджет?) я бы несколько лямов зарядил)
    • GroupAnonymousBot
      мы не смогли пока посчитать т.к. очень сложно
      • mike_kozyakov
        С матчингом там сложно будет. Разные упаковки, какие-то в дефектуре, придется сильно вникать.
        • GroupAnonymousBot
          в том то и дело. и это все очень плохо поддается прогнозированию по точности.
        • whatisitmy
          Ага, разная дозировка, разное количество, разные торговые названия
          • mike_kozyakov
            Точно:) я пробовал собирать свою эталонную базу на базе РЛС и потом к ней уже матчить. Ну, что-то получилось. Но сейчас с нейронками этими лучше выйдет. У меня там то, что не матчилось, матчил оператор вручную, нужно было похожее выбрать из вариантов.
      • shastnv
        а начальная максимальная цена какая?)
        • GroupAnonymousBot
          а ее нет. ты подаешь свои предложения.
      • jromka68
        в мультах?
  • lord_markus
    И зачем они такие нужны?
  • e23book
    То чувство, когда у тебя 30к аптек, 100к наименований (20к активных), синк остатков и цен со складами и точками каждые 2–3 часа. Сарян, парни, сразу скажу, что данных дать не могу)
  • ooo_smart_price
    А в чем сложность матчинга? Поясните профану. Я думал это лет 5 назад уже решалось довольно неплохо. А с нейронками сейчас всяко лучше.
    • GroupAnonymousBot
      точность... сложности нет, есть точность которая не всегда высокая.
    • mike_kozyakov
      С нейронками задачка, думаю, неплохо решается. Я считал расстояние Левенштейна:)