Русский ИТ бизнес 👨
Подписаться
Post media
Пробуем матчить между собой лекарства с помощью Gemini 3.0 Pro. Она написала какой-то код для работы с данными и сама выполняет. Смотрю на это с неким изумлением, понимая, что вообще не понимаю, что там происходит :)

p.s. на выходе получилась полная хрень, докладываю. Две аптеки спарсили, закинули на вход и получили полную муть на выходе. Отлично!

Русский ИТ бизнес

Комментарии (0)

  • David_Tamoyan
    Любой результат есть результат😉
  • DADementr
    В промте указывай, что бы не использовала скрипты для сравнения а сравнивала сама
  • BorisAB
    Десять строк и импорт Пандас, это и без Гемени можно сделать
  • Channel_Bot
    Промт сильно плохой.
    • sergei_babaian
      А вы бы как написали?
      • Channel_Bot
        Точно не так.
  • BorisAB
    "фармацевтически идентичны", что за критерий такой?
  • alexar95
    ну для матчей хороших нужна система посложнее))
    • BorisAB
      Студенты не потянут.
  • blaqdog
    у всех препаратов есть в составе действующее вещество. Обычно оно совпадает у разных производителей. И обычно его пишут открыто. Можно просто складывать его в виде тегов и потом выводить в на странице в блоке Похожие товары по этому полю. Но тут надо бы понять, для чего матчинг
    • BorisAB
      А ещё лекарственные формы, упаковки, дозировки. Да и одно и то же действующее вещество вполне возможно может встречаться в составе препаратов разного назначения.
      • blaqdog
        я уже понял что речь о том, чтобы понять, что товары на разных сайтах это про один препарат. Сначала подумал про блок Похожие товары
        • McConst
          А ещё аспирин от фирмы Bayer и то же самое от Борисовские медпрепараты могут отличаться степенью очистки, например.
          • BorisAB
            Для мэтчинга это наверное не так важно
            • McConst
              Для желудка может быть важно 😊
              Обычно этого не пишут, но люди, которые годами сидят на аспирине прям говорят - этот помогает, а этот - нет.
  • blaqdog
    аа, видимо объединить товар из разных аптек в одну карточку. Понял, это другое
  • andr_van
    Подскажите. А на сколько законно брать объявления с других сайтов и агрегировать у себя в едином поиске?
    Нужно ли отдельно договариваться с владельцами этих сайтов?

    Интересуюсь для личного проекта
    • blaqdog
      рекламные объявления? или баннеры с акциями?
      • andr_van
        Скорее рекламные обьявления, например о сдаче посуточно квартир.
        Со ссылкой на источник
        • McConst
          😊 Отфильтрованные от телефонов агентств?
          Сделайте баннер в своём стиле. Не повторяйтесь. Там только вёрстку поменять и всё.
          • andr_van
            А вообще, если есть сайт агрегатор обьявлений с других сайтов, как по типу тут приводили пример с поиском https://poisk.im/.

            Можно без разрешения собирать инфу с других сайтов с указанием источника?
            • McConst
              Я так для себя делал.
              Видел платное приложение для Android (Flatty), которое делало это 5 лет назад.

              Они это публикуют в открытом виде. Без залогинивания. Если так, то значит можно. ИИ-шки парсят эти объявки внаглую и никто их пока не штрафовал - я не слышал.
  • blaqdog
    там ведь названия жёстко производителем фиксируются, разве нет?
  • McConst
    Я вчера в игрушку DeusEx Mankind резался. Там по миссии головоломка была на доске 3х3, чтобы дальше пройти. Минут пять тыркал, но потом достало. Описал правила головоломки и исходное состояние в perplexity. Попросил найти решение. Тот составил скрипт на питоне, который нашел решение за 4 хода.
  • SVRyzhov
    Названия товаров в аптеках, как правило, состоят из бренда, количества в упаковке, дозировки и прочей спецификации объединенной в различном порядке, через разный разделитель и написанный различным алфавитом и с разными сокращениями. Название можно делить на два, один переводить чисто в кириллицу, другой в латиницу и сравнивать эти пары, будет более точное соответствие
  • dr_sgs
    Просто надо уметь пользоваться контекст инжинирингом, Макс
  • yoyo07
    стеммер слов, ну и потом по порогу полученных совпадений...