Русский ИТ бизнес
Русский ИТ бизнес

Пробуем матчить между собой лекарства с помощью Gemini 3.0 Pro. Она написала какой-то код для работы с данными и сама выполняет. Смотрю на это с неким изумлением, понимая, что вообще не понимаю, что там происходит :)

p.s. на выходе получилась полная хрень, докладываю. Две аптеки спарсили, закинули на вход и получили полную муть на выходе. Отлично!

Русский ИТ бизнес
  • Милый Эксперт
    Милый Эксперт
    Любой результат есть результат😉 Ответить
  • Добрый Павлин
    Добрый Павлин
    В промте указывай, что бы не использовала скрипты для сравнения а сравнивала сама Ответить
  • Ворчливый Сатир
    Ворчливый Сатир
    Десять строк и импорт Пандас, это и без Гемени можно сделать Ответить
  • Лохматый Осьминог
    Лохматый Осьминог
    Промт сильно плохой. Ответить
    раскрыть ветку (2)
    • Острый Посол
      Острый Посол
      А вы бы как написали? Ответить
      раскрыть ветку (1)
      • Лохматый Осьминог
        Лохматый Осьминог
        Точно не так. Ответить
  • Ворчливый Сатир
    Ворчливый Сатир
    "фармацевтически идентичны", что за критерий такой? Ответить
  • Покинутый Плов
    Покинутый Плов
    ну для матчей хороших нужна система посложнее)) Ответить
    раскрыть ветку (1)
    • Ворчливый Сатир
      Ворчливый Сатир
      Студенты не потянут. Ответить
  • Голографический Пёс
    Голографический Пёс
    у всех препаратов есть в составе действующее вещество. Обычно оно совпадает у разных производителей. И обычно его пишут открыто. Можно просто складывать его в виде тегов и потом выводить в на странице в блоке Похожие товары по этому полю. Но тут надо бы понять, для чего матчинг Ответить
    раскрыть ветку (5)
    • Ворчливый Сатир
      Ворчливый Сатир
      А ещё лекарственные формы, упаковки, дозировки. Да и одно и то же действующее вещество вполне возможно может встречаться в составе препаратов разного назначения. Ответить
      раскрыть ветку (4)
      • Голографический Пёс
        Голографический Пёс
        я уже понял что речь о том, чтобы понять, что товары на разных сайтах это про один препарат. Сначала подумал про блок Похожие товары Ответить
        раскрыть ветку (3)
        • Океанический Гоблин
          Океанический Гоблин
          А ещё аспирин от фирмы Bayer и то же самое от Борисовские медпрепараты могут отличаться степенью очистки, например. Ответить
          раскрыть ветку (2)
          • Ворчливый Сатир
            Ворчливый Сатир
            Для мэтчинга это наверное не так важно Ответить
            раскрыть ветку (1)
            • Океанический Гоблин
              Океанический Гоблин
              Для желудка может быть важно 😊
              Обычно этого не пишут, но люди, которые годами сидят на аспирине прям говорят - этот помогает, а этот - нет. Ответить
  • Голографический Пёс
    Голографический Пёс
    аа, видимо объединить товар из разных аптек в одну карточку. Понял, это другое Ответить
  • Ворчливый Сатир
    Ворчливый Сатир
    Подскажите. А на сколько законно брать объявления с других сайтов и агрегировать у себя в едином поиске?
    Нужно ли отдельно договариваться с владельцами этих сайтов?

    Интересуюсь для личного проекта Ответить
    раскрыть ветку (5)
    • Голографический Пёс
      Голографический Пёс
      рекламные объявления? или баннеры с акциями? Ответить
      раскрыть ветку (4)
      • Ворчливый Сатир
        Ворчливый Сатир
        Скорее рекламные обьявления, например о сдаче посуточно квартир.
        Со ссылкой на источник Ответить
        раскрыть ветку (3)
        • Океанический Гоблин
          Океанический Гоблин
          😊 Отфильтрованные от телефонов агентств?
          Сделайте баннер в своём стиле. Не повторяйтесь. Там только вёрстку поменять и всё. Ответить
          раскрыть ветку (2)
          • Ворчливый Сатир
            Ворчливый Сатир
            А вообще, если есть сайт агрегатор обьявлений с других сайтов, как по типу тут приводили пример с поиском https://poisk.im/.

            Можно без разрешения собирать инфу с других сайтов с указанием источника? Ответить
            раскрыть ветку (1)
            • Океанический Гоблин
              Океанический Гоблин
              Я так для себя делал.
              Видел платное приложение для Android (Flatty), которое делало это 5 лет назад.

              Они это публикуют в открытом виде. Без залогинивания. Если так, то значит можно. ИИ-шки парсят эти объявки внаглую и никто их пока не штрафовал - я не слышал. Ответить
  • Голографический Пёс
    Голографический Пёс
    там ведь названия жёстко производителем фиксируются, разве нет? Ответить
  • Океанический Гоблин
    Океанический Гоблин
    Я вчера в игрушку DeusEx Mankind резался. Там по миссии головоломка была на доске 3х3, чтобы дальше пройти. Минут пять тыркал, но потом достало. Описал правила головоломки и исходное состояние в perplexity. Попросил найти решение. Тот составил скрипт на питоне, который нашел решение за 4 хода. Ответить
  • Механический Кот
    Механический Кот
    Названия товаров в аптеках, как правило, состоят из бренда, количества в упаковке, дозировки и прочей спецификации объединенной в различном порядке, через разный разделитель и написанный различным алфавитом и с разными сокращениями. Название можно делить на два, один переводить чисто в кириллицу, другой в латиницу и сравнивать эти пары, будет более точное соответствие Ответить
  • Легендарный Багет
    Легендарный Багет
    Просто надо уметь пользоваться контекст инжинирингом, Макс Ответить
  • Звонкий Дух
    Звонкий Дух
    стеммер слов, ну и потом по порогу полученных совпадений... Ответить