Русский ИТ бизнес
Русский ИТ бизнес
Post media

Я думал, что в начале 2026 года мы запустим сервис - на вход домен, на выходе фид с данными

Я думал, что в начале 2026 года мы запустим сервис - на вход домен, на выходе фид с данными (структурированный). А в итоге? НИ-ХУ-А :) Ничего не работает.

Поэтому работаем по старинке в xmldatafeed.com - договор, оплата, работа, акты. Вот и платят. Но SAAS сделать не получается :( Качества пока нет.

p.s. на вход ссылка на магазин, на выходе товарный фид - вот моя мечта.

Русский ИТ бизнес +✅Мы в MAX

Комментарии (35)

  • Длинный Огнетушитель
    Длинный Огнетушитель
    Когда поняли, что не получается?)
    • Автор канала
      Автор канала
      постепенно приходит стадия осознания.
      • Длинный Огнетушитель
        Длинный Огнетушитель
        Макс, а вы себе тулзу никакую не делали для парсинга? Ну что новый клиент - это не копирование шаблона разработчиками и там прописываются айдишники/классы и так далее. А есть какой-то гуевый интерфейс (веб или десктопное приложение) В этой тулзе есть проект какой-то, для него составляются джсон схемы или в поля вводятся какие-то нужные поля, которые забирать и урлы страниц. Ну полет фантазии тут неограничен. Или просто всегда копипаста? Такие же инструменты процентов 20 времени бустят.
        • Автор канала
          Автор канала
          вот как раз это и делаем. уже месяев 7. есть прогресс, но ... ИИ глючит.
          • Длинный Огнетушитель
            Длинный Огнетушитель
            Не. Это вы как сервис делаете. А я про кастомный парсинг, которым вы занимаетесь. Вот если откинуть ИИ.
            • Длинный Огнетушитель
              Длинный Огнетушитель
              Т.е. инструмент чтобы свою продуктивность поднять.
            • Автор канала
              Автор канала
              у нас много наработок. факт. но вот такого интерфейса готового нет.
              • Длинный Огнетушитель
                Длинный Огнетушитель
                Не думали в эту сторону, сколько времени можете сэкономить? Я вот и думаю, что у вас вагон наработок, которые вы можете для себя использовать и ускорить работу и так много не нанимать.
                • Автор канала
                  Автор канала
                  щас 2300 сайтов парсим. простые. просто тонем в поддержке
                  • Длинный Огнетушитель
                    Длинный Огнетушитель
                    Ну вот. И ребятам всегда надо код править. А в тулзе и менеджер сможет шаманить, а ребята когда что-то не так идёт
                    • Автор канала
                      Автор канала
                      я поговорю с СТО. Были подходы к снаряду, но ... не удалось. очень разные сайты
                      • Длинный Огнетушитель
                        Длинный Огнетушитель
                        Понимаю. Но, кажется, тут сначала хуй к носу прикинуть как это будет. Т.е. дизайнеру задача. Так то аналитику, но его нет. А вот если дизайнер смышлёный, он все подводные соберёт, накидает интерфейс как это может быть выглядеть и у СТО глаза откроются. Просто у СТО глаза могут быть замылены и он увидит сложность и в штыки примет)
                        • Длинный Огнетушитель
                          Длинный Огнетушитель
                          Короче работы сначала много без разработки. А разработка только уточнять все будет.
                        • Длинный Огнетушитель
                          Длинный Огнетушитель
                          Оно, конечно же, может и не получиться. Деталей же не знаю. Но есть ощущение, что работу можно облегчить. Ручного труда станет чуть-чуть да меньше.
                    • Роботизированный Вепрь
                      Роботизированный Вепрь
                      Я как-то парсил продажи жилья в Штатах. Каждое каунти имеет сайт с такими данными по всему жилью (где-то на уровне штата). Всего каунти больше 5000 кажется.

                      Пытался сделать фрейворк, так там одни исключения и условия.
        • Робкий Киллер
          Робкий Киллер
          Самая лучшая тулза это расширение браузера и выделение мышкой карточки с автоопределением сущностей и атрибутов

          https://www.perplexity.ai/search/e5928abd-7878-4c87-a2e2-5990cfea2fad#0

          И никакой LLM тут не нужен
          • Робкий Киллер
            Робкий Киллер
            Добавил готовый скрипт: скопировал - вставил в закладку браузера

            Пробуйте. Сам ещё не тестил. По ссылке выше вторым сообщением

            Закладка (bookmarklet) — отличный вариант для простого UX-анализатора: один клик, мышью наводишь/выделяешь карточку товара, и на выходе готовые селекторы или JSON с полями (название, цена, img). Это проще расширения, работает везде без установки.
            • Робкий Киллер
              Робкий Киллер
              Гипотеза подтверждена - получил сущности карточек с Озон

              https://www.perplexity.ai/search/ne-udaetsia-poluchit-dostup-k-TPL.IyWnRGK5AGzqs9622g#1

              По ссылке скрипт во втором сообщении

              Как использовать: в браузере - добавить страницу в закладки и в поле, где url вставляешь скрипт.

              На озоне открываешь каталог с товарами и кликаешь закладку - наводишь мышкой карточку пока не появится обводка - кликаешь - json сущностей в буфере обмена

              Докуриваешь
  • Изумрудный Космонавт
    Изумрудный Космонавт
    полностью черный слайдер баннеров на странице, вводит в ступор, ощущение, что то не загрузилось и страница неправильно отображается.
  • Тающий Носорог
    Тающий Носорог
    Технолоджи 🤣
  • Пряный Пирог
    Пряный Пирог
    Макс еще не "допетрил", что ИИ нужно использовать для сборки парсера, его тестов, преодоления защиты сайтов и анализа. А не для тупого "Вот тебе ИИ ссылка на сайт" отдай мне результат джейсон". Парсить должны парсеры, а настраивать их должна LLM настраиваемая другой LLM 😂 Правда на МакБуке, крутой видеокарте или АПИ к ЖПТ такое возможно ли настроить???
    • Автор канала
      Автор канала
      Да да мы не допетрили до этого. Точно. Во ща попрет
      • Пряный Пирог
        Пряный Пирог
        Макс, я был на 2 конференциях в Москве за 2025 год, где ребята показывали внутрянку, как они свои цоды через ИИ автоматизировали и другие крупные бигтехи. Честно, они говорили на каком-то языке фраз, мне не понятных. От силы я уловил 20% смысла, как они выстроили свою конфигурацию LLM моделей. При этом читал твой чат и радовался, что я тут все понимаю, ясно-понятно и по примерам из чата автоматизирую мелкие процессы через АПИ к ЖПТ по понятной схеме работы за понятные денюжки. Я сейчас вижу, что само понимание ИИ ушло на 2 разделения. Для одних это ИИ АПИ к ЖПТ, для других экосистема ИИ моделей в разных контурах и каждую единицу этой экосистемы нужно адаптировать, настроить, обучить, проверить, перепроверить и т.д., что требует большого штата сотрудников и это не джуны на самоволке ))
        • Шустрый Специалист
          Шустрый Специалист
          Сперва решили праздновать, потом казнить. Потом решили совместить...
          • Пряный Пирог
            Пряный Пирог
            Так выглядит многополярный мир 😅
  • Глиняный Боярин
    Глиняный Боярин
    за сколько готов будешь выкупить рабочий продукт, если я реализую твою мечту? 🙂
    Имею понимание как это можно реализовать, да и в целом в разработке огромный опыт. Если интересно - пиши в личку)
  • Королевский Лев
    Королевский Лев
    а будет такое что в условный чатгпт "окошечко" скидываешь урл сайтика с описанием типа "отдай мне в цсв все товыры из категории ТВ" и он тебе отдает черем 4 минутки?
    • Автор канала
      Автор канала
      скорее будет так - домен вписали, указали что собирать и получили данные
      • Королевский Лев
        Королевский Лев
        ну или так. тогда нужна задача обогодить эти данные как то
      • Ворчливый Сатир
        Ворчливый Сатир
        Интересно, на сайтах же разные структуры html. Как это привести планировали к одному виду? С помощью ИИ?
        • Автор канала
          Автор канала
          да вы правы.
          • Ворчливый Сатир
            Ворчливый Сатир
            Тоже интересно стало, на чём споткнулись. Неужели модели не могут из html страницы составить селекторы по которым потом парсеры будут собирать данные. Да, не идеально, но если описать все пограничные сценарии в промпте, а часть автоматизировать, то могло бы что-то получиться
            • Автор канала
              Автор канала
              в теории все просто. мы тоже так думали