Русский ИТ бизнес
Русский ИТ бизнес

Ожидалось, что ИИ одинаково хорошо справляются с анализом как первых, так и последних токенов в длинных текстах, но на деле производительность падает с ростом длины входа, даже на простых задачах.

Проще говоря, модели “устаете” при большом объёме текста и начинают ошибаться, терять важные данные или путаться. Значит, чтобы такие модели работали хорошо, нужно умело выбирать и структурировать информацию, а не просто кормить их огромными массивами текста без разбора.

В исследовании проверяли 18 моделей, включая GPT-4.1, Claude 4, Gemini 2.5 и Qwen3, и обнаружили, что модели работают всё менее надёжно по мере увеличения длины входного контекста.

Русский ИТ бизнес
  • Паровой Кисель Паровой Кисель
    Все таки с длинным контекстом лучше резюмировать и подавать только релевантные куски, чем сыпать весь текст в модель )
  • Прохладный Сурок Прохладный Сурок
    Макс, подскажите какая модель AI лучше справится с задачей пирсинга с сайта?
    • Раздражительный Жираф Раздражительный Жираф
      да, заебывает это исправление парсинга на пирсинг
    • Автор канала Автор канала
      Гпт мини
    • Тающий Носорог Тающий Носорог
      gpt-mini за 7 рублей за 1кк токенов, вообще огонь. И кольцо в пупок вставит 😂
    • Океанический Гоблин Океанический Гоблин
      Обтекаемо сформулирован вопрос. Ибо коммерческий парсинг отличается от узкого парсинга для себя. Тут важны и цена вопроса, и возможность оплаты и объем контекста и зависания ответов от реквестов. Все ИИ по этим параметрам разные
  • Океанический Гоблин Океанический Гоблин
    Deepseek на график забыли нанести. Не укладывается в концепцию?
  • Прохладный Сурок Прохладный Сурок
    Готов отплатить 7 за однократный парсинг одного сайта)
  • Богатый Шаман Богатый Шаман
    Оригинальная статья длинная, но что конкретно делать - не понятно. Дробить большие файлы на мелкие? Или в одном текстовом файле дробить текст на пункты и подпункты?
    • Автор канала Автор канала
      дробить да