Русский ИТ бизнес
Русский ИТ бизнес
Post media

Alibaba выкатила Qwen3-Max-Thinking, и на её фоне GPT-5

Alibaba выкатила Qwen3-Max-Thinking, и на её фоне GPT-5.2 с Claude-Opus-4.5 выглядят слегка отстающими в развитии. В бенчмарках - тотальный разнос (особенно в Arena-Hard), а вместо тупого перебора вариантов модель теперь «умнеет» прямо в процессе диалога, накапливая инсайты.

Самое забавное: этот «китаец» настолько всеяден, что маскируется под конкурентов, поддерживая API и OpenAI, и Anthropic (даже Claude Code работает нативно). GLM 4.7 теперь официально антиквариат.

Тестим, пока дают: chat.qwen.ai :)

Русский ИТ бизнес

Комментарии (7)

  • Пухлый Хариус
    Пухлый Хариус
    Обычно нейминг с максом ничем хорошим не заканчивается
  • Кованый Писатель
    Кованый Писатель
    Вот они всех по бенчам рвут, а когда кодом их грузишь, один черт сонет догнать не могут
  • Мудрый Козел
    Мудрый Козел
    Это значит в скором времени нас ожидает новое качество постов ?)
  • Закатный Писатель
    Закатный Писатель
    Старый qwen, странно делает исследования, подставляя несущие ссылки на документы и не исправляя ошибки...
  • Раздражительный Барс
    Раздражительный Барс
    Где тут отставание? 5%? Я вам промпт напишу, Qwen их будет внизу..
    Они просто играют цифрами. Для прорыва хватает 1-2%.. По факту промпт их даёт в легкую!
    Просто попытка перетянуть лоха к себе..
  • Сквознячный Судья
    Сквознячный Судья
    Да нужно все проверять. glm-4.7 + gsd фреймворк, к примеру, тоже себя неплохо ведет, по-моему. Хотя я еще как следует не дотестил, не могу сказать. Но если так работать с opus, то никаких подписок ни на что не хватит.
  • Пухлый Воробей
    Пухлый Воробей
    Glm 4.7 только в бенчах что-то показывает, а на практике хуета полнейшая.
    Элементарную ошибку исправить не может, как не детализируй промпт. Gpt 5.2 mr с первого раза.