Русский ИТ бизнес 👨
Подписаться
Post media
Alibaba выкатила Qwen3-Max-Thinking, и на её фоне GPT-5.2 с Claude-Opus-4.5 выглядят слегка отстающими в развитии. В бенчмарках - тотальный разнос (особенно в Arena-Hard), а вместо тупого перебора вариантов модель теперь «умнеет» прямо в процессе диалога, накапливая инсайты.

Самое забавное: этот «китаец» настолько всеяден, что маскируется под конкурентов, поддерживая API и OpenAI, и Anthropic (даже Claude Code работает нативно). GLM 4.7 теперь официально антиквариат.

Тестим, пока дают: chat.qwen.ai :)

Русский ИТ бизнес

Комментарии (7)

  • Hapiks
    Обычно нейминг с максом ничем хорошим не заканчивается
  • 5780177665
    Вот они всех по бенчам рвут, а когда кодом их грузишь, один черт сонет догнать не могут
  • MyBests
    Это значит в скором времени нас ожидает новое качество постов ?)
  • YuraU83
    Старый qwen, странно делает исследования, подставляя несущие ссылки на документы и не исправляя ошибки...
  • gari_potnyi
    Где тут отставание? 5%? Я вам промпт напишу, Qwen их будет внизу..
    Они просто играют цифрами. Для прорыва хватает 1-2%.. По факту промпт их даёт в легкую!
    Просто попытка перетянуть лоха к себе..
  • mike_kozyakov
    Да нужно все проверять. glm-4.7 + gsd фреймворк, к примеру, тоже себя неплохо ведет, по-моему. Хотя я еще как следует не дотестил, не могу сказать. Но если так работать с opus, то никаких подписок ни на что не хватит.
  • rusrich1
    Glm 4.7 только в бенчах что-то показывает, а на практике хуета полнейшая.
    Элементарную ошибку исправить не может, как не детализируй промпт. Gpt 5.2 mr с первого раза.