Alibaba выкатила Qwen3-Max-Thinking, и на её фоне GPT-5

Alibaba выкатила Qwen3-Max-Thinking, и на её фоне GPT-5.2 с Claude-Opus-4.5 выглядят слегка отстающими в развитии. В бенчмарках - тотальный разнос (особенно в Arena-Hard), а вместо тупого перебора вариантов модель теперь «умнеет» прямо в процессе диалога, накапливая инсайты.

Самое забавное: этот «китаец» настолько всеяден, что маскируется под конкурентов, поддерживая API и OpenAI, и Anthropic (даже Claude Code работает нативно). GLM 4.7 теперь официально антиквариат.

Тестим, пока дают: chat.qwen.ai :)

Русский ИТ бизнес

1 776

👍 8

Комментарии (7)

Пухлый Хариус 2026-01-28 20:38

Обычно нейминг с максом ничем хорошим не заканчивается Ответить
Кованый Писатель 2026-01-28 20:39

Вот они всех по бенчам рвут, а когда кодом их грузишь, один черт сонет догнать не могут Ответить
Мудрый Козел 2026-01-28 20:47

Это значит в скором времени нас ожидает новое качество постов ?) Ответить
Закатный Писатель 2026-01-28 21:03

Старый qwen, странно делает исследования, подставляя несущие ссылки на документы и не исправляя ошибки... Ответить
Раздражительный Барс 2026-01-28 21:11

Где тут отставание? 5%? Я вам промпт напишу, Qwen их будет внизу..
Они просто играют цифрами. Для прорыва хватает 1-2%.. По факту промпт их даёт в легкую!
Просто попытка перетянуть лоха к себе.. Ответить
Сквознячный Судья 2026-01-29 00:19

Да нужно все проверять. glm-4.7 + gsd фреймворк, к примеру, тоже себя неплохо ведет, по-моему. Хотя я еще как следует не дотестил, не могу сказать. Но если так работать с opus, то никаких подписок ни на что не хватит. Ответить
Пухлый Воробей 2026-01-29 11:07

Glm 4.7 только в бенчах что-то показывает, а на практике хуета полнейшая.
Элементарную ошибку исправить не может, как не детализируй промпт. Gpt 5.2 mr с первого раза. Ответить