Вот что им понравилось:
• Скачок в кодинге, при этом с моделью приятно работать. Быстрая, дружелюбная, сразу стала основной. Но при этом мощная в коде — редкое сочетание.
• 62 из 100 на их бенчмарке Senior Engineer. Opus 4.7 набрал 33 из 100 (но 5.5 лучше всего работает по плану, составленному Opus 4.7). При тестировании использовали более 900 миллионов токенов, и это позволило шипить продакшн-фичи с высокой скоростью и качеством.
• Серьёзная концептуальная ясность — держит сложный план в голове часами, не отвлекаясь на существующий код. Первая модель, которая справляется со сложными рефакторингами, где нужно удалить и переосмыслить большую часть кодовой базы.
• Хорошо пишет тексты. Первая модель OpenAI за год, из-за которой писатели Every перешли с Claude. Текст ощущается органичнее, лучше копирует стиль, не перебарщивая.
• Отличная для агентской работы — первая модель OpenAI, которая одновременно и сильный инженер, и умеет всё: от таблиц до ресерча.
• Безумно быстрая, потрясающе работает в десктопном Codex — часть команды пересела с Claude Code и Cowork на время тестирования.
В целом GPT-5.5 — огромное достижение OpenAI и заслуживает серьёзного рассмотрения как основная модель.
Из минусов:
• Opus 4.7 всё ещё лучше составляет планы — планы 5.5 очень читаемые, но у Opus внимательнее к деталям и острее инсайты.
• Opus чуть лучше во фронтенде и фулстек-продуктовой работе, когда нужно фулстек-мышление и дизайн, и не очень хорошо пишет на Ruby.
• 5.5 отличный вайб-кодер, но без плана хуже Opus — Opus лучше читает между строк в недоспецифицированных задачах.
Это для тех, кто применяет ИИ для написания кода. То что вижу, наши ребята задействуют Gemini 3.1 Pro + DeepSeek.
🟪 MAX ❤ TG
Комментарии (3)
Сегодня тестировали kimi 2.6 , 5.4 сильно быстрее при сопоставимых результатах