Русский ИТ бизнес
Русский ИТ бизнес

Ребята из Every сделали оценку новой GPT-5.5 и сравнили с Opus 4.7

Ребята из Every сделали оценку новой GPT-5.5 и сравнили с Opus 4.7. Они тестировали её три недели: кодинг, написание текстов, работа с знаниями.

Вот что им понравилось:
• Скачок в кодинге, при этом с моделью приятно работать. Быстрая, дружелюбная, сразу стала основной. Но при этом мощная в коде — редкое сочетание.

• 62 из 100 на их бенчмарке Senior Engineer. Opus 4.7 набрал 33 из 100 (но 5.5 лучше всего работает по плану, составленному Opus 4.7). При тестировании использовали более 900 миллионов токенов, и это позволило шипить продакшн-фичи с высокой скоростью и качеством.

• Серьёзная концептуальная ясность — держит сложный план в голове часами, не отвлекаясь на существующий код. Первая модель, которая справляется со сложными рефакторингами, где нужно удалить и переосмыслить большую часть кодовой базы.

• Хорошо пишет тексты. Первая модель OpenAI за год, из-за которой писатели Every перешли с Claude. Текст ощущается органичнее, лучше копирует стиль, не перебарщивая.

• Отличная для агентской работы — первая модель OpenAI, которая одновременно и сильный инженер, и умеет всё: от таблиц до ресерча.

• Безумно быстрая, потрясающе работает в десктопном Codex — часть команды пересела с Claude Code и Cowork на время тестирования.

В целом GPT-5.5 — огромное достижение OpenAI и заслуживает серьёзного рассмотрения как основная модель.

Из минусов:

• Opus 4.7 всё ещё лучше составляет планы — планы 5.5 очень читаемые, но у Opus внимательнее к деталям и острее инсайты.

• Opus чуть лучше во фронтенде и фулстек-продуктовой работе, когда нужно фулстек-мышление и дизайн, и не очень хорошо пишет на Ruby.

• 5.5 отличный вайб-кодер, но без плана хуже Opus — Opus лучше читает между строк в недоспецифицированных задачах.

Это для тех, кто применяет ИИ для написания кода. То что вижу, наши ребята задействуют Gemini 3.1 Pro + DeepSeek.

🟪 MAXTG

Комментарии (3)

  • Равнодушный Агент
    Равнодушный Агент
    Впечатляет скорость и ясность, неожиданные детали радуют
  • Добрый Павлин
    Добрый Павлин
    Ты им просто денег на опус не даешь)
  • Лазерный Банан
    Лазерный Банан
    На самом деле модель 5.4 настолько хороша, что закрывает бОльшую часть потребностей в разработке. 5.5 лучше справляется с версткой , потому что у нее больше развито ocr распознование .
    Сегодня тестировали kimi 2.6 , 5.4 сильно быстрее при сопоставимых результатах