Apex-Testing обновлён: модели кодинга проваливаются на приватных репозиториях — результаты шокируют

Apex-Testing обновлён: модели кодинга проваливаются на приватных репозиториях — результаты шокируют
Обновлённый бенчмарк Apex-Testing v2 теперь тестирует AI-кодеров на 20 приватных репозиториях реальных компаний. GPT 5.2 Codex, Claude 4 Opus и Gemini 3 Ultra не справились с legacy-кодом и корпоративной инфраструктурой.
Это доказывает, что даже топовые модели кодинга беспомощны перед реальным продакшен-кодом, с которым сталкиваются разработчики.
Читать статью →

Подписаться на канал

215

👍 0

Комментариев пока нет.