Apex-Testing обновлён: модели кодинга проваливаются на приватных репозиториях — результаты шокируют
Обновлённый бенчмарк Apex-Testing v2 теперь тестирует AI-кодеров на 20 приватных репозиториях реальных компаний. GPT 5.2 Codex, Claude 4 Opus и Gemini 3 Ultra не справились с legacy-кодом и корпоративной инфраструктурой.
Это доказывает, что даже топовые модели кодинга беспомощны перед реальным продакшен-кодом, с которым сталкиваются разработчики.
Читать статью →
Подписаться на канал
AiManual - База знаний по ИИ
23 мая 2026 21:22
Комментариев пока нет.