Вот в Reddit обсуждают, как китайская KIMI K2 обогнала GPT-5 в бенчмарках.
Оказывается, K2 показала лучшие результаты в tau-2 bench - это тест на инструментальное взаимодействие, где ИИ-агенты решают задачи в симуляциях типа бронирования билетов или телеком-диагностики. Но самое интересное в комментариях: многие сомневаются в объективности одного бенчмарка и советуют тестировать самостоятельно.
Что происходит на рынке:
- Китайские модели активно развиваются, но остаются open-weight, а не open-source
- Пользователи отмечают, что для программирования K2 Thinking работает лучше многих аналогов
- Есть подозрения в корпоративном саботаже и информационных войнах вокруг оценки моделей
- Локальный запуск больших моделей пока недоступен большинству из-за дороговизны железа
А вы как думаете - это начало реальной конкуренции на рынке ИИ или просто хорошо продуманный пиар-ход?
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться

Комментарии (0)
в некоторых задачах на голову выше гпт и остальных
если пользоваться по апи, то насколько я понимаю сейчас это лучший инструмент по соотношению цена / качество
Рано или поздно пузырь Сэма Альтмана лопнет