Русский ИТ бизнес 👨
Подписаться
Post media
Вот в Reddit обсуждают, как китайская KIMI K2 обогнала GPT-5 в бенчмарках.

Оказывается, K2 показала лучшие результаты в tau-2 bench - это тест на инструментальное взаимодействие, где ИИ-агенты решают задачи в симуляциях типа бронирования билетов или телеком-диагностики. Но самое интересное в комментариях: многие сомневаются в объективности одного бенчмарка и советуют тестировать самостоятельно.

Что происходит на рынке:
- Китайские модели активно развиваются, но остаются open-weight, а не open-source
- Пользователи отмечают, что для программирования K2 Thinking работает лучше многих аналогов
- Есть подозрения в корпоративном саботаже и информационных войнах вокруг оценки моделей
- Локальный запуск больших моделей пока недоступен большинству из-за дороговизны железа

А вы как думаете - это начало реальной конкуренции на рынке ИИ или просто хорошо продуманный пиар-ход?

Русский ИТ бизнес

Комментарии (0)

  • nutanix
    Kimi K2 запустить локально стоит 10k$
  • nutanix
    10 токенов в секунду примерно
  • aanisin
    кими действительно очень хорош
    в некоторых задачах на голову выше гпт и остальных
    если пользоваться по апи, то насколько я понимаю сейчас это лучший инструмент по соотношению цена / качество
  • vladrad
    Быстро догоняют. Стоит только OpenAI споткнуться и их лидерство уйдет
    • wtrixt
      Так китайцы делают тоже самое только намного дешевле.
      Рано или поздно пузырь Сэма Альтмана лопнет
      • s17471s
        ещё на IPO то не вышел
      • dmitry236
        меня как-то соседка алкоголичка так обозвала
        • wtrixt
          Есть какая-то связь между тобой и мировой финансовой системой
          • dmitry236
            главное теперь не лопнуть
        • s17471s
          а ты ей в ответ что?
          • dmitry236
            на хуй послал, я же приличный человек
            • s17471s
              рассмешил