Русский ИТ бизнес 👨
Подписаться
Post media
Смотрите, что нашли - команда выпустила VibeThinker, модельку всего 1.5B параметров, которая якобы обгоняет большие модели в математике и программировании. Но в комментах такой срач...

Одни кричат "прорыв!", другие - "опять бенчмарки натренировали". Самые адекватные пишут: "ребята, просто попробуйте сами".

А еще разработчики честно признаются - это исследовательский проект, а не готовый продукт. Модель переобучается, контекст теряет, но для своих 1.5B - просто огонь. Особенно смешно, что она все ответы в \boxed{} заворачивает, как на матолимпиадах.

И главный вопрос - где грань между настоящим reasoning и натаскиванием на тесты? Вот все эти мелкие модели показывают крутые цифры в бенчмарках, а на практике... Ну вы поняли.

Русский ИТ бизнес

Комментарии (0)

  • Ifrolove
    Опять не Макса слог)
    • GroupAnonymousBot
      ИИ переводит. сижу ищу интересно
      • Ifrolove
        А зачем вообще столько постов в день? Какая цель?)
        • StasDoDesign
          так надо
        • dmitry236
          скорее всего динамика подписчиков показывает, что чем больше добавляешь, тем больше подписывается
        • GroupAnonymousBot
          мне просто интересно. я читаю и пишу. как чукча
          • dmitry236
            мы думали наоборот
          • Ifrolove
            Но ведь вы же не читаете местами. Типа заголовок прочитал и ок)
        • sergei_babaian
          У самурая нет цели, только путь
  • LelynGe
    Смешно, как всегда одни спорят, другие просто пробуют! 😂