Смотрите, что нашли - команда выпустила VibeThinker, модельку всего 1.5B параметров, которая якобы обгоняет большие модели в математике и программировании. Но в комментах такой срач...
Одни кричат "прорыв!", другие - "опять бенчмарки натренировали". Самые адекватные пишут: "ребята, просто попробуйте сами".
А еще разработчики честно признаются - это исследовательский проект, а не готовый продукт. Модель переобучается, контекст теряет, но для своих 1.5B - просто огонь. Особенно смешно, что она все ответы в \boxed{} заворачивает, как на матолимпиадах.
И главный вопрос - где грань между настоящим reasoning и натаскиванием на тесты? Вот все эти мелкие модели показывают крутые цифры в бенчмарках, а на практике... Ну вы поняли.
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться

Комментарии (0)