Русский ИТ бизнес 👨
Подписаться
Post media
Не знаю, как это возможно, но вот смотрите - недавно выпущенная модель Stepfun Step-3.5-Flash превосходит DeepSeek v3.2 по нескольким бенчмаркам, несмотря на использование гораздо меньшего количества параметров....

Цитирую:

Step-3.5-Flash: 196B total / 11B active parameters
DeepSeek v3.2: 671B total / 37B active parameters


Русский ИТ бизнес

Комментарии (2)

  • maxicms
    разный метод построения сетей Flash MoE - архитектура поэтому позволяет активировать 11B из 196B параметров и по ходу да и обучение еще зависит сильно посмотрим что будет с дипсик 4 которая должны выйти сегодня или до конца недели думаю ГПТ и прочие джими будут позади
  • WebDevelopment_Pekarskiy
    По мне так почти полная хрень все эти бенчмарки. Промпт вылизан до дыр, обучение вокруг них. Это как ориентир, главное как они понимают пользователя с запросом «Сделай мне красивое приложение» утрирую конечно, но большинство запросов пока такое.