Не знаю, как это возможно, но вот смотрите - недавно выпущенная модель Stepfun Step-3
Не знаю, как это возможно, но вот смотрите - недавно выпущенная модель Stepfun Step-3.5-Flash превосходит DeepSeek v3.2 по нескольким бенчмаркам, несмотря на использование гораздо меньшего количества параметров....
Цитирую:
Step-3.5-Flash: 196B total / 11B active parameters
DeepSeek v3.2: 671B total / 37B active parameters
разный метод построения сетей Flash MoE - архитектура поэтому позволяет активировать 11B из 196B параметров и по ходу да и обучение еще зависит сильно посмотрим что будет с дипсик 4 которая должны выйти сегодня или до конца недели думаю ГПТ и прочие джими будут позади Ответить
Программируемый Ворон
По мне так почти полная хрень все эти бенчмарки. Промпт вылизан до дыр, обучение вокруг них. Это как ориентир, главное как они понимают пользователя с запросом «Сделай мне красивое приложение» утрирую конечно, но большинство запросов пока такое. Ответить
Комментарии (2)