GLM-4.7 Flash вышла. Можно запускать локально. На картинке ее метрики. Она думающая, к слову. Ждем цены на токены у поставщиков... Пишут, что модель будут дешево предлагать, сравнивая с конкурентами.
hf.co/unsloth/GLM-4.7-Flash-GGUF:Q2_K_XL вот эту запускал на xeon 2680v4 32gb через ollama
Пряный Единорог
Скорость инференса какая в итоге получилась?
Нежный Радист
не очень быстро, а как посмотреть ? точно?
Пряный Единорог
Если через Ollama, надо запускать с параметром verbose
Чесночный Минотавр
ссылка уже 404
Нежный Радист
Через гугл ищется
Комичный Лорд
на каком железе запускал? какая скорость получилась?
Сквознячный Судья
Мне кажется, что китайцы с метриками нас, все же, обманывают:) или что-то недоговаривают…
Сквознячный Судья
Сквознячный Судья
Я не так как-то смотрю?
Сквознячный Судья
Нежный Радист
Нежный Радист
достаточно быстро но глючит
Пряный Единорог
Шустро. Особенно для CPU. А в чем глючная?
Нежный Радист
зацикливается часто
Пряный Единорог
Попробовал вчера. На Beelink Mini PC GTR9 Pro AMD Ryzen AI Max+ 395 CPU 128GB RAM эта модель выдала 47 токенов в секунду. Было бы интересно попробовать версию GLM-4.7-Аir, если они ее выпустят.
Комментарии (18)