Русский ИТ бизнес 👨
Подписаться
Post media
GLM-4.7 Flash вышла. Можно запускать локально. На картинке ее метрики. Она думающая, к слову. Ждем цены на токены у поставщиков... Пишут, что модель будут дешево предлагать, сравнивая с конкурентами.

Русский ИТ бизнес

Комментарии (18)

  • 709864982
    Вчера запускал
    • mtrnkwas
      И как?
      • 709864982
        hf.co/unsloth/GLM-4.7-Flash-GGUF:Q2_K_XL вот эту запускал на xeon 2680v4 32gb через ollama
        • mtrnkwas
          Скорость инференса какая в итоге получилась?
          • 709864982
            не очень быстро, а как посмотреть ? точно?
            • mtrnkwas
              Если через Ollama, надо запускать с параметром verbose
        • Sergey_chto_nado
          ссылка уже 404
          • 709864982
            Через гугл ищется
    • Null_Solid
      на каком железе запускал? какая скорость получилась?
  • mike_kozyakov
    Мне кажется, что китайцы с метриками нас, все же, обманывают:) или что-то недоговаривают…
    • mike_kozyakov
      Comment media
      • mike_kozyakov
        Я не так как-то смотрю?
    • mike_kozyakov
      Comment media
  • 709864982
    Comment media
  • 709864982
    Comment media
    достаточно быстро но глючит
    • mtrnkwas
      Шустро. Особенно для CPU. А в чем глючная?
      • 709864982
        зацикливается часто
  • mtrnkwas
    Попробовал вчера. На Beelink Mini PC GTR9 Pro AMD Ryzen AI Max+ 395 CPU 128GB RAM эта модель выдала 47 токенов в секунду. Было бы интересно попробовать версию GLM-4.7-Аir, если они ее выпустят.