Русский ИТ бизнес 👨
Подписаться
GLM-4.5 - новая модель для сложных задач, в том числе программирования и работы с инструментами. В ней 355 миллиардов параметров, рабочей частью из них являются 32 миллиарда. Есть версия GLM-4.5-Air: 106 миллиардов параметров, из них используются 12 миллиардов.

Оба варианта умеют хорошо рассуждать и использовать внешние инструменты, причем у GLM-4.5 контекст - до 128,000 токенов. В тестах модель заняла третье место среди аналогов, а по задачам с агентами (например, автоматическое выполнение сложных инструкций) показала результат на уровне Claude 4 Sonnet.

В тесте на веб-поиск точность - 26.4%, лучше Claude-4-Opus (18.8%), но чуть ниже o4-mini-high (28.3%).

GLM-4.5 также круто пишет код: в тесте SWE-bench Verified у нее 64.2%, а в конкурента GPT-4.1 - 48.6%. В задачах на сложные вычисления и логические рассуждения тоже хорошие показатели, например, в AIME24 - 91%. Модель может создавать не только обычный код, но и полноценные сайты, игровые прототипы и презентации, а также успешно справляется с многозадачностью благодаря особой архитектуре. Причем она доступна как на сайте Z.ai, так и для локального запуска через HuggingFace.

GLM-4.5 разработала китайская компания Zhipu AI, которая недавно переименовалась в Z.ai. Это частная компания, стартап из Пекина, основанный в 2019 году выходцами из Университета Цинхуа.

Русский ИТ бизнес

Комментарии (0)

  • luxeweb3
    Заи в Аи 🍜
  • rusrich1
    За сколько они купили домен, очень интересно)
  • Oleg7kmv
    и у кого...
  • 625115967
    Мне модель понравилась.
    Кейс, рынок оптовой торговли, пусть фарфоровых кошек, я в рынке более 10 лет от маленьких игроков до огромных корпораций, занимался всем подряд, сейчас системы учета строю, поддерживаю, оптимизирую и т.п. поэтому некой определённой экспертизой владею.

    Пробовал общаться с квен, дипсик, Кими, перплексити, и вот зет.
    Скажем апробация некоторых мыслей дальнейшего развития.
    Пока что зет выдаёт результаты по аналитике лучше чем перплексити, остальных даже не считаю, ибо пургу несусветную несут.
    Причем качественно лучше, посмотрим дальше😁
  • rich_bro
    Их апи на open . bigmodel . cn
    • rich_bro
      Только нужно kyc проходить, видимо китайские законы