Русский ИТ бизнес
Русский ИТ бизнес

Не знаю, как это запускать локально, ибо новые ИИ просто коллосы

Не знаю, как это запускать локально, ибо новые ИИ просто коллосы
Не знаю, как это запускать локально, ибо новые ИИ просто коллосы.

Судя по расчетам пользователей на основе кода (HuggingFace PR), общая база параметров GLM-5 составляет около 776 миллиардов (776B).

Чтобы запустить такую махину даже в сжатом виде (квантование 4-бит), потребуется более 400 ГБ видеопамяти (VRAM). Для этого нужно минимум 17–20 видеокарт RTX 3090/4090, что превращает «локальный» запуск в серверную задачу :)

В общем ИИ становятся умнее, но «входной билет» для их запуска дома подорожал до цены подержанного автомобиля в РФ.

Русский ИТ бизнес

Комментарии (4)

  • Сказочный Пёс
    Сказочный Пёс
    Верно, локальный запуск сейчас это целая эпоха, а облако уже необходимость. Готов к такому вызову?
    Было бы круто посмотреть альтернативы подешевле за счёт оптимизаций и квантования Ответить
  • Древний Кубик
    Древний Кубик
    В инсте показывали набор из четырех маков, объединенных тандерболтом. 1.5Tb. $40k Ответить
  • Внеземной Мышонок
    Внеземной Мышонок
    на примере 1С GLM не очень https://vibecoding1c.ru/bench Ответить
  • Чесночный Минотавр
    Чесночный Минотавр
    или ИИ процессоры и дофига RAM понятно что ddr5, у меня нет на ноуте видеокарты, но модели до 20b и 32K контекста работают уверенно. Ответить