А знаете, я вот вообще не удивлен тенденции на локальные ИИ-решения

А знаете, я вот вообще не удивлен тенденции на локальные ИИ-решения. Корпораты хотят технологического суверенитета, никто в здравом уме не хочет гонять чувствительные внутренние данные через чужие закрытые API, какими бы удобными они ни были.

Тут Сбер весьма вовремя выложил под MIT-лицензией свою флагманскую GigaChat Ultra. Для понимания ситуации: это открытая ИИ-база, нативно обученная на русском, которая по внутренним замерам обходит Qwen3-235B и DeepSeek-V3 в математике и рассуждениях. Любой условный банк или гаражный стартап теперь может развернуть мощного ИИ-помощника в своем закрытом контуре и дообучить на внутренних документах. Делать свои продукты на открытой русскоязычной базе становится просто выгоднее и безопаснее, чем зависеть от вендоров.

ГигаЧат еще и прокачался в функциях - научился искать информацию в интернете прямо во время диалога и получил долгосрочную память. Теперь модель запоминает все важные данные для пользователя и использует их в чатах.

Все последние обновления ГигаЧат доступны для всех пользователи и независимых разработчиков. Но для рынка главное именно инженерное движение в сторону опенсорса и поддержка открытого инструментария. @bezsmuzi

1 757

👍 27

Комментарии (19)

Танцующий Единорог 2026-03-24 20:13

Российский бизнес массово сворачивает ИТ-проекты по внедрению генеративного ИИ
Около 7-10% пилотных проектов больших технологических компаний, запущенных в 2025 г. и связанных с внедрением больших языковых моделей, чат-ботов на базе искусственного интеллекта и агентов, дошли до стадии полноценного внедрения. Остальные 90% в марте 2026 г. либо остаются в стадии пилотирования, либо трансформируются, либо закрываются. Одна из причин — запуск не практичных проектов, а громких инициатив с сильным рекламным эффектом.
https://www.cnews.ru/news/top/2026-03-24_biznes_svernul_ili_zamorozil Ответить

раскрыть ветку (4)
- Аметистовый Колдун 2026-03-24 20:40
  
  Навайбкодили хуйни.
  Никогда небыло и вот опять. Ответить
- Скрипучий Полицейский 2026-03-24 20:47
  
  10% неплохой результат Ответить
  
  раскрыть ветку (1)
  - Роботизированный Вепрь 2026-03-25 18:18
    
    Это те что ещё дёргается. Могут и помереть Ответить
- Кожаный Карьерист 2026-03-24 20:52
  
  пуков 😁 Ответить
Эфирный Доцент 2026-03-24 20:19

И на чем такое чудо поднимать. Купить парочку H100? У нас весь бизнес только стоит. Ответить
Кожаный Карьерист 2026-03-24 20:58

Ну или почти любой)

Grok: Требования к железу для инференса (локальный запуск):

Не для одного GPU. Нужно минимум 16+ мощных датацентровских GPU (NVIDIA H100 80 ГБ, A100 80 ГБ или аналог) с tensor parallelism (TP) + expert parallelism (EP) = 16.

VRAM: ≈ 1,4 ТБ только на веса модели в BF16 (702 млрд × 2 байта). Плюс KV-кэш и оверхед. Даже в FP8 — около 700+ ГБ.

Фреймворки: vLLM, SGLang, LMDeploy или TensorRT-LLM (с поддержкой MoE и MTP — Multi-Token Prediction).

CPU/RAM: мощный сервер (сотни ГБ RAM) + быстрый interconnect (NVLink).

Сколько может стоить такое железо?

Минимальная конфигурация (16 × H100 80 ГБ + сервер): от 400–700 тыс. долларов (один H100 сейчас ≈ 30–40 тыс. USD + шасси, охлаждение, питание).
Полноценный кластер под production — легко миллион+ долларов.

Альтернатива: аренда в облаке (Yandex Cloud, Selectel, AWS, RunPod и т.д.) — от нескольких долларов в минуту до десятков в час в зависимости от нагрузки. Для теста/прототипа это дешевле, чем покупать. Ответить

раскрыть ветку (2)
- Эфирный Доцент 2026-03-24 21:02
  
  Думаю это как раз все железо сбера, т.е. их модель заведется только на их железе, так, что польза от этого национального говна только ароматная. Ответить
  
  раскрыть ветку (1)
  - Кожаный Карьерист 2026-03-24 21:07
    
    особенности национального опенсорса. Либо не можешь воспользоваться, либо тебе это нахрен не нужно 😁 Ответить
Тёмный Геймер 2026-03-26 22:04

это как в опенсорс выложить аглоритм майнинга биткоина Ответить
Эфирный Доцент 2026-03-24 20:25

1С:Бухобслуживание не пробовали? Ответить

раскрыть ветку (5)
- Невидимый Гриб 2026-03-24 20:27
  
  Я не знаю что они пробовали. Последний год к ним катался какой то 1С программист из Барнаула и пытался их учить. Год прошел, толку нет. Я берусь с условием, что если в течении месяца будет саботаж, то дальше я умываю руки. Ответить
  
  раскрыть ветку (4)
  - Жестокий Вампир 2026-03-24 20:31
    
    Надеюсь за деньги ездишь? Ответить
    
    раскрыть ветку (3)
    - Невидимый Гриб 2026-03-24 20:32
      
      За обещание светлого будущего больше не работаю. Ответить
    - Раздражительный Жираф 2026-03-24 20:32
      
      там бабы новые, кого Адольфович ещё не топтал Ответить
      
      раскрыть ветку (1)
      - Эфирный Доцент 2026-03-24 20:37
        
        Не ведись, они тебя отматросят и бросят. Ответить