Русский ИТ бизнес
Русский ИТ бизнес
Post media

А знаете, я вот вообще не удивлен тенденции на локальные ИИ-решения

А знаете, я вот вообще не удивлен тенденции на локальные ИИ-решения. Корпораты хотят технологического суверенитета, никто в здравом уме не хочет гонять чувствительные внутренние данные через чужие закрытые API, какими бы удобными они ни были.

Тут Сбер весьма вовремя выложил под MIT-лицензией свою флагманскую GigaChat Ultra. Для понимания ситуации: это открытая ИИ-база, нативно обученная на русском, которая по внутренним замерам обходит Qwen3-235B и DeepSeek-V3 в математике и рассуждениях. Любой условный банк или гаражный стартап теперь может развернуть мощного ИИ-помощника в своем закрытом контуре и дообучить на внутренних документах. Делать свои продукты на открытой русскоязычной базе становится просто выгоднее и безопаснее, чем зависеть от вендоров.

ГигаЧат еще и прокачался в функциях - научился искать информацию в интернете прямо во время диалога и получил долгосрочную память. Теперь модель запоминает все важные данные для пользователя и использует их в чатах.

Все последние обновления ГигаЧат доступны для всех пользователи и независимых разработчиков. Но для рынка главное именно инженерное движение в сторону опенсорса и поддержка открытого инструментария. @bezsmuzi

Комментарии (19)

  • Танцующий Единорог
    Танцующий Единорог
    Российский бизнес массово сворачивает ИТ-проекты по внедрению генеративного ИИ
    Около 7-10% пилотных проектов больших технологических компаний, запущенных в 2025 г. и связанных с внедрением больших языковых моделей, чат-ботов на базе искусственного интеллекта и агентов, дошли до стадии полноценного внедрения. Остальные 90% в марте 2026 г. либо остаются в стадии пилотирования, либо трансформируются, либо закрываются. Одна из причин — запуск не практичных проектов, а громких инициатив с сильным рекламным эффектом.

    https://www.cnews.ru/news/top/2026-03-24_biznes_svernul_ili_zamorozil
    • Аметистовый Колдун
      Аметистовый Колдун
      Навайбкодили хуйни.
      Никогда небыло и вот опять.
    • Скрипучий Полицейский
      Скрипучий Полицейский
      10% неплохой результат
      • Роботизированный Вепрь
        Роботизированный Вепрь
        Это те что ещё дёргается. Могут и помереть
    • Кожаный Карьерист
      Кожаный Карьерист
      пуков 😁
  • Эфирный Доцент
    Эфирный Доцент
    И на чем такое чудо поднимать. Купить парочку H100? У нас весь бизнес только стоит.
  • Кожаный Карьерист
    Кожаный Карьерист
    Ну или почти любой)

    Grok: Требования к железу для инференса (локальный запуск):

    Не для одного GPU. Нужно минимум 16+ мощных датацентровских GPU (NVIDIA H100 80 ГБ, A100 80 ГБ или аналог) с tensor parallelism (TP) + expert parallelism (EP) = 16.

    VRAM: ≈ 1,4 ТБ только на веса модели в BF16 (702 млрд × 2 байта). Плюс KV-кэш и оверхед. Даже в FP8 — около 700+ ГБ.

    Фреймворки: vLLM, SGLang, LMDeploy или TensorRT-LLM (с поддержкой MoE и MTP — Multi-Token Prediction).

    CPU/RAM: мощный сервер (сотни ГБ RAM) + быстрый interconnect (NVLink).

    Сколько может стоить такое железо?

    Минимальная конфигурация (16 × H100 80 ГБ + сервер): от 400–700 тыс. долларов (один H100 сейчас ≈ 30–40 тыс. USD + шасси, охлаждение, питание).
    Полноценный кластер под production — легко миллион+ долларов.

    Альтернатива: аренда в облаке (Yandex Cloud, Selectel, AWS, RunPod и т.д.) — от нескольких долларов в минуту до десятков в час в зависимости от нагрузки. Для теста/прототипа это дешевле, чем покупать.
    • Эфирный Доцент
      Эфирный Доцент
      Думаю это как раз все железо сбера, т.е. их модель заведется только на их железе, так, что польза от этого национального говна только ароматная.
      • Кожаный Карьерист
        Кожаный Карьерист
        Comment media
        особенности национального опенсорса. Либо не можешь воспользоваться, либо тебе это нахрен не нужно 😁
  • Тёмный Геймер
    Тёмный Геймер
    это как в опенсорс выложить аглоритм майнинга биткоина
  • Эфирный Доцент
    Эфирный Доцент
    1С:Бухобслуживание не пробовали?
    • Невидимый Гриб
      Невидимый Гриб
      Я не знаю что они пробовали. Последний год к ним катался какой то 1С программист из Барнаула и пытался их учить. Год прошел, толку нет. Я берусь с условием, что если в течении месяца будет саботаж, то дальше я умываю руки.
      • Жестокий Вампир
        Жестокий Вампир
        Надеюсь за деньги ездишь?
        • Невидимый Гриб
          Невидимый Гриб
          За обещание светлого будущего больше не работаю.
        • Раздражительный Жираф
          Раздражительный Жираф
          там бабы новые, кого Адольфович ещё не топтал
          • Эфирный Доцент
            Эфирный Доцент
            Не ведись, они тебя отматросят и бросят.