Русский ИТ бизнес
Русский ИТ бизнес

А знаете, я вот вообще не удивлен тенденции на локальные ИИ-решения

А знаете, я вот вообще не удивлен тенденции на локальные ИИ-решения
А знаете, я вот вообще не удивлен тенденции на локальные ИИ-решения. Корпораты хотят технологического суверенитета, никто в здравом уме не хочет гонять чувствительные внутренние данные через чужие закрытые API, какими бы удобными они ни были.

Тут Сбер весьма вовремя выложил под MIT-лицензией свою флагманскую GigaChat Ultra. Для понимания ситуации: это открытая ИИ-база, нативно обученная на русском, которая по внутренним замерам обходит Qwen3-235B и DeepSeek-V3 в математике и рассуждениях. Любой условный банк или гаражный стартап теперь может развернуть мощного ИИ-помощника в своем закрытом контуре и дообучить на внутренних документах. Делать свои продукты на открытой русскоязычной базе становится просто выгоднее и безопаснее, чем зависеть от вендоров.

ГигаЧат еще и прокачался в функциях - научился искать информацию в интернете прямо во время диалога и получил долгосрочную память. Теперь модель запоминает все важные данные для пользователя и использует их в чатах.

Все последние обновления ГигаЧат доступны для всех пользователи и независимых разработчиков. Но для рынка главное именно инженерное движение в сторону опенсорса и поддержка открытого инструментария. @bezsmuzi

Комментарии (19)

  • Танцующий Единорог
    Танцующий Единорог
    Российский бизнес массово сворачивает ИТ-проекты по внедрению генеративного ИИ
    Около 7-10% пилотных проектов больших технологических компаний, запущенных в 2025 г. и связанных с внедрением больших языковых моделей, чат-ботов на базе искусственного интеллекта и агентов, дошли до стадии полноценного внедрения. Остальные 90% в марте 2026 г. либо остаются в стадии пилотирования, либо трансформируются, либо закрываются. Одна из причин — запуск не практичных проектов, а громких инициатив с сильным рекламным эффектом.
    https://www.cnews.ru/news/top/2026-03-24_biznes_svernul_ili_zamorozil Ответить
    раскрыть ветку (4)
    • Аметистовый Колдун
      Аметистовый Колдун
      Навайбкодили хуйни.
      Никогда небыло и вот опять. Ответить
    • Скрипучий Полицейский
      Скрипучий Полицейский
      10% неплохой результат Ответить
      раскрыть ветку (1)
      • Роботизированный Вепрь
        Роботизированный Вепрь
        Это те что ещё дёргается. Могут и помереть Ответить
    • Кожаный Карьерист
      Кожаный Карьерист
      пуков 😁 Ответить
  • Эфирный Доцент
    Эфирный Доцент
    И на чем такое чудо поднимать. Купить парочку H100? У нас весь бизнес только стоит. Ответить
  • Кожаный Карьерист
    Кожаный Карьерист
    Ну или почти любой)

    Grok: Требования к железу для инференса (локальный запуск):

    Не для одного GPU. Нужно минимум 16+ мощных датацентровских GPU (NVIDIA H100 80 ГБ, A100 80 ГБ или аналог) с tensor parallelism (TP) + expert parallelism (EP) = 16.

    VRAM: ≈ 1,4 ТБ только на веса модели в BF16 (702 млрд × 2 байта). Плюс KV-кэш и оверхед. Даже в FP8 — около 700+ ГБ.

    Фреймворки: vLLM, SGLang, LMDeploy или TensorRT-LLM (с поддержкой MoE и MTP — Multi-Token Prediction).

    CPU/RAM: мощный сервер (сотни ГБ RAM) + быстрый interconnect (NVLink).

    Сколько может стоить такое железо?

    Минимальная конфигурация (16 × H100 80 ГБ + сервер): от 400–700 тыс. долларов (один H100 сейчас ≈ 30–40 тыс. USD + шасси, охлаждение, питание).
    Полноценный кластер под production — легко миллион+ долларов.

    Альтернатива: аренда в облаке (Yandex Cloud, Selectel, AWS, RunPod и т.д.) — от нескольких долларов в минуту до десятков в час в зависимости от нагрузки. Для теста/прототипа это дешевле, чем покупать. Ответить
    раскрыть ветку (2)
    • Эфирный Доцент
      Эфирный Доцент
      Думаю это как раз все железо сбера, т.е. их модель заведется только на их железе, так, что польза от этого национального говна только ароматная. Ответить
      раскрыть ветку (1)
      • Кожаный Карьерист
        Кожаный Карьерист
        Comment media
        особенности национального опенсорса. Либо не можешь воспользоваться, либо тебе это нахрен не нужно 😁 Ответить
  • Тёмный Геймер
    Тёмный Геймер
    это как в опенсорс выложить аглоритм майнинга биткоина Ответить
  • Эфирный Доцент
    Эфирный Доцент
    1С:Бухобслуживание не пробовали? Ответить
    раскрыть ветку (5)
    • Невидимый Гриб
      Невидимый Гриб
      Я не знаю что они пробовали. Последний год к ним катался какой то 1С программист из Барнаула и пытался их учить. Год прошел, толку нет. Я берусь с условием, что если в течении месяца будет саботаж, то дальше я умываю руки. Ответить
      раскрыть ветку (4)
      • Жестокий Вампир
        Жестокий Вампир
        Надеюсь за деньги ездишь? Ответить
        раскрыть ветку (3)
        • Невидимый Гриб
          Невидимый Гриб
          За обещание светлого будущего больше не работаю. Ответить
        • Раздражительный Жираф
          Раздражительный Жираф
          там бабы новые, кого Адольфович ещё не топтал Ответить
          раскрыть ветку (1)
          • Эфирный Доцент
            Эфирный Доцент
            Не ведись, они тебя отматросят и бросят. Ответить