Три в одном: Nvidia Star Elastic — как 12B, 23B и 30B живут в одном файле, и зачем тебе Zero-Shot Slicing
Nvidia Star Elastic хранит три модели в одном чекпоинте, позволяя выбирать размер (12B, 23B или 30B) на лету без дублирования весов. Zero-Shot Slicing активирует нужную подсеть из суперпозиции параметров — никаких дополнительных адаптеров. Применяется для экономии дискового пространства и быстрого переключения между конфигурациями под разные задачи.
Ограничение: для работы требуется поддержка разреженных слоёв на уровне фреймворка и совместимое оборудование (не все GPU или версии CUDA).
Читать статью →
Подписаться на канал
AiManual - База знаний по ИИ
10 мая 2026 06:20
Комментариев пока нет.