Русский ИТ бизнес
Русский ИТ бизнес

Kimi K2.6 теперь запускается почти на любом устройстве

Kimi K2.6 теперь запускается почти на любом устройстве
Kimi K2.6 теперь запускается почти на любом устройстве.

Модель на 1 триллион параметров сжата до 340 ГБ через Dynamic GGUF. Рабочий компромисс, не требующий кластера из сотен GPU.

Запуск возможен на CPU, GPU и SSD. Скорость >40 токенов/сек при ~350 ГБ RAM/VRAM. Полная точность требует 610 ГБ.

Первый случай доступности модели такого масштаба вне датацентров.

Гайд: https://unsloth.ai/docs/models/kimi-k2.6
GGUF: https://huggingface.co/unsloth/Kimi-K2.6-GGUF

🟪 MAXTG

Комментарии (20)

  • Аристократичный Шаман
    Аристократичный Шаман
    всего 340 гигов, у меня вот на балконе завалялось столько Ответить
  • Авангардный Гигант
    Авангардный Гигант
    Запустил вчера ее на роботе пылесосе... Ответить
    раскрыть ветку (1)
    • Добрый Павлин
      Добрый Павлин
      А память он сам добирал по углам🤣 Ответить
  • Сумеречный Архитектор
    Сумеречный Архитектор
    А кто-то из местных Roo code в vscode использует? Ответить
    раскрыть ветку (5)
    • Лохматый Осьминог
      Лохматый Осьминог
      использую Ответить
      раскрыть ветку (4)
      • Сумеречный Архитектор
        Сумеречный Архитектор
        Мне пишет мало токенов для моей задачи на free моделях от openRouter
        Покупаете api платных? Ответить
        раскрыть ветку (3)
        • Чесночный Режиссер
          Чесночный Режиссер
          Открою вам тайну. Ключевые слова Ollama qwen cloud Ответить
        • Лохматый Осьминог
          Лохматый Осьминог
          у фри опенроутера не большой лимит. погуглите omniroute. там пока клод (правда не топовый) бесплатно. мне хватает Ответить
          раскрыть ветку (1)
          • Сумеречный Архитектор
            Сумеречный Архитектор
            Ого спасибо, а то мне железяка ничего не подсказал))) Ответить
  • Чесночный Режиссер
    Чесночный Режиссер
    а я несколько агентов параллельно в CLI запускаю. В VS code поди так не получится? Ответить
    раскрыть ветку (6)
    • Сумеречный Архитектор
      Сумеречный Архитектор
      Что такое cli? Как его запускать? Что за агенты?

      Просто тоже хочу понять как несколько агентов юзать Ответить
      раскрыть ветку (5)
      • Чесночный Режиссер
        Чесночный Режиссер
        Comment media
        раскрыть ветку (4)
        • Сумеречный Архитектор
          Сумеречный Архитектор
          Спасибо, гляну Ответить
          раскрыть ветку (3)
          • Чесночный Режиссер
            Чесночный Режиссер
            если задачки не сильно сложные бесплатная minimax 2.5 может сгодится Ответить
            раскрыть ветку (2)
            • Сумеречный Архитектор
              Сумеречный Архитектор
              Да и по разному, не особо, просто ищу соотношение цена качество. Пока на glm 4.5 плачу за api по 3$
              Мне для пробы надо генератор ui Ответить
            • Сумеречный Архитектор
              Сумеречный Архитектор
              Спасибо, учту Ответить
  • Ночной Зомби
    Ночной Зомби
    Щас запущу свой Altair 8800 там как раз места на две такие Ответить
  • Сквознячный Судья
    Сквознячный Судья
    Да, 4 H200 нормально затащат. Ляма полтора в месяц. Ответить
    раскрыть ветку (1)
    • Сквознячный Судья
      Сквознячный Судья
      Хотя вру. Даже 4 rtx 6000 pro. Ну 600-700к в месяц, ОК. Ответить
  • Взрослый Андроид
    Взрослый Андроид
    Запуск на ssd? 🤨 Ответить