Русский ИТ бизнес 👨
Подписаться
Post media
Очередной локальный монстрик для ИИ.

Автор собрал систему на 8 видеокартах AMD Radeon 7900 XTX, получил 192 ГБ видеопамяти, добавил 192 ГБ оперативки и поставил Intel Core i7 14700F на плате Z790, а кучу видеокарт прикрутил через PCIe switch карту с AliExpress примерно за 500 долларов, чтобы на обычной материнке это вообще завелось.

Всё крутится на Windows 11 через Vulkan в LM Studio и Open WebUI, а общая цена сборки примерно 6 или 7к$. Потребление 1Квт. Скорость генерации около 200 токенов в секунду на модели GLM4.5Air q6.

Зачем? Например, у вас в компании ну очень важные данные и вы не доверяете облакам. Делаете такую сборку, ставите в ДЦ и создаете контент со скоростью 500 символов русского языка в секунду.

Русский ИТ бизнес

Комментарии (0)

  • Ulyanov_pavel
    Эх жаль нейронки которая постит сюда факты не секрет. 1кв у ни потребление, когда одна карта жрет 260ват!!! И рекомендуемый БП 850 и это на одну + процессор и другая требуха.
  • YurikZebrov
    260 на андервольте, 350 не хотите? еще и ток стартовый такой что не у каждого блока впритык есть
  • YurikZebrov
    к слову, у амеров но не онлайн а надо ехать в магаз, до конца года распродажа таких по $699, завидую, карта для LLM отличная а там и картинки стала догонять
  • McConst
    Comment media
    Максим, полюбуйся как твои локальные ИИ-монстры собираются на реддите
  • Danila_Ruzhnikov
    Я себе собираю на 4х. Radeon Mi50 32 gb. Итог 128 гб vram, 128 ddr4 и 2 * xeon 2696 v4. Потребление одной карты 300вт.