- Telega FM

Русский ИТ бизнес

13 дек 2025 10:53

Чел хвастается домашним монстром, собранным для локальных LLM: огромный корпус Phanteks Enthoo Pro 2 Server, связка ASRock X570 Taichi и Ryzen 3950X. Внутри три видеокарты, две RTX 3090 и одна RTX 4090, причем 4090 сидит через цепочку M.2, Oculink, PCIe и питается от второго блока питания.

Хранилище с размахом: Intel P4510 на 8 ТБ U.2 NVMe под виртуалки и четыре HDD Seagate Exos по 18 ТБ под TrueNAS в виртуалке, плюс 10GBe сетевая карта тоже через M.2, PCIe переходник.

По скорости LLM автор гордится тем, что GPT OSS 120B полностью в видеопамяти выдает около 109 токенов в секунду вместо 16 токенов в секунду на двух 3090 с CPU offload...

Еще раз отмечу - 100 токенов в секунду или 300 символов русского языка в секунду выдает это чудовщие :)

Вложения примерно 6370 долларов: CPU 750, материнка 250, RAM 400, NVMe U.2 8 ТБ 650, четыре HDD 18 ТБ по 300 это 1200, 10GBe 100, два M.2 райзера 100, корпус 200, блоки питания 120 и 250, две RTX 3090 по 700 это 1400, RTX 4090 1300.

В РФ сразу прикидывайте на 900 000 р. Мы покупаем API к ИИ и платим условно 7 рублей за 1 млн. исходящих токенов. Если положить 900к под 13% годовых на депозит, можно 10 000 р. в месяц получать и бесплатно генерить безумное количество токенов :)

Русский ИТ бизнес

👍 0

Лохматый Осьминог 2025-12-13 10:56

тут не в деньгах же дело... собрать настроить поюзать попиариться - в этом же кайф 😉 Ответить
Сквознячный Судья 2025-12-13 11:12

Тут еще может быть такое, что он это собирает для каких-то таких подозрительных целей, что ему и запросы-то к api делать боязно или жене сказал, что это ему по работе, а сам в игрушки режется на нем:) Ответить
Алый Повар 2025-12-13 11:33

А с кладовками что делать??? Ответить
Лохматый Осьминог 2025-12-13 14:28

а инфляцию покрывать не надо разве?) хорошо если 500р в месяц чистой прибыли останется) Ответить

раскрыть ветку (2)
- Раздражительный Жираф 2025-12-13 14:28
  
  так и железки будут дешеветь по идее Ответить
  
  раскрыть ветку (1)
  - Лохматый Осьминог 2025-12-13 14:32
    
    но это не точно. но амортизация будет, да. Ответить
Робкий Киллер 2025-12-13 14:40

Ну по крайней мере в условиях блокады и мобильных отключений сможет продолжить работу

А те кто надеется на api - не надейтесь. Готовьте кошельки по 60₽ за 200К токенов - это один запрос ответ в чате по кодингу Ответить

раскрыть ветку (5)
- Робкий Киллер 2025-12-13 14:41
  
  Или 80К / мес при работе с яндекс апи Ответить
  
  раскрыть ветку (4)
  - Циничный Бегемот 2025-12-13 14:45
    
    Может сосун разовьётся к тому моменту. Идея то толковая Ответить
    
    раскрыть ветку (3)
    - Робкий Киллер 2025-12-13 14:49
      
      А как он будет работать в условиях списка белых сайтов?
      
      Там вообще ничего не работает даже Яндекс облако не раздает апи к ии Ответить
      
      раскрыть ветку (2)
      - Циничный Бегемот 2025-12-13 14:49
        
        Скорее всего он будет дополняться, список Ответить
        
        раскрыть ветку (1)
        
        Робкий Киллер 2025-12-13 14:51
        
        Ну сосун то точно не скрепный и его не впустят в русскую цивилизацию Ответить