- Telega.FM

Русский ИТ бизнес

10 сен 2025 16:04

Одна из самых больших площадок по аренде GPU. На картинке подсветил - vast.ai. За 5$ в час получите монстра с 2 картами H200. А если готовы платить 9$ в час, то будет 2x B200.

Про H200 читал, а вот B200 (180 гб памяти) - вообще кракен в мире железа для ИИ :)

По данным MLPerf v4.1 и обзоров, B200 даёт кратный прирост: на крупных LLM‑задачах вроде GPT‑3 предобучения и LLaMA fine‑tuning ускорение составляет примерно 2 раза на GPU против H200/H100‑систем...

5$ в час = 870$ в меся или около 74 000 р. Не так уж и дорого, если у вас соответствующие задачи по требованиям к скорости. Например, около 1.2–1.8 тыс токенов в секунду можно выжимать для ИИ oss-120b на такой сборке. Это около 5000 символов русского языка в 1 секунду в генерации.

Русский ИТ бизнес

👍 0

Альтернативный Единорог 2025-09-10 16:07

Минутка душноты: 5$ в час - это 3600$ в месяц (5*24*30)
- Автор канала 2025-09-10 16:07
  
  я ошибся? :( сорян. во даю.
  - Аметистовый Колдун 2025-09-10 16:12
    
    Ты рабочие часы подсчитал 5/2 - профдеформация во всей красе:)
    - Автор канала 2025-09-10 16:12
      
      100% да. туплю к концу дня пипец.
Лохматый Осьминог 2025-09-10 17:44

Наверное, такое решение более актуально для обучения моделей
- Пепельный Червь 2025-09-10 17:48
  
  PMKID вскрывать :)
- Автор канала 2025-09-10 17:52
  
  да. в основном для этого