Русский ИТ бизнес 👨

21.11.2025 12:05

Часто приходится слышать жалобы на дорогие GPU для AI-разработки

Буквально на днях услышал на конференции про кейс маленькой нижегородской компании, которая делает большую платформу речевой аналитики DEERAY, и тоже столкнулась с проблемой дорогого железа. Ребятам нужно было обрабатывать 4М минут речи ежемесячно. Когда они посчитали стоимость GPU для инференса LLM, то уперлись в цены провайдеров. Но оказалось, если вместо аренды GPU для инференса пользоваться Evolution Foundation Models от Cloud.ru, затраты сокращаются в десятки раз 🙌

Для сравнения: если судить по тарифной сетке, Qwen 235B может обойтись по 2 копейки за 1 000 входных токенов вместо 60 копеек в среднем по рынку. По самым скромным прикидкам 4M минут речи — это где-то 672М токенов. Для стартапов, которые строят ML-сервисы — это не просто сбережения, это разница между банкротством и масштабированием.

Посмотрите кейс и тарифы, возможно, пригодится.

0/7 Открыть в Telegram

Комментарии (0)

lord_markus
2025-11-21 12:07

Почему нет пальца вниз реакции? ну реклама же чистой воды.
- dmitry236
  2025-11-21 12:11
  
  это доступно только на платном тарифе
- Kodama97
  2025-11-24 15:27
  
  Во-первых есть палец, а во-вторых - ну реклама, и чё? :)