*xAI открыла транскрипцию для разработчиков — и сразу ударила по цене! 💥💰*
Grok умеет не только отвечать на вопросы 🤖. xAI тихо запустила Speech-to-Text API — и сразу заявила о лучшем соотношении цена/качество на рынке 🚀.
Что умеет. 25 языков включая русский 🇷🇺, пословные временные метки ⏱️, многоканальное аудио 🎧, диаризация — точное разделение реплик нескольких участников 👥. Всё что нужно, чтобы встроить транскрипцию в продукт 🛠️.
Цены. Файловая транскрипция — $0,1 за час аудио 💸. Стриминг в реальном времени — $0,2 за час ⚡. Для сравнения: OpenAI Whisper API стоит $0,006 за минуту, то есть $0,36 за час. xAI дешевле почти вдвое 📉.
Технологический стек. Не с нуля — та же инфраструктура уже работает в Grok Voice 🗣️, автомобилях Tesla 🚗 и службе поддержки Starlink 🛰️. Разработчики получают боевую систему, а не MVP 🛡️.
Параллельно xAI выпустила Text-to-Speech API — синтез речи с живой интонацией 🎙️. Вместе это полный голосовой стек: текст → речь → обратно в текст 🔄.

Комментариев пока нет.