Microsoft выложили нейронку VibeVoice-1.5B (MIT), которая клонирует любой голос идеально, и это абсолютно бесплатно. Генерирует до 90 минут аудио за один раз и поддерживает до четырех голосов в одном диалоге.
Телефонные мошенники радостно вспотели :)
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться

Комментарии (0)
Качество произношения в выложенных в доступ образцах действительно хорошее.
Особенно у женского голоса. Мужской голос с британским акцентом тоже звучит хорошо. С американским всё таки напоминает робота.
Прикольно будет если вдруг в какой-то из мессендженров позвонит якобы товарищ майор и твоим же голосом с тобой разговаривать начнёт. 😁
https://vkvideo.ru/video233825509_456239938?list=a8389a21debc481dc2
😁
Я их уже штук 20 перепробовал, везде допиливать надо
VibeVoice не поддерживает русский язык.
Поддерживаемые языки
Модель VibeVoice в основном ориентирована на английский и китайский (мандаринский) с возможностью кросс-лингвальной генерации между ними. Экспериментальные спикеры добавлены для девяти языков: немецкий (DE), французский (FR), итальянский (IT), японский (JP), корейский (KR), нидерландский (NL), польский (PL), португальский (PT) и испанский (ES).
Русский язык
Русский (RU) не входит в список поддерживаемых языков ни в основной версии, ни в экспериментальных обновлениях на декабрь 2025 года. Хотя модель показывает некоторую мультиязычную способность за пределами английского, для русского это не подтверждено и не рекомендуется для качественного использовани
вот пример
Придется качать, проверять