Alibaba выпустила CosyVoice 3 - мощный open-source для клонирования голоса
Несмотря на легкий вес (0,5 млрд параметров), модель превосходит конкурентов и доступна для коммерческого использования.
Ключевые фишки:
9 языков: включая русский, английский и китайский.
Идеальное клонирование: нужно всего 3 секунды аудио. Копирует тембр, эмоции, акцент и даже дефекты речи.
Real-time: работает с задержкой всего 150 мс.
Точность: можно вручную корректировать произношение сложных терминов.
🔗 Попробовать демо на HuggingFace
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться

Комментарии (10)