Русский ИТ бизнес
Русский ИТ бизнес

Alibaba выпустила CosyVoice 3 - мощный open-source для клонирования голоса

Alibaba выпустила CosyVoice 3 - мощный open-source для клонирования голоса
Alibaba выпустила CosyVoice 3 - мощный open-source для клонирования голоса

Несмотря на легкий вес (0,5 млрд параметров), модель превосходит конкурентов и доступна для коммерческого использования.

Ключевые фишки:

9 языков: включая русский, английский и китайский.

Идеальное клонирование: нужно всего 3 секунды аудио. Копирует тембр, эмоции, акцент и даже дефекты речи.

Real-time: работает с задержкой всего 150 мс.

Точность: можно вручную корректировать произношение сложных терминов.

🔗 Попробовать демо на HuggingFace

Русский ИТ бизнес

Комментарии (10)

  • Замёрзший Бухгалтер
    Замёрзший Бухгалтер
    МХЛ, вратарь, Борис Тютьков. Звучит как основа для доверия. На этом доверии строятся мои прогнозы. Основа для сегодня: 100к на КХЛ. Укрепи свой банкролл, перейдя в профиль. Ответить
  • Суровый Официант
    Суровый Официант
    мой друг сделал fast версию, на гитхабе можете найти Ответить
    раскрыть ветку (1)
  • Лохматый Осьминог
    Лохматый Осьминог
    Все мошенники зааплодировали стоя 😂 Ответить
  • Лохматый Осьминог
    Лохматый Осьминог
    Знает может кто хорошие нейронки для озвучки русского текста, для организации своих голосовых ии помощников? Локально чтобы работало типа этой? Ответить
    раскрыть ветку (3)
    • Альтернативный Единорог
      Альтернативный Единорог
      Та что в новости наверно будет лучшей для этого.. Ответить
    • Неоновый Клон
      Неоновый Клон
      для русского и языков народов России - silero лучшее из бесплатного open-source Ответить
    • Добрый Павлин
      Добрый Павлин
      Ну вот она вполне достойная, я тестил Ответить
  • Строганый Киборг
    Строганый Киборг
    а к comfyui еще не подключили ее? Ответить
  • Строганый Киборг
    Строганый Киборг
    Вот кстати как генерирует русский текст (Fun-CosyVoice3-0.5B) Ответить