Русский ИТ бизнес
Русский ИТ бизнес
Post media

Alibaba выпустила CosyVoice 3 - мощный open-source для клонирования голоса

Alibaba выпустила CosyVoice 3 - мощный open-source для клонирования голоса

Несмотря на легкий вес (0,5 млрд параметров), модель превосходит конкурентов и доступна для коммерческого использования.

Ключевые фишки:

9 языков: включая русский, английский и китайский.

Идеальное клонирование: нужно всего 3 секунды аудио. Копирует тембр, эмоции, акцент и даже дефекты речи.

Real-time: работает с задержкой всего 150 мс.

Точность: можно вручную корректировать произношение сложных терминов.

🔗 Попробовать демо на HuggingFace

Русский ИТ бизнес

Комментарии (10)

  • Замёрзший Бухгалтер
    Замёрзший Бухгалтер
    МХЛ, вратарь, Борис Тютьков. Звучит как основа для доверия. На этом доверии строятся мои прогнозы. Основа для сегодня: 100к на КХЛ. Укрепи свой банкролл, перейдя в профиль.
  • Суровый Официант
    Суровый Официант
    мой друг сделал fast версию, на гитхабе можете найти
  • Лохматый Осьминог
    Лохматый Осьминог
    Все мошенники зааплодировали стоя 😂
  • Лохматый Осьминог
    Лохматый Осьминог
    Знает может кто хорошие нейронки для озвучки русского текста, для организации своих голосовых ии помощников? Локально чтобы работало типа этой?
    • Альтернативный Единорог
      Альтернативный Единорог
      Та что в новости наверно будет лучшей для этого..
    • Неоновый Клон
      Неоновый Клон
      для русского и языков народов России - silero лучшее из бесплатного open-source
    • Добрый Павлин
      Добрый Павлин
      Ну вот она вполне достойная, я тестил
  • Строганый Киборг
    Строганый Киборг
    а к comfyui еще не подключили ее?
  • Строганый Киборг
    Строганый Киборг
    Вот кстати как генерирует русский текст (Fun-CosyVoice3-0.5B)