Русский ИТ бизнес
Русский ИТ бизнес

Microsoft выпустила бесплатную модель MAI-1 для расшифровки речи, которая в бенчмарке FLEUR обходит

Microsoft выпустила бесплатную модель MAI-1 для расшифровки речи, которая в бенчмарке FLEUR обходит
Microsoft выпустила бесплатную модель MAI-1 для расшифровки речи, которая в бенчмарке FLEUR обходит Gemini.

Поддерживает русский язык, работает быстро, позволяет загружать файлы или записывать голос из браузера. Идеально для интервью и лекций. Тут: https://playground.microsoft.ai/chat?model=mai-transcribe-1

Комментарии (18)

  • Альтернативный Единорог
    Альтернативный Единорог
    доступ только через квн Ответить
  • Лохматый Осьминог
    Лохматый Осьминог
    А мне ChatGPT на днях сгенерировал скрипт на питоне и теперь вся транскрипция проводится локально без отправки файлов куда-то на сторону. Работает отлично Ответить
    раскрыть ветку (9)
    • Милый Эксперт
      Милый Эксперт
      И на каком железе работает? Что по скорости? Есть ли тестовые данные у вас? 😉 Ответить
      раскрыть ветку (8)
      • Лохматый Осьминог
        Лохматый Осьминог
        На моем старом macbook c m2 работает на скорости примерно 1 к 5 (т.е. за одну секунду работы алгоритма обрабатывает 5 сек записи). Если не поленюсь, то попробую запустить на mac mini m4 (думаю, там прирост будет существенным). А так, текущая скорость меня вполне устраивает. использую для траскрибации аудиозаписей нашей клиники и подготовки текстов к дальнейшему анализу ИИ Ответить
        раскрыть ветку (7)
        • Крадущийся Судья
          Крадущийся Судья
          кстати у сбера на планшетах копайлот записывает все разговоры с сотрудниксо, потом анализ какой то и без вазилина цап Ответить
          раскрыть ветку (3)
          • Лохматый Осьминог
            Лохматый Осьминог
            Мы пишем общение администраторов клиники с клиентами (на ресепшене и телефонные) и после их анализируем, для последующей выдачи рекомендаций по улучшению работы. Как все отладим, то такое же решение будет и в кабинетах стоять Ответить
            раскрыть ветку (2)
            • Крадущийся Судья
              Крадущийся Судья
              ну вот супер применение реальное, всякие напоминалки по чекапам можно под соусом заботы о здоровье клиентов Ответить
            • Скользящий Червь
              Скользящий Червь
              А как насчёт конфиденциальности? Клиенты будут в курсе, что общение с врачом записывается? Ответить
        • Чесночный Минотавр
          Чесночный Минотавр
          Я виспер разворачивал ради интереса на маке с интел (Прошка 2020, последняя перед м1), 1 минута аудио расшифровывалась 3 минуты времени😂 Ответить
          раскрыть ветку (1)
          • Лохматый Осьминог
            Лохматый Осьминог
            Ну вот, даже на М2 существенный прирост скорости Ответить
        • Милый Эксперт
          Милый Эксперт
          Понял. Спасибо за ответ. Информативно 😉 Ответить
  • Авангардный Гигант
    Авангардный Гигант
    Главное диагнозы с ИИ не ставьте пожалуйста... Ответить
    раскрыть ветку (2)
    • Лохматый Осьминог
      Лохматый Осьминог
      Я в свое время участвовал в проекте совместно Бауманки и Онкологического института, по настройки ИИ (тогда еще не было всяких чатопгпт) для выявления кожной онкологии, по тестам выдает коэф правильных диагнозов выше чем у врача. Сейчас этот проект резидент Сколково и активно развивается. Конечно, мнение этой ИИ только как рекомендательное и окончательное решение принимает врач в том числе и на основе гистологии и других анализов Ответить
      раскрыть ветку (1)
      • Крадущийся Судья
        Крадущийся Судья
        да уже давно понятно, пока на данном этапе ии отличный помощник, но решение и отвественность на кожанном Ответить
  • Крадущийся Судья
    Крадущийся Судья
    а как вы обработку ведете на стороне? опасно данные реальные скармливать в чат гпт Ответить
    раскрыть ветку (3)
    • Лохматый Осьминог
      Лохматый Осьминог
      Мы на сторону уже обезличенное текстом отдаем, поэтому и транскрибация у нас локально Ответить
      раскрыть ветку (2)
      • Крадущийся Судья
        Крадущийся Судья
        так можно пропустить какие то чувствительные данные , каким образом обезличиваете? Ответить
        раскрыть ветку (1)
        • Лохматый Осьминог
          Лохматый Осьминог
          Имена и номера телефонов довольно легко локально выявить и заменить в тексте. Но это редкость, кроме имен в голосовых ничего нет, номера и другие данные уже и так вбиты в карточку клиента и голосом их проговаривать нет нужды Ответить