Система распознавания речи Microsoft значительно улучшилась

2 027

microsoft-speech

 

Год назад группа ученых из Microsoft по речевым и диалоговым исследованиям улучшила свою систему распознавания речи, достигнув 5,9% коэффициента ошибок. Ранее это считалось средним значением для частоты ошибок самих людей, однако позднее было показано, что коэффициент в 5,1% больше подходит для людей, способных цитировать то, что было услышано в беседе.

 

Чтобы снизить частоту ошибок системы распознавания речи, исследователи из Microsoft включили ряд усовершенствований в свои акустические и языковые модели на основе нейронной сети. Помимо общих обновлений для всех компонентов системы, размер словаря коммутатора увеличили с 30 000 слов до 165 000.

 

Наиболее важным нововведением стала так называемая «долговременная память на основе сеанса диалога». Это означает, что новая языковая модель позволяет системе использовать весь предыдущий разговор как историю при попытке четко определить конкретные фразы. Другими словами, система намного быстрее понимает, что разговор идет, например, о спорте или политике, и находит подходящие под эту тему фразы.

 

«Мы работаем над обучением компьютеров, чтобы не просто расшифровывать сказанные слова, а также понимать их смысл, — пишет технический сотрудник Microsoft. — Переход от распознавания к пониманию речи — следующий важный рубеж для речевых технологий».

 

Системы распознавания речи Microsoft в настоящее время используются в таких сервисах, как Cortana и Speech Translator. Компания предоставила документ, в котором описаны особенности новой версии системы.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *




[sam_pro id='2_4' codes='true'] [sam_pro id='2_16' codes='true']
[sam_pro id='2_5' codes='true'] [sam_pro id='2_17' codes='true']
[sam_pro id='2_8' codes='true']

Статьи & тестыArticles

Лучшие колонки

Топ-5 критериев выбора беспроводной колонки: Мощность – для комнаты хватит 10–20 Вт, для вечеринок лучше 40 Вт и выше. Автономность – оптимально от 12 часов, а если планируешь долгие прогулки или путешествия, ищи модели с 20–30 ч работы. Защита корпуса – стандарты IPX7 или IP67 гарантируют устойчивость к пыли и воде, что важно для использования […]


NVIDIA Blackwell – архитектура с новыми возможностями для ИИ и создания контента NVIDIA Blackwell

Технологии NVIDIA, которые были доступны только владельцам профессиональных видеокарт, стали открыты для обычных пользователей. Расскажем о возможностях архитектуры Blackwell в области искусственного интеллекта и создания контента.


НовостиNews
| 22.23
Хорошиий недорогой робот пылесос — что купить в 2025 году
| 16.08
Garmin Instinct Crossover — гибридные смарт-часы с экраном AMOLED, фонариком и сапфировым стеклом стоят $600
Garmin Instinct Crossover

Garmin Instinct Crossover получили 1,2-дюймовый AMOLED-дисплей с аналоговыми стрелками RevoDrive, покрытыми люминесцентным составом Super-LumiNova.