20:05, 03 февраля 2023, Бишкек - 24.kg , Татьяна КУДРЯВЦЕВА
Ученые из института умных систем и искусственного интеллекта Назарбаев Университета (ISSAI) расширили свою работу до автоматизированной многоязычной модели, которая может распознавать десять тюркских языков. Об этом сообщается на сайте вуза.
Ранее ученые разработали модели распознавания речи для казахского языка. Теперь система распознает азербайджанский, башкирский, чувашский, казахский, кыргызский, саха, татарский, турецкий, уйгурский и узбекский языки.
«Многоязычные модели, которые были обучены с использованием общих речевых данных, показали более надежные результаты, чем базовые одноязычные модели, при этом лучшая модель достигла снижения средней частоты ошибок в символах и словах на 56 и 54 процента соответственно», — говорится в сообщении.
Результаты экспериментов показали, что снижение частоты ошибок в символах и словах было более вероятным, когда многоязычные модели обучались с использованием данных из родственных тюркских языков, чем когда они разрабатывались с использованием данных из неродственных, нетюркских языков, таких как английский и русский.
Чтобы продемонстрировать использование многоязычной модели автоматического распознавания речи для тюркских языков, ISSAI разработала демо-программу, которая распознает десять тюркских языков, а также русский и английский.