В республике разработали синтезатор удмуртской речи
Эта работа стала результатом взаимодействия ученых двух научных подразделений УдмФИЦ УрО РАН: лингвистов Удмуртского института истории, языка и литературы и специалистов в области искусственного интеллекта Лаборатории машинного обучения и обработки «больших» данных производственных киберсистем.
Деятельность в данном направлении стала возможной благодаря разработанному учеными УдмФИЦ УрО РАН в 2019 году Национальному корпусу удмуртского языка, создающему условия для широкого использования удмуртского компьютерных технологий (распознаватели и синтезаторы речи, навигаторы, автоматические переводчики и т.д.).
Синтезатор удмуртской речи разработан на основе глубокой нейронной сети Tacotron.
Для бучения нейросети были задействованы мощные ресурсы вычислительного кластера ИММ УрО РАН (Екатеринбург) и использованы специально подготовленные тексты, озвученные Светланой Пикулевой – профессиональной ведущей радио «Моя Удмуртия».
Таким образом, удмуртская речь, сгенерированная синтезатором, воспроизводится сегодня голосом известной радиоведущей.
Пока мы говорим только о первой версии синтезатора. Данная нейронная сеть проста и хорошо обучаема. Она выдает приемлемый результат, но возможно пока еще не такой совершенный и естественный.
Например, по синтезированным нейронной сетью предложениям на удмуртском языке можно определить, что говорит не человек, а программа. В дальнейшем мы планируем использовать более совершенную нейронную сеть следующего поколения, которая сможет генерировать искусственный голос, неотличимый от голоса реального человека.
В настоящее время ведется работа по интеграции обученной нейронной сети синтезатора удмуртской речи и сайта Национального корпуса удмуртского языка. Уже вскоре синтезатор должен появиться в открытом доступе.
Григорий Григорьев, младший научный сотрудник Лаборатории машинного обучения и обработки «больших» данных производственных киберсистем УдмФИЦ УрО РАН
Уже сегодня синтезатор речи может быть полезен для слабовидящих людей, которые благодаря ему смогут слушать книги. Его можно использовать для обучения детей чтению на правильном литературном удмуртском языке.
Мы надеемся, что данная разработка будет полезна и востребована не только в качестве самостоятельного приложения, но и как составная часть автоматических переводчиков с удмуртского языка, навигаторов, обучающих систем, голосовых помощников.
Виктор Трубицын, заведующий лабораторией машинного обучения УдмФИЦ УрО РАН, доктор физико-математических наук