Научные сотрудники Удмуртского института истории, языка и литературы УдмФИЦ УрО РАН создают новые технологии в лингвистике.
По словам руководителя УИИЯЛ УдмФИЦ УрО РАН Игоря Поздеева, сегодня продолжается наполнение корпуса удмуртского языка.
“Тот темп, который мы взяли, позволяет надеяться, что корпус будет наполнен достаточно быстро. Сейчас наша основная задача — полностью автоматизировать работу. То есть, чтобы программа при вводе текста сама проверяла на ошибки, преобразовала слова и вводила их в корпус”, — сообщил он.
Уже сейчас пользователям доступны полезные функции национального корпуса языка. Так, на сайте есть подробный словарь, помогающий сделать точный перевод многих слов. В корпусе уже находятся 55 тысяч слов с толкованием и примерами употребления.После того, как в него будут введены все удмуртские слова и их формы, станет возможным создание интерактивных сервисов по переводу и озвучиванию текстов на удмуртском. Одним из таких новшеств станет “робот”, проговаривающий его на удмуртском языке.
“Мы надеемся, что через несколько лет у нас будет переводчик с технологией нейросетей — когда текст вводится целиком, скажем, на русском языке, а программа переводит на удмуртский язык”, — делится Игорь Поздеев.