Этнические организации помогают в разработке электронных переводчиков
По словам разработчиков, начальный этап работы над языками одинаковый: в машину загружаются все доступные материалы, она проходит по параллельным текстам на разных языках и строит распределение вероятностей перевода для каждого найденного слова. Так система пополняет свой словарный запас и запоминает переводы.
Перевод с малых языков отличается тем, что не может обойтись без своего рода "асессора" — человека, который знает этот язык и может по особым методикам определить, насколько точным оказался перевод.
В этом случае разработчикам помогают многочисленные региональные организации, которые в России занимаются исследованием и сохранением малых языков.
Так, в создании марийско-русского перевода помогли сразу несколько организаций, которые обеспечили лингвистическую поддержку и подготовку эталонных марийско-русских переводов для оценки качества перевода.
В создании переводчика с удмуртского языка помогла группа энтузиастов, которые занимаются составлением его корпуса.
Работы по машинному переводу с других языков еще очень много и разработчики группы машинного перевода "Яндекса" надеются на помощь людей, неравнодушных к судьбе своих языков и готовых помочь в создании корректного переводчика.
По материалам сайтов nplus1.ru, Национальный акцент