Русско-эрзянский онлайн-переводчик разрабатывают ученые Мордовии

17 апреля, 14:33
Русско-эрзянский онлайн-переводчик разрабатывают ученые Мордовии
МГУ им. Н.П. Огарёва

В Мордовском госуниверситете имени Н.П. Огарёва занимаются разработкой интернет-переводчика на эрзянский язык. По мнению ученых, он получит широкое применение в системе образования, органах госслужбы при делопроизводстве, национальных СМИ как в регионе, так и в местах компактного проживания мордовского населения за пределами республики.

По данным Федерального агентства по делам национальностей, к 2023 году онлайн-переводчики были разработаны только для 6 из 277 языков народов России: татарского, башкирского, чувашского, марийского, якутского и удмуртского.

Согласно последней переписи населения России, численность мордвы составляет более 484 тысяч человек. Из них 30% проживают в Мордовии, остальные расселены по Нижегородской, Ульяновской, Оренбургской, Самарской и Пензенской областям. «Отсутствие интернет-сервиса по мордовским языкам не позволяет в полной мере обеспечивать функционирование эрзянского и мокшанского языков в цифровом пространстве. Разработка онлайн-переводчика на мордовские языки расширит сферу их функционирования, упростит процессы их применения, создаст условия для их сохранения и развития в современных условиях», - считают специалисты университета.

«Наш вуз получил грант в размере 8,5 млн рублей на создание параллельных корпусов мордовских языков - русско-эрзянского и русско-мокшанского. Работа ведётся в рамках реализации стратегического проекта «Университет — центр социокультурного развития региона» федеральной программы «Приоритет 2030», – отметил ректор МГУ им. Н.П. Огарёва Дмитрий Глушко.

Состав и содержание предложений имеет самый разнообразный характер, часто применяется не употребляемая в мордовских языках терминология — это является трудоемкой и сложной переводческой задачей. Предложения собраны из различных источников — художественные тексты, тексты официальных новостей, фразы из разговорников, учебников, научная и техническая терминология.

«Мы создали и запустили чат-бот в мессенджере «Телеграм» для направления перевода русский-эрзянский. Также в режиме бета-тестирования с коллегами отрабатываем наиболее распространенные ошибки и неточности, вносим правки в модель, учитываем в следующих релизах. Сейчас мы начинаем сбор аудиозаписей на эрзянском языке для решения задач синтеза и распознавания речи. Кроме того, мы собираем и предложения для языковой пары русский-мокшанский, с дальнейшей реализацией такой же модели в виде чат-бота», — отметил разработчик проекта, доцент кафедры фундаментальной информатики, директор лаборатории интеллектуального анализа данных МГУ им. Н.П. Огарёва Артём Андронов.

Загрузка...


Пример HTML-страницы
Пример HTML-страницы
Пример HTML-страницы
Пример HTML-страницы

Банк Хлынов снова в списке самых надежных банков страны
Инфо-РМ

Видео дня





Доска объявлений.jpg