Государственное бюджетное учреждение «Республиканский центр «Бэлиг» приступил к реализации проекта по распознаванию бурятской речи.
«Стартом нового этапа цифровизации бурятского языка, к реализации которого приступил коллектив центра, стал проект по сбору аудио дата-сета для обучения модели по распознаванию бурятской речи», - сообщили в центре «Бэлиг».
Первое совещание с участниками проекта прошло в минувшую пятницу онлайн. Директор центра «Бэлиг» Баир Балданов отметил значимость нового проекта, направленного на обучение искусственного интеллекта бурятскому языку.
- Мы начинаем работу над ещё одним из важных проектов по сохранению и развитию бурятского языка в цифровом пространстве. Благодарю вас, уважаемые коллеги за то, что вы согласились участвовать в нём на безвозмездной основе, - отметил Баир Балданов.
Новый проект реализуется в соответствии с достигнутыми недавно в Москве договорённостями центра «Бэлиг». Речь идёт о соглашении с Домом народов России и договоре с компанией «Яндекс». Первый документ касается сохранения этнокультурного и языкового многообразия Бурятии, в том числе путём разработки механизмов цифровизации родных языков. Договор с компанией «Яндекс» касается передачи ей центром «Бэлиг» базы данных голосовых записей на бурятском языке, необходимой для осуществления работ по синтезу и распознаванию речи.
Распознавание речи – это технология искусственного интеллекта, которая преобразует устную речь в машиночитаемый текст. Это многоуровневый процесс, включающий анализ звука, его разделение на фонемы, слова и фразы, и формирование текстовой расшифровки с помощью сложных алгоритмов и нейросетей, что позволяет компьютерам понимать команды, вести диалог и выполнять задачи.
В дальнейшем эта технология применяется при разработке голосовых помощников, голосового поиска, диктовки и транскрипции, управления устройствами. Также могут быть созданы голосовые боты-консультанты и многое другое.