, , , ,

"Исследование и разработка алгоритма распознавания устной речи на базе метода переноса обучения в глубокой нейронной сети типа wav2vec". Артём Константинович Болдинов, бакалавриат НГУ, 29.6.2022

nsu_akboldinov_202206.pdf

Состав коллектива

Аннотация

Цель нашей работы состоит в исследовании и разработке многозадачного метода обучения глубокой сети wav2vec2 при дообучении на русскоязычном наборе данных Golos с учётом иерархичности речи после предварительного обучения на многоязычном наборе данных.

Объектом исследования в работе являются методы распознавания речи на основе глубоких нейронных сетей.

Предметом исследования является иерархическое многозадачное обучение нейронной сети типа wav2vec распознаванию русской речи.

Методы исследования. Для решения поставленных задач использованы методы анализа данных и машинного обучения, методы математической статистики, и методы программной инженерии.

Научная новизна полученных результатов состоит в следующем. Предложена архитектура многозадачной модели, позволяющая повысить качество распознавания символов и слов по сравнению с базовой моделью.

Обоснованность и достоверность научных положений и выводов подтверждается корректным использованием математических методов, применением способов разработки корректных программ, результатами экспериментальной проверки.