Состав коллектива

  • Артём Константинович Болдинов, бакалавриат ММФ НГУ
  • Иван Бондаренко, старший преподаватель кафедры ФиПЛ ГИ НГУ

Аннотация

Цель нашей работы состоит в исследовании и разработке многозадачного метода обучения глубокой сети wav2vec2 при дообучении на русскоязычном наборе данных Golos с учётом иерархичности речи после предварительного обучения на многоязычном наборе данных.

Объектом исследования в работе являются методы распознавания речи на основе глубоких нейронных сетей.

Предметом исследования является иерархическое многозадачное обучение нейронной сети типа wav2vec распознаванию русской речи.

Методы исследования. Для решения поставленных задач использованы методы анализа данных и машинного обучения, методы математической статистики, и методы программной инженерии.

Научная новизна полученных результатов состоит в следующем. Предложена архитектура многозадачной модели, позволяющая повысить качество распознавания символов и слов по сравнению с базовой моделью.

Обоснованность и достоверность научных положений и выводов подтверждается корректным использованием математических методов, применением способов разработки корректных программ, результатами экспериментальной проверки.