Тип публикации: препринт
Год издания: 2006
Ключевые слова: обработка речи, преобразование в текст, вероятностно-сетевые модели, фонемы русского языка
Аннотация: Рассмотрена вероятностно-сетевая модель преобразования речи в текст. Признаки выделены на основе кратномасштабного вейвлет-преобразования. Классификация фонемных сегментов выполнена нейронной сетью, предварительно обученной под конкретного диктора. Из фонемных сегментов синтезирована фонемная строка, используемая для формирования сПоказать полностьюлова с учетом вероятности встречаемости фонем в словах. Скомпонована грамматическая форма слова из фонемной транскрипции. В случае ошибочного распознавания отдельных фонем слово подбирают из словаря словоформ. Для поиска такого слова используют функцию Левенштейна, которую часто называют расстоянием редактирования. Модуль преобразования речи в текст реализован в среде Matlab 7. Исследование качества распознавания показало, что надежность классификации составляет 95,5%