Электронная библиотека Веда
Цели библиотеки
Скачать бесплатно
Доставка литературы
Доставка диссертаций
Размещение литературы
Контактные данные
Я ищу:
Библиотечный каталог российских и украинских диссертаций

Вы находитесь:
Диссертационные работы России
Технические науки
Математическое моделирование, численные методы и комплексы программ

Диссертационная работа:

Бойков Федор Геннадиевич. Применение вейвлет-анализа в задачах автоматического распознавания речи : Дис. ... канд. физ.-мат. наук : 05.13.18 : Москва, 2003 111 c. РГБ ОД, 61:04-1/235-7

смотреть содержание
смотреть введение
Содержание к работе:

Введение

Глава /, Обзор применения технологии вейвлет-анализа 11

В ейвлеты и их свойства 13

В ей влет-преобразование _ ____ 13

Кратном ас штабный анализ и ортогональные вейвлеты 19

Быстрый алгоритм вычисления ортогонального ее йв лет-преобразования 26

Мул ъти в ей влеты .___ _^„___ _____ 2S

Бен влеты в обработке речи 33

Очистка речевого сигнала от шума 34

Сегментация речевого сигнала и определение основного тона ___^^__ 38

Автоматическое распознавание речи ___ ___^ .44

Выводы к главе 1: 59

Глава 2. Разработка и исследование методов параметризации речевого сигнала на
основе ьейвлет-аиализа
60

Параметризация на основе диад и чески* в ей влетов 60

Схема вычисления коэффициентов вей влет-преобразования 60

Схема формирования вектора признаков __ 67

Оценка параметров на основе недпадических вен влетов 68

Вейвлет преобразование в области нижних частот на основе голосового источника 71

Вейвлет преобразование в области верхних частот 80

Выводы к главе 2: 83

Глава 3. Численное моделирование распознавания речи на основе веивлетного
анализа
84

Распознавание слитной речи на основе вейвлет-аналнза 84

Архитектура системы распознавания слитной речи $5

Оненка параметров дискретных марковских моделей с помощью самоорганизующихся карт
признаков Кохонена. S9

Оценка параметров на основе диадическик вей влет о в 96

Расчетные формулы 96

Речевой материал 97

Результаты численных экспериментов 98

Оценка параметров на основе неднадическнх вей влетов 100

Расчетные формулы 100

Речевой материал 102

Результаты численных экспериментов 102

Выводы к главе 3: 103

Заключение 105

Список литературы

Введение к работе:

В связи со стремительным развитием информационных технологий в течение последних десятилетий значительно расширился круг задач, решаемых с помощью вычислительной техники. Также более разнообразными стали способы взаимодействия человека с различного рода электронными информационными системами. В частности речевые пользовательские интерфейсы внедряются в разнообразные автоматизированные системы.

Речь является наиболее естественной формой обмена информацией между человеком и машиной. Преимущества использования устной речи для общения с машинами сказываются также в снятии некоторых ограничений, которые присущи традиционным устройствам ввода-вывода, например, в освобождении рук и фиксированного положения тела оператора, необходимости использования клавиатуры и дисплея. Для многих миниатюрных устройств, таких как мобильные телефоны и ладонные компьютеры наличие встроенных систем распознавания и синтеза речи является единственным удобным способом обмена информацией.

Несмотря на то, что реализация речевого диалога с компьютерами на естественном разговорном языке до сих пор остается нерешенной задачей, современные методы цифровой обработки речевых сигналов успешно позволяют частные прикладные задачи из этой области. К таким приложениям можно отнести задачи распознавания раздельно и слитно произносимой речи (от простого распознавания произносимых слов и предложений до голосового управления различными системами),

верификации идентификации дикторов, медицинскую диагностику на основе исследования параметров речи (обнаружение патологий), и даже разработку детекторов лжи (распознавание эмоционального состояния).

Существующие технологии имеют ряд ограничений по надёжности и скорости распознавания, чувствительности к помехам, искажениям, ограничениям полосы частот. Эти ограничения не позволяют использовать системы с речевыми интерфейсами, во многих практических ситуациях, когда необходимо принятие ответственных решений. Это обстоятельство делает актуальными задачи разработки и исследования принципиально новых методов оценки информативных признаков речевого сигнала,

В связи с этим актуальными задачами являются задачи улучшения надёжности и скорости речевых систем на основе новых технологий.

До настоящего времени основным средством анализа речевого сигнала являются, в частотной области, преобразование Фурье, которое переводит исходный сигнал из амплитудно-временного пространства в частоти о-временное, а во временной области- линейное предсказание речи, которое описывает речевой сигнал с помощью модели авгорегрессии.

Существующие подходы несут в с^бе ряд ограничений связанных как с качеством частотно-временного представления сигнала, так и со скоростью и объемом вычислений, необходимых для преобразования. С появлением теории вейвлет-преобразования эти ограничения частично снимаются. Например, алгоритм быстрого вейвлет-преобразования (Fast Wavelet Transform — FWT) на основе ортогональных вейвлетов позволяет

— 4 —

сократить объём вычислений и повысить скорость преобразования, которая так важна для задач в масштабе реального времени.

Возможность успешного применения вейвлетов в задачах обработки и распознавания речи вытекает из свойств речевого сигнала. Вейвлеты, как средство многомасштабного анализа позволяют выделять, одновременно как основные характеристики сигнала, так и короткоживущие высокочастотные явления в речевом сигнале. Это свойство является существенным преимуществом в задачах обработки речевого сигнала по сравнению с оконным преобразованием Фурье, где, варьируя ширину окна, приходится выбирать масштаб явлений, которые необходимо выделить в сигнале- Кроме того, оконное Фурье-преобразование, являясь частным случаем вей влет-преобразования, не даёт в полной мере варьировать свои частотно-временные характеристики для подстройки системы под конкретную задачу. В отличие от традиционного преобразования Фурье, вейвлет-преобразование определено неоднозначно: каждому вейвлету соответствует свое преобразование. Это позволяет тщательнее подобрать вейвлет-функцию с хорошими свойствами частотно-временной локализации.

Получение дополнительной информации с разных масштабов времени и разных масштабов разрешения сигнала может улучшить точность распознавания речи.

Существуют также психофизиологические соображения [7] в пользу использования анализа речевого сигнала на основе вейвлетов. Человеческое ухо устроено так, что при обработке звукового сигнала оно передает мозгу вейвлет-образ сигнала. Колебания амплитуды давления

— 5 —

передаются от барабанных перепонок не мембрану и далее распространяются по всей длине завитка внутреннего уха. Завиток скручен в виде спирали во внутреннем ухе. Если представить, что завиток распрямлён в некоторый сегмент, а вместе с ним и распрямлена мембрана, то можно показать, что результирующее преобразование сигнала будет с точностью до константы совпадать с вейвлет-преобразованием.

Многочисленные исследования применения веивлет-анализа речевого сигнала, некоторые результаты которых рассмотрены в Главе 1, показали адекватность применения технологии веивлет-анализа для исследования речевого сигнала.

Обзор и анализ опубликованных работ показывает, что:

  1. Технология веивлет-анализа может быть успешно применена для исследования характерных особенностей сигнала, как средство многом асштабного анализа с хорошими показателями частотно-временной локализации;

  2. До сих пор на основе вейвлетов не создана система распознавания речи, сравнимая по показателям с системами, основанными на Фурье-преобразовании;

  3. Задача разработки системы распознавания речи с применением вейвлетов требует подхода, учитывающего особенности человеческого восприятия речевой информации и речевоспроизведения.

— 6—

Цель диссертационной работы заключается в разработке и исследовании методов параметризации речевого сигнала на основе вей влет-преобразования, а также практическом применении этих методов в системе распознавания речи.

Для достижения указанной цели в диссертационной работе решаются следующие основные задача исследования:

  1. Анализ существующих методов обработки речевых сигналов на основе вейвлетов;

  2. Анализ существующих систем автоматического распознавания речи с использованием вейвлетов;

  3. Разработка методов предобработки речевого сигнала на основе диадических вейвлетов;

  4. Конструирование методов и алгоритмов анализа речевого сигнала, основанных на вейвлетах, с использованием свойств восприятия звуковой информации и речеобразования;

  5. Экспериментальное исследование и настройка разработанных алгоритмов в системе автоматического распознавания речи.

Научная новизна работы заключается в следующем:

1. Разработаны алгоритмы вейвлет-анализа речевого сигнала с применением диадических вейвлетов для построения системы распознавания речи.

2. Разработаны алгоритмы вейвлет-анализа речевого сигнала на основе моделирования механизмов речеобразования и слуха человека.

На основе разработанных алгоритмов построен блок предобработки речевого сигнала для системы автоматического распознавания речи. Выполнены численные эксперименты по тестированию созданной системы.

Диссертационная работа состоит из введения, трёх глав и заключения.

В главе 1 излагаются основные особенности вейвлет-преобразования применительно к задачам обработки речи, особенности кратномасштабного анализа и ортогональных вейвлетов, а также быстрый алгоритм вычисления параметров вейвлет-преобразования.

В этой главе также анализируются существующие методы обработки речевого сигнала на основе технологии вейвлет-прсобразования; методы сегментации, очистки речевого сигнала от шума, определения основного тона и распознавания речи.

Подобные работы
Ефремов Роман Владимирович
Анализ методов полиэдральной аппроксимации выпуклых тел и их применение в задачах многокритериальной оптимизации
Минкин Александр Сергеевич
Применение технологии NURBS к созданию трехмерных компьютерных моделей для численного анализа начально-краевых задач
Стадник Алексей Викторович
Использование искусственных нейронных сетей и вейвлет-анализа для повышения эффективности в задачах распознавания и классификации
Алферов Максим Владимирович
Разработка алгоритмов комплексного анализа деятельности угольных предприятий с применением метода нейронных сетей
Акишина Елена Павловна
Развитие методов моделирования и анализа цифровых изображений и их применение
Шугай Юлия Сергеевна
Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей
Перемитина Татьяна Олеговна
Алгоритмы комплексного анализа многомерных данных о природных объектах с применением метода главных компонент и геоинформационных систем
Калинина Евгения Александровна
Теоретический и численный анализ задач идентификации для линейных моделей конвекции - диффузии - реакции
Черемухин Евгений Александрович
Задачи анализа и интерпретации данных для приближенных моделей

© Научная электронная библиотека «Веда», 2003-2013.
info@lib.ua-ru.net