Электронная библиотека Веда
Цели библиотеки
Скачать бесплатно
Доставка литературы
Доставка диссертаций
Размещение литературы
Контактные данные
Я ищу:
Библиотечный каталог российских и украинских диссертаций

Вы находитесь:
Диссертационные работы России
Технические науки
Автоматизированные системы управления и прогрессивные информационные технологии

Диссертационная работа:

Катков Олег Николаевич. Автоматизация процесса верификации абонентов АСУ с речевым управлением : диссертация ... кандидата технических наук : 05.13.06 / Катков Олег Николаевич; [Место защиты: Орлов. гос. техн. ун-т].- Орел, 2008.- 160 с.: ил. РГБ ОД, 61 08-5/1343

смотреть содержание
смотреть введение
Содержание к работе:

Введение 4

ГЛАВА 1 Сравнительный анализ способов идентификации

пользователей АСУ 12

  1. Верификация пользователей в АСУП 12

  2. Сравнение методов контроля биометрических параметров 20

  3. Идентификация личности по рисунку сосудов глазного дна 21

  4. Идентификация личности по радужной оболочке глаза 22

  5. Идентификация личности по геометрии кисти руки 23

  6. Идентификация по папиллярным рисункам пальцев руки 24

  7. Идентификация личности по особенности геометрии лица 25

  8. Термографическое наблюдение лицевых артерий и вен 27

  9. Идентификация личности по венам руки 28

  10. Развитие статических методов биометрической идентификации...28

  11. Принципы идентификации методом динамической биометрии 29

  12. Обобщенная структура систем биометрической идентификации...31

  13. Сравнительный анализ систем идентификации личности 34

Выводы по первой главе 38

ГЛАВА 2 Анализ принципов построения систем речевой

верификации личности 39

  1. Характеристики и параметры речевых сигналов 39

  2. Идентификация личности по особенностям голоса 47

  3. Структура систем речевого распознавания 55

  4. Алгоритм определения частоты основного тона 65

  5. Нечеткая логика в системах верификации 80

Выводы по второй главе 85

ГЛАВА 3 Нейросетевые системы верификации речевых

сигналов 86

3.1 Нейронные сети и их применение для распознавания

речевых сигналов 86

Динамическая нейронная сеть и алгоритмы

ее функционирования 93

Устройство и алгоритм исключения неинформативных параметров речевого сигнала 106

Выводы по третьей главе 109

ГЛАВА 4 Процесс верификации пользователей на основе

динамических нейронных сетей 110

Локально-стационарная модель речевых сигналов 110

Распознавание речевых сигналов как решение дискретной экстремальной задачи 115

Математическая модель процесса верификации 119

4.4. Разработка алгоритма процесса верификации 127

  1. Разработка рекомендаций по реализации системы

речевой верификации 135

  1. Оценка эффективности системы речевой верификации 140

Выводы по четвертой главе 148

Заключение 149

Библиографический список 150

Введение к работе:

Современный этап развития информационно-вычислительных и автоматизированных систем характеризуется расширением их функциональных возможностей с предоставлением потребителям широкой сферы дополнительных и сервисных услуг. В частности, значительно упрощен доступ к информационным базам данных по сетям Internet и Intranet, осуществляемый даже с сотовых телефонов, автоматизированы процессы вычислений, различного вида проектирования, маркетинга, составления отчетов и т. п.

Одним из перспективных направлений дальнейшего совершенствования средств информационно-вычислительной техники является разработка и внедрение человеко-машинных систем - автоматизированных систем с речевым управлением, основанных на распознавании речи и ее преобразовании в набор управляющих команд или текстовых файлов. Создание таких систем позволит значительно упростить процессы составления различных отчетов (печатные машинки, управляемые голосом), поиска информации (по ключевым словам в речевом запросе), выдачи справочных данных (о расписании поездов, местонахождении объектов, номерах телефонов и т. п.).

Вторым, и одним из важнейших путей развития систем с речевым управлением является создание устройств идентификации личности абонента в целях защиты информационных баз данных от несанкционированного использования или преднамеренного искажения. Такая защита необходима не только в информационно-вычислительных системах специального назначения, но и в автоматизированных системах управления технологическими процессами на предприятиях точного приборостроения, выпускающих продукцию двойного назначения.

Передовой мировой опыт доказывает, что повышение эффективности деятельности современного предприятия возможно только при наличии единой системы, объединяющей управление финансами, персоналом, снабжением, сбытом и собственно производством. Такие системы рассматриваются как средство достижения основных целей бизнеса: улучшения качества выпускаемой продукции, снижения издержек и увеличения объема производства.

Актуальность работ по созданию и внедрению на предприятии автоматизированной системы оперативного диспетчерского управления (АСО- ДУ) каждый руководитель понимает по-своему. Однако есть ряд объективных факторов, влияющих на принятие решения. Так, решить задачу повышения эффективности собственного производства невозможно без получения объективной картины технических и технологических параметров производства. Другой фактор - это наличие информационных и организационных барьеров между управленческими и технологическими уровнями. И последнее, необходимо осуществить разграничение доступа лиц к общей информационной базе в соответствии с занимаемым положением и возложенными функциональными обязанностями.

В связи с этим исследование и разработка микропроцессорных устройств для автоматического распознавания абонентов по особенностям речи является важной научно-практической задачей, которая особенно актуальна на современном этапе развития информационных технологий.

Создание устройств с высокой надежностью (достоверностью) распознавания речи позволит обеспечить не только допуск легитимных абонентов к информационным сетям специального назначения, но и решать задачи автоматической оценки эмоционального состояния операторов, управляющих сложными производственными процессами, а также других лиц, работающих в реальных или моделируемых стрессовых ситуациях. В частности, по снижению скорости речи можно судить о степени утомляемости, а повышение акустического уровня звука и частоты слов указывает на эмоциональное возбуждение человека при возникновении непредвиденных ситуаций, и т. д.

Исследованиями различных аспектов проблемы распознавания речевых сигналов занимаются тысячи зарубежных организаций. Имеются мощные научные центры в Японии, Франции, Канаде, Швеции и других странах.

Ведущими американскими центрами в области речевых технологий являются Массачусетский технологический институт, Калифорнийский и Карнеги- Меллонский университеты, Хаскинская и Белловская лаборатории. Значительные достижения имеют исследовательские центры фирм IBM и BBN, фирмы Scott Instruments Inc., Kurzweil Applied Intelligence Inc., Voice Processing Corp., Texas Instruments и др. В Японии ведущей фирмой является NliC и исследовательские центры Университетов городов Токио и Киото. В Швеции - Королевский Технологический Институт, в Финляндии - Хельсинский Университет.

В России и странах ближнего зарубежья несколько десятков организаций также работает в области цифровой обработки речевых сигналов. Среди этих организаций три мощных коллектива проводят полный цикл работ в области распознавания речи - начиная от комплексных исследований про-! блемы и закапчивая изготовлением опытных и серийных образцов. К этим коллективам относятся: Институт кибернетики АН Украины, Институт ма-, тематики СО РАН и Институт технической кибернетики АН Белоруссии.

Следует также отметить Московский и Петербургский университеты, в которых работают две лингвистических школы, и Петербургский Институт физиологии РАН, где имеется одна из ведущих в мире физиологических школ.

В СССР процессорное устройство для распознавания изолированных команд "Икар" было создано еще в 1980 году в НИИ СЧЕТМАШ [1, 2], а в 1982-1983 годах созданы системы распознавания изолированных команд: "Речь" (ИК АН Украины) [3], "Марс" (НТК Беларусии) и "Сибирь" (ИМ СО РАН и НГУ) [4].

Применение векторного квантования измеряемых характеристик (признаков) речевых сигналов, представление речевых сигналов в пространстве признаков в виде марковских последовательностей, появление быстродействующих процессоров и увеличение объемов оперативной памяти компьютеров позволило еще в 1980-е годы теоретически решить проблему распознавания речи, составленной из словарей большого объема. Однако широкое распространение систем распознавания речи сдерживалось ограниченной производительностью вычислительной техники. Для распознавания, например, 200 команд необходим процессор с производительностью 30 млн. операций в секунду, содержащий 500 тыс. электронных компонентов. Для распознавания слитно произнесенных цифр нужно выполнять до 100 млн. операций в секунду процессором, имеющим один миллион компонентов. Кроме того, для распознавания слитной речи на базе словаря в 1000 слов требуется производить вычисления со скоростью один млрд. операций в секунду при 10 млн. компонентах на процессор. Для распознавания слитной речи из словаря с 5000 слов - до 300 млрд. операций в секунду на процессоре, имеющем более 30 млн. элементов [5].

Универсальные системы распознавания речи продемонстрировали эф- f фективность устного ввода информации. Однако эти системы трудно адаптировать к конкретной предметной области, поэтому они не нашли широкого практического применения, в частности, из-за относительно невысокой надежности распознавания слов, составляющей в среднем около 80 % при ощутимой задержке при выдаче результатов распознавания речи.

В это же время спегщаяпзированные системы распознавания речевых сигналов характеризуются сравнительно высоким показателем надежности. Так, голосовая пишущая машинка ( Voice typewriter) фирмы IBM с системой распознавания речи TANGORA на 20000 слов обучается на голос диктора в течение 20 минут при произнесении фраз с четко выраженными паузами между словами, и при прочтении четырьмя дикторами 100 эталонных предложений (1696 слов) получено всего 3,5 % ошибок [6, 7].

Фирмы British Telecom, Lodgica и Кембриджский университет в рамках программы Alvey создали голосовую систему управления базой данных ( VODIS) для получения по телефону информации о движении поездов, которая рассчитана на распознавание 200 слов в составе предложений [8].

В Карнеги-Меллонском университет и фирме Dragon Systems разработана система, ориентированная на словари изолированных слов объемом 1000, 11000 и 30000 слов с надежностью распознавания на тестовом словаре DARPA 1000 слов - 98,6 %, 11000 слов - ,83 % и 30000 слов - 93 % [6].

В настоящее время развиваются проекты по распознаванию слитной речи из словарей, содержащих десятки тысяч и даже более 100 тысяч слов.

Современные системы распознавания речи основаны на использовании сигнальных процессоров серии TMS320 и быстродействующих персональных компьютеров со специализированным программным обеспечением, чем практически ограничивается возможность применения таких устройств в различных областях. В связи с этим ставится задача по разработке и исследованию систем распознавания речи, специализированных по областям применения и реализуемых на базе одной - двух интегральных микросхем.

Возможность практического создания таких речевых микросхем обусловлена несколькими факторами: развитием средств сотовой связи, широким внедрением устройств управления на базе нечеткой логики и разработкой новых алгоритмов динамического программирования, реализуемых на нейтронных сетях. Сочетание принципов построения данных устройств позволяет обеспечить решение задачи по созданию надежных и сравнительно недорогих микросхем распознавания речевых сигналов, предназначенных для идентификации личности или управления технологическими процессами.

В общем случае проблема создания устройств с речевым управлением и систем распознавания речи содержит две принципиально разных задачи.

Первая задача сводится к преобразованию акустического речевого сигнала в электрический сигнал с его последующим цифровым преобразованием или кодированием. При этом выделяются основные информативные признаки речи (частота основного тона и ряд коэффициентов, характеризующих тембр и фонетические особенности речи на интервалах 10-30 мс), которые передаются по каналу связи в виде последовательности параметров.

Вторая задача заключается в сравнении неизвестных параметров речи с некоторыми базовыми эталонными значениями, получаемыми заранее на этапе обучения системы распознавания, и формировании выходных сигналов в зависимости от итогов сравнения в виде необходимых управляющих воздействий или как результат идентификации личности абонента.

Успешное и вполне удовлетворительное решение первой задачи - кодирование параметров речи - доказано практическим использованием миллиардов сотовых телефонов, в которых реализовано цифровое преобразование разноязычной речи и ее передача со скоростью 13,5 килобит в секунду.

В связи с этим объектом исследования в диссертационной работе являются системы верификации пользователей АСУ с речевым управлением.

Предмет исследования - модели и алгоритмы обработки речевых сигналов.

Цель работы состоит в повышении качества функционирования АСУ с речевым управлением за счет совершенствования системы верификации пользователей.

Поставленная цель предполагает решение следующих научных задач:

  1. обоснование способа эффективной верификации пользователей АСУ на основе их речевых характеристик;

  2. разработка алгоритмов обработки речевых сигналов для задач верификации пользователей в АСУ с речевым управлением;

  3. моделирование и экспериментальное исследование алгоритма речевой верификации для оценки его результативности и аппаратурных затрат.

При решении поставленных в диссертационной работе задач применялись следующие методы исследования: методы системного анализа, методы теории множеств, теория нейронных сетей, теория принятия решений, мето-

ды объектно-ориентированного программирования, теория электрической связи, методы статистической обработки сигналов, а также программные и языковые средства современных компьютерных технологий.

Научная новизна диссертационной работы заключается в следующем:

  1. разработаны математическая модель и алгоритм верификации пользователей АСУ с речевым управлением, основанные на аппарате динамических нейронных сетей, учитывающие статистические характеристики речевого сигнала;

  2. разработан новый алгоритм фрагментирования речевых сигналов для формирования признакового пространства на входе нейронной сети, учитывающий автокорреляционные связи между соседними речевыми кадрами;

  3. разработан способ определения частоты основного тона речевого сигнала, основанный на быстром преобразовании Фурье и адаптивном изменении интервала анализа

Основные положения, выносимые на защиту диссертационной работы:

    1. Способ определения частоты основного тона речевого сигнала, основанный на адаптивном изменении интервала анализа.

    2. Устройство и алгоритм исключения неинформативных параметров речевого сигнала, обеспечивающий сокращение времени верификации абонентов АСУ с речевым управлением.

    3. Математическая модель и алгоритм процесса речевой верификации абонентов АСУ с речевым управлением на основе аппарата динамических нейронных сетей.

    Практическая значимость и реализация результатов работы заключается в том, что полученные научно-технические решения использованы при выполнении двух научно-исследовательских работ, проведенных в Академии ФСО России в 2006 — 2007 годах. Результаты исследований внедрены и используются в образовательном процессе - при проведении практических и лабораторных работ по курсу "Теория электрической связи" и "Цифровая обработка сигналов" на кафедре №7 Академии ФСО России, а также при дипломном проектировании.

    Апробация работы. Основные положения и результаты работы докладывались и получили положительную оценку на следующих конференциях:

        1. Международная научная конференция "Информатизация и информационная безопасность правоохранительных органов" Москва, 2004 г.

        2. XI Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов "Новые информационные технологии в научных исследованиях и образовании" Рязань, 2006.

        3. XII Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов "Новые информационные технологии в научных исследованиях и образовании" Рязань, 2007.

        4. 33-я Всероссийская научно-техническая конференция "Сети, системы связи и телекоммуникации. Деятельность ВУЗа при переходе на федеральный государственный образовательный стандарт 3-го поколения" Рязань, 2008.

        5. XIII Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов "Новые информационные технологии в научных исследованиях и образовании" Рязань, 2008.

        По результатам проведенных исследований опубликовано 6 статей, в том числе 4 работы в изданиях из перечня ВАК.

Подобные работы
Шведов Николай Георгиевич
Автоматизация и управление процессом многолезвийной механической обработки на основе динамического моделирования технологической системы
Тимофеев Дмитрий Юрьевич
Автоматизация и управление процессом стружкодробления на основе предварительного термического воздействия на обрабатываемый материал
Крюков Игорь Иванович
Автоматизация и управление процессами проектирования и производства специальных кварцевых оптических волокон
Попов Дмитрий Иванович
Комплексная автоматизация и управление процессами аттестации персонала промышленных предприятий
Мырзин Глеб Семенович
Автоматизация и управление процессом технического обслуживания системы технологических трубопроводов
Левыкин Михаил Павлович
Автоматизация и управление технологическими процессами многономенклатурного производства специализированной обуви
Касьянов Юрий Васильевич
Автоматизация и управление технологическим процессом ректификации КССЖ в производстве спирта
Белоусов Александр Владимирович
Автоматизация и управление вентиляционными процессами на базе электростатической фильтрации газовоздушных сред
Сарданашвили Сергей Александрович
Автоматизация процесса принятия решений в диспетчерском управлении газотранспортной отрасли
Надиров Армаис Григорьевич
Автоматизация технологических процессов дробильно-сортировочного производства с управлением по крупности продукта дробления

© Научная электронная библиотека «Веда», 2003-2013.
info@lib.ua-ru.net