Электронная библиотека Веда
Цели библиотеки
Скачать бесплатно
Доставка литературы
Доставка диссертаций
Размещение литературы
Контактные данные
Я ищу:
Библиотечный каталог российских и украинских диссертаций

Вы находитесь:
Диссертационные работы России
Технические науки
Теоретические основы информатики

Диссертационная работа:

Баев, Алексей Александрович. Методы распознавания 3D изображений на основе их кватернионных моделей : автореферат дис. ... кандидата технических наук : 05.13.17 / Баев Алексей Александрович; [Место защиты: Нижегор. гос. техн. ун-т им Р.Е. Алексеева].- Нижний Новгород, 2011.- 17 с.: ил. РГБ ОД,

смотреть введение
Введение к работе:

Актуальность темы. В настоящее время широко ведутся разработки систем распознавания образов для применения в автономных транспортных средствах различных операционных сред: для города и бездорожья (мобильное патрулирование), для подводных работ (поисковые и исследовательские), дистанционно пилотируемые летательные аппараты. Одной из ключевых систем автономных транспортных средств является система технического зрения. Ее задачами являются сбор, обработка и преобразование сенсорной информации в сигналы, удобные для использования в системе управления. Данные с входящих в систему технического зрения ультразвуковых сенсоров, лазерных дальномеров могут быть искажены помехами и шумами (например, в зоне задымления или запыленности), в этом случае, принятие необходимых решений системой распознавания образов затрудняется. Обработка данных в реальном времени усложняется ввиду высоких требований к производительности цифрового процессора.

Важнейшие результаты в области обработки изображений и распознавания образов получены отечественными научными школами Ю.И. Журавлева, В.А. Сойфера, B.C. Киричука, Ю.Г. Васина, В.А. Ут-робина, В.В. Кондратьева, B.C. Титова, К.К. Васильева и Е.Л. Столова, а также зарубежными школами, в частности школой Принстонского университета. Ряд сложившихся к настоящему времени подходов к обработке 3D изображений базируется на воксельных моделях и связан с трудоемкими процедурами вычисления трехмерного градиента для выделения плоских фрагментов. Методы, базирующиеся на сферическом гармоническом анализе, нашли применение при решении задач биометрический идентификации, астроориентации и т.п. В последнее время получили развитие методы, основанные на представлении 3D изображений и точечных полей в виде кватернионных сигналов, предполагающие переход к формированию описания объекта в виде контура многогранника. Контурные методы обработки обладают высокой эффективностью в условиях, когда известна нумерация векторов, образующих контур данного изображения. В этом случае возможно формирование меры схожести плоских или 3D изображений на основе согласованной фильтрации их контуров, а при обработке плоских изображений - получать и оценки параметров линейных преобразований. Данный подход приемлем как в отношении сплошных изображений, так и в отношении групповых точечных объектов, однако его применение в этом случае требует знания нумерации векторов контура или отметок в составе группового точечного объекта, поскольку в противном случае

формирование импульсной характеристики фильтра, согласованного с контурным описанием данного объекта, невозможно. В случае контуров плоских сплошных изображений нумерация векторов в контуре обеспечивается естественным образом при прослеживании контура объекта. Однако для 3D изображений и изображений групповых точечных объектов приходится вводить определенные правила нумерации. При этом возможно возникновение ошибок в аналитическом описании в условиях воздействия координатных шумов, появления ложных отметок или пропуска сигнальных, что затрудняет использование контурной согласованной фильтрации.

Таким образом, актуальной задачей является разработка методов и алгоритмов обработки 3D изображений, обладающих высоким быстродействием, помехоустойчивостью, инвариантностью к нумерации отсчетов и преобразованиям масштаба и вращения.

Объектом исследования является система распознавания образов информационных систем, а предметом исследования - методы распознавания 3D изображений, заданных неупорядоченными отсчетами.

Цель и задачи исследования. Целью исследования является разработка методов распознавания 3D изображений на основе их кватерни-онных моделей в системах технического зрения.

Для достижения поставленной цели требуется решение следующих задач:

  1. Обзор и сравнительный анализ методов распознавания 3D изображений в информационных системах.

  2. Разработка метода распознавания 3D изображений с неупорядоченными отсчетами в виде функции кватернионного переменного.

  3. Оценка эффективности метода распознавания и обработки 3D изображений для решения задач распознавания и измерения параметров в условиях воздействия координатных шумов.

  4. Оценка вычислительной трудоемкости предложенного метода обработки 3D изображений. Повышение его быстродействия за счет применения параллельных вычислений.

  5. Разработка устройства распознавания на базе предложенного метода обработки 3D изображений и его реализация на программируемой логической интегральной схеме (ПЛИС).

Методы исследования. При проведении диссертационного исследования использованы методы теории функции гиперкомплексного переменного, контурного анализа изображений пространственных объектов, теории вероятностей и математической статистики, методы математического моделирования.

Научная новизна:

  1. Разработан метод описания 3D изображений в виде полиномиальной функции кватернионного переменного, проецирующей отсчеты с поверхности объекта на единичную сферу. На его основе разработаны алгоритмы распознавания и измерения параметров 3D изображений.

  2. Разработана методика повышения быстродействия путем распараллеливания вычислений с использованием технологии многопоточного программированияна графическом и центральном процессорах при обработке 3D изображений на базе проецирующей функции.

  3. Разработано устройство распознавания на базе предложенного метода, реализованное на ПЛИС.

Практическая ценность. Разработанные методы обработкии распознавания трехмерных изображений позволяют синтезировать эффективные системы их обработки, применяемые в локационных системах, системах биометрической идентификации, системах навигации и управления автономными транспортными средствами.

Защищаемые положения:

  1. Модель представления трехмерных объектов в виде проецирующей полиномиальной функции кватернионного переменного инвариантная к нумерации отсчетов на их поверхности, сохраняющая информацию о параметрах вращения и масштабирования и обеспечивающая возможность их определения.

  2. Методы оценки параметров вращения и масштабирования и распознавания 3D изображений пространственных объектов на основе полиномиальной функции кватернионного переменного, обеспечивающие возможность обработки 3D изображений пространственных объектов в условиях воздействия координатных шумов.

  3. Методы аппаратной и программной реализации устройства распознавания 3D изображений пространственных объектов системы технического зрения автономного транспортного средства.

Публикация результатов. По теме диссертации опубликованы 22 печатные работы, в том числе 3 статьи в журналах, рекомендованных ВАК РФ для публикации основных результатов диссертаций, 12 работ в журналах и трудах конференций. Получено 7 свидетельств Роспатента о регистрации программ для ЭВМ.

Практическая значимость. Научные и практические результаты диссертационной работы внедрены в разработкиОАО «Марийский машиностроительный завод» концерна «Алмаз-Антей», ООО «НИЦ Кибернетики и Автоматики», а также использованы при выполнении грантов РФФИ «Решение проблемы распознавания и оценки параметров 2D

и 3D изображений при неизвестной нумерации отсчетов их контуров на базе теории функции комплексного и гиперкомплексного переменного», проект №08-01-00854-а, «Решение проблемы распознавания и оценки параметров многоградационных и цветных 3D изображений сложной формы при неизвестной нумерации их отсчетов на базе методов теории функции гиперкомплексного переменного», проект №10-01-00445-а, по программе «Развитие научного потенциала высшей школы», проекты 2.1.2/2204 и 2.1.2/10218, использованы в учебном процессе на радиотехническом факультете Марийского государственного технического университета по дисциплинам «Радиотехнические системы», «Цифровая обработка радиотехнических сигналов», «Цифровые устройства и микропроцессоры», «Научно-исследовательская работа в семестре», в курсовом и дипломном проектировании. Акты о внедрении приведены в приложении к диссертации.

Достоверность и обоснованность полученных результатов обусловливается корректным использованием адекватного математического аппарата, методов математического моделирования и логической обоснованностью выводов, согласованностью с известными научными положениями, актами о внедрении.

Апробация полученных результатов. Основные результаты диссертационной работы обсуждались на 10-й Международной научно-технической конференции и выставке «Цифровая обработка сигналов и ее применение» (г. Москва, 2008 г.), Ш-й молодежной научной конференции «Тинчуринские чтения» (г. Казань, 2008г.), Всероссийской конференции «Математические методы распознавания образов» (ММРО -14 г. Суздаль, 2009г. и ММРО - 15 г. Петрозаводск, 2011 г.), научной школе для молодых ученых «Компьютерная графика и математическое моделирование (Visual Computing)» (г. Москва, 2009 г.), IX Международной конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание-2010» (г. Курск, 2010 г.), 4-й международной конференции «Распределенные вычисления и грид-технологии в науке и образовании» (г. Дубна, 2010 г.), а также на IX и X международных конференциях «Распознавание образов и обработка изображений» (г. Н.Новгород, 2008 г. и г. Санкт-Петербург, 2010 г.).

Личный вклад автора заключается в участии в постановке целей и задач исследования, получении, обработке и анализе основных результатов, интерпретации и обобщении полученных данных, формулировке выводов и основных научных положений.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и списка использованной литературы из 84 наименований. Общий объем диссертации 131 страниц машинописного текста, содержит 51 рисунок и 4 таблицы.


© Научная электронная библиотека «Веда», 2003-2013.
info@lib.ua-ru.net