Электронная библиотека Веда
Цели библиотеки
Скачать бесплатно
Доставка литературы
Доставка диссертаций
Размещение литературы
Контактные данные
Я ищу:
Библиотечный каталог российских и украинских диссертаций

Вы находитесь:
Диссертационные работы России
Технические науки
Информатика, вычислительная техника и автоматизация

Диссертационная работа:

Данилкин Сергей Владимирович. Модели построения информационных массивов для решения задачи классификации сведений в условиях неопределенности : диссертация ... кандидата технических наук : 05.25.05 / Данилкин Сергей Владимирович; [Место защиты: Тамб. гос. техн. ун-т].- Тамбов, 2010.- 204 с.: ил. РГБ ОД, 61 10-5/2515

смотреть содержание
смотреть введение
Содержание к работе:

ОСНОВНЫЕ И УСЛОВНЫЕ СОКРАЩЕНИЯ И ОБОЗНАЧЕНИЯ 4

ВВЕДЕНИЕ 5

1 РЕШЕНИЕ ЗАДАЧ КЛАССИФИКАЦИИ И ПРОБЛЕМА НЕОПРЕДЕЛЕННОСТИ 10

1.1 Общая постановка задачи классификации и основные направления ее решения 14

1.2 Основные концепции неопределенности в задачах классификации 20

1.2.1 Основы подхода к решению задач классификации с позиции

теории нечетких множеств 33

1.3 Постановка цели и задач исследования 40

2 АНАЛИТИЧЕСКИЕ И ПРОЦЕДУРНЫЕ МОДЕЛИ ДЕКОМПОЗИЦИИ ЦЕЛЕВОГО ПРОСТРАНСТВА ИНФОРМАЦИОННЫХ МАССИВОВ И ПОСТРОЕНИЕ ОЦЕНКИ СЛОЖНОСТИ ИНФОРМАЦИОННЫХ МАССИВОВ 43

2.1 Структура отношений на целевом пространстве информационных массивов 44

2.2 Отображения целевого пространства информационных массивов 47

2.3 Декомпозиция целевого пространства информационных массивов... 51

2.4 Функция оценки близости и метрики на декомпозиции целевого пространства информационных массивов 60

2.5 Определение сложности 63

2.6 Оценка сложности информационных массивов 65

2.7 Декомпозиция целевого пространства информационных массивов по сложности 72

2.8 Формулировка принципа сложности для информационного массива.. 78

2.9 Оператор и функционал сложности информационного массива 81

2.10 Критерий сложности построения информационного массива 82

2.11 Критерий обобщенной эффективности

2Л2 Связь с теорией нечетких множеств 86

Выводы по главе 90

3 ФОРМИРОВАНИЕ ИНФОРМАЦИОННЫХ МАССИВОВ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ 91

3.1 Методы оценки релевантности 92

3.2 Формирование пространства информационных массивов 100

3.3 Постановка задач выбора метода решения задачи классификации 117

3.4 Результаты решения задачи классификации 126

Выводы по главе 130

ЗАКЛЮЧЕНИЕ 131

СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ 132

ПРИЛОЖЕНИЕ А Фрагменты результатов работы ИПМ Rambler 154

ПРИЛОЖЕНИЕ Б Фрагменты результатов работы ИПМ Yandex 160

ПРИЛОЖЕНИЕ В Фрагменты результатов работы ИПМ AltaVista 168

ПРИЛОЖЕНИЕ Г Фрагменты результатов работы ИПМ Google 170

ПРИЛОЖЕНИЕ Д Фрагменты результатов работы ИПМ Aport 176

ПРИЛОЖЕНИЕ Е Фрагменты результатов работы ИПМ Yahoo 179

ПРИЛОЖЕНИЕ Ж Фрагменты результатов работы ИПМ Ask 186

ПРИЛОЖЕНИЕ И Фрагменты результатов работы ИПМ Lycos 189

ПРИЛОЖЕНИЕ К Фрагменты результатов работы ИПМ Nigma 195

ПРИЛОЖЕНИЕ Л Акты об использовании и внедрении результатов диссертационной работы 2  

Введение к работе:

Актуальность темы. На современном этапе развития общества, характеризующемся интенсивным внедрением информационных технологий, которые в большинстве своем основываются на использовании компьютерных сетей, особое значение приобретают задачи классификации сведений, получаемых из различных источников, одним из которых являются результаты работы информационно-поисковых машин (ИПМ). Использование информационно-поисковых машин в настоящее время приобретает особую значимость при нахождении сведений, необходимых для решения задач анализа, оптимизации, управления и принятия решений в различных сферах деятельности. Необходимость решения задач классификации сведений обусловлена неудовлетворительным качеством работы информационно-поисковых машин, результаты работы которых, в большинстве своем, не отранжированы по критерию релевантности и даже в тех случаях, когда этот критерий используется, отсутствует какая-либо группировка сведений, способствующая упрощению процесса их последующей обработки. Одной из основных особенностей задачи классификации сведений является наличие как качественных, являющихся источником неопределенности, так и количественных признаков в описании объектов исходного множества. При выделении однородных групп сведений, относящихся к объектам выбранной предметной области, различают такие виды группировки исходных данных, как структурная и типологическая. Структурная группировка представляет собой способ выделения количественно однородных групп объектов, а типологическая — способ выделения качественно однородных групп.

Методы выделения однородных групп сведений используют следующие основные подходы:

- вероятностный подход, основанный на предположении о том, что объекты, принадлежащие одному из выделяемых классов, описываются одинаково распределенными случайными векторами, а для различных классов характерны различные распределения вероятностей;

- вариативный подход, состоящий в разбиении множества объектов по выбранному исследователем признаку на интервалы группирования, в результате чего исходное множество объектов разбивается на группы таким образом, что объекты одной группы находятся на относительно небольшом расстоянии друг от друга;

- структурный подход, базирующийся на представлении об объектах как точках в многомерном пространстве, которое получило развитие в работах Солодовникова В.В., Дубова Ю.А., Якимца В.И., Кузьмина В.Б., Макарова И.М., Виноградской Т.М., Рубчинского А.А., Бирюкова В.Ф., Тумаркина В.И. и др.

Однако при этом не рассматривался процесс получения сведений, подлежащих классификации, основанный не только на результатах работы информационно-поисковых машин, но и на формировании соответствующих информационных массивов, используемых в дальнейшем для решения задач классификации сведений. Процессы построения информационных массивов при решении широкого класса задач рассматривались в работах Кузнецова Н.А., Кульбы В.В., Норенкова И.П., Ковалевского С.С, Косяченко С.А., Цвиркуна А.Д., Павлова В.Б. и др., однако они не использовались для решения задачи классификации сведений в условиях неопределенности, методам и подходам раскрытия которых посвящены работы российских и зарубежных ученых Поспелова Д.А., Аверкина А.Н., Батыршина И.З., Блишуна А.Ф., Кузьмина В.Б., Борисова А.Н., Алексеева.А.В., а также Заде Л.А., Кофмана А. и др.

Таким образом, решение задачи классификации сведений, основанной на использовании сформированных специальным образом информационных массивов и выборе соответствующих методов их обработки в условиях неопределенности, является актуальным.

Цель работы: повысить эффективность процесса классификации сведений в условиях неопределенности путем формирования информационных массивов заданной сложности. Задачи исследования:

• ввести в рассмотрение целевое пространство информационных массивов (ЦПИМ) для последующего построения процедур его декомпозиции;

• ввести в рассмотрение критерий сложности построения информационных массивов (ИМ);

• провести классификацию неопределенностей, имеющих место при решении задачи классификации, и обосновать выбор математического аппарата для их формализации;

• предложить и обосновать структуру информационного массива, удовлетворяющую предложенному критерию оценки сложности, учитывающую влияние факторов неопределенности при решении задачи классификации.

Объект исследования. Методы построения информационных массивов для решения задач классификации сведений.

Предмет исследования. Модели построения информационных массивов по критерию сложности для решения задачи классификации сведений в условиях неопределенности.

Методы исследования. Для решения поставленных задач в работе использованы методы системного анализа, теории нечетких множеств и математического программирования.

Научная новизна работы заключается в следующем:

- предложена формализация целевого пространства информационных массивов в виде кортежа из трех элементов, которыми являются множество информационных массивов, отвечающих общей цели, и определенные на нем отношения эквивалентности и частичной упорядоченности, что дало возможность построить процедуры декомпозиции; построены аналитические и процедурные модели декомпозиции информационных массивов, основанные на использовании предложенных типов взаимосвязи, определяемых отношениями эквивалентности, частичной упорядоченности и введенных в рассмотрение прототипах;

- предложен критерий оценки сложности информационного массива, построенный на основе использования характеристических функций, разбивающих целевое пространство информационных массивов на уровни декомпозиции;

- построена аналитическая модель выбора типа «много входов - один выход» (MISO), основанная на применении выбранных Т-норм, методов решения задачи классификации сведений из построенных информационных массивов в условиях неопределенности.

Практическая значимость полученных результатов заключается в использовании разработанного программного обеспечения, реализующего построенные процедурные модели решения задач классификации сведений, что позволяет существенно сократить время получения и поиска сведений в локальных и сетевых информационных системах.

Работа выполнена при поддержке Государственного контракта № П292 в рамках ФЦП «Научные и научно-педагогические кадры инновационной России на 2009-2013годы».

Реализация результатов работы осуществлена в ОАО «Пигмент», г.Тамбов; ООО «Совтех», г.Воронеж; Государственном образовательном учреждении высшего профессионального образования «Тамбовский государственный технический университет».

Положения, выносимые на защиту:

• формализация целевого пространства информационных массивов в виде кортежа из трех элементов, которыми являются множество информационных массивов, отвечающих общей цели, и определенные на нем отношения эквивалентности и частичной упорядоченности, позволяет построить процедуры его декомпозиции и повысить эффективность решения задачи классификации сведений;

• аналитические и процедурные модели декомпозиции целевого пространства информационных массивов, основанные на использовании предложенных типов взаимосвязи, определяемых отношениями эквивалентности, частичной упорядоченности и введенных в рассмотрение прототипах, дают возможность сформировать информационные массивы для решения задачи классификации;

• критерий оценки сложности информационного массива, построенный на основе использования характеристических функций, разбивающих целевое пространство информационных массивов на уровни декомпозиции, который позволяет осуществить построение информационного массива с заданными свойствами;

• аналитическая модель выбора типа MISO, основанная на применении Т-норм, методов решения задачи классификации сведений из построенных информационных массивов в условиях неопределенности, позволила автоматизировать процесс и сократить временные затраты.

Апробация работы. Основные результаты работы представлены и

обсуждены на Всероссийских и международных научных конференциях "Наука на рубеже тысячелетий" (международная конференция, Тамбов, 2004), "Динаміка наукових досліджень 2005" (IV міждународна науково-практична конференція, Дніпропетровськ, 2005), "Теория конфликта и ее приложения" (IV Всероссийская научно-техническая конференция, Воронеж, 2006), на семинарах кафедры "Информационные системы и защита информации" ГОУ ВПО ТГТУ и кафедры "Прикладная информатика" Тамбовского филиала Московского государственного университета культуры и искусств.

Объем и структура работы. Диссертация, общий объем которой составляет 204 страницы (основной текст - 153 страниц), состоит из введения, трех глав, заключения, списка используемых источников, включающего 249 наименований научных трудов на русском и иностранном языках, и 10 приложений. Диссертация содержит 25 рисунков и 12 таблиц.

Публикации. По теме диссертации опубликовано 8 работ, из них 5 статей, в том числе 4 статьи в изданиях, рекомендованных ВАК РФ, и 3 тезисов докладов на Всероссийских и международных научных конференциях.  


© Научная электронная библиотека «Веда», 2003-2013.
info@lib.ua-ru.net