Электронная библиотека Веда
Цели библиотеки
Скачать бесплатно
Доставка литературы
Доставка диссертаций
Размещение литературы
Контактные данные
Я ищу:
Библиотечный каталог российских и украинских диссертаций

Вы находитесь:
Диссертационные работы России
Технические науки
Управление в социальных и экономических системах

Диссертационная работа:

Селезнев Константин Егорович. Модели управления процессом продаж на рынке недвижимости с помощью нечетких запросов к массивам текстовой информации : Дис. ... канд. техн. наук : 05.13.10 : Воронеж, 2004 170 c. РГБ ОД, 61:05-5/489

смотреть содержание
смотреть введение
Содержание к работе:

ВВЕДЕНИЕ 4

ГЛАВА 1. АНАЛИЗ ОСНОВНЫХ ЗАДАЧ И ПРИНЦИПОВ РАБОТЫ СППР
РИЭЛТОРСКОГО ПРЕДПРИЯТИЯ 12

  1. Предпосылки возникновения и актуальность задачи автоматизации риэлторской деятельности 12

  2. Анализ потребностей в автоматизированной обработке информации для риэлторской фирмы 15

  1. Основные понятия и свойства рынка объектов недвижимости 15

  2. Методы оценивания объектов недвижимости 20

1.3 Обзор информационных систем предприятий 26

  1. Основные типы систем 26

  2. Основные принципы работы СППР риэлторского предприятия 31

1.4 Методы анализа текстовой информации 38

1.4.1 Обработка русскоязычных неформализованных текстов 41

1.4.2Выделение слови предложений 45

  1. Анализ отдельных слов русского языка 46

  2. Синтаксический анализ 47

  3. Практические задачи обработки текстов 52

1.5 Цели и задачи исследования 55

ГЛАВА 2. РАЗРАБОТКА МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
ФУНКЦИОНИРОВАНИЯ СППР РИЭЛТОРСКОГО ПРЕДПРИЯТИЯ 58

  1. Модель представления результатов анализа отдельных элементов текста 58

  2. Математическая модель синтаксической структуры предложения 63

  3. Представления данных в виде семантической сети 68

  4. Синтез фрагментов семантической сети 74

  5. Математическая модель извлечения данных 80

  6. Математическая модель запросов с нечёткими условиями 87

  7. Оценивание объектов недвижимости на основе метода сравнения продаж 96

* 2.8 Основные выводы главы 101

ГЛАВА 3. АЛГОРИТМЫ ФУНКЦИОНИРОВАНИЯ СППР
РИЭЛТОРСКОГО ПРЕДПРИЯТРЇЯ 105

3.1 Алгоритмическая модель извлечения информации 105

  1. Алгоритм построения лексического графа и анализа отдельных слов 105

  2. Алгоритм поиска отдельных предложений 107

  3. Алгоритм извлечения информации 108

  4. Построение семантической сети данных 109

3.2 Алгоритмы анализа информации 111

\« 3.2.1. Простейший алгоритм выполнения запросов и его критика 111

  1. Алгоритм выполнения запросов при использовании реляционной СУБД 113

  2. Вычисление значения метрики при сравнении запросов 118

3.3 Выводы главы 121

ГЛАВА 4. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ СППР РИЭЛТОРСКОГО
ПРЕДПРИЯТИЯ 123

  1. Обобщённая архитектура полученной СППР 123

  2. Практическая реализация и наполнение словарей 130

4.2.1. Описание предметной области СППР в терминах семантической сети
130

4.2.2. Пример содержимого базы данных 131

  1. Примеры словарей нечётких значений 132

  2. Пример выполнения запроса 134

  3. Пример оценивания объекта недвижимости 137

  4. Пример сравнения трёх запросов 139

  1. Экономический эффект и возможности развития 143

  2. Основные выводы главы 146

ОСНОВНЫЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ РАБОТЫ 149

СПИСОК ЛИТЕРАТУРЫ 150

ПРИЛОЖЕНИЕ №1 158

\#

#

ПРИЛОЖЕНИЕ №2 164

ПРИЛОЖЕНИЕ №3 168

ПРИЛОЖЕНИЕ №4 169

ПРИЛОЖЕНИЕ №5 170

Введение к работе:

Актуальность темы. Бурное развитие рынка недвижимости повлекло за собой резкое увеличение количества компаний, предоставляющих риэлторские услуги, что привело к обострению конкурентной борьбы и повышению требований по уровню, скорости, удобству и качеству обслуживания клиентов. Взаимодействие с каждым конкретным клиентом состоит из двух этапов: во-первых, поиск актуального предложения рынка недвижимости, его рассмотрение и совместное обсуждение, и, во-вторых, оформление всех юридических документов в случае осуществления сделки. Эффективность работы всего предприятия зависит от качества выполнения первого этапа, успешное проведение которого требует многократной обработки всего массива актуальных предложений рынка, а при оценивании объектов недвижимости - ещё и анализа текущего состояния рынка, сложившейся сегментированности рынка и установившихся цен в каждом сегменте.

Существенное увеличение скорости и качества выполнения всех перечисленных действий требует разработки и внедрения системы поддержки принятия решений (СППР), предоставляющей возможности анализа информации о текущем состоянии рынка недвижимости. Важным требованием к СППР является необходимость анализировать данные, представленные в виде неформализованных текстов, поступающих из различных специализированных средств массовой информации.

Таким образом, актуальность диссертационной работы определяется необходимостью разработки іматематических и алгоритмических моделей функционирования СППР риэлторского предприятия, а также разработку программной архитектуры, пригодной для практической реализации системы.

Цель и задачи исследования. Целью диссертационной работы является разработка обобщённых математических моделей и принципов

функционирования СППР сотрудников риэлторского предприятия, являющейся одним из звеньев в процессе принятия маркетинговых решений фирмы.

Для достижения указанной цели в работе решались следующие основные задачи:

анализ методов обработки неформализованных текстов, оценивания объектов недвижимости и сегментирования рынка недвижимости;

разработка модели автоматизированного извлечения структурированной информации об актуальных предложениях рынка недвижимости из неформализованных текстовых документов;

разработка модели поиска предложений на рынке недвижимости, удовлетворяющих заданным нечётким условиям;

разработка математической модели оценивания . объектов недвижимости на основе метода продаж и содержимого базы данных СППР;

разработка математической модели задания и автоматизированного сегментирования рынка недвижимости.

Методы исследования. Выполненные исследования базируются на использовании методов математического моделирования, теории принятия решений, теории графов, методов оптимизации, вычислительной лингвистики, теории синтаксического анализа, нечёткой логики, теории реляционных баз данных, численных методов и программирования. Общей методологической основой является системный подход.

Научная новизна заключается в следующих результатах:

- разработана модель автоматизированного анализа текстовых
документов, позволяющая извлекать структурированную
информацию об актуальных предложениях рынка недвижимости из
неформализованных текстов, применимая в других предметных
областях;

разработана модель задания и выполнения запросов, позволяющих указывать нечёткие условия поиска информации;

задача поиска предложений рынка недвижимости сформулирована как задача оптимизации;

разработана модель оценивания объектов недвижимости на основе метода сравнения продаж и содержимого базы данных СППР, позволяющая учитывать сегментацию рынка;

разработана математическая модель задания и автоматизированной сегментации рынка недвижимости, основанная на кластеризации журнала запросов и позволяющая формулировать описания сегментов в общеупотребительных терминах.

Достоверность научных результатов. Научные положения, теоретические выводы и практические рекомендации обоснованы корректным использованием математического аппарата, подтверждены вычислительными экспериментами на ЭВМ и оценкой работы созданного экспериментального программного обеспечения.

Практическая ценность. Практическая ценность работы непосредственно следует из поставленных задач исследования работы и заключается в следующих результатах:

разработано экспериментальное программное обеспечения анализа текстовых документов и автоматизированного извлечения структурированной информации об актуальных предложениях на рынке недвижимости;

предложен способ реализации модуля выполнения запросов, содержащих нечёткие условия, к реляционной базе данных;

разработана программная архитектура и основные принципы построения СППР риэлторского предприятия.

Реализация результатов работы. Предложенная программная

' архитектура средств извлечения данных из неформализованных текстовых

русскоязычных документов принята за основу при разработке средств

наполнения информационного хранилища информационно-аналитической системы (ИАС) НЕВОД 4.0, разрабатываемой ЗАО НЛП "РЕЛЭКС". Произведено наполнение экспериментальной базы данных, позволяющей провести оценку полученных математических моделей.

Созданное экспериментальное программное обеспечение апробировано в ООО "ЮПИКС. Недвижимость", и в данный момент ведётся обсуждение дополнительных требований (стоимость разработки системы, дизайн, пользовательский интерфейс и т.п.) к Сі 11 IF риэлторского предприятия.

Полученные результаты диссертации используются в учебном процессе факультета прикладной математики, информатики и механики Воронежского госуниверситета при чтении следующих курсов: "Управление рисками", "Принятие решений" и "Методы представления знаний".

На защиту выносятся:

модель автоматизированного извлечения структурированной информации об актуальных предложениях рынка недвижимости из неформализованных тестовых документов, применимая в других предметных областях;

модель задания и выполнения запросов с нечёткими условиями;

формализация задачи поиска наиболее интересных для клиента предложений рынка недвижимости;

модель оценивания объектов недвижимости на основе метода сравнения продаж и содержимого базы данных 011 IP;

модель задания и автоматизированной сегментации рынка недвижимости, основанная на кластеризации журнала запросов.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих конференциях и совещаниях:

  1. "Проблемы компьютерной лингвистики", г.Воронеж, май 17-18,2002

  2. 10-ая Международная конференция "Математика. Компьютер. Образование", г. Пущино, январь 2003

  1. 3-я региональная конференция "Информатика: проблемы, методологии, технологии ", г. Воронеж, февраль 12-13,2003

  2. 4-я региональная конференция "Информатика: проблемы, методологии, технологии ", г. Воронеж, февраль 3-4, 2004

  3. Международная конференция "Образование, наука, производство и управление в XXI веке", г. Старый Оскол, октябрь 20-22, 2004

Публикации. Основные результаты диссертации опубликованы в 13
печатных работах, из них 10 работ выполнено самостоятельно. Личный вклад
автора в работах, опубликованных в соавторстве, состоит в следующем: в
< [36] автором предложен подход к визуализации семантических сетей данных;

в [46] автором разработана программная архитектура комплекса, а также подсистемы анализа текстов и подсистемы выполнения запросов; в [4] автор обосновал возможность использования технологий автоматизированного анализа текстов для обработки резюме сотрудников.

Структура и объём работы. Материал диссертации изложен на 170 страницах машинописного текста. Диссертация состоит из введения, четырех глав, выводов, списка литературы и приложений, содержит 21 рисунок, и 13 таблиц. Библиография включает 87 наименований.

Содержание работы

Во введении обосновывается актуальность темы, формулируются цели и задачи исследования, научная новизна и практическая значимость работы.

Во первой главе рассмотрено взаимодействие риэлторской фирмы с
клиентом, обоснована необходимость разработки СППР, предоставляющей
возможности выработки и оценки решений на основе неформализованной
текстовой информации. Указаны экономические подходы и базовые
принципы функционирования рынка недвижимости, которые положены в
основу функционирования СППР. Отдельное внимание уделено анализу
основных методов оценивания объектов недвижимости, при этом, приведены
t. достоинства и недостатки каждого метода.

Дана существующая классификация средств автоматизации деятельности предприятий, и показано соотношение рассматриваемой СППР с существующими видами средств анализа данных. Сформулированы основные требования, предъявляемые к функциональности СППР: загрузка информации из текстовых документов, выполнение запросов с нечёткими условиями, задание сегментации и проведение автосегментирования рынка, примерное оценивание объектов недвижимости и т.д. Рассмотрена классификация текстовых документов с точки зрения их автоматизированной обработки, и дана характеристика текстов, поступающих и специализированных средств массовой информации и содержащих данные о предложениях на рынке недвижимости. Подробно рассмотрены результаты анализа обобщённой схемы обработки текстов на русском языке, послужившей основой для создания уже существующих программных средств анализа неформализованных текстовых документов, а также дан краткий обзор практических задач обработки русскоязычных текстов.

В заключении главы сформулированы цели и задачи исследования.

Во второй главе рассмотрена математическая модель процесса автоматизированного извлечения информации из русскоязычных текстовых документов. В соответствии с обобщённой схемой обработки неформализованных русскоязычных текстов, процесс извлечения информации разделён на этап выделения в исходном тексте слов и предложений, морфологический анализ отдельных слов и синтаксический анализ. Показано, что в зависимости от типа исходных текстовых документов, этапы морфологического и синтаксического анализа могут быть существенно упрощены.

Заключительными этапами обработки текста является синтез отдельных фрагментов семантической сети данных, производимый на основе правил формализации и результатов синтаксического анализа, а также построение единой семантической сети путём объединения отдельных

фрагментов. Информация о каждом предложении на рынке недвижимости представляется в виде части семантической сети данных.

В главе предложена математическая модель выполнения запросов к семантической сети данных. В каждом запросе указывается структура искомых фрагментов семантической сети и условия, налагаемые на информационное наполнение искомых фрагментов. При задании условий могут использоваться логические предикаты и операции сравнения информационного наполнения с указанными нечёткими значениями. Результатом выполнения любого запроса является нечёткое множество фрагментов семантической сети данных, каждый из которых содержит информацию о предложении на рынке недвижимости и характеризуется, во-первых, степенью соответствия условиям запроса, во-вторых, собственными параметрами объекта недвижимости, такими как цена, месторасположение и т.д.

Приведены основные операции по» работе с полученной выборкой объектов недвижимости: поиск оптимального объекта' недвижимости, ранжирование выборки, перестроение условий запроса и т.д.

Показано, что сегментация рынка заключается в формировании набора запросов с помощью эксперта, или на основе журнализации всех выполняемых запросов, на множестве которых может быть задана метрика, проведена кластеризация и, таким образом, выявлены наиболее обособленные запросы. Рассмотрены три способа оценивания объектов недвижимости: формирование точной цены на основе наиболее похожего объекта, формирование средневзвешанной цены на основе цены нескольких объектов и, наконец, построение неточного значения цены.

Во третьей главе рассмотрены подходы к реализации алгоритмов, действующих на основе описанных в предыдущей главе моделей. Приведено детализированное описание алгоритмов построения лексического графа исходного текста, синтеза фрагментов семантической сети данных и

построения результата извлечения информации путём объединения отдельных фрагментов семантической сети данных.

Выполнение формализованных запросов к семантической сети данных заключается в поиске всех фрагментов указанной структуры и вычислении значения характеристической функции для каждого из них. Показано, что предложенный алгоритм обладает существенными недостатками (скорость работы, невозможность получения части выборки и сложность реализации), не позволяющими его использовать при построении* СППР риэлторского предприятия. Рассмотрены основные принципы работы и обобщённый алгоритм выполнения запросов, не имеющий указанных недостатков и позволяющий использовать реляционную СУБД для хранения содержимого * базы данных СППР.

Отдельный пункт главы»посвящен сравнению запросов и вычислению метрики, заданной на множестве всех возможных запросов. Показано, что вычисление значений метрики сводится к задаче численного интегрирования.

Во четвёртой главе дано описание программной архитектуры СППР риэлторского предприятия, а также указаны основные сценарии работы, пользователей с СППР. Детально рассмотрены примеры работы предложенных математических моделей поиска информации, оценивания объектов недвижимости и автоматизированного сегментирования рынка.

В главе указаны возможности продолжения работы в области как анализа текстовых документов, так и развития моделей выработки и принятия решений.

В заключении рассмотрены основные результаты работы.

В приложениях дано развёрнутое описание возможностей интегрирования модуля синтаксического анализа в подсистему извлечения данных, а также рассмотрены возможности расшиения предложенной модели оценивания объектов, учитывающего динамику изменения рынка недвижимости.

Подобные работы
Зеленин Александр Юрьевич
Управление инвестиционным процессом развития региональной системы телерадиовещания на основе моделей и алгоритмов принятия решений
Монахов Михаил Юрьевич
Методы и модели обработки и представления информации в распределенных образовательных системах
Егоров Алексей Геннадьевич
Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса
Микрин Вадим Евгеньевич
Модели и методы репланирования сельскохозяйственного производства в условиях чрезвычайных ситуаций с использованием аэрокосмической информации
Колпачев Виктор Николаевич
Оптимизационные модели в управлении строительными проектами
Лысаков Алексей Викторович
Модели договорных отношений в управлении проектами
Баранчиков Вячеслав Викторович
Модели согласованного планирования в управлении проектами
Алимбекова Софья Робертовна
Автоматизированное управление проектами на основе процессной модели : На примере приборостроительного предприятия
Хвастунов Дмитрий Анатольевич
Модели оптимального распределения объемов работ в управлении строительными проектами
Баркалов Павел Сергеевич
Модели и методы распределения ресурсов при управлении проектами с учетом времени их перемещения

© Научная электронная библиотека «Веда», 2003-2013.
info@lib.ua-ru.net