Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Выбор методов и разработка основных алгоритмов решения задачи



Дискриминантный анализ – это совокупность методов, позволяющих решать задачи идентификации объектов по заданному набору характерных признаков.

Весь процесс проведения дискриминантного анализа разбивается на два этапа и каждый из них можно рассматривать как совершенно самостоятельный метод.

Первый этап – выявление и формальное описание различий между существующими множествами (группами) наблюдаемых объектов.

Второй этап – непосредственная классификация новых объектов, т.е. отнесение каждого объекта к одному из существующих множеств.

Пусть имеется множество единиц наблюдения, каждая из которых характеризуется несколькими признаками (переменными): – значения j-й переменной у i-гообъекта ; .

Предположим, что все множество объектов разбито на несколько подмножеств (два и более). Из каждого подмножества взята выборка объемом , где – номер подмножества (класса) .

Признаки, которые используются для того, чтобы отличать одно подмножество от другого, называются дискриминантными переменными.

Число дискриминантных переменных не ограничено, но на практике выбор должен осуществляться на основании логического анализа исходной информации. Число объектов наблюдения должно превышать число дискриминантных переменных, т.е. . Предполагается, что дискриминантные переменные – линейно независимые нормально распределенные многомерные величины.

Рассмотрим случай для двух дискриминантных переменных. Функция называется канонической дискриминантной функцией, а величины и – дискриминантными переменными

. (1.1)

Дискриминантная функция может быть как линейной, так и нелинейной. Выбор вида этой функции зависит от геометрического расположения разделяемых классов в пространстве дискриминантных переменных.

Коэффициенты дискриминантной функции () определяются таким образом, чтобы и как можно больше отличались между собой.

Вектор коэффициентов дискриминантной функции () определяется по формуле

. (1.2)

Полученные значения коэффициентов подставляют в формулу (1.1) и для каждого объекта в обоих множествах вычисляют дискриминантные функции , затем находят среднее значение для каждой группы (). Таким образом, каждому -му наблюдению, которое первоначально описывалось -переменными, будет соответствовать одно значение дискриминантной функции, и размерность признакового пространства снижается.

Классификация при наличии двух обучающих выборок. Перед тем как приступить непосредственно к процедуре классификации, нужно определить границу, разделяющую два множества. Такой величиной может быть значение функции, равноудаленное от и , т.е.

. (1.3)

Величина с называется константой дискриминации.

Объекты, расположенные над разделяющей поверхностью находятся ближе к центру множества ,следовательно, могут быть отнесены к первой группе, а объекты, расположенные ниже этой поверхности, ближе к центру второго множества, т.е. относятся ко второй группе. Если граница между группами будет выбрана как сказано выше, то вэтом случае суммарная вероятность ошибочной классификации будет минимальной.

Классификация при наличии -обучающих выборок. Рассмотрим особенности классификации объектов, возникающие при наличии -обучающих выборок ( > 2). Как и в случае с двумя обучающими выборками, предполагается, что каждое множество является нормально распределенным с различными векторами средних значений. Оценка совместной ковариационной матрицы рассчитывается по следующей формуле:

, (1.4)

где количество обучающих выборок; – матрица ковариации для i-й выборки; – численность i-й выборки.

В этом случае каждому множеству ставится в соответствие своя дискриминантная функция вида

.

Вектор коэффициентов этой функции () рассчитывается по формуле , а свободный член .

Новый классифицируемый объект с переменными будет отнесен к тому множеству , для которого величина будет максимальной.

Диаграмма состояний варианта использования «Проведение анализа определения более рентабельного курса» представлена на рисунке 6.

Рисунок 6 – Диаграмма состояний процесса анализа данных





Дата публикования: 2015-11-01; Прочитано: 370 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...