Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Дискриминантный анализ



Предположим, что мы имеем совокупность объектов, разбитую на несколько групп (т.е. для каждого объекта мы можем сказать, к какой группе он относится). Пусть для каждого объекта имеются изменения нескольких количественных характеристик. Мы хотим найти способ, как на основании этих характеристик можно узнать группу, к которой принадлежит объект. Это позволит нам для новых объектов из той же совокупности предсказывать группы, к которой они относятся.

Например, исследуемыми объектами могут быть пациенты — здоровые или больные той или иной болезнью, а характеристиками — результаты медицинских анализов. Если мы научимся по этим характеристикам узнавать, здоров ли пациент, либо болен той или иной болезнью, это позволит значительно повысить эффективность медицинских обследований.

Для решения этой задачи применяются методы дискриминантного анализа, они позволяют строить функции измеряемых характеристик, значения которых и объясняют разбиение объектов на группы. Желательно, чтобы этих функций (дискриминирующих признаков) было немного — в этом случае результаты анализа легче содержательно истолковать. Особую роль, благодаря своей простоте, играет линейный дискриминантный анализ, в котором классифицирующие признаки выбираются как линейные функции от первичных признаков. В случае разделения нескольких нормальных (гауссовских) совокупностей линейный дискриминантный анализ имеет ясные статистические свойства.

«Дискриминантный анализ»—это общий термин, относящийся к нескольким тесно связанным статистическим процедурам. В конкретных ситуациях не обязательно использовать все эти процедуры. Их можно разделить на методы интерпретации межгрупповых различий и методы классификации наблюдений по группам. Речь идет об интерпретации, когда рассматриваются различия между классами. Другими словами, при интерпретации необходимо ответить на вопросы: возможно ли, используя данный набор характеристик (переменных), отличить один класс от другого; насколько хорошо эти характеристики позволяют провести различение и какие из них наиболее информативны. Метод, относящийся к классификации, связан с получением одной или нескольких функций, обеспечивающих возможность отнести данный объект к одной из групп. Эти функции, называемые дискриминантными, зависят от значений характеристик таким образом, что появляется возможность отнести каждый объект к одной из групп. Разумеется, дискриминантный анализ необходим и для интерпретации, и для классификации.

Характеристики, применяемые для того, чтобы отличать один класс от другого, называются дискриминантными переменными. Эти переменные должны измеряться либо по интервальной шкале, либо по шкале отношений. Таким образом, становится возможным вычисление математических ожиданий, дисперсий и правомерно использование дискриминантных переменных в математических уравнениях.

Однако существуют определенные ограничения, касающиеся статистических свойств дискриминантных переменных. Во-первых, ни одна переменная не может быть линейной комбинацией других переменных. Линейная комбинация—это сумма одной или более переменных с постоянными весами. Таким образом, нельзя пользоваться суммой переменных или их средним арифметическим совместно с самими переменными. Следующее допущение касается того, что закон распределения для каждого класса является многомерным нормальным, т.е. каждая переменная имеет нормальное распределение при фиксированных остальных переменных. Данное предположение позволяет получить точные значения вероятности принадлежности к данному классу и критерия значимости.

Упомянутые выше допущения для дискриминантного анализа фундаментальны. Если экспериментальные данные для некоторой конкретной задачи не вполне удовлетворяют этим предположениям, то статистические выводы не будут точным отражением.реальности.

Из всего сказанного, должно быть ясно, что дискриминантный анализ используется для изучения различий между несколькими группами по определенному набору дискриминантных переменных. Рассматривая классы как значения некоторой классифицирующей переменной, измеренной по шкале наименований (когда каждому классу присваивается свое обозначение), мы представляем дискриминантный анализ в качестве метода сопоставления нескольких интервальных переменных одной номинальной переменной.

В модели дискриминантного анализа должны быть:

1) два или более классов: g³2,

2) по крайней мере два объекта в каждом классе: ni³2;

3) любое число дискриминантных переменных при условии, что оно не превосходит общее число объектов за вычетом двух: 0<p< (n— 2);

4) измерение дискриминантных переменных по интервальной шкале;

5) линейная независимость дискриминантных переменных;

6) приблизительное равенство между ковариационными матрицами для каждого класса (если не используются специальные формулы);

7) многомерная нормальность закона распределения дискриминантных переменных для каждого класса.





Дата публикования: 2015-03-29; Прочитано: 453 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...