Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
№ | Обозначение | Значение |
Вероятность правила (Rule's probability) | Это значение равно отношению количества случаев, подтверждаемых правилом «Если – То», к общему количеству случаев, содержащих условие «Если» | |
Правило проявляется… (The rule exists…) | Количество объектов, для которых срабатывает правило | |
Уровень значимости (Significance Level) | Определяет степень, с которой можно полагаться на правило, на основании которого делается распознавание прогноз. Если значение меньше 0.05 – это правило не случайно для данной выборки | |
Положительные примеры (Positive Examples) | Список объектов, для которых правило осуществляет корректное распознавание | |
Отрицательные примеры (Negative Examples) | Список объектов, для которых правило осуществляет ошибочное распознавание |
Как ви:зуализировать:
Система WizWhy предоставляет возможность визуализации полученного правила. Для этого нужно щёлкнуть на правиле левой кнопкой мыши и затем с помощью правой кнопки вызвать контекстное меню, в котором выбрать диаграмму правила Rule Chart (рис. 15).
Рис. 15. Диаграмма выделенного правила № 1
Диаграмма иллюстрирует отдельные компоненты правила, даёт их графическое отображение и также отображает результат взаимодействия переменных.
4. Отчёт о трендах (Trend Report)
Отчёт о трендах представляет результаты сегментации отдельных признаков. Окно данного отчёта разделено на три области.
В области, расположенной в левом верхнем углу, мы задаём анализируемый признак (Field to be analyzed). Здесь можно не только выбирать требуемый признак, но и сортировать признаки по какому-либо критерию (в алфавитном порядке, по номеру поля, по информативности).
Другие две области предназначены для отражения отношений между значениями признака и зависимой переменной (в нашем случае это INCOMEALL). В верхней правой области окна отчёта приводятся статистические характеристики сегментов выделенного признака. В нижней области отчёта приводится графическая иллюстрация информативности каждого сегмента.
На графике (рис. 16) по горизонтальной оси располагаются, в случае качественных признаков возможные значения, а в случае количественных признаков сегменты, на которые выбранный признак автоматически разбивается системой WizWhy.
По вертикальной оси откладывается отношение количества объектов класса if-then правил к общему количеству объектов, попадающих в сегмент. Таким образом, высота столбиков на графике отражает информативность сегментов. Синяя горизонтальная линия соответствует значению начальной относительной частоты целевого значения в выборке. Если столбик выше синей горизонтальной черты, значит, в данный сегмент чаще попадают объекты класса if-then, а если ниже горизонтальной черты – класса if-then-NOT. Чем больше разница между чертой и высотой столбика, тем лучше осуществляется прогнозирование целевого значения по исследуемому признаку.
В свою очередь, ширина столбиков пропорциональна количеству объектов, относящихся к данному сегменту
В качестве меры информативности в данном случае используется предсказанная вероятность значения (отношение числа правильно распознанных объектов к общему числу объектов с целевым значением в данном интервале).
Рис. 16. Отчет о трендах
Для нашего примера: посмотрим на рисунок 16 Используя отчёт о трендах анализируем «вклад» по информативности (Prediction Power) переменной RISK в анализируемую (зависимую, целевую) переменную. Из графика видно, что для зависимой переменной большую информативность имеют акции с риском 1-3.
Дата публикования: 2014-11-02; Прочитано: 353 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!