Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Закладка Rule Parameters (Параметры правил)



1. Выставите прогнозируемое значение (Predicted Value) зависимой (целевой) переменной (рис. 7).

После задания области значений целевой переменной или, возможно, её одного значения система WizWhy читает данные и вычисляет простые статистики, которые могут быть использованы в дальнейшем анализе. Справа от поля Predicted Value система выводит значение частоты, с которой в анализируемых данных встречается прогнозируемое значение переменной.

2. В качестве начальных параметров также задаются:

1. Минимальная доверительная вероятность (точность) (Minimum probability of …) для правила «Если…То» (if-then);

2. Минимальная доверительная вероятность (Minimum probability of …) для «Если…То Не» (if-then-Not) правил.

Эти параметры есть ни что иное, как точность правила.

В принципе, можно задавать любые значения минимальных вероятностей от 0 до 100%. Но следует хорошо представлять, что, задав слишком низкий уровень точности, мы получим большое количество правил, среди которых будет много малоинформативных компонентов. В свою очередь, выставив требование 100%, мы, скорее всего, не получим вообще ничего.

3. Минимальное число объектов (Minimum number of …), на которых подтверждается правило;

4. Максимальное число событий в правиле (Maximum number of …).

Это максимальное количество элементарных логических событий в одном правиле.

Рис. 7. Задание параметров правил

Пример (продолжение)

Выберем в качестве зависимой (целевой) переменной доходы акций за пять лет (это количественная переменная). И проанализируем, когда были получены максимальные доходы (например, нас интересует диапазон 13500 – 16500).

Переходим на вкладку Rule Parameters, выставляем следующие значения:

Predicted Value:

Больше чем – 13500

Меньше либо равно – 16500

Minimum probability of if-then и Minimum probability of if-then-Not:

Поставим в соответствующих полях окна диалога одинаковые значения указанных вероятностей 70% процентов. Это означает, что системеWizWhy формулируется требование обнаружить правила, которые будут ошибаться не более чем в 20% случаев (имеются в виду ошибки на анализируемой выборке).

Следует понимать, что, задав слишком низкий уровень точности (например 10%), мы получим большое количество правил, среди которых будет много малоинформативных компонентов. В свою очередь, выставив требование 100%, мы, скорее всего, не получим вообще ничего.

Minimum number of cases in a rule (минимальное число объектов в правиле).

Выставим здесь значение 6, обозначив тем самым наше желание обнаружить в данных правила, которые распространяются не менее чем на 6 объектов. Нижний предел составляет 4 объекта.

Maximum number of conditions in a rule (максимальное число условий в правиле).

Это максимальное количество элементарных логических событий в одном правиле. Хотя авторы ничего не говорят о предельном значении данного параметра, установлено, что оно равно 6 (таким образом, выставляем любое число не более 6).

Примечание: Если при попытке выполните вышеуказанный пункт задания программа WizWhy «вылетает»,что достаточно часто бывает при использовании категориальных переменных, то следует сменить тип зависимой переменной и установить определенные значения полей «More than» и «Less or equal than».

Закладка Стоимость ошибок (Error Costs).

Здесь задаются значения двух параметров, которые используются при последующем прогнозировании (рис. 8):

Рис. 8. Задание параметров стоимости ошибки

1. Стоимость пропуска (Cost of a miss) – отнесение к «Не»-диагностируемому классу, когда на самом деле имеет место диагностируемый класс, как правило, задается равной 1;

2. Стоимость ложной тревоги (Cost of a false alarm) – отнесение к противоположному диагностируемому классу, когда на самом деле имеет место правильное распознавание, также задается равной 1.

Значения стоимости ошибок предпочтительней задавать равными – это минимизирует число ошибок в данных при анализе.

Пример (продолжение)

Оставляем значения стоимости ошибок равными 1.





Дата публикования: 2014-11-02; Прочитано: 604 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...