Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
1. Выставите прогнозируемое значение (Predicted Value) зависимой (целевой) переменной (рис. 7).
После задания области значений целевой переменной или, возможно, её одного значения система WizWhy читает данные и вычисляет простые статистики, которые могут быть использованы в дальнейшем анализе. Справа от поля Predicted Value система выводит значение частоты, с которой в анализируемых данных встречается прогнозируемое значение переменной.
2. В качестве начальных параметров также задаются:
1. Минимальная доверительная вероятность (точность) (Minimum probability of …) для правила «Если…То» (if-then);
2. Минимальная доверительная вероятность (Minimum probability of …) для «Если…То Не» (if-then-Not) правил.
Эти параметры есть ни что иное, как точность правила.
В принципе, можно задавать любые значения минимальных вероятностей от 0 до 100%. Но следует хорошо представлять, что, задав слишком низкий уровень точности, мы получим большое количество правил, среди которых будет много малоинформативных компонентов. В свою очередь, выставив требование 100%, мы, скорее всего, не получим вообще ничего.
3. Минимальное число объектов (Minimum number of …), на которых подтверждается правило;
4. Максимальное число событий в правиле (Maximum number of …).
Это максимальное количество элементарных логических событий в одном правиле.
Рис. 7. Задание параметров правил
Пример (продолжение)
Выберем в качестве зависимой (целевой) переменной доходы акций за пять лет (это количественная переменная). И проанализируем, когда были получены максимальные доходы (например, нас интересует диапазон 13500 – 16500).
Переходим на вкладку Rule Parameters, выставляем следующие значения:
Predicted Value:
Больше чем – 13500
Меньше либо равно – 16500
Minimum probability of if-then и Minimum probability of if-then-Not:
Поставим в соответствующих полях окна диалога одинаковые значения указанных вероятностей 70% процентов. Это означает, что системеWizWhy формулируется требование обнаружить правила, которые будут ошибаться не более чем в 20% случаев (имеются в виду ошибки на анализируемой выборке).
Следует понимать, что, задав слишком низкий уровень точности (например 10%), мы получим большое количество правил, среди которых будет много малоинформативных компонентов. В свою очередь, выставив требование 100%, мы, скорее всего, не получим вообще ничего.
Minimum number of cases in a rule (минимальное число объектов в правиле).
Выставим здесь значение 6, обозначив тем самым наше желание обнаружить в данных правила, которые распространяются не менее чем на 6 объектов. Нижний предел составляет 4 объекта.
Maximum number of conditions in a rule (максимальное число условий в правиле).
Это максимальное количество элементарных логических событий в одном правиле. Хотя авторы ничего не говорят о предельном значении данного параметра, установлено, что оно равно 6 (таким образом, выставляем любое число не более 6).
Примечание: Если при попытке выполните вышеуказанный пункт задания программа WizWhy «вылетает»,что достаточно часто бывает при использовании категориальных переменных, то следует сменить тип зависимой переменной и установить определенные значения полей «More than» и «Less or equal than».
Закладка Стоимость ошибок (Error Costs).
Здесь задаются значения двух параметров, которые используются при последующем прогнозировании (рис. 8):
Рис. 8. Задание параметров стоимости ошибки
1. Стоимость пропуска (Cost of a miss) – отнесение к «Не»-диагностируемому классу, когда на самом деле имеет место диагностируемый класс, как правило, задается равной 1;
2. Стоимость ложной тревоги (Cost of a false alarm) – отнесение к противоположному диагностируемому классу, когда на самом деле имеет место правильное распознавание, также задается равной 1.
Значения стоимости ошибок предпочтительней задавать равными – это минимизирует число ошибок в данных при анализе.
Пример (продолжение)
Оставляем значения стоимости ошибок равными 1.
Дата публикования: 2014-11-02; Прочитано: 604 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!