Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Subset variables



1) Обучающая выборка - используется для обучения сети (т.е., чтобы оценить веса сети и другие параметры). Каждая подача обучающей выборки в сеть, исп-ся для корректировки весов и порогов, наз. Эпохой. Для этого считается ошибка сети.

2)Контрольная выборка. Наблюдения в контрольной выборке будут использованы для проведения "независимой проверки" качества сети во время обучения,

Общая ошибка также вычисляется для контрольной выборки (иногда ее называют проверочной выборкой).

Если ошибка на контрольных данных перестает уменьшаться или начинает расти, обучение останавливается.

Эти данные не принимают участия в корректировке порогов и весов, но во время обучения

качество сети постоянно проверяется на этой выборке

Использование контрольных данных важно, так как при неограниченном обучении нейронная сеть начинает "зазубривать" обучающие данные.

Использование контрольной выборки для остановки обучения в момент наилучшей обобщающей способности является важным моментом при обучении НС

· Как правило, ошибка на контрольном множестве превышает ошибку на обучающем множестве, так как:

· алгоритм обучения нацелен на минимизацию ошибки на выходе сети

Если наблюдается рост ошибки на контрольном множестве и её уменьшение на обучающем множестве:

· сеть "зазубрила" предъявленные ей наблюдения

· не способна к обобщению

· такое состояние называется переобучением - переобучения надо избегать.

Алгоритм Intelligent Problem Solver:

· самостоятельно отслеживает переобучение

· при завершении обучения возвращает сеть в наилучшее состояние (Retain Best Network - Восстановить наилучшую сеть).

Тестовая выборка.

Может использоваться для сравнения альтернативных моделей.

· не участвует в обучении вообще

· после завершения обучения используется для:

ü расчета производительности полученной сети

ü её ошибки на данных, о которых "ей вообще ничего неизвестно".

Хорошая сеть:

· ошибка одинаково мала на всех трех подмножествах.

Игнорировать. Наблюдения в выборке Игнорировать будут проигнорированы во время обучения или при окончательной оценке сети,

Выходим из вкладки Variables – возвратились к Стартовой панели:

Нажмем кнопку OK.

Раздел Select analysis - Выбор анализа – (Инструмента решения):

доступны 2 опции:

· Intelligent Problem Solver (Мастер решения) – на 1-м этапе будем пользоваться им, устанавливается по умолчанию

· Custom Network Designer – Конструктор решения – для продвинутых пользователей

Мастер решений - это сложный инструмент, помогающий создавать и тестировать сети для задач анализа данных и прогнозирования.

Конструирует множество сетей для решения задачи

Копирует их в текущий Набор сетей

Затем передает эти сети в окно Результаты, позволяя проверить их качество различными способами.

Выбрать Intelligent Problem Solver (Мастер решения).

Появляется окно настройки процедуры Intelligent Problem Solver - Мастер решений SNN.

Окно содержит большое количество опций, распределенных в различных вкладках.

Основные опции:

Quik (быстрый) – задаётся количество обучаемых сетей – Network Tested

Retain (сохранить) – войдя в эту вкладку, можно ввести кол-во сохраняемых моделей сетей

Types (Типы сетей) – в этой вкладке можно выбрать типы тестируемых сетей

- Linear – линейная сеть (в выходном слое содержит только линейные эл-ты)

- GRNN – Обобщённо-регрессионная сеть

- PNN - вероятностная нейронная сеть

- Radial basis function – радиальная базисная сеть

- Three layer perceptron – 3-х слойный персептрон

- Four layer perceptron – 4-х слойный персептрон

Complexity (сложность) – можно задать кол-во нейронов на скрытом слое

· нам понадобится вкладка Quick - Быстрый и её раздел Optimization Time - Время оптимизации (содержит группу опций, отвечающих за время исполнения алгоритма поиска нейронной сети)

· 2 возможности:

1)задать количество сетей, которые необходимо протестировать (подходят ли они для решения задачи);

2)вручную задать время выполнения алгоритма. Для этого необходимо воспользоваться опцией Hours/Minutes - Часы/Минуты.

Воспользуемся 1-й опцией.

1)В разделе Optimization Time - Время оптимизации:

в опции Networks tested - Количество тестируемых сетей укажем 200.

2)В разделе Networks Retained (Количество сохранённых сетей) укажем 10.

Запускаем Мастер в работу (ОК).

Состояние алгоритма поиска отображается в диалоговом окне IPS Training In Progress - Процесс поиска сети, см. Рис.6.

Рис.6. Процесс поиска сети.

· информация о времени исполнения алгоритма

· о рассмотренных нейронных сетях

Цель алгоритма поиска:

· перебор ряда нейросетевых конфигураций

· выбор наилучшей с точки зрения:

ü минимума ошибки на выходе сети и

ü максимума её производительности

Сети необходимо:

· Обучать

· рассчитывать их ошибки и производительности

· эти показатели сравнивать

Получили результат – панель Results:

Структура Таблицы Results:

Каждая строка соответствует определённой конфигурации сети

Каждая нейронная конфигурация описывается строкой в информационном поле диалогового окна.

Столбцы:

· Index – номер отобранной сети.

· Profile - Тип сети

· Train (Select, Test) Performance - Производительность сети на обучающем (контрольном, тестовом) множестве

· Train (Select, Test) Error - Ошибка обучения (контроля, тестирования)

· Training/members

· Inputs – число входов

· Hidden(1) – число нейронов на 1-м скрытом слое

· Hidden(2)- число нейронов на 2-м скрытом слое

Раздел Profile - Тип сети описывает:

· топология нейронной сети = её класс (персептрон (MLP), сеть RBF и т.д.)

· количество входных и выходных переменных

· количество скрытых слоев

· число элементов на каждом скрытом слое

Формат строки:

<тип> <входы>: <слой1>-<слой2>-<слой3>: <выходы>

Например, архитектура MLP 4:4-7-3:1 обозначает:

многослойный персептрон с 4-мя входными и 1-й выходной переменными, и 3-мя слоями по 4, 7 и 3 элементов соответственно.

Производительность обуч./Контр. производительность /Тест. производительность.

Значение производительности зависит от типа сети.

Для сети классификации, это доля правильно классифицированных наблюдений в выборке.

Для регрессионной сети - это отношение стандартных отклонений ошибки прогноза и наблюдаемых значений

Эти столбцы дают производительность сети на обучающей, контрольной и тестовой выборках соответственно.

Не следует слишком доверять уровню производительности, который приводится для обучающей выборки, так как он зачастую обманчиво высок (что говорит о переобучении).

Контрольная производительность - это ключ к оценке сетей, показанных в окне итоги моделей.

(Контрольная производительность 1.0 означает, что все контрольные наблюдения классифицированы правильно.)

Ошибка обучения/Контрольная ошибка/Тестовая ошибка.

Алгоритмы обучения оптимизируют функцию ошибки.

Значение ошибки интерпретируется менее точно, чем значение производительности, но более значимо для алгоритмов обучения.

Training/members:

BP100, CG20, CG0b - значит "сто эпох обратного распространения, затем двадцать эпох метода сопряженных градиентов, после которых алгоритм был остановлен из-за переобучения и была восстановлена лучшая за время обучения сеть.

Основные вкладки окна результатов:

1)Models Summary – Результаты моделей

2)Predictions – Таблица предсказаний

3)Residuals – Таблица остатков

4)Sensitivity analysis –Таблица чувствительности

5)Descriptive statistics – (Описательные статистики) - Таблица классификации и Матрица ошибок

2)Вкладка Predictions (предсказание):

- Строки – какие классы должны получиться

- Столбцы – какие классы предсказала сеть в разных моделях





Дата публикования: 2015-10-09; Прочитано: 1034 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.014 с)...