Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Обработка пропущенных значений. Для каждой переменной набора данных можно ввести свое значение кода пропущенных данных (MD Code)



Для каждой переменной набора данных можно ввести свое значение кода пропущенных данных (MD Code). Это значение будет свидетельствовать об отсутствии данных для конкретного наблюдения или переменной (при этом в таблице исходных данных отображается пустая ячейка). Чтобы изменить этот код для конкретной переменной, нужно дважды щелкнуть на ее имени в таблице исходных данных, чтобы открыть диалоговое окно спецификаций переменной. По умолчанию код пропущенных данных в системе STATISTICA, используемый при создании новых файлов, добавлении новых переменных или импорте данных, равен -9999.

Способ использования пропущенных данных можно подобрать индивидуально для каждой процедуры анализа. Там, где это возможно, пользователю предоставлен выбор способа обработки пропущенных данных: удаление их из вычислений построчно или попарно, замена на средние значения, а также их преобразование или интерполяция.

Выберите команду Replace Missing Data - Заменить пропущенные данные в меню Data (Данные) – Data Filtering/Recoding (Фильтрация даныых/Перекодирование) для вызова диалога Missing Data Replacement - Замена пропущенных данных, который используется для замены пропущенных данных в выбранных переменных на средние значения этих переменных.

Нажмите кнопку Variables – Переменные для вызова диалога Select Variables - Выбор переменных, который используется для выбора переменных, в которых пропущенные данные заменяются на средние.

Вы можете использовать условия выбора наблюдений при вычислении средних для выбранных наблюдений. Для этого нажмите кнопку Cases – Наблюдения для вызова диалога Spreadsheet Case Selection Conditions - Условия выбора наблюдений в таблице данных. В этом диалоге вы можете задать новые условия выбора наблюдений или открыть существующие.

По умолчанию, каждое (выбранное) наблюдение равно среднему значению переменной. Для изменения, нажмите кнопку Weight – Вес для вызова диалога Spreadsheet Case Weights – Веса наблюдений таблицы данных, в котором вы выбираете взвешенную переменную. При выборе одной из переменных с весами, влияние каждого наблюдения изменяется в зависимости от значений весов переменных для данного наблюдения.

Для того, чтобы определить резко выделяющиеся (аномальные значения), необходимо построить коробчатую диаграмму (Graphs – Legacy Dialogs - Boxplot) и графически определить выделяющиеся значения (и их наличие вообще). Если в ходе анализа были выявлены резко выделяющиеся значения и было принято решение их удалить, то удаление осуществляется в ручную.





Дата публикования: 2014-10-19; Прочитано: 502 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.01 с)...