Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Программы статистической обработки данных. Прогнозирование



Методы статистической обработки данных используются во многих ППП, например, Excel, QuattroPro, Lotus 1-2-3, MathCAD. Большими возможностями обладают специализированные ППП статистической обработки данных, предназначенные для специалистов со специальной подготовкой в области теории статистики. К ним относятся:

· ППП SPSS – разработчик SPSS inc.

· ППП STATISTICA используется в экономической статистике, финансах, научных исследованиях, производстве (разработчик StatSost)

MS Excel. Самой часто упоминаемой (и используемой) в отечественных статьях является приложение MS Excel из пакета офисных программ компании Microsoft? MS Office. Причины этого кроются в широком распространении этого программного обеспечения, наличии русскоязычной версии, тесной интеграцией с MS Word и PowerPoint. Однако, MS Excel - это электронная таблица с достаточно мощными математическими возможностями, где некоторые статистические функции являются просто дополнительными встроенными формулами. Расчеты сделанные при ее помощи не признаются авторитетными биомедицинскими журналами. Также в MS Excel невозможно построить качественные научные графики. Безусловно, MS Excel хорошо подходит для накопления данных, промежуточного преобразования, предварительных статистических прикидок, для построения некоторых видов диаграмм. Однако окончательный статистический анализ необходимо делать в программах, которые специально созданы для этих целей. Существует макрос-дополнение XLSTAT-Pro http://www.xlstat.com для MS Excel который, включает в себя более 50 статистических функций, включая анализ выживаемости, которых в основных случаях достаточно для обычного применения. Пробную версию макроса можно взять на сайте производителя.

STADIA. Программа отечественной разработки с 16-и летней историей. Включает в себя все необходимые статистические функции. Она прекрасно справляется со своей задачей - статистическим анализом. Но. Программа внешне фактически не изменяется с 1996 года. Графики и диаграммы, построенные при помощи STADIA, выглядят в современных презентациях архаично. Цветовая гамма программы (красный шрифт на зеленом) очень утомляет в работе. К положительным качествам программы можно отнести русскоязычный интерфейс и наличие книг описывающих работу. Например: Кулаичев А.П. Методы и средства анализа данных в среде Windows. - М: ИнКо, 2002. - 341 с. Со страницы http://www.protein.bio.msu.su/~akula/index.htm можно взять демо-версию STADIA.

STATA. Профессиональный статистический программный пакет с data-management system, который может применятся для биомедицинских целей. Один из самых популярных в образовательных и научных учреждениях США наряду с SPSS. Официальный сайт http://www.stata.com Программа хорошо документирована, издается специальный журнал для пользователей системы. Однако возможности предварительного ознакомления с демо-версией нет.

ППП STATISTICA содержит полный набор статистических методов анализа данных, в том числе нейронные сети, и высококачественную графику (сотни типов графиков).

Состоит из следующих частей (окон):

· таблицы исходных данных

· Графики

· Таблицы результатов

Лист рабочей книги файл (например, с исходными данными) - *.sta График *.stw

Данные организованы в виде электронной таблицы:

· Столбцы – это переменные Variable

· Строки – это наблюдения Cases

Характерная черта ППП – внизу панель анализа, на которой располагается значок свернутого окна доступа к различным видам анализа, возврата на предыдущие шаги и др. опции. Не следует закрывать это окно до конца анализа данных.

Нейронные сети – используются когда другие виды анализа неприменимы, т.е.:

· анализ данных со сложной нелинейной структурой зависимостей

· распознавание и классификация

· нелинейное понижение размерности

ППП SPSS

Содержит полный набор статистических методов анализа данных, кроме нейронных сетей, модульную структуру, отличается низкой стоимостью.

Предлагаются следующие процедуры:

· Общая линейная модель (GLM) содержит модели:

линейная регрессия,

одномерный дисперсионный анализ,

одномерный ковариационный анализ,

многомерный дисперсионный анализ

многомерный ковариационный анализ и др.

· Смешанная линейная модель (Mixed) содержит модели:

Однофакторный дисперсионный анализ (ANOVA) с фиксированными эффектами

рандомизированные полные блоки

случайные эффекты

случайные коэффициенты

многоуровневый анализ,

безусловная модель линейного роста,

модель линейного роста с ковариатами,

модель повторных измерений с ковариатами, зависящими от времени и др.

· Политомическая (PLUM) - универсальная логит модель (дает возможность предсказывать порядковые исходы с более чем двумя категориями. Например, можно исследовать факторы, влияющие на уровень интереса (низкий, средний, высокий) покупателей к товару.

· Оценка компонент дисперсии (VARCOMP) - ряд методов оценки компонент дисперсии для каждого случайного эффекта в смешанных моделях.

· Анализ выживаемости

· Многовходовые таблицы сопряженности (LOGLINEAR)

· Иерархические Многовходовые таблицы сопряженности (HILOGLINEAR)

· Подгонка моделей к данным (GENLOG)

· Оценка временного интервала

· Пропорциональные риски с зависящими от времени ковариатами

35. Методологии структурного анализа: IDEF0, IDEF3, DFD

BPwin - мощный инструмент моделирования, который используется для анализа, документирования и реорганизации сложных бизнес-процессов. BPwin позволяет определить точки конфликтов и достичь их согласования. (PLATINUM)

3 средства Bpwin:

· моделирование функций (IDEF0) для систематического анализа бизнеса, рассматривая регулярно решаемые задачи-функции, ресурсы, результаты

· моделирование потоков данных (DFD), передающихся между различными операциями

· моделирование потоков работ (IDEF3) - анализ операции процесса, а также точки принятия решений, влияющих на ход процесса

IDEF0

Система представляется как совокупность взаимодействующих работ или функций. Начало моделирования – это определение контекста. Его составляющие:

· субъект (что входит в систему, а что за ее пределами, при этом учитывается широта и глубина- уровень детализации, области исследования. После определения границ не рекомендуется вводить новые объекты, т.к. нарушаются связи)- команда Model / Model Properties /Definition

· цель (для чего проводится моделирование) - команда Model / Model Properties /Purpose

· точка зрения (это должна быть точка зрения одного человека, ответственного за моделирование в целом - команда Model / Model Properties /Purpose

· Виды модели:

· AS-IS "как есть" для выявления узких мест, анализа недостатков, следует избегать приукрашивания, т.е. модели SHOULD-BE ("как должно бы быть")

· To-BE "как будет" для исправления, перенаправления информационных и материальных ресурсов

Модель – взаимосвязанные, иерархически упорядоченные диаграммы. Каждая диаграмма на отдельном листе. 4 типа диаграмм:

· Контекстная – это вершина дерева, общее описание системы, может быть только одна

· Декомпозиция – это разбиение контекстной диаграммы на фрагменты

· Дерево узлов – это иерархическая зависимость работ

· Для экспозиции (FEO) – это иллюстрация фрагментов и др.

Работа – это процессы, функции или задачи, происходящие за определенное время и имеющие распознаваемые результаты. Изображаются в виде прямоугольника, внутри расположено имя работы, например, Прием заказа, Изготовление детали.

Работы располагаются по диагонали от левого верхнего угла к правому нижнему – это порядок доминирования. Самая важная работа или выполняющаяся первой - в верхнем левом углу.

Каждая работа в свою очередь может быть декомпозирована. Работы нижнего уровня – это то же самое, что и работы верхнего уровня, но рассматриваются более детально.

Работы связаны именованными стрелками.

4 типа стрелок:

· вход (input) – это материал или информация, используемые или преобразуемые работой

· управление (control) – это правила, стандарты и др.

· выход (output) – это материал или информация, производимые работой

· механизм (mechanism) – это ресурсы, выполняющие работу (персонал, станки и др.

Модель IDEF3

IDEF3 – это модель, описывающая процессы в виде логических схем, в которых основное внимание уделяется очередности выполнения функций и бизнес–процессов.

В отличие от модели IDEF0 модель IDEF3 кроме работ и связей может включать в себя такие элементы, как перекрестки и ссылки (указатели).

Перекрестки (Junction) используются для отображения логики выполнения множества работ, которые могут или должны завершиться перед началом последующей за ними работы. Различают перекрестки для слияния (Fan–in Junction) и разветвления (Fan–out Junction) стрелок.

Стрелки могут сливаться или разветвляться только через перекрестки. Во избежание несоответствий в логической схеме при установке сочетаний перекрестков на диаграмме должны выполняться следующие требования.

· Каждому перекрестку для слияния должен предшествовать перекресток для разветвления.

· Перекресток для слияния «И» не может следовать за перекрестком для разветвления типа синхронного или асинхронного «ИЛИ», или исключающего «ИЛИ».

· Перекресток для слияния типа исключающего «ИЛИ» не может следовать за перекрестком для разветвления типа «И».

· Перекресток, имеющий одну стрелку на одной стороне, должен иметь более одной стрелки на другой стороне.





Дата публикования: 2015-02-18; Прочитано: 8298 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...