Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Задача выравнивания статистических рядов



Статистическая проверка гипотезы о законе распределения случайной величины

1. Статистическая гипотеза. Основные понятия.

2. Задача выравнивания статистических рядов.

3. Критерии согласия проверки гипотезы о законе распределения случайной величины.

4. Методика выравнивания статистического распределения.

5. Пример проверки гипотезы о статистическом распределении случайной величины по нормальному закону.

Литература.

1. Солонин И. С. Математическая статистика в технологии машиностроения / И. С. Солонин. - М.: Машиностроение, 1972. - 216 с. (с. 57-78)

Статистическая гипотеза. Основные понятия

Статистическая проверка гипотез, т. е. предположений, относящихся к эмпирическим распределениям изучаемых случайных величин, играет важную роль в исследованиях процессов механической обработки деталей.

Если эмпирическая кривая распределения большой выборки по своему внешнему виду приближается к какому-либо теоретическому закону распределения, то возникает вопрос, можно ли данную выборку рассматривать как выборку из генеральной совокупности, имеющей распределение именно по этому закону. Решение этого вопроса имеет большое значение для исследователя, так как знание закона распределения изучаемой величины позволяет извлечь из экспериментов дополнительную информацию. Если производится две серии испытаний с фактором A и без него и в результате получаются разные значения средних и дисперсий изучаемой переменной величины, то возникает вопрос, является ли это различие в средних и дисперсиях влиянием фактора A или оно носит чисто случайный характер. В математической статистике подобные задачи относятся к задачам проверки статистических гипотез.

Статистическая гипотеза – это содержательное высказывание о свойствах генеральной совокупности, исходя из свойств выборки x 1, x 2,, xn из этой генеральной совокупности. Статистические гипотезы делятся на:

· параметрические – гипотезы, сформулированные относительно параметров распределения известного вида (среднего арифметического значения, дисперсии и т. п.);

· непараметрические - гипотезы, сформулированные относительно вида распределения, например, предположение по распределению данных выборки о нормальном законе генеральной совокупности.

В математической статистике процесс проверки гипотезы включает в себя постановку и определение достоверности основной, так называемой «нулевой гипотезы» H 0. Постановка «нулевой гипотезой» заключается в формулировке допущения об отсутствии интересующего нас различия между выборкой и ее генеральной совокупностью. Например, нас интересует, можно ли по полученному распределению в большой выборке из генеральной совокупности считать, что последняя имеет нормальное распределение. Для того чтобы прийти к вполне определенному заключению, хотя бы и вероятностного характера, мы делаем гипотетическое допущение, что распределение выборки несущественно отличается от нормального и, следовательно, на основании закона больших чисел можно считать, что и генеральная совокупность имеет нормальное распределение. Другими словами, мы выдвигаем «нулевую гипотезу» H 0: данная выборка взята из нормальной совокупности.

Наряду с нулевой гипотезой H 0 рассматривается альтернативная ей гипотеза H 1. Для выше приведенной нулевой гипотезы H 0 альтернативная ей гипотеза может быть сформулирована как H 1: данная выборка не принадлежит нормальной совокупности. Далее осуществляется проверка этих гипотез.

Проверка нуль – гипотезы производится с использованием различных статистических критериев, позволяющих с помощью их уровней значимости q сделать вывод об опровержении гипотезы H 0 и принятии альтернативной ей гипотезы H 1.

Статистическим критерием K называют случайную величину, с помощью которой принимают решение о принятии или отклонении нуль - гипотезы H 0. Различают критерии значимости и критерии согласия. Критерии значимости используются для проверки гипотез о параметрах распределения генеральной совокупности (проверки параметрических гипотез). К ним относятся критерии Стьюдента, Фишера и др.

Критерии согласия применяют для проверки гипотез о законах статистических распределений. Из этих критериев широко используются критерий λ А.Н. Колмогорова и критерий К. Пирсона.

Уровень значимости q критерия K представляет собой достаточно малое значение вероятности, отвечающее событиям, которые в данной обстановке исследования можно считать практически невозможными. Обычно принимают пяти- двух- или однопроцентный уровень значимости. В технике чаще всего принимают пятипроцентный уровень значимости. Эти уровни значимости соответствуют классификации явлений на редкие (q = 0,05), очень редкие (q = 0,01) и чрезвычайно редкие (q = 0,001). Выбирая тот или иной уровень значимости q критерия K, мы тем самым устанавливаем и область допустимых его значений, при которых выдвинутая гипотеза считается достоверной.

Статистические приемы проверки гипотез не обладают полной определенностью. Если используемый критерий попадает в область допустимых значений, то нельзя еще сделать вывод о правильности гипотезы, а можно лишь заключить, что наблюденное значение критерия не противоречит этой гипотезе, что можно признать допустимость гипотезы до тех пор, пока более обстоятельные исследования с помощью более точных критериев или при увеличенном числе наблюдений не подтвердят это или не приведут к противоположному заключению. Поэтому статистическими методами нельзя пользоваться формально, а необходимо их сочетать с анализом физической сущности изучаемого явления. Когда гипотеза, основанная на теоретическом анализе физической сущности явления, подтверждается также статистическими приемами, то достоверность ее можно считать достаточно надежной.

В статистических исследованиях процессов механической обработки деталей наиболее часто проверяют гипотезы:

· о законе распределения случайной величины (точности обработки, шероховатости поверхности, стойкости инструмента и др.);

· случайности выборки;

· равенства двух выборочных средних;

· равенства двух и более дисперсий;

· о принадлежности двух выборок одной и той же генеральной совокупности.

Последовательность проверки гипотез включает следующие операции:

1) формулируется «нулевая гипотеза»;

2) выбирается уровень значимости;

3) выбирается критерий согласия и определяется его критическое значение (по соответствующей таблице математической статистики);

4) вычисляется по результатам выборки расчетное (выборочное) значение критерия согласия;

5) принимается или отвергается нуль-гипотеза.

Задача выравнивания статистических рядов.

Основные понятия

Подавляющее число показателей, являющихся количественными характеристиками свойств различных технологических процессов, режущих инструментов, отдельных деталей и машин, относятся к случайным величинам. Наиболее полной характеристикой любой случайной величины является ее закон распределения, устанавливающий связь между возможными значениями случайной величины и соответствующими им вероятностями. Поэтому установление закона распределения исследуемой случайной величины, например, точности обработки, стойкости режущего инструмента, долговечности изделия и др., является одной из важных задач статистической обработки данных. Следует заметить, что результаты решения этой задачи предопределяют успех тех или иных мероприятий, осуществляемых по управлению точностью и стабильностью отдельных процессов изготовления изделий и управлению качеством выпускаемой продукции в целом.

Является очевидным, что в любом статистическом распределении неизбежно присутствуют в той или иной степени элементы случайности. Их наличие обусловлено ограниченным числом наблюдений, выполнением именно тех, а не других опытов, давших именно эти, а не другие результаты и т. п. Только при очень большом числе наблюдений эти элементы случайности сглаживаются, и случайное явление обнаруживает в полной мере присущую ему закономерность. Однако на практике всегда имеют дело с ограниченным объемом данных и, как следствие, необходимостью учета имеющихся в рассматриваемом статистическом распределении в большей или меньшей степени черт случайности. Поэтому при обработке статистических данных приходится решать вопрос, как подобрать для полученных статистических данных теоретическую кривую распределения, отражающую лишь существенные черты распределения исследуемой величины, а не случайности, связанные с недостаточным объемом экспериментальных данных. Такая задача называется задачей выравнивания (сглаживания) статистических рядов.

Например, изучается некоторая случайная величина X, закон распределения которой в точности не известен. Требуется определить этот закон из опыта или проверить экспериментально гипотезу о том, что величина X подчинена тому или иному закону. С этой целью над случайной величиной производится ряд независимых опытов (наблюдений). В каждом из этих опытов случайная величина X принимает определенное значение. Совокупность наблюденных значений величины X представляет первичный статистический материал, подлежащий обработке, осмыслению и научному анализу. Такую совокупность принято называть простой статистической совокупностью или простым статистическим рядом.

Обычно простая статистическая совокупность оформляется в виде таблицы с одним входом, в первом столбце которой стоит номер опыта, а во втором – наблюденное значение случайной величины. Нередко статистическая совокупность оформляется в виде таблицы, содержащей только значения случайной величины. В этом случае номер опыта предопределяется порядком расположения этих значений в таблице (табл. 5).

Задача выравнивания заключается в подборе такой теоретической кривой (закона) распределения, которая с той или иной точки зрения наилучшим образом описывает имеющееся статистическое распределение. Легко заметить по табл. 5, что оформление статистического материала в виде простой статистической совокупности сильно затрудняет решение задачи выравнивания статистического ряда, поскольку не дает какое-либо представление о характере изменения случайной величины. Особенно это проявляется при большом числе наблюдений (порядка сотни и более значений), когда простая статистическая совокупность становится неудобной, громоздкой и мало наглядной формой записи статистического материала для определения закона распределения случайной величины. Для придания статистическому материалу компактности и наглядности его подвергают дополнительной обработке - построению так называемого статистического ряда.

Статистический ряд представляет собой таблицу, содержащую определенное число интервалов, на которые разбит диапазон предварительно ранжированных в порядке возрастания наблюденных значений случайной величины. Для каждого интервала приводится количество значений случайной величины (частота), принадлежащих соответствующему интервалу. Например, для случайной величины, рассматриваемой в примере 1, ее статистический ряд имеет вид, приведенный в табл. 6.

Дополнительно в таблице могут быть приведены значения относительной частоты, называемой частостью. Она вычисляется как отношение частоты значений случайной величины, принадлежащих соответствующему интервалу к общему количеству наблюденных значений случайной величины, т. е. является статистической вероятностью возникновения значения случайной величины в данном интервале диапазона наблюденных значений. Является очевидным, что сумма частостей всех интервалов должна быть равна единице. Статистический ряд позволяет представить опытные данные графически в виде гистограммы или полигона (рис. 1), визуальный анализ которых помогает в определенной степени установить закон распределения исследуемой случайной величины.

Для определения закона распределения случайной величины существуют два подхода. Первый подход основан на подборе, исходя из внешнего вида статистического распределения, наиболее подходящей функции для его аналитического описания. В принципе выравнивание статистического ряда можно осуществить с помощью любой аналитической функции, обладающей основными свойствами плотности распределения φ(x):

(1)

Такой подход выбора закона распределения обладает существенным недостатком, а именно, выбранная функция в качестве закона статистического распределения не отражает физическую сущность исследуемого объекта.

Определение закона статистического распределения при втором подходе осуществляется путем выбора теоретической кривой из существующих в теории вероятностей и математической статистике теоретических распределений. Основанием такого подхода служит то, что разработанные в теории вероятностей и математической статистике теоретические законы распределения имеют своим источником реальные процессы и получены логическим путем с использованием физических характеристик этих процессов. Это позволяет выполнить выбор вида теоретической кривой не по внешним формальным признакам, а по близости (общности) физической сущности рассматриваемого случайного процесса и выбираемого теоретического закона распределения[1]. В данном случае обеспечивается выбор теоретического закона, аналитическое выражение которого содержит параметры, характеризующие физическую сущность исследуемого случайного процесса или явления. При этом задача выравнивания статистического ряда переходит в задачу рационального выбора таких значений параметров закона распределения, при которых соответствие между статистическим и теоретическим распределением оказывается наилучшим.

Так, исследуемая в примере 1 случайная величина X есть погрешность размера деталей, обработанных на станке, настроенном на заданный размер детали. Эта погрешность обработки обусловлена действием множества случайных независимых факторов (вариации твердости материала заготовок детали, колебанием размера заготовок и т. д.). Из анализа результатов, представленных в виде статистического ряда (табл. 6) и теоретических соображений можно считать, что распределение величины X подчиняется нормальному закону:

. (2)

Таким образом, задача выравнивания статистического ряда переходит в задачу о рациональном выборе параметров M (x) и σ в выражении (2). Обычно принимают, что параметры выбранного теоретического закона распределения равны соответствующим статистическим параметрам. В частности, для приведенного закона (2) принимают, что

. (3)

Построив с использованием условий (3) теоретическую кривую распределения и сопоставив ее со статическим распределением, представленным, например, в виде гистограммы, можно визуально оценить близость теоретического и статического распределения (рис. 2). Вместе с тем, как бы хорошо ни была подобрана теоретическая кривая, между ней и статистическим распределением неизбежны некоторые расхождения. Поэтому возникает вопрос, обусловлены ли эти расхождения только случайными воздействиями и связаны с ограниченным числом наблюдений, или они являются существенными и вызваны тем, что подобранная теоретическая кривая плохо выравнивает исследуемое статистическое распределение. Для ответа на этот вопрос осуществляют проверку гипотезы о законе распределения с помощью критериев согласия.





Дата публикования: 2015-01-09; Прочитано: 934 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...