Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Полигоны частот. Выборочная функция распределения и гистограммы



Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки которой соединяют точки с координатами (x 1, n 1), (x 2, n 2),…, (xk, nk), где xi откладываются на оси абсцисс, а ni – на оси ординат. Если на оси ординат откладывать не абсолютные (ni), а относительные (wi) частоты, то получим полигон относительных частот (рис.1). Рис. 1.

По аналогии с функцией распределения случайной величины можно задать некоторую функцию, относительную частоту события X < x.

Определение. Выборочной (эмпирической) функцией распределения называют функцию F* (x), определяющую для каждого значения х относительную частоту события X < x. Таким образом,

,

где пх – число вариант, меньших х, п – объем выборки.

Замечание. В отличие от эмпирической функции распределения, найденной опытным путем, функцию распределения F (x) генеральной совокупности называют теоретической функцией распределения. F (x) определяет вероятность события X < x, а F* (x) – его относительную частоту. При достаточно больших п, как следует из теоремы Бернулли, F* (x) стремится по вероятности к F (x).

Для непрерывного признака графической иллюстрацией служат гистограммы, то есть ступенчатые фигуры, состоящие из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотами отрезки длиной ni /h (гистограмма частот) или wi /h (гистограмма относительных частот). В первом случае площадь гистограммы равна объему выборки, во втором – единице (рис.2).

Одна из задач математической статистики: по имеющейся выборке оценить значения числовых характеристик исследуемой случайной величины или признака.

Определение. Выборочным средним называется среднее арифметическое значений случайной величины, принимаемых в выборке:

,

где xi – варианты, ni - частоты.

Замечание. Выборочное среднее служит для оценки математического ожидания исследуемой случайной величины. В дальнейшем будет рассмотрен вопрос, насколько точной является такая оценка.

Определение. Выборочной дисперсией называется -

,

а выборочным средним квадратическим отклонением

Так же, как в теории случайных величин, можно доказать, что справедлива следующая формула для вычисления выборочной дисперсии:

.

Другими характеристиками вариационного ряда являются:

- мода М0 – варианта, имеющая наибольшую частоту;

- медиана те - варианта, которая делит вариационный ряд на две части, равные по числу вариант. Если число вариант нечетно (n = 2 k + 1), то me = xk+ 1, а при четном n = 2 k .

Одна из задач математической статистики: по имеющейся выборке оценить значения числовых характеристик исследуемой случайной величины или признака.

Получив статистические оценки параметров распределения (выборочное среднее, выборочную дисперсию и т.д.), нужно убедиться, что они в достаточной степени служат приближением соответствующих характеристик генеральной совокупности. Требования к оценкам, которые должны при этом выполняться, служат требования несмещенности, эффективности и состоятельности.

При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, что приводит к грубым ошибкам. Поэтому в таком случае лучше пользоваться интервальными оценками, то есть указывать интервал, в который с заданной вероятностью попадает истинное значение оцениваемого параметра. Разумеется, чем меньше длина этого интервала, тем точнее оценка параметра.

Определение Статистической гипотезой называют гипотезу о виде неизвестного распределения генеральной совокупности или о параметрах известных распределений.

Определение. Нулевой (основной) называют выдвинутую гипотезу Н 0. Конкурирующей (альтернативной) называют гипотезу Н 1, которая противоречит нулевой.

Определение. Простой называют гипотезу, содержащую только одно предположение, сложной – гипотезу, состоящую из конечного или бесконечного числа простых гипотез.

В результате проверки правильности выдвинутой нулевой гипотезы (такая проверка называется статистической, так как производится с применением методов математической статистики) возможны ошибки двух видов: ошибка первого рода, состоящая в том, что будет отвергнута правильная нулевая гипотеза, и ошибка второго рода, заключающаяся в том, что будет принята неверная гипотеза.

Процесс проверки гипотезы состоит из следующих этапов:

1) выбирается статистический критерий К;

2) вычисляется его наблюдаемое значение Кнабл по имеющейся выборке;

3) поскольку закон распределения К известен, определяется (по известному уровню значимости α) критическое значение kкр, разделяющее критическую область и область принятия гипотезы (например, если р (К > kкр) = α, то справа от kкр располагается критическая область, а слева – область принятия гипотезы);

4) если вычисленное значение Кнабл попадает в область принятия гипотезы, то нулевая гипотеза принимается, если в критическую область – нулевая гипотеза отвергается.

Типовая задача 1

Приведены результаты тестирования студентов по математике (ответы на 50 вопросов программы). Требуется:

1. Построить интервальные статистические ряды распределения частот и относительных частот (частостей) наблюдаемых значений;

2. Найти размах вариации и разбить его на 9 интервалов;

3. Построить гистограмму и полигон относительных частот, кумуляту. Указать, графикам каких функции в теории вероятностей они соответствуют;

4. Найти эмпирическую функцию распределения и построить ее график;

5. Вычислить числовые характеристики ряда распределения: выборочную

среднюю, выборочные моду и медиану , выборочную дисперсию , выборочное среднее квадратичное отклонение s и выборочный коэффициент вариации . Вычислить выборочные начальные и центральные моменты до четвертого порядка включительно, а также выборочные коэффициент асимметрии и эксцесса

6. Рассчитать теоретическую нормальную кривую распределения и построить ее на эмпирическом графике;

7. Приняв в качестве нулевой гипотезы Но (генеральная совокупность, из которой извлечена выборка, имеет нормальное распределение), проверить гипотезу, пользуясь критерием согласия Пирсона ( 2) при уровне значимости

8. Найти доверительные интервалы для математического ожидания и среднего квадратичного отклонения.

Исходные выборочные данные

       
       
       
       
       
       
       
       
       
       

Решение:

1) Минимальное значение признака хmin = 18 вопросов., максимальное - хmax = 49 вопросов. Для определения границ интервалов находим шаг интервала: h = . Шаг интервала округляем

h = = .

Принимаем, что интервалы включают правую границу.

2) Для составления интервального распределения составим таблицу. В первой строке расположим в порядке возрастания интервалы, длина каждого из которых h=4. Во второй строке запишем количество значений признака в выборке, попавших в этот интервал (т.е. сумму частот вариант, попавших в соответствующий интервал). Интервальный статистический ряд таков:

(xi, xi+1) 16–20 20–24 24–28 28–32 32–36 36-40 40-44 44-48 48-52
ni                  

Объем выборки n=1 +4+6+6+8+6+ 4+2 +3=40.

Распределение относительных частот.

(xi, xi+1) 16–20 20–24 24–28 28–32 32–36 36-40 40-44 44-48 48-52
ni/n 0,025 0,1 0,15 0,15 0,2 0,15 0,1 0,05 0,075

Для построения гистограммы частот на оси абсцисс откладываем частичные интервалы; на каждом из них строим прямоугольники высотой

Дискретный ряд распределения

xi                  
ni/n 0,025 0,1 0,15 0,15 0,2 0,15 0,1 0,05 0,075

Для построения полигона частот по оси абсцисс откладываем середины интервалов, по оси ординат относительные частоты

Накопленные частоты

xi                  
ni                  
ni/n 0,025 0,125 0,275 0,425 0,625 0,775 0,875 0,925  

3) Полигон относительных частот соответствует графику плотности распределения, кумулята соответствует функции распределения





Дата публикования: 2015-10-09; Прочитано: 2794 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.01 с)...