Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки которой соединяют точки с координатами (x 1, n 1), (x 2, n 2),…, (xk, nk), где xi откладываются на оси абсцисс, а ni – на оси ординат. Если на оси ординат откладывать не абсолютные (ni), а относительные (wi) частоты, то получим полигон относительных частот (рис.1). Рис. 1.
По аналогии с функцией распределения случайной величины можно задать некоторую функцию, относительную частоту события X < x.
Определение. Выборочной (эмпирической) функцией распределения называют функцию F* (x), определяющую для каждого значения х относительную частоту события X < x. Таким образом,
,
где пх – число вариант, меньших х, п – объем выборки.
Замечание. В отличие от эмпирической функции распределения, найденной опытным путем, функцию распределения F (x) генеральной совокупности называют теоретической функцией распределения. F (x) определяет вероятность события X < x, а F* (x) – его относительную частоту. При достаточно больших п, как следует из теоремы Бернулли, F* (x) стремится по вероятности к F (x).
Для непрерывного признака графической иллюстрацией служат гистограммы, то есть ступенчатые фигуры, состоящие из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотами – отрезки длиной ni /h (гистограмма частот) или wi /h (гистограмма относительных частот). В первом случае площадь гистограммы равна объему выборки, во втором – единице (рис.2).
Одна из задач математической статистики: по имеющейся выборке оценить значения числовых характеристик исследуемой случайной величины или признака.
Определение. Выборочным средним называется среднее арифметическое значений случайной величины, принимаемых в выборке:
,
где xi – варианты, ni - частоты.
Замечание. Выборочное среднее служит для оценки математического ожидания исследуемой случайной величины. В дальнейшем будет рассмотрен вопрос, насколько точной является такая оценка.
Определение. Выборочной дисперсией называется -
,
а выборочным средним квадратическим отклонением –
Так же, как в теории случайных величин, можно доказать, что справедлива следующая формула для вычисления выборочной дисперсии:
.
Другими характеристиками вариационного ряда являются:
- мода М0 – варианта, имеющая наибольшую частоту;
- медиана те - варианта, которая делит вариационный ряд на две части, равные по числу вариант. Если число вариант нечетно (n = 2 k + 1), то me = xk+ 1, а при четном n = 2 k .
Одна из задач математической статистики: по имеющейся выборке оценить значения числовых характеристик исследуемой случайной величины или признака.
Получив статистические оценки параметров распределения (выборочное среднее, выборочную дисперсию и т.д.), нужно убедиться, что они в достаточной степени служат приближением соответствующих характеристик генеральной совокупности. Требования к оценкам, которые должны при этом выполняться, служат требования несмещенности, эффективности и состоятельности.
При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, что приводит к грубым ошибкам. Поэтому в таком случае лучше пользоваться интервальными оценками, то есть указывать интервал, в который с заданной вероятностью попадает истинное значение оцениваемого параметра. Разумеется, чем меньше длина этого интервала, тем точнее оценка параметра.
Определение Статистической гипотезой называют гипотезу о виде неизвестного распределения генеральной совокупности или о параметрах известных распределений.
Определение. Нулевой (основной) называют выдвинутую гипотезу Н 0. Конкурирующей (альтернативной) называют гипотезу Н 1, которая противоречит нулевой.
Определение. Простой называют гипотезу, содержащую только одно предположение, сложной – гипотезу, состоящую из конечного или бесконечного числа простых гипотез.
В результате проверки правильности выдвинутой нулевой гипотезы (такая проверка называется статистической, так как производится с применением методов математической статистики) возможны ошибки двух видов: ошибка первого рода, состоящая в том, что будет отвергнута правильная нулевая гипотеза, и ошибка второго рода, заключающаяся в том, что будет принята неверная гипотеза.
Процесс проверки гипотезы состоит из следующих этапов:
1) выбирается статистический критерий К;
2) вычисляется его наблюдаемое значение Кнабл по имеющейся выборке;
3) поскольку закон распределения К известен, определяется (по известному уровню значимости α) критическое значение kкр, разделяющее критическую область и область принятия гипотезы (например, если р (К > kкр) = α, то справа от kкр располагается критическая область, а слева – область принятия гипотезы);
4) если вычисленное значение Кнабл попадает в область принятия гипотезы, то нулевая гипотеза принимается, если в критическую область – нулевая гипотеза отвергается.
Типовая задача 1
Приведены результаты тестирования студентов по математике (ответы на 50 вопросов программы). Требуется:
1. Построить интервальные статистические ряды распределения частот и относительных частот (частостей) наблюдаемых значений;
2. Найти размах вариации и разбить его на 9 интервалов;
3. Построить гистограмму и полигон относительных частот, кумуляту. Указать, графикам каких функции в теории вероятностей они соответствуют;
4. Найти эмпирическую функцию распределения и построить ее график;
5. Вычислить числовые характеристики ряда распределения: выборочную
среднюю, выборочные моду и медиану , выборочную дисперсию , выборочное среднее квадратичное отклонение s и выборочный коэффициент вариации . Вычислить выборочные начальные и центральные моменты до четвертого порядка включительно, а также выборочные коэффициент асимметрии и эксцесса
6. Рассчитать теоретическую нормальную кривую распределения и построить ее на эмпирическом графике;
7. Приняв в качестве нулевой гипотезы Но (генеральная совокупность, из которой извлечена выборка, имеет нормальное распределение), проверить гипотезу, пользуясь критерием согласия Пирсона ( 2) при уровне значимости
8. Найти доверительные интервалы для математического ожидания и среднего квадратичного отклонения.
Исходные выборочные данные
Решение:
1) Минимальное значение признака хmin = 18 вопросов., максимальное - хmax = 49 вопросов. Для определения границ интервалов находим шаг интервала: h = . Шаг интервала округляем
h = = .
Принимаем, что интервалы включают правую границу.
2) Для составления интервального распределения составим таблицу. В первой строке расположим в порядке возрастания интервалы, длина каждого из которых h=4. Во второй строке запишем количество значений признака в выборке, попавших в этот интервал (т.е. сумму частот вариант, попавших в соответствующий интервал). Интервальный статистический ряд таков:
(xi, xi+1) | 16–20 | 20–24 | 24–28 | 28–32 | 32–36 | 36-40 | 40-44 | 44-48 | 48-52 |
ni |
Объем выборки n=1 +4+6+6+8+6+ 4+2 +3=40.
Распределение относительных частот.
(xi, xi+1) | 16–20 | 20–24 | 24–28 | 28–32 | 32–36 | 36-40 | 40-44 | 44-48 | 48-52 |
ni/n | 0,025 | 0,1 | 0,15 | 0,15 | 0,2 | 0,15 | 0,1 | 0,05 | 0,075 |
Для построения гистограммы частот на оси абсцисс откладываем частичные интервалы; на каждом из них строим прямоугольники высотой
Дискретный ряд распределения
xi | |||||||||
ni/n | 0,025 | 0,1 | 0,15 | 0,15 | 0,2 | 0,15 | 0,1 | 0,05 | 0,075 |
Для построения полигона частот по оси абсцисс откладываем середины интервалов, по оси ординат относительные частоты
Накопленные частоты
xi | |||||||||
ni | |||||||||
ni/n | 0,025 | 0,125 | 0,275 | 0,425 | 0,625 | 0,775 | 0,875 | 0,925 |
3) Полигон относительных частот соответствует графику плотности распределения, кумулята соответствует функции распределения
Дата публикования: 2015-10-09; Прочитано: 2794 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!