Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Случайная величина



Случайной величиной называется такая величина, которая принимает в результате опыта одно из множества возможных значений, причем заранее неизвестно, какое именно.

Множество возможных значений может быть конечным (счетным) или бесконечным. Соответственно, случайные величины делятся на дискретные и непрерывные.

Примеры случайных величин:

Дискретные случайные величины 1. Количество попаданий при стрельбе. 2. Количество присутствующих на собрании. 3. Показания цифрового измерительного прибора. 4. Число дефектных изделий в партии. 5. Количество входящих звонков по теле­фону в течение дня. Непрерывные случайные величины 1. Время безотказной работы прибора. 2. Вес человека, его рост. 3. Показания аналогового прибора. 4. Значение технологического параметра (температура, давление …) 5. Скорость передвижения.

Оценки экспертов следует рассматривать как случайные величины, значения которых невозможно предсказать точно; можно только судить о наиболее вероятных и средних значениях.

Возьмем конкретный пример. Допустим, нам понадобилось проанализировать, насколько верно с позиций конфликтологии ведут себя 20 руководителей среднего звена предприятия. Допустим, в оценке участвовало 100 экспертов (по 5 экспертов для каждого руководителя). Использовался признак «Умение улаживать конфликты». Формулировки признака:

1. Стремится не замечать каких бы то ни было конфликтных ситуаций. Практически никогда не обсуждает вопросы, чреватые разногласиями.

2. В случае, когда не удается уклониться от разрешения конфликтной ситуации, делает все, чтобы замять конфликт.

3. Апеллирует к потребности в солидарности, когда пытается сгладить возникающие в коллективе противоречия.

4. В конфликтных ситуациях пытается заставить принять свою точку зрения.

5. В конфликтной ситуации способен на компромисс: принятие — до некоторой степени — противоположной точки зрения во избежание ссоры.

6. В конфликтных ситуациях анализирует иные точки зрения, ищет наилучшие, конструктивные варианты не за счет других.

Итоги исследования сведены в таблицу:

Номера формулировок            
Значения микрорейтингов            
Количество голосов, поданных за отдельные формулировки            
Частота (оценка вероятности) 0,06 0,15 0,25 0,28 0,19 0,07

В третьей строке таблицы записаны опытные данные: сколько раз руководители оказались оцененными с формулировками 1, 2,…,6. Например, в 28 случаях из 100 эксперты нашли наиболее подходящей 4-ю формулировку. В последней строке приведены частоты выбора каждой из шести формулировок. Эти частоты есть не что иное, как оценки вероятностей. Их можно записать в форме , где х – конкретное значение переменной (микро­рейтинга):

= 0,06; (20)=0,15; (40)=0,25; (60)=0,28; (80)=0,19; (100)=0,07.

Представим последние результаты в форме гистограммы:

Рис. 3. Эмпирическое распределение вероятностей отдельных значений микрорейтингов.

Итак, выражаясь языком статистики, мы выполнили свертку исходных данных — получили 6 объясняющих параметров вместо 100 исходных экспертных значений переменной Х. Свертка может быть еще лаконичнее, если использовать две основные характеристики случайной величины — математическое ожидание и дисперсию.

Вся статистика основана на усреднении и получении в результате усреднений обобщенных характеристик. Используем оператор усреднения M. Оператор М показывает, что стоящая за ним (в квадратных скобках) переменная или функция этой переменной усредняется. Например, запись М[X] означает, что вычисляется среднее значение Х. Итак, среднее значение или математическое ожидание случайной величины X: mx = M[X].

Основные свойства математического ожидания:

1. .

2. .

3. .

4. Для независимых Х1 и Х2

Чтобы вычислить оценку математического ожидания дискретной случайной величины, можно использовать формулу:

(4) ,

где n – количество (дискретных) значений случайной величины. В нашем примере n =6.

Воспользуемся этой формулой:

.

Среднее значение — популярное понятие, не требующее особых пояснений. Для механиков это аналог центра тяжести.

В общем случае, когда вероятности состояний неизвестны, вместо (4) удобнее использовать очевидную формулу:

(5) ,

где xi – значения случайной величины в отдельных опытах, а N – число опытов.

Большинство случайных величин, с которыми приходится иметь дело на практике, не дискретны, как в рассматриваемом примере, а непрерывны.

Для непрерывных случайных величин используется схожее с описанным представление распределений с помощью гистограмм. Как это делается, покажем на примере.

Допустим, в нашем распоряжении имеются результаты обследования населения некоторого городка. Измерялся рост взрослых людей (Х). Диапазон наблюдаемых значений случайной величины Х — от 140 до 210 см. Разобьем этот диапазон на 7 равных по величине полуинтервалов: (140-150); (150-160),…, (200-210). Далее определим, сколько измерений попало в каждый полуинтервал, разделим полученные значения на общее число опытов. В итоге получили таблицу такого вида:

Полуинтервал 140-150 150-160 160-170 170-180 180-190 190-200 200-210
Оценка вероятности 0,02 0,10 0,25 0,28 0,24 0,10 0,01

Графическое отражение таблицы — гистограмма, представленная на рис. 4. В отличие от предыдущего рисунка, где узкие прямоугольники указывали на вероятности отдельных значений дискретной случайной величины, здесь прямоугольники расположены вплотную, указывая на непрерывность, принадлежность соответствующим полуинтервалам.

Рис. 4. Гистограмма распределения непрерывной случайной величины

Иногда вместо гистограммы рисуют полигон распределения случайных величин, который получится, если соединить прямыми линиями средние точки вершин прямоугольников гистограммы (рис. 5).

Рис. 5. Полигон распределения непрерывной случайной величины

Существует очевидная связь между числом опытов и числом интервалов гистограммы (полигона). Для обеспечения приемлемой точности каждой оценки вероятности попадания в полуинтервал нужно иметь в среднем примерно 15 опытов на полуинтервал. Произвольно плодить число полуинтервалов нельзя: гладких (соответствующих природе большинства явлений) форм при этом не получится.

А теперь представим, что нам необходимо отобразить сложное распределение, например, распределение с двумя максимумами, и при этом имеется достаточное число опытов. Увеличивая число полуинтервалов, замечаем: значения оценок вероятностей (особенно на «хвостах») приближаются к нулю, шкала измерений (вероятности) становится неудобной.

Разрешить эту проблему можно, если по оси Y откладывать не вероятности, а их значения, деленные на величины полуинтервалов. Новая единица измерения носит (удачное) название: плотность вероятности. В пределе, при стремлении размера полуинтервала к нулю (большое количество опытов), получается все более гладкая непрерывная кривая плотности вероятности.

После этих рассуждений легче понять формулу, с помощью которой дается определение понятия «плотность вероятности»:

(6) .

Здесь плотность вероятности непрерывной случайной величины Х в точке х.

В числителе дроби записана вероятность попадания случайной величины Х в интервал , прилегающий к точке х.

Следует различать обозначения случайной величины Х (с большой буквы, как фамилии) и ее отдельного значения х. Отсюда ясна запись: Х=х.

Основные свойства плотности вероятности:

1. .

2. .

3. (условие нормировки).

Первое свойство очевидно: как и вероятность, плотность вероятности не может иметь отрицательное значение.

Второе свойство дает возможность определить вероятность того, что случайная величина находится в пределах интервала .

Последнее свойство следует из второго: вероятность иметь хоть какое значение величины Х равная единице.

По аналогии с формулой (4) можно записать выражение для математического ожидания (среднего значения) непрерывной случайной величины:

(7)

Познакомимся еще с одной характеристикой — дисперсией случайной величины. Дисперсия — средний квадрат отклонения случайной величины от математического ожидания:

(8) Dx=M[(X-mx)2].

Физический смысл дисперсии: мощность источника изменчивости Х. Например, мощность источника колебаний электрического тока пропорциональна среднему квадрату переменной составляющей напряжения. При этом постоянная составляющая напряжения — аналог математического ожидания.

Перечислим основные свойства дисперсии, используя символ D как символ оператора:

1. .

2. .

3. Для независимых случайных величин X1, X2,..., Xn

.

Учитывая свойства 2 и 3, можно записать для независимых случайных величин X1 , X2:

.

Для оценки дисперсии случайной величины из опытных данных используется формула:

(9) .

При сопоставлении выражений (8) и (9) возникает естественный вопрос: почему в числителе формулы (9) стоит N -1, а не N? Ведь при вычислении среднего значения мы обычно делим сумму на число опытов.

Ответ таков. Если бы в числителе формулы (9) стояла не оценка математического ожидания , а ее истинное значение , тогда действительно следовало ставить в знаменателе не N- 1, а N. Однако мы пользуемся оценкой , которая случайна и зависит от числа опытов N. При этом . Нетрудно доказать, что для выполнения аналогичного условия (условия несмещенности) в числителе формулы должно быть N- 1.

Из дисперсии порождается еще одна характеристика — среднеквадратическое отклонение случайной величины . Определяющая формула: . Соответственно оценка среднеквадратического отклонения случайной величины Х: .

В отличие от дисперсии, среднеквадратическое отклонение имеет ту же размерность, что и случайная величина Х, и обычно используется как мера рассеяния (или мера ошибки, если, например, Х — показания прибора).

Учитывая свойства дисперсии, покажем, как меняется среднеквадратическая ошибка вычисления среднего значения (рассеяние оценки математического ожидания) с увеличением числа опытов.

.

Используя для краткости символ в качестве оператора, запишем:

.

То есть среднеквадратическое рассеяние оценки среднего значения в раз меньше, чем рассеяние отдельного опыта. Например, результат усреднения мнений 9 экспертов в 3 раза точнее, чем оценка одного эксперта (при условии, что мнения экспертов однородны).

Воспользуемся нашими знаниями свойств дисперсии для решения следующего примера. Допустим, мы имеем возможность измерять технологический параметр (например, расход основного продукта) двумя приборами. Показания приборов обозначим и . Их среднеквадратические погрешности равны ; .

Можно подсчитать «истинное» значение параметра с помощью простого усреднения:

При этом оба измерения входя т в последнее выражение с одинаковым весом (0,5). Несправедливо. Более того — грубо. Можно показать, что когда , оценка имеет ошибку, б о льшую, чем ошибка наиболее точного прибора. В нашем случае мы можем в этом убедиться, если воспользуемся знаниями свойств дисперсии:

.

Среднеквадратическая ошибка результата простого усреднения равна То есть результат простого усреднения оказался на 12% грубее результата измерения наиболее точным прибором. Минимальная ошибка оценки будет в случае, если использовать взвешенное среднее:

,

где веса и неодинаковы и вычисляются на основании двух соотношений:

;

;

с – константа, которая находится при совместном решении записанных соотношений.

В нашем случае: . 0,656; 0,81.

То есть в результате взвешенного усреднения мы получаем в условиях нашего примера почти 20%-ный выигрыш в точности!

Метод взвешенного усреднения применим и в случае, когда число измерений больше двух. Естественно ожидать соответствующее усиление уточняющего эффекта взвешивания. В алгоритме обработки экспертных данных в системе «Персона» взвешенное усреднение используется при расчете средних мнений экспертов. Это позволяет минимизировать субъективизм и влияние экстремально настроенных экспертов. Экспертов — одиночек. Естественный вопрос: а как быть, если экстремально настроенных экспертов двое? Как быть, когда мнения экспертов разделились? Приходится использовать методы, позволяющие анализировать структуру мнений экспертов. Об этом — позднее.

Нормальное распределение

Существует большое число распределений случайных величин, описывающих особенности поведения переменных в различных практических задачах. Например, распределение Вейбулла и экспоненциальное распределение нашли применение в задачах теории надежности, распределение Пуассона — в теории массового обслуживания, в экологии, ядерной физике и т.д.

Особое место занимает нормальное распределение или распределение Гаусса. В соответствии с центральной предельной теоремой распределение случайной величины стремится к нормальному, если на нее действует большое число факторов, среди которых нет доминирующих. Иначе говоря, нормальное распределение — предел влияния множества случайностей. Плотность вероятности при этом описывается следующей формулой:

(10) .

Множество значений нормально распределенной случайной величины Х описывается всего двумя известными нам параметрами — mx и . На рис. 6 показаны кривые нормального распределения n(m; σ) с разными значениями математического ожидания m и среднеквадратического рассеяния σ.

Нормальное распределение симметрично относительно математического ожидания и не имеет границ слева и справа. Координата максимума плотности вероятности (моды) совпадает с величиной математического ожидания. Изменение математического ожидания приводит к смещению середины кривой. Увеличение σ приводит к уплощению формы кривой; уменьшении σ — к обострению формы распределения в сравнении со стандартной кривой n(0; 1).

Рис. 6. Графики нормального распределения

Любое «нестандартное» нормальное распределение случайной величины приводится к стандартному посредством преобразования

(11) .

В соответствии со свойствами плотности вероятности вероятность того, что нормально распределенная случайная величина X окажется в пределах интервала , равна

.

Получающийся при этом интеграл является не берущимся (не выражающимся через элементарные функции). Используя преобразование (11), его приводят к стандартному виду, универсальному для всех случаев:

(12) .

Определенный интеграл с переменным верхним пределом вида

,

выражающий площадь на интервале (0,z) под стандартной нормальной кривой, носит название интеграла Лапласа.

Основные свойства интеграла Лапласа:

1. ;

2. ;

3. ;

4.

Значения интеграла Лапласа можно найти в статистических таблицах, так что вычислять каждый раз (например, численно) не берущийся интеграл не требуется. Выражение (12) можно представить следующим образом:

.

Благодаря преобразованию (11), любую нормально распределенную случайную величину, в каких бы единицах она ни измерялась, можно представить в универсальной (стандартной) шкале, где расстояние измеряется «в сигмах» от нулевого математического ожидания. При этом

.

Используя табличные значения , составим таблицу:

Таблица 1. Вероятностные характеристики нормально распределенной случайной величины

z Вероятность нахождения в интервале : Вероятность выхода из интервала :
  0,3413 0,68 0,32
  0,4772 0,954 0,045
  0,49865 0,9973 0,0027
  0,4999683 0,99993 0,00007

Из табл. 1 следует:

  1. В пределах () содержится 2/3 всех значений нормально распределенной случайной величины;
  2. За пределы интервала () выходит 5% значений нормально распределенной случайной величины;
  3. За пределы интервала () выходит 0,3% значений нормально распределенной случайной величины;
  4. За пределы интервала () выходит только одно из 15625 измерений нормально распределенной случайной величины.

Результаты, приведенные в последней таблице, служат источников множества ошибок. Наиболее ядовитая из них — злоупотребление так называемым «правилом трех сигма». На основании ограниченного числа (выборки) экспериментальных значений вычисляются оценки математического ожидания и среднеквадратического отклонения некоторой случайной величины X, а затем провозглашается, что эта случайная величина находится практически в пределах «трехсигмового» интервала , поскольку вероятность выхода за пределы этого интервала ничтожно мала (0,3%).

Возражения:

  1. Нормальный закон в чистом виде на практике не встречается, прежде всего, потому, что реальные случайные величины не могут изменяться в бесконечных пределах. Возможны довольно хорошие приближения к нормальности при большом числе источников, приводящих к изменениям случайной величины. В этих случаях используют усеченное нормальное распределение, которое получается из нормального распределения простым усечением — отбрасыванием значений «на хвостах». Чаще всего «хвосты» — то, что выходит за пределы . Среди специалистов по статистике есть те, кто считает, что победителей не судят, и если, например, в практике управления качеством «правило трех сигма» срабатывает, то нечего теоретизировать. Другая часть специалистов провозгласила, что нормальность — это миф, и нужно использовать исключительно непараметрические методы, не зависящие от вида распределения.
  2. Вероятность выхода случайной величины за пределы интервала () и за пределы интервала — не одно и то же. Для того, чтобы определить на основании опытных данных, какая часть нормально распределенной случайной величины X вышла за границы (), следует использовать толерантные границы [33]. Строгая формулировка толерантных границ такова:

С вероятностью S по меньшей мере g процентов всех возможных значений нормально распределенной случайной величины лежит внутри допустимой области (); при этом и рассчитываются на основании выборки объема n.

Таблица 2. Толерантные границы

n S=0,95 S=0,99
g=0,95 g=0,99 g=0,95 g=0,99
  9,92 12,86 22,40 29,06
  4,41 5,78 6,35 8,30
  3,16 4,15 3,87 5,08
  2,65 3,48 3,00 3,95
  2,55 3,35 2,84 3,73
  2,38 3,13 2,58 3,39
  2,23 2,93 2.36 3,10
  2,07 2,72 2,12 2,78
¥ 1,96 2,58 1,96 2,58

Как видно из табл. 2, при малом числе опытов n и высоких требованиях к надежности S ошибка установления границ, в которых лежит заданная часть значений нормально распределенной случайной величины, может быть чрезвычайно большой. Только при n=¥ границы, указанные в табл. 2, совпадают с табличными для .

При отклонениях от нормального закона требования еще ужесточаются. В книге Л. Закса [33] приведены непараметрические допустимые границы, справедливые для любого распределения случайной величины.

Отметим одно важное обстоятельство. Классическая (параметрическая) теория вероятностей и статистика базируются на предположении нормальности распределений случайных величин, как одномерных, так и многомерных (многомерные случайные величины мы рассмотрим далее). Такие методы, как корреляционный, регрессионный, дисперсионный и дискриминантный анализ, требуют проверки эффективности при отступлениях от нормальности распределений анализируемых случайных величин.

Наилучший способ проверки работоспособности методов в реальных условиях — имитационное моделирование. Автор использовал имитационное моделирование для сравнительных испытаний классического алгоритма регрессионного анализа и «неклассических» алгоритмов. И оказалось, что классический алгоритм наиболее универсален и не так уж плох [72]. Из-за строгого математического описания с четко определенными условиями его легче критиковать, чем какой-нибудь эвристический метод, лишенный математических основ. Нередки случаи, когда предложенный неким автором оригинальный алгоритм работоспособен только для определенного примера. Более того, были выявлены пакеты программ, где используются алгоритмы, приводящие к грубым ошибкам расчетов.

К сожалению, среди математиков довольно часто встречаются изобретатели эффектных, но не эффективных новинок, а также любители решения задач с условиями, которые не встречаются в реальной действительности.

Итак, мы выяснили, что оценки основных параметров случайных величин и являются случайными величинами. Иногда для оценок используют свои символы: вместо ; вместо и т. д. Причем в аналитической химии для оценки среднеквадратического отклонения даже введен свой термин — «стандарт». Мы считаем это неудобным (зачем плодить ненужные сущности?) практичнее однотипное описание вероятностных характеристик и процедур их оценки.

Рассеяние значений оценок зависит от размера выборки: чем больше n, тем меньше среднеквадратические отклонения оценки. Чтобы установить некий аналог ошибки оценивания (неточности), для оценок параметров ввели доверительные интервалы.

Доверительный интервал — это вычисленный по выборочным значениям интервал, который с заданной вероятностью накрывает истинное, но не известное нам значение параметра. В качестве доверительной вероятности обычно принимают 95%; эта вероятность говорит о том, что при частых применениях данного метода вычислений доверительный интервал примерно в 95% случаев будет накрывать оцениваемый параметр.

Иногда в популярных книгах по статистике доверительный интервал объясняется как интервал, в который с заданной вероятностью попадает истинное значение параметра. Ошибка заключается в следующем: случаен полученный интервал, а не истинное значение параметра. Столб никогда первым не нападает на автомобиль; мы можем наехать или не наехать автомобилем (интервалом) на столб (истинное значение параметра).

Обычно предполагается, что полученный набор опытных данных — выборка является частью бесконечной генеральной совокупности — множества возможных значений X. Причем генеральная совокупность однородна, не является смесью нескольких частных совокупностей с различающимися свойствами. Пример такой неоднородной смеси: один и тот же химический продукт, выпущенный разными заводами, из разного сырья, по разным технологиям.

Границы доверительного интервала для среднего значения нормально распределенной случайной величины рассчитывается по формуле

(13) ,

где — среднеквадратическое рассеяние оценки . Напоминаем: ;

— коэффициент распределения Стьюдента.

Распределение Стьюдента является распределением оценок . Внешне оно схоже со стандартным нормальным распределением: при малых n оно более плоское по форме, при совпадает со стандартным нормальным распределением.

Замечаем: в (13) — вновь отсчеты «в шагах, равных сигма». (Если строго: «в шагах, равных оценкам сигма»). Параметр z в табл. 4.1. является аналогом параметра t в (13): при z=2 интервал обеспечивает накрытие 95,4% значений случайной величины. Для того, чтобы с вероятностью 95% накрыть истинное значение , необходимо воспользоваться таблицей коэффициентов Стьюдента и найти t при вероятности ошибки и числе степеней свободы, равном n-1.

Ранее, поясняя, почему в формуле оценки дисперсии (9) в числителе стоит не n, а n-1, мы ссылались на необходимость обеспечения условия несмещенности оценки: . Можно дать более общее объяснение.

Универсальная для оценок параметров характеристика — степень свободы — учитывает «расходование» имеющегося статистического материала. Известно, что для нахождения значений n переменных необходимо не менее n уравнений. Точно так же для нахождения n оценок требуется не менее n опытов. Если перед оцениванием некоторого параметра мы были вынуждены найти k других параметров, это означает, что число степеней свободы сократилось на k единиц. При оценке и при оценке доверительного интервала для , вначале требовалось оценить математическое ожидание, и тем самым «израсходовать» один опыт, потерять одну степень свободы.





Дата публикования: 2014-11-28; Прочитано: 549 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.024 с)...