Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Математическое ожидание дискретной случайной величины. Теоретическая дисперсия дискретной случайной величины



Математическое ожидание дискретной случайной величины – это взвешенное среднее всех ее возможных значений на вероятность соответствующего исхода. Математически если случайную величину обозначить как х, то ее математическое ожидание будет обозначаться как .

Предположим, что х может принимать n конкретных значений () и что вероятность получения равна . Тогда математическое ожидание дискретной случайной величины равна

. (1.1)

и непрерывной случайной величины: .

Свойства 1. Математическое ожидание суммы случайных величин равно сумме их математических ожиданий, т.е.

. (1.2)

Свойства 2. Если случайная переменная умножается на константу, то ее математическое ожидание умножается на ту же константу. Если х – случайная переменная и а – константа, то

. (1.3)

Свойства 3. Математическое ожидание константы есть сама эта величина, т.е.

Дисперсией (теоретической) случайной величины х называется математическое ожидание квадрата отклонения х от математического ожидания , т.е.

, (1.4)

следовательно, для дискретной случайной величины

,

а для непрерывной случайной величины

.

Пример 1.1

Найти дисперсию случайной величины X, которая задана следующим законом распределения:

X        
P 0,3 0,5 0,2 /через отклонение/

Решение: Найдем математическое ожидание:

Е(х)=1*0,3+2*0,5+5*0,2=2,3.

Найдем все возможные значения квадрата отклонения:

[x

[x

[x

Напишем закон распределения квадрата отклонения:

[х-Е(х)] 1,69 0,09 7,29
P 0,3 0,5 0,2

По определению, =1,69*0,3+0,09*0,5+7,29*0,2=2,01.

Задание 1.1. Случайная переменная х определяется как разность между большим и меньшим числами, выпавшими при бросании двух костей. Если они равны между собой, то переменная х считается равной нулю. Найдите распределение вероятностей для х. Найти математическое ожидание случайной величины х. Рассчитайте Е(х2) для величины х.

Задание 1.2. Пусть х – случайная переменная с математическим ожиданием μ, и λ-константа. Докажите, что математическое ожидание λх равно λμ.

Задание 1.3. Пусть х – число очков, выпавшее при однократном бросании игральной кости. Рассчитайте возможные значения у, где у получается по формуле у=х2+3х-2 и, далее, рассчитайте Е(у). Покажите, что она равняется Е(х2)+3Е(х)-2.

Задание 1.4. Рассчитайте теоретическую дисперсию и стандартное отклонение величины х, определенной как в задание 1.

Задание 1.5. Рассчитайте дисперсию обобщенной оценки теоретического среднего для частного случая σ2=1 и выборки из двух наблюдений, с величинами λ1 от 0 до 1 при шаге 0,1. Нанесите полученные точки на график. Важно ли то, чтобы весовые коэффициенты λ1 и λ2 в точности равнялись друг другу?

Контрольные вопросы

1. Дать определение случайной переменной

2. Перечислите свойства математического ожидания.

3.Дать определение дисперсии.

Практическое занятие 2. Ковариация, дисперсия и корреляция

Выборочная ковариация является мерой взаимосвязи между двумя переменными.

При наличии n наблюдений двух переменных (х и у) выборочная ковариация между х и у задается формулой:

.

Правила расчета ковариации.

1. Если , то .

2. Если , где а – константа, то .

3. Если , где а – константа, то .

Если х и у – случайные величины, то теоретическая ковариация определяется как математическое ожидание произведения отклонений этих величин от их средних значений:

где и - теоретические средние значения х и у соответственно.

Для выборки из n наблюдений выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:

.

Правила расчета дисперсии

1.Если , то .

2. Если , где а является постоянной, то .

3. Если , где а является постоянной, то .

4. Если , где а является постоянной, то .

Более точной мерой зависимости является коэффициент корреляции. Коэффициент корреляции имеет две формы – теоретическую и выборочную. Теоретический коэффициент корреляции r определяется следующим образом:

Выборочный коэффициент корреляции r определяется путем замены теоретических дисперсий и ковариации на их несмещенные оценки.

.

Выборочный коэффициент корреляции имеет максимальное значение, равное единице, которое получается при строгой линейной положительной зависимости между выборочными значениями х и у. Аналогичным образом r принимает минимальное значение –1, когда существует отрицательная линейная зависимость. Величина r =0 показывает, что зависимость между наблюдениями х и у в выборке отсутствует.

Пример 2.1. Пусть имеем данные по 6-ти семьям (домохозяйствам), приведенные в таблице, где x- общий годовой доход; y- расходы на питание и одежду; v-расходы на питание; w-расходы на одежду. Здесь y=v+w. Указанную в таблице 2.1величину z рассматривать пока не будем.

a) Покажем, что если y=v+w, то

Таблица 2.1

семья Доход семьи х Расходы на питание и одежду у Расходы на питание v Расходы на одежды w Вторая выборка: расходы семьи на питание и одежду z
           
           
           
           
           
           
Сумма          
среднее          

Для каждой семьи вычислим величины , , , . Эти данные оформим в виде таблицы 2.2.

; ; .

Таблицы 2.2

Семья  
  -883 -75   -50   -25  
  -1383 -325   -200   -125  
            -25 -2917
               
  -583 -175   -100   -75  
               
Сумма          
Среднее          

Итак, , , ,

, если у=v+w,, т.е вклад семьи в является суммой ее вкладов в ,

б) Добавим последнюю колонку z, которая определяет расходы на питание и одежду для второй выборки из 6 семей. Предполагается, что значения x для второго набора семей такие же как и в первом наборе. Покажем, что если y=az, то

Таблицы 2.3

семья Доход семьи х Расходы на питание и одежду z
      -883 -150  
      -1383 -650  
           
           
      -583 -350  
           
Сумма          
среднее          

, так как y=2z. Рассмотрим первую часть: z=2y1

. , т.е. вклад первой семьи в величину в точности равен двойной величине ее вкладов , то же справедливо для других семей.

в) Докажем на примере правило 3, если у=a, где а-const, то Cov(x,y)=0.

Допустим, что каждая семья имеет по 2 взрослых человека. Вычислим ковариацию между х- общим доходом и а- числом взрослых в семье.

следовательно, и . Следовательно, для каждой семьи и , поэтому . Данные вычислений можно оформить в виде таблицы

Таблицы 2.4

Семья Доход семьи х a
      -883    
      -1383    
           
           
      -583    
           
Сумма          
среднее          

Задание 2.1. В некоторой бюрократической стране годовой доход каждого индивида у определяется по формуле: у=10000+500s+200t, где s –число лет обучения индивида; t –трудовой стаж (в годах); х- возраст индивида.(таблица 2.5). Рассчитайте Cov(x,y), Cov(x,s) и Cov(x,t) для выборки из пяти индивидов, описанной ниже, и проверьте, что Cov(x,y)=500Cov(x,s)+200Cov(x,t). Объясните аналитически, почему так происходит.

Таблица 2.5

индивид Возраст(годы), х Годы обучения, s Трудовой стаж,t Доход, у
         
         
         
         
         

Задание 2.2. Используя данные из задания 3, вычислите Var(y), Var(s) Var(t) и проверьте, что Var(y)=250000Var(s)+40000Var(t)+200000Cov(s,t), при этом результат объясните аналитически.

Задание 2.3. Пусть наблюдения двух случайных переменных х и у находятся на прямой линии: у=а+bx. Покажите, что Cov(x,y)=bVar(x) и что Var(y)=b2Var(x), а следовательно, выборочный коэффициент корреляции равен 1, если наклон линии положителен, и -1, если этот наклон отрицателен.

Задание 2.4. Пусть переменная у определяется строгой линейной зависимостью: у=а+bх, и предположим, что для х, у и третьей переменной z получена выборка наблюдений. Покажите, что если коэффициент b положителен, то выборочный коэффициент корреляции для у и z должен таким же, как и для х и z.

Контрольные вопросы

1.Какая оценка называется несмещенной, состоятельной и эффективной?

2.Что такое выборочная, теоретическая ковариация?

3.Что такое выборочная дисперсия?

4.Какие две формы имеет коэффициент корреляции?

Практическое занятие 3. Модель парной линейной регрессии

Регрессия по методу наименьших квадратов с одной независимой переменной.

Рассмотрим случай, когда имеется n наблюдений двух переменных х и у. Предположив, что у зависит от х, мы хотим подобрать уравнение .Мы хотим выбрать а и b, чтобы минимизировать величину S:

Необходимые условия минимума S заключается в равенстве нулю частных производственных по а и b:

,

Решение этой системы двух уравнений с двумя неизвестными дают формулы:

, .

В парном регрессионном анализе поведение зависимой переменной объясняется поведением независимой переменной. Согласно определению остатков можно записать , .

Оказывается справедливо следующее равенство .

Это означает, что мы можем разложить Var(y) на две части: - часть, которая «объясняется» уравнением регрессии и Var(e) – «необъясненную» часть.

Отношение - это часть дисперсии у, объясненная уравнением регрессии. Это отношение известно как коэффициент детерминации, и его обычно обозначают :

, что равносильно .

Максимальное значение коэффициента равно единице. Это происходит в том случае, когда линия регрессия точно соответствует всем наблюдениям, так что для всех i и все остатки равны нулю. Тогда , и =1. Если в выборке отсутствует видимая связь между у и х, то коэффициент будет близок к нулю.

Пример 3.1. Для 13 клиентов спортивного отдела магазина зафиксирована сумма покупки (в у.е.) и время разговора с продавцом (в мин.). Данные представлены в таблице 3.1.

Таблица 3.1

                         
                         

Т р е б у е т с я:

1) Оценить с помощью МНК параметры линейного регрессионного уравнения, предположив, что переменная «длительность разговора с продавцом» объясняется переменной «величина покупки».

2) Оценить с помощью МНК параметры линейного регрессионного уравнения, предположив, что переменная «величина покупки» объясняется переменной «длительность разговора с продавцом».

3) Нарисовать диаграмму рассеяния величин (, ) и обе линии регрессии. Объяснить, почему, если поменять экзогенную и эндогенную переменные местами, как правило, получаются различные уравнения регрессии.

Решение

1.Для оценки параметров линейного регрессионного уравнения рассчитаем сначала ; ; ; ; .

и .

С учетом этого

;

В целом, получаем

(3.1)

2.Оценим теперь параметры линейного регрессионного уравнения .

;

таким образом,

(3.2)

3. Для того чтобы можно было сравнить уравнения (3.1) и (3.2), выразим y из уравнения (3.2) и получим (3.2*) Сравнение коэффициентов уравнений (3.1) и 3.2*) показывает, что уравнения (3.1) и (3.2) различны (рисунок 3.1).

Рисунок 3.1-Диаграмма рассеяния величин и графики уравнений регрессии (3.1) и (3.2*)

       
 
 
   


Если рассматривать переменную у как эндогенную, а переменную х –как экзогенную, то основу МНК образуют величины (разности ), если поменять переменные местами, то основу МНК образуют (разности )(рисунок 3.2). Минимизация суммы квадратов разностей абсцисс дает, как правило, выборочную прямую, отличную от той, которую дает минимизацию разностей ординат. Прямые совпадают только в том случае, когда все пары наблюдений лежат на одной прямой, наклон которой не ноль.

Рисунок 3.2 - Варианты измерения расстояния от точки до прямой

Задание 3.1. Дана таблица наблюдений

n x y
     
     
     

а) Составить уравнение регрессии.

б) Вычислить коэффициент детерминации.

Задание 3.2. Дана таблица наблюдений

i x y
  -2 -5
     
     

а) Построить уравнение парной линейной регрессии.

б) Вычислить коэффициент детерминации

Задание 3.3. Дана таблица наблюдений

i x y
    -5
     
     

Построить уравнение парной линейной регрессии.

Задание 3.4. Исследуется зависимость затрат на рекламу у от годового оборота х в некоторой отрасли. Для этого собрана информация по T = 20 случайно выбранным предприятиям этой отрасли о годовом обороте xt и соответствующих расходах на рекламу yt (в млн. руб.). Из выборки получены следующие данные: = 17,3; =1,2; = 944,3; =9250; = 127,2. Предполагается, что зависимость уt от хt описывается следующим уравнением: yt = a0 + a1 xt+ e t (t = 1,...,20).

Т р е б у е т с я:

1) Оценить параметры a0 и a1с помощью МНК;

2) Оценить дисперсию «истинной» ошибки e t;

3)Оценить дисперсии оценок a 0и а 1и их ковариацию.

Задание 3.5. Имеется выборка, состоящая из T = 6 пар наблюдений (xt, yt):





Дата публикования: 2015-04-06; Прочитано: 3146 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.023 с)...