Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Модели случайно усеченных выборок (selection-model)

⇐ Предыдущая 11 12 13 14 151617 18 19 20 Следующая ⇒

Предположим, что переменные у и z имеют двумерное распределение с коэффициентом корреляции r. Найдем распределение у по случайной выборке (у, z) условии, что уровень переменной z превышает определенное значение (z > b). Интуиция подсказывает, что если у и z положительно коррелированы, то усечение z должно подвинуть распределение у вправо.

Нахождение распределения у связано с определением, во-первых, вида функции плотности случайно усеченного распределения переменных у и z, и, во-вторых, математического ожидания и дисперсии случайно усеченной переменной у при условии, что у и z подчинены закону двумерного нормального распределения.

Усеченная совместная плотность у и z согласно выражению (10.136) при любом распределении этих переменных определяется следующим выражением:

Если у и z распределены согласно двумерному нормальному закону с математическими ожиданиями m_y и m_z и стандартными отклонениями s _y и s _z, а коэффициент их парной корреляции равен r, то в соответствии с выражениями (10.142)–(10.143) условные математическое ожидание и дисперсия у при усечении z определяются следующим образом:

M [ y | z > b ]= m_y + r × s _y ×l (b _z); (10.169)

D [ y | z > b ]= s_y ² × [1– r ²× d (b _z)], (10.170)

где

b _z =(b–m_y)/ s _z; (10.171)

l (b _z)= f (b _z)/[1–F(b _z)]; (10.172)

d (b _z)= l (b _z) × [ l (b _z)– b _z ]. (10.173)

Заметим, что при усечении сверху, т. е. z < b, математическое ожидание и дисперсия переменной у также определяется согласно выражениям (10.169) и (10.170) при l (b _z)=– f (b _z)/ F(b _z).

Из выражения (10.169) следует, что при усечении “снизу” условное математическое ожидание у смещается в направлении корреляции переменных у и z, если усечение проводится “сверху”, то – в направлении противоположном корреляции. Случайное усечение уменьшает дисперсию, т. к. d (b _z) и r ² принадлежат интервалу (0,1).

Рассмотрим два примера, иллюстрирующих случайное усечение.

Предположим, что любая женщина выходит на работу только в том случае, если ее потенциальный доход будет превышать некоторый критический уровень (для каждой женщины свой). Допустим, переменная z_t представляет собой разность между потенциальным и критическим доходом, и зависимость между переменной z_t и влияющими на нее факторами x _t ¹ можно представить следующим образом:

z_t = a ¢× x _t ⁽¹⁾+ e_t ⁽¹⁾, (10.174)

где x _t ⁽¹⁾ – вектор независимых факторов, влияющих на разность доходов (например, возраст, образование, количество детей и т. д.); a – вектор параметров модели; e_t ⁽¹⁾ – ошибка модели.

Для всех женщин, у которых z_t >0, требуется определить желательное количество рабочих часов y_t. Предположим, что зависимость между переменной y_t и влияющими на нее факторами х_t ⁽²⁾ также можно описать линейной эконометрической моделью:

y_t = b ¢× x _t ⁽²⁾+ e_t ⁽²⁾, (10.175)

где x _t ⁽²⁾ – вектор независимых факторов, влияющих на желательное количество рабочих часов (например, семейный статус, количество детей и т. д.); b – вектор параметров модели; e_t ⁽²⁾ – ошибка модели.

Заметим, что вектора x _t ⁽¹⁾ и x _t ⁽²⁾ могут как совпадать, так и отличаться друг от друга.

При формировании модели (10.175) возникает проблема усечения, поскольку данные о часах работы имеются только для работающих женщин, т. е. число часов – случайно усеченная переменная.

В разделе 10.3.1 рассматривалась модель миграции, в которой переменные, влияющие на принятие решения о смене места жительства, были представлены эконометрическими моделями в зависимости от набора соответствующих факторов. В целом модель содержала три уравнения:

чистая прибыль от переезда – N_t ^* = g ¢× w _t +u_t; (10.176)

доходы при переезде – y_t^p = a ¢× x _t^p + e_t^p; (10.177)

доходы при “непереезде” – y_t^m = b ¢× x _t^m + e_t^m. (10.178)

где w _t, x _t^p и x _t^m – вектора независимых переменных, влияющих соответственно на чистую прибыль от переезда, и доходы в случае переезда и “непереезда”; g, a и b – вектора параметров; u_t, e_t^p и e_t^m – ошибки модели.

Предположим, что совокупность мигрантов формируется из числа лиц, желающих переехать, для которых чистая прибыль от переезда положительна. Чистая прибыль от переезда z_t ^*, определяется согласно выражению (10.176) как

z_t ^* = g ¢× w _t +u_t. (10.179)

Для совокупности мигрантов формируется уравнение, связывающее величину их дохода на новом месте у_t с некоторым набором факторов x _t, характеризующих, например, опыт работы, пол, образование и т. д:

у_t = a ¢× x _t + e_t. (10.180)

где a – вектор параметров; e_t – вектор ошибки.

Переменная у_t является случайно усеченной, так как информация о доходе мигранта может быть получена, когда переезд индивидуума на новое место жительства уже осуществился, и индивидуум приступил к работе.

Поскольку доход на новом месте и чистая прибыль от переезда взаимосвязаны, ошибки e_t и u_t моделей (10.179) и (10.180) взаимозависимы. Предположим, что они распределены согласно двумерному нормальному закону с нулевыми математическими ожиданиями и коэффициентом корреляции r. В этом случае в соответствии с выражениями (10.169)–(10.170) получим:

M [ y_t | y_t наблюдаемый доход]= M [ y_t | z_t ^*>0]= M [ y_t | u_t >– g ¢× w _t ]=

= a ¢× x _t + M [ e_t | u_t >– g ¢× w _t ]= a ¢× x _t + r × s_e×l_t (b _u)= a ¢× x _t + a_l×l_t (b_u), (10.181)

где b_u =– g ¢× w _t / s_u и l _t (b_u)= f (g ¢× w _t / s_u)/F(g ¢× w _t / s_u).

Выражение (10.181) показывает, что условное математическое ожидание выборочной совокупности доходов мигрантов при условии z_t >0 находится в непосредственной и опосредованной зависимости от факторов x _t. Непосредственная зависимость выражается слагаемым a ¢× x _t, а опосредованная, характеризующая влияние факторов x _t на вероятность того, что переменная z_t ^* положительна, определяется слагаемым r × s_e×l_t (b_u).

На практике значение переменной z_t ^* не наблюдается, она является латентной. Наблюдаемая переменная z принимает значение 1 (событие произошло) или 0 – в противном случае. В наших примерах: женщина работает или нет, индивидуум мигрирует или нет. С учетом этого представим модель (10.179)–(10.180) в виде совокупности двух следующих моделей:

1. Модели селекции, определяющие выборку мигрантов

z_t ^* = g ¢× w _t+u_t; (10.182)

z_t =1, если z_t ^*>0; (10.183)

z_t =0, если z_t ^*<0; (10.184)

P (z_t =1)=F(g ¢× w _t); (10.185)

P (z_t =0)=1–F(g ¢× w _t). (10.186)

2. Модели дохода мигранта

y_t = a ¢× x _t + e_t. (10.187)

y_t представляет собой значение дохода индивидуума, фактически сменившего место жительства случайную выборку мигрантов, лиц фактически сменивших место жительства, для которого z_t =1.

В соответствии с введенным предположнием о зависимости между ошибками e_t и u_t моделей (10.179) и (10.180) закон их совместного распределения характеризуется характеризуется следующими свойствами:

(u_t, e_t)~ N (0,0,1, s_e, r). (10.188)

Согласно выражению (10.169) условное математическое ожидание y_t при z_t =1определяется согласно выражению:

M [ y_t | z_t =1]= a ¢× x _t + r × s_e × l (g ¢× w _t). (10.189)

⇐ Предыдущая 11 12 13 14 151617 18 19 20 Следующая ⇒

Дата публикования: 2014-10-25; Прочитано: 455 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.013 с)...