Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Тема 13. Статистическое изучение связей между явлениями



13.1. Типы связей между явлениями, их характеристика

Изучение действительности показывает, что изменение изучаемого признака находитсяв тесной взаимосвязи с другими признаками.

При изучении конкретных зависимостей одни признаки выступают в качестве факторов, обуславливающих изменения других признаков – они называются факторными признаками (Х).

Признаки, которые являются результатом влияния этих факторных признаков, называются результативными признаками (У).

Например: рассматривая зависимость между производительностью труда и квалификацией рабочих, уровень производительности труда является результативным признаком, а квалификация рабочих факторным, т.к. её повышение ведет к росту производительности труда.

Различают два основных вида связей между явлениями.

- функциональные связи характеризуются полнымсоответствием между изменением факторного и результативного признака (каждому значению признака – фактора соответствует вполне определенные значения результативного признака)

y =f(x).

Примером функциональной связи является зависимость длины окружности (L) от радиуса (r).

L = 2Пr.

- корреляционные связи, при которых между изменением факторного и результативного признаков нет полного соответствия, воздействия отдельных факторов проявляется лишь в среднем при массовомнаблюдении, фактических данных.

В простейшем случае применения корреляционной зависимости величина результативного признака рассматривается как следствие изменения только одного фактора (например: рост квалификации рабочих рассматривается как причина роста производительности труда).

Однако выделенный в данном примере в качестве основного признак – фактор не является единственной причиной изменения результативного признака, а на ряду с ним на величину результативного признака влияет множество других причин (в частности на производительность труда влияет уровень энерговооруженности, механизации и автоматизации производства).

При наличии корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного признака.

Объяснения этому – сложность взаимосвязей между анализируемыми факторами, взаимодействие которых влияют неучтенные, случайные величины. Поэтому связь появляется лишь в среднем, в массе случаев.

При корреляционной связи каждому значению аргумента (х -признака фактора).

Соответствует случайно распределенные в некотором интервале значения функции (у – признака результата).

Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесенных удобрений. Очевидно, что удобрения участвуют в формировании урожая, для конкретного поля участии одного и того же количества удобрений вызовет разный прирост урожайности, так как во взаимодействии находится ещё целый ряд факторов (погода, состояние почвы и т. д.), которые формируют урожай. Однако в среднем такая связь наблюдается увеличение массы внесенных, удобрений ведет к росту урожайности.

Виды взаимосвязей:

a) По направлению связи делятся на:
- прямые – когда зависимая переменная растёт с увеличением факторного признака (положительная связь)
- обратные, когда рост факторного признака ведёт к уменьшению результативного (отрицательная связь)

б) По степени тесноты:

Величина коэффициента корреляции Характер связи
До Отсутствует
- Слабая
- Умеренная
- Сильная

в) По аналитическому выражению:
- линейные
- криволинейные.

Задачи статистики в изучении связей между явлениями заключается в следующем:

1. количественная оценка наличия и направления связи;

2. характеристика формы влияния одних факторов на другие (изменение степени тесноты корреляционной связи);

3. нахождение аналитического выражения связи (построение уравнений регрессии или корреляционно-регрессионных моделей);

4. оценка соответствия полученных моделей и их практическое использование.

13.2. Методы выявления наличия корреляционной связи между двумя признаками

Для ответа на вопрос о наличии или отсутствии корреляционной связи используется ряд методов:

- параллельное сопоставление рядов значений результативного и факторного признаков, является простейшим приёмом. Значения факторного признака располагаются в возрастающем порядке, а затем прослеживают направление изменения величины результативного признака;

Однако наличие большого числа различных значений результативного признака, соответствующих одному и тому же значению признака-фактора, затрудняет восприятие таких параллельных рядов. В таких случаях для установления связи – пользуются статистическими таблицами – корреляционными и групповыми.

Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков.

При этом факторный признак (х), как правило, имеет конкретные значения и располагается в строках; а результативный признак (y) представлен в виде интервалов и располагается в столбцах таблицы.

Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту построения данного сочетания значений Х и Y.

Такая корреляционная таблица уже при общем знакомстве даёт возможность:

- определить наличие или отсутствие связи;

- выяснить её направление.

Если частоты в корреляционной таблице расположены по диагонали из левого верхнего угла в правый нижний (т.е. большим значениям фактора соответствуют большие значения результата), то можно предположить наличие прямой корреляционной зависимости между признаками.

Если же частоты располагаются с правого верхнего угла к левому нижнему, то предполагают наличие обратной связи.

Построение групповой таблицы также начинают с группировки. По каждой группе вычисляют средние значения результативного признака, и дальше происходит сопоставление полученных данных.

- Графический метод применяется для:

· Предварительного выявления наличия или отсутствия связи;

· Определения характера и формы связи.

Используя данные об индивидуальных значениях признака-фактора и соответствующих значениях результативного признака, можно построить в прямоугольных осях точечный график, который называется поле корреляции.

Определив среднее значение точек, можно построить линию, которая является эмпирической линией связи.

Если эмпирическая линия связи приближается к прямой линии связи, то возможно наличие прямолинейной линии корреляционной связи между признаками.

Если к какой-либо кривой, то возможна криволинейная корреляционная связь.

13.3. Измерение степени тесноты корреляционной связи между двумя признаками

Понятно, что одни факторы влияют сильнее, другие слабее на результативный признак.

Характеристика силы воздействия одних факторов на другие даётся при помощи показателей степени тесноты корреляционной связи между двумя признаками, к ним относятся:

· Коэффициент корреляции знаков;

· Линейный коэффициент корреляции;

· Коэффициент корреляции рангов

а) Коэффициент корреляции знаков

, где

- число совпадений знаков отклонения индивидуальных величин от средней факторного и результативного признаков;

- число несовпадений знаков отклонений.

б) Линейный коэффициент корреляции является более совершенным показателем степени тесноты связи. При расчёте этого показателя учитываются не только знаки отклонений, но и сами величины таких отклонений.

Есть много вариантов этой формулы.

Много учёных занималось вопросами корреляции и в целом стохастических зависимостей (проявляется в массе случаев).

Множественная корреляция.

Коэффициент множественной корреляции: , где

- общая дисперсия фактических данных результативного признака, т.е. дисперсия y.

- остаточная дисперсия, характеризующая вариацию y за счёт факторов не включённых в уравнение регрессии.

- отражает тесноту связи между вариацией зависимой переменной и вариациями всех включённых в анализ независимых переменных

0< <1 чем ближе к 1, тем более сильная связь, к 0 - не все факторы учтены, не подходящая форма уравнения.

в) Коэффициент корреляции рангов (коэффициент связи качественных признаков)

Позволяет измерить тесноту связи между качественными признаками, которые не поддаются выражению числом. Каждой единице совокупности присваивается порядковый номер в ряду, который будет упорядочен по уровню признака. Таким образом, ряд значений ранжируется, а номер каждой отдельной единицы будет её рангом.

Можно получить представление, о корреляционной связи сопоставляя ранги факторного и результативного признаков. Метод Спирмена и метод Кенделла.

13.4. Уравнения регрессии, их виды

Изучение корреляционных зависимостей основывается на исследовании таких связей между переменными, при которых значение одной переменной, которую можно применять за зависимую переменную «в среднем» изменяется в зависимости от того, какие значения принимает другая переменная, рассматриваемая, как причина по отношению к зависимой переменной.

Изучение зависимостей ведёт к поиску аналитических связей в виде формул (т.е. функций, который записываются составлением уравнений регрессии).

А на графическом поле строится теоретическая линия регрессии это та линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление, основную тенденцию связи.

Наиболее часто для характеристики связей экономических явлений используются такие типы функций:

Линейную:

Гиперболическую:

Показательную:

Степенную:

13.5. Корреляционно-регрессивные модели (КРМ),

их применение в анализе и прогнозе

На практике чаще всего изменение изучаемого признака зависит от действия нескольких причин. В таких случаях изменение корреляционной связи не может ограничиться парными зависимостями, и в анализ необходимо включить другие признаки-факторы существенно влияющие на изучаемую переменную.

Отбор факторов для построения многофакторных моделей производится на основе качественного и количественного анализа социально-экономических явлений с использованием статистических критериев.

Корреляционно-регрессивной моделью системы взаимосвязанных признаков является такое уравнение регрессии, которое включает основные факторы.

Построение многофакторных регрессионных моделей позволяет дать количественное описание основных закономерностей изучаемых явлений, выделить существенные факторы, обуславливающие изменение экономических показателей, и оценить их влияние.

Полученные модели в основном используются в двух направлениях:

· Для сравнительного анализа

· В прогнозировании

Возможность применения методов корреляционно-регрессивного анализа ещё в недалёком прошлом сдерживалась высокой трудоёмкостью необходимых расчётов. Сегодня широкое распространение получили пакеты прикладных программ по статистике, ликвидировав эти ограничения.

С целью расширения возможностей экономического анализа используют коэффициент эластичности:

, где

- среднее значение факторного признака

- среднее значение результативного признака

- коэффициент регрессии при соответствующем факторном признаке.

Показывает на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака.

- устанавливают как справочную величину.

Следует различать функциональные и корреляционные связи. В отличие от функциональной зависимости, при которой каждому значению одной переменной строго соответствует одно определённое значение другой переменной, зависимость, при которой одному значению переменной (х) может соответствовать (в силу наслоения действия других причин) множество значений другой переменной (y), называют корреляционной. Корреляционная зависимость проявляется лишь на основе массового наблюдения.

Примером корреляционной зависимости может служить зависимость производительности труда от стажа работы рабочих, зависимость урожайности от срока сева, зависимость годового удоя коров от количества отёлов и т.п.

Наиболее простым случаем корреляционной зависимости является парная корреляция, т.е. зависимость между двумя признаками (результативными и одним из факторных).

Основными задачами при изучении корреляционных зависимостей являются:

1. отыскание математической формулы, которая бы выражала эту зависимость y от x

2. измерение тесноты такой зависимости.

Решение первой задачи, т.е. определение формы связи с последующим отысканием параметров уравнения, называется нахождением уравнения связи (уравнения регрессии). Показатели, рассматриваемые как функция х, обозначают (читается: «игрек, выровненный по икс»).

Возможны различные формы связи:

1. прямолинейная:

2. криволинейная в виде:
а) параболы второго порядка (или высших порядков)
б) гиперболы
в) показательной функции и т.д.

Параметры для всех уравнений связи чаще всего определяют из так называемой системы нормальных уравнений, отвечающих требованию «метода наименьших квадратов» (МНК). Это требование можно записать как или, при линейной зависимости, т.е. требуется определить, при каких значениях параметров и сумма квадратов отклонений y от будет минимальной. Найдя частные производные указанной суммы по и и приравняв их к нулю, легко записать систему уравнений, решение которой и дают параметры искомой функции, т.е. уравнения регрессии.

Так, система нормальных уравнений при линейной зависимости имеет вид:

Если связь выражена параболой второго порядка

,

то система нормальных уравнений для отыскания параметров , , выглядит следующим образом:

Вторая задача – измерение тесноты зависимости – для всех форм связи может быть решена с помощью исчисления теоретического корреляционного отношения :

где

- дисперсия в ряду выравненных значений
результативного показателя ;

- дисперсия в ряду фактических значений y.

Так как дисперсия отражает вариацию в ряду только за счёт вариации фактора x, а дисперсия отражает вариацию y за счёт всех факторов, то их отношение, именуемое теоретическим коэффициентом детерминации, показывает, какой удельный вес в общей дисперсии ряда y занимает дисперсия, вызываемая вариацией фактора х. квадратный корень из отношения этих дисперсий даёт нам теоретическое корреляционное отношение. Если = , то это означает, что роль других факторов в вариации y сведена на нет, и отношение:

означает полную зависимость вариации y от х.

Если =0, то это означает, что вариация х никак не влияет на вариацию y, и в этом случае .

Следовательно, максимальное значение, которое может принимать корреляционное отношение, равно 1, минимальное значение – 0.

Математически легко доказывается, что в случае линейной зависимости корреляционное отношение может быть заменено выражением которое называют линейным коэффициентом корреляциии обозначают r, т.е. где - коэффициент регрессии в уравнении связи, и - соответственно среднее квадратическое отклонение в ряду x и в ряду y.

Линейный коэффициент корреляции можно выразить и другими формулами, тождественными первой, в частности:

или а также

Линейный коэффициент корреляции может принимать по модулю значения от 0 до 1 (знак «+» при прямой зависимости и знак «-» при обратной зависимости).

Рассмотрим решение задачи по этой теме.

Задача 1

Пусть по 10 однотипным предприятиям имеются следующие данные о выпуске продукции (х) в тыс. ед. и о расходе условного топлива (y) в тоннах (графы 1 и 2 таблицы).

Требуется найти уравнение зависимости расхода топлива от выпуска продукции (или уравнение регрессии y по x) и измерить тесноту зависимости между ними.

Решение.

А.рассматривая уравнение регрессии в форме линейной функции вида , параметры данного уравнения ( и ) найдём из системы нормальных уравнений

X y x2 xy =1,16+0,547x y2
           
            3,9 4,4 5,5 5,5 6,6 6,6 8,8 12,1 12,1 14,3  
           

Необходимые для решения суммы , , рассчитаны выше в таблице. Подставляем их в уравнения и решаем систему:

Отсюда

Подставляя в это уравнение последовательно значения х =5,6,8,10 и т.д., получаем выравненные (теоретические) значения результативного показателя (графа 5 таблицы).

Поскольку параметры уравнения регрессии являются оценочными, то для каждого из них рассчитывается средняя ошибка, т.е. .

Конкретный расчёт ошибок для и по данным нашего примера приведён далее.

Б. Для измерения тесноты зависимости между y и x воспользуемся прежде всего линейным коэффициентом корреляции (поскольку зависимость рассматривалась линейно):

а) применяем формулу .

Находим

Определяем , предварительно найдя и

Отсюда

Значение линейного коэффициента корреляции (т.е. близкое к единице) характеризует не только меру тесноты зависимости вариации y от вариации x, но и степень близости этой зависимости к линейной;

б) воспользуемся ещё одной формулой линейного коэффициента корреляции:

т.е. результат тот же.

При расчёте коэффициента корреляции очень важно оценить его значимость. Оценка значимости (существенности) линейного коэффициента корреляции основана на сопоставлении значения r с его средней квадратической ошибкой ().

Средняя ошибка коэффициента корреляции при n >50 рассчитывается приближённо по формуле

Если при этом коэффициент корреляции r превышает свою среднюю ошибку больше чем в 3 раза, т.е. если то он считается значимым, а связь - реальной.

При n <30 значимость коэффициента корреляции проверяется на основе t -критерия Стьюдента. Для этого рассчитывается фактическое (расчётное) значение критерия:

Которое сопоставляется с определяемым по Приложению 9, для числа степеней свободы и заданного уровня значимости (обычно ).

Если > r считается значимым, а связь – реальной. Если

< то считается, что связь между x и y отсутствует и значение r, отличное от нуля, получено случайно.

В рассматриваемом примере средняя ошибка коэффициента корреляции

а

По таблице приложений находим, что при числе степеней свободы и уровне табличное (критическое, пороговое) t равно 2,306, т.е. =2,306.

Поскольку фактическое (расчётное) t больше табличного, т.е. > то линейный коэффициент корреляции r=0,96 считается значимым, а связь между x и y – реальной.

Контрольные вопросы к теме:

1. Какие признаки являются результативными, факторными.

2. Какие два основных вида связей между явлениями различают. Объясните их суть.

3. Расскажите классификацию взаимосвязей.

4. В чем заключаются задачи статистики при изучении связей между явлениями.

5. Расскажите, какие вы знаете методы выявления наличия корреляционной связи между двумя признаками.

6. При помощи, каких показателей дается характеристика силы воздействия одних факторов на другие.

7. Расскажите о коэффициенте множественной корреляции.

8. Что такое «корреляционно-регрессивные модели» и каково их применение в анализе и прогнозе.

9. Расскажите о линейном коэффициенте корреляции.

10. В чем суть метода наименьших квадратов.

Библиографический список

1. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. 5-е изд., перераб. и доп. М.: Финансы и статистика, 2004.

2. Ефимова М.Р., Петрова Е.В., Румянцева В.Н. Общая теория статистики: Учебник. – 2-е изд., испр. и доп. – М.: ИНФРА-М, 2000. – 416 с.

3. Общая теория статистики: Учебник / Под ред. О.Э. Башиной, А.А. Спирина, 5-е изд. М., 1999.

4. Практикум по теории статистики: Учеб. пособие / Под ред. Р.А. Шмойловой. М.: Финансы и статистика, 1999.

5. Сиденко А.В., Попов Г.Ю., Матвеева В.М. Статистика: Учебник. М., 2000.

6. Социальная статистика: Учебник / Под ред. И.И. Елисеевой. 3-е изд., перераб. и доп. М.: Финансы и статистика, 2003.

7. Статистика товаров и услуг: Учебник / Под ред. И.К. Белявского. М., 2002.

8. Статистика: Учебник / Под ред. В.С. Мхитаряна. М.: Экономист, 2005

9. Теория статистики: Учебник/Под ред. профессора Г.Л. Громыко. – М.: ИНФРА-М, 2000. – 414 с.

10. Экономика и статистика фирм / Под ред. С.Д. Ильенковой. М., 2000





Дата публикования: 2015-01-09; Прочитано: 8151 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.026 с)...