Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Тема 5. СТАТИСТИЧЕСКий анализ связей



Статистические распределения характеризуются наличием более или менее значительной вариации в величине признака у отдельных единиц совокупности. Естественно, возникает вопрос о том, какие же причины формируют уровень признака в данной совокупности и каков конкретный вклад каждой из них.

Вариация каждого изучаемого признака находится в тесной связи и взаимодействии с вариацией других признаков, характеризующих исследуемую совокупность единиц. Например, вариация уровня производительности труда работников предприятий зависит от степени совершенства применяемого оборудования, технологии, организации производства, труда и управления и других самых различных факторов.

При изучении конкретных зависимостей одни признаки выступают в качестве факторов, обусловливающих изменение других признаков. Признаки этой первой группы в дальнейшем будем называть признаками-факторами (факторными признаками );а признаки, которые являются результатом влияния этих факторов, будем называть результативными.

В статистике изучают функциональную и стохастическую зависимости. Функциональная связь характеризуется полным соответствием между изменением факторного признака и изменением результативной величины. Каждому значению признака-фактора соответствуют вполне определенные значения результативного признака. Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, в среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков. Связи между явлениями и их признаками классифицируются по степени тесноты, направлению и аналитическому выражению.

По степени тесноты связи различают:

количественные критерии степени тесноты связи

Величина коэффициента корреляции Характер связи
До практически отсутствует
слабая
умеренная
сильная

По направлению выделяют прямую и обратную связь. Если с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного признака, то связь называется прямой. Если с увеличением или уменьшением значений факторного признака происходит уменьшение или увеличение значений результативного признака, то связь называется обратной.

По аналитическому выражению выделяют:

n прямолинейные (линейные) связи, которые могут быть приблизительно выражены уравнением прямой;

n нелинейные связи, которые выражаются уравнением какой-либо кривой линии.

Корреляционный анализ имеет своей задачей количественное определение тесноты связи между признаками. Важнейшим условием правильного применения методов корреляционного анализа является требование однородности единиц, подвергаемых изучению методами корреляционного анализа. Однородность может быть оценена с помощью коэффициента вариации. Другим важным требованием, обеспечивающим надежность выводов корреляционного анализа, является требование достаточного числа наблюдений. Включаемые в исследование факторные признаки должны быть независимы друг от друга, так как наличие тесной связи между ними свидетельствует о том, что они характеризуют одни и те же стороны изучаемого явления и в значительной мере дублируют друг друга. Все основные положения теории корреляции разрабатывались применительно к предположению о нормальном законе распределения исследуемых признаков. Поэтому целесообразным является изучение формы распределения, дающее возможность в известной мере обосновать правомерность применения методов корреляционного анализа.

Для измерения тесноты связи применяются: линейный коэффициент корреляции, теоретическое корреляционное отношение, индекс корреляции.

Линейный коэффициент корреляции

При расчете этого показателя учитываются величины отклонений индивидуальных значений признака от средней, т.е. соответственно для факторного и результативного признаков величины . Однако непосредственно сопоставлять между собой данные абсолютные величины нельзя. Признаки могут быть выражены в разных единицах, а при одинаковых единицах измерения средние могут быть различны по величине. Сравнению подлежат отклонения, выраженные в долях среднего квадратического отклонения (нормированные отклонения). Рассчитывают среднее произведение нормированных отклонений, которое называется линейным коэффициентом корреляции:

где

Выполнив несложные преобразования, можно получить следующую формулу для расчета линейного коэффициента корреляции:

При пользовании этой формулой отпадает необходимость вычислять отклонения индивидуальных значений признаков от средней величины, что исключает ошибку в расчетах при округлении средних величин.

Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до + 1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи. Прямой зависимости соответствует знак плюс, а обратной зависимости - знак минус. Линейный коэффициент корреляции применяется для измерения тесноты связи только при линейной форме связи. Равенство говорит лишь об отсутствии линейной корреляционной зависимости, но не вообще об отсутствии корреляционной, а тем более статистической зависимости. Величина коэффициента корреляции не является доказательством наличия причинно-следственной связи между исследуемыми признаками, а является оценкой степени взаимной согласованности в изменениях признаков. Установлению причинно-следственной зависимости предшествует анализ качественной природы явлений. Особенно осторожно следует подходить к истолкованию полученных коэффициентов корреляции при незначительных объемах выборочной совокупности.

Пусть по результатам выборочного наблюдения . Объясняется ли это действительно существующей корреляционной связью между признаками в генеральной совокупности или является следствием случайности отбора элементов в выборку?

По вычисленному значению выборочного коэффициента корреляции требуется проверить гипотезу

Н0: коэффициент корреляции в генеральной совокупности равен нулю

при альтернативе

Н1: коэффициент корреляции в генеральной совокупности не равен нулю.

В качестве статистического критерия для гипотезы Н0 обычно используется величина

которая распределена по закону Стьюдента с степенями свободы. Гипотеза Н0 отвергается (т.е. зависимость считается установленной), если превысит допустимое значение при уровне значимости и степенями свободы. Некоторые значения критерия приведены ниже в таблице.

Таблица 11.

Допустимые значения критерия Стьюдента при числе степеней свободы и уровне значимости .

0,05 0,01
  2,10 2,88
  2,09 2,86
  2,09 2,85
  2,08 2,83
  2,07 2,82
  2,07 2,81
  2,06 2,80
  2,06 2,79
  2,06 2,78
  2,05 2,77
  2,05 2,76
  2,05 2,76
  2,04 2,75
  2,02 2,70
  2,00 2,66
  1,98 2,62
1,96 2,58

Коэффициент корреляции достаточно точно оценивает степень тесноты связи лишь в случае линейной зависимости между признаками. При криволинейной зависимости линейный коэффициент корреляции недооценивает степень тесноты связи и даже может быть равен 0, а потому в таких случаях рекомендуется использовать в качестве показателя степени тесноты связи другие величины. Рассмотрим эмпирическое корреляционное отношение .

Согласно правилу сложения дисперсий, общая дисперсия равна сумме средней из групповых и межгрупповой дисперсий:

.

Первая составляющая - межгрупповая дисперсия , характеризует ту часть колеблемости результативного признака, которая складывается под влиянием изменения признака-фактора, положенного в основу группировки. Вариацию, обусловленную влиянием прочих факторов, характеризует средняя из групповых дисперсий .

Зная общую и межгрупповую дисперсии, можно оценить долю, которую составляет вариация под действием фактора в общей вариации результативного признака , т.е. найти отношение .

Извлекая квадратный корень из этого отношения, получим эмпирическое корреляционное отношение

или

Корреляционное отношение равно нулю, когда нет колеблемости в величине средних значений результативного признака по выделенным группам. В тех случаях, когда средняя из групповых дисперсий близка к нулю, т.е. практически вся вариация результативного признака обусловлена действием фактора , величина корреляционного отношения близка к 1. Направление связи мы легко установим по данным групповой таблицы (см. пример …).





Дата публикования: 2015-01-10; Прочитано: 1327 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...