Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Тема. КОРРЕЛЯЦИЯ



Еще Гиппократ обратил внимание на то, что между телосложением и темпераментом людей, между строением их тела и предрасположенностью к заболеваниям существует определенная связь.
Чаще всего рассматриваются простейшие ситуации, когда в ходе исследования измеряют значения только одного варьирующего признака генеральной совокупности. Остальные признаки либо считаются постоянными для данной совокупности, либо относятся к случайным факторам, определяющим варьирование исследуемого признака. Как правило, исследования в спорте значительно сложнее и носят комплексный характер. Например, при контроле за ходом тренировочного процесса измеряется спортивный результат, и одновременно может оцениваться целый ряд биомеханических, физиологических, биохимических и других параметров (скорость и ускорения общего центра масс и отдельных звеньев тела, углы в суставах, сила мышц, показатели систем дыхания и кровообращения, объем физической нагрузки и энергозатраты организма на ее выполнение и т. д.). При этом часто возникает вопрос о взаимосвязи отдельных признаков. Например, как зависит спортивный результат от некоторых элементов техники спортивных движений? как связаны энергозатраты организма с объемом физической нагрузки определенного вида? насколько точно по результатам выполнения некоторых стандартных упражнений можно судить о потенциальных возможностях человека в конкретном виде спортивной деятельности? и т. п. Во всех этих случаях внимание исследователя привлекает зависимость между различными величинами, описывающими интересующие его признаки.
Этой цели служит математическое понятие функции, имеющее в виду случаи, когда определенному значению одной (независимой) переменной Х, называемой аргументом, соответствует определенное значение другой (зависимой) переменной Y, называемой функцией. Однозначная зависимость между переменными величинами Y и X называется функциональной, т.е. Y = f(X) (“игрек есть функция от икс”).
Например, в функции Y = 2X каждому значению X соответствует в два раза большее значение Y. В функции Y = 2X2 каждому значению Y соответствует 2 определенных значения X. Графически это выглядит так (рис.1.1, 1.2 соответственно):


Рис.1.1. Рис.1.2.

Но такого рода однозначные или функциональные связи между переменными величинами встречаются не всегда. Известно, например, что между ростом (длиной тела) и массой человека существует положительная связь: более высокие индивиды имеют обычно и большую массу, чем индивиды низкого роста. То же наблюдается и в отношении качественных признаков: блондины, как правило, имеют голубые, а брюнеты — карие глаза. Однако из этого правила имеются исключения, когда сравнительно низкорослые индивиды оказываются тяжелее высокорослых, и среди населения хотя и нечасто, но встречаются кареглазые блондины и голубоглазые брюнеты. Причина таких “исключений” в том, что каждый биологический признак, выражаясь математическим языком, является функцией многих переменных; на его величине сказывается влияние и генетических и средовых факторов, в том числе и случайных, что вызывает варьирование признаков.

Во многих задачах теплотехнического характера требуется установить и оценить зависимость одной случайной величины от другой или нескольких других или нескольких других. Две случайные величины могут быть связаны либо функциональной зависимость, либо статистической, либо быть независимыми.

Статистической называют зависимость, при которой изменение одной из величин влечёт за собой изменение распределения другой. Если при изменении одной из величин изменяется среднее значение другой, то статистическая зависимость называется корреляционной.

Корреляционная связь между признаками может быть линейной и криволинейной (нелинейной), положительной и отрицательной.
Прямая корреляция отражает однотипность в изменении признаков: с увеличением значений первого признака увеличиваются значения и другого, или с уменьшением первого уменьшается второй.
Обратная корреляция указывает на увеличение первого признака при уменьшении второго или уменьшение первого признака при увеличении второго.
Например, больший прыжок и большее количество тренировок — прямая корреляция, уменьшение времени, затраченного на преодоление дистанции, и большее количество тренировок — обратная корреляция.

В целях краткости изложения будем рассматривать только дискретные случайные величины, хотя все приводимые понятия легко переформулировать для непрерывных случайных величин. Принято случайные величины обозначать заглавными буквами латинского алфавита X, Y, Z, а их соответствующие конкретные значения x, y, z – малыми буквами.

При обработке экспериментальных данных необходимо установить зависимость между случайными величинами и . В большинстве случаев эта зависимость линейная или линейное приближение по среднеквадратичному критерию.

Корреляционное поле и корреляционная таблица являются исходными данными при корреляционном анализе. Пусть , , …, – результаты парных наблюдений над случайными величинами Х и Y. Изображая полученные результаты в виде точек в декартовой системе координат,получим корреляционное поле. По характеру расположения точек поля можно составить предварительное представление о форме зависимости случайных величин.

Элементы выборки наносятся на плоскость в виде точек с координатами , , …, - получится диаграмма рассеивания.

На диаграмму рассеивания наносят прямоугольную сетку с длинами разрядов группировки по и по ( и ).

Для заполнения корреляционной таблицы определяют количество точек ( - номер строки, а - номер столбца), попавших в каждую клетку сетки (точки, попавшие на границы, разносятся по в каждую клетку, а попавшие в узел – по ).

Для системы двумерных случайных величин рассмотрим приближённое представление величины в виде линейной функции величины (условное среднее ) и наоборот ():

где - оптимальные оценки неизвестных параметров определяются методом наименьших квадратов.

Линейная среднеквадратическая регрессия имеет вид:

,

.

Отсюда получаем , , , .

называется коэффициентом регрессии на , а - коэффициентом регрессии на .

и называют прямыми линиями среднеквадратичной регрессии между случайными величинами и , а точку, через которую проходят обе прямые (координаты этой точки ), называют центром совместного распределения величин.

Коэффициент корреляции определяется по формуле: .

Для удобства расчёта оценки коэффициента введем в корреляционную таблицу значения отклонений представителей разрядов от среднего значения, т.е. и .

Суммирование в формуле осуществляем по столбцам (), а затем по строкам ().

Корреляционная таблица

  l
   
     
           
   
           
r    
         
         

Коэффициент корреляции, характеризующий связь между двумя случайными величинами, в случае линейной корреляции между ними по модулю меньше или равен 1. Чем ближе к 1, тем теснее связаны случайные величины и . Если , то между случайными величинами линейная функциональная зависимость, если , то и - независимы.

Выборочный коэффициент корреляции является оценкой коэффициента корреляции генеральной совокупности и поэтому служит для измерения линейной связи между величинами – количественными признаками и . Если выборочный коэффициент корреляции, найденный по выборке, оказался отличным от нуля, то нельзя заключить, что коэффициент корреляции генеральной совокупности также отличен от нуля, так как выборка отобрана случайно. Возникает необходимость проверить гипотезу о значимости выборочного коэффициента корреляции.

Определив параметры регрессии, прямые линии регрессии наносят на диаграмму рассеивания и делают вывод о корреляционной зависимости между величинами и .

Линия регрессии даёт наглядное изображение «в среднем» случайной величины от значения случайной величины .





Дата публикования: 2015-01-10; Прочитано: 452 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...