Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Тема 7. Статистические методы анализа связи



Признаки, которыми характеризуются единицы совокупности, могут быть взаимосвязанными. Взаимосвязанные признаки могут выступать в одной из ролей:

- роли признака-результата (аналог зависимой переменной (Y) в математике);

- роли признака-фактора, значения которого определяют значение признака-результата (аналог независимой переменной (X) в математике).

Связи в статистике классифицируют по степени тесноты, направлению, форме, числу факторов.

· По степени тесноты связи делят на статистические и функциональные.

Статистическая (стохастическая) связь – это такая связь между признаками, при которой для каждого значения признака-фактора Х признак-результат Y может в определенных пределах принимать любые значения с некоторыми вероятностями; при этом его статистические (обобщающие) характеристики (например, среднее значение) изменяются по определенному закону.

У · · ·

· · ·

· · ·

· · ·

· · · Х

Х1Х2 Х3Х4Х5 Х6

Модель стохастической связи может быть представлена в общем виде уравнением: Y=f(X,u), где Y - фактическое значение результативного;

f(X) - часть результативного признака, сформировавшаяся под воздействием фактора Х (или множества факторов: Y=f(X1,...,Xm);

u - случайная составляющая, часть результативного признака, возникшая вследствие действия прочих (неучтенных) факторов, а также ошибок измерения признаков.

Например, уровень успеваемость студентов по статистике стохастически связан с целым комплексом факторов: склонностью к точным наукам; временем, затраченным на подготовку к предмету; состоянием здоровья студента и др. Полный перечень факторов неизвестен. Кроме того, неодинаково действие любого известного фактора на результат. Например, при одной и той же успеваемости, разные студенты затрачивают неодинаковое время на подготовку. В результате – при одинаковых возможностях наблюдается вариация значений успеваемости студентов.

Корреляционная связь - частный случай статистической связи, при которой с изменением значения признака-фактора Х среднее значение признака-результата Y закономерно изменяется: М(YçX)=f(X) или М(YçX1, X2,.., Xm)=f(X1, X2,...,Xm), m-количество факторов, М (YçX)– условное математическое ожидание.

Понятие «корреляция» было введено английскими статистиками. В переводе оно означает подобие связи (в смысле функциональной связи). Relation по-английски - жестко детерминированная (функциональная) связь.

Противоположной статистической связи является функциональная.

Функциональная связь – такая связь, при которой для каждого значения признака-фактора признак-результат принимает одно или несколько строго определенных значений. Она имеет место, когда все факторы, действующие на результативный признак, известны и учтены в модели и ошибки измерения отсутствуют.

Модель функциональной связи может быть представлена как: Y=f(X).  
У ·

·

·

·

· Х

Х1 Х2 Х3Х4

· По направлению связи делят на прямые и обратные связи.

При прямой связи направление изменения результата совпадает с направлением изменения признака-фактора.

При обратной связи направление изменения результата противоположно направлению изменения признака-фактора.

Например, чем выше квалификация рабочего, тем выше уровень производительности его труда (прямая связь). Чем выше производительность труда, тем ниже себестоимость единицы продукции (обратная связь).

· По форме связи (виду функции f) связи делят на линейные (прямолинейные) и нелинейные (криволинейные) связи.

Линейная связь отображается прямой линией; криволинейная отображается кривой (параболой, гиперболой и т.п.). При линейной связи с возрастанием значения факторного признака происходит равномерное возрастание (убывание) значения результативного признака. При криволинейной связи с возрастанием значения фактора возрастание (убывание) результата происходит неравномерно (гиперболическая форма связи) или же направление его изменения меняется на обратное (параболическая форма связи).

· По количеству факторов, действующих на результат, связи подразделяют на однофакторные (парные) и многофакторные связи.

Порядок изучения статистической связи:

1. Качественный (содержательный) анализ связи. На этом этапе производят предварительный анализ направления и формы связи.

2. Сбор данных (статистическое наблюдение).

3. Эмпирический анализ связи.

4 Количественная оценка тесноты связи (корреляционный анализ).

5. Установление аналитической зависимости между признаками (регрессионный анализ):

5.1. выбор формы связи (вида аналитической зависимости);

5.2. оценка параметров уравнения регрессии;

5.3. оценка качества уравнения регрессии.

3 этап - эмпирический анализ связи состоит в построении группировок (аналитической или комбинационной) и графиков.
Для анализа связи между признаками служат графики: корреляционного поля и эмпирической линии регрессии.

Корреляционное поле – точечный график, построенный в прямоугольной системе координат. Число точек равно числу единиц в совокупности. Каждая точка соответствует единице совокупности и имеет координаты по оси абсцисс – значение признака-фактора Х, а по оси ординат – значение признака-результата Y у данной единицы совокупности.

Для построения эмпирической линии регрессии требуются данные аналитической группировки. Эмпирическая линия регрессия – ломанная, построенная по данным аналитической группировки. Число точек у этой ломаной равно числу групп в аналитической группировке. Координаты точек: по оси Х – значение признака-фактора в группе (или середина интервала, если группировка интервальная), по оси Y – среднее значение признака-результата в группе.

Форма графиков корреляционного поля и эмпирической линии регрессии позволяет делать выводы о направлении, форме и тесноты связи. Если эмпирическая линия регрессии по своему виду приближается к прямой линии, то можно предположить наличие прямолинейной корреляционной связи между признаками. А если линия связи приближается к кривой, то это может быть связано с наличием криволинейной корреляционной связи.

ПРИМЕР. Построим эмпирическую линию регрессии и корреляционное поле по данным о 12 предприятиях розничной торговли для выявления зависимости между 2-умя признаками: y – объем продаж за период и x- численность населения в торговой зоне (тыс.чел.).

Номер предпр.                        
y                        
x 1,7 2,8     3,3   2,5 1,9 2,1 1,9 3,1 1,6

Для построения эмпирической линии регрессии нам потребуются данные аналитической группировки:

Численность населения в торговой зоне (xн j; x вj) Середина интервала Число предприятий Средний по группе объем продаж
[1,6;2) 1,8    
[2; 2,8) 2,4    
[2,8; 3,3] 3,05    
Итого     Х

Результаты построения графиков корреляционного поля и эмпирической линии регрессии представлены на рисунке.

Анализируя эмпирическую линию регрессии и корреляционное поле можно сделать вывод о прямой близкой к линейной зависимости между признаками.





Дата публикования: 2015-01-09; Прочитано: 876 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...