Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

ТЕМА 14



МЕТОДЫ ИЗУЧЕНИЯ СВЯЗЕЙ МЕЖДУ ЭКОНОМИЧЕСКИМИ ЯВЛЕНИЯМИ

Метод взаимосвязанных параллельных рядов

Этот метод известен в статистике под названием метода сравнения параллельных рядов. Он заключается в установлении связей между экономическими явлениями и процессами посредством сопоставления двух или нескольких рядов показателей.

Сначала показатели, касающиеся факторного признака, располагаются в восходящем или нисходящем порядке в зависимости от исследуемого явления или процесса, затем производится параллельная запись показателей результативного признака.

Путем сравнения расположенных таким образом значений признака выявляются существование связей и их направление.

Метод аналитической группировки

Метод аналитической группировки считается одним из основных методов изучения связей между экономическими явлениями. Процесс установления связей между экономическими явлениями начинается с группировки единиц совокупности по факторному признаку. Затем приступают к вычислению синтетических показателей (относительных и средних величин) для результативного признака по группам, на которые была разбита совокупность.

Различие между результативными и факторными признаками относительно: один и тот же признак в зависимости от исследуемого явления может быть результативным или факторным. Например, урожайность в зависимости от уровня агротехники является результативным признаком, в то же время она является факторным признаком при изучении себестоимости продукции.

В изучении массовых явлений хозяйственной деятельности предприятий первостепенное значение имеет оценка общих итогов деятельности, различий в достигнутых результатах по предприятиям и т. п. Эту задачу решают аналитические группировки по результативному признаку. Они позволяют установить различия в полученных результатах, отделить передовое от отстающего, оценить связь результатов с комплексом факторов.

При группировке необходимо выбрать такие признаки, которые позволяют разделить совокупность на группы качественно однородные внутри себя и различные между собой. Выделение групп можно вести сразу по нескольким качественно различным признакам или по одному признаку, в величине которого имеются качественные переходы.

Имеется ряд указаний по вопросу отбора признаков, которые сводятся к следующему:

1. Необходимо брать типичные, существенные признаки изучаемого явления в соответствии с целями проводимой статистической работы.

2. При выборе группировочных признаков должны быть приняты во внимание конкретные условия места и времени, так как одни и те же признаки в одних условиях могут быть положены в основу группировки, а в других условиях не годятся для этой цели.

3. При изучении сложных явлений группировку следует проводить не по одному, а по нескольким признакам, так как это дает возможность более полно охарактеризовать изучаемое явление.

Группировки по одному признаку называются простыми, а по нескольким – комбинированными. В отличие от нескольких простых комбинированная аналитическая группировка позволяет выявить не только влияние каждого из факторов на результат, но и влияние сочетания этих факторов. Иными словами, комбинированная группировка покажет, при каком сочетании группировочных признаков можно получить наилучший эффект.

От выбора группировочного признака в ряде случаев зависит решение вопроса о том, какие конкретно могут быть образованы группы. Так, при выборе в качестве группировочных некоторых атрибутных признаков (т. е. имеющих качественные оценки) можно образовать лишь ограниченное число вполне определенных групп. Например, при группировке населения страны по полу или с выделением сельского и городского населения можно выделить только две группы.

Как известно, многие атрибутные признаки имеют большое количество разновидностей, например сотни и тысячи профессий, болезней, сортов растений, пород животных и т. д. При группировке совокупностей по такого рода признакам обычно родственные разновидности признака объединяются в подгруппы по заранее установленной номенклатуре, классификации. Например, при распределении населения по профессиям в качестве особой подгруппы выделяют профессию «слесарь», в которую включают слесарей-сборщиков, лекальщиков, инструментальщиков, водопроводчиков и т. п.

Классификация несколько отличается от номенклатуры.

Классификация – это обычно твердо установленное распределение явлений и объектов на классы, разряды (например, классификация: сельскохозяйственных культур, оборудования, скота по видам и т.п.).

Номенклатуры и классификации разрабатываются органами статистики и рассчитаны на применение в течение длительного времени.

При группировке по количественным признакам изучаемую совокупность расчленяют по величине признака. Группировка является несложной, когда признак варьирует в узких пределах и имеет ограниченное число значений. Если признак варьирует значительно и совокупность большая, то возникает вопрос об определении интервала группировки. Интервалы могут быть равными – их можно определить по формуле:

и неравными.

Обычно трудности возникают при группировке по количественным признакам (урожайность, продуктивность, производительность труда, себестоимость продукции и т. д.), когда за количественными изменениями необходимо установить качественные переходы. Такие переходы вначале необходимо установить путем предварительной оценки величины признаков, сравнивая их с нормативными, плановыми. Например, при группировке по признакам, для которых установлены плановые задания, необходимо выделить группы единиц с недовыполнением, выполнением и перевыполнением плана. При группировке по себестоимости – с уровнем себестоимости продукции выше и ниже закупочных цен и т. д. При образовании групп необходимо также учитывать то обстоятельство, что для получения надежных обобщающих показателей необходимы массовые данные. Поэтому при небольшом объеме изучаемой совокупности следует выделять группы с таким расчетом, чтобы в каждую из них попало достаточное число единиц. Иногда целесообразно производить вторичную группировку. Процесс образования новых групп на основе ранее проведенной группировки называется вторичной группировкой; к ней прибегают в том случае, если имеющаяся группировка не удовлетворяет требованиям анализа. Например, если при группировке рабочих по стажу на одном предприятии выделено семь групп с одними интервалами, а на другом – пять групп с другими интервалами, то данные о распределении рабочих, фонда зарплаты и других показателей по первому предприятию будут несопоставимы с данными по второму. Чтобы привести данные к сопоставимому виду, надо произвести вторичную группировку, выделить по обоим предприятиям одно и то же число групп с одними и теми же интервалами.

Получение новых групп на основании имеющихся возможно двумя способами:

1. перегруппировкой по величине интервалов первичной группировки, как было уже сказано ранее;

2. перегруппировкой по удельному весу отдельных групп в общем их итоге.

Экономические явления, как и связи между ними, чрезвычайно сложны и многообразны. Поэтому простая группировка может дать характеристику только одной стороны изучаемого явления. Комбинационная группировка может дать характеристику более полную, позволяет изучить экономические явления и их взаимосвязи. Однако и она не в состоянии выразить всю сложность экономических явлений. Для этих целей следует использовать систему группировок, состоящую из взаимосвязанных, рационально составленных групповых и комбинационных таблиц, в основу которых положена целая система признаков и их комбинаций, отражающих существенные стороны изучаемого явления.

Однако следует помнить, что разработка системы статистических группировок невозможна без глубокого знания сущности изучаемого явления.

Аналитические группировки позволяют изучить наличие и направление связи между экономическими явлениями, если они осуществлялись по существенным признакам.

Существенность связи между признаками доказывается на основе применения дисперсионного метода.

Метод дисперсионного анализа

Как было уже отмечено, дисперсионный метод тесно связан со статистическими группировками и предполагает, что изучаемая совокупность подразделена на группы по факторным признакам, влияние которых должно быть изучено.

На основе дисперсионного анализа производится:

1. оценка достоверности различий в групповых средних по одному факторному признаку или нескольким;

2. оценка достоверности взаимодействий факторов;

3. оценка частных различий между парами средних.

В основе применения дисперсионного анализа лежит закон разложения дисперсий (вариаций) признака на составляющие.

Общая вариация Dо результативного признака при группировке может быть разложена на следующие составные части:

1. на межгрупповую Dм связанную с группировочным признаком;

2. на остаточную (внутригрупповую) DB, не связанную с группировочным признаком.

Соотношение между этими показателями выражается следующим образом:

Dо = Dм + Dв. (1.30)

Рассмотрим применение дисперсионного анализа на примере.

Допустим, требуется доказать, влияют ли сроки посева на урожайность пшеницы. Исходные опытные данные для дисперсионного анализа представлены в табл. 8.

Таблица 8

В данном примере N = 32, K = 4, l = 8.

Определим общую суммарную вариацию урожайности, которая представляет собой сумму квадратов отклонений индивидуальных значений признака от общей средней:

где N – число единиц совокупности; Yi – индивидуальные значения урожайности; Yo – общая средняя урожайности по всей совокупности.

Для определения межгрупповой суммарной вариации, определяющей вариацию результативного признака за счет изучаемого фактора, необходимо знать средние значения результативного признака по каждой группе. Эта суммарная вариация равна сумме квадратов отклонений групповых средних величин от общей средней величины признака, взвешенной на число единиц совокупности в каждой из групп:

Внутригрупповая суммарная вариация равна сумме квадратов отклонений индивидуальных значений признака от групповых средних по каждой группе, суммированной по всем группам совокупности.

Влияние фактора на результативный признак проявляется в соотношении между Dм и Dв: чем сильнее влияние фактора на величину изучаемого признака, тем больше Dм и меньше Dв.

Для проведения дисперсионного анализа нужно установить источники варьирования признака, объем вариации по источникам, определить число степеней свободы для каждой компоненты вариации.

Объем вариации уже установлен, теперь необходимо определить число степеней свободы вариации. Число степеней свободы – это число независимых отклонений индивидуальных значений признака от его среднего значения. Общее число степеней свободы, соответствующее общей сумме квадратов отклонений в дисперсионном анализе, разлагается по составляющим вариации. Так, общей сумме квадратов отклонений Dо соответствует число степеней свободы вариации, равное N – 1 = 31. Групповой вариации Dм соответствует число степеней свободы вариации, равное K – 1 = 3. Внутригрупповой остаточной вариации соответствует число степеней свободы вариации, равное N – K = 28.

Теперь, зная суммы квадратов отклонений и число степеней свободы, можно определить дисперсии для каждой составляющей. Обозначим эти дисперсии: dм– групповые и dв – внутригрупповые.

После вычисления этих дисперсий приступим к установлению значимости влияния фактора на результативный признак. Для этого находим отношение: dM /dB = Fф,

Величина Fф, называемая критерием Фишера, сравнивается с табличным, Fтабл. Как уже было отмечено, если Fф > Fтабл, то влияние фактора на результативный признак доказано. Если Fф < Fтабл то можно утверждать, что различие между дисперсиями находится в пределах возможных случайных колебаний и, следовательно, не доказывает с достаточной вероятностью влияние изучаемого фактора.

Теоретическая величина связана с вероятностью, и в таблице ее значение приводится при определенном уровне вероятности суждения. В приложении имеется таблица, позволяющая установить возможную величину F при вероятности суждения, наиболее часто используемой: уровень вероятности «нулевой гипотезы» – 0,05. Вместо вероятностей «нулевой гипотезы» таблица может быть названа таблицей для вероятности 0,95 существенности влияния фактора. Повышение уровня вероятности требует для сравнения более высокого значения Fтабл.

Величина Fтабл зависит также от числа степеней свободы двух сравниваемых дисперсий. Если число степеней свободы стремится к бесконечности, то Fтабл стремится к единице.

Таблица значений Fтабл построена следующим образом: в столбцах таблицы указаны степени свободы вариации для большей дисперсии, а в строках – степени свободы для меньшей (внутригрупповой) дисперсии. Величина F находится на пересечении столбца и строки соответствующих степеней свободы вариации.

Так, в нашем примере Fф = 21,3/3,8 = 5,6. Табличное же значение Fтабл для вероятности 0,95 и степеней свободы, соответственно равных 3 и 28, Fтабл = 2,95.

Значение Fф полученное в опыте, превышает теоретическое значение даже для вероятности 0,99. Следовательно, опыт с вероятностью более 0,99 доказывает влияние изучаемого фактора на урожайность, т. е. опыт можно считать надежным, доказанным, а значит, сроки посева оказывают существенное влияние на урожайность пшеницы. Оптимальным сроком посева следует считать период с 10 по 15 мая, так как именно при этом сроке посева получены наилучшие результаты урожайности.

Нами рассмотрена методика дисперсионного анализа при группировке по одному признаку и случайному распределению повторностей внутри группы. Однако часто бывает так, что опытный участок имеет какие-то различия в плодородии почвы и т. д. Поэтому может возникнуть такая ситуация, что большее число делянок одного из вариантов попадет на лучшую часть, и его показатели будут завышены, а другого варианта – на худшую часть, и результаты в этом случае, естественно, будут хуже, т. е. занижены.

Чтобы исключить варьирование, которое вызывается не относящимися к опыту причинами, надо из внутригрупповой (остаточной) дисперсии вычленить дисперсию, рассчитанную по повторностям (блокам).

Общая сумма квадратов отклонений подразделяется в этом случае уже на 3 составляющие:

Dо = Dм + Dповт + Dост. (1.33)

Для нашего примера сумма квадратов отклонений, вызванная повторностями, будет равна:

Стало быть, собственно случайная сумма квадратов отклонений будет равна:

Dост = Dв – Dповт; Dост= 106 – 44 = 62.

Для остаточной дисперсии число степеней свободы будет равно 28 – 7 = 21. Результаты дисперсионного анализа представлены в табл. 9.

Таблица 9

Поскольку фактические значения F-критерия для вероятности 0,95 превышают табличные, то влияние сроков посева и повторностей на урожайность пшеницы следует считать существенным. Рассмотренный способ построения опыта, когда участок предварительно делится на блоки с относительно выровненными условиями, а проверяемые варианты распределяются внутри блока в случайном порядке, называется способом рендомизированных блоков.

С помощью анализа дисперсионным методом можно изучить влияние не только одного фактора на результат, а двух и более. Дисперсионный анализ в этом случае будет называться многофакторным дисперсионным анализом.

Двухфакторный дисперсионный анализ отличается от двух однофакторных тем, что он может ответить на следующие вопросы:

1. 1каково влияние обоих факторов вместе?

2. какова роль сочетания этих факторов?

Рассмотрим дисперсионный анализ опыта, в котором следует выявить влияние не только сроков посева, но и сортов на урожайность пшеницы (табл. 10).

Таблица 10. Данные опыта по влиянию сроков посева и сортов на урожайность пшеницы

– это сумма квадратов отклонений индивидуальных значений от общей средней.

Вариация по совместному влиянию сроков посева и сорта

– это сумма квадратов отклонений средних по подгруппам от общей средней, взвешенных на число повторностей, т. е. на 4.

Вычисление вариации по влиянию только сроков посева:

Остаточная вариация определяется как разность между общей вариацией и вариацией по совместному влиянию изучаемых факторов:

Dост = Dо – Dпс = 170 – 96 = 74.

Все расчеты можно оформить в виде таблицы (табл. 11).

Таблица 11. Результаты дисперсионного анализа

Результаты дисперсионного анализа показывают, что влияние изучаемых факторов, т. е. сроков посева и сорта, на урожайность пшеницы существенно, так как F-критерии фактические по каждому из факторов значительно превышают табличные, найденные для соответствующих степеней свободы, и при этом с достаточно высокой вероятностью (р = 0,99). Влияние же сочетания факторов в данном случае отсутствует, так как факторы независимы друг от друга.

Анализ влияния трех факторов на результат ведется по такому же принципу, что и для двух факторов, только в этом случае будет три дисперсии по факторам и четыре дисперсии по сочетанию факторов. С увеличением числа факторов резко увеличивается объем расчетных работ и, кроме того, становится затруднительно оформлять исходную информацию в комбинационную таблицу. Поэтому вряд ли целесообразно изучать влияние многих факторов на результат с использованием дисперсионного анализа; лучше взять меньшее их число, но выбрать наиболее существенные факторы с точки зрения экономического анализа.

Нередко исследователю приходится иметь дело с так называемыми непропорциональными дисперсионными комплексами, т. е. такими, в которых не соблюдается пропорциональность численностей вариантов.

В таких комплексах вариация суммарного действия факторов не равна сумме вариации по факторам и вариации сочетания факторов. Она отличается на величину, зависящую от степени связей между отдельными факторами, возникающих вследствие нарушения пропорциональности.

В этом случае возникают трудности при определении степени влияния каждого фактора, так как сумма частных влияний не равна суммарному влиянию.

Одним из способов приведения непропорционального комплекса к единой структуре является способ его замены пропорциональным комплексом, в котором частоты усреднены по группам. Когда такая замена произведена, задача решается по принципам пропорциональных комплексов.

Метод корреляционно-регрессионного анализа

Изучение связи между экономическими явлениями, раскрытие причинно/следственного механизма – важнейшая задача статистики. Мало определить центральную тенденцию, измерить вариацию и определить другие характеристики распределения – важно выяснить причины различий единиц совокупности, выявить и измерить влияние отдельных факторов на изучаемое явление.

Для исследования интенсивности, вида и формы причинных влияний широко применяется корреляционный и регрессионный анализ. Понятия корреляции и регрессии непосредственно связаны между собой. В то время как в корреляционном анализе оценивается сила (теснота) связи между явлениями, в регрессионном исследуется ее форма.

Термины «связь» и «зависимость» имеют различный смысл, и поэтому необходимо различать понятия «корреляционная связь» и «корреляционная зависимость». Если нам уже известно, что изменение одного явления вызвано изменениями другого, т. е. установлена причинная связь, то использование термина «корреляционная зависимость» будет обоснованным; но если это неизвестно, то необходимо употребить термин «корреляционная связь».

Экономические явления находятся в постоянной всеохватывающей объективной взаимосвязи. Наиболее общим видом связи между явлениями является стохастическая (вероятностная) связь. Она выражается в том, что с изменением одного явления меняется условный закон распределения другого явления.

Корреляционная связь является частным случаем стохастической. Корреляционной называют такую связь, при которой одному значению одного явления соответствует множество значений другого. Корреляционные связи проявляются только «в общем и среднем». По наблюдениям отдельных явлений этой связи можно и не заметить, она может даже показаться обратной той, которая проявляет себя «в общем и в среднем». Например, увеличение продолжительности рабочего времени приведет к увеличению выпуска продукции, однако за один и тот же отрезок времени отдельные работники произведут различные объемы продукции или при одинаковых дозах удобрений будут получены различные результаты урожайности сельскохозяйственных культур. Следовательно, корреляционная связь – это неполная связь между явлениями, которая проявляется при большем числе наблюдений. Существует и функциональная связь между явлениями – когда за изменением одного явления всегда следует строго определенное изменение другого. Функциональные связи всегда имеют то или иное математическое выражение (математическая функция), в то время как корреляционные могут иметь математическое выражение «в среднем», а не в каждом конкретном случае.

Для отличия от строго математической функции ее называют функцией регрессии.

Существуют различные виды корреляции и регрессии. Так, относительно числа изучаемых признаков различают следующие виды корреляции и регрессии:

1. Простая корреляция и регрессия, выражающая связь между двумя признаками. Например, между урожайностью и осадками, между производительностью труда и уровнем механизации, т. е. между результативным признаком Y и факторным признаком X. Такого рода связь можно выразить формулой: Y = f (x).

2. Множественная корреляция и регрессия, характеризующая связь между результативным признаком и несколькими факторными признаками, например связь между себестоимостью продукции и факторами, влияющими на нее (производительностью труда, концентрацией и специализацией производства и т. д.). В общем виде такая связь выражается формулой: Y1,2... n = f (x1, x2, …, xn).

В зависимости от характера связи различают следующие виды корреляции и регрессии.

3. Положительная корреляция и регрессия – если связь между изучаемыми явлениями прямая, т. е. с увеличением факторного признака растет и результативный (в среднем). Например, связь между производительностью труда с уровнем механизации.

4. Отрицательная корреляция и регрессия – если с ростом значений факторного признака результативный признак в среднем уменьшается. Например, связь между стоимостью продукции и получаемой предприятием прибылью. Однако это различие касается только простой регрессии и корреляции. Если же она множественная, то на результативный признак влияет множество факторов различного направления и невозможно четко определить окончательно ее направление.

Относительно формы связи различают следующие виды.

1. Линейная – когда связи между изучаемыми явлениями носят линейный характер и выражены линейной функцией. Уравнение регрессии имеет вид:

2. Криволинейная корреляция и регрессия – когда между исследуемыми явлениями существуют нелинейные соотношения и связь выражается нелинейной функцией.

Процесс нахождения теоретической линии регрессии заключается в выборе и обосновании типа кривой, в расчете параметров ее уравнения. Для выбора и обоснования типа линии нет универсального метода. Существует несколько путей решения задачи: теоретический, эмпирический, а также опыт предыдущих исследований.

Определить тип уравнения регрессии можно, исследуя зависимость графически, однако существуют и другие приемы, позволяющие выявить тип уравнения связи. Так, если результативный и факторный признаки возрастают примерно одинаково, то это свидетельствует о том, что связь между ними линейная; если же один признак увеличивается, а другой неравномерно уменьшается, – связь гиперболическая. Если с увеличением значений фактора результативный признак сначала растет, а потом снижается, то связь параболическая, и т. д.

Задача заключается в том, чтобы найти такие коэффициенты уравнения регрессии, чтобы ошибка была минимальной. Это достигается путем применения метода наименьших квадратов. Для нахождения значений неизвестных параметров приравняем частные производные по этим параметрам к нулю и после простейших преобразований получим систему уравнений.

Пусть связь между результатом и фактором выражается уравнением параболы второго порядка:

Y = a + b1 x+b2 x2, (1.36)

Миниминизируя сумму квадратов отклонений переменной от ее значений по уравнению, получим:

Для этого берутся частные производные Q по параметрам «а» и «b», которые приравниваются к нулю, и полученная система уравнений решается относительно параметров:

Проделав простейшие преобразования, получим систему из трех уравнений:

Далее задача сводится к решению этой системы нормальных уравнений.

Применим этот метод для определения степени влияния сроков посева на урожайность. Для расчетов используем табл. 12, из которой возьмем следующие данные: сроки посева и средние значения урожайности для каждого срока посева.

Таблица 12

Порядковые номера сроков посева можно рассматривать как кодированные значения Х. Причем

Средняя урожайность представлена таблицей значений:

Y1 = 16; Y2 = 18; Y3 = 18; Y4 = 17; Y5 = 15;

Теперь задача сводится к построению зависимости: Y = f(x).

Исходные данные для расчета зависимости Y = f(x) представлены в табл. 13.

Из табл. 13 видно, что с изменением сроков посева средняя урожайность сначала растет, а затем падает. Следовательно, существуют оптимальные сроки посева, при которых средняя урожайность максимальна.

Подобный процесс целесообразно описать уравнением параболы 2/го порядка:

Таблица 13

Y = a + b1x + b2 x2,

где a, b1, b2 – параметры, подлежащие определению.

Для нахождения параметров a, b1 и b2 необходимо решить систему нормальных уравнений.

Известно, что экстремальные точки функции Y = f (x) определяются из условия Y = f (x), где Y' – первая производная функции Y по переменной x.

Для выбранного вида функции:

Y = (a + b1x + b2 x2) = b1 + 2b2 x.

Откуда

Подставляя из табл. 13 значения (Xi Y) в систему нормальных уравнений, получим:

5a + 15b1 + 55b– = 84;

15a + 55b1 + 225b2 = 249; (I)

55a + 225b1 + 979b2 = 897.

Система решается следующим образом:

1. Все уравнения делятся на коэффициенты при «а»:

a + 3b1 + 11b2 = 16,8;

a + 3,67b1 + 15b2 = 16,8;

a + 4,09b1 + 17,8b2 = 16,3.

2. Из первого уравнения вычитается сначала 2/е, а затем 3/е. В результате получается система уравнений с двумя неизвестными:

– 0,67b1, – 4b2 = +0,2; (II)

– 1,09b1 – 6,8b2 = +0,5.

3. Повторяем процедуру 1 и 2 и получаем:

0,24b2 = -0,16,

откуда b2 = -0,64.

Подставляя в любые уравнения системы II, например в первое, значение: b2 = -0,64, найдем b1 = +3,54.

Из первого уравнения системы I находим:

a = 13,22.

Таким образом, уравнение, выражающее связь сроков посевов с урожайностью, будет иметь вид:

Y = 13,22 + 3,54x – 0,64x2

Оптимальный срок посева будет равен хопт = 2,8, что соответствует периоду с 10 по 20 мая.

Существует много методов решения системы нормальных уравнений, в частности, целесообразно решать систему нормальных уравнений обычными методами линейной алгебры.

До сих пор речь шла о том, что на результативный признак действует один факторный признак, и в зависимости от этого мы строили все свои расчеты. На самом деле все обстоит гораздо сложнее. На результативный признак действует множество случайных факторов, и перед нами возникает новая задача – найти модель наблюдаемого процесса, адекватно отражающую сам процесс, определить, как и в какой степени на результаты наблюдения воздействуют выбранные факторы. Эта задача чрезвычайно важна, так как именно она позволяет правильно оценить с определенной заданной вероятностью место и роль наблюдаемого явления в решении конкретных народно-хозяйственных задач.

Наиболее часто на практике наблюдаемый процесс описывается линейной многофакторной моделью:

Y = a + b1x1 + b2 х2 +… + bkxk, (1.37)

гдеx1x2 … xk – значения факторов; a, b1, b2, bk – параметры модели.

Что же такое модель? Как ее объяснить? Обычно стараются для наглядности все процессы интерпретировать геометрически. Попробуем подойти к многофакторной модели именно с такой позиции.

Совершенно очевидно, что однофакторный процесс является частным случаем многофакторного уравнения. Модели Y = f (?) представляют собой множество кривых различного рода на плоскости. Если рассматривать модель вида Y = a + bx, то это будет множество прямых на плоскости. Внося в рассмотрение еще один фактор, мы получаем уравнение вида Y = f (x1, x2) или для линейной модели: Y = a + b1x1 + b2x2. Это уже будет множество положений плоскости в трехмерном пространстве. Для трех факторов мы уже не можем дать геометрического толкования модели. Однако в целях обобщения можно считать, что линейная модель Y = a + b1 x1 + b2x2 +...bkxk представляет собой «гиперплоскость» в (k + 1) – мерном пространстве.

Рекомендуется всегда предварительно изучить форму и степень связи между результативным и всеми выбранными факторами попарно. Если все попарные связи линейны или близки к линейным, то есть все основания полагать, что и множественная связь будет линейной.

Схема корреляционно-регрессионного анализа подразумевает следующие шаги:

1. определение связи между изучаемыми признаками;

2. формирование уравнения регрессии;

3. расчет показателей связи.

Чтобы отобрать факторы, оказывающие существенное влияние на результативный признак, необходимо произвести группировку по нему. Из всех факторов необходимо отобрать те, которые наиболее связаны с результативным признаком.

Так, например, при изучении влияния основных экономических факторов на себестоимость молока необходимо произвести группировку хозяйств по себестоимости 1 ц молока, взяв в качестве факторных признаков:

1. уровень кормления;

2. стоимость 1 ц кормовых единиц (корм. ед.);

3. уровень оплаты труда;

4. уровень специализации хозяйств на производстве молока и т. п.

Для установления формы связи необходимо построить графики попарной зависимости выбранных факторов с результативным признаком (в нашем случае это себестоимость). В случае прямолинейной зависимости или близкой к таковой между всеми факторами и результатом следует использовать уравнение регрессии линейного типа:

Y=a+b1x1 + b2 x2 + „. + bkxk,

где x1 x2 … xk – выбранные факторы; b1 b2 … bk – коэффициенты регрессии, определяющие степень среднего изменения значений зависимой переменной Y при изменении фактора на единицу, но при условии, что остальные факторы, включенные в уравнение, остаются постоянными.





Дата публикования: 2014-12-11; Прочитано: 207 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.035 с)...