Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Решение. 1. Проранжируем по возрастанию исходные данные



1. Проранжируем по возрастанию исходные данные. Результат приведем в таблице 2.

Таблица 2.

Обработка данных, полученных в процессе проведения статистического наблюдения

Исходные данные Ранжированные данные
Стоимость основных средств, тыс.р. Затраты на производство продукции, тыс.р. Стоимость основных средств, тыс.р. Затраты на производство продукции, тыс.р.
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       

Произведении группировку данных по факторному и результативному признакам. Для этого находим количество групп и значения величин интервалов. Количество групп определим по формуле Стерджесса:

Округлим полученное значение до целого и принимаем решение о разбиении совокупности на шесть групп.

Рассчитаем величины интервалов по формуле:

Учитывая полученные значения величин интервалов произведем группировки данных и формируем ряды распределения. Результаты группировок оформим в виде простых таблиц.

Таблица 3

Группировка предприятий по стоимости основных средств

Стоимость основных средств, тыс.р. Число предприятий
3197 – 4903,5  
4903,5 – 6610  
6610 – 8316,5  
8316,5 – 10023  
10023 – 11729,5  
11729,5 – 13436  
Итого  

Таблица 4

Группировка предприятий по затратам на производство продукции

Затраты на производство продукции, тыс.р. Число предприятий
3885 – 5627,2  
5627,2 – 7369,4  
7369,4 – 9111,6  
9111,6 – 10853,8  
10853,8 – 12596  
12596 – 14338  
Итого  

Для проведения анализа по полученным рядам распределения произведем структурную и аналитическую группировку, результаты представим в табличной форме.

Таблица 5

Структурная группировка предприятий по стоимости основных средств.

Стоимость основных средств, тыс.р. Число предприятий Показатели структуры, %
3197 – 4903,5   17,86
4903,5 – 6610   21,43
6610 – 8316,5   21,43
8316,5 – 10023   7,14
10023 – 11729,5   17,86
11729,5 – 13436   14,29
Итого   100,00

Таблица 6.

Структурная группировка предприятий по затратам на производство продукции

Затраты на производство продукции, тыс.р. Число предприятий Показатели структуры, %
3885 – 5627,2   32,14
5627,2 – 7369,4   17,86
7369,4 – 9111,6   28,57
9111,6 – 10853,8   14,29
10853,8 – 12596   3,57
12596 – 14338   3,57
Итого   100,00

По результатам группировки можем сделать вывод, что наибольшее число предприятий имеют стоимость основных средств в пределах 8316,5 – 10023 тыс.р., а затраты на производство чаще находятся в интервале 3885 – 5627,2 тыс.р.

Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие признаки, т.е. признаки, которые изменяются под влиянием факторных признаков, и факторные признаки, т.е. те, зависимость результирующих признаков от которых исследуется. Аналитическая группировка отличается следующими особенностями: единицы совокупности группируются по факторному признаку; каждая выделенная группа характеризуется средними значениями результативного признака, по изменению величины которых определяется наличие связи и зависимостей между признаками.

Результаты аналитической группировки представлены ниже.

Таблица 7.

Аналитическая группировка предприятий по стоимости основных средств

Стоимость основных средств, тыс.р. Число предприятий Затраты на производство продукции, тыс.р. Среднее значение показателя.
3197 – 4903,5      
 
 
 
 
Итого     5391,2
       
4903,5 – 6610        
 
 
 
 
 
Итого   5220,3
       
6610 – 8316,5      
 
 
 
 
 
Итого   8045,3
       
8316,5 – 10023      
 
Итого    
       
10023 – 11729,5      
 
 
 
 
Итого   9500,8
       
11729,5 – 13436      
 
 
 
Итого   9897,5

По результатам аналитической группировки можем отметить возможное наличие прямой линейной связи между факторным (стоимость основных средств) и результативным (затраты на производство продукции) признаками.

Построим комбинационную таблицу.

Таблица 8

Комбинационная таблица.

Значения интервалов факторного признака Показатели Значения интервалов результативного признака
3885 – 5627,2 5627,2 – 7369,4 7369,4 – 9111,6 9111,6 – 10853,8 10853,8 – 12596 12596 – 14338
3197 – 4903,5            
4903,5 – 6610            
6610 – 8316,5            
8316,5 – 10023            
10023 – 11729,5            
11729,5 – 13436            

По полю комбинационной таблицы видно, что при увеличении факторного признака результативный признак увеличивается, что является свидетельством наличия линейной зависимости между признаками.

2. При расчете средних показателей берем данные простой таблицы и расчет производится в следующем порядке.

Таблица 9

Группировка предприятий по стоимости основных средств

Стоимость основных средств, тыс.р. Дискретный ряд распределения Число предприятий Сумма накопленных частот
3197 – 4903,5 4050,25    
4903,5 – 6610 5756,75    
6610 – 8316,5 7463,25    
8316,5 – 10023 9169,75    
10023 – 11729,5 10876,25    
11729,5 – 13436 12582,75    
Итого      

а) Для расчета среднего риска воспользуемся средней арифметической взвешенной:

,

где х – значение признака,

f – частота (вес) группы.

б) Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.

,

где – нижняя граница модального интервала. Интервал с максимальной частотой является модальным;

– шаг модального интервала, который определяется разницей его границ;

fmo – частота модального интервала;

fmo-1 – частота интервала, предшествующего модальному;

fmo+1 – частота интервала, последующего за модальным.

В этом случае можно сказать, что совокупность мультимодальна.

Или

Медиана Me - это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.

Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты. Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот или превышает ее (так как все предшествующие накопленные частоты меньше этой величины).

,

где xme – нижняя граница медианного интервала. Интервал, в котором находится порядковый номер медианы, является медианным. Для его определения необходимо подсчитать величину . Интервал с накопленной частотой равной величине является медианным.

i – шаг медианного интервала, который определяется разницей его границ;

– сумма частот вариационного ряда;

Sme-1 – сумма накопленных частот в домедианном интервале;

fme – частота медианного интервала.

Накопленная частота интервала 6610 – 8316,5 превышает половину объема совокупности, следовательно, этот интервал медианный.

в) Показатели вариации необходимы для того, чтобы сделать вывод об однородности и засоренности изучаемой совокупности.

Размах вариации – это разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности. Недостатком показателя R является то, что он показывает только максимальное различие значений X и не может измерять силу вариации во всей совокупности

,

где хmax – максимальное значение признака;

х min – минимальное значение признака;

Cреднее линейное отклонение - это средний модуль отклонений значений X от среднего арифметического значения.

,

где – индивидуальные значения признака,

– средняя величина;

f – частота;

Таблица 10

Расчет среднего линейного отклонения

Стоимость основных средств, тыс.р. Дискретный ряд распределения Число предприятий
3197 – 4903,5 4050,25   3900,57 19502,85
4903,5 – 6610 5756,75   2194,07 13164,42
6610 – 8316,5 7463,25   487,57 2925,42
8316,5 – 10023 9169,75   1218,93 2437,86
10023 – 11729,5 10876,25   2925,43 14627,15
11729,5 – 13436 12582,75   4631,93 18527,72
Итого       71185,42

Дисперсия– это средний квадрат отклонений от средней:

Таблица 11

Расчет дисперсии

Стоимость основных средств, тыс.р. Дискретный ряд распределения Число предприятий
3197 – 4903,5 4050,25   15214446,32 76072231,62
4903,5 – 6610 5756,75   4813943,165 28883658,99
6610 – 8316,5 7463,25   237724,5049 1426347,029
8316,5 – 10023 9169,75   1485790,345 2971580,69
10023 – 11729,5 10876,25   8558140,685 42790703,42
11729,5 – 13436 12582,75   21454775,52 85819102,1
Итого       237963623,9

Среднее квадратическое отклонение – это корень квадратный из дисперсии.

Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по составу.

Коэффициент вариации:

.

Аналогичным образом производится расчет для ряда распределения предприятий по затратам на производство продукции.

Структурная группировка предприятий по затратам на производство продукции

Таблица 12

Группировка предприятий по затратам на производство продукции

Затраты на производство продукции, тыс.р. Дискретный ряд распределения Число предприятий Сумма накопленных частот
3885 – 5627,2 4756,1    
5627,2 – 7369,4 6498,3    
7369,4 – 9111,6 8240,5    
9111,6 – 10853,8 9982,7    
10853,8 – 12596 11724,9    
12596 – 14338      
Итого      

Результаты расчетов по рядам распределения приведем в таблице.

Таблица 13

Средние величины и показатели вариации

Показатель Стоимость основных средств(х) Затраты на производство продукции (у)
Средняя величина 7950,82 7369,4
Мода   5091,14
Медиана 7463,25 7369,4
Размах вариации    
Среднее линейное отклонение 2542,34 1991,08
Среднее квадратическое отклонение 2915,25 2351,27
Коэффициент вариации (%) 36,66 31,91

Анализируя полученные результаты, можем отметить неоднородность совокупности по данным признакам.

3. Определим размер выборки, которую необходимо получить:

В связи с небольшим объемом отбираемых данных проведем случайную повторную выборку.

Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (например, бочонки), которые затем перемешиваются в некоторой емкости (например, в мешке) и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.

С помощью генератора случайных чисел формируем новую совокупность

Таблица 14

Выборка из генеральной совокупности.

Предприятие Стоимость основных средств
   
   
   
   
   
   
   
   
   
   
   

Произведем расчет средней величины по формуле средней арифметической простой:

В математической статистике доказывается, что величина средней квадратической стандартной ошибки простой случайной повторной выборки может быть определена по формуле:

.

Следовательно, чем больше вариация признака, тем больше ошибка выборки и чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик.

Определим величину дисперсии по формуле:

Расчет приведем в таблице.

Таблица 15

Расчет дисперсии

Предприятие Стоимость основных средств
    1200618,256
    14751185,98
    3595850,256
    15494242,98
    15893994,35
    15494242,98
    1135774,62
    17772356,44
    15893994,35
    15494242,98
    20126642,98
Итого   136853146,2

Величину называют предельной ошибкой выборки. Она равна -кратному числу средних ошибок выборки.

Для определения значения - критерия воспользуемся таблицей.

1,00 1,96 2,00 2,58 3,00
  0,683   0,950   0,954   0,990   0,997

Найдем предельную ошибку выборки с вероятностью 0,95.

Выборочное наблюдение дает возможность определить среднюю арифметическую выборочной совокупности и величину предельной ошибки этой средней , которая показывает (с определенной вероятностью), насколько выборочная средняя может отличаться от генеральной средней в большую или меньшую сторону. Тогда величина генеральной средней будет представлена интервальной оценкой, для которой нижняя граница будет равна , а верхняя граница . Пределы, в которых с данной степенью вероятности будет заключена неизвестная величина оцениваемого параметра, называют доверительными, а вероятность Р – доверительной вероятностью.

Доверительный интервал для генеральной средней можно записать как:

Таким образом с вероятностью 95% средняя величина в генеральной совокупности принадлежит интервалу:

Среднее значение генеральной совокупности мы находили в пункте 2 данного задания и оно равно:

Т.к. данное значение входит в пределы изменения среднего значения в выборочной совокупности, то она признается представительной и может быть использована для проведения дальнейшего анализа.

4. Рассмотрим полученную в пункте 1 аналитическую группировку представленную в таблице 7.

Таблица 7.

Аналитическая группировка предприятий по стоимости основных средств

Стоимость основных средств, тыс.р. Число предприятий Среднее значение затрат на производство продукции, тыс.р.
3197 – 4903,5   5391,2
4903,5 – 6610   5220,3
6610 – 8316,5   8045,3
8316,5 – 10023    
10023 – 11729,5   9500,8
11729,5 – 13436   9897,5

Очевидно, что с увеличением стоимости основных средств затраты на производство продукции пропорционально увеличиваются, что позволяет говорить о возможном наличии линейной связи.

Построим график зависимости результативного признака от факторного:

Рис. 1. График зависимости затрат на производство продукции от стоимости основных средств (поле корреляции)

Изучая графическое представление исходных данных можно предположить наличие линейной связи между признаками.

Построим уравнение регрессии для линейной зависимости. Уравнение имеет вид:

Для оценки параметров регрессии используется метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических значений ŷx при тех же значениях фактора x минимальна.

Система нормальных уравнений записывается следующим образом:

Таблица 16

Расчет параметров уравнения линейной регрессии

Предприятие Стоимость основных средств, тыс.р., х Затраты на производство продукции, тыс.р., у х2
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
Итого        

Решая систему нормальных уравнений, находим параметры уравнения регрессии, которое будет иметь следующий вид:

Оценка тесноты связи между признаками осуществляется с помощью коэффициента линейной парной корреляции - rx,y. Он может быть рассчитан по формуле: . Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии а1: .

Показатель Стоимость основных средств(х) Затраты на производство продукции (у)
Средняя величина 7950,82 7369,4
Мода   5091,14
Медиана 7463,25 7369,4
Размах вариации    
Среднее линейное отклонение 2542,34 1991,08
Среднее квадратическое отклонение 2915,25 2351,27
Коэффициент вариации (%) 36,66 31,91

Оценку статистической значимости коэффициента линейной парной корреляции в генеральной совокупности проведем с помощью -статистики Стьюдента.

Выдвигаем гипотезу Но о статистически незначимом отличии показателя от нуля: = 0.

для числа степеней свободы и составит 2,07.

Для проверки гипотезы о незначимом отличии от нуля используется следующий критерий:

,

где ryx - оценка коэффициента корреляции, полученная по наблюдаемым данным;

mr – стандартная ошибка коэффициента корреляции ryx.

Для линейного парного уравнения регрессии:

.

Фактическое значения t – статистики превосходит табличные показания:

поэтому гипотеза Hо отклоняется, т.е не случайно отличается от нуля, а статистически значим.

По результатам расчетов можем сделать следующий вывод: связь между признаками прямая и слабая. При увеличении факторного признака на 1 от своей средней значение результативного признака увеличивается на 0,5909 от своей средней. Влияние неучтенных факторов составляет 2764,3 тыс.р.





Дата публикования: 2015-01-09; Прочитано: 560 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.029 с)...