Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Лекция 6. Математическая статистика

Лекция 6. Математическая статистика

План лекции

6.1. Основные понятия математической статистики

6.2. Точечные оценки параметров

6.3. Примеры некоторых распределений

6.1. Основные понятия математической статистики

Математическая статистика – это раздел математики, посвящённый анализу статистических данных самой разнообразной природы. Есть определённая связь математической статистики с теорией вероятностей, которая не случайно изучается раньше. В теории вероятностей име­ют де­ло с ве­ро­ят­но­стя­ми слу­чай­ных со­бы­тий, а так­же со слу­чай­ны­ми ве­ли­чи­на­ми и их ха­рак­те­ри­сти­ка­ми. При этом пред­по­ла­га­ется, что ин­те­ре­сую­щие нас ве­ро­ят­но­сти ли­бо из­вест­ны, ли­бо их мож­но рас­счи­тать. Но в прак­ти­че­ских за­да­чах по­ло­же­ние иное. Во вре­мя про­ве­де­ния опы­тов фик­си­ру­ют­ся кон­крет­ные зна­че­ния слу­чай­ной ве­ли­чи­ны, по ко­то­рым за­тем нуж­но оп­ре­де­лить её чи­сло­вые ха­рак­те­ри­сти­ки и за­кон рас­пре­де­ле­ния ве­ро­ят­но­стей. Осо­бен­но­стью за­да­чи в по­дав­ляю­щем чис­ле слу­ча­ев яв­ля­ет­ся не­воз­мож­ность об­сле­до­вать все объ­ек­ты на­блю­де­ния, а зна­чит, имея в на­ли­чие толь­ко ог­ра­ни­чен­ное ко­ли­че­ст­во из­ме­ре­ний, нам не­об­хо­ди­мо сде­лать вы­вод о по­ве­де­нии всей со­во­куп­но­сти объ­ек­тов.

Всё мно­же­ст­во ис­сле­дуе­мых объ­ек­тов на­зы­ва­ет­ся ге­не­раль­ной со­во­куп­но­стью. Чис­ло объ­ек­тов на­зы­ва­ет­ся объ­ё­мом ге­не­раль­ной со­во­куп­но­сти. Объ­ём ге­не­раль­ной со­во­куп­но­сти яв­ля­ет­ся ко­неч­ным в от­ли­чие от тео­ре­ти­че­ских рас­смот­ре­ний, где он пред­по­ла­га­ет­ся бес­ко­неч­ным.

Мно­же­ст­во слу­чай­ным об­ра­зом ото­бран­ных объ­ек­тов ис­сле­до­ва­ния на­зы­ва­ет­ся вы­бо­роч­ной со­во­куп­но­стью или вы­бор­кой, а чис­ло объ­ек­тов в вы­бор­ке – её объ­ё­мом. Про­из­ве­дён­ная вы­бор­ка долж­на дос­та­точ­но пол­но от­ра­жать свой­ст­ва всех объ­ек­тов ге­не­раль­ной со­во­куп­но­сти. Осо­бен­но это важ­но, ко­гда ге­не­раль­ная со­во­куп­ность име­ет не­ко­то­рую не­од­но­род­ность объ­ек­тов. Та­кое тре­бо­ва­ние к вы­бор­ке фор­му­ли­ру­ет­ся так: вы­бор­ка долж­на быть ре­пре­зен­та­тив­ной (пред­ста­ви­тель­ной). Ре­пре­зен­та­тив­ность вы­бор­ки обес­пе­чи­ва­ет­ся слу­чай­но­стью от­бо­ра при оди­на­ко­вой ве­ро­ят­но­сти лю­бо­го объ­ек­та по­пасть в вы­бор­ку.

Про­ил­лю­ст­ри­ру­ем это по­ня­тие на при­ме­ре. До­пус­тим, что на­се­ле­ние го­ро­да со­став­ля­ет 100 000 че­ло­век, сре­ди ко­то­рых 60% - бед­ня­ки, 30% - сред­ний класс, а ос­таль­ные - бо­га­чи. Тре­бу­ет­ся оце­нить сред­не­го­до­вой до­ход на ду­шу на­се­ле­ния. По­сколь­ку нет ни фи­нан­со­вых, ни фи­зи­че­ских воз­мож­но­стей оп­ро­сить всех жи­те­лей го­ро­да, то ре­ши­ли сде­лать вы­бор­ку из 1000 че­ло­век, и по ре­зуль­та­там оп­ро­са оце­нить сред­не­го­до­вой до­ход. Что­бы вы­бор­ка бы­ла ре­пре­зен­та­тив­ной, сле­ду­ет слу­чай­ным об­ра­зом вы­брать для оп­ро­са при­бли­зи­тель­но 600 бед­ня­ков, 300 че­ло­век со сред­ним дос­тат­ком и 100 бо­га­чей. Толь­ко в этом слу­чае сред­нее ариф­ме­ти­че­ское их го­до­вых до­хо­дов бу­дет хо­ро­шей оцен­кой сред­не­го­до­во­го до­хо­да жи­те­лей это­го го­ро­да.

Те­перь пе­рей­дем к фор­маль­ной сто­ро­не ма­те­ма­ти­че­ской ста­ти­сти­ки, ко­то­рая, как уже говорилось, оп­ре­де­ля­ет­ся как раз­дел ма­те­ма­ти­ки, по­свя­щён­ный ма­те­ма­ти­че­ским ме­то­дам сис­те­ма­ти­за­ции, об­ра­бот­ки и ис­поль­зо­ва­ния ста­ти­сти­че­ских дан­ных для на­уч­ных и прак­ти­че­ских вы­во­дов вне за­ви­си­мо­сти от при­ро­ды изу­чае­мых объ­ек­тов.

Пусть име­ет­ся ге­не­раль­ная со­во­куп­ность слу­чай­ной ве­ли­чи­ны Х (в при­ве­дён­ном вы­ше при­ме­ре - ин­ди­ви­ду­аль­ные до­хо­ды 100 000 го­ро­жан), функ­ция рас­пре­де­ле­ния F(x) ко­то­рой нам не­из­вест­на, ли­бо из­вест­на с точ­но­стью до не­сколь­ких па­ра­мет­ров. То­гда вы­бор­кой объ­ё­ма n бу­дет яв­лять­ся слу­чай­ный n - мер­ный век­тор, имею­щий “ко­ор­ди­на­ты” { х1, х2,..., хn } (в примере – до­хо­ды слу­чай­ным об­ра­зом ото­бран­ных n го­ро­жан). Ста­вит­ся за­да­ча: по имею­щей­ся вы­бор­ке оце­нить ос­нов­ные чи­сло­вые ха­рак­те­ри­сти­ки слу­чай­ной ве­ли­чи­ны Х (ма­те­ма­ти­че­ское ожи­да­ние, дис­пер­сию) или сде­лать вы­вод о ви­де функ­ции рас­пре­де­ле­ния.

По­сколь­ку вы­бор­ка слу­чай­на, то ко­ор­ди­на­ты n - мер­но­го век­то­ра хi не­упо­ря­до­че­ны, т.е., во-пер­вых, сре­ди них мо­гут встре­тить­ся оди­на­ко­вые ве­ли­чи­ны (рав­ные до­хо­ды), а во-вто­рых, мо­жет вы­пол­нять­ся лю­бое из не­ра­венств: хi+1 > > xi или хi+1 < xi. Для удоб­ст­ва ра­бо­ты с вы­бор­кой зна­че­ния xi пе­ре­став­ля­ют так, что­бы вы­пол­ня­лись не­стро­гие не­ра­вен­ст­ва: х1 £ х2 £ х3 £ ... £ хn. Та­кая пе­ре­ста­нов­ка не при­ве­дет ни к по­те­ре ин­фор­ма­ции, ни к её при­об­ре­те­нию (про­сто оп­рос тех же го­ро­жан про­во­дил­ся бы в ином по­ряд­ке).

Не­ко­то­рые зна­че­ния в вы­бор­ке мо­гут сов­па­дать. До­пус­тим, все­го име­ет­ся k (1 £ k £ n) раз­ных и рас­по­ло­жен­ных в по­ряд­ке воз­рас­та­ния зна­че­ний ; их на­зы­ва­ют ва­ри­ан­та­ми, а та­кую по­сле­до­ва­тель­ность чи­сел – ва­риа­ци­он­ным ря­дом. Раз­ность - ме­ж­ду наи­боль­шим и наи­мень­шим зна­че­ния­ми вы­бор­ки на­зы­ва­ют раз­ма­хом вы­бор­ки. До­пус­тим, зна­че­ние по­вто­ря­ет­ся ni раз (1 £ i £ k) при со­блю­де­нии ра­вен­ст­ва . Ве­ли­чи­ну ni на­зы­ва­ют час­то­той ва­ри­ан­ты , а от­но­ше­ние ni / n от­но­си­тель­ной час­то­той Wi. Лег­ко убе­дить­ся, что сум­ма от­но­си­тель­ных час­тот рав­на еди­ни­це: .

Дан­ные ва­риа­ци­он­но­го ря­да за­но­сим в таб­ли­цу, верх­нюю стро­ку ко­то­рой за­пол­ним ва­ри­ан­та­ми , ,..., , а ниж­нюю - со­от­вет­ст­вую­щи­ми от­но­си­тель­ны­ми час­то­та­ми . Та­кая таб­ли­ца на­зы­ва­ет­ся таб­ли­цей ста­ти­сти­че­ско­го рас­пре­де­ле­ния вы­бор­ки или про­сто ста­ти­сти­че­ской таб­ли­цей. Ста­ти­сти­че­ская таб­ли­ца в слу­чае от­сут­ст­вия по­вто­ряю­щих­ся зна­че­ний в ва­риа­ци­он­ном ря­ду име­ет вид табл. 6.1, а для вы­бор­ки с по­вто­ряю­щи­ми­ся зна­че­ния­ми - табл. 6.2.

Wi 1/n 1/n 1/n 1/n 1/n
Табл. 6.1

Wi
Табл.6.2

Заметим, что таб­ли­цу ста­ти­сти­че­ско­го рас­пре­де­ле­ния вы­бор­ки можно считать таблицей рас­пре­де­ле­ния некоторой гипотетической слу­чай­ной дис­крет­ной ве­ли­чи­ны, при­ни­ма­ющей зна­че­ния , ,..., с ве­ро­ят­но­стя­ми . В си­лу этой ана­ло­гии мож­но по тем же фор­му­лам, ко­то­рые ис­поль­зо­ва­лись для дис­крет­но­го рас­пре­де­ле­ния в теории вероятностей, по из­вест­но­му эм­пи­ри­че­ско­му рас­пре­де­ле­нию най­ти вы­бо­роч­ные ана­ло­ги ма­те­ма­ти­че­ско­го ожи­да­ния, дис­пер­сии и эм­пи­ри­че­ской функ­ции рас­пре­де­ле­ния.

Ес­ли объ­ём вы­бор­ки из ге­не­раль­ной со­во­куп­но­сти не­ко­то­рой слу­чай­ной не­пре­рыв­ной ве­ли­чи­ны ве­лик, то при­бе­га­ют к пред­ва­ри­тель­ной груп­пи­ров­ке дан­ных: ин­тер­вал зна­че­ний этой ве­ли­чи­ны раз­би­ва­ют на k ин­тер­ва­лов (при этом их дли­ны не обя­за­тель­но долж­ны быть оди­на­ко­вы). При вы­бо­ре ко­ли­че­ст­ва ин­тер­ва­лов ру­ко­во­дствуются фор­му­лой k = log2 n + 1. Под­счи­ты­ва­ют, сколь­ко зна­че­ний n1 , n2,..., nk по­па­ло в ка­ж­дый из k ин­тер­ва­лов (n1 + n2 +... + nk = = n). Ва­ри­ан­та­ми для груп­пи­ро­ван­ной вы­бор­ки считают се­ре­ди­ны этих ин­тер­ва­лов , ,..., . Эти дан­ные за­но­сят в ста­ти­сти­че­скую таб­ли­цу рас­пре­де­ле­ния вы­бор­ки (табл. 6.2).

Для на­гляд­но­го пред­став­ле­ния ста­ти­сти­че­ско­го рас­пре­де­ле­ния поль­зу­ют­ся гра­фи­че­ски­ми изо­бра­же­ния­ми ва­риа­ци­он­ных ря­дов: по­ли­го­ном (для слу­чай­ной дис­крет­ной ве­ли­чи­ны) и гис­то­грам­мой (для не­пре­рыв­ной). По­ли­гон по­лу­ча­ют, со­еди­няя от­рез­ка­ми пря­мых точ­ки с ко­ор­ди­на­та­ми (, ), i = 1 ,..., k. Он яв­ля­ет­ся ана­ло­гом мно­го­уголь­ни­ка рас­пре­де­ле­ния слу­чай­ной дис­крет­ной ве­ли­чи­ны в тео­рии ве­ро­ят­но­стей. Гис­то­грам­ма - это ряд пря­мо­уголь­ни­ков, ос­но­ва­ния­ми ко­то­рых яв­ля­ют­ся от­рез­ки длиной - , а их вы­со­ты рав­ны . При та­ком вы­бо­ре сто­рон пря­мо­уголь­ни­ков дос­ти­га­ет­ся ра­вен­ст­во еди­ни­це пло­ща­ди всей этой сту­пен­ча­той фи­гу­ры. Гис­то­грам­ма яв­ля­ет­ся ана­ло­гом плот­но­сти ве­ро­ят­но­стей слу­чай­ной не­пре­рыв­ной ве­ли­чи­ны. При­ме­ры по­ли­го­на и гис­то­грам­мы при­ве­де­ны со­от­вет­ст­вен­но на рис. 5.1 и 5.2.

Wi

x1 x2 x3 x4 х5 x6 x7 x

Рис. 6.1

Wi

 
 


       
   
 
 


х

Рис. 6.2

Рас­смат­ри­вая эти гра­фи­ки, мож­но вы­ска­зать пред­по­ло­же­ние, что в пер­вом слу­чае слу­чай­ная ве­ли­чи­на име­ет рав­но­мер­ное рас­пре­де­ле­ние, а во вто­ром - нор­маль­ное. Оцен­ка пра­во­мер­но­сти этих ги­по­тез со­став­ля­ет от­дель­ную гла­ву ма­те­ма­ти­че­ской ста­ти­сти­ки.

П р и м е р № 1. На при­ём­ных эк­за­ме­нах слу­чай­ная вы­бор­ка сре­ди аби­ту­ри­ен­тов да­ла сле­дую­щие на­бран­ные ими бал­лы: 12. 11, 12, 10, 10, 9, 14, 12, 13, 10, 11, 11, 15, 9, 12, 12, 11, 9, 9, 10, 11, 11, 14, 13, 9, 11, 12, 9, 11, 13. По­стро­ить для дан­ной вы­бор­ки ва­риа­ци­он­ный ряд, по­ли­гон и эм­пи­ри­че­скую функ­цию рас­пре­де­ле­ния, най­ти мо­ду и ме­диа­ну.

Р е ш е н и е. Рас­по­ло­жим дан­ные вы­бор­ки в по­ряд­ке их воз­рас­та­ния, или дру­ги­ми сло­ва­ми, со­ста­вим ва­риа­ци­он­ный ряд: 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 11, 11, 11, 11, 11, 11, 11, 11, 12, 12, 12, 12, 12, 12, 1, 13, 13, 14, 14, 15. Чис­ла яв­ля­ют­ся ва­ри­ан­та­ми с чис­лом по­вто­ре­ний со­от­вет­ст­вен­но n1 = 6, n2 = 4, n3 = 8, n4 = 6, n5 = 3, n6 = 2, n7 = 1. Объ­ём вы­бор­ки ра­вен n = . Дан­ные за­не­сём в ста­ти­сти­че­скую таб­ли­цу рас­пре­де­ле­ния вы­бор­ки (табл. 6.3).

             
Wi 6/30 4/30 8/30 6/30 3/30 2/30 1/30
Табл. 6.3

По­стро­им по­ли­гон вы­бо­роч­но­го рас­пре­де­ле­ния (рис. 6.3).


Wi

 
 


 
 


x

0 1 8 9 10 11 12 13 14 15

Рис. 6.3

Мо­дой рас­пре­де­ле­ния Мо яв­ля­ет­ся ва­ри­ан­та 11, для ко­то­рой от­но­си­тель­ная час­то­та наи­боль­шая. Ме­диа­на Ме вы­чис­ля­ет­ся по фор­му­ле:

Ме = .

1

0,5

               
   
 
 
 
   
 
   


....

0 1 8 9 10 11 12 13 14 15 x

Рис. 6.4

Эм­пи­ри­че­ская функ­ция рас­пре­де­ле­ния (рис. 6.4), со­от­вет­ст­вую­щая по­лу­чен­ной ста­ти­сти­че­ской таб­ли­це рас­пре­де­ле­ния, стро­ит­ся по той же ме­то­ди­ке, что и в теории вероятностей. Она име­ет сту­пен­ча­тый вид: в точ­ках (i = 1, 2,..., 7) име­ют­ся ”скач­ки” ве­ли­чи­ной Wi, при­чём = 0 для x < и = 1 для x > .

П р и м е р № 2. Из­ме­ре­ния тол­щи­ны (в мм) слю­дя­ных про­кла­док да­ли сле­дую­щие ре­зуль­та­ты: 0,042; 0,030; 0,039; 0,031; 0,042; 0,034; 0,036; 0,030; 0,033; 0,024; 0,031; 0,040; 0,031; 0,033; 0,031; 0,022; 0,031; 0,034; 0,027; 0,032; 0,048; 0,030; 0,026; 0,031; 0,043; 0,030; 0,033; 0,028; 0,028; 0,032; 0,039; 0,031; 0,034; 0,031; 0,035; 0,037; 0,025; 0,029; 0,027; 0,031; 0,028; 0,030; 0,029; 0,045; 0,033; 0.046; 0,036; 0,049; 0,021; 0,037. По­стро­ить гис­то­грам­му.

Р е ш е­ н и е. Объ­ём вы­бор­ки ра­вен n = 50. Сгруп­пи­ру­ем дан­ные в ин­тер­ва­лы, чис­ло ко­то­рых най­дём по фор­му­ле: k = log 250 + 1 = 6,6. Ок­руг­лим это чис­ло до бли­жай­ше­го це­ло­го, пре­вы­шаю­ще­го по­лу­чен­ное: k = 7. По­сколь­ку раз­мах вы­бор­ки ра­вен xmax – xmin = 0,049 – 0,021 = 0,028 мм, то ка­ж­дый из ин­тер­ва­лов со­став­ля­ет 0,004 мм. По­счи­та­ем, сколь­ко из­ме­рен­ных зна­че­ний по­па­ло в со­от­вет­ст­вую­щие ин­тер­ва­лы, и со­ста­вим ста­ти­сти­че­скую таб­ли­цу рас­пре­де­ле­ния груп­пи­ро­ван­ных дан­ных (табл. 6.4), до­пол­нив её не­об­хо­ди­мой для по­строе­ния гис­то­грам­мы стро­кой, со­дер­жа­щей зна­че­ния (по ус­ло­вию Dx = 0,004).

За­ме­тим, что объ­ем вы­бор­ки .

В ка­че­ст­ве ва­ри­ант возь­мём се­ре­ди­ны про­ме­жут­ков:

i [0.021- 0.025) [0.025-0.029) [0.029-0.033) [0.033-0.037) [0.037-0.041) [0.041-0.045) [0.045-0.049]
Wi 3/50 7/50 18/50 10/50 5/50 3/50 4/50
Wi/Dx              
Табл. 6.4

Wi /Dx

           
   
 
     


0,021 0,025 … 0,049 х

Рис. 6.5

Гис­то­грам­ма, со­от­вет­ст­вую­щая по­лу­чен­ной ста­ти­сти­че­ской таб­ли­це, изо­бра­же­на на рис. 6.5. Она яв­ля­ет­ся ана­ло­гом плот­но­сти ве­ро­ят­но­сти слу­чай­ной не­пре­рыв­ной ве­ли­чи­ны Х - тол­щи­ны слю­дя­ной про­клад­ки.

6.2. Точечные оценки параметров

Пусть име­ет­ся вы­бор­ка (x1, x2,..., xn) из не­ко­то­рой ге­не­раль­ной со­во­куп­но­сти. За­пи­сав не­кое ма­те­ма­ти­че­ское вы­ра­же­ние, со­дер­жа­щее эти зна­че­ния, по­лу­чим функ­цию вы­бор­ки Zn (x1, x2,..., xn), ко­то­рая са­ма бу­дет слу­чай­ной ве­ли­чи­ной в силу того, что в выборку отбираются случайные элементы из генеральной совокупности. На­при­мер, мож­но рас­смот­реть сред­нее ариф­ме­ти­че­ское зна­че­ние вы­бор­ки (ана­лог ма­те­ма­ти­че­ско­го ожи­да­ния в тео­рии ве­ро­ят­но­стей), ко­то­рое на­зы­ва­ет­ся вы­бо­роч­ным сред­ним: (x1+ x2+...+ xn) / n. Раз­брос же зна­че­ний в вы­бор­ке мож­но ха­рак­те­ри­зо­вать ис­прав­лен­ной вы­бо­роч­ной дис­пер­си­ей: .

За­да­ча оцен­ки не­из­вест­но­го па­ра­мет­ра l (на­при­мер, М(Х) или D(Х)), который как-либо связан с ге­не­раль­ной со­во­куп­но­стью, порождённой функцией распределения случайной величины Х, на ос­но­ва­нии по­лу­чен­ной вы­бор­ки (х1, х2,..., хn), оз­на­ча­ет сле­дую­щее. На­до за­дать (при­ду­мать!) та­кую функ­цию вы­бор­ки Zn, реа­ли­за­ция ко­то­рой Zn = Z (х1, х2,..., хn) в не­ко­то­ром смыс­ле мог­ла бы рас­смат­ри­вать­ся как «хо­ро­шее» при­бли­жен­ное зна­че­ние па­ра­мет­ра l, т.е. должно выполняться условие l» Zn.

Та­кая функ­ция вы­бор­ки Zn = Z (х1, х2,..., хn) на­зы­ва­ет­ся то­чеч­ной оцен­кой па­ра­мет­ра l. Реа­ли­зо­вав­шее­ся зна­че­ние функ­ции вы­бор­ки Zn бу­дем на­зы­вать вы­бо­роч­ным (или эм­пи­ри­че­ским) зна­че­ни­ем па­ра­мет­ра l.

То­чеч­ная оцен­ка Zn = Z (х1, х2,..., хn) па­ра­мет­ра l на­зы­ва­ет­ся не­сме­щен­ной, ес­ли М (Zn) = l.

То­чеч­ная оцен­ка Zn па­ра­мет­ра l на­зы­ва­ет­ся со­стоя­тель­ной, ес­ли Р (| Zn - l| < e) ® 1, при n ® ¥, где e - сколь угод­но ма­лое по­ло­жи­тель­ное чис­ло. То есть со­стоя­тель­ность оцен­ки оз­на­ча­ет, что при очень большой выборке и сколь угод­но ма­лом e > 0, ве­ро­ят­ность со­бы­тия (| Zn - l| < e) сколь угод­но близ­ка к 1.

Нас бу­дут ин­те­ре­со­вать оцен­ки Р (Х = А) - ве­ро­ят­но­сти со­бы­тия А, ма­те­ма­ти­че­ско­го ожи­да­ния М(Х), дис­пер­сии D(Х) и ко­эф­фи­ци­ен­та кор­ре­ля­ции Gxy. Ос­нов­ные тре­бо­ва­ния, предъ­яв­ляе­мые к их оцен­кам, со­сто­ят в не­сме­щён­но­сти и со­стоя­тель­но­сти.

Мы бу­дем ис­поль­зо­вать сле­дую­щие оцен­ки че­ты­рех, пе­ре­чис­лен­ных вы­ше па­ра­мет­ров М (Х), D(Х), Р(Х = А), G ху:

1) - вы­бо­роч­ное сред­нее;

2) - исправленная вы­бо­роч­ная дис­пер­сия;

3) - час­то­та со­бы­тия А, где , ес­ли со­бы­тие А про­изош­ло в i - ом опы­те, и , ес­ли оно не про­изош­ло. Ве­ли­чи­ну мож­но рас­смат­ри­вать как оцен­ку ве­ро­ят­но­сти Р в схе­ме ис­пы­та­ний Бер­нул­ли.

Ес­ли в ге­не­раль­ной со­во­куп­но­сти со­дер­жит­ся две ин­те­ре­сую­щие нас слу­чай­ные ве­ли­чи­ны Х и Y, то­ вы­бор­ка объ­е­ма n со­сто­ит из по­сле­до­ва­тель­но­сти пар В этом слу­чае оцен­ка ко­эф­фи­ци­ен­та кор­ре­ля­ции слу­чай­ных ве­ли­чин Х и Y про­из­во­дит­ся по фор­му­ле:

где

Мож­но дока­зать, что при­ве­ден­ные вы­ше оцен­ки являются не­сме­щён­ными и со­стоя­тель­ными то­чеч­ными оце­нками.

При­ве­ден­ные фор­му­лы для вы­чис­ле­ния со­от­вет­ст­ву­ют не груп­пи­ро­ван­ным вы­бор­кам. Ес­ли про­ве­де­на груп­пи­ров­ка вы­бор­ки объ­е­ма n и по­лу­че­на ста­ти­сти­че­ская таб­ли­ца в виде табл. 6.2, то рас­чет про­во­дят по фор­му­лам:

З а м е ч а н и е. На прак­ти­ке час­то поль­зу­ют­ся для оцен­ки дис­пер­сии D (X) выборочной дисперсией . Но оказывается оценкой смещённой, т.е. М () ¹ D (X). При боль­ших зна­че­ни­ях n зна­че­ния исправленной выборочной дисперсии и выборочной дисперсии прак­ти­че­ски сов­па­да­ют . Поэтому при не­боль­ших объ­е­мах вы­бор­ки луч­ше ис­поль­зо­вать оцен­ку , которую получают по формуле . А про то­чеч­ную оценку можно сказать, что она яв­ля­ет­ся не­сме­щен­ной толь­ко асим­пто­ти­че­ски (при n >> 1).

З а д а ч а. Вернёмся к вы­бор­ке для тол­щи­ны слю­дя­ных про­кладо­к, при­ве­ден­ной в при­ме­ре № 2 п.6.1. Необходимо найти оцен­ки па­ра­мет­ров М (Х), D (Х) и - ма­те­ма­ти­че­ско­го ожи­да­ния, дис­пер­сии и сред­не­квад­ра­ти­че­ско­го от­кло­не­ния для тол­щи­ны слю­дя­ной про­клад­ки.

Р е ш е н и е. Вначале вы­чис­ля­ем вы­бо­роч­ное сред­нее:

= (0,023 × 3 + 0,027 × 7 + 0,031 × 18 + 0,035 × 10 + 0,039 × 5 + 0,043 × 3 + 0,047 × 4)/50 =

= 0,03356 мм.

Теперь находим выборочную дисперсию: =

= (0,0232 × 3 + 0,0272 × 7 + 0,0312 × 18 + 0,0352 × 10 + 0,0392 × 5 + 0.0432 × 3 +

+ 0,0472 × 4) / 50 – 0,033562 = 3,82464 × 10-5 мм 2.

Исправленная выборочная дисперсия легко находится:

= × 3,82464 × 10-5 = 3,9027 × 10-5 мм 2.

Выборочное среднеквадратическое отклонение толщины прокладки равно

Из-за того, что в группированной выборке участвуют уже только середины интервалов разбиения, груп­пи­ровка вы­бор­ки приводит к некоторой потере ин­фор­ма­ции, содержащейся в исходной выборке. Поэтому, исходя из опыта, объ­ем вы­бор­ки n берут достаточно большим (не менее нескольких десятков), а чис­ло ин­тер­ва­лов раз­бие­ния k – в пределах от 5 до 15. В этом случае раз­ни­ца в оцен­ках па­ра­мет­ров рас­пре­де­ле­ния, по­лу­чен­ных по груп­пи­ро­ван­ной и не груп­пи­ро­ван­ной вы­бор­кам, оказывается не­зна­чи­тель­ной. Так, в только что рассмотренном примере оценки М (Х) и s, вы­чис­лен­ные по груп­пи­ро­ван­ной вы­бор­ке, оказались рав­ными: А ес­ли вы­бор­ку не груп­пи­ро­вать, то для оценок М (Х) и s получатся соответственно значения 0,0331 мм и 6,25 мк, что весьма незначительно отличается от значений оценок по группированной выборке.

З а м е ч а н и е. В случае малых или, наоборот, больших значений для упрощения вычисления по­лез­но ис­поль­зо­вать фор­му­лу, позволяющую оперировать с привычными числами:

,

где чис­ла C 1 и C вы­би­ра­ются, ис­хо­дя из удобств вы­чис­ле­ний.

На­при­мер, вы­чис­ле­ние в предыдущем при­ме­ре проще осу­ще­ст­вить по формуле: .

В за­клю­че­ние от­ме­тим, что воз­мож­ность вы­чис­ле­ния зна­че­ний пре­ду­смот­ре­на в “инженерных” и “научных” каль­ку­ля­то­рах.

6.3. Примеры некоторых распределений

В лекции 2 описано нор­маль­ное рас­пре­де­ле­ни­е слу­чай­ной непрерывной ве­ли­чи­ны. Плот­ность ве­ро­ят­но­сти нор­маль­но­го рас­пре­де­ле­ния величины Х, имеющей математическое ожидание М (Х) = а и дисперсию D (Х) = s2 име­ет вид

.

Мно­же­ст­во нор­маль­но рас­пре­де­лен­ных слу­чай­ных ве­ли­чин с па­ра­мет­ра­ми а и s2 обо­зна­ча­ет­ся N (а, s2). В тео­рии ве­ро­ят­но­стей до­ка­зы­ва­ет­ся, что сум­ма нор­маль­но рас­пре­де­лен­ных слу­чай­ных ве­ли­чин име­ет нор­маль­ное рас­пре­де­ле­ние. По­это­му слу­чай­ная ве­ли­чи­на , где - не­за­ви­си­мые слу­чай­ные ве­ли­чи­ны, будет нор­маль­но рас­пре­де­ле­на с па­ра­мет­ра­ми а и . Иными словами,

З а м е ч а н и е. Ра­вен­ст­ва бы­ли по­лу­че­ны в конце п. 6.3 (задача № 2).

Пусть (х1, х2,..., хn) - ма­те­ма­ти­че­ская вы­бор­ка из ге­не­раль­ной со­во­куп­но­сти, по­ро­ж­ден­ной рас­пре­де­ле­ни­ем или из ге­не­раль­ной со­во­куп­но­сти, об­ра­зо­ван­ной не­за­ви­си­мы­ми слу­чай­ны­ми ве­ли­чи­на­ми с ма­те­ма­ти­че­ским ожи­да­ни­ем а и дис­пер­си­ей . То­гда мож­но до­ка­зать несколько сле­дую­щих утверждений.

1. Слу­чай­ная ве­ли­чи­на име­ет стан­дар­ти­зи­ро­ван­ное нор­маль­ное рас­пре­де­ле­ние N (0; 1) или асим­пто­ти­че­ски стан­дар­ти­зи­ро­ван­ное нор­маль­ное рас­пре­де­ле­ние, плот­ность ве­ро­ят­но­сти ко­то­ро­го .

В п. 2.6.2.2 было показано, что ес­ли x > 0, то , где - функ­ция Ла­п­ла­са. Для лю­бо­го име­ем

.

Заметим, что функция - чётная: , а функция Лапласа – нечётная: .

Таб­ли­цы зна­че­ний функ­ций и для x > 0 при­во­дят­ся в Приложении (табл. 1 и 2).

2. Рас­смот­рим схе­му ис­пы­та­ний Бер­нул­ли, где в ка­ж­дом из n опы­тов со­бы­тие А реа­ли­зу­ет­ся с ве­ро­ят­но­стью р. Вве­дём слу­чай­ные ве­ли­чи­ны: хi = 1, ес­ли в i -ом опы­те про­изош­ло со­бы­тие А, и хi = 0, ес­ли в i -ом опы­те со­бы­тие А не про­изош­ло. Об­ра­зу­ем слу­чай­ную ве­ли­чи­ну .

До­ка­зы­ва­ет­ся, что слу­чай­ная ве­ли­чи­на име­ет асим­пто­ти­че­ски стан­дар­ти­зи­ро­ван­ное рас­пре­де­ле­ние, т.е. при дос­та­точ­но боль­шом числе опытов .

3. Слу­чай­ная ве­ли­чи­на , где , на­зы­ва­ет­ся ­от­но­ше­ни­ем Стью­ден­та с (n - 1) сте­пе­нью сво­бо­ды. Поясним последнее обстоятельство. Ве­ли­чи­на Т за­ви­сит от слу­чай­ных ве­ли­чин (в силу того, что ) и S, т.е. Т за­ви­сит от (n + 1) слу­чай­ной ве­ли­чи­ны. Но сре­ди этих слу­чай­ных ве­ли­чин есть две функ­цио­наль­ные свя­зи: и . Поэтому не­за­ви­си­мых слу­чай­ных ве­ли­чин, уча­ст­вую­щих в фор­ми­ро­ва­нии слу­чай­ной ве­ли­чи­ны Т, бу­дет , что и является её числом степеней свободы.

За­ме­тим, что в тео­рии ве­ро­ят­но­стей до­ка­зы­ва­ет­ся, что и S - не­за­ви­си­мые слу­чай­ные ве­ли­чи­ны.

Обо­зна­чим плот­ность ве­ро­ят­но­сти слу­чай­ной ве­ли­чи­ны Т с сте­пе­ня­ми сво­бо­ды че­рез . Рас­пре­де­ле­ние ве­ли­чи­ны Т на­зы­ва­ет­ся рас­пре­де­ле­ни­ем Стью­ден­та с k сте­пе­ня­ми сво­бо­ды. Из­вест­но, что эта плот­ность ве­ро­ят­но­сти – функция чётная: , а также, что .

Таб­ли­цы при за­дан­ных зна­че­ни­ях m, g, a для оп­ре­де­ле­ния зна­че­ний x > 0, удов­ле­тво­ряю­щих ра­вен­ст­вам

и ,

при­во­дят­ся в Приложении (табл.4).

4. Слу­чай­ная ве­ли­чи­на име­ет рас­пре­де­ле­ние Стью­ден­та с числом сте­пе­ней сво­бо­ды m = n - 2, ес­ли . Здесь - ко­эф­фи­ци­ент кор­ре­ля­ции слу­чай­ных ве­ли­чин X и Y, а - его вы­бо­роч­ное значение, рав­ное .

5. Слу­чай­ная ве­ли­чи­на име­ет рас­пре­де­ле­ниехи-квад­рат с m = n - 1 сте­пе­нью сво­бо­ды. Обо­зна­чим плот­ность ве­ро­ят­но­сти ве­ли­чи­ны c2 как . То­гда для x > 0 име­ем

Ес­ли , то вероятность случайной величине принять значение между х 1 и х 2 равна

Таб­ли­ца при за­дан­ных па­ра­мет­рах m = n – 1, 0 < a < 1 для зна­че­ний х, удов­ле­тво­ряю­щих ра­вен­ст­ву , при­во­дит­ся в Приложении (табл. 5).

Математическое ожидание и дисперсия для хи-квадрат распределения равны ; мо­да рас­пре­де­ле­ния, т.е. значение варианты, для которой плот­ность ве­ро­ят­но­сти максимальна, равна xо = m – 2.

Таб­ли­цы для оп­ре­де­ле­ния х, удов­ле­тво­ряю­ще­го урав­не­нию , обыч­но при­во­дят­ся для числа степеней свободы m в диапазоне: . Ес­ли же m > 30, то ис­поль­зу­ет­ся тот факт, что случайная величина рас­пре­де­ле­на асим­пто­ти­че­ски нормально, т.е. Î , m >> 1. Это по­зво­ля­ет по­лу­чить при­бли­жен­ное ре­ше­ние урав­не­ния в ви­де , где Ka - кван­тиль порядка a нор­маль­но­го стан­дар­ти­зи­ро­ван­но­го рас­пре­де­ле­ния (квантиль порядка a случайной величины Х определяется как корень уравнения F (K a) = , что нормальной случайной величины выглядит так: , где - функ­ция Ла­п­ласа). Ес­ли ве­ли­чи­на a близ­ка к 0 или 1, то сле­ду­ет поль­зо­вать­ся при­бли­же­ни­ем .

З а д а ч а № 1. Най­ти зна­че­ние х, удов­ле­тво­ряю­щее урав­не­нию

, где m = 100, a = 0,01.

Р е ш е н и е. Т.к. чис­ло сте­пе­ней сво­бо­ды m = 100 > 30, то ис­поль­зо­вать таб­л. 5 нель­зя. Вос­поль­зу­ем­ся фор­му­лой , где К a - ко­рень урав­не­ния , т.е. . По таб­л. 2 зна­че­ний функ­ции Ла­п­лас­а Ф (х) по­лу­чим: (- Кa) = 2,33, т.е. К a = -2,33. Затем вы­чис­ля­ем .

Ес­ли же вос­поль­зо­вать­ся фор­му­лой , то по­лу­чим . Т.е. оба при­бли­же­ния да­ют практически одинаковые зна­че­ния х: 69,3 и 70.

З а д а ч а № 2. В предыдущем примере возьмём a = 0,001 и найдём х.

Р е ш е н и е. Зна­че­ние х сле­дую­щее: , где ве­ли­чи­на К a удов­ле­тво­ря­ет урав­не­нию . По таб­л.2 находим: (- Кa) = 3,08, т.е. Кa = - 3,08, и по­это­му


Дата публикования: 2014-11-29; Прочитано: 517 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...