Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Формули для розрахунку обсягу простої випадкової вибірки



Відбір за якісною ознакою Відбір за кількісною ознакою
безповторний повторний безповторний повторний
n = 4Npq / 0,0025N+4pq n = 4pq / 0,0025 n = 4s2 N / 0,0025N+4 s2 n = 4s2 / 0,0025
n – обсяг вибіркової сукупності, N – обсяг генеральної сукупності, р – доля одиниць з даним значенням ознаки, q = 1–р – доля одиниць, в яких дана ознака відсутня, s2 – дисперсія (характеристика розподілення кількісних ознак)

Якщо для характеристики розподілення кількісних ознак застосовується показник дисперсії, то для якісних ознак це величина pq. Наприклад, обсяг вибірки складає 900 осіб, з них 400 - чоловіки, 500 – жінки:

pq = 400/900 Х (1 – 400/900)» 0,45 Х 0,55» 0,25

Під час повторного відбору вилучені з сукупності одиниці знов повертаються у сукупність та можуть бути відібраними. Це дозволяє зберегти рівну ймовірність влучення у вибірку всіх одиниць сукупності протягом відбору. У практиці соціальних досліджень, як правило, застосовується безповторний відбір, але для розрахунку характеристик простої випадкової вибірки можна скористатися більш простими формулами для повторного відбору.

Процедура вилучення одиниць може здійснюватися із застосуванням лототрона, а також за допомогою таблиці випадкових чисел. Такі таблиці містять велику кількість випадкових чисел обсягом від декількох десятків до мільйону цифр, які можуть бути двох -, трьох -, чотирьох -, п’яти -, шестизначними. Якщо генеральна сукупність, наприклад, складає 2000 осіб, числа, які ми відбиратиме з таблиці, не повинні перевищувати цього значення. В даному випадку нам підійдуть будь-які числа від 1 до 2000. Якщо у таблиці містяться, наприклад, п’ятизначні числа, в нашому випадку використовуються тільки чотири цифри кожного числа (скажімо, перші чотири). При цьому числа, більші за 2000 чи ті, що нам вже зустрілися, слід пропускати. Пересуватися по таблиці можна з будь-якого її місця, вдовж строки чи стовпця.

Якщо список одиниць має електронний аналог (зберігається у пам’яті комп’ютеру), то процедура відбору здійснюється за допомогою генератору випадкових чисел.

Систематичну вибірку часто розглядають як різновид випадкового відбору, хоча вона реалізується дещо іншим способом. Відбір одиниць із списку (основи вибірки) здійснюється через певний інтервал - крок. Запорука надійності інформації, яку ми отримуємо за допомогою систематичної вибірки, в тому, що порядок розташування одиниць у списку не повинен збігатися із періодичністю у значеннях певної характеристики (наприклад, крок відбору з списку працівників установи дорівнює 20, в той час як кожен 20-й у списку – керівник відділу).

Крок вибірки найчастіше розраховується так:

P = N/n,

де N - обсяг генеральної сукупності, n - обсяг вибірки.

Номер першої одиниці, яка ввійде до ВС, можна визначити випадковим способом (одиниця вибирається із сукупності цифр, що вкладаються у крок) чи наступним чином:

n1= р/2,

де n1 – номер першого респондента, р – крок вибірки.

Коли об’єкт дослідження чи генеральна сукупність є достатньо великими (наприклад, молодь України, молоді сім’ї міста і т.п.), процес конструювання вибірки протікає в декілька стадій, а вибірка має характер багатоступеневої.

Необхідність застосування багатоступеневої вибірки пов’язана з тим, що іноді неможливо чи недоцільно з точки зору трудомісткості та ресурсозатратності скласти повний список одиниць генеральної сукупності. В даному випадку на початковому та кожному проміжному етапі відбираються об'єкти репрезентації (одиниці відбору), а лише на заключному - одиниці спостереження, наприклад, область – район – мікрорайон – квартал – дім – квартира – сім’я. Багатоступенева вибірка позбавляє нас необхідності збирання інформації щодо всіх без виключення одиниць спостереження, що входять до генеральної сукупності. До того ж, як правило, відомою є інформація щодо основних ознак об’єктів репрезентації на кожному з етапів (ними можуть бути географічні регіони, політико-адміністративні одиниці, підприємства, установи, навчальні заклади).

Основний недолік багатоступеневої вибірки пов’язаний з тим, що кожний етап вносить свій “вклад” у помилку вибірки, тобто чим більшою є кількість етапів, тим більшою буде величина погрішності, яка не підлягає корекції. Наприклад, якщо генеральна сукупність складається з мешканців регіону, необхідно розділити її на таки групи одиниць, які повністю відтворюють її неоднорідність, тобто не забути, наприклад, про мешканців сіл чи малих міст.

Як правило, на першому етапі побудови багатоступеневої вибірки застосовують процедуру стратифікації генеральної сукупності. Страти – це внутрішньо однорідні та відмінні одна від одної частини сукупності, які її повністю вичерпують. Наприклад, територія України поділяється на політико-адміністративні райони, кожен з них - на населені пункти міського і сільського типів, міста розділяються за величиною, територія міст поділена на райони і т.д. Саме таким чином, тобто за територіальною локалізацією респондентів, здійснюється первинна стратифікація у більшості крупномасштабних досліджень з молодіжної проблематики (звідси й інша назва цієї процедури – районування).

Стратифікацію доречно продовжувати, доки не буде досягнуто певної рівномірності розподілу ознаки усередині кожної із страт: наприклад, сукупність "міста України" є неоднорідною за рядом критеріїв, насамперед, за величиною міст, тому її доцільно стратифікувати за критерієм величина (кількість населення): великі міста - середні міста - малі міста. Усередині отриманих страт однорідність розглянутої ознаки буде більшою, ніж між стратами; наприклад, великі міста несхожі з малими, але водночас схожі між собою.

Фактично стратифікація є процедурою формування декількох окремих випадкових підвибірок із певної сукупності, які потім об’єднуються у одну. Чисельність одиниць, які відбираються з кожної страти, можна визначити декількома способами.

1. З кожної страти відбирається та чисельність одиниць, яка пропорційна обсягу страти:

ni = n Ni /N,

де n – обсяг вибірки, N – обсяг генеральної сукупності, Ni – обсяг і-й страти.

Наприклад, якщо кількість сімей у області дорівнює 1,16 млн.(генеральна сукупність), з них 244,76 тис. - молоді сім’ї, обсяг вибірки – 1000 одиниць, то кількість осіб, які відбиратимуться з страти “молоді сім’ї”, дорівнюватиме 211.

2. Чисельність одиниць у кожній підвибірці пропорційна середньоквадратичному відхиленню si у і-й страті (цей показник розраховується за результатами пробного дослідження):

l

ni = n Ni si / S Njsj,

J=1

де n – обсяг вибірки, Ni – обсяг і-й страти, l – кількість груп.

3. З кожної страти відбирається однакова кількість одиниць:

N1 = N2 = N3 =....= Nk

В даному випадку ігнорується розбіжність у чисельності різних страт генеральної сукупності, але водночас з’являється можливість представити у вибірці достатнім чином малочисельні страти.

Якщо на певному етапі стратифікації досягнута однорідність у розподіленні цікавої для дослідника ознаки, як правило, здійснюється процедура виділення гнізд, чи серій (серійна вибірка). На відміну від страт, гнізда є схожими між собою, тобто порівняно однорідними за певною ознакою утвореннями. Нехай генеральну сукупність складають школи міста та в цій сукупності були виділені різні страти, скажімо, державні та приватні навчальні заклади. Всередині кожної з страт досягнута однорідність розподілення ознаки – форма власності освітнього закладу; це означає, що в кожній з страт знаходитимуться порівняно схожі об’єкти – гнізда. На цьому етапі слід відібрати, наприклад, по одному гнізду з кожної страти. На наступному етапі робиться відбір шкільних класів (які теж виступатимуть гніздами, якщо принцип комплектування класів є однаковим) для подальшого обстеження.

Як правило, серіями вважають сім’ї, бригади на підприємствах (якщо вони є схожими між собою за певною значимою ознакою, скажімо, за умовами праці), поштові відділення і т.д. Відібрані у вибірку серії підлягають суцільному чи вибірковому обстеженню [37, с.216]. Треба відзначити, що за умови суцільного обстеження відібраних гнізд однорідність об’єктів всередині кожного з них занадто занижує дисперсію ознаки порівняно з генеральною сукупністю (наприклад, учні конкретного шкільного класу чи працівники певного колективу та, тим більш, члени однієї сім’ї, матимуть багато спільних рис).

Зробити відбір певного гнізда (серії) із страти можна наступними способами:

4. за випадковим принципом,

5. за принципом типовості гнізда; зокрема, на типовість гнізда можуть вказати експерти; для цього, як правило, опитують трьох експертів, та якщо їхні думки відразу ж сходяться, виділяють для обстеження зазначене ними гніздо, якщо ні – кількість експертів збільшується [34, с.111]

На останньому етапі реалізації власне випадкового чи систематичного відбору перед інтерв’юером, як правило, постає завдання відбору конкретного респондента з кола потенційно можливих. Як правило, на цьому етапі застосовується так званий маршрутний метод. Якщо відбір респондентів здійснюється за допомогою покрокової вибірки, на основі карт місцевості розробляється схема маршруту опитування, в яку заносяться всі житлові будівлі (крім готелів, житлових церковних споруд і т.і.), що зустрічаються на цьому маршруті. У вибірку потрапляє, скажімо, кожна третя будівля (якщо крок дорівнює трьом). Якщо на шляху інтерв’юера зустрічаються багатоквартирні будівлі, то для визначення номеру квартири, як правило, кількість квартир у будинку ділиться на крок вибірки (якщо кількість під’їздів не перевищує трьох); якщо ж кількість під’їздів понад три, кожний під’їзд розглядається як окрема будівля. Якщо опитування за відібраною адресою здійснити немає можливості, відбирається наступна за порядком, але крок при цьому не зміщується.

Для відбору респондента з сім’ї складається повний перелік її членів (за виключенням тих, хто за своїми характеристиками не входить до об’єкту дослідження, наприклад, неповнолітніх). Спочатку переписуються всі особи чоловічої статі у порядку збільшення віку, потім у такому ж порядку – жінки. Із складеного списку відбирається один респондент випадковим чином. Для цього інтерв’юеру видається спеціальна таблиця, зразок якої наводиться нижче (див. таблицю 5).

Таблиця 5

Таблиця для визначення члена сім’ї, якій підлягатиме опитуванню

Кількість членів сім’ї
          6 та більше
Обведіть цифру, яка стоїть на пересіченні позначеної стрічки та стовпця під кількістю членів сім’ї. Ця цифра – номер члена сім’ї, якого необхідно опитати
             
             
Ö 3            
             
             
             
             
             

Якщо відібрана сім’я недоступна під час всього періоду опитування, або нікого з її членів не вдається застати вдома протягом трьох відвідувань, інтерв’юер вправі не опитувати респондента з даної сім’ї. Як правило, в цьому випадку використовуються резервні адреси.

Крім випадкових, у практиці соціальних досліджень, які проводять ЦССМ, активно використовують й невипадкові (цільові) види відбору одиниць спостереження. При цьому найбільш точні результати забезпечує такий різновид цільової вибірки, як квотний відбір.

Застосування квотної вибірки передбачає наявність даних щодо розшарування генеральної сукупності (одночасно чи окремо) за декількома ознаками. Відомості щодо обсягу (частки у генеральній сукупності) кожного шару дозволяють відтворити відповідну частку у вибірці. Таким чином, конструювання квотної вибірки засноване на пропорційній щодо генеральної сукупності представленості кожної її підгрупи у вибірці. Обмеження за важливими з точки зору мети дослідження ознаками (стать, вік, матеріальний статус, освіта і т.д.) називають квотами.

У таблиці 6 вказаний принцип розрахунку чисельності квот, виходячи з параметрів генеральної сукупності, яку складають студенти трьох вузів (N=20334). Критеріями репрезентації (параметрами, за якими вибірка відтворює генеральну сукупність) в даному випадку є тип вузу та курс. Вибірка складала 2% від обсягу генеральної сукупності. Наприклад, якщо на 1 курсі вузу L навчається 2439 студентів, то у вибірку ввійшли 2% - 49 студентів.

Таблиця 6

Квотні параметри (n=Nх2%)

ВУЗ Генеральна сукупність Разом Вибіркова сукупність Разом
Курс Курс
                       
L                            
M           -             -  
N                         -  
Разом                            

Поряд з загальним бланком квот також складаються завдання на опитування для кожного інтерв’юера, де вказується, яку чисельність респондентів слід опитати за кожним з квотних параметрів. Треба зазначити, що метод квот може застосовуватися як на початкових і проміжних етапах побудови багатоступеневої вибірки, так й на останньому етапі при відборі безпосередньо одиниць спостереження. До недоліків методу можна віднести наявність певної свободи інтерв’юера у виборі респондента, довільність у визначенні обсягу вибірки та неможливість оцінити випадкову помилку вибірки внаслідок цільового характеру процедури. Водночас порівняння результатів ідентичних досліджень, проведених із застосуванням різних типів вибірок (імовірнісної та квотної) дозволив констатувати їх максимальну схожість. Що ж стосується помилки вибірки, то її можна приблизно оцінити за контрольними параметрами – характеристиками об’єкта, відомості щодо яких є у дослідника, але вони не враховувалися при побудові вибірки (наприклад, дані щодо розподілень досліджуваних за сімейним станом, типу сім’ї, національності і т.п.). Середнє відхилення за всіма контрольними параметрами може бути умовно прийнято за середню помилку репрезентативності.

Одним з різновидів невипадкового відбору є метод основного масиву, коли аналізу підлягає найбільш представлена у генеральній сукупності (типова) група – наприклад, молоді працівники металургійних підприємств міста як досить чисельна та типова підгрупа сукупності “молоді працівники промислових підприємств міста”. Застосування означеного методу можливе лише у випадку, коли дослідник цілком впевнений, що частина генеральної сукупності, яка не потрапила до вибірки, не може суттєво впливати на висновки дослідження.

Іншим різновидом цільового відбору є стихійна вибірка. Основною передумовою її використання є відсутність відомостей щодо генеральної сукупності та неможливість в зв’язку з цим (чи з інших причин, наприклад, з економічних) забезпечити відповідність вибірки генеральній сукупності за всіма ознаками.

Можна виділити декілька різновидів стихійного відбору.

Відбір "першого зустрічного": інтерв’юер опитує тих, кого випадково зустрічає на місці опитування, наприклад, на вулиці, в інших багатолюдних місцях. На добір респондентів цим методом можуть вплинути почуття симпатії чи антипатії, які виникають у інтерв’юера, принцип зручності, безпеки тощо.

При відборі методом "собі подібних" (метод снігової грудки) до вибірки потрапляють, перш за все, індивіди з найближчого оточення інтерв’юера, які рекомендують опитати своїх знайомих і т.д.

Поштові, пресові, теле- та радіоопитування. В даному випадку вибірка складається з тих, хто відгукнувся на прохання взяти участь у опитуванні, та дозволяє, таким чином, з’ясувати думку окремих верств населення. У більшості випадків ми не маємо відомостей щодо точного обсягу та параметрів генеральної сукупності (передплатники газет, телеглядачі, радіослухачі і т.д.), що не дає можливості оцінювати репрезентативність вибірки.

Жодна з вказаних процедур не забезпечує випадковості влучення одиниць сукупності у вибірку, тобто рівності їх шансів стати одиницями спостереження. Внаслідок цих особливостей стихійна вибірка не забезпечує достатнього рівня репрезентативності даних, але може застосовуватися для оперативного одержання ілюстративної інформації з деяких актуальних питань.

Іноді, проводячи вибіркове обстеження, дослідник не ставить за мету побудову репрезентативної за кількісними параметрами вибірку, але намагається відобразити в ній якісні властивості досліджуваного об’єкту. В такому випадку може застосовуватися відбір за аналітичним (експериментальним) принципом. У дослідженні бере участь дві групи – основна та контрольна, які розрізняються за експериментальною ознакою (наприклад, підлітки “групи ризику” та “звичайні” підлітки. За всіма іншими параметрами (стать, вік і т.д.) групи повинні бути максимально ідентичними. Чисельність підгруп може складати 50-100 осіб, але якщо гіпотетичних факторів, які більш ніж один, чисельність осіб у кожній з підгруп збільшується (n=nmink, де k – кількість диференціюючих факторів). Чим більшою за чисельністю буде вибірка, тим з більшою ймовірністю вдасться статистично обґрунтувати гіпотези дослідження [34, С.123 ].

Якщо у сформованій репрезентативній вибірці представників певної соціальної групи недостатньо для того, щоб роботи статистично обґрунтовані висновки, доцільно штучно збільшити чисельність цієї категорії у вибірковій сукупності, тобто застосувати в ипуклу вибірку. Наприклад, при вивченні ціннісних орієнтацій студентської молоді застосовувалася квотна пропорційна вибірка. Опитуванню підлягали 2% студентів кожного вузу, якій потрапив до вибірки. В одному з вузів чисельність відібраних у вибіркову сукупність склала 3 студента, тобто була занадто малою для того, щоб робити статистично значимі порівняння з іншими групами та одержати обґрунтовані висновки щодо існуючих (чи неіснуючих) міжгрупових розбіжностях. Для забезпечення коректного порівняння представників цієї підгрупи з іншими досліджуваними були прийнято рішення включити у вибірку 30% студентів цього вузу, що склало 40 осіб.

Під час загального аналізу результатів дослідження додаткова вибірка виключається з масиву даних, тобто її враховують лише при порівняльному аналізі за підгрупами.





Дата публикования: 2014-11-04; Прочитано: 4635 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...