Процедури формування репрезентативної вибірки
В основі формування лежить принцип випадковості або рандомізації.
Дві умови випадковості вибірки:
1. Вибірка повинна бути побудована таким чином, щоб кожний об’єкт генеральної сукупності мав рівні можливості бути відібраним до вибірки.
2. Вибірка повинна бути побудована таким чином щоб будь-яке сполучення з “н” об’єктів мало рівні можливості бути відібраним до вибірки.
Способи отримання вибірки:
v Проста (лотерея). Кожному об’єкту привласнюється номер випадковим чином. N - розмір генеральної сукупності, n - розмір вибірки.
v Систематична випадкова вибірка. Треба мати генеральну сукупність у вигляді деякого списку. Визначаємо розмір вибірки. І ділимо N/n і отримаємо число k. Кожний k-тий об’єкт потрапить до нашої вибірки.
v Кластерна вибірка. Замість людей ми розглядаємо їхнє місце проживання.
v Стратифікована. Якщо у нас є вся генеральна сукупність, нас цікавить лише невелика частинка цієї сукупності. Тут треба розподіляти генеральну сукупність на ту що нас дуже цікавить і та, що не дуже. І потім їх аналізуємо по 1 або 2 методі, а потім об’єднуємо.
v Квотна вибріка. Ми формування цієї вибірки елементи генеральної сукупності класифікуються відповідно до певинх характеристик та ознак та відбрираються об’єкти до вибірки в тій пропорції в якій ця ознака присутня у генеральній сукупності.
v Експертна вибірка. просто експерт каже що треба взяти до вибірки, а що ні.
Найбільш важливим фактором є гомогенність – це степінь близькості елементів один до одного, якщо в генеральній сукупності кожен елемент в точно такий самий як і інший, то для отримання репрезентативної вибірки достатньо обрати будь-який елемент генеральної сукупності, в цьому випадку сукупність називається цілком гомогенною.
Генеральна сукупність в якій елементи відрізняються – цілком гетерогенна.
Щоб отримати репрезентативну вибірку, потрібно обрати всі елементи. У випадку стратифікованого формування вибірки підвищується гомогенність.
| Припустимий відсоток помилки вибірки
| Степінь впевненості 0,95
| Степінь впевненості 0,99
| | +-1
| 10 000
| 22 500
| | +-2
| 2 500
| 5 625
| | +-3
| 1 111
| 2 500
| | +-4
| 625
| 1 406
| | +-5
| 400
| 900
| | +-10
| 100
| -
| 2 методи використання
Метод 1
Перший фактор:
Можемо задати рівень помилки вибірки, який ми згодні допустити і степінь впевненості, з якою будемо діяти. Наприклад, задаємо +-4, степінь впевненості 0,99. Означає, що будь-який вимір, який можемо зробити у вибірці, буде відхилятись не більше ніж на 4% від істиного значення генеральної сукупності.
Опитування перед виборами і партія отримала 39%, помилка +-4. Означає, що голоси потраплять в інтервал від 39% до 43%
Точність результату – помилка вибірки. Для точності результату краще менше значення помилки вибірки +-3, +-1.
Точність пронозу зростає тим більше чим менша помилка вибірки.
1406 – розмір вибірки, стільки голосів, яких можемо опитати (на перетині +-4 та 0,99)
Якщо помилка вибірки зменшиться, то розмір вибірки збільшується +-3 та 0,99 – на перетині 2 500
Помилка менша – розмір вибірки більший.
Другий фактор:
Степінь впевненості – означає імовірність того, що наша вибірка дійсно буде репрезентативною. Для обраної генеральної сукупності в рамках заданого степеня точності.
0,95 – означає, що їі 100% вибірки даного об’єму, отриманих із однієї і тієї ж генеральної сукупності, 95% витримали тест на точність, а 5% і відповідно з 0,99 – якщо отриманий 100% результат, то 99% потрапляє в інтервал, а один – ні.
Чим вищий степінь впевненості - тим точніший буде результат.
Залежність розміру вибірки від степеня впевненості – чим вищий степінь впевненості тим суттєвіше збільшується розмір вибірки.
Висновок: чим нижчий рівень помилки і чим вищий ступень впевненості – тим краще для дослідження.
Метод 2
Вже є вибірка, заданий розмір вибірки і тоді обираємо впевненість і розмір помилки.
|