Вы находитесь на странице: 1из 10

Выборочное наблюдение

Теоретическая часть
В статистике существует два способа наблюдения массовых явлений в
зависимости от полноты охвата объекта: сплошное и не сплошное.
Разновидностью не сплошного наблюдения является выборочное
наблюдение.
Под выборочным наблюдением понимается не сплошное наблюдение,
при котором статистическому обследованию (наблюдению) подвергаются
единицы изучаемой совокупности, отобранные случайным образом.
Выборочное наблюдение ставит перед собой задачу – по обследуемой
части дать характеристику всей совокупности единиц при условии
соблюдения всех правил и принципов проведения статистического
наблюдения и научно организованной работы по отбору единиц.
Совокупность отобранных для обследования единиц в статистике
принято называть выборочной совокупностью, а совокупность единиц, из
которых производится отбор, называют генеральной совокупностью.
Основные характеристики генеральной и выборочной совокупности
представлены в таблице 1.
Таблица 1 - Основные характеристики генеральной и
выборочной совокупности
Обозначение или формула
Генеральная Выборочная
Показатель
совокупность совокупность
Число единиц N n  
Число единиц, обладающих каким-либо
M m  
признаком
Доля единиц, обладающих этим
p = M/N ω = m/n  
признаком
Доля единиц, не обладающих этим
q=1-p 1-ω  
признаком
Средняя величина признака  
Дисперсия признака  
Дисперсия альтернативного признака
pq ω (1 - ω)  
(дисперсия доли)
При проведении выборочного наблюдения возникают систематические
и случайные ошибки. Систематические ошибки возникают в силу нарушения
правил отбора единиц в выборку. Изменив правила отбора, от таких ошибок
можно избавиться.

Случайные ошибки возникают в силу не сплошного характера


обследования. Иначе их называют ошибками репрезентативности
(представительности). Случайные ошибки разделяют на средние и

1
предельные ошибки выборки, которые определяются как при расчете
признака, так и при расчете доли.
Средние и предельные ошибки связаны следующим
соотношением:Δ = tμ, где Δ - предельная ошибка выборки, μ - средняя
ошибка выборки, t - коэффициент доверия, определяемый в зависимости от
уровня вероятности.
В таблице 2 приведены некоторые значения t, взятые из теории
вероятностей.

  Таблица 2 - Соответствие некоторых


значений вероятностей коэффициенту
доверия
Вероятность, Р 0,683 0,866 0,954 0,988 0,997 0,999
Значение t 1,0 1,5 2,0 2,5 3,0 3,5

Величина средней ошибки выборки рассчитывается


дифференцированно в зависимости от способа отбора и процедуры выборки.
Основные формулы для расчета ошибок выборки представлены в
таблице 3.
Таблица 3 - Основные формулы для расчета ошибок
выборки при повторном и бесповторном отборе
Обозначение и формула
Генеральная  Выборочная
Показатель
совокупность совокупность
Средняя ошибка признака при
 
случайном повторном отборе

Средняя ошибка доли при


 
случайном повторном отборе
Предельная ошибка признака
при случайном повторном  
отборе
Предельная ошибка доли при
 
случайном повторном отборе
Средняя ошибка признака при
случайном бесповторном  
отборе
Средняя ошибка доли при
случайном бесповторном  
отборе

2
Предельная ошибка признака
при случайном бесповторном  
отборе
Предельная ошибка доли при
случайном бесповторном  
отборе

Расчет средней и предельной ошибок выборки позволяет


определить возможные пределы, в которых будут находиться
характеристики генеральной совокупности.

Например, для выборочной средней такие пределы устанавливаются на


основе следующих соотношений:

- пределы доли признака в генеральной совокупности р.

Пример 1. Результаты выборочного обследования незанятого


населения

Возраст, лет до 25 25-35 35-45 45-55 55 и


более

Численность лиц данного возраста 15 37 71 45 22

С вероятностью 0,954 определите границы:


а) среднего возраста незанятого населения;
б) доли (удельного веса) лиц, моложе 25 лет, в общей численности
незанятого населения.

Решение. Для определения средней ошибки выборки нам


необходимо, прежде всего рассчитать выборочную среднюю величину
и дисперсию изучаемого признака, данные для расчета которых
приведены в табл. 4

3
Таблица 4
Расчет среднего возраста незанятого населения и дисперсии

Численность лиц
Середина
Возраст, лет x данного xf x2f
интервала x
возраста f

15- 25  15 20  300  6000 

25-35  37 30 1110  33300 

35-45 71 40  2840 113600

45-55 45 50  2250  112500 

55 -65 22 60 1320 79200

Итого 190 - 7820 344600

Средняя ошибка выборки составит:

 года.

Определим с вероятностью 0,954 (t = 2) предельную ошибку выборки:

 года.

Установим границы генеральной средней: 41,2 - 1,6  5 41,2+1,6


или:

39.6  42.8

Вывод: Таким образом, на основании проведенного выборочного


обследования с вероятностью 0,954 можно заключить, что средний
возраст незанятого населения, ищущего работу, лежит в пределах от 40
до 43 лет.

4
Для ответа на вопрос, поставленный в пункте «б» данного примера, по
выборочным данным определим долю лиц в возрасте до 25 лет и
рассчитаем дисперсию доли:

Рассчитаем среднюю ошибку выборки:

Предельная ошибка выборки с заданной вероятностью составит:

Определим границы генеральной доли:

 или

Вывод: Следовательно, с вероятностью 0,954 можно утверждать, что


доля лиц в возрасте до 25 лет в общей численности незанятого
населения находится в пределах от 3,9 до 1 1,9%.

При расчете средней ошибки собственно-случайной бесповторной


выборки необходимо учитывать поправку на бес повторность отбора

где N - объем (число единиц) генеральной совокупности

Необходимый объем собственно-случайной повторной


выборки определяется по формуле:

Если отбор бесповторный, то формула приобретает следующий вид:

5
Полученный на основе использования этих формул результат всегда
округляется в большую сторону до целого значения.

Пример 2. Необходимо определить, сколько учащихся первых классов


школ района необходимо отобрать в порядке собственно-случайной
бесповторной выборки, чтобы с вероятностью 0,997 определить
границы среднего роста первоклассников с предельной ошибкой 2 см.
Известно, что всего в первых классах школ района обучается 1100
учеников, а дисперсия роста по результатам аналогичного
обследования в другом районе составила 24.

Решение. Необходимый объем выборки при уровне вероятности 0,997


(t = 3) составит:

Таким образом, для получения данных о среднем росте


первоклассников с заданной точностью необходимо обследовать 52
школьника.

 Механическая выборка. Данная выборка заключается в отборе


единиц из общего списка единиц генеральной совокупности через
равные интервалы в соответствии с установленным процентом отбора.
При решении задач на определение средней ошибки механической
выборки, а также необходимой ее численности, следует использовать
приведенные выше формулы, применяемые при собственно-случайном
бесповторном отборе.

Типическая выборка. Эта выборка применяется в тех случаях, когда


единицы генеральной совокупности объединены в несколько крупных
типичных групп. Отбор единиц в выборку производится внутри этих
групп пропорционально их объему на основе использования
собственно-случайной или механической выборки (при наличии
необходимой информации отбор также может производиться
пропорционально вариации изучаемого признака в группах).
Средняя ошибка типической выборки определяется по формулам:

 (повторный отбор);

 (бесповторный отбор),

где  - средняя из внутригрупповых дисперсией.


6
Пример 3. В целях изучения доходов населения по трем районам
области сформирована 2%-ная выборка, пропорциональная
численности населения этих районов. Полученные результаты
представлены в табл. 5

Таблица 5
Результаты выборочного обследования доходов населения

Доход в расчете на 1 человека


Численность Обследовано,
Район
населения, чел. чел. средняя, тыс.
дисперсия
руб.

I 120000 2400 2,9 1,3

II 170000 3400 2,5 1,1

III 90000 1800 2,7 1,6

Необходимо определить границы среднедушевых доходов населения по


области в целом при уровне вероятности 0,997.

Решение. Рассчитаем среднюю из внутригрупповых дисперсий:

Средняя и предельная ошибки выборки:

Рассчитаем выборочную среднюю:

тыс.руб.

Вывод: В результате проведенных расчетов с вероятностью 0,997 можно


сделать вывод, что среднедушевые доходы жителей данной области
находятся в следующих границах (тыс. руб.):

7
При определении необходимого объема типической выборки учитывается
средняя из внутригрупповых дисперсий:

 (повторный отбор);

 (бесповторный отбор).

Полученное значение общего объема выборки необходимо распределить по


типическим группам пропорционально их численности, чтобы определить,
какое количество единиц следует отобрать из каждой группы:

где Ni — объем i-и группы;

n, - объем выборки из /-и группы.

Серийная выборка. Эта выборка используется в тех случаях, когда единицы


изучаемой совокупности объединены в небольшие равновеликие группы или
серии. Единицей отбора в этом случае является серия. Серии отбираются с
использованием собственно-случайной либо механической выборки, а
внутри отобранных серий обследуются все без исключения единицы.

В основе расчета средней ошибки серийной выборки лежит межгрупповая


дисперсия:

 (повторный отбор);

 (бесповторный отбор),

где xi - число отобранных i - серий; 

R - общее число серий.

Межгрупповую дисперсию при равновеликих группах вычисляют


следующим образом:

8
где хi — средняя i-и серии;

х — общая средняя по всей выборочной совокупности.

Пример 4: В целях контроля качества комплектующих из партии изделий,


упакованных в 50 ящиков по 20 изделий в каждом, была произведена 10%-
ная серийная выборка. По попавшим в выборку ящикам среднее отклонение
параметров изделия от нормы соответственно составило 9 мм, 11, 12, 8 и 14
мм. С вероятностью 0,954 определите среднее отклонение параметров по
всей партии в целом.

Решение. Выборочная средняя:

 мм.

Величина межгрупповой дисперсии:

С учетом установленной вероятности Р = 0,954 (t = 2) предельная ошибка


выборки составит:

 мм.

Произведенные расчеты позволяют заключить, что среднее отклонение


параметров всех изделий от нормы находится в следующих границах:

Для определения необходимого объема серийной выборки при заданной


предельной ошибке используются следующие формулы:

 (повторный отбор);

 (бесповторный отбор).

9
10

Вам также может понравиться