Вы находитесь на странице: 1из 2

Было реализовано 3 подхода к комбинированию выборок:

1. Усреднение частотного распределения двух выборок, отсортированных в равном


процентном соотношении по переменной «Регион»;
2. Объединение двух выборок, из которых случайным образом отобрано по 500
наблюдений;
3. Комбинирование пропорционально объему выборок (1600 и 824), т.е. с весовыми
коэффициентами 0,66 и 0,34 для интервьюирования и интернет-опроса соответственно.

Таким образом, математическая модель комбинирования выборок имеет следующий вид:


m n
m n
vi = ∑ i+ ∑ i,
m+n 1 m+n 1
где vi – значение измеряемого показателя i в выборке, m и n – объемы выборок для
интервьюирования и интернет-опроса соответственно.

Для каждого подхода было рассчитано среднее значение модуля разности частотного
распределения двух выборок (выборки интервьюирования и комбинированной выборки).
Минимальное из трех полученных значений (3,409%, 4,569% и 2,308%) соответствует 3 подходу
комбинирования, причем это значение меньше размера ошибки выборки интервьюирования (для
выборки опроса ВЦИОМ максимальный размер ошибки составляет 2,5% [2]).

Поскольку две выборки являются независимыми, для оценки различий частотных распределений
был использован непараметрический U-критерий Манна-Уитни [1]. Исходя из небольшого
размера сравниваемых выборок уровень статистической значимости был принят равным 0,05. Для
всех вопросов полученные значения данного критерия оказались больше соответствующих им
критических значений (Uэмп>Uкр(0,05)), из чего был сделан вывод о том, что различия в двух
выборках не являются статистически значимыми и носят случайный характер.

Проверка выборок на однородность показала, что среднее значение модуля расхождений между
частотами не превышает допустимого значения 5% [3]. Проведенная коррекция выборки
интернет-опроса путем ее взвешивания по социально-демографическим показателям выборки
интервьюирования не устранила расхождений в частотных распределениях. Максимальное
изменение расхождения составило 2%.

Вывод: данные, полученные методами интервьюирования и интернет-опроса, имеют небольшие


расхождения, не являющиеся статистически значимыми. При этом социально-демографические
показатели не являются фактором формирования данных расхождений.

1. https://rsmu.ru/fileadmin/templates/DOC/Faculties/PF/Phys-mat/Stat_Hypoth.pdf
2. https://ok.wciom.ru/research/vciom-sputnik#methodology
3. https://intuit.ru/studies/curriculums/20398/courses/402/lecture/9250?page=5

Влияние метода опроса на достижимость респондентов

Для оценки достижимости респондентов проведено сравнение двух социально-демографических


показателей – возраст и регион.

К труднодостижимой категории относятся респонденты в возрасте до 30 лет.


Эксперимент показал, что значительное расхождение при разных методах опроса наблюдается в
числе респондентов двух возрастных групп – 18-29 лет и 30-49 лет. Доля респондентов в возрасте
от 18 до 29 лет в интервьюировании составила 18,1% против 38,85% в интернет-опросе, а для
респондентов в возрасте от 30 до 49 лет – 37,8% в интервьюировании и 15,65% в интернет-опросе.
При этом доли респондентов для двух оставшихся возрастных групп (50 – 59 лет и 60 лет и старше)
примерно равны.

Оценить