Вы находитесь на странице: 1из 19

Федеральное государственное образовательное бюджетное учреждение

высшего образования
«ФИНАН

«ФИНАНСОВЫЙ УНИВЕРСИТЕТ ПРИ ПРАВИТЕЛЬСТВЕ


РОССИЙСКОЙ ФЕДЕРАЦИИ»

Департамент анализа данных, принятия решений и финансовых технологий

С.А.Зададаев

Творческое задание: социологический опрос

Учебно-методическое пособие для самостоятельного изучения


по теме творческого задания дисциплины «Анализ данных»

Для бакалавров направления 38.03.01 «Экономика»

Электронное издание

Москва 2018
УДК 519.85
ББК 32.973

З-15 Зададаев С.А.

Творческое задание: социологический опрос. Учебно-методическое пособие для


самостоятельного изучения по теме творческого задания дисциплины «Анализ данных». –
М.: Финуниверситет, 2018. – 40с. (для бакалавров)
ISBN
В учебном пособии излагаются IT-принципы организации социологических
опросов и обработки их результатов на языке R.
Структурно учебное пособие представляет собой 2 темы по изучению и
применению средств Microsoft Forms в приложении социологического исследования
дисциплины «Анализ данных», которая читается в Финансовом университете при
Правительстве РФ на втором курсе общеэкономических специальностей.
Учебное пособие будет полезно всем студентам вторых и третьих курсов,
изучающих применение современных вычислительных технологий в анализе данных и
эконометрике, а также всем тем, кто хочет попрактиковаться в программировании на
языке R.
Учебное пособие будет полезно аспирантам, научным сотрудникам и
преподавателям.

УДК 519.85
ББК 32.973

Учебное издание
Зададаев Сергей Алексеевич

Творческое задание: социологический опрос


Учебное пособие

Компьютерный набор, верстка С.А.Зададаев


Формат 60x90/16. Гарнитура Times New Roman
Усл. п.л. 2,5. Изд. № - 2018.
Заказ № ______
Электронное издание

© Зададаев Сергей Алексеевич, 2018.


Оглавление
Введение....................................................................................................................................................4
Microsoft Forms........................................................................................................................................5
Анкета опроса......................................................................................................................................5
Платформа опроса...............................................................................................................................8
Получение результатов анкетирования........................................................................................15
Творческое задание...............................................................................................................................18
Исследование......................................................................................................................................18
Критерии оценки...............................................................................................................................19
Список используемой литературы.....................................................................................................19
Введение

Изучение дисциплины «Анализ данных» преследует несколько целей,


одной из которых является развитие умения быстро и качественно
составлять, проводить и обрабатывать какой-либо социологический опрос.
Фактически любое наше желание узнать мнение достаточно большой группы
людей так или иначе связано с необходимостью проведения
социологического исследования.

В данном пособии мы в большей степени остановимся на технических


и математических аспектах анкетирования, оставляя содержательные
вопросы социологии и психологии за рамками рассмотрения. Впрочем,
наших житейских представлений о коммуникациях между людьми здесь
будет вполне достаточно.

При обработке данных мы будем использовать язык R и его связь с


xlsx-файлами Excel, поэтому нам необходимо настроить RStudio на
соответствующую работу, корректно установив библиотеку xlsx и несколько
java-приложений (подробнее см. [1]).
Microsoft Forms

Анкета опроса

Прежде, чем реализовывать наш исследовательский интерес,


необходимо составить перечень вопросов и возможных вариантов ответов на
них. Здесь надо отметить, как минимум, три важные особенности, учет
которых сильно облегчит последующую обработку результатов или вообще
сделает ее возможной.

Первое, на что необходимо обратить внимание, это существующие


интерпретации ваших вопросов. Если вопрос можно неоднозначно
трактовать, то наше исследование стремительно потеряет актуальность,
смешивая мнение разных людей о разных предметах.

Второе – это формат ответа (перечень из списка, ввод чисел или


текстовых строк, открытый ответ). Для исключения ошибок ввода важно
правильно изначально чисто технически ограничить возможные варианты
ответов.

Третий момент связан с наличием в анкете вопросов с открытым


вариантом ответа, т.е. таких вопросов, на которые респондент должен ввести
осмысленный текст в одно или несколько предложений. Мы ничего не имеем
против таких ответов, но вы должны ясно понимать, что анализ таких
ответов при больших объемах выборки потребует привлечения значительных
человеческих ресурсов либо использования серьезных алгоритмов
содержательной обработки текста, начиная от специфических нейросетей и
заканчивая общими методами контент-анализа. Вручную ответы открытого
типа в «одиночку» не обработать.
Прокомментируем специфику таких опросов на примере очень
простого анонимного анкетирования. Будем задавать респондентам всего три
вопроса:

1. Каков цвет ваших глаз? (Ответ: конкретный цвет в одно слово)


2. Каков вес Вашего завтрака в граммах? (Ответ: конкретный вес в
граммах)
3. Какие продукты Вы едите на завтрак? (Ответ: выбор основных
категорий)

Сейчас нам абсолютно не важно: имеет ли внешний научный смысл


наш опрос или нет. Мы не выдвигаем никаких первоначальных гипотез о
тайной связи цвета глаз и завтрака и не собираемся их проверять. Все, что мы
хотим, – это понять: насколько мы оказались далеки от настоящего опроса и
как исправить наши вопросы/ответы, составив в итоге корректную анкету.

Начнем с цвета глаз. Ученые выделяют от 12 до 16 основных


цветовых категорий, хотя оттенков цвета глаз существует бесконечное не
перечисляемое количество. Что же мы получим в итоге ответа на наш
вопрос? Кто-то ограничится обычным «карий» или «зеленый», а кто-то явно
романтичнее укажет «цвета виски» или «малахитовый». Но и «карий» можно
выдать по-разному: «Карий», «карий», «кареглазый», «цвет карий», «каррий»
и т.д.

В таких случаях требуется первоначально выделить интересующие нас


категории, причем их количество должно быть согласовано с количеством
респондентов. Если мы хотим опросить всего 20 человек, то 16 цветовых
категорий будет несоизмеримо огромным числом (подумайте почему). Для
определенности остановимся на следующих четырех категориях:
«карие», «зеленые», «голубые» и «серые».

Однако, подобного списка будет категорически недостаточно, т.к. он не


перечисляет все возможности и, если респондент не находит свой вариант
ответа, то он ставит любой случайный, но при проведении опросов меньше
всего хотят получить случайные ответы. Поэтому добавим еще один вариант
«другой цвет» для оставшихся цветовых значений:
«карие», «зеленые», «голубые», «серые» и «другой цвет»
– вот наши исчерпывающие категории ответов. С первым вопросом в анкете
мы разобрались.

Каков вес завтрака?

Переходя ко второму вопросу, обратим внимание, что здесь речь идет


уже не о категории, а о числовом значении (Каков вес Вашего завтрака в
граммах?). Однако, проанализируем, как можно понимать этот вопрос,
насколько его формулировка в целом корректна?

Завтрак завтраку рознь. Сегодня я съел 470 граммов, а вчера – 380 (это
без учета кофе). А напитки считать? А мюсли в молоке – это напиток? В
среднем можно оценить, что разница между весом завтраков с напитками и
без – 250 граммов, а между различными днями варьируется в пределах 100
граммов, т.е. в сумме неоднозначность вопроса в среднем составляет 350
граммов, что соизмеримо с весом самого завтрака! В итоге наши результаты
по такому вопросу будут ничтожными a priory.

Нам необходимо уточнить вопрос, а для этого необходимо понять что


именно нас интересует: вес съеденной пищи (с учетом жидкости или без)
или полученные калории, инвариантные относительно всех массовых
ньюансов? Остановимся на первом варианте без напитков и используем
слова «примерно» и «в среднем», чтобы не спрашивать о конкретном
завтраке:
Каков примерный вес всех продуктов без напитков, которые Вы
съедаете в среднем на завтрак? Ответ приведите в граммах.

Какие продукты Вы едите на завтрак?


В этом вопросе нет ничего некорректного, если правильно определить
гастрономические категории, которые могут быть выбраны, причем,
выбраны заметим, одновременно! В этом основное отличие от первого
вопроса с цветом глаз, где выбор исключает другие варианты ответа.
Определим перечень таким: «зерновые», «кисломолочные», «мясо/рыба»,
«овощи/фрукты», «другое».

Платформа опроса

Мы собираемся разместить нашу анкету в интернете для свободного


доступа к участию всех желающих и сделать это хотели бы бесплатно. Есть
много примерно эквивалентных друг другу ресурсов, но мы остановимся на
платформе Microsoft Forms, для чего в браузере запустим ссылку:
https://forms.office.com/ (см. рис 1.)

Рисунок 1.

Далее нажимаем кнопку «Начало работы» и заходим под своей учеткой


(см. рис.2).
Рисунок 2.

Замечание. Всем студентам Финуниверситета автоматически присвоена учетная


корпоративная запись в Microsoft – генеральном партнере Финуниверситета. Впрочем,
учетку можно создать и не связанную с университетом.

Далее указываем пароль (см. рис.3)

Рисунок 3.
и попадаем в свой кабинет Microsoft Forms. Со временем у вас появится
несколько проектов (анкет и тестов), и Ваш кабинет станет похож на кабинет
автора (см. рис. 4).
Рисунок 4.

Для создания нашего опроса жмем кнопку «Создать форму» (см. рис.5)

Рисунок 5.
Далее все интуитивно просто: двойной щелчок левой мыши по
названию активизирует его редакцию, а одинарный левый клик по кнопке
«+Добавить вопрос» – открывает редакцию вопроса анкеты.
Попробуйте получить следующий вид анкеты (см. рис. 6) с
оформленным титулом и первым вопросом.

Рисунок 6.

Обратите внимание на правый нижний угол экрана на рисунке 6 – там


активировано поле «Обязательно», которое указывает на то, что без ответа на
этот вопрос, анкета не будет принята, т.е. этот вопрос обязательный в
анкетировании. А вот кнопку «Добавить вариант ''Другое''» нажимать не
следует, т.к. в этом случае будет добавлено поле с открытым вариантом
ввода.

Действуя аналогично, попробуем запрограммировать второй вопрос


нашей анкеты (см. рис. 7).
Рисунок 7.

Здесь важно установить ограничения на ответ. На рисунке 7 справа


внизу указываем на значок расширенных функций и выбираем пункт
«Ограничения» (см. рис 8.).

Рисунок 8.
Мы выбрали ответ в виде «Числа» с естественными ограничениями не
отрицательности и не превышающим одного килограмма, но можно было бы
выбрать просто «Число», что не исключало в дальнейшем большие
случайные вылеты.
С третьим вопросом все уже совсем несложно (рис. 9).

Рисунок 9.

Единственное принципиальное отличие – это разрешение нескольких


вариантов ответа (см. красную стрелку на рис. 9). И, да! Мы добавили
открытый вариант ответа на «Другое» исключительно для разнообразия, хотя
в целом эту идею здесь не поддерживаем.

Итак, наша анкета готова! Давайте запустим ее в «народ». Для этого


достаточно нажать на кнопку «Поделиться» (справа вверху окна) и чуть ниже
появившуюся кнопку «Копировать», которая скопирует web-адрес на нашу
форму (анкету) в буфер обмена (см. на красные стрелки рис. 10).
Рисунок 10.
Важным моментом является правильно установить аудиторию
опрашиваемых респондентов. По умолчанию установлено, что анкету могут
заполнить только пользователи из «моей организации» – это естественная
позиция, т.к. автор зашел под своей корпоративной учетной записью. Чтобы
это изменить, щелкните левой кнопкой мыши по галочке, на которую
указывает синяя стрелка (см. рис. 10) и выберите «Может ответить любой
пользователь со ссылкой» (см. рис 11)

Рисунок 11.
Теперь остается прислать по электронной почте или вывесить на сайте
ссылку на наше анкетирование (она скопирована в буфер обмена) и
дождаться результатов. Для того, чтобы более детально управлять
характеристиками опроса, достаточно щелкнуть на правый верхний угол
окна и выбрать «Параметры» (см. рис. 12).
Рисунок 12.

Получение результатов анкетирования

Через определенное время ответы на форму будут накоплены и надо


понять, как их скачать в приемлемом формате. Щелкним по второй вкладке
«Ответы» и, если ответы есть, получим краткий отчет (см. рис.13)
Рисунок 13.

Красная стрелка на рисунке 13 указывает на вкладку «Ответы», синяя –


на кнопку «Просмотреть результаты», а желтая – формирует Excel-файл и
предлагает сохранить его на диск.
После того, как мы скачали файл результатов опроса (см. файл «Цвет
глаз и завтрак(1-5).xlsx» в папке 8, откроем его в Excel и посмотрим
структуру данных (см. рис.14)

Рисунок 13.

Обратим внимание на ряд особенностей.

1. Поля «Почта» и «Имя» оказались фактически пустыми, т.к. мы


организовали анонимное анкетирование. Если включить опрос среди
сотрудников «своей организации» (корпоративный домен), то данные
поля будут автоматически заполнены.
2. Первая строка названий столбцов (полей) представлена в виде фильтров.
Если в этом нет необходимости, то можно убрать на вкладке «Данные»
кликом по значку фильтра, предварительно выделив первую строку.
3. Последний столбец G содержит результаты множественного выбора,
перечисляемые через точку с запятой. Такие данные требуется разнести
по отдельным ячейкам и делается это так: выделяем столбец G и
нажимаем на вкладке «Данные» кнопку «Текст по столбцам» (см. рис.
14)

Рисунок 14.

В появившемся окне указываем формат данных с разделителем,


нажимаем кнопку «Далее» и указываем наш разделитель – символ «;» (см.
рис. 15)

Рисунок 15.
И несколько раз кнопку «Далее» и затем «Готово». Множественные
ответы будут разнесены по столбцам справа. Имейте в виду, что
первоначальные данные в этих столбцах будут утеряны.

Полученные в итоге данные могут быть проанализированы как


средствами самого Excel, так и с помощью пакета R, см. например, [1–3].

Творческое задание

Исследование

Проведите свое небольшое социологическое исследование, реализовав


следующий алгоритм действий (возможно больший, чем указано ниже):

1. Определитесь с тем, что Вы хотите исследовать: объект исследования,


представленный группой респондентов, и его исследуемое качество,
свойство, отношение, …
2. Составьте небольшую анкету (3-4 вопроса), ответы на которую
помогут Вам ответить на вопросы исследования. Вопросы должны
содержать как категориальные ответы, так и числовые.
3. Проверьте однозначность вопросов и корректность предлагаемых
ответов.
4. Запрограммируйте свою анкету в Microsoft Forms
5. Запустите интернет-анкетирование среди респондентов (это могут быть
друзья, студенты, случайные интернет-пользователи, люди с форумов
или иных групп,…). Соберите не менее 50, а лучше 100, ответов
респондентов.
6. Скачайте файл ответов и визуализируйте результаты опроса с
помощью Excel или R(RStudio) на Ваше усмотрение. При этом для
категориальных переменных должны быть построены гистограммы, а
для числовых переменных – гистограммы и ящики с усами,
проинтерпретируйте результаты.
7. Оформите и распечатайте результаты в MSWord с краткими выводами
Вашего исследования.

Критерии оценки

– Актуальность исследования: 1 балл


– Программирование анкеты, корректность вопросов и ответов: 1 балл
– Реальность данных на не менее 80 респондентах: 1 балл
– Полнота используемых графических инструментов: 1 балл
– Культура оформления в отчета в Word: 1 балл

Список используемой литературы


1. Зададаев С.А. Визуализация и обработка данных в R. Учебно-
методическое пособие для самостоятельного изучения по темам
визуализации дисциплины «Анализ данных». – М.: Финуниверситет,
2018. – 40с. для бакалавров (электронное издание)
2. В. И. Соловьев. Анализ данных в экономике. Теория вероятностей и
прикладная статистика в Microsoft Excel: учебник – Москва: КНОРУС,
2018. – 387 с. – (Бакалавриат)
3. С.А. Зададаев. Математика на языке R: учебник / Финансовый
университет при Правительстве РФ. – Москва: ПРОМЕТЕЙ, 2018. –
324 с. (Учебники для вузов. Специальная литература)