Вы находитесь на странице: 1из 592

Маркетинговые исследования

Часть 1

Павлов Николай Вячеславович


pavlov@kafedrapik.ru
Когда нужна маркетинговая информация:

 при формировании стратегических направлений


развития организации;
 при разработке путей достижения стратегических
целей;
 при разработке новых товаров;
 при формировании имиджа организации;
 при планировании кампаний по продвижению
товаров;
 при выборе тематики рекламы;
 ………

Введение 2
Типы маркетинговой информации
 Информация о внешней среде организации.
Официальные печатные источники.
 Демографическая информация. Отчеты о переписях.
 Информация о покупателях. От продавцов и
коммерческих агентов, маркетинговые исследования.
 Общеэкономическая информация. В периодической
печати, Госкомстат.
 Информация о промышленности. Отраслевые обзоры,
новости..., платные отчеты об исследованиях
 Информация о конкурентах. От анализа реклам до
промышленного шпионажа.
 Информация о состоянии организации. Из внутренних
документов.

Введение 3
Получение маркетинговой информации
Маркетинговая информационная система (MIS)
Индивиды, оборудование и процедуры сбора,
сортировки, анализа, оценки и распределения
используемой при принятии маркетинговых решений
своевременной и достоверной информации.
Особенности MIS:
 формат входной информации и способ хранения четко
определены;
 данные в базах данных постоянно обновляются;
 задачи по обработке данных запрограммированы и не
требуют от пользователя квалификации программиста;
 данные представляются в заранее заданном виде всем,
кому они нужны;
 параметры отчетов фиксированы.
Информационно-поисковые системы
Введение>>Источники информации 4
Получение маркетинговой информации

Большие данные — совокупность подходов,


инструментов и методов обработки
структурированных и неструктурированных данных
огромных объёмов и значительного многообразия
для получения воспринимаемых человеком
результатов.
Определяющие характеристики
 объём (volume) - величина физического объёма,
 скорость (velocity) – прироста и обработки,
 многообразие (variety) – структурированные и
неструктурированные.
Введение>>Источники информации 5
Получение маркетинговой информации
Измерения в байтах
ГОСТ 8.417—2002
Название Обозначение Степень
0
байт Б 10
3
Килобайт Кбайт 10
6
мегабайт Мбайт 10
9
гигабайт Гбайт 10
12
терабайт Тбайт 10
15
петабайт Пбайт 10
18
эксабайт Эбайт 10
21
зеттабайт Збайт 10
24
иоттабайт Ибайт 10
Введение>>Источники информации 6
Получение маркетинговой информации

Система поддержки принятия


решений (DSS)

Диалог

MIS Модели

Введение >>Источники информации 7


Получение маркетинговой информации
Модели систем поддержки принятия решений (DSS)

 объединение в группы;
 получение сводных показателей;
 ранжирование;
 выделение особых случаев;
 графическое представление данных.

Введение >>Источники информации 8


Получение маркетинговой информации
Модели систем поддержки принятия решений (DSS)
Особенности
Тип Период Примеры
модели Уровень Используемая применения
моделировани
менеджмента информация
я
Обоснования
скидок
Рабочие Низший Внутренняя День, неделя
Рекомендации
для продавцов
Внешняя Ценообразование
Тактиче
Средний Субъективные Месяц, год Выбор средств
ские
данные рекламы
Оценка объема
Внешняя продаж нового
Стратег продукта
Высший Обычно годы
ические Решение о снятии
Субъективные
продукта
данные
с производства
Введение >>Источники информации 9
Получение маркетинговой информации
Онлайновая аналитическая обработка
(OLAP) + Хранилища данных (Data
Warehouses)

Интеллектуальный анализ данных (Data


Mining)
Процесс обнаружения в сырых
данных
 ранее неизвестных;
 нетривиальных;
 практически полезных;
 доступных интерпретации знаний
для принятия решений
Маркетинговые исследования
Введение >>Источники информации 10
Объем рынка маркетинговых исследований
России 2013 – 2015 гг.
Показатель 2013 2014 2015
Объем рынка, млн долл. США 430 382,7 236
Изменение объема рынка по отношению
к аналогичному периоду прошлого года, +10 -11 -38
%, долл. США
Объем рынка, млрд руб. 13,69 14,58 14,31
Изменение объема рынка по отношению
к аналогичному периоду прошлого года, +13 +6,5 -1
%,
Среднегодовой курс:
31,8 38,5 60,6
доллар США/российский рубль

Введение >>Источники информации 11


Рейтинг маркетинговых агентств, работающих в РФ
(без зарубежных филиалов)
Место в Выручка за 2014, Выручка за 2015,
Название компании
рейтинге млн.руб. млн.руб.

1 TNS 3 188 3 132


2 AC Nielsen 2 541 2 995
3 Ipsos Comcon 2 425 2 185
4 ГФК-РУСЬ 1 633 1 831
5 A/R/M/I-Marketing 803 763
6 РОМИР 310 330
7 МАСМИ 170 181
8 МАГРАМ 148 178
9 Бизнес Аналитика 204 169
10 FDFgroup 89 162
11 О+К 165 151
12 Validata 157 124
13 Фабрика маркетинга 93 118
14 Тибурон 86 107
15 MARC* 88 н/д
16 МаркетСенс 98 84
17 Top of Mind 64 83
18 Mix Research 143 82
19 Online Market Intelligence** >107 >82

20 АС Консалтинг 95 73
21 Радость Понимания 74 63
22 Божоле 62 61

Введение >>Источники информации 12


Определение маркетинговых исследований
Внешняя среда

Продвижение Продукт

Потребитель
Место Цена

Введение >>Определение МИ 13
Определение маркетинговых исследований

Цели деятельности фирмы

Внешние Комплекс
факторы маркетинга Потребитель

Введение >>Определение МИ 14
Определение маркетинговых исследований

Маркетинговые исследования – это


деятельность, которая связывает
 потребителя, покупателя,
 внешнюю среду фирмы
 с маркетинговыми структурами

через информацию, предназначенную для:


 обеспечения достижения целей фирмы;
 мониторинга внешней среды;
 разработки, оценки и корректировки маркетинговых
действий на основе изучения потребителей;
 определения возможностей и проблем маркетинга.

Введение >>Определение МИ 15
Особенности маркетинговых исследований

 в основном прикладной характер;


 в результате ждут рекомендаций;
 жесткие ограничения по времени и ресурсам;
 изменчивый объект управления;
 достоверность проверяется по описанию;
 измерительный прибор приходится
разрабатывать.

Введение >>Особенности 16
Связь с деятельностью организации
Цели
фирмы
Деятел
ьность

Основные вопросы,
маркетинговых
решаемые исследованиями
исследований
Кто покупает товар, где производятся покупки?
Планирова-

Определить Сколько покупателей у товара?


ние

возможности Каковы доходы покупателей?


рынка Расширяется или уменьшается рынок?
Существуют ли другие перспективные рынки?
Каковы должны быть характеристики нового продукта?
Когда выводить на рынок новый продукт?
Продукт
Какую выбрать упаковку?
Решение проблемы

Дать Каким должно быть качество продукта?


информацию Какую цену установить на товар?
Цена
для Как изменить цену?
управления Где и кем продаются товары?
Место
комплексом Как поощрить торговлю?
маркетинга Какие средства выбрать для рекламы
Продви- (газеты, журналы, телевидение, радио)?
жение Как распределить ресурсы между товарами и регионами?
Каковы затраты на продвижение
Выявить Какова доля рынка фирмы (в целом; по районам; по сегментам)?
Управле-

проблемы, Каковы степень удовлетворенности покупателей, состояние сервиса,


ние

спланировать
Введение >>Особенности процент возврата товаров? 17
действия Каков имидж фирмы, какова ее репутация?
Этапы маркетинговых исследований

1. Формулировка проблемы.
2. Проектирование исследований.
3. Проектирование процедуры сбора данных.
4. Проектирование выборки и сбор данных.
5. Анализ и интерпретация данных.
6. Подготовка отчета

Введение>>Этапы 18
Этика маркетинговых исследований

Этика – это моральные стандарты для ситуаций,


связанных с потенциальным вредом индивидууму
или группе.

Введение>>Этика 19
Этика маркетинговых исследований
1. Деонтологический подход (всё должно быть правильно)
1.1. Принцип прав
1.1.1. Критерий универсальности: действия
основываются на общеупотребительных принципах.
1.1.2. Критерий обратимости: для выполняющего
действия желательно применение тех же принципов ко всем,
в том числе и к нему самому.
1.2. Принцип справедливости.
1.2.1. Критерий дистрибутивности: распределение
ресурсов производится согласно общепризнанным
принципам.
1.2.2. Критерий ретрибутивности: наказание нанесшему
вред по собственному сознательному решению
осуществляется пропорционально этому вреду.
1.2.3. Критерий компенсационности: возмещение
убытков пострадавшей стороне производится до исходного
уровня.
2. Утилитаристский подход (должен быть хороший итог)
Введение >>Этика 20
Этика маркетинговых исследований

Утилитаристский подход:

 оцениваются возможные варианты действий;


 способы оценки плюсов и минусов каждого варианта;
 прямые и косвенные последствия для всех, кто им
подвергнется;
 момент начала и длительность последствий;
 социальная и экономическая цена действий;
 находятся альтернативы, дающие максимальный выигрыш
(максимальную разницу между плюсами и минусами)

Введение >>Этика 21
Этические проблемы

Исследователи

Заказчики Респонденты

Введение >>Этика 22
Этические проблемы респондент - исследователь
Ситуация Комментарий
Анонимность Опрашиваемый имеет право знать, кому он
ответов отвечает. Но он не обязан называть свое имя
Стресс при Следует приходить на интервью вовремя,
опросах компенсировать потери времени респондента
Использование Респондент может испытывать страх перед
оборудования сложной техникой, датчиками, электродами. В
случае видео- или звукозаписи – бояться
нарушения инкогнито, возможности шантажа.
Требуется выраженное согласие опрашиваемого
после вводных разъяснений. Исключения могут
составлять случаи, когда ущерб для респондента
мал и нет других способов получения
информации
Ущерб для Вопрос о приемлемости цены товара может
имиджа оказаться "больным" для респондента
Введение >>Этика 23
Этические проблемы респондент - исследователь
Ситуация Комментарий
Человек, считавший себя знатоком марок кофе, не смог
Ущерб
отличить их по вкусу. Надо восполнить моральный ущерб,
самооценке
нанесенный ему в результате теста
Если рассказать о цели исследования перед тестом на
запоминание, то участники будут стараться запомнить
Обман задания получше. Придумывается легенда, а в конце теста
участникам дают разъяснения, принося соответствующие
извинения. Допустимо, если вред мал и нет альтернатив
Неэтично, когда начальник предупреждает, что примет
меры к тем, кто не отвечал на вопросы
Большое количество опросов, чаще всего по телефону,
Принуждение утомляет граждан. В некоторых странах рассматриваются
меры по ограничению телефонных опросов в
законодательном порядке
Статус исследователя влияет на ответы. Респонденты
(особенно – дети и пожилые люди)могут сказать что-то
приятное исследователю или дать ожидаемый им ответ
Введение >>Этика 24
Этические проблемы респондент - исследователь
Ситуация Комментарий
Поведение людей искажается, если они знают о
наблюдении. Надо рассказать обо всем в конце
исследования и ознакомить с отчетом, признавая право
на отказ post factum в его опубликовании
Часто проводится наблюдение за реакцией на новый
Преду- товар, стенд в общественных местах, причем
прежде- посетители не знают об этом. Следует написать на
ние видном месте, что проводится исследование, либо
об лично информировать посетителей об исследовании
исследо- Потеря выгоды контрольной группой вызывает
вании напряжение. Например, лекарство против СПИДа не
проходит проверку с использованием контрольной
группы, так как у людей отнимается шанс выздороветь.
Менее драматическая ситуация – исследование
различных механизмов льгот при покупке: кто-то их
получает, а кто-то – нет.

Введение >>Этика 25
Этические проблемы заказчик - исследователь

 Соблюдение конфиденциальности.
 Профессионализм.
 Корректное использование результатов,
рекомендации.
 На чьей стороне стоять.

Введение >>Этика 26
Этические проблемы в команде

 Собственные убеждения мало влияют на


поведение в организации
 Поведение начальства сильно влияет на
поведение подчиненных.
 Всегда существует множество возможностей для
неэтичного поведения.

Введение >>Этика 27
Этические проблемы

Итог

 Есть кодекс этики маркетинговых исследователей


ESOMAR
 Однозначных рецептов нет
 Надо решать самостоятельно

Введение >>Этика 28
Формулировка проблемы
Тип Источник Объекты маркетингового Основные
проблем проблем исследования вопросы
Неожи- Окружающая среда: демография,
данные экономика, технология, политика, Что
измене- Прошлое законодательство происходит?
ния События в фирме: смена Почему?
ситуации руководства, потеря доли рынка
Запла- Перспективность и
нирован- конкурентоспособность нового
ные продукта
измене- Будущее Зависимость прибыли от цены Как?
ния в
органи- Альтернативные варианты
зации изменений
Случайность Хороша ли идея?
Новые Жалобы покупателей Различные Как ей
идеи воспользоваться?
Отчеты продавцов
Формулировка проблемы 29
Постановка исследовательской проблемы
Проблема управления Проблема исследований
(что надо делать) (что надо выяснить)
Разработать упаковку Какова эффективность
различных проектов упаковки
Открыть новый магазин В каком месте его лучше
расположить
Увеличить оборот магазина Каков существующий имидж
магазина
Увеличить количество Как, кем, в каком количестве
повторных покупок производятся повторные покупки
Какова насыщенность рынка на
Освоить новые регионы существующих и новых
территориях
Распределить бюджет на Каков текущий уровень охвата
рекламу по регионам рынка в этих регионах
Вывести на рынок новый Каков ожидаемый объем продаж,
продукт каков индекс доходности проекта
Формулировка проблемы 30
Почему лучше заказывать исследование

 Собственные специалисты загружены


неравномерно
 Могут понадобиться специальные знания
 Заказчик может остаться анонимным

Введение >>Этика 31
Целесообразность проведения исследований
Проблема: стоит ли открывать магазин при новой
бензозаправочной станции.
Имеются две альтернативы: A1: открывать станцию с магазином;
A2: открывать станцию без магазина.
Количество посетителей может быть большим (ситуация S1) или
малым (ситуация S2).
У лица, принимающего решение, есть мнение относительно
возможностей каждого из событий: P1=P(S1)=0,6 и P2=P(S2)=0,4.
Имеются экспертные оценки прибыли Eij, в миллионах рублей,
которые будут иметь место во всех возможных ситуациях.
S1 S2
A1 E11=30 E12=–20
A2 E21=0 E22=0
Можно заказать маркетинговые исследования стоимостью VИ=5
тыс. руб. Они точно предскажут количество посетителей.
Формулировка проблемы>>Целесообразность 32
Целесообразность проведения исследований
Требуется: выбрать наилучшее решение.
Критерий оптимальности решения – показатель, вычисляемый
для каждой альтернативы. По его значению производится выбор
решения. Для наилучшего решения значение критерия должно
быть экстремальным
(максимальным, если это прибыль
или минимальным, если это затраты).
Возможные критерии.
 Минимизация возможных потерь. (Решение = ?)
 Средняя ожидаемая прибыль (в каких случаях можно
использовать этот критерий?)
 Какие еще можно взять критерии?

Формулировка проблемы >>Целесообразность 33


Дерево решений. Обозначения

Наше решение

Возможность Конечный
Результат результат
варианта

Неуправляемая
ситуация

Формулировка проблемы >>Целесообразность 34


Много
E11
11
A1 Посети P1
Дерево V11 телей
Мало
E12
Нет
решений
12
Есть P2
V1 магазин?
Много
E21
21
A2 Посети P1
V12 телей
Мало
E22
22
P2
Много
E11
11
Проводить A1 Посети P1
маркетинговые V21 телей
Мало
исследования? E12
12
Z1
S Есть P2
P1 магазин?
Много
E21
21
A2 Посети P1
V22
V 12
22 телей
Мало
E22
22
P2
Да Прог-
V2 ноз Много
E11
11
A1 Посети P1
V23 телей
Мало
E12
12
Z2
S Есть P2
P2 магазин?
Много
E21
Z1, Z2 – возможные результаты исследования A2 Посети P1 21

V24 телей
Формулировка проблемы >>Целесообразность Мало 35
E22
22
P2
Решение 1
Маркетинговое исследование не проводим.

Критерий – гарантированный результат

V11=min(E11,E12)= –20 млн. руб. ,

V12=min(E21,E22)=0 ,

V1=max(V11,V12)=0.

Ответ: магазин не открывать, убыток будет не больше 0.

Формулировка проблемы >>Целесообразность 36


Решение 2
Маркетинговое исследование не проводим.

Критерий – средний ожидаемый результат

V11=P1×E11+P2×E21 =0,6×30+0,4×(–20)=10 млн. руб. ,

V12=P1×E12+P2×E22=0,6×0+0,4×0=0 ,

V1=mav(V11,V12)=10 млн. руб.

Ответ: магазин открывать, ожидается прибыль 10 млн. руб.

Формулировка проблемы >>Целесообразность 37


Решение 3

Маркетинговое исследование проводим.


Пока его цену не учитываем.
Считаем, что оно даст истинный прогноз:
«посетителей будет много»; «посетителей будет мало»
Критерий – средний ожидаемый результат
V2=P1(вер. прогноза)*max(E11,E12)+P2*max(E21,E22) – VИ=
=0,6*30+0,4*0 – VИ=18 – VИ млн. руб.
Ответ:
если результат исследования будет «посетителей много»,
то магазин открывать,
если результат исследования будет «посетителей мало»,
то магазин не открывать,

ожидается прибыль 18 млн. руб.

Формулировка проблемы >>Целесообразность 38


Решение 4

Целесообразно ли
проводить исследование за 5 млн.р.?
Без исследования ожидалась прибыль 10 млн. р.,
с бесплатным исследованием 18 млн.р.
Прирост 8 млн.р.

Исследование проводить целесообразно,


если его цена менее 8 млн.р.

Формулировка проблемы >>Целесообразность 39


Не доверяем исследователям!
Исследователи ошибаются.
Их репутация оценивается по таблице.
Z1 – результат исследования: много посетителей
Z2 – результат исследования: мало посетителей
S1, S2 – реальная ситуация.
Q – условные вероятности.
Сумма по столбцам = 1 означает,
что хоть какой-то ответ дают всегда.

S1 S2
Z1 Q11=P(Z1/S1)=0,9 Q12=P(Z1/S2)=0,7
Z2 Q21=P(Z2/S1)=0,1 Q22=P(Z1/S2)=0,3
Итого 1 1

Формулировка проблемы >>Целесообразность 40


Не доверяем исследователям! Перерасчет

Результат Состоя- P(Zk*Sj) = P(Sj/Zk) =


исследо- ние P(Sj) P(Zk/Sj) P(Sj)* P(Zk*Sj)/
вания Zk среды Sj P(Zk/Sj) P(Zk)
S1 0,6 0,9 0,54 0,66
Z 1
S2 0,4 0,7 0,28 0,34
Сумма для Z1 1 – P(Z1)=0,82 1
S1 0,6 0,1 0,06 0,33
Z2
S2 0,4 0,3 0,12 0,67
Сумма для Z2 1 – P(Z2)=0,18 1
Итоговая сумма – – P(Z1)+P(Z2)=1 –

Формулировка проблемы >>Целесообразность 41


Решение 5

Исследование проводим,
но результатам доверяем не совсем
Если исследователи принесут результат Z1:
V(A1/Z1) = P(S1/Z1)E11+P(S2/Z1)E12=
0,66*30+0,34*(-20) = 13 млн. руб.
V(A2/Z1) = P(S1/Z1)E21+P(S2/Z1)E22=
0,66*0+0,34*0=0;
V(Z1) = maxi V(Ai/Z1))=13 млн. руб.

Если принесут результат Z1, то надо принимать решение A1 и


получать +13 млн. руб.
Формулировка проблемы >>Целесообразность 42
Решение 5

Исследование проводим,
но результатам доверяем не совсем
Если исследователи принесут результат Z2:
V(A1/Z2) = P(S1/Z2)E11+P(S2/Z2)E12=
0,33*30+0,67*(-20)=-3,5 млн. руб.
V(A2/Z2) = P(S1/Z2)E21+P(S2/Z2)E22=
0,33*0+0,67*0=0;
V(Z2) = maxi V(Ai/Z2))=0 млн. руб.

Если принесут результат Z2, то надо принимать решение A2 и


получить 0 млн. руб.
Формулировка проблемы >>Целесообразность 43
Решение 5

Исследование проводим,
но результатам доверяем не совсем

Все случаи результатов исследований

VR = V(Z1)P(Z1)+V(Z2)P(Z2)=13×0,82+0×0,18=10,7 млн. руб.

Если принесут результат Z1, то надо принимать решение A1


Если принесут результат Z2, то надо принимать решение A2
Получим 10,7 млн. руб.

Формулировка проблемы >>Целесообразность 44


Какова цена информации. Какой вариант лучше?

Ожидаемый эффект решения


Эффект при полной информации
2 3
Область, где исследования целесообразны
1

Эффект без дополнительной информации

Цена информации

Формулировка проблемы >>Целесообразность 45


Задачи принятия решений в условиях риска

 ограниченное количество состояний среды и альтернатив;


 знание априорных возможностей событий;
 задан критерий оптимальности решения;
 знание возможностей исполнения прогнозов исследования.

Формулировка проблемы >>Целесообразность 46


Проектирование исследований

Типы исследований
 Поисковые
 Описательные
 Причинно-следственные

Количественные
Качественные

Проектирование исследования 47
Цели поисковых исследований
 формулировка проблем для дальнейшего исследования;
 улучшение понимания проблемы;
 выдвижение новых гипотез;
 уточнение концепций, гипотез;
 определение приоритетов в исследованиях.

Гипотеза это утверждение, определяющее, как две или


более измеряемые величины относятся между собой.

Хорошая гипотеза должна давать четкий способ


проверки данного утверждения.

Проектирование исследования>>Поисковые МИ 48
Методы поисковых исследований

 Поиск по литературным источникам


 Обзор опыта = опрос информированных лиц
 Анализ избранных случаев
 Фокус-группы
 Проблемные группы
 Экспертные оценки

Проектирование исследования >>Поисковые МИ 49


Фокус-группы
 Обычно – потребители, обычно – специальная группа;
 8-12 чел;
 1,5 часа;
 есть ведущий.

Примеры
 Что такое качественное образование
 Почему падает посещаемость книжного клуба Снарк
 Хорошо ли оформлен пакет для молока?

Формы проведения:
Очная
Форум
Интернет-конференция
Телефон???
Проектирование исследования >>Поисковые МИ 50
Проблемные группы

 Обычно – специалисты;
 до 10 чел;
 распределение ролей;

Примеры
 Что? Где? Когда?
 Собрания на производстве

Формы проведения:
 Обычно очная

Проектирование исследования >>Поисковые МИ 51


Проблемные группы

Проектирование исследования >>Поисковые МИ 52


Проблемные группы

Проектирование исследования >>Поисковые МИ 53


Опросы экспертов

Индивидуальные (в каких случаях?)


Коллективные (в каких случаях?)

Однократные
Многократные
 Анкетный опрос
Количественные  Систематизация оценок
Качественные  Составление полного
перечня вариантов
 Мозговая атака
 Метод Дельфи
Проектирование исследования >>Поисковые МИ 54
Метод Дельфи

Ожидаемая стоимость проекта

Проектирование исследования >>Поисковые МИ 55


Формула оценки экспертов

v i,Иv i,С v i,О


vi  ,
VИ VС VО
Оценка 1 Оценка 2 Оценка 3
Само- Исследователи; Объективные По
оценка ЛПР показатели Среднее формуле
1 1 1 1,00 1,00
1 1 0,5 0,83 0,50
1 1 0 0,67 0,00
0,5 0,5 0,5 0,50 0,13
0 0 0 0,00 0,00

Проектирование исследования >>Поисковые МИ 56


Формула средневзвешенной количественной
оценки

v X i i
X эксп  i 1
n
,
v
i 1
i

n
X 1
эксп   vi X i .
i 1

Проектирование исследования >>Поисковые МИ 57


Важное в опросах экспертов

1. Опрос почти как обычно, но еще более вежливо


и деликатно!
2. Надо избегать напряженности в группе!
3. Достоверность оценок оценить нельзя!

Проектирование исследования >>Поисковые МИ 58


Цели описательных исследований
Конкретика!
 Описать характеристики определенной группы,
например, «среднего пользователя» – его доход, возраст,
типичное поведение
 Оценить долю людей, которые ведут себя определенным
образом (например, делают покупки преимущественно в
супермаркете), среди всей совокупности.
 Сделать специальный прогноз, например, каким образом
лучше продавать конкретный товар.

Примеры количественных и качественных оценок!

Проектирование исследования >>Описательные МИ 59


Шаблон итоговой таблицы

Количество потребителей, предпочитающих различные


марки кофе, в зависимости от возраста
Предпочитаемая марка
Возраст
Jacobs Tchibo Nescafe
до 30
30 – 39
40 и более

Проектирование исследования >>Описательные МИ 60


Описание вопроса

Пункт описания Описание


Формулировка Сколько упаковок сливочного масла
1
вопроса требуется Вашей семье в месяц?
Количество упаковок сливочного масла,
2 Переменная
покупаемых в месяц на семью
Умножением на вес упаковки получается
3 Информация количество масла, потребляемого семьей
в месяц
1. Для сегментирования потребителей
Причины
по объему потребления товара.
4 включения
2. Для оценки среднего потребления
Вопроса
масла на семью; на одного человека

Проектирование исследования >>Описательные МИ 61


Описание вопроса
Пункт
описания Описание
Потребители разделяются на категории:
Первич- использующие мало мала;
ный использующие много масла
анализ и Анализируются влияние на объем потребления:
инфор-  размера семьи,
5 мацион-
возраста,
ная доходов,
ценность пола,
образования,
цены за упаковку
Сегментирование предполагается по вопросам о
размере упаковки,
Допол- марке,
нитель- качестве,
6 ный составе,
анализ вкусе,
Будет определена важность этих параметров на величину
потребления
Проектирование исследования >>Описательные МИ 62
Описательные исследования

Описательные исследования

Длительные (Траекторные) Разовые (Поперечное сечение)

Классическая Панель Полное Выборочное


панель «омнибус» обследование обследование

Проектирование исследования >>Описательные МИ 63


Исследования с помощью списков
Количество семей, предпочитающих Как считать?
различные марки пельменей
Предпочитали Предпочитали Относительное
Марка
в момент t1 в момент t2 изменение
A 165 183 +11%
B 226 218 -3%
C 214 204 -5%
D 300 300 0%

Всего 905 905

Проектирование исследования >>Описательные МИ 64


Исследования с помощью списков
Количество и процент семей,
покупающих различные марки пельменей
A (t2) B (t2) C (t2) D (t2) Всего для t1
93 33 39
A (t1) 0 (0%) 165 (100%)
(56%) (20%) (24%)
185 41
B (t1) 0 (0%) 0 (0%) 229 (100%)
(82%) (18%)
165 49
C (t1) 0 (0%) 0 (0%) 218 (100%)
(77%) (23%)
90 210
D (t1) 0 (0%) 0 (0%) 300 (100%)
(30%) (70%)
Всего
183 218 204 300 905
для t2
Проектирование исследования >>Описательные МИ 65
Исследование с помощью списков.
Граф переходов

20%
А B
30%
24% 18%
23%
C D

Проектирование исследования >>Описательные МИ 66


Разовое исследование

Потребление
безалкогольных
Возраст
напитков,
л/мес
10 – 19 12
20 – 29 10
30 – 39 8
40 – 49 6
50 и 3
выше
Проектирование исследования >>Описательные МИ 67
Когорта
Когорта – группа индивидов,
которые испытали некоторое событие в одно и то же
время (или в один и тот же временной интервал).
Другие поколения Запада
 Потерянное поколение
 Великое поколение
 Тихое поколение
 Поколение беби-бума
 Поколение X - не верят в Бога, не любят
королеву и не уважают родителей
 Поколение Y - родившиеся с 1978 по 1991 годы,
легко меняют работу, руководят более старыми
людьми. Миф: надо сделать рабочее место
площадкой для игр
 Поколение Z – цифровые люди, пользуются
планшетами везде
Проектирование исследования >>Описательные МИ 68
Результаты исследований,
проведенных в разные годы

Потребление безалкогольных напитков на душу населения,


л/мес
Год опроса
Возраст, лет
1960 1970 1980 1990
10 – 19 1 5 8 12
20 – 29 1 2 7 10
30 – 39 1 2 3 8
40 – 49 1 2 3 6
50 и выше 1 1 2 3

Проектирование исследования >>Описательные МИ 69


Результаты исследований,
проведенных в разные годы

Проектирование исследования >>Описательные МИ 70


Причинность

Причина Следствие 1 Следствие 2

Причина 1

Причина 2 Следствие 1 Следствие 2

Причина 3

Проектирование исследования >>Исслед. причинности 71


Исследования причинности. Методы

 Анализ временной последовательности событий:


причина не может быть позже следствия. Но «после» еще
не значит «поэтому».
 Анализ сопутствующих изменений
 Отсекание других возможных объяснений

Проектирование исследования >>Исслед. причинности 72


Исследования причинности
 Анализ сопутствующих изменений

Количество и процент регионов с различной долей рынка


в зависимости от оценки деловых качеств дилера
Доля рынка в регионе
Оценка дилеров
Всего
руководством Большая Небольшая

«Хороший» 50 (67%) 25 (33%) 100%


«Плохой» 15 (25%) 45 (75%) 100%
Влияние качества дилера на процент успешности
67-25= 42 процентных пункта
Проектирование исследования >>Исслед. причинности 73
Исследования причинности
Люди со второй, третьей и четвёртой группой крови подвергаются
повышенному риску развития ишемической болезни сердца в сравнении с
обладателями первой группы.
Британские ученые выяснили, что работающие женщины больше склонны
к полноте по сравнению с домохозяйками, сообщает Raut.ru.
Становясь старше, мы становимся счастливее. Несмотря на то, что после
перехода через рубеж среднего возраста здоровье ухудшается, уровень
"счастливости" наоборот начинает стабильно расти, отмечает газета The
Daily Mail.
Вести СПб, 12 сент 2012: «9 из 10 преступлений, совершаемых
иностранцами, совершаются выходцами из Средней Азии».
Некорректно!
Пример
1000 выходцев совершили 9 преступлений уровень 0,9%
1 не выходец совершил 1 преступление уровень 100%
Проектирование исследования >>Исслед. причинности 74
Исследования
причинности
Какими буквами
отмечать образцы при
дегустации?
26 букв латинского алфавита были представлены в
четырех последовательностях:
1. В алфавитном порядке.
2. В обратом алфавитном порядке.
3. В случайной последовательности
TJENXBFHZOGPACRWLQKDSIVYMU.
4. В обратной случайной последовательности.
Проектирование исследования >>Исслед. причинности 75
Исследования причинности
Какими буквами отмечать образцы при дегустации?

Ответы, предлагаемые респондентам, были следующими


(цифры респондентам не давались):

очень благоприятный (Very favorable) (200)


более или менее благоприятный (Somewhat favorable) (100)
нет значения (No meaning) (0)
более или менее неблагоприятный (Somewhat unfavorable) -100
очень неблагоприятный (Very unfavorable) (-200).

Как выглядит анкета для такого опроса?

Проектирование исследования >>Исслед. причинности 76


Эксперименты

Эксперимент – это научное исследование,


в котором исследователь сознательно манипулирует
одной или несколькими независимыми переменными
и наблюдает за возникающими в результате
вариациями зависимых переменных.

Проектирование исследования >>Исслед. причинности 77


Эксперименты

Валидность =
Виды
правильность

 Полевые
 Внутренняя
 Лабораторные
 Внешняя

Проектирование исследования >>Исслед. причинности 78


Посторонние переменные в экспериментах
 История
 Созревание
 Влияние выбросов
 Смещение выборки
60% слышавших рекламу по телевидению
положительно относятся к товару, в то время как 60%
не слышавших относятся отрицательно.
=
60% слышавших и 40% не слышавших рекламу по
телевидению положительно относятся к товару.
Меры:
рандомизация (?)
подбор пар (?)
Проектирование исследования >>Исслед. причинности 79
Посторонние переменные в экспериментах

 Потери в ходе эксперимента (!!!!!)


Репрезентативно (Что это?) Нерепрезентативно
Случайно
отобранные Согласившиеся
участники

Отказавшиеся

Проектирование исследования >>Исслед. причинности 80


Посторонние переменные в экспериментах

 Основной эффект тестирования

O1 X O2
 Интерактивный эффект тестирования

O1 X O2
Проектирование исследования >>Исслед. причинности 81
Проекты экспериментов
 Реальные эксперименты
 Претест-посттест с контрольной группой

ЭГ (R) O1 X O2 О2-О1=e + u + m + i
КГ (R) О3 О4 О4-О3=u + i
(О2-О1)-(О4-О3)=e + m

Недостаток – неучет эффекта тестирования !

Проектирование исследования >>Исслед. причинности 82


Проекты экспериментов
 Реальные эксперименты
 Посттест с контрольной группой

ЭГ1 (R!) X O5
КГ1 (R!) О6

О5-О6=e

Проектирование исследования >>Исслед. причинности 83


Проекты экспериментов
 Преэксперименты
(например, реклама в журнале, отношение к товару среди
тех, кто заметил и кто не заметил)
 Одиночное исследование
X O
 Претест-посттест в одной группе
О 1 X O2
 Сравнение с контрольной группой
ЭГ: X O1 Чем отличается от посттеста
с контрольной группой?
КГ: О2
О2-О1=e
Проектирование исследования >>Исслед. причинности 84
Проекты экспериментов

 Квазиэксперименты

 Временные последовательности

О1 О 2 О 3 О 4 X О5 О6 О 7 О 8

Проектирование исследования >>Исслед. причинности 85


Результаты О
а)
квазиэкспериментов

б)

в)

г)

д)

Время
Момент X
Проектирование исследования >>Исслед. причинности 86
Примеры экспериментов

 Выбрать лучший способ продажи новых соусов и


приправ в супермаркетах

 Определить влияние снижения цены самого дорогого


чайника Philips на его продажи

Выбрать тип, обсудить влияние посторонних переменных

Проектирование исследования >>Исслед. причинности 87


Тестовый маркетинг

Тестовый маркетинг представляет собой управляемый


эксперимент, осуществляемый в ограниченной, но
тщательно выбранной части рыночного пространства с
целью предсказания объема продаж или размера
прибыли в абсолютном или относительном выражении
как реакцию на маркетинговые действия фирмы.

1. Как
2. Сколько стоит?
3. Для каких товаров применять?

Проектирование исследования >>Исслед. причинности 88


Тестовый маркетинг
Хорошо Хорошо Хорошо
Модельный Управляемый Реальный Полно-
рынок рынок рынок масштаб-
Плохо Плохо Плохо ный
марке-
Завершение эксперимента тинг

Проектирование исследования >>Исслед. причинности 89


Маркетинговые исследования
часть 2
Сбор данных

Первичные данные – данные, собранные специально


для проводимого исследования, в первый раз.

Стандартизированные отчеты – первичны по


содержанию, вторичны по форме

Вторичные данные – данные, собранные ранее для


других целей.

Сначала ищутся вторичные данные

Сбор данных 91
Недостатки вторичных данных
1. Данные не точно соответствуют проблеме:
по единице измерения;
по шагу измерения или границам классов;
по свежести.
2. Данные недостаточно точны.
а) источник данных: первичный источник вторичных
данных; вторичный источник вторичных данных;
б) цель публикации: защита интересов производителей или
торговцев; продвижение товара; документы политических
партий; пропагандистские материалы; анонимные;
оправдательные, исследование для примера; собранные
профессионалами;
в) возможности авторов собрать достоверные данные.

Сбор данных 92
Маркетинговые исследования
часть 2
Сбор данных

Первичные данные – данные, собранные специально


для проводимого исследования, в первый раз.

Стандартизированные отчеты – первичны по


содержанию, вторичны по форме

Вторичные данные – данные, собранные ранее для


других целей.

Сначала ищутся вторичные данные

Сбор данных 94
Недостатки вторичных данных
1. Данные не точно соответствуют проблеме:
по единице измерения;
по шагу измерения или границам классов;
по свежести.
2. Данные недостаточно точны.
а) источник данных: первичный источник вторичных
данных; вторичный источник вторичных данных;
б) цель публикации: защита интересов производителей или
торговцев; продвижение товара; документы политических
партий; пропагандистские материалы; анонимные;
оправдательные, исследование для примера; собранные
профессионалами;
в) возможности авторов собрать достоверные данные.

Сбор данных 95
Оценка источников вторичных данных
 По каким принципам производился отбор элементов
исследования?
 Каким методом собирались данные: опросом или
наблюдением; как это следовало бы сделать?
 Каково качество подготовки полевых работников?
 Как проверялась их работа?
 Каков был процент отказов и есть ли отдельная
статистика по этому вопросу?
 Хорошо ли представлена информация?
 Не противоречивы ли данные?
 Правомерны ли выводы, сделанные по собранным
данным?

Каков уровень профессионализма исследователей?


Сбор данных 96
Источники вторичных данных
Накладные, которые включают: вид товара
(услуги), сведения о покупателе, объем
Внутренние
продажи и условия продажи, цену и многое
(имеющиеся
другое
в фирме,
собранные Другие документы: книга жалоб и
для других предложений, кредитные записи, гарантийные
целей) карты, отчеты продавцов
Отчеты о предыдущих исследованиях

Публикуемые: книги, журналы


Внешние
Коммерческие: базы данных; отчеты

Сбор данных 97
Стандартизированные отчеты

 Сегментирование рынка с определением


демографических характеристик покупателей по данным
переписи или результатам выборочного опроса.
 Определение объема продаж и доли рынка.
Исследования проводятся по большим представительным
спискам.
 Аудит магазинов.
 Телефонный опрос «омнибус».

Сбор данных 98
Сканеры штрих-кодов

 Оценка результатов кампаний по продвижению товара.


 Оценка популярности нового продукта.
 Оценка влияния неожиданных событий типа нехватки
товара.
 Изучение каналов распределения.
 Точное определение цены места на полке.
 Вычисление доходности каждого продукта.
 Определение популярности определенного товара
 Определить лучшее место продажи товара: у кассы
или в отделе.
 Работа со списками (панелями).
 Сбор данных для интеллектуального анализа.

Сбор данных 99
Сканеры штрих-кодов
Сбор данных и некоторые виды обработки
автоматизированы

 Оценка результатов кампаний по продвижению товара.


 Оценка популярности нового продукта.
 Оценка влияния неожиданных событий типа нехватки
товара.
 Изучение каналов распределения.
 Точное определение цены места на полке.
 Вычисление доходности каждого продукта.
 Определять популярность того или иного товара
 Определить лучшее место продажи товара: у кассы
или в отделе.
 Работа со списками (панелями).
 Сбор данных для интеллектуального анализа.
Сбор данных 100
Типовые стандартизированные отчеты

 Измерение охвата аудитории и эффективности


рекламы
 Телевидение (телеметр  опрос)
 Радио (опрос)
 Печатные средства (опрос).
Отчет = журнал с отмеченной популярностью
разных элементов
 Интернет – количество кликов по разным
областям
Для рекламы – аналогично
(с помощью видеокамеры)
Сбор данных 101
Типовые стандартизированные отчеты. Интернет

 Целевой звонок. Привязка номера к любому источнику трафика


вплоть до отдельной рекламной кампании. Такие звонки будут
подсчитаны и это поможет оценить эффективность рекламы.
 API (application programming interface – интерфейс прикладного
программирования).
o Мониторинг поисковых запросов. Количество запросов по разным
ключевым словам. Для сайта выбираются наиболее популярные
ключевые слова.
o Многофункциональные SEO (Search Engines Optimization)
платформы.
o Средства персонализации результатов поисковых запросов.
Попытка предугадать следующие запросы.

Сбор данных 102


Первичные данные
О покупателях и потребителях
 Демографические и социоэкономические
 Психологический профиль личности
 привычки;
 личностные качества и ценности;
 эмоциональный профиль личности;
 картина мира, убеждения;
 истинные цели и привычные способы их достижения;
 привычные стратегии лжи и сокрытия информации;
 привычные способы принятия решений, обучения,
самомотивации и творчества
 типичное поведение в конфликтных ситуациях;
 создание и поддержание межличностных отношений;
 уровень лояльности;
 профессиональный потенциал.

Сбор данных 103


Первичные данные
О покупателях и потребителях
 Отношение
 Мнение
 Осведомленность
 самостоятельное воспоминание;
 несамостоятельное воспоминание;
 узнавание.
 Намерения
 Мотивация
 Поведение
 что
 сколько
 каким образом
 где
 когда
 в какой ситуации
 кто Сбор данных 104
Первичные данные

Типы покупательского поведения

 неактивные;
 активные;
 требовательные;
 традиционные;
 оригиналы;
 ценовые;
 транзитные.

Сбор данных 105


Первичные данные
 Причуды – всплески кратковременной моды на тот или иной товар.
 Тенденции (тренды) – более длительные
 «99 жизней»
 Жизнь вне крупных городов
 Эгономичность – желание быть не похожим на других – вызвало к жизни
индивидуальные товары.
 «Женская логика» – признание различий мышления мужчин и женщин
 Стремление к миниатюризации
 Усиливающееся разделение на богатых и бедных
В России
 Ускорение перевозок
 Информатизация
 Распространение на рынках глобальных торговых марок
 Мегатенденции – медленные изменения
 Мировой компьютерный бум
 Глобализация
 Усиление женского лидерства

Сбор данных 106


Value
And
Life-
Style
1
(1978)

Сбор данных 107


VALS 2
(1989)

Сбор данных 108


iVALS
(1997)

Сбор данных 109


Первичные данные
Внутренние факторы организации
 Цели – желаемые результаты деятельности. Обычно
имеются в документированном виде в Уставе,
стратегии развития и т.п.
 Задачи – работы, которые должны быть выполнены.
Важны для постановки задач маркетингового
исследования.
 Структуры – взаимосвязи между элементами
 полномочия заключать договор об исследовании
 группа участников покупки
 Технологии – совокупность средств, процессов,
методов деятельности. Для оценки возможностей
 оборудование,
 навыки
 знания
Сбор данных 110
Первичные данные
Внешние факторы организации
 рынок труда;
 поставщики;
 конкуренты;
 общественные организации;
 правовая среда;
 экономическая среда;
 политическая среда;
 научно-техническая среда;
 социально-демографическая среда;
 культурная среда (ценности, понятия, желания и
поведение членов общества ).
 экологическая среда;
 международное окружение.

Сбор данных 111


Методы сбора первичных данных

Типы
Опрос Наблюдение
Проведение
Замаскировано
Незамаскировано
Структурировано
Нектруктурировано
Прямо
Непрямо Отпечатки пальцев
Натурно
Со специальной подготовкой

Сбор данных 112


Сравнение

Типы
Опрос Наблюдение
Показатель
Разносторонность 1 или 2?
Время
Стоимость
Точность
Объективность

Сбор данных 113


Структурированный незамаскированный опрос

Как часто Вы смотрите телевизор?


Несколько раз в день 
Один раз в день 
Два-три раза в неделю 
Раз в неделю или реже 

Сбор данных 114


Структурированный незамаскированный опрос
 Надежность (отсутствие случайной ошибки) благодаря
заданным рамкам
 Прояснение сути вопроса.
Ваше семейное положение?
Одинокий/одинокая 
Женат/замужем 
Вдовец/вдова 
Разведен/разведена 

Какой тип кузова легковых автомобилей Вы предпочитаете?

(Определите ответы. В данном случае лучше дать картинки)

Сбор данных 115


Структурированный незамаскированный опрос

 Нельзя отобразить особое мнение

 В одном ответе много нюансов

 Бывает, что по ошибке не включен нужный ответ

Сбор данных 116


Неструктурированный незамаскированный опрос
 Форма вопроса
Как Вы относитесь к курению? ___________________
(Дать ответы!)

 Глубинное интервью
 Требуются высококвалифицированные
высокооплачиваемые интервьюеры.
 Имеется субъективное влияние интервьюера.
 Усилия затрачиваются на то, чтобы добиться
сотрудничества от респондента.
 Обработка результатов опросов затруднена, так
как имеется разброс в формулировках вопросов и
ответов.
Сбор данных 117
Пример глубинного интервью «до дна»
Интервьюер: Какие лекарства от головной боли Вы знаете?
Респондент: Аспирин, анальгин, пирамидон. И цитрамон.
Интервьюер: (Молчание).
Респондент: Еще спазган окажется, максиган. Я их путаю.
Интервьюер: А еще?
Респондент: Дочери я даю панадол, говорят, он безвреден...
Интервьюер: Угу.
Респондент: Да, я вспомнила, еще баралгин.
Интервьюер: Так, баралгин.
Респондент: Еще рекламируют что-то по телевизору, но я не
помню. Какое-то средство с двойным действием.
Интервьюер: А еще какие?
Респондент: Больше не помню.
Интервьюер: Точно?
Респондент: Да, не могу вспомнить.
Сбор данных 118
Неструктурированный замаскированный опрос
 Работа с рисунками

Дорисовать рисунки, не дольше 2-х секунд на каждый

Сбор данных 119


Неструктурированный замаскированный опрос

Ключ к дорисовыванию рисунков

1. Абстрактное или конкретное мышление

2. Одна или иного целей

3. Коммуникабельность

4. Интроверт или экстраверт

Сбор данных 120


Неструктурированный замаскированный опрос

 Завершение предложения

Люди, которые никогда не курят, _____________________


(типичные ответы: более здоровые, счастливее, умнее);
Тинэйджеры, которые курят _________________________
(типичные ответы: глупы, не правы, рисуются),

Сбор данных 121


Неструктурированный замаскированный опрос

 Завершение предложения

Люди, которые никогда не курят, _____________________


(типичные ответы: более здоровые, счастливее, умнее)
Тинэйджеры, которые курят _________________________
(типичные ответы: глупы, не правы, рисуются)

Сбор данных 122


Неструктурированный замаскированный опрос
 Тематический апперцепционный тест
Каким Вы видите владельца данной кредитной карточки?

Приятно ли взять в руки?

Сбор данных 123


 Тесты
Роршаха

Сбор данных 124


Неструктурированный замаскированный опрос
 Психоанализ

Сбор данных 125


Структурированный замаскированный опрос

Что сейчас происходит с законом о штрафах


за загрязнение рек?

Разрабатывается 
Слушался 
В доработке 
Принят 

Сбор данных 126


Способы проведения опроса

 Личный опрос
 На улице Характеристики
 В магазине
 Дома  Процент отказов
 В чате
 Получаемая информация
 Телефонный опрос
 Стоимость
 Почтовый опрос
 Обычная почта
 Электронная почта
 СМС

 Онлайновый опрос в Интернете

Сбор данных 127


Способы проведения опроса
Интервью на дому
Высокий процент ответов Обычно – узкий круг
Легко получить ответ опрашиваемых
от конкретного человека Трудно руководить
Возможно использование проведением
любых типов анкет Дорог
Легко изменить порядок Дорог повторный визит
вопросов (если респондента не было
Можно прояснить неясные дома)
моменты Занимает много времени
Можно использовать Сильно влияние
наглядные материалы интервьюера
Интервью на улице
Быстрее и дешевле, чем на Интервью должны быть
дому короткими

Сбор данных 128


Способы проведения опроса
Почтовая анкета
Иногда – единственно Сложно добиться ответа от
возможный способ опроса конкретного респондента
При наличии списков Проблемы с неграмотностью
легко определяются рамки Длительное время ответа,
выборки которое невозможно
Нет влияния уменьшить
интервьюера Нельзя помочь с неясными
Индивидуальный темп моментами
ответов Трудно управлять
Респондент лучше последовательностью
отвечает на личные и вопросов
сложные вопросы Ошибки в результатах, так
Дешев как вся анкета видна сразу
Сбор данных 129
Способы проведения опроса

Телефонный опрос
Дешев Трудно добиться
Обеспечивает широкий репрезентативной выборки
охват Нельзя представлять
Удобно управлять наглядный материал
проведением и Трудно определить, тот ли
контролировать работу респондент отвечает
интервьюеров Время опроса ограниченно
Высокая скорость опроса Трудно добиться
Легко перезвонить сотрудничества
Легко использовать
компьютер

Сбор данных 130


Компьютеры при опросах
 Ввод ответов оператором при телефонном опросе
 Автоматический набор номеров с отслеживанием по базе
 Автоматическая генерация выборки
 Контроль работы интервьюеров
CATI (Computer Assisted Telephone Interview).
 Демонстрация мультимедиа
 Ввод ответов респондентом «в поле»
 Управление порядком вопросов
 Можно прекратить исследование при достижении
результата
 Персонификация
 Короткие ответы
Трудно распознать поверхностные ответы
Нельзя перестроиться на новую важную тему

Сбор данных 131


Бланк структурированного наблюдения
Номер покупателя: 15 .
1. Первая выбранная марка: ААА
2. Общее количество просмотренных коробок: 3
3. Время на выбор, с: 20
4. Купленная марка: ААА
Бланк не структурированного наблюдения
Номер покупателя: 15 .

Сбор данных 132


Технические средства наблюдения
 Гальванометр

Сбор данных 133


Технические средства наблюдения

 Тахитоскоп

Сбор данных 134


Технические средства наблюдения

 Анализатор голоса

Сбор данных 135


Технические средства наблюдения

 Полиграф

Сбор данных 136


МРТ Выделение
 Нейромаркетинг сигнала из шума
– изучение и
использование
эмоций и
подсознания Транскраниальная
магнитная
стимуляция

Электроэнцефалография
– запись электрической
активности мозга Генетические
исследования
Измерение
поведенческих реакций

Сбор данных 137


Позитронно-эмиссионный сканер – отслеживание распределения в
организме соединений, меченных радиоизотопами. Позволяет
исследовать внимание, эмоциональные реакции, память, стрессорность.
Электронейромиография – регистрация сокращений лицевых мышц
испытуемых с помощью накладываемых на лицо электродов.
Электроэнцефалография - регистрация электрической активности
головного мозга. На волосатую часть головы накладываются электроды
для ркгистрации электрической активности мозга.
Магнитоэнцефалография бесконтактно регистрируют магнитные поля
на поверхности скальпа.
Транскраниальная магнитная стимуляции коры головного мозга
магнитными импульсами для определения областей мозга, ответственных
за различные задачи.

Сбор данных 138


Проектирование анкет

Анкета для маркетинговых исследований


представляет собой опросный лист со списком вопросов,
в который позже заносятся и ответы респондента.

Каждому респонденту должна предъявляться


для заполнения отдельная анкета,
чтобы он не видел ответы других респондентов.

Сбор данных 139


Проектирование анкет

Определение информации, которую требуется получить


Процент
100
60 Процент среди купивших товар 80

40 60

20 40

0 Доход 20
Низкий Средний Высокий Доход
0
Низкий Средний Высокий

Сбор данных 140


Проектирование анкет
 Выбор типа анкеты, метода проведения анкетирования
Структурированная
Замаскированная
Лично, по телефону, по почте, через Интренет
Показ образцов

Сбор данных 141


Проектирование анкет
Содержание каждого вопроса
Нужен ли вопрос вообще? (семейное положение  возраст)
Сколько нужно вопросов?

Почему Вы покупаете зубную пасту А?_____

Возможные ответы:
 чтобы уменьшить вероятность кариеса (причина
употребления в настоящее время);
 посоветовал врач (почему начал пользоваться);
 знакомая упаковка (процесс повторных покупок).

Сбор данных 142


Проектирование анкет
Содержание каждого вопроса

Сколько нужно вопросов?

Как впервые стали применять пасту? ___________

Укажите основную причину использования: __________

Каким образом покупаете? _____________

Сбор данных 143


Проектирование анкет
 Имеется ли у респондента требуемая информация?
Что Вы знаете о Metallic Metal Act?
Это будет хорошо для США (21,4% ответивших);
Это будет хорошо для отдельных штатов (58,6%);
Это хорошо для других стран, но не у нас (15,7%);
Совершенно бесполезно (4,3%);

Нет мнения (0,3%).

Сбор данных 144


Проектирование анкет
 Имеется ли у респондента требуемая информация?

Кто в Вашей семье покупает бакалею? ______________,


Имеете ли Вы мнение о ............

Сколько семья тратит на бакалею в месяц? _________

Сбор данных 145


Проектирование анкет
Эффект гало - результат
воздействия общего
впечатления о чем либо
(явлении, человеке, вещи) на
восприятие его частных
особенностей.
В маркетинге:
распространение
уважительного отношения к
бренду, сорту или торговой
марке на новые продукты,
выпускаемые под этим же
именем.
Сбор данных 146
Проектирование анкет
Эффект телескопа –
Тенденция воспринимать
недавние события как
произошедшие более давно, а
произошедшие давно – как
более недавние

В зависимости от чего?

Сбор данных 147


Проектирование анкет
 Будут ли респонденты давать информацию

Каков Ваш доход? ___________________

Какие стили легковых машин Вы предпочитаете? _____

Какая ошибка допущена в вопросе 2?

Сбор данных 148


Проектирование анкет

 Тонкие вопросы
Искажаете ли Вы показания весов в гипермаркете?
Ездите ли Вы зайцем в электричке?
У Вас установлены лицензионная копия Windows?
Покупате ли Вы пиратские диски?
Да  Нет 
 Спрятать среди других

Сбор данных 149


Проектирование анкет

 Тонкие вопросы
Сказать, что отношение не необычно

Недавние исследования показали, что при


самостоятельном взвешивании покупатели довольно
часто искажают вес продуктов. Вы делали это, хотя бы
иногда? ______________

Сбор данных 150


Проектирование анкет

 Тонкие вопросы
 Построить вопрос о других

Думаете ли Вы, что некоторые посетители искажают


показания весов при самостоятельном взвешивании?
_____________________
Почему? _____________

Сбор данных 151


Проектирование анкет

 Тонкие вопросы о возрасте


 Использовать категории

Каков Ваш возраст?


(А: 20 – 29 лет, В: 30 – 39 лет, С: 40 и более лет):
А  ,
В  ,
С .

Сбор данных 152


Проектирование анкет

 Тонкие вопросы
 Использовать модель случайного ответа

Ваш день рождения зимой?


Да , нет 
Жульничаете ли Вы в магазине самообслуживания?
Да , нет 

Сбор данных 153


Проектирование анкет

 Тонкие вопросы
 Использовать модель случайного ответа

=ps+(1-p)a,
где  - вероятность получения ответа «Да»;
p – вероятность
выбора «опасного» вопроса (задается); 1-p – вероятность
выбора безобидного вопроса (задается); s – вероятность
положительного ответа на «опасный» вопрос (неизвестна);
a – вероятность положительного ответа на безобидный
вопрос (можно определить по данным Госкомстата).

Сбор данных 154


Проектирование анкет

 Форма ответа на каждый вопрос


 Вопросы с открытым концом.

Какие марки телевизоров вспоминаются Вам прежде


всего? _____________

Сбор данных 155


Проектирование анкет

 Форма ответа на каждый вопрос


 Многозначный выбор.
 Плюсы:
●просто отвечать;
●просто обрабатывать ответы.
 Минусы:
● требуются глубокие предварительные знания;
● список может стать слишком длинным;
● невозможно ответить «Если…то»;
● надо решить вопрос, нужно ли вводить пункт «Не
знаю» («Нет мнения»; «Нейтральное мнение», «Не
то, чтобы да, и не то, чтобы нет»?

Сбор данных 156


Проектирование анкет

Будете ли Вы покупать товар... (далее следовали


наименования различных товаров, от зубной щетки до
автомобиля)
Да ;
может быть, да ;
не знаю ; (20%)
может быть, нет ;
точно нет .

Сбор данных 157


Проектирование анкет

Да Может быть, да Может быть, нет Точно нет


20%
1% 6% 11% 3%

Не знаю

Что тут самое опасное?


Какое решение можно предложить?

Сбор данных 158


Проектирование анкет
точно нет точно да

Как Вы считаете, в этом году Ваши расходы на


продовольственные товары по сравнению с прошлым
годом:
значительно увеличились ;
скорее увеличились ;
остались примерно такими же ;
скорее уменьшились ;
значительно уменьшились ?

Сбор данных 159


Проектирование анкет
 Форма ответа на каждый вопрос
 Многозначный выбор.
Минусы:
● требуется устранить неоднозначность выбора

Укажите Ваш возраст:


до 20 лет ; до 20 лет ;
20-30 лет ; 20-29 лет ;
30-40 лет ; 30-39 лет ;
40-50 лет ; 40-49 лет ;
свыше 50 лет ? 50 лет и более ;

Сбор данных 160


Проектирование анкет
 Форма ответа на каждый вопрос
 Многозначный выбор.
Минусы:
● требуется уточнить количество ответов
Почему Вы купили данную марку фотоаппарата?
Подходящая цена ;
Нужное увеличение ;
Хорошая марка ;
Посоветовали друзья ;
Такая марка у меня уже была ;
Другое (что?)_________________ ?
Укажите самую важную причину
Отметьте три важных причины
Ранжируйте причины по важности (как сказать проще?)
Сбор данных 161
Проектирование анкет
 Форма ответа на каждый вопрос
 Многозначный выбор.
Минусы:
● тенденция раннего ответа
В этом году Вы смотрите телевизор чаще, чем в
предыдущем? Проценты ответов
Ответ При прямом При обратном
порядке порядке
Значительно больше 5% 2%
Больше 9% 10%
Примерно так же 48% 46%
Меньше 26% 23%
Значительно меньше 12% 19%
Какова максимальная разница? Как устранить проблему?
Сбор данных 162
Проектирование анкет
 Форма ответа на каждый вопрос
 Многозначный выбор.
Минусы:
● ответы можно расположить неудачно

Укажите Ваш примерный доход:

свыше 10000 руб. в мес. ; свыше 40000 руб. в мес. ;


свыше 20000 руб. в мес. ; свыше 30000 руб. в мес. ;
свыше 30000 руб. в мес. ; свыше 20000 руб. в мес. ;
свыше 40000 руб. в мес. ; свыше 10000 руб. в мес. ;
отказ отвечать ? отказ отвечать ;

Сбор данных 163


Проектирование анкет

 Форма ответа на каждый вопрос


 Многозначный выбор.
Минусы:
● границы шкалы ответов (эффект избегания
крайних значений)

Сбор данных 164


Проектирование анкет

 Выбор слов для каждого вопроса


 Необходимо использовать простые слова
 Необходимо устранять разночтения
 более или менее
 примерно
 всё, всегда, никогда
 Вы или вы
и
Считаете ли Вы, что существует конкуренция между
продавцами лимонада и крекеров? Да  Нет 
 как
 слышать
Сбор данных 165
Проектирование анкет

 Выбор слов для каждого вопроса


 Необходимо устранять наводящие вопросы:

Считаете ли Вы, что ограничение налогов –


эффективный путь предотвратить опустошение Ваших
карманов правительством? Да  Нет 

Сбор данных 166


Проектирование анкет

 Выбор слов для каждого вопроса


Необходимо избегать скрытых альтернатив

1. Если представится возможность, будете ли Вы


работать? Да  Нет 

2. Если представится возможность, Вы пойдете работать


или будете заниматься домашним хозяйством? Да 
Нет 

Разница в 3 раза!

Сбор данных 167


Проектирование анкет

 Выбор слов для каждого вопроса


Необходимо раскрывать альтернативы

Следует ли издать закон, обязывающий пристегивать


ремни безопасности в автомобиле? Да  Нет 

Следует ли издать закон, обязывающий либо ездить с


пристегнутыми ремнями, либо платить штраф в размере
100 руб.? Да  Нет 

Сбор данных 168


Проектирование анкет

 Выбор слов для каждого вопроса


Необходимо избегать обобщений в ответах

Сколько бутылок минеральной воды Вы покупаете в


год? __________________________

Сколько бутылок минеральной воды Вы купили в


последнюю неделю? ______________

Сбор данных 169


Проектирование анкет

 Выбор слов для каждого вопроса


 Нельзя использовать вопросы с двойным ответом.

Какова Ваша оценка уровня цен и сервиса в отеле?

Сбор данных 170


Проектирование анкет

 Определение последовательности вопросов


 Открывающие вопросы – интересные и простые.

Каково Ваше мнение о … ?

 Воронкообразный подход.

Как Вам понравилось обслуживание


в нашем магазине? ________________________________

Как Вам понравилась вежливость персонала? _______

Сбор данных 171


Проектирование анкет

 Определение последовательности вопросов


 Четкая логическая последовательность.
 Тщательное планирование ветвлений
 Сложные и тонкие вопросы – ближе к концу
 Классификационные вопросы – в конце!!!
 Определение физических характеристик анкеты
 Внешний вид
 Размер
 Раскраска
 Нумерация анкет, вопросов и ответов
 Сопроводительное письмо или преамбула

Сбор данных 172


Содержание сопроводительного письма
 Персональное обращение. Алан Пиз
 Просьбу об одолжении.
 Указание важности проекта исследования и его целей
(…национальный масштаб…).
 Упоминание важности респондента (…Вас и других
экспертов… среди руководства…).
 Фразу о важности ответов в целом (…для получения
достоверной картины…).
 Уточнение, что ответ важен, даже если респондент не
считает себя достаточно квалифицированным (…независимо
от того, используете ли Вы наше оборудование…).
 Намек на пользу для респондента (…чтобы
спроектировать удовлетворяющий Вас продукт…).
 Слова о том, что ответ займет немного времени и будет
нетрудно ответить на вопросы.
 Напоминание о прилагаемом конверте с обратным
адресом.
Сбор данных 173
Содержание сопроводительного письма
 Пояснение, как выбирали респондентов (…Ваше имя
появилось в научно составленной случайной выборке…).
 Указание на то, что ответ анонимен (…Если Вас
заинтересуют результаты, проставьте свои координаты
на анкете или дайте запрос о результатах по
адресу…………., телефон…………, факс……….)
 Просьбу ответить при первой возможности.
 Благодарность за помощь.
 Намек на важность обращающегося с просьбой (подпись
директора исследовательской организации).
 Информацию об организации, проводящей опрос
(название организации в заголовке письма).
 Описание и цель вознаграждения (…прилагаемый чек –
всего лишь дань признательности…).
Письмо ни при каких обстоятельствах не должно
занимать более одной машинописной страницы

Сбор данных 174


Проектирование анкет

 Проверка предыдущих шагов

 Проверка на другом человеке

 Предварительная статистическая оценка результата

Сбор данных 175


Правила проверки анкет
 Всегда использовать личное интервью. Фиксировать
неясные моменты, сомнения при ответах.
 Проверка производится самыми опытными
исследователями.
 Проверочные опросы проводятся среди респондентов,
близких по характеристикам к объектам исследования:
 как респонденты понимают вопрос
 легко ли дают ответ
 находят ли нужный ответ среди предложенных в
анкете
 правильно ли отмечают его
 в каких дополнительных разъяснениях нуждаются
 Проверяется, как с анкетой работают интервьюеры:
 правильно ли дают пояснения
 нет ли неясных моментов или других проблем.
Сбор данных 176
Правила проверки анкет

 Проверяется, как будут кодироваться и табулироваться


ответы, отвечают ли полученные результаты целям
исследования.
 Производится статистическая обработка результатов,
полученных при предварительном опросе.
 Если требуется внести лишь незначительные изменения,
например, исправить только порядок слов, то можно не
проводить полного перепроектирования всей анкеты. В
противном случае следует провести полное
перепроектирование анкеты, начиная с первых шагов.

Сбор данных 177


Маркетинговые исследования
часть 3
Проектирование выборки и сбор данных

Генеральная совокупность – это полный набор


исследуемых единиц (элементов исследования), которые
удовлетворяют определенным спецификациям.
Спецификации определяют принадлежность каждой
исследуемой единицы к генеральной совокупности.

Ценз – обследование всех элементов генеральной


совокупности.

Исследование всей генеральной совокупности


 иногда слишком дорого,
 иногда невозможно (???)
 иногда дает неточные результаты (???).
Выборка и сбор данных 179
Проектирование выборки и сбор данных

Рамки выборки – перечень элементов генеральной


совокупности, из которых производится выборка .

Выборка – подмножество всех элементов исследования.


Каждый элемент выборки подвергается исследованию.

Задание: определить генеральную совокупность, рамки


выборки и выборку для объекта исследования: жители
Санкт-Петербурга

Выборка и сбор данных 180


Проектирование выборки и сбор данных

Генеральная совокупность

Рамки выборки

Выборка

Выборка и сбор данных 181


Задание рамок выборки

Телефонная книга, справочник на сайте http://spb.spravker.ru/.


 Телефоны меняются.
 Не у всех имеются телефоны.
 Имеются незарегистрированные телефоны и телефоны, не
включенные в справочники.
 Имеются отключенные телефоны.
 Имеются телефоны с АОН и анти-АОН, работающие в
режиме «черного» и «белого» списков.
 Не везде высокая телефонизация.

Выборка и сбор данных 182


Задание рамок выборки

Случайный набор телефона


 Есть «дыры» в номерах.
 Требует правильной работы генератора случайных чисел.

«Выборка + 1»
 Случайное изменение одной цифры.

Выборка и сбор данных 183


Задание рамок выборки
Списки
 Подписчики периодических изданий - уменьшается.
 Покупатели по банковским карточкам – сложно взять.
 Бравшие кредит – то же.
 Врачи, юристы и пр. – специфично
 Посетители поликлиник – врачебная тайна
 Избиратели – сложно взять
 Социальные группы – по-разному

Обычно это внутрифирменные данные

Выборка и сбор данных 184


Задание рамок выборки
Уличный опрос
 Необходимо проводить в
разных местах, в разное
время

Выборка и сбор данных 185


Виды планов выборки
План В ы б о р к и
выборки – Вероятностная Детермини-
способ (у каждого элемента имеется известный рованная
ненулевой шанс быть выбранным). (выбор
выбора а) с фиксированной вероятностью, производится
исследуемых когда размер выборки известен заранее; на основании
единиц из б) последовательная выборка, некоторого
когда ход исследования определяется суждения)
рамок достигнутыми результатами
выборки.
Простая случайная По удобству

Пропорциональная По суждениям
Стратифици-
рованные Непропорциональная По квотам

Гнездовые Механическая
(кластерные)
Территориальная

Выборка и сбор данных 186


Выборки по суждениям
 опрос телезрителей дает точный прогноз результатов
президентский выборов в США;
 результаты выборов президента России совпадают с
результатами по Красноярскому краю
«Снежный ком»

Выборка и сбор данных 187


Виды планов выборки

Квота – заданный процент исследуемых единиц,


обладающих некоторой характеристикой.
Пример: определение числа жертв войны в Ираке:
1) по данным больниц;
2) по данным обхода жителей европейскими добровольцами
(число оказалось гораздо больше).

Задание: составить квотную выборку


для опроса студентов университета
с целью выяснения процента курящих
Опросить надо 500 человек

Выборка и сбор данных 188


Простая случайная выборка
В простой случайной выборке у каждого элемента
генеральной совокупности (рамок выборки) есть равный
шанс быть опрошенным.
Проводим сплошное исследование
N N

 Xi  i
( X  X ) 2

X i 1
,  X2  i 1
.
N N
Xi – данные опроса всей генеральной совокупности;
N – количество опрошенных;
X – среднее значение генеральной совокупности;
 X – дисперсия генеральной совокупности.
2

Выборка и сбор данных 189


Простая случайная выборка
а) Количество людей б) Количество выборок
2 2

1 1

0 0
10 20 30 40 50 Доход 10 20 30 40 50 Выборочные
средние
Среднее значение по всем возможным выборкам размера 2.
Определить распределение выборочных средних.
Размер выборки 2.

Выборка и сбор данных 190


Простая случайная выборка

Статистики – характеристики, измеренные по выборке.


~
X - выборочное среднее.

 2X~ - дисперсия выборочных средних. Что это?

(N  n)
 
2
~
X
2

n(N  1)
X ≈  2
X
n
Квадрат сигмы
- зависит от дисперсии генеральной совокупности
- обратно пропорционален размеру выборки
Выборка и сбор данных 191
Разные выборки дают разный результат
На самом деле все проще:
размерность 1

192
Центральная предельная теорема

В простой случайной выборке размера n из


генеральной совокупности со средним X и
дисперсией  при больших n выборочное
2
X

среднее будет нормально распределено со


средним X и дисперсией  2
~
X .

Выборка и сбор данных 193


Центральная предельная теорема
Количество людей
Количество выборок

Кривая 2

Кривая 1

Доход

Выборка и сбор данных 194


Распределение выборочных средних

z2
1 z 
F( t )  
2 z
e 2
dt.
~
X  z X~  X  X  z X~ ,
Что означает последняя формула?
Выборка и сбор данных 195
Распределение ~
выборочных средних X  z X~  X  X  z X~ ,

То, что мы измерили, скорее всего, будет недалеко от истины


Выборка и сбор данных 196
Распределение выборочных средних

Провели одно выборочное исследование

~ ~
X  z X~  X  X  z X~ .

Что означает эта формула?

Выборка и сбор данных 197


1. Теоретически: чаще попадают ближе к центру
2. Практическое выборочное исследование.
Если было одно попадание, потом сняли мишень –
где был центр?

198
Распределение выборочных средних

~ ~
X  z X~  X  X  z X~ .

Истина, скорее всего, будет рядом с тем, что мы


измерили

Выборка и сбор данных 199


Ширина доверительного интервала

Размер Z Достоверность, Ширина


выборки (число процентов интервала
сигм)
200 1 68 10
2 95 20
3 99,7 30
100 
800 1 68 5
2 95 10
3 99,7 15
100 

Выборка и сбор данных 200


Процесс планирования исследования
1. Задаемся точностью и достоверностью (95%)
2. Где-то как-то (?) ищем сигму генеральной совокупности
3. Определяем z (1 для 68%, 2 для 95%, 3 для 99,7%)
4. Определяем требуемую сигму выборочных средних
(точность делим на z)
5. Определяем число n по формуле

(N  n)
 
2
~
X
2

n(N  1)
X ≈  2
X
n

6. Тщательно производим отбор (шанс должен быть равным)

Выборка и сбор данных 201


Пример: определить средний доход жителей СПб
Задаемся точностью ± 1000 руб. и достоверностью (95%)
Где-то ищем сигму генеральной совокупности (все измерения
укладываются в 6 сигм. Минимум = 0, максимум = 300 000
руб/мес. Сигма ГС = 50 000)
Определяем z (1 для 68%, 2 для 95%, 3 для 99,7%)
Определяем требуемую сигму выборочных средних
(точность делим на z) 1000/2=500
Определяем число n по формуле, показанной выше √n =
50000/500 = 100 n=10 000
А нужна ли такая точность? Была бы точность ± 2000,
опрашивали бы в 4 раза меньше, то есть 2500.

Тщательно производим отбор (шанс должен быть равным)

Выборка и сбор данных 202


Среднее Дисперсия
N N

X i (X i  X) 2

X i 1
,   2
X
i 1
.
N N
Ковариация

Корреляция

Выборка и сбор данных 203


Стратифицированная выборка
Вся генеральная совокупность делится на
взаимоисключающие группы, называемые стратами.
Страты полностью охватывают генеральную совокупность.
Внутри каждой страты производится простая случайная
выборка.
Метод позволяет иногда повысить точность при опросе того
же числа респондентов или уменьшить размер выборки,
которая обеспечивает заданную точность. Это происходит в
том случае, если дисперсия внутри страт меньше, чем
дисперсия всей генеральной совокупности.
Страта 1 Страта 2 Доход

Генеральная совокупность
Выборка и сбор данных 204
Стратифицированная выборка

Среднее и дисперсия для стратифицированной выборки:


L L
~ Nh ~ Nh 2
X   Xh ;     X~,h ,
2
~
X
h1 N h1 N

где L – количество страт; Nh – общее количество элементов


генеральной совокупности, относящихся к h-й страте; N –
общее количество элементов генеральной совокупности;

 2
~
X
определяется как средневзвешенная дисперсия по
каждой страте.
Выборка и сбор данных 205
Виды стратификации

 Пропорционально размеру страт. Размер выборки


пропорционален доле страты в совокупности.
 Пропорционально разбросу значений в стратах. Если в
страте разброс велик, берется большое количество
элементов, если мал – малое .
 Равный размер выборки для каждой страты.

Выборка и сбор данных 206


Гнездовые выборки
 Механическая.
 Территориальная.
Данные для осуществления выбора кварталов
Номер квартала. Количество Количество семей
Упорядочено по семей нарастающим
размеру квартала итогом
1 200 200
2 100 300
3 50 350
4 30 380
5 20 400
Всего семей 400

Далее – с помощью датчика случайных чисел


Выборка и сбор данных 207
Определение размера выборки

 Оценка среднего, абсолютная точность, дисперсия


генеральной совокупности известна
X
  z X~  z( ),
n
откуда
2
z
n  ( 2 ) X .
2


Выборка и сбор данных 208
Определение размера выборки

 Оценка среднего, относительная точность, дисперсия


генеральной совокупности известна
 X
r  100%.   rX  z ,
X n
z  2 2 2
z
n 2  2 V .
2 X
2
r X r
V - коэффициент вариации

Выборка и сбор данных 209


Определение размера выборки

 Оценка доли, абсолютная точность


Среднеквадратическое отклонение для пропорции, равной 

(1  )
p  . ∆=zp
n
2
z
n  2 (1  ).
 2
«Этот худший из миров» 1z
=0,5 n .
4 2

Выборка и сбор данных 210


Определение размера выборки

 Оценка доли, относительная точность r%


Среднеквадратическое отклонение для пропорции, равной 

r r (1  )
  z p z
100% 100% n

z 1  .
2
n  10000% 2
r 

Выборка и сбор данных 211


Определение размера выборки, конечный размер
совокупности

X N  n
 X~  .
n N 1

N=100, n=20 n’=17


.

Выборка и сбор данных 212


Определение размера выборки, другие случаи

 Стратифицированная выборка – сложно


 Чтобы убедить ЛПР
 Обеспечить точность важных параметров
 Использовать шаблоны итоговых таблиц

Выборка и сбор данных 213


Ошибки при сборе данных

Ошибки, возникающие при сборе данных

Ошибки выборки Ошибки, не связанные с выборкой

Случайные Неслучайные

Ошибки наблюдения Ошибки ненаблюдения

Выборка и сбор данных 214


Ошибки при сборе данных
Общие меры проверки

 Валидность исследования проверяется с помощью


достоверной информации, не содержащей отклонений.
Демографическую информацию можно сравнить с
официальными данными переписи населения.
 Состоятельность респондентов проверяется различными
версиями одного вопроса.
 Состоятельность ответа проверяется повторным опросом
того же человека через определенное время.

Выборка и сбор данных 215


Виды ошибок
 Неохват
 Четко определить рамки выборки.
 Переохват
 Тщательно планировать процесс выборки. Брать
владеющих двумя автомобилями с весом 0,5.
(мобильных телефонов на человека в России 1,8)
 Отказ отвечать.
 Повышение уровня ответов (?)
 Уменьшение отказов в процессе работы (?)

Выборка и сбор данных 216


Виды ошибок
Отказ отвечать.
Экстраполяция. Пусть Xcp_o, Xcp_н – средние значения
некоторой характеристики среди ответивших и не
ответивших на некоторый вопрос. Искомое среднее для
всей выборки равно

Xcp=PoXcp_o+PnXcp_н,
где Po – доля ответивших на вопрос; Pн – доля отказавшихся
отвечать; Po+Pн=1

Неизвестная величина оценивается:


 по ответившим со второго раза;
 по небольшому количеству опрошенных

Выборка и сбор данных 217


Виды ошибок

 Отказ отвечать.
 Метод Политца и Симмонса
Ответы тех, кто был дома в последние 5 дней, берут с
весом 1, ответы тех, кого не было дома в предыдущие 5
дней, берут с весом 1.
 Неответ на отдельные вопросы.
 Переформулировать вопрос

Выборка и сбор данных 218


Процесс 1. Интервьюер читает вопрос в своей анкете.
2. Интервьюер произносит вопрос вслух.
сбора 3. Респондент слышит вопрос.
данных 4. Респондент не понимает вопрос.
5. Респондент формулирует уточняющий вопрос.
6. Респондент задает интервьюеру уточняющий вопрос.
7. Интервьюер слышит вопрос
8. Интервьюер понимает вопрос
9. Интервьюер формулирует ответ
10. Интервьюер произносит ответ
11. Респондент слышит ответ.
12. Респондент понимает ответ интервьюера.
13. Респондент обдумывает свой ответ на исходный вопрос.
14. Респондент формулирует то, что он ответит.
15. Респондент оценивает точность и приемлемость ответа.
16. Респондент корректирует ответ.
17. Респондент произносит ответ.
18. Интервьюер слышит ответ.
19. Интервьюер понимает ответ.
20. Интервьюер записывает ответ.
Выборка и сбор данных 219
Процесс сбора данных

 Ошибки интервьюеров на один вопрос:


 0,293 ошибки чтения вопроса;
 0,116 вариации речи при чтении вопроса;
 0,140 ошибки в уточнениях к вопросу;
 0,161 раз – влияние на респондента.

Выборка и сбор данных 220


Характеристика участников опроса
Характеристика,
Интервьюер Респондент
комментарий
Базовые Возраст
характеристики Образование
(Лучше, если эти Социальный статус
характеристики будут То же
Раса
схожи у обоих участников Религия
интервью) Пол

Психологические
факторы Восприятие
(Тренированный Отношение То же
интервьюер должен быть Ожидания
бесстрастным и четко Мотивы
соблюдать инструкции)

Факторы поведения Ошибки в вопросах Ответы:


(Даже если инструкции Ошибки в уточнениях к вопросу точные/
и есть, им не всегда
Ошибки в мотивации неточные;
следуют, что вносит
Ошибки в записи ответа адекватные/
ошибку в результаты
Мошенничество неадекватные
исследования)

Выборка и сбор данных 221


Работа интервьюеров
Телефонный контакт
Есть Нет
Ошибочный номер
Отказ респондента
Нет ответа
Отвергнут интервьюером
Нет дома
Опрос начат
Не позвали к телефону
Отвергнут интервьюером Не стал говорить
Сверх квот Занято
Подходящий респондент Не работает телефон
Прочее
Бесполезен
Отвергнут интервьюером Не прошел отбор
в процессе опроса
Сам прекратил интервью Не домашний телефон
Связь прервалась
Нормальное завершение

Выборка и сбор данных 222


Работа интервьюеров

количество завершенных разговоров


степень ответов = количество подходящих респондентов в выборке ,

степень упорства = качество работы интервьюера =


количество завершенных контактов
=
количество попыток контакта с подходящими респондентами .

Выборка и сбор данных 223


Анализ данных

Редактирование – обеспечение качества данных.

В поле В офисе

Анализ данных 224


Анализ данных
Кодирование – категоризация данных
и представление их в условном виде (обычно – числовом).
Это принципиально неавтоматизируемая процедура.

Классификация – разбиение элементов исследования на


группы по значениям определенных признаков.

Глубина классификации – общее число уровней


классификации.

Анализ данных 225


Анализ данных

Каждый признак зависит от предыдущего, каждый


последующий конкретизирует
Признаки соподчиненные,
классификация на их основе – иерархическая.

Признаки описывают различные стороны объекта. Могут


быть расположены произвольно.
Признаки несподочиненные,
Классификация на их основе – фасетная.

Анализ данных 226


Анализ данных
Методы кодирования

Без использования классификации С использованием классификации

Порядковая
Иерархической Фасетной Комбинированной
регистрация

Последовательное Параллельное Комбинированные системы последова-


кодирование кодирование тельного и параллельного кодирования

Закодируйте это!

Анализ данных 227


УДК 339.138
3 – Общественные науки. Демография. Статистика.
Социология. Политика. Экономика. Право. Государство.
Военное дело. Социальное обеспечение. Страхование.
Образование. Этнография.
33 – Экономика. Экономические науки.
339 – Торговля. Международные экономические отношения.
Мировое хозяйство.
339.1 – Общие вопросы торговли.
339.13 – Рынок. Анализ рынка. Спрос. Предложение.
Конкуренция. Маркетинг.
339.138 – Маркетинг.

Анализ данных 228


Параллельное кодирование
Пример. Сведения о поступивших в университет студентах
можно заносить в базу данных в виде следующего кода.

1.78.9403.2.1.080011.

где (по порядку слева направо)


1. – пол (мужской);
.78. – регион, в котором родился (Санкт-Петербург);
.9403. – дата рождения (1994 год, март);
.2. – семейное положение (холостой/не замужем);
.1. – образование (среднее);
.080011 – специальность (маркетинг).

Анализ данных 229


Пример кодирования

Определите, какой вид кодирования используется в


номере группы

3077/1

Анализ данных 230


 Кодирование 
Закодированные ответы
респондентов, снабженные ключом
и сохраняемые обычно
в базе данных, –

золотой фонд
результатов исследований.
 Анализ данных

231
Простая табуляция
Отлично – 5 чел
Хорошо – 12 чел
Удовлетворительно – 7 чел
 Обобщение результатов исследования
 Выявление ошибок
 Определение выбросов
 Определение эмпирического распределения
 Получения суммарных статистик
 Решение вопроса о том, что делать с неответами по
отдельным пунктам:
 оставить неответ и отчитаться категорией «нет ответа»;
 для каждого вопроса указать, из скольких ответов
получено среднее;
 заменить неответ медианой, модой или другой оценкой.
Анализ данных 232
Перекрестная табуляция
Исследуются две или более переменных одновременно.

Кол-во Количество членов семьи


посещений 1 2 3 4 5 Более
магазина в
неделю
Реже 1 111 1 11111
1 или 2
3 или 4
5 и более

Анализ данных 233


Перекрестная табуляция

Заключение Истинное положение дел


исследователя
Нет связи Есть связь

Нет связи Правильное Ложное отсутствие связи

Ложная Правильное, если получена


Есть связь связь правильная количественная
оценка

Анализ данных 234


Перекрестная табуляция
С введением дополнительной переменной:
Первичное
заключение Заключение Заключение
изменяется подтверждается

1А – уточняется влияние
1Б – раскрывается ложная
Есть связь
зависимость 2
переменных
1В – определяются
граничные условия
Нет связи
3 4
переменных

Анализ данных 235


Таблица взаимосвязи первого порядка
Расчет уточненного влияния дохода на процент семей,
владеющих большим количеством телевизоров
Семьи Небольшие Большие Любые
Число Мал Бол Все Мал Бол Все Мал Бол Все
тв
Доход
27
низк. (56%) 21 48 4 4 8 31 25 56
(44%) (100%) (50%) (50%) (100%) (55%) (45%) (100%)
Доход
8
выс. (44%) 10 18 6 20 26 14 30 44
(56%) (100%) (23%) (77%) (100%) (32%) (68%) (100%)
Всего 66 34 100
семей
Влияни (65-44) = 12 (77-50) = 27 (68-45) = 23
е процентных процентных процентных
дохода пунктов пунктов пункта
Уточненное влияние дохода:
(66×12+34×27)/100 = 17 процентных пунктов
Анализ данных 236
Таблица взаимосвязи первого порядка
Расчет уточненного влияния размера семьи на процент
семей, владеющих большим количеством телевизоров
Доход Низкий Высокий Любой
Число Мал Бол Все Мал Бол Любо Мал Бол Все
ТВ е
Семья 27 21 48 8 10 18 35 31 66
небол. (56%) (44%) (100%) (44%) (56%) (100%) (53%) (47%) (100%)
Семья 4 4 8 6 20 26 10 24 34
бол. (50%) (50%) (100%) (23%) (77%) (100%) (29%) (71%) (100%)
Всего 56 44 100
семей
Влияни (50-44) = 6 (77-56) = 21 (71-47) = 24
е процентных процентный процентных
размер пунктов пункт пункта
а семьи
Уточненное влияние размера семьи:
(56×6+44×21)/100 = 13 процентных пунктов
Анализ данных 237
Главная таблица
Вопрос: Сколько телевизоров в Вашей семье?
По доходу По размеру
Всего в семьи
выборке
27613 >27613 2 >2
Общее 100 56 44 66 34
количество (100%) (100%) (100%) (100%) (100%)
семей
Семей, где 0 45 31 14 35 10
или 1 телевизор (45%) (55%) (32%) (53%) (29%)
Семей, где 2 и 55 25 30 31 24
более (55%) (45%) (68%) (47%) (71%)
телевизоров

Анализ данных 238


OLAP

Семья
небольшая
Семья
большая
Телевизоров Телевизоров
немного много
Доход низкий 8 10
Доход высокий 27 21

Анализ данных 239


OLAP – это
 быстро (время реакции на запрос пользователя, даже
сложный, должно быть не более 30 с, что не всегда
достижимо на современном этапе);
 гибко; можно задавать различные, в том числе и
нестандартные, процедуры обработки и визуализации
данных;
 обработка совместно используемых данных, с
применением механизмов разграничения прав доступа к
данным и их изменения;
 обработка многомерных данных (конкретный смысл
этого термина определяется особенностями реализации
хранилища);
 получение полезных для принятия решений сведений.

Анализ данных 240


OLAP – это

 сложно (нужно организовать хранение данных);

 инструмент, требующий квалификации.

Анализ данных 241


Шкалы измерения

Измерение есть правило присвоения чисел


объектам с целью представить количество
некоторого их атрибута.

Анализ данных 242


Шкалы измерения

 Номинальная
 Порядковая
 Интервальная
 Относительная

Шкала Характеристики
Номинальная Мода
Порядковая + медиана
Интервальная + арифметическое среднее
Относительная + геометрическое среднее

Анализ данных 243


Представление данных

Группировка

Затраты на рекламу, Объем продаж,


Товар ден. процент к общим физ. ден. ед.
ед. затратам на рекламу ед.
1
2

Итого

Анализ данных 244


Представление данных

Индексы
Для построения индекса выбирается базовый период 0 иt
t
текущий (отчетный) период n. Определяются значения
анализируемого параметра (объема продаж, прибыли) в
двух этих периодах: qt0 и qtn соответственно. Индекс
будет равен

i = qtn/qt0.

Анализ данных 245


Выбор метода анализа

Количество переменных
Методы 1 >1

анализа Одномерный анализ Многомерный анализ

Количество зависимых переменных


0 1 >1
Анализ Анализ Декомпозиция
взаимозависимости зависимости задачи

Шкала переменных Шкала зависимой переменной


Н П И Н П И
Шкала Шкала Шкала
причинных причинных причинных
переменных переменных переменных
Н П И Н П И Н П И
переменными; кластерный анализ
Факторный анализ с фиктивными

Индекс предсказательной связи;

Ранговая корреляция Спирмана

с фиктивными переменными
коэффициент контингенции
Коэффициент конкордации

Дискриминантный анализ

Регрессионный анализ

Регрессионный анализ
кластерный анализ
Факторный анализ;
Кендалла

Анализ данных 246


Одномерный анализ

Задача. Разработан новый продукт, выпускаемый в трех


видах упаковки: маленькой, средней и большой.
Прошлый опыт производителя говорит о том, что обычно
на одну проданную маленькую упаковку приходится
четыре средних и три больших (нуль-гипотеза).
Так ли это?
Имеются результаты продаж: 120 маленьких упаковок, 550
средних и 330 больших; всего – 1000.

Анализ данных 247


Одномерный анализ

Если бы гипотеза была верна, то среди тысячи продаж


было бы 1000*1/8=125 маленьких упаковок, 1000*4/8=500
средних и 1000*3/8=375 больших.

Очевидно, что результаты 126, 501, 373 также


свидетельствовали бы в пользу нуль-гипотезы, так как
возможны случайные малые отклонения.

Однако полученные результаты отличаются от


предсказанных гипотезой довольно сильно…

Анализ данных 248


Одномерный анализ

Для проверки данной нуль-гипотезы можно использовать


критерий согласия 2. Он основан на сравнении
ожидаемого и реального количества проданных упаковок.

k (O i  E i ) 2

 
2
,
i 1 Ei
где i – номер типа упаковки; k – количество типов упаковок;
Oi – измеренное количество проданных упаковок каждого
типа; Ei – ожидаемое количество проданных упаковок.
Анализ данных 249
Одномерный анализ
При идеальном совпадении результатов с предсказанными
2=0

Подставив значения в формулу, получим


2=10,9.
Граничное значение определяется как функция вероятности
ошибки (обычно 5%)
и числа степеней свободы =k-1=2.
Имеются таблицы. Имеется функция Excel

ХИ2ОБР(вероятность; степени свободы)

кр2 =5,99
Анализ данных 250
Одномерный анализ

Можно найти  для результатов измерения по тем же


таблицам.

Для =k-1=2 и 2=10,9  = 0,005.


Что это значит?

Анализ данных 251


Задача
Как использовать критерий хи квадрат для проверки
зависимости заболеваемости кариесом от месяца рождения?
Процент первичных пациентов с кариесом
http://ms-intern.livejournal.com/5551.html

Анализ данных 252


Задача
Как использовать критерий хи квадрат для проверки
зависимости заболеваемости кариесом от месяца рождения?
Процент первичных пациентов с кариесом
http://ms-intern.livejournal.com/5551.html

Количество больных по месяцам рождения

6 4 2 1 1 3 6 6 0 1 5 4

В среднем: 3,25

Анализ данных 253


Тест Колмогорова-Смирнова

Задача. Компания выпускает четыре вида лака для дерева:


очень светлый, светлый, средний и темный.

Есть ли покупательские предпочтения одного из крайних


оттенков?
Если да, то будет производиться только этот оттенок.
В противном случае будет развернуто производство всех
оттенков.

Пусть из 100 покупателей 48 приобрели очень светлый


оттенок, 32 – светлый, 16 – средний и 4 – темный.

Анализ данных 254


  Dmax n,

Тест Колмогорова-Смирнова

Параметр  Колмогорова-Смирнова определяется как

  Dmax n,
где Dmax – максимальное значение модуля разности кумулят;
n – количество элементов в выборке.

Для данного примера =1,5.

Анализ данных 255


Тест Колмогорова-Смирнова
Фактически Фактичес Ожида- Ожидаема Модуль
куплено -кая емые я кумулята разности
Оттенок
кумулята покупки покупок кумулят
покупок (?) Di
Очень
светлый 35 35 25 25 10
Светлый 30 65 25 50 15
Средний 20 85 25 75 10
Темный 15 100 25 100 0

Критические значения определяются по таблицам

Анализ данных 256


среднем
об одном
Гипотезы

Распределение в генеральной совокупности нормально?


Да

Нет
Выборка большая? Дисперсия генеральной
совокупности известна?
Да

Нет

Анализ данных
Да

Нет

Распределение в ге- Дисперсия гене-


неральной совокупно- ральной совокуп- Выборка
сти симметрично? ности известна? большая?

Да
Да
Да

Нет
Нет
Нет

Преобразовать
переменную,
чтобы распре-
деление было
симметричным
t
z
z

n
n

i1
i1
(

~
~
~

X 

статистика
статистика

XX
XX
статистика

Используется
Используется
XX

n(n  1)
Используется

X
X n

 i )

 ( Xi  X)
~ 2

~ 2

n(n  1) 257
Гипотезы об одном среднем

Если количество покупателей в магазине больше 100 чел в день,


проблем нет.
Иначе надо что-то делать.
Сколько покупателей в магазине?

Проверяли 50 дней.

Дисперсия генеральной совокупности. Допустим взята из прошлых


исследований.

Анализ данных 258


Гипотезы об одном среднем
Получено:
~
n=50; X =106;  2X =14,1.
 2X~ =  X n = 14,14/7,07 = 2,00.
Измерим в сигмах.
~
X - X = (106-100)/2,00=3[  X~ ].
~
Вероятность того, что расстояние от X до X будет не более 3  X~ ,
равна 0,9973. (2 хвоста)
~
Вероятность того, что расстояние от X до X будет более 3  X~ , равна
0,0027 (2 хвоста).
Вероятность того, что X будет меньше 100 или больше 112, равна
0,0027 (2 хвоста).
Вероятность того, что X будет меньше 100, составляет
0,0027/2=0,0014 (1 хвост).
ИТОГ: Вряд ли среднее количество посетителей меньше 100.
А не сделана ли лишняя работа?
Анализ данных 259
Гипотезы об одном среднем
Получено:
n=10; ni = 94, 100, 105, 106, 106, 106, 106, 107, 112, 118;
~
X =106,5.
Ожидалось: 100, 100, 100, 100, 100, 100, 100, 100, 100, 100.

Расчет:
Ширина доверительного интервала не 2×z×  X~ , а 2×t×  X~ .
t(α=0,05;=9)=2,26 вместо z=2
Проверка:
=СТЬЮДЕНТ.ТЕСТ(массив1;массив2;количество_хвостов;
тип=1),

Результат: 0,003.
α = 0,003. Гипотеза о превышении числа посетителей
значения 100 верна на 99,7%.

Анализ данных 260


Многомерный анализ
Коэффициент контингенции
Пусть требуется исследовать зависимость размера
покупаемой стиральной машины от размера семьи.
Независимая (причинная) переменная – размер семьи.
Возможные значения: В1 – семья из 1…2 чел;
В2 – из 3…4 чел;
В3 – из 5 и более чел.
Зависимая переменная (следствие) – размер
приобретаемой стиральной машины. Возможные значения:
А1 – обрабатывает менее 2,5 кг белья ;
А2 – от 2,5 до 4 кг;
А3 – от 4 кг и выше.

Анализ данных 261


В1 В2 В3 Всего
A1 20 40 30 90
A2 30 60 50 140
A3 20 20 60 100
Всего 70 120 140 330
Р(А1)=n(A1)/n=90/330; P(A2)=140/330; P(A3)=100/330;
P(B1)=n(B1)/n=70/330; P(B2)=120/330; P(B3)=140/330,
где n – общее количество семей;
n(x) – количество семей в категории x.
Если зависимости A(B) нет, то :
O11=nP(A1)P(B1)=330(90/330)( 70/330 ) =19,1;
O12=nP(A1)P(B2)=330(90/330)(120/330) =32,7;

O33=nP(A3)P(B3)=330(100/330)(140/330) =42,4.
Анализ данных 262
k (
l O  E )2

  
2 ij ij
,
i 1 j 1 Eij

где k – количество строк; l – количество столбцов; Eij –


фактические значения, взятые из таблицы, распределена как
2 с количеством степеней свободы , равным (k-1)×(l-1).
Для примера значение формулы равно 21,2, а значение
соответствующего 2 равно 9,5. Таким образом, гипотеза Н0
отвергается в пользу НA и объем покупаемой стиральной
машины принимается зависящим от размера семьи

Анализ данных 263


Собрано В1 В2 В3 Всего
А1 20 40 30 90
А2 30 60 50 140
А3 20 20 60 100
Всего 70 120 140 330
Расчет по В1 В2 В3 Всего
гипотезе
А1 19,1 32,7 37,4 90
Не сходится!?!
А2 29,1 49,9 58,2 140
А3 20,8 35,6 41,6 100
Всего 70 120 140 330
ХИ2ТЕСТ(фактический интервал; ожидаемый интервал)
Достоверность нуль-гипотезы равна 0,0003. Отвергаем.
Анализ данных 264
Коэффициент контингенции показывает силу влияния одной
переменной на другую. Вычисляется по формуле:

C   (n   ).
2 2

Здесь n – объем выборки. Для данного примера он равен


0,25. Если зависимость отсутствует, то С=0. Максимально
возможное значение (для сильной связи) определяется для
равного числа строк и столбцов r как

Cmax  (r  1) r ,
что составляет 0,82. Значит, можно сделать вывод о
несильном влиянии размера семьи на приобретение большой
стиральной машины.
Анализ данных 265
Индекс предсказательной связи.
Как предсказать А, если В неизвестно?
Как предсказать А, если В известно (для каждого В)?
Какова вероятность правильного предсказания в двух
случаях?

В1 В2 В3 Всего
А1 20 40 30 90
А2 30 60 50 140
А3 20 20 60 100
Всего 70 120 140 330

Анализ данных 266


Индекс предсказательной связи

Если В неизвестно, то прогноз А2 сбудется с вероятностью


P(A2)=140/330=0,42.
Если известно, что некоторый объект имеет B1, то для него
предсказывается А2 с вероятностью P(A2/B1)=30/70. Для В2
предсказывается А2 с вероятностью P(A2/B2)=60/120, и для В3 –
А3 с вероятностью P(A3/B3)=60/140. Общая вероятность верного
предсказания в этом случае равна
P(B1)P(A2/B1)+P(B2)P(A2/B2)+P(B3)P(A3/B3)=0,45
Индекс предсказательной связи λ - относительное снижение
ошибки предсказания.
Изменяется от 0 (связи нет) до 1 (связь максимальна)
В примере ошибка предсказания снизилась с (1-0,42)=0,58 до
(1-0,45)=0,55, то есть на 0,03.
Относительное снижение ошибки предсказания равно:
λ = 0,03/0,55=0,06. Это мало.

Это взаимозависимость? Шкалы атрибутов?


Анализ данных 267
Коэффициент ранговой корреляции Спирмана
Номер Ранг по оценке Ранг по Разность 2
дистрибьютора руководства отзывам рангов di di
i покупателей
1 8 6 -2 4
2 4 2 -2 4
3 5 8 3 9
4 7 9 2 4
5 2 1 -1 1
6 1 3 2 4
7 3 7 4 16
8 6 5 -1 1
9 9 4 -5 25
10 10 10 0 0
n
 i
d 2
68
i 1

Анализ данных 268


Коэффициент ранговой корреляции Спирмана
n
6 di2
rS  1  i 1
.
n(n  1)
2

Максимум = 1 (сильная корреляция), минимум =0 (нет


корреляции). Расчет дает 0,59.
Нуль-гипотеза Н0 – нет связи между уровнем сервиса и
общим показателем эффективности. НА – есть такая связь.
Критические значения rs для принятия гипотез имеются в
специальных таблицах. При количестве оцениваемых
объектов n10 можно пользоваться t-статистикой:
t  rS (n  2) (1  rS2 ).
Количество степеней свободы  = n-2, а =0,1
В примере t = 2,1,  = 8, tкр из таблицы равно 1,397.
Гипотеза об отсутствии взаимосвязи отвергается.
Анализ данных 269
Коэффициент конкордации
Номер Ранжирован Ранжирован Ранжирован Сумма
дистрибьюто ие судьей 1 ие судьей 2 ие судьей рангов
ра i 3=k Ri
1 5 4 3 12
2 6 3 4 13
3 9 8 5 22
4 1 1 1 3
5 10 10 10 30
6 2 9 2 13
7 7 2 8 17
8 3 5 9 17
9 8 7 6 21
10 = n 4 6 7 17
Как зависит сумма рангов от согласованности мнений?
Если все мнения идеально согласованы? Если разброд?
Анализ данных 270
Коэффициент конкордации
n
 (R i  R ) 2 Числитель напоминает что?
Когда числитель большой?
 i 1
, где
1 2 3 R – среднее значение для Ri.
k (n  n)
12
При n>7 значения k(n-1) распределены как 2 с n-1 степенями
свободы.
Нуль-гипотеза НО в данном случае заключается в том, что связи между
ранжированиями нет, альтернативная НА – что связь есть.
Для примера  = 9, R = 16,5,  = 0,62, 2 , критическое
значение 2 для  равно 16,9. Таким образом, нет оснований для
того, чтобы отвергнуть гипотезу об отсутствии взаимосвязи между
оценками. Оценки считаются несвязанными (противоречивыми).
Анализ данных 271
Маркетинговые исследования
часть 4
Кластерный анализ

Задача. Откомандировать приемщиков грибов и ягод в шесть


деревень (A – F) одного района.
Расстояния между деревнями в км заданы.
Требуется уменьшить их перемещения

DF = 100 AB = 125 AD = 150


DE = 105 BF = 130 CE = 155
AC = 110 CD = 135 BE = 160
BD = 115 EF = 140 AE = 165
BC = 120 CF = 145 AF = 170

Анализ данных 273


а) б)

D F
Простая 100 D 100 F

кластеризация 105
(метод ближнего Е

соседа)
Расстояние в) г) C
B
170
110 110
160 115
C D 100 F 100 F
150 A A D
105
140 105
Е Е
130
120 д)
B
C 120
110
110
100 115
100 F
A D
А С В D F E Элементы 105
Анализ данных Е 274
Полная
кластеризация Расстояние
(метод дальнего 170
соседа)
160
150
140
130
120
110
100

А С В D F E Элементы
Проиллюстрировать процесс
Анализ данных 275
Ход полной кластеризации (метод дальнего соседа)
 Объединяются D и F на уровне 100.
 Уровень 105 пропускается, так как объект E не может быть
присоединен к кластеру DF (еще не «проверено» расстояние
EF).
 Формируется кластер AC на уровне 110.
 Уровни 115 и 120 пропускаются, так как B еще не может
быть присоединен ни к кластеру DF, ни к AC.
 B добавляется к AC только на уровне 125.
Это – расстояние от вновь присоединяемого элемента B
до самого дальнего от него элемента кластера AC.
Поэтому данный метод кластеризации называется также
методом самого дальнего соседа.
 Присоединение E к кластеру DF на уровне 140.
 Один кластер на уровне 170 – максимальном расстоянии
между исследуемыми объектами.

Анализ данных 276


Другие виды кластеризации
 Узловая
 На заданное число групп

Меры расстояний, если имеется несколько характеристик


 Евклидово n
Dij   ( Xki  Xkj ) 2
,
k 1
 Квадрат Евклидова расстояния Зачем он?
 Manhattan block (кварталы Манхэттена)
Определите формулу
 Корреляция

Анализ данных 277


Подобие читательских вкусов
Пара Количество Количество Количество
респон журналов, журналов, несовпаден
дентов которые оба которые оба не ий во
читают, a читают, b вкусах, c
AB 2 4 4
AC 1 4 5
BC 2 3 5
a/(a+b+c); a/(b+c);
(a+b)/(a+b+c); b/(a+b+c).
В чем разница?

Анализ данных 278


Регрессионный анализ
Регрессионный анализ – метод определения вида связи
между одной или несколькими независимыми переменным и
одной зависимой.

Номер Объем Количество Количество Оценка


города продаж торговых реклам по ответствен-
в представи- местному ного
городе, телей в телевидению, менеджера,
тыс.р. городе, чел. шт/мес баллы
I Yi X1i X2i X3i
… … … … …

Критерий Предикторы

Анализ данных 279


Регрессионный анализ
a) б) в)
Y Y Y

X1 X2 X3

ˆ  a  bX ,
Y 1 1 Почему тут вертикальные группы?

Yi  a1  bX1i  1i , В чем великий смысл


линейной зависимости?
Анализ данных 280
Регрессионный анализ
n
 2
ji  min .
i 1
n
~ ~
 ( X ji  X j )( Yi  Y)
rj  i1
.
ns X j s Y
2
s
r  1 остаточная дисперсия Y / Xj
 1
2
j общая дисперсия 2
.
s Y

sY / Xj называется стандартной ошибкой оценки или


стандартным разбросом регрессии.
Анализ данных 281
Множественная регрессия

ˆ  a b X ,
Y 1 1 1

ˆ   a  b X  b X ,
Y 1 1 1 2 2

ˆ   a  bX  b X  b X .


Y 1 1 1 2 2 3 3

Мультиколлинеарность

Анализ данных 282


Data Mining в регрессионном анализе
ˆ  a b X ,
Y Сколько
1 1 1 всевозможных
ˆ   a  b X  b X ,
Y уравнений при 3-х
1 1 1 2 2
ˆ   a  bX  b X  b X .
Y
переменных? При
1 1 1 2 2 3 3 10-ти? При 30-и?

Задача: выбрать только важные переменные


Формальная задача: обеспечить заданное качество модели
при минимальном количестве переменных
 Последовательное увеличение размерности
 Последовательное уменьшение размерности
 Алгоритм плюс l минус r

Анализ данных 283


Регрессия с фиктивными переменными

Задача: определить влияние пола (М, Ж)


Задача: определить влияние уровня жизни: (низкого,
среднего, высокого) на покупку товара А
Задача: определить разницу в знаниях студентов,
получивших неуд, уд, хор и отл.
Какие это шкалы?
Вводятся фиктивные переменные
Количество = число значений минус 1
Для каждого значения, кроме одного, базового только одна
переменная равна 1, остальные равны 0

Анализ данных 284


Регрессия с фиктивными переменными

Учет пола
X1
М 0 Учет уровня жизни
Ж 1 X1 X2
Низкий 0 0 Учет оценки по МИ
Средний 0 1 X1 X2 X3
Высокий 1 0 Неуд 0 0 0
Уд 0 0 1
Хор 0 1 0
Отл 1 0 0
Какой принцип?

Анализ данных 285


Регрессия с фиктивными переменными

База данных
Заработная Оценка за экзамен
ФИО X1 X2 X3
плата (ЗП) (не анализируется)
Иванов 30000 0 0 0 Неуд
Петров 27000 0 0 1 Уд
Сидоров 50000 0 1 0 Хор
Сидорин 60000 1 0 0 Отл
Сидоркин 18000 0 0 1 Уд
Сидорцев 45000 1 0 0 Отл
Сидорчук 34000 0 1 0 Хор

ЗП=а1X1+a2X2+a3X3+b
Анализ данных 286
Регрессия с фиктивными переменными
Результаты
а1 16000
а2 8000
а3 5000
Во сколько выльется получение 3 вместо 2? 4 вместо 3? 5
вместо 4? 5 вместо 3?
Учет оценки по МИ
X1 X2 X3
Неуд 0 0 0
Для справки
Уд 0 0 1
Хор 0 1 0
ЗП=а1X1+a2X2+a3X3+b Отл 1 0 0
Анализ данных 287
Пример регрессионного анализа

Внутренние органы Психическое состояние

Гипертимность
Застревание
Реакция 12 Эмотивность
внутренних органов Педантичность
на нагрузку Тревожность
Циклотимность
Гипотеза об Демонстративность
электроакупунктурной Возбудимость
Дистимность
психодиагностике
Экзальтированность
Анализ данных 288
Пример регрессионного анализа
При выборе всех переменных получается, что объясняется
97% дисперсии, но уровень доверия = 60%
(иногда в пакетах дается вероятность ошибки p-value 40%).
Мало человек (14)?
Методом последовательного увеличения найдено уравнение,
объясняющее 67% дисперсии с уровнем доверия 99%.
Методом последовательного уменьшения найдено
уравнение, объясняющее 91% дисперсии с уровнем доверия
100%.
Пример удачной находки:
Возбудимость=8,7*реакция желудка +
+ 9,0*реакция тонкого кишечника - 8,3*реакция печени.
И чё?
Анализ данных 289
Пример регрессионного анализа
Перспективы
 Психодиагностика
 Психотерапия
 Психогигиена
 Мониторинг психического состояния
 Лечение
Пример регрессионного анализа
Анализировалась зависимость оценок (из деканата) от
черт характера студентов (психологические тесты) по
разным предметам
Вопрос: какая характеристика оказалась самой важной
для получения высоких оценок?

Анализ данных 290


Факторный анализ
В самой общей постановке факторный анализ –
комплексное изучение и измерение воздействия факторов
на величину результативных показателей.

Измеренные параметры должны быть представлены


в интервальной или относительной шкалах.
Будет рассмотрена группа методов, выявления латентных
обобщающих характеристик изучаемых явлений.
Гипотеза: явление или процесс имеет набор скрытых, но
существенных характеристик, которые определяют его
поведение.
Если гипотеза соответствует действительности, факторный
анализ будет успешен.
Анализ данных 291
Факторный анализ. Метод главных компонент

Номер Число Число


представит. сделок звонков
Х2 – Число звонков F 1 10 20
2 5 10
3 7 14
… … …

Х1 – Число сделок
Анализ данных 292
Факторный анализ. Метод главных компонент
Fi=a1X1i+a2X2i,
где Fi – проекции точек на новую ось, а1, а2 – постоянные
коэффициенты, X1i, X2i – координаты точек в старой системе
координат.
Иногда используют формулу
~ ~
F  a1( X1  X1 )  a2 ( X2  X2 ),

~ ~
где X1, X 2 – средние значения X1i, X2i .
Новая ось может быть названа «деловая активность».
Критерий построения новой оси – максимум дисперсии
значений F. 2
F  max,
Анализ данных 293
Факторный анализ. Метод главных компонент
Второй фактор перпендикулярен первому и забирает
максимум оставшегося разброса.
Компонент (фактор) Процент дисперсии
1 72
2 20
3 5
4 2
5 1

Анализ данных 294


Факторный анализ. Метод главных компонент

Результаты
 Снижение размерности, возможность графического
представления
 Веса показывают силу влияния переменных
 Возможность именовать компоненты
Из чего складывается динамичность автомобиля?
 Возможность перейти к переменным-заменителям
Какая переменная используется для автомобилей?

Анализ данных 295


Факторный анализ. Пример
 Задано 3 вопроса об удовлетворенностью жизнью дома и
на работе
 Построена корреляционная матрица
 Видны «треугольники» с большой корреляцией

Р1 Р2 Р3 Д1 Д2 Д3
Р1 1
Р2 0,65 1
Р3 0,65 0,73 1
Д1 0,14 0,14 0,16 1
Д2 0,15 0,18 0,24 0,66 1
Д3 0,14 0,24 0,25 0,59 0,73 1

Анализ данных 296


Факторный анализ. Пример
Корреляция между переменными и факторами
F2 F1
P1 0,65 0,56
P2 0,72 0,54
P3 0,51 0,74 F1 1
Д1 0,63 -0,56 Р3 F1'
Д2 0,71 -0,57 Р2
Д3 0,61 -0,63 Р1
Вращение факторов F2

-1 1
Д2
Переменные-заменители, например, Д1 Д3
Д1 и Р3 -1 F2'
Анализ данных 297
Факторный анализ. Проблемы

 Когда применять
 Сколько факторов брать
 Вращать ли и как
 Можно ли взять переменные-заменители

Анализ данных 298


Дискриминантный анализ

Дискриминантный анализ –метод нахождения линейных


комбинаций измеренных параметров,
по которым элементы исследования
разделяются на группы.

Зависимая переменная измеряется в номинальной шкале, а


независимые – в интервальной или относительной.

Анализ данных 299


Дискриминантный анализ. Пример
Данные о работниках
Количество Количеств
Количество звонков о
Имя Количество
звонков постоянны посещени Оце
(номер повторных
потенциальны м й нка
) звонков
м покупателям покупателя покупател
м ей
i X1 X2 X3 X4 O
+
-

Задача: кто они, получившие высокую оценку?


Анализ данных 300
Дискриминантный анализ. Пример

X2
Ось Y=1*X1+2*X2+3*X3+4*X4.
Дискриминантная Y=с
функция Y

A
– элементы типа а
B – элементы типа b

X1
Анализ данных 301
Дискриминантный анализ. Пример

Важность определяется через стандартизированный вес,


k*=skk,
где sk – среднеквадратическое отклонение k-й переменной,
оцененное по выборке.

Y=1*X1+2*X2+3*X3+4*X4.

Анализ данных 302


Дискриминантный анализ. Использование
Средние значения Y для получивших и не получивших приз
YП  1X1,П   2 X 2,П   3 X3,П   4 X 4,П ,
YНП  1X1,НП   2 X 2,НП   3 X 3,НП   3 X 3,НП .
Xk,П , Xk,НП – средние значения k-й независимой переменной
среди получивших и не получивших приз
соответственно.
Есть 2 «центра». Где проходит граница между областями?

YП  YНП nП YП  nНП YНП


YП _ НП  . YП _ НП  .
2 2
Вторая формула: значение, взвешенное по количество
попавших в группы.
Анализ данных 303
Дискриминантный анализ.
Механизм возникновения ошибки
Х2

X1
Анализ данных 304
Дискриминантный анализ. Три группы

X2

A
B

X1
Анализ данных 305
Деревья классификации
Номер Возраст, Доход, Потребление
респондент лет руб./мес пельменей
а (1 – нет, 2 – да)
X1 X2 X3

Задача: построить правило,


Х2 по которому можно
определить по полу и
возрасту, потребитель он(а)
или нет
 Зачем это надо? Еще
примеры?
 Дискриминантный анализ
Х1 работает?
Анализ данных 306
Деревья классификации
Метод построения деревьев классификации
используется для предсказания величины,
измеренной в номинальной шкале, по значениям
одной или нескольких независимых переменных
(в любой шкале).

Дерево решений – графическое отображение правил


классификации.

Можно ли привести любую шкалу к номинальной?

Анализ данных 307


Свойства деревьев классификации

 Иерархичность
Если доход не высокий,
то если доход не низкий,
то это потребитель пельменей.
Другая формулировка:
Если доход высокий,
то это не потребитель пельменей,
иначе если доход низкий,
то это не потребитель пельменей,
иначе это потребитель пельменей.
В нотации Excel
=ЕСЛИ(доход>8000; «Не потребитель»;
(ЕСЛИ(доход<4000; «Не потребитель»; «Потребитель»))

Анализ данных 308


Свойства деревьев классификации

 Высокая гибкость
 Различные шкалы. Необходимо только задать, можно ли
применять условие «больше»
Для каких шкал это можно? Нельзя? Как отражается в
деревьях классификации?
 Возможны линейные комбинации переменных

Анализ данных 309


Методы построения деревьев классификации

 CART – двоичные ветвления по одной переменной


 CHAID – использует многозначные ветвления.
 QUEST – аналог многократного дискриминантного анализа
Например, если в анкете присутствовал вопрос о числе
членов семьи с возможными ответами
1, 2 , 3 , 4 , 5 , более , нет ответа ,
то разделение по этой переменной может произойти на три
ветви:
1 или 2 человека;
3 человека;
более трех человек или неответ.

Анализ данных 310


Работа с деревьями классификации
1.Определяется критерий качества дерева.
 Минимизируется процент неправильно определенных
элементов.
 Если размеры классификационных групп сильно
различаются, больше внимания уделяется большей
группе. Используются априорные вероятности попасть в ту
или иную группу. Их можно
 взять равными;
 задать по имеющимся случаям;
 взять из прошлых исследований.
 Минимизируется стоимость ошибок
2. Выбирается алгоритм построения.
 CART;
 QUEST Рекомендации?
 CHAID.
3. Определяется правило завершения
Ветвлений (см. ниже)
Анализ данных 311
Работа с деревьями классификации

Х2
Ошибки классификации

Для новых случаев

При обучении
Х1
Количество ветвлений

Анализ данных 312


Работа с деревьями классификации

 минимально допустимое количество элементов в узле;


 минимальный процент элементов в узле от общего числа
элементов исследования;
 максимальное число узлов дерева;
 максимальная «глубина» ветвлений;
Дополнительные алгоритмы
 Автоматический поиск минимума ошибки. Часть данных -
для обучения; часть – для проверки.
 Построение нескольких деревьев, максимально
отличающихся друг от друга; выбор наилучшего.
 Ручное «выращивание» каждой ветви шаг за шагом.
4. Вид представления полученных правил.
 словесное описание сегментов;
 запрос к базе данных на языке SQL.

Анализ данных 313


Пример
Сегментация рынка. Товары по почте. На письмо
могут не ответить (98,85%). Убыток от каждого 0,15$;
могут попросить бесплатный каталог (0,56%), но не купить;
Убыток 7$.
могут купить (0,59%, прибыль от каждого в среднем 35$).
Анкета. Размер семьи, возраст главы, пол главы, наличие
кредитной карточки, доход, количество детей, занятие главы
семьи. Следствие – поведение. 81040 случаев.
Первое деление – размер семьи. Категории
1; 2; 3…4; 5 и более; не ответили.
 Лучший процент приносящих прибыль для семьи из 2 чел.
равен 0,98%.
 Для 2 чел. лучший процент у категории с возрастом 55…64
равен 1, 69%.
 Для семей из 2 чел и возраста 55-54 лучший процент у
имеющих доход более 14000: 2, 42% покупают (максимально
покупающая категория). Как называется этот сегмент?
Анализ данных 314
Пример. Результат работы программы
Узел % Ср. прибыль от Индекс Кумулята
респ респ. % ср. индекс
приб.
17 0,76 0,69 3628% (в 36 раз больше, 0,76 0,69 3628%
чем во всей выборке)
18 0,80 0,49 2572% 1,57 0,59 3087%

1 31,2 0,03 168% 50,31 0,17 432%
12 31,5 -0,04 -188% 81,81 0,08 193%

21 -0,21 -1079% 100 0,02 100%

Анализ данных 315


Классификация методом сравнения с образцом
Метод полезен, если видны компактные группы элементов
исследования. Можно применить метод главных компонент
(зачем и как?).
Каждый элемент исследуемого
множества из группы заменяется
своим прототипом.
Шкалы измерения атрибутов
должны быть порядковыми,
интервальными или
относительными.

Каждый представитель сегмента заменяется некоторым


«средним покупателем».

Анализ данных 316


Этапы:
 выбрать центр группы по каждой i-й измеренной
характеристике:
ХПi=(X1i+X2i+…+Xni)/N,
где ХПi – координаты прототипа по i-й характеристике, Xni –
координаты элементов исследования, входящих в группу,
n=1…N, N – число элементов в группе;
 взять в качестве прототипа реальный элемент, координаты
которого наиболее близки к вычисленному центру.

При исследовании нового неизвестного элемента находится


ближайший к нему прототип. Им и заменяется исходный
элемент.

Как оценить расстояние между потребителями?


Анализ данных 317
Метод k ближайших соседей

Для нового элемента исследования находятся k ближайших


соседей с известной классификацией.
Решение об отнесении элемента к той или иной группе
(сегменту) делается, например, с помощью «подсчета
голосов». Это означает, что элемент относится к той группе,
представителей которой больше поблизости.

Кто сосед?

Анализ данных 318


Data Mining (Интеллектуальный анализ данных)
Предпосылки:

 данные, накопленные в компьютерных системах, имеют


практически неограниченный объем;
 накопленные данные разнородны: в виде баз данных,
текста, электронных таблиц содержится как количественная,
так и качественная информация;
 требуется простой и понятный инструмент для работы с
этими данными;
 получаемые результаты также должны быть конкретными,
полезными и понятными.

Анализ данных 319


Data Mining. Определение

Data mining – процесс обнаружения в «сырых» данных


• ранее неизвестных;
• нетривиальных;
• практически полезных;
• доступных интерпретации
знаний, используемых для принятия решений в различных
сферах человеческой деятельности.

Анализ данных 320


Data Mining. Области применения
1. Торговля.
1.1. Анализ совместных покупок.
1.2. Анализ последовательности покупок.
1.3. Построение прогнозирующих моделей.
1.4. Определение параметров, влияющих на цену объектов
недвижимости.
2. Сфера услуг.
2.1. Сегментация клиентов, предложение пакетов услуг.
2.2. Выявление клиентов, которые могут стать лояльными.
3. Промышленность.
3.1. Определение требований к товарам, прогноз их
изменений.
3.2. Определение причин возникновения дефектов.
4. Страхование. Определяется, какие параметры следует
учитывать при страховании.
5. Безопасность. Анализируется типология мошенничества.

Анализ данных 321


Закономерности
Типы закономерностей.
 Ассоциации обозначают связанные друг с другом события.
65% купивших чипсы берут и кока-колу. Если продавать
комплект со скидкой, таких покупателей будет уже 85%.
 Последовательность – это цепочка событий, связанных
во времени. За покупкой фотоаппарата последует покупка
пленки к нему.
 Классификация представляет собой группировку по
одинаковым значениям признака или признаков и разделение
– по различным значениям этих признаков.
 При кластеризации происходит группировка по сходству
на основе признаков. Но она не привязывается к
определенным признакам.
 Прогнозирование будущих значений переменной.
 Прогнозирование значений одной переменной по
значениям других переменных.

Анализ данных 322


Методы Data Mining

1. Регрессионный анализ с выбором набора переменных.


2. Деревья классификации.
3. Методы сравнения с образцом.
4. Нейронные сети.
5. Эволюционные алгоритмы.
6. Генетическое программирование.
7. Алгоритмы ограниченного перебора

Анализ данных 323


Направления развития средств Data Mining:

 универсального применения;

 маркетинговой ориентации;

 проблемно-ориентированные;

 средства для специальных исследований.

Анализ данных 324


Если…то правило
Если А, то В.
 Точность правила – доля случаев В среди случаев А.
 Полнота – доля случаев А среди случаев В.
 Точное и полное правило для евклидовой геометрии: если
треугольник прямоугольный, то в нем есть два угла, сумма
которых равна 90 градусам.
 Неточное, но полное правило: курильщик заболеет раком
легких. Среди курильщиков заболевают 6%. Но среди
заболевших 95% курильщиков.
 Точное, но неполное правило: если существо – человек,
то оно смертно. Все люди смертны, но не все смертные –
люди.
 Неполное и неточное правило: если человек студент, то он
знает информатику. Не все студенты знают информатику, и не
все, знающие информатику, студенты.
Анализ данных 325
Измерение отношения

Отношение это

 Предрасположение к принятию (приятию) объекта; не


поведение, а категория готовности.
 Скрытое качество, которое вызывает последующие
высказывания или реальные действия.
 Направленность на объект: предпочтения, оценки,
чувства.

Мнение – высказанное отношение

Отношение 326
Методы измерения отношения

 Наблюдение поведения

 Объектная задача.

 Измерения психологических реакций.

 Непрямые методы

Отношение 327
Метод равных интервалов Турстоуна и Чейва
 Определяется класс объектов
 Разрабатываются утверждения,
выражающие отношение (Например?)
 Производится опрос среди судей
(А судьи кто?)
Как Вы считаете, насколько положительно характеризует
АВТОМОБИЛЬ ВООБЩЕ (не конкретный!) каждое из
приведенных утверждений
(1 – очень отрицательно, … , 6 – безразлично, … , 11 – очень
положительно).
(При чем тут равные интервалы?)
 Определяется среднее значение (медиану) и дисперсию
для каждого вопроса
 Производится отбор утверждений: разные средние,
минимальная дисперсия
Отношение 328
Метод равных интервалов Турстоуна и Чейва

 Составляется итоговая анкета:


Укажите, с какими из приведенных ниже утверждений
относительно автомобиля Toyota Camry 2015 года Вы
согласны (приводятся только отобранные утверждения)
 Рассчитывается отношение как среднее значение средних
значений по ответам «Да».
Результат – число. Чем оно больше, тем отношение лучше.
 Анализ данных: сравнить отношение среди разных групп, к
разным объектам. Хорошее отношение = лучше среднего.
Плохое = ниже среднего.

Можно ли взять медианное отношение? Что это значит?


Может ли метод не сработать?
Часто ли это бывает?

Отношение 329
Метод суммированного рейтинга Лайкерта

 Определяется класс объектов


 Разрабатываются утверждения, выражающие отношение
Производится опрос среди потенциальных респондентов
Насколько Вы согласны с данным утверждением
относительно автомобиля Toyota Camry 2015 года
(-2 – совершенно не согласен; -1 – скорее не согласен; 0 – не
то, чтобы да, и не то, чтобы нет; +1 скорее согласен; +2 –
полностью согласен).
(В чем главное отличие от предыдущего метода?)
 Ответы преобразуются. Если ответ априорно
положительный, ответ меняет знак
(Зачем это надо?)

Отношение 330
Метод суммированного рейтинга Лайкерта

Преобра- Преобра-
Ответ Ответ зованный зованный
Утверждение Вес «пессими- «оптими- ответ ответ
ста» ста» «песси- «опти-
миста» миста»
Тесно -1 +2 -2 -2 +2
Хорошая
1 -2 +2 -2 +2
динамика
Сумма 0 0 -4 +4

Отношение 331
Метод суммированного рейтинга Лайкерта
 Определяется сумма ответов. Это и есть «истина».
 Хорошие утверждения – те, мнения о которых коррелируют
с суммой:
 Те, у кого большая сумма, указали +2
 Те, у кого маленькая сумма, указали -2.
 Отбирается 10…16 хороших утверждений.
 Итоговая анкета такая же, как и пробная, но утверждения
только хорошие.
 Расчет такой же, как у пробной анкеты
 Анализ такой же, как у метода Турстоуна

Каковы сравнительные плюсы и минусы описанных методов?

Отношение 332
Семантическая дифференциальная шкала

Оцените время
работы магазина: удобное неудобное.

Укажите Ваше впечатление


от автомобиля: престижный спортивный ;

Эта обувь: пригодна только годится, чтобы


для помещения работать на огороде ;

Обслуживание: вежливое Х О невежливое.


Время работы: удобное X O неудобное.

Отношение 333
Змеевидная диаграмма

Обслуживание: Невежливое Вежливое


Расположение: Неудобное Удобное
Часы работы: Неудобные Удобные
Процент по вкладам: Низкий Высокий
Банк A Банк B

Отношение 334
Шкалы рейтинга
Процент
Фактор, наиболее важный при покупке TV
ответов
Репутация марки 35 – 42%
Цена 17 – 20%
Особенности (например, караоке) 12 – 18%
Условия гарантии 10 – 14%
Характеристики (HD, Full HD, Ultra HD) 5 – 11%
Размеры 2 – 10%

 Графические
 С категориями
 Сравнительные

Отношение 335
Шкалы рейтинга. SAM – self assessment manikin

Отношение 336
Шкалы рейтинга
Параметр шкалы Влияние на надежность
(отсутствие случайной ошибки)
Число вопросов Прямое
Сложность вопросов Обратное
Тип шкалы Нет
Количество позиций шкалы Прямое
Тип меток Нет
Описание позиций шкалы Нет
Наличие нейтральной Прямое при неуверенности в
позиции шкалы ответах

Отношение 337
Многомерное шкалирование
Отвечает на следующие вопросы.
 Сколько атрибутов рассматривает респондент?
 Как они называются?
 Где идеальный продукт?
Scree
Scree Plot plot
,02
Mercedes BMW
Buick VW

A B C
Normalized Raw Stress

a) ,01
B
c) d)
B D
b) B
A D
A C
A C C
0,00
1 2 3 4

Dimensionality

International MR 338
Многомерное шкалирование
A B C
a) B
в) г)
B D
б) B
A D
A C
A C C

Совместный анализ – был на практике

Отношение 339
Измерение психологических атрибутов

Готовность рискнуть

Покупка автомобиля Склонность


с рук к риску

Наблюдение Анкета (тест)

Опыт – почва наблюдений

Отношение 340
Проектирование тестов
Коммуникабельность – это дружелюбие с определенной
целью: подвигнуть людей в желательном для Вас
направлении.

Составляющие
 умение хорошо руководить командами (эмпатия в
действии);
 умение искусно уговаривать (проявление
самоосознанности, саморегуляции и эмпатии);
 знание того, когда лучше обратиться к эмоциям
собеседника, а когда – к его разуму;
 публично видимая мотивация деятельности (энтузиазм),
которая распространяется и на окружающих.

Эмпатия - осознанное сопереживание текущему


эмоциональному состоянию другого человека, без потери
ощущения внешнего происхождения этого переживания
Отношение 341
Проектирование тестов
 Определяется тестируемое понятие
 Разрабатываются утверждения
 Допущение 1. Сумма ответов на все вопросы и есть
«истина»
 Допущение 2. Нельзя определить характеристику по
одному вопросу
 Определяется сумма ответов
 Изменяются вопросы с отрицательной корреляцией
 Максимизируется
 k

 k 
  Di  где  – коэффициент надежности
  1  i1 , Кронбаха; Di – дисперсия ответов
 k  1 Dt  на i-й вопрос; Dt – дисперсия сумм
 
  результатов теста по всем
участникам
Отношение 342
Проектирование тестов

Альфа – свойство теста. Но какое-то альфа зачем-то


считают для каждого вопроса.
Что полезно рассчитать для каждого вопроса?

Домен – набор вопросов, освещающих одну и ту же


проблему.
 Определяется содержание домена
 В готовый тест включаются преобразованные оставшиеся
вопросы
 Тест снабжается ключом

Какой вопрос теста (в том числе и теста на знание


учебного предмета) хороший?

Отношение 343
Маркетинговые исследования
часть 5
Что влияет на результаты МИ?
 Действительные отличия в измеряемых характеристиках.
 Отличия в других относительно стабильных
характеристиках респондентов.
 Переменные факторы: настроение, состояние здоровья,
усталость, болезнь.
 Ситуационные факторы. На вопрос о роли мужа и жены в
покупке автомобиля муж скажет одно, жена – другое, они
вместе – третье.
 Характеристики интервьюера и его поведение.
 Формулировка вопросов анкеты.
 Погрешности инструмента измерения.
 Механические факторы

Практика МИ 345
Валидность

Xo=Xt+Xs+Xr,
Xo – результаты наблюдений или измерений;
Xt – истинное отличие в характеристиках;
Xs – систематическая (постоянная) ошибка;
Xr – случайная ошибка.

Валидность (точность, правильность) –


степень, в которой разница в результатах измерения
отражает действительную разность измеряемых
параметров, а не ошибки.
Высокая валидность означает, что Xo=Xt.
Практика МИ 346
Виды валидности

 Предсказательная валидность.
 Валидность совпадения. Температура больного была
измерена точно.
 Валидность содержания. Тест правописания не должен
включать только специальные термины.
 Валидность по отношению к конструкциям.
 Валидность конвергенции. Два теста на грамотность
должны давать сходные результаты.
Валидность отличия. Результаты теста на грамотность и
знание специальных терминов должны давать разные
результаты.

Практика МИ 347
Надежность
Надежность – это отсутствие случайной ошибки в
измерениях. Надежность означает, что Xr=0.

Измерение может быть надежно, но не валидно.


Валидность => надежность;
Ненадежность => невалидность.
Стабильность –это повторяемость результатов
исследований, проведенных повторно.

Эквивалентность – это равенство результатов для каждой


части используемых инструментов опроса.

Практика МИ 348
Проверка анкеты
 Кабинетный анализ (самостоятельно или с коллегами)
 Опрос 30…50 человек и проверка
Дифференцирующая способность анкеты
 Отсутствие разброса ответов
 Использование части шкалы
 Неравномерное использование шкалы
 Гребенчатый вид
Данная модель – одна из лучших __________________ ;
Данная модель не хуже многих ____________________ ;
Данная модель не хуже и не лучше других __________ ;
Есть много моделей лучше этой ___________________ ;
Данная модель хуже многих других ________________ .

 Решение по выбросам
Практика МИ 349
Проверка анкеты

 выбор чувствительности шкалы

Чувствительность шкалы – это количество делений,


приходящихся на единицу измеряемой величины.

Практика МИ 350
Проверка анкеты
 Проверка валидности содержания
 Наличная обоснованность
 Разные инструменты изучения одного вопроса
• Это сложно.
• Если получено различие в оценках, то неясно, какой из
инструментов более правильный.
• Даже различие мало, неясно, измерялась ли одна
характеристика или две различных, но имеющих высокую
корреляцию.
• Если два инструмента включаются в одну анкету для
взаимоконтроля, то ответы часто различны.

 Судейство
 Проверка валидности совпадения
Практика МИ 351
Типовые МИ, основные области исследования

 Исследования внешней среды


 политическая среда;
 правовая среда;
 экономическая среда;
 научно-техническая среда;
 социально-демографическая среда;
 экологическая среда;
 культурная среда:
 причуды;
 тенденции;
 мегатенденции.

Практика МИ 352
Типовые МИ, источники информации

 Литература (политические и экономические обзоры)

 Опрос информированных лиц (политиков, социологов,


экономистов)

 Вторичные данные (статистика) экспертные оценки;

 Cool-hunting.

A school that’s cool in Beverly Hills

Практика МИ 353
Демография
 Влияние политики на демографию Что вы знаете?
 Возрастная структура населения

Метод:
 Статистические обзоры

Практика МИ 354
Демография
 Этническая структура населения

Практика МИ 355
Демография
Уровень образования

Практика МИ 356
Демография
Структуры домашнего хозяйства

Практика МИ 357
Демография
 Географическое перемещение населения.

Практика МИ 358
Экономическая среда
 Уровень развития экономики:
 экономика, обеспечивающая существование населения;
 экономика, экспортирующая природные ресурсы;
 развивающаяся экономика;
 индустриальная экономика;
 постиндустриальная экономика.
 Распределение доходов:
 очень низкие;
 преимущественно низкие;
 очень низкие и очень высокие;
 низкие, средние и высокие;
 преимущественно средние.
 Уровень цен, размер сбережений, доступность кредитов.
 Природная среда:
 ограничения на продажу экологически вредных
продуктов;
 защита ограниченно возобновляемых ресурсов;
 защита невозобновляемых ресурсов;
 цены на энергоносители
Практика МИ 359
Экология
 Быстро расширяется набор новых товаров, призванных
сохранить природную среду;
• в Англии используют для каминов только бездымный уголь;
• на автомобили во многих странах требуется установка до-
вольно дорогостоящих систем очистки выхлопных газов;
• используется разлагающаяся в природе упаковка;
• хотят перейти на спирт для автомобилей;
• ведутся работы по утилизации отходов.

Практика МИ 360
Социокультурная среда
 Мнение людей о самих себе (товар – воплощение мечты).
Люди считают себя:
 охранителями;
 деятелями;
 потребителями;
 реформаторами;
 искателями;
 эскапистами.
 Мнение людей о других.
 Отношения между индивидами и организациями.
 Взгляды людей на общество.
 Отношение к природе (товары для туризма).
 Базовые ценности и убеждения (надо отслеживать).
 Вторичные ценности.
 Субкультуры. Какие методы?
Практика МИ 361
Исследование потребительского рынка. Показатели

Рыночный потенциал – предельный спрос при больших


маркетинговых затратах.
Базовый спрос – спрос при отсутствии маркетинговых
затрат.

Чувствительность спроса к маркетингу –


разность между рыночным потенциалом и базовым спросом.

Текущий объем реализации товара (емкость рынка)


– это объем продаж в денежном или натуральном
выражении за определенный период времени при
определенных условиях внешней среды и определенном
уровне маркетинговых затрат.
Практика МИ 362
Исследование потребительского рынка. Показатели
Темп замены товара – это величина, обратная сроку
службы. Она показывает, какая доля парка товара,
находящегося в эксплуатации, требует замены в течение
заданного периода времени .

Коэффициент насыщенности рынка определенным


товаром в определенный период времени – это доля
удовлетворенной потребности в данном товаре на данном
рынке.

Практика МИ 363
Коэффициент насыщенности рынка
n n
Po   Pt  R t
K Нас  1  t 1
n
t 1

Po   Pt
t 1
где Po – потенциальная потребность в товаре на момент
выхода на рынок; Pt – изменения потенциальной потребности
в соответствующий период; Rt – объем сбыта в период.
Одна из формул для определения Pt выглядит как
Pt=lt+rt+bt*mt
где lt – изменения потенциальной потребности за счет
рекламы, появления товаров-субститутов, социальной
политики и т. д.; rt – объем товаров, требующих замены; bt –
среднее количество товара, потребляемое одним
покупателем; mt – изменение количества покупателей.

Практика МИ 364
Исследование потребительского рынка. Показатели

Объем продаж организации

Доля рынка
vj
d j   100%
E
где
dj – доля рынка j-го предприятия,
vj – фактический или прогнозируемый объем продаж
предприятия на исследуемый период, например, на год;
Е – емкость рынка.

Практика МИ 365
Исследование потребительского рынка. Показатели
Доля рынка
b
k c a
j j R Sm
j
l
j
dj  Q

k
j 1
a
j c b
j R Sm
j
l
j
где
kj – уровень качества товара j-го предприятия от 0 до 1;
сj – цена товара в денежных единицах;
Rj – затраты на рекламу или темп их роста;
Sj – затраты на стимулирование сбыта
,
или темпы их роста;
а<=1 – коэффициент эластичности спроса по качеству;
b>1 – коэффициент эластичности спроса по цене;
m – коэффициент эластичности спроса по затратам на
маркектинг;
Q – количество предприятий-конкурентов, выпускающих
аналогичные товары.

Практика МИ 366
Методы исследования потребительского рынка

 Тестовый маркетинг
 Опросы потребителей (в том числе об отношении к товару)
 Наблюдения за покупками
 Сбор вторичных данных об аналогичных товарах
 Анализ свойств самого товара.

Как можно определить указанные выше показатели этими


методами?

Практика МИ 367
Исследования рынка товаров производственно-
технического назначения
 Обычно такие рынки информационно-закрыты.
 Количество потенциальных потребителей обычно мало.
 Мотивация покупок рациональна.
 Спрос на средства производства зависит от спроса на
конечную продукцию.
 В процессе покупки участвует группа людей; велика роль
межличностных и личностных факторов.
Участники процесса покупки:
 инициаторы покупки;
 пользователи;
 лица, влияющие на решение;
 лица, принимающие решение
 лица, одобряющие решение;
 покупатели;
 «стражи».

Практика МИ 368
Исследования рынка товаров производственно-
технического назначения
 Особенности проведения исследований
 Обычно выборка не случайна
 Надо опросить лидеров отрасли
 Надо тщательно готовиться
 Надо собирать материал по крупицам из разных
источников

Практика МИ 369
Исследования потребителей. Факторы
 Культурные: культура, субкультура, социальные классы.

Социальные классы – построенные в строгой иерархии,


относительно однородные, стабильные общественные
группы, объединенные едиными ценностями, интересами и
поведением.
 Социальные факторы.
 Референтные группы.
 Семья.
 Роли и статусы.
 Личностные факторы.
 Возраст и этапы жизненного цикла.
 Род занятий.
 Стиль жизни.
 Черты личности и самовосприятие.
Практика МИ 370
Исследования потребителей. Факторы
 Культурные: культура, субкультура, социальные классы.
Социальные классы – построенные в
строгой иерархии, относительно
однородные, стабильные
общественные группы, объединенные
едиными ценностями, интересами и
поведением.

Практика МИ 371
Факторы, влияющие на процесс покупки
 Психологические факторы.
Мотивация.
 По Фрейду (ассоциации).
 По Маслоу.
 По Герцбергу ( + - )
 По Кенрику и Гришкевичусу
 Восприятие.
 Избирательное внимание.
 Избирательное искажение.
 Избирательное запоминание.
 Обучение.
 Убеждения.

Практика МИ 372
Исследования потребителей. Процесс покупки
 Покупательские роли:
 инициатор,
 влияющий на покупку,
 принимающий решение,
 покупатель,
 использующий купленный товар.
 Поведение покупателей:
 убеждения,
 установки,
 факт покупки;
 поведение после покупки.
Нужна ли реклама для тех, кто уже купил товар?
Особый метод
 Этнографическое маркетинговое исследование
Исследования потребителей. Отношение
Практика МИ 373
Исследования потребителей.
Уровень удовлетворенности
 Какие атрибуты товара определяют его качество в глазах
потребителей;
 Какова их относительная важность;
 Как оценивается определенный товар по выбранным
атрибутам
 Общая удовлетворенность = средневзвешенное значение.
Источники данных
 Жалобы покупателей на качество товара. Лучше устно.
 Анализ удовлетворенности аналогичным товаром
(вторичные источники).
 Опросы представителей оптовой и розничной торговли.
 Опросы конечных потребителей:
 ключевых клиентов;
 членов списка;
 всех потребителей методом выборочного опроса.
Практика МИ 374
Исследования потребителей.
Уровень удовлетворенности
Интегральная оценка удовлетворенности S одного потребителя
определяется по формуле средневзвешенного значения:
n
 w ipi
S i1
n
 wi
i1

где n – количество рассматриваемых потребителем атрибутов; wi –


заданный им вес i-го атрибута; pi – данная им оценка i-го атрибута

Больше информации дает кластеризация

(Как ее провести? Что дает?)


Практика МИ 375
Исследование цен

Изучаются:
 фактически сложившиеся цены;
 ценовая политика конкурентов;
 государственные меры регулирования цен;
 влияние цен на продажи;
 психология восприятия цен (например, 9,99 или 4444).
Источники данных:
 ценовые эксперименты;
 математические модели;
 статистические данные;
 экспертные оценки.

Ценообразование – отдельная тема


Практика МИ 376
Исследование продаж
 Фундаментальный анализ динамики
 Прогноз по тренду, технический анализ динамики
 ABC анализ
 XYZ анализ (коэффициент вариации)
 ABCXYZ анализ
Источники данных
 Внутрифирменные данные n
 Данные о внешней среде
Кумулята объема продаж  (x
i 1
ij  xj) 2

kj  n  100%
xj
A B C

1 2 3 4 5 6 7 8 9 10 Вид товара
Практика МИ 377
Исследование рекламы

 Изучение средств рекламы


 Оценка рекламной кампании (company, campaign)
 Экономическая эффективность руб/руб.
 Коммуникативная эффективность руб/чел. (опросами):
 самостоятельная узнаваемость;
 несамостоятельная узнаваемость.
 Уровень побудительности (лабораторные эксперименты)
 Мотивационное воздействие (глубинное интервью).
 Эмоциональное воздействие (технические средства).
 Влияние рекламы на поведение покупателей.
 Разница сделанных покупок в экспериментальной и
контрольной группах.
 Отношение к рекламной кампании (опрос целевого
сегмента).
Практика МИ 378
Исследование рекламы

Исследования, связанные с разработкой рекламы


1. Генерация идей о форме и содержании: фокус-группа
или мозговая атака. Учитываются результаты изучения
важности атрибутов товара, его воспринимаемые и
действительные характеристики. В рекламе
подчеркиваются достоинства товара в глазах
потребителей.
2. Готовые варианты рекламы показывается группе
респондентов. Обычно в лабораторных исследованиях.
Метод фокус-групп или технические средства.
3. Пробная партия рекламных плакатов демонстрируется в
ограниченном объеме рыночного пространства
Анализируются отзывы посетителей (по результатам
опросов) и изменения объемов продаж.

Практика МИ 379
Исследование личных продаж
 Найти список
 Выбрать подход
 Проконтролировать процесс
Исследование стимулирования сбыта
 покупателей
 продавцов
 Торговлю

 Выбрать метод

Исследование пропаганды

Исследование PR

Практика МИ 380
Исследование товара

Чего хочет Что выгодно


потребитель производить
(продавать)

Практика МИ 381
Исследование товара

 Определяются факторы успеха нового товара (экспертным путем


либо опросами разработчиков, маркетологов фирмы, торговых
посредников, реже – потребителей).
 Определяются показатели рынка и их прогноз.
 Выбирается номенклатура производимых товаров.
 что выпускать?
 какие атрибуты важны?
прямой опрос;
опрос методом сравнения;
опрос методом возможных улучшений:
 за какие улучшения и сколько готовы заплатить потребители?
 Разрабатываются варианты нового товара.
 Обсуждение среди потребителей.
Определяется окончательная номенклатура.
 Разрабатывается окончательный вариант нового товара.
 Разрабатывается план выпуска нового товара.
 Разрабатывается план маркетинга для нового товара.
Практика МИ 382
Исследование качества товара
Качество товара – совокупность его свойств,
удовлетворяющих определенные потребности
потребителей в заданных условиях.
Показатели качества:
 по областям применения:
 конструктивные (мощность и максимальная скорость
автомобиля);
 технологические или производственные (стоимость
сборки и ремонта);
 потребительские или эксплуатационные (расчетный
пробег автомобиля).
 по области анализа:
 технические;
 технико-экономические;
 экономические
 по условиям оценки:
 базовые;
 достигнутые;
Практика МИ 383
Исследование качества товара
Показатели качества классифицируются (продолжение)
 по характеризуемым свойствам (примеры – ниже):
 единичные (характеризуют один показатель);
 комплексные (обобщают единичные показатели);
 определяющие (по ним судят о качестве товара в
целом);
 интегральные (обычно вычисляются как отношение
суммарного полезного эффекта от эксплуатации или
потребления к суммарным затратам на создание и
эксплуатацию или потребление);
 по способу выражения:
 абсолютные;
 относительные;
 удельные. (Что это такое?)

Практика МИ 384
Исследование качества товара
Техническая надежность – способность товаров
сохранять требуемые свойства,
выполнять предназначенные функции в течение заданного
срока.
Это очень широко, надо конкретизировать
 Долговечность – способность сохранять свойства
определенное время;
 Интенсивность отказов (число отказов в единицу времени);
 Среднее время восстановления после отказа, включая
время обнаружения и исправления отказа;
 Коэффициент готовности, равный отношению времени,
когда объект находится в рабочем состоянии, к общему
времени эксплуатации.
Оценка показателей надежности проводится
экспериментальным или расчетно. (75 компьютеров)
Практика МИ 385
Исследование качества товара
Эргономичность – соответствие изделия требованиям,
предъявляемым по всей совокупности свойств,
воздействующих на человека.
 гигиенические (запыленность, уровень шума),
 антропологические (соответствие размерам тела),
 физиологические (яркость, контрастность изображения на экране
монитора);
 психологические (легкость восприятия и переработки
получаемой информации).
Эти показатели обычно измеряются экспертами в баллах. Лишь
некоторые показатели имеют нормы и процедуры измерения
(удобочитаемость по Флешу. 90 – 100 – для младших школьников,
60 – 70 – для выпускников школ, 0 – 30 – для лиц с высшим
образованием)

Эстетические показатели оцениваются органолептическим


методом, обычно в баллах.
Практика МИ 386
Исследование качества товара

Методы оценки качества товаров:


 экспериментальный;
 расчетный;
 органолептический;
 экспертный;
 социологический (сбор и анализ мнений)

Практика МИ 387
Исследование качества товара
Уровень качества Когда какую формулу применять?
Кi=qi/qib или Кi=qib/qi ,
где Ki – коэффициент сравнения по i-му показателю; qi –
значение показателя нашего товара; qib – значение
показателя базового товара.
Комплексная оценка качества:
К=Q/Qb ,
где К – коэффициент сравнения, Q, Qb – комплексные
показатели качества соответственно исследуемого товара и
базового товара.
Например, средневзвешенное (по важности для потребителя)
коэффициентов сравнения.

Практика МИ 388
Исследование конкурентоспособности товара и
организации
Конкурентоспособность товаров – возможность
обеспечения достаточного для получения прибыли спроса
на определенный товар в условиях деятельности
конкурентов путем выбора значений параметров этого
товара.

Конкурентоспособность организации – возможность


обеспечения прибыльной деятельности фирмы в условиях
конкуренции.

Конкуренты – лица, группы лиц или фирмы, соперничающие


в достижении идентичных целей, стремлении занять более
сильное положение на рынке.

Практика МИ 389
Исследование
конкуренто-
способности
товара и
организации

Практика МИ 390
Исследование конкурентоспособности товара и
организации

1. Определение конкурентов.
2. Количество продавцов и степень дифференциации в
отрасли .
3. Барьеры на входе в отрасль, на выходе из нее, препятствия
мобильности.
4. Структура издержек в отрасли. Ситуация с ресурсами и их
распределением.
5. Степень вертикальной интеграции.
6. Степень глобализации отрасли.
7. Детальное изучение каждого конкурента.
8. Принятие решений по действиям относительно
конкурентов.

Практика МИ 391
Исследование конкурентоспособности товара и
организации
1. Создается система наблюдения за конкурентами.
2. На постоянной основе производится сбор данных.
3. Производится оценка достоверности полученных данных,
их анализ, систематизация и интерпретация.
4. Осуществляется рассылка информации всем тем
работникам фирмы, кто в ней нуждается. Это делается либо
периодически, либо по запросам.

Практика МИ 392
Источники сведений о конкурентах
 Единый государственный реестр юридических лиц и
Единый государственный реестр индивидуальных
предпринимателей. ЕГРЮЛ/ЕГРИП
 Единый государственный реестр налогоплательщиков.
 Государственный земельный кадастр.
 Единый государственный реестр прав на недвижимое
имущество и сделок с ним.
 Реестр лицензий.
 Частные детективы.
 Средства массовой информации.
 Правовые базы данных Кодекс, Гарант, КонсультантПлюс.
Практика МИ 393
Эмпирический маркетинг = экспериентальный
При исследованиях покупок мобильных телефонов на вопрос
о важнейшем атрибуте, который учитывался при выборе,
были получены следующие ответы:
 внешний вид – 51%,
 цена – 37%,
 функциональные свойства – 11%.

Практика МИ 394
Эмпирический маркетинг

Маркетинг свойств и преимуществ


УТП (Что это такое?)
Маркетинг переживаний
 делается акцент на переживания, ценности чувственного,
поведенческого, познавательного характера вместо
функциональных свойств товаров.
 исследуется «ситуация» потребителя: вместо того, чтобы
концентрироваться на шампуне и его свойствах
рассматривается более общее понятие ухода за телом;
вместо дачной мебели рассматривается категория все для
дачи;
 потребители искусно провоцируются с применением
эмоционального воздействия;
 применяются разноплановые методики генерации новых
идей.
Практика МИ 395
Эмпирический маркетинг

Анализ переживаний
Показывают фото или иллюстрации. Предлагается:
 выбрать их по заданной теме.
 классифицировать их, указав признак;
 разработать визуальное развитие ситуации;
 провести сенсорное дублирование изображений;
 создать клип.
Нейромаркетинг

Практика МИ 396
Эмпирический маркетинг
Стратегические эмпирические модули (типы переживаний):
 ощущения;
 чувства;
 размышления;
 действия;
 соотнесение.
Для управления стратегическими эмпирическими модулями
предлагается использовать проводники переживаний:
 коммуникационные материалы, в том числе средства
Интернет;
 визуальные и словесные образы и символы;
 сам продукт;
 пространственное окружение;
 события;
 определенных людей.

Практика МИ 397
Эмпирический маркетинг

Для подбора проводников переживания надо знать:


 кто наши клиенты;
 какой тип переживаний, связанных с нашим продуктом, они
больше всего ценят;
 каким подходом пользуются конкуренты, преуспели ли они;
 в каком направлении развивается отрасль;
 есть ли в отрасли представитель, преуспевший в каком-то
одном подходе.

Практика МИ 398
Эмпирический маркетинг
 Ощущения могут быть:
 дифференциатором (что-то новое, отличающее
продукт от других, например, «морозная свежесть»
стирального порошка);
 мотиватором (чтобы хотелось попробовать и
приобрести – «ощути вкус…»);
 источником ценностной значимости (сами приятные
ощущения ценны – «райское наслаждение»).
Решаются вопросы:
эстетический или
развлекательно-
будоражащий подход?
 на какие органы чувств
лучше воздействовать;
 как варьировать
сенсорные воздействия
во времени, чтобы они не
надоели.
Практика МИ 399
Эмпирический маркетинг
 Виды чувств:
 настроения;
 эмоции.
Решаются вопросы:
 какова цель усилий – создать благоприятное настроение
или вызвать конкретное чувство;
 какое это чувство;
 как придать эмоциональную окраску комплексу
переживаний.

Практика МИ 400
Эмпирический маркетинг
 Размышления.
 аналитическое рассуждение о четко очерченной
логической проблеме;
 (более широко) любой систематический и тщательный
анализ.
Решаются вопросы:
 как стимулировать творческое мышление потребителя;
 какой тип проводников переживаний для этого
использовать.

Практика МИ 401
Эмпирический маркетинг
 Действия.
 Физический опыт вызывает положительные эмоции.
 Определенные действия могут непосредственно
вызывать те или иные эмоции.
Виды действия.
 Осмысленные физические действия.
 Сигналы тела – непроизвольные реакции .
 Стиль жизни. Люди, не задумываясь, выполняют многие
действия; не задумываясь, играют определенную роль.
 Взаимодействие с другими людьми.

Практика МИ 402
Эмпирический маркетинг
 Соотнесение. Место человека среди людей
 Решаются вопросы:
 кто входит в референтную группу потребителя;
 что в большей степени определяет его поведение: он
сам, другие люди или культура, к которой он себя относит;
 как помочь потребителю идентифицировать себя с
ними;
 надо ли поощрять формирование брендовых сообществ
(например, байкеров, которые ездят на мотоциклах марки
Харлей-Девидсон).

Практика МИ 403
Бенчмаркинг и маркетинговые исследования

Бенчмаркетинг
Бенчмаркинг представляет собой систематическую
деятельность по поиску лучших примеров ведения бизнеса,
их оценку и учебу на них.

Главные вопросы.
1. Кто наш конкурент?
2. Почему наша организация не лучшая?
3. Что надо сохранить в организации, чтобы она стала
лучшей?
4. Что надо изменить в организации, чтобы она стала
лучшей?
5. Как стать лучшей организацией?

Практика МИ 404
Принципы бенчмаркинга

 Принцип легальности.
 Принцип обмена.
 Принцип конфиденциальности.
 Принцип использования информации.
 Принцип контакта.
 Принцип подготовки.
 Принцип завершения бенчмаркинга.
 Принцип понимания и действия.

Практика МИ 405
Виды бенчмаркинга
Внутренний бенчмаркинг.
 Бенчмаркинг конкурентоспособности.
 Функциональный бенчмаркинг.
 Бенчмаркинг процесса.
 Глобальный бенчмаркинг.
 Общий бенчмаркинг.
 Бенчмаркинг затрат.
 Бенчмаркинг характеристики.
 Бенчмаркинг клиента.
 Оперативный бенчмаркинг.
Развитие бенчмаркинга:
 ретроспективный анализ продукта,
 бенчмаркинг конкурентоспособности,
 общий бенчмаркинг,
стратегический бенчмаркинг,
глобальный бенчмаркинг.
Практика МИ 406
Этапы бенчмаркинга
1. Определение объекта бенчмаркинга:
 оценка эффективности деятельности предприятия;
 установление потребности предприятия в улучшениях;
 выделение основных процессов, влияющих на результат
деятельности предприятия;
 выбор способа количественного измерения характеристик;
 определение глубины бенчмаркинга.
2. Выбор партнера по бенчмаркингу:
 устанавливается тип бенчмаркинга: внешний или
внутренний;
 проводится поиск эталонных предприятий;
 устанавливаются контакты с этими предприятиями;
 формулируются критерии оценки и анализа.

Практика МИ 407
Этапы бенчмаркинга (продолжение)

3. Поиск информации.
4. Обработка собранной информации, получение результатов
5. Внедрение результатов бенчмаркинга:
 разрабатывается план внедрения;
 уточняются процедуры контроля исполнения плана;
 проводятся мероприятия по внедрению;
 оцениваются результаты внедрения;
 при необходимости осуществляются дополнительные,
корректирующие мероприятия.

Практика МИ 408
Процесс бенчмаркинга
 Сбор информации производится с помощью опросных
листов.
 Они оформляются документально и одобряются
руководством
 Анализ информации. Важно понять взаимосвязь собранных
данных.
 Упорядочение и сопоставление собранных данных,
контроль качества информации, выявление факторов,
которые могут исказить сравнение.
 Выявление недостатков работы нашей организации по
сравнению с лучшими.
 Обоснование принятия решений.
 Повторение процесса.
Важно творчески переработать полученный опыт,
иначе это будет «стратегия побежденного».

Практика МИ 409
Бенчмаркинг и маркетинговые исследования

Практика МИ 410
Исследования международных
рынков
Language problem!

Market Research vs Marketing Research

What is Market (рынок)?

Introduction>Market research 412


Причины глобализации

 Насыщение местных рынков


 Развивающиеся рынки
 Глобальная конкуренция
 Глобальная кооперация
 Интернет революция

IMR>Goal Formulation 413


Стадии интернационализации [Kotabe et al.]

IMR>Goal Formulation 414


Стадии интернационализации

Разница с
предыдущим
случаем?

IMR>Goal Formulation 415


Международная специфика МИ

В окружении, во внешней среде

 правительство;
 право;
 экономика;
 информация;
 технология;
 социокультурные факторы;
 маркетинг;
 структуры.

IMR>Specifics 416
Глобализация организации

IMR>Goal Formulation 417


Глобализация организации

IMR>Goal Formulation 418


Глобализация организации

IMR>Goal Formulation 419


Глобализация организации

IMR>Goal Formulation 420


Бизнес-план

Что требуется узнать?

 Краткая суть.
 Цели и задачи.
 Продукт (услуга).
 Маркетинговая ситуация.
 План производства.
 План маркетинга.
 Организационный план.
 Финансовый план.

IMR>Research Goal Formulation 421


План производства

 Количество
 Размещение оборудования
 Оборудование
 Технология
 Субподрядчики
 Условия договоров
 Качество

Что требуется
узнать?
Research Goal Formulation >> Marketing Plan >> Production Plan 422
Потребность в информации

 Для выбора выхода на


рынок другой страны
 Для изучения отдельных
рынков
 Для рационализации

 Стратегия
 Тактика

Research Goal Formulation >> Information Needs 423


Пример индикаторов рисков выхода

Research Goal Formulation >> Factors and Indicators 424


Исследования для тактических решений

Research Goal Formulation >> Information for Tactical Decisions 425


Оценка возможностей международных рынков
Особенности:
 первая стадия;
 важная стадия;
 начало практической работы;
 В чем-то предпринимательская задача.

Оценка возможностей глобальных рынков это


процесс анализа готовности организации и
интернационализации, оценки пригодности продукта,
просмотра стран, оценки рынков и объемов продаж в этих
странах, выбора партнеров н целевых рынках.

Global Market Opportunity Assessment 426


Ключевые виды деятельности

Деятельно Цель Типовые задачи


сть
1. Готова ли Сильные и слабые стороны,
Определе организация к рекомендации по преодолению
ние международной недостатка ресурсов и других
готовности деятельности. сложностей.
организац
ии к
интернаци
онализаци
и

Global Market Opportunity Assessment 427


Ключевые виды деятельности
Деятельно Цель Типовые задачи
сть
2. Годится ли Уровень соответствия
Оценить продукт для продукта характеристикам
готовност
иностранцев. целевого сегмента.
ь
продукта
организа
ции к
зарубежн
ым
рынкам

Global Market Opportunity Assessment 428


Ключевые виды деятельности
Деятельн Цель Типовые задачи
ость
3. отбор Снизить 5…6 возможных стран.
стран для количество стран Размер рынка, его рост,
поиска для углубленного покупательская возможность,
целевых изучения. уровень потребления,
рынков Для инфраструктура для бизнеса,
эффективного свободы, риски и т.д.
использования
ресурсов

Global Market Opportunity Assessment 429


Ключевые виды деятельности
Деятель Цель Типовые задачи
ность
4. Сколько Оценит долю продаж в каждой стране по
Оценит всего отрасли. Оценить отраслевые барьеры
ь можно входа на рынок. Прогноз продаж на 3…5
потенци продать в лет. Определить ключевые переменные:
ал данной размер рынка, скорость роста, тренды.
отрасл стране. Оценить конкурентов. Уровень
евого протекционизма. Стандарты и правила.
рынка Инфраструктура.

Global Market Opportunity Assessment 430


Ключевые виды деятельности

Деятельнос Цель Типовые задачи


ть
5. Выбрать Так легче. “Wish list” идеальных
зарубежных партнеров.
партнеров

Global Market Opportunity Assessment 431


Ключевые виды деятельности
Деятель Цель Типовые задачи
ность
6. Прогноз Прогноз на 3…5 лет.
Определ производства Определить, что на это влияет.
ить
потенци
ал
продаж
организа
ции

Global Market Opportunity Assessment 432


Оценить потенциал продаж организации

 Отношение к риску топ менеджмента.


 Финансовые и человеческие ресурсы.
 Ценообразование.
 Маркетинговые сети .
 Возможности партнеров.
 Доступ к каналам распределения.
 Уровень конкуренции.
 Сроки выхода на рынок.

Global Market Opportunity Assessment 433


Оценить потенциал продаж организации

 Аудит торговли.
 Спросить партнеров.
 Опрос конечных потребителей.
 Тестовый маркетинг.
 По аналогии (!?).
 По вспомогательным индикаторам.
 Оценка конкурентов.

Global Market Opportunity Assessment 434


Переменные
Фактор Типичные переменные
Восприимчиво Ожидаемые выгоды
сть Особенности коммуникаций
респондента
Позициониров УТП
ание бренда Особенности бренда

Параметры Маржа для посредников


каналов
распределения
Конкуренты  Интенсивность конкуренции
 Относительная сила
 Потенциальные ответы
Global Market Opportunity Assessment 435
Переменные
Покупатели  Размер сегмента
 Покупательная способность
 Рост спроса
 Демография
Ценообразов  Себестоимость на «том» рынке
ание  Обычная маржа посредникам
 Стратегия (проникновение, снятия сливок, по
ЖЦ, дифференцированная)

Как это все использовать?

Global Market Opportunity Assessment 436


Проект исследования
 Определение цели:
прогноз размера рынка.
 тип: описательное; метод;
по аналогии;
модель взвешенных параметров;
барометрические расчеты (sugar consumption  GDP);
обзорное исследование;
математические модели.
 Инструмент сбора данных:
поиск в Интернет, Excel;
результат: прогноз.
 Сбор данных Для начала надо просто
 Обработка данных посмотреть на графики
 Заключение
 Oтчет

Project 437
Первичные данные. Сравнимость

Элементы должны быть сравнимы по


 размеру рынка;
 инфраструктуре рынка;
 языку и культуре;
 связанности с другими странами;
 географическому сходству;
 уровню индустриализации;
 политическому режиму;
 уровню образования.

International MR 438
Проблемы сбора перв. данных
Взаимосвязь элементов
 миграция,
 туризм,
 СМИ
 Internet,
 глобальные игроки (McDonald’s).
Различия в России
 «Россия начинается в 100 км от Москвы»;
 Дальний Восток;
 Различные религии
 Сельская культура.

Что такое портрет нации?

International MR 439
Уточнение элементов
 Городские покупатели во всем мире.
 Городские покупатели в развивающихся странах.
 Молодые городские профессионалы в азиатских странах.
 Жители российских мегаполисов.

International MR 440
Критерии принадлежности
Пример: сравнить интересы и потребительское
поведение детей от 5 до 11 в городских семьях среднего
достатка в Европе и Азии.
 Возраст: понятно. Да неужели???,
 Социальный класс: проблематично. Как определить?
 Занятие: какая-то эквивалентность. Пример?
 Доход на семью: разная покупательная способность
даже в разных городах одной страны.
Какова основная причина глобализации?
 Перцентили: средний достаток в четвертом квинтиле
(между 60–80%) может быть скорректировано с учетом
различной несимметричности распределения (в Европе
децильный коэффициент равен 5…6, в US: 12, в России: 16!

International MR 441
Примеры

 Изучение отношений и покупательского поведения


экологически озабоченных покупателей по всему миру
 Сравнение характеристики инноваторов в разных
странах (автолюбитель in the USSR = car owner, amateur),
 Изучение потребителей материалистов в разных
странах.
Old New Year
 Сравнение межличностного влияния в странах с
коллективистской и индивидуалистической культурами.

Эти факторы не одинаково проявляются в разных


странах.

International MR 442
Типичные исследовательские проекты

1. Исследования в одном месте за рубежом.

Проводятся в одной стране, но есть неявное сравнение!


Предположение: есть важные различия между нашей
страной и зарубежной. Но нет явного сравнения.
Проверить правильность заключения нельзя.
Часто делаются местными исследовательскими
организациями (что для этого надо?).
Результаты не могут быть верифицированы.

International MR 443
Статическое сравнение

2. Статическое сравнение элементов в разных


географических расположениях и разных
макроэкономических ситуациях.

Цель – изучить разницу в отношении или подведении.


Пример: поведение элитных покупателей в разных
странах мира.
Изучается влияние некоторого фактора (роль мам в
дарении подарков).
Важно исключить влияние более широких
социокультурных факторов. (Что бы это значило?)

International MR 444
Статическое сравнение
Пример: символизм продуктов и поведенческие паттерны
Нью-Йоркцев еврейского происхождения касательно:
 американской культуры;
 контекста Нью-Йорка;
 уровня благосостояния;
 страны происхождения.
В сравнении с потребителями в Париже и Лондоне
касательно
 европейского наследия,
 городского расположения,
 социоэкономического статуса и занятости.

Как это сформулировать более корректно?

International MR 445
Статическое сравнение
1, 2, 3 – Потребители
еврейского происхождения в
схожих социоэкономических
группах и группах по
занятости в Париже, Милане
и Лондоне. Можно выделить
западноевропейское
наследие (схожесть).
4, 5 – Потребители
еврейского происхождения
исхожего статуса в Нью-
Йорке и Чикаго.
Сравнение 1, 2, 3 с 4, 5
Culti-unit позволяет выделить разницу
западноевропейского и
американскгого наследия.

International MR 446
Culti-unit (культурная единица)

Определяется в терминах
 этнических,
 демографических,
 расовых,
 религиозных
 социоэкономических
характеристик группы

или

 особых интересов или деятельности.

International MR 447
Статическое сравнение

Тинэйджеры мира при покупке музыки


Тинэйджеры мира в досуге
Тинэйджеры мира в одежде

Тинейджеры
Нью-Йорка
еврейского
происхождения

Еврейские предпочтения в пище

International MR 448
Статическое сравнение

Сила идентификации различна

Католическая французская культура


Европейская
Франкоговорящий тинейджер-
тинейджерская
католик в Швейцарии
культура

Швейцарско-французская культура

International MR 449
Изучение внешних влияний
3. Определяется влияние других культур
Белое – нет влияния
Серое – есть влияние.
Они не должны различаться в
важных параметрах!
Прямое влияние:
после
посещения
страны
Непрямое:
масс-медиа

Иммигранты

International MR 450
Исследования динамики

4. Исследования динамики. Из одной culti-unit в другую.


Изучаются процесс и его скорость.
Что ускоряет:
+ изучение языка;
+ ассоциации в социальные и профессиональные
структуры.
Замедляет:
- поддержка тесных связей с представителями исходной
культуры;
- Создание новых социальных структур (школы, банки,
магазины).

International MR 451
Исследование динамики

Сравнить скорость
ассимиляции семей из
Марокко (macro unit J)
и Вьетнама (macro
culture L) во
французскую культуру
(K).

International MR 452
Проблемы созревания
Старение или созревания происходит одновременно с
ассимиляцией. Обычно индивиды становятся более
консервативными и этноцентрическими.
Разовые исследования дают сравнение поведения
разных возрастных когорт одной социокультурной группы.
Длительные исследования лучше; они прослеживают
индивидуальные изменения.

Пример. Изменения отношения и покупательского


поведения молодых иммигрантов по мере их взросления в
новой культуре.

International MR 453
Культурное смещение (Bias)

Исследователи
 проводят исследования в другой культурной среде;
 общаются с исследователями из других культур.
Опыт исследований в Японии полезен в Корее.
Опыт в Саудовской Аравии полезен в Средней Азии.

International MR 454
Культурное смещение
Проект исследования

Ценности и паттерны поведения

Потребление и использование продукта

Предпочтения и реакция на маркетинг.

Культурные нюансы:
 как выражаются отношения;
 что означает конкретное поведение.

Примеры!

International MR 455
Культурное смещение
Коммуникации
Интервью в другой стране:
Понятен ли вопрос?

Что ему надо???


Интерпретация
Допустим, респондент указал, что ему неважна инновация.
Как это повлияет на реакцию рынка на маркетинговые
действия? Значит ли это, что респондент отрицательно
отреагирует на новый продукт?

International MR 456
Культурное смещение
1. Определите проблему в терминах своей национальной
науки.
2. Определите проблему в терминах иностранной культуры.
Избегайте заключений!
3. Изолируйте self-referent cultural (SRC) влияние.
Посмотрите, как это усложняет проблему.
4. Переопределите проблему без SRC и решайте ее для
ситуации на зарубежном рынке.
ИЛИ. Кооперируйтесь с исследователями других культур с
самого начала.
Пример SRC
Какие атрибуты привлекают потребителей?
Исходный список: атрибуты, которые успешно использовались
в другой стране. Применяем их тут. Но.
Некоторые неважны, а важных нет! ОШИБКА!!!
International MR 457
Сравнимость данных по разным странам

Решения:

 Куда и как расширяться;


 Какие новые продукты продавать;
 Какие бренды или расширения брендов задействовать;
 Как позиционировать продукты и бренды;
 На какие сегменты ориентироваться.

Эти решения чаще глобальные, а не для отдельный стран.

International MR 458
Emic/Etic дилемма

Emic: как люди сами понимают и описывают свое поведение.


Etic: что говорят люди в рамках глобальных социальных
теорий, какие ошибки при этом возможны.
Pseudo-etic: то, что разработано в одной стране,
применяется в другой без адаптации.

(Это не этика – не ethical!)

International MR 459
Подход Etic
Психологической тестирование
Изучается психологическая концепция (активность,
коммуникабельность, склонность к риску,
предпринимательские способности и т.п.)
Это измеряется тестированием.
1. разрабатываются вопросы о предпринимательских
способностях, например. Есть плохие, но большинство
хорошие.
2. Проводится опрос целевой аудитории.
3. Обработка: удаление неудачных вопросов.
4. Оставшиеся вопросы различны для разных целевых групп!
5. Описывается разница, ищется сходство.
Что тут etic?

International MR 460
Предпринимательские способности
В СССР предпринимательство =
 делать деньги на торговле;
 производить продукты на подпольных предприятиях;
 частники-такси (сейчас это нелегально);
считалось преступлением.

То есть предпринимательство ≈ криминал.

Фарцовщики (black marketeers, spivs(?)) презирались.

(Читать Михаила Веллера)

International MR 461
Адаптированная Etic модель

Допущение: используемая теория панкультурна с местной


адаптацией.
1. Сформулировать теорию для различных социальных
условий.
Пример теории: информированные авторитеты передают
информацию населению (но в Швеции важен и
горизонтальный обмен).
2. Изучаем соответствующие гипотезы и проверяем, верны
ли они и во всех ситуациях.
3. Адаптация может касаться универсальных ценностей,
параметров (например, предпринимателя). Новые
параметры можно добавить в список.

International MR 462
Размерности национальной культуры
[Hofstede]: http://geert-hofstede.com/national-culture.html
1. Power Distance
2. Individualism versus Collectivism
3. Masculinity versus Femininity
4. Uncertainty Avoidance
[Michael Bond]:
5. Confucian dynamism based on Long-Term Orientation
Christianity: Give us our daily bread
[Michael Minkov]:
6. Indulgence versus Restraint.
Определяются уровни проявления составляющих.
Культура существует только в сравнении!
Культура и цивилизация
International MR 463
Адаптированная Etic модель

Другой подход.

1. Найти концепции etically.


2. Измерить их по-другому (emically).
3. Сравнить emic измерения и etic конструкции.
4. Разработать улучшенную etic конструкцию.
5. Переход к 1.

Специфика.
 Здесь выявляются сходства, а не различия.
 Доминирует культура исходной страны.

International MR 464
Связанная Emic модель
1. Проводятся emic исследования в различных местах
местными исследователями.
2. Они договариваются о наборе общих параметров.
Это нелегко!
3. Каждый исследователь проектирует исследование:
 элементы, концепции, взаимосвязи, которые могут быть
глобальными,
 глобальные концепции, проявляющиеся по-разному,
 различающиеся взаимосвязи между концепциями,
 уникальные для каждой ситуации концепции.

International MR 465
Связанная Emic модель, продолжение

4. Проводятся исследования в разных местах.


5. Результаты сравниваются.
6. Проверяются гипотезы и разрабатываются новые.

Это модель выявляет уникальные черты culti-unit.


Сложность: корректировка совместной работы
исследователей.

Помогает избежать этноцентризма и ошибок из-за


pseudo-etic.

International MR 466
Эквивалентность данных

Функциональная: одинаковы ли функции концепции плп


поведения в разных странах?

 Велосипеды: В US = отдых = гольф. В Нидерландах, Китае


= основной вид транспорта.
 Покупка бакалеи в развитых странах – как можно более
эффективна  заказ через Интернет.
В других странах = важная социальная функция. Общение
с продавцом, с соседями.
Что в России?
Владение автомобилем: роскошь  средство
передвижения?

International MR 467
Эквивалентность данных
Концептуальная: одинаковы ли в разных странах
ценности, отношение и поведение?
 Концепция «Я» различна (Аз).
 «Сохранить лицо» важная идея на Востоке.
 «Philotimo», вести себя так, как этого ждут члены
определенной группы (семья, друзья, гости). Считается, что
это особенность греков;
 «Lagom» особенное шведское слово «лишнего не надо».
 Западная культура = независимость.
 Азиатская культура = взаимосвязанность людей,
подчинение старшим (см ниже).
 Социальные ритуалы (свадьбы, похороны, дарение
подарков) различаются.

International MR 468
Эквивалентность данных
Категорий: вопрос классификации

 Что считать безалкогольным напитком (баночная или


бутылочная sodas, минеральная вода, фруктовые соки,
холодный чай, порошковые концентраты («Зуко»)?
 В Нидерландах включается молоко. В других странах это
добавка к горячим напиткам или детское питание.
 Профессия: в Корее король, учитель и отец одинаково
важны (роль Учителя в буддизме).
 Социальный престиж госслужбы различен.

International MR 469
Эквивалентность измерений
Калибровка:
эквивалентность
валют или
физических
величин;
стандартов
качества
продукта; цвета,
формы, при
интерпретации
стимулов.

Снег, фирн, лед

IMR 470
Эквивалентность измерений

Перевода: вербальные и невербальные(!?) стимулы.


Есть проблемы.

Метрическая: шкала и процесс измерения.


Англоговорящие страны: пяти- и семибалльная шкала.
Другие страны: 20, 10.
Германия – лучшая оценка – кол (1), худшая – 5.
Азия и юг Европы: респонденты дают более высокие
оценки.

International MR 471
Конструктиваная валидность

Пример конструкции. Этноцентризм (наша группа -


лучшая!) Иностранные продукты, особенно еда, хуже, чем
наши. Покупать иностранную еду – нехорошо, аморально.

Есть тест. Consumer Ethnocentrism Test (CET scale).

Это Emic? Etic?

International MR 472
Конструктивная надежность

Состоятельность во времени. Анкету используют 2 раза


с интервалом от 2 до 5 недель. Хорошо, если корреляция
высока.
Если времени прошло мало, ответы помнят.
Если слишком много – изменится измеряемый параметр.

Это редко используется в международных исследованиях –


сложно и дорого.

International MR 473
Конструктивная надежность

Состоятельность для индивидов. Действительно ли 2


или более независимых судей оценили объект одинаково?
Квалифицированно ли жюри?
Как интерпретировать открытые вопросы?
Какие характеристики Вы цените в мебели?_________
Какова их важность?____________________________
Проверяется согласие результатов судейства (судей из
разных стран, мужей и жен). Используются коэффициент
ранговой корреляции Спирмана, коэффициент
конкродации (проверка статистических гипотез).

International MR 474
Конструктивная надежность

Внутренняя состоятельность шкалы. Все вопросы


теста про одно и то же?
Корреляция ответов на вопрос и общего счета
Альфа Кронбаха
Метод деления пополам

Страна 1, четные вопр. Страна 2, четные вопр.

Страна 1, нечетные вопр. Страна 2, нечетные вопр.

International MR 475
Эквивалентность процедуры сбора данных

Сравнимость исследовательского инструмента.


Самоответ (отвечает респондент) / ответы записывает
интервьюер; вербальные стимулы / рисунки.
Высокооразованные culti-units: почта (e-mail), вербальные
стимулы.
Малообразованные: интервьюер объясняет вопросы,
показывает рисунки.

Сравнимость выборок. Кого спрашивать?


Арабские страны: мужья часто играют б’ольшую роль при
покупке бакалеи, чем в Латинской Америке.

International MR 476
Эквивалентность процедуры сбора данных

Баланс между сравнимостью и


репрезентативностью. Выборки, одинаковые по
характеристикам (полу, доходу) могут быть
нерепрезентативными с точки зрения культурного контекста.

Пригодность процедур выборки и проведения опроса.


В некоторых странах лучше работает телефонный опрос, а в
других – личное интервью.
Заполнение анкеты самим респондентом вызывает меньше
ошибок (почему?).

International MR 477
Базовые характеристики в анкетах
Семейное положение [ESOMAR]:
 married/living together; the English expression ‘living together’
requires slight modification when translated into French (vivant
comme marie) and German (leben mit einem Partner
zusammen);
single;
widowed/divorced/separated.

Доход: квартили, квинтили, децильные коэффициенты

 Те, кто работает на двух работах, укажет доход по одной;


 Фермеры не укажут бартер;
 Не укажут 13-ю зарплату.

International MR 478
Базовые характеристики

Образование: типы школ, колледжей, университетов


Сколько лет учились?

Россия: Средняя школа (High school): 11 лет, бакалавр 4


года;
Европа: High school: 12 years, bachelor (higher school) 3 years.

International MR 479
Базовые характеристики

Занятость
lawyers in the US,
solicitors and barristers in the UK,
advocates in France.
European Social Grade system [ESOMAR]:
• A, B managers and professionals руководители,
профессионалы;
• C1 well-educated nonmanual and skilled workers
образованные работники умственного труда и ВКР;
• C2 skilled workers and nonmanual employees
квалифицированные рабочие и служащие;
• D, E1, E2, E3 неквалифицированные рабочие (физический
труд) и прочие.
International MR 480
Поведенческие характеристики

Поведение в супермаркетах: чувствительность к цене,


скорость оплаты.
В маленьких магазинах – слушают продавца.
Вино как подарок: Можно дать организатору встречи.
Иногда цветы - лучше. В России вино – близким друзьям
Подарки вообще
На Востоке подарки д. б. тщательно подобраны к статусу
дарителя и соответственно упакованы.
В Корее: 1) никогда не смотрят, что подарили Почему?; 2)
молодоженам дарят туалетную бумагу Почему?.
В Финляндии народ инновационный: электронная техника, но
синдром Нокии…

International MR 481
Отношение, психографика, стиль жизни
Полезно для сегментации.
Черты (агрессивность, уважение к авторитетам, честь =
гонор) различны в разных странах
Материализм в US: ‘Вещи, которыми я владею, много
говорят обо мне’.
Франция: ‘Люблю роскошь!’.
Россия: ‘Не верю в Бога и чудеса’.

Сегментирование: культура еды в Европе. Обнаружилось 12


культур: 7 национальных, 7 – транснациональных и 1
местная.

International MR 482
Перевод анкет

Исходная анкета

Переводчик 1 Переводчик 2 Переводчик 3


Анкета 1 Анкета 2 Анкета 3

Сравнение

Итоговая анкета

International MR 483
Перевод анкет
Amigo ≠ Friend
Friend in Russia ≠ Friend in America

Род
Freund/Freundin (Germany)
eine Sekretarin (feminine) – profession of secretary;
ein Sekretar (masculine) – a desk;
– a man with a senior executive position.

In Turkish
Rarely = Never.

Как проверить: дать анкету и спросить, что там написано

International MR 484
Перевод анкет

Исходная анкета Com- ??? Анкета


pari-
Переводчик 1 son Переводчик 2

Анкета 1 (Eng)

Проблема: идиоматические выражения.


Нужны итерации!

International MR 485
Перевод несколькими людьми

Исходная анкета

Переводчик 1 Переводчик 2
Часть 1 анкеты Часть 2 анкеты

Проверяющий

Итоговая встреча

Готовый перевод анкеты

International MR 486
Верификация анкеты
1.Эвристика
1.1. Проверяем ясность и понятность вопросов
монолингвами и билингвами.
1.2. Оценка билингвами на предмет разночтений;

2. Статистический анализ.
2.1. Сравнение результатов исходной анкеты и после
двойного перевода;
2.2. Сравнение результатов исходной и переведенной среди
билингвов.

Просто статистика ответов, например, неответ по


позициям – не для перевода.
International MR 487
Перевод невербальных стимулов
Разные культуры

Расстояние

Настроение

Сравнение результатов по вербальным и невербальным


стимулам полезно:
 при общей проверке:
 для обнаружения недопонимания.

International MR 488
Инструментальная ошибка
 Ошибка «Да»;
 Ошибка крайних значений;
 Ошибка социальной правильности;
 Тема (Скандинавы будут обсуждать
алкоголь; англичанки не будут говорить про
тараканов в отличие от француженок);
 Неответ по вопросам (доход, образование);
 Вопросы про личность (возраст,
образование, пол) (?);
 Формат ответа
(«1» - лучший или худший?).

International MR 489
Сбор данных

1. Почтовый опрос
2. Телефонное интервью
3. Личное интервью
 На улице
 В магазине
 В спецпомещении
в malls
4. Электронный опрос
Сравнивается по
 скорости
 охвату
 стоимости
 требуемому персоналу
 разнообразию информ.
 уровню ответов
 репрезентативности

International MR 490
Анализ данных

 Внутри страны, по сегментам.


 Между странами. Сравниваются данные по странам.
Допущение: выборка репрезентативна.
 Pancountry. Уровень мира.

International MR 491
Корреляционный анализ
 Швеция: доходы примерно равны, то же и с выбором
автомобиля (Volvos or Saabs)
Корреляция положительная, но не сильная (пример!).
 Европа (Германия, Франция, Испания and Италия)
Корреляция положительна, разной величины.
 Все страны: корреляция положительная, большая.

Элемент Элемент
Корреляция Корреляция

International MR 492
Корреляционный анализ

 Корреляционная матрица по всем переменным для


страны: какие переменные уникальны, какие - избыточны.
 Сравнение двух матриц для 2-х стран: одинаковы ли они
(тест Хи квадрат).
 По всем станам.
 Между странами: средние значения для стран.

International MR 493
Корреляция и причинность
 Смысл?
 Направленность?
 Затраты на рекламу Продажи
 Затраты на рекламу  (Планируемые) продажи
 Может быть, есть дополнительные переменные, которые и
есть причина.
«У более высокие женщин чаще рождаются близнецы».

International MR 494
Means–End иерархия

 Means – типовые атрибуты продукта (для парфюмерии:


аромат, цена, имидж).
 Ends - следствия и ценности, связанные с атрибутами.
Для парфюмерии: престижность, фантазия, комфорт,
романтика, самоудовлетворенность.

В разных странах могут совпадать, могут и не совпадать.

International MR 495
Сбор данных для Means–End иерархии
 Глубинное интервью.
 Сортировка карточек по важности. Респондент может
добавлять карточки.
 Карточки с атрибутами товара.
 С последствиями
 С ценностями.
 Бумажный метод
 Ассоциативная техника: отмечаем пересечения строк и
столбцов.
 Атрибуты-последствия (AC matrix)
 Последствия-ценности matrix (CV matrix)
 Клетки (см. ниже)

International MR 496
Means–End иерархия для австрийской одежды

International MR 497
Means–End иерархия, результат

(?)
(Average
place in a
form?)

International MR 498
Means–End иерархия

 Метод структурирован.
 Прямолинейный анализ.
 Свободные ответы
 Нет ошибок при опросе.
 Не все соглашаются на глубинное интервью
 В почтовых опросах высок уровень неответов
 Проблема репрезентативности

International MR 499
Паневропейское исследование стиля жизни
20 000 респондентов в 16 европейских странах были
опрошены, 138 вопросов о предпочтениях в еде и поведении
при еде (предпочтения, способы готовки, жарки…)
Факторный анализ снизил число переменных до 41 важного
фактора касательно поведения при еде/отношений; поведения,
связанного с продуктами; привычек пития, привычек, связанных
со здоровьем.
Страны были разделены на 79 регионов, по 41 фактору. В итоге
получилось 12 кластеров.
Дания; Норвегия; Швеция; Португалия; Испания; Италия;
Греция,
Германский кластер (Германия, Австрия, Швейцария);
Британские острова; Нидерланды + Фландрия;
Франция и франкоговорящая Швейцария; Брюссель, Валлония
и Люксембург.
International MR 500
Отчет о маркетинговых исследованиях

Отчет 501
Отчет о маркетинговых исследованиях
ГОСТ 7.32-2001. «Отчет о научно-исследовательской работе.
Структура и правила оформления». Существует также ГОСТ Р
7.0.11-2011. «Диссертация и автореферат диссертации. Структура
и правила оформления». Найти новые редакции ГОСТ можно,
например, на сайте [http://www.internet-law.ru/].

Практический совет: взять правильно оформленный образец.

Для ВКР – взять методичку, тогда будет в разы проще.

Отчет 502
Отчет о маркетинговых исследованиях
 Титульный лист.
 Список исполнителей.
 Реферат:
o объект исследования;
o цель исследования;
o методы и инструменты исследования;
o полученные результаты и их новизна;
o рекомендации по внедрению или итоги внедрения результатов;
o область применения полученных результатов;
o экономическая эффективность, значимость проделанной работы;
o прогнозные предположения о развитии объекта исследования.
 Содержание.
 Обозначения и сокращения.
 Введение.
 Основная часть.
 Заключение.
 Список использованных источников. Составляется по ГОСТ Р
7.0.5 – 2008
 Приложения.

Отчет 503
Отчет о маркетинговых исследованиях
Реферат. В 7 строк.

 объект исследования;
 цель исследования;
 методы и инструменты исследования;
 полученные результаты и их новизна;
 рекомендации по внедрению или итоги внедрения
результатов;
 область применения полученных результатов;
 экономическая эффективность, значимость проделанной
работы;
 прогнозные предположения о развитии объекта
исследования.

Отчет 504
Отчет о маркетинговых исследованиях

Основная часть

В ней: разделы, подразделы, пункты и подпункты.


(в просторечии – главы, параграфы, подпараграфы)

1. Формулировка проблемы, постановка задач

2. Описание метода решения

3. Описание выполненных работ

4. Результаты и выводы

Отчет 505
Отчет о маркетинговых исследованиях

Заключение

 общий вывод из всей проделанной работы;


 оценка полноты решения поставленных задач;
 рекомендации по использованию результатов;
 оценка технико-экономической эффективности внедрения
результатов;
 оценку научно-технического уровня выполнения
исследований;
 возможные направления дальнейших исследований.

Отчет 506
Отчет о маркетинговых исследованиях

Приложения

 материалы, дополняющие отчет;


 промежуточные расчеты;
 таблицы вспомогательных цифровых данных;
 протоколы испытаний;
 описание применяемых приборов;
 заключения экспертов;
 инструкции, методики применения результатов;
 иллюстрации вспомогательного характера;
 копия технического задания на исследования, договора;
 акты внедрения результатов исследования.

Отчет 507
Отчет о маркетинговых исследованиях

Изложение материала

Понятность (просто и понятно)

Полнота

Ясность (структура, понятия, логика, выводы)

Краткость

Отчет 508
Отчет о маркетинговых исследованиях

Примеры ошибок
Прецизные сопроты, субоптимальный,
Визитация, судьбоносность
План на будущее, консенсус мнений
Эта проблема будет рассмотрена ниже

Описывайте и то, что Вам кажется очевидным!

Отчет 509
Найдите ошибки
 20% опрошенных положительно относятся к товару, а 60%
– отрицательно.
 50% опрошенных указали в качестве причины покупки
приемлемую цену, 40% – привлекательный внешний вид, 30%
– высокие потребительские Структура расходов семьи
качества товара.
 Круговая диаграмма.
На
На продо-
непродо-
вольст-
вольст-
венные
венные
товары;
 Ранее 6% населения были товары;
35%
знакомы с товаром, теперь – 40%

12%, что на 6% больше.


 Доходы уменьшились от 1 до 2 тыс. руб.
 Средний годовой доход на душу населения в России
увеличился за рассматриваемый период с 2000 руб. до
200000 руб., следовательно, покупательная способность
возросла в 100 раз
Отчет 510
Отчет

Отчет 511
Отчет о маркетинговых исследованиях
1. Всегда -
сравнение
2. Что
показывать
(какие
переменные)
3. В чем
основная
мысль, что
должно быть
видно
Отчет 512
Презентация

 1 рисунок = 1000 слов!


 Большой размер букв
 Не текст, а намеки
 1 минуту на слайд

Порядок ведения доклада


1. Открытие собрания
2. 15 мин на презентацию
3. Ответы на вопросы
4. Мнение эксперта
5. Заключительное слово

Отчет 513
Мифы о маркетинговых исследованиях

Отчет 514
1. Исследования рынка - это подсказка, помогающая
узнать, какие новые продукты и услуги будут успешны в
будущем

Открытия – штучные явления


Потребителя опираются на предыдущий опыт: йогурт как
сметана

Никогда не появились бы мобильные телефоны, автоответчики,


микроволновые печи, одноразовые подгузники

Отчет 515
2. Исследования рынка - верный способ создания
инновационных продуктов и услуг
Новый товар = новый рынок
Лидерство на нем - недолго

Что мог исследовать Генри Форд, начинавший сто лет назад


выпуск автомобилей, если автомобильного рынка в то время
вообще не существовало?

Маркетинговые исследования - это путь к унифицированности


и банальности. Вы предлагаете потребителям сравнить ваш
товар с товарами конкурентов и указать на те свойства, которые
можно модифицировать. Компания, которая всецело полагается
на результаты маркетинговых исследований, будет вечно
догонять лидера, тогда как абсолютный стратегический успех
определяется способностью вести рынок за собой.
Отчет 516
3. Исследования рынка - эффективный и рентабельный
инструмент менеджмента

Есть много неподконтрольных факторов (например, изменения в


законодательстве)
Товар хорош, по результатам фокус-групп
Но не продается: не контролируется логистика

На пути от производителя к потребителю потенциально


успешный товар потерял все конкурентные преимущества, так
высоко отмеченные потребителями в ходе исследований.

Отчет 517
4. Исследования рынка - точный инструмент

Слишком много субъективных факторов: настроение, плохая


погода.
Нет эталона измерения, как эталона метра

Один и тот же респондент или покупатель с разницей в два часа


может дать вам диаметрально противоположную оценку
одного и того же товара

Если в ходе исследования выясняется, что 98,5% целевых


потребителей готовы покупать ваш товар, это совсем не
означает, что все активные покупатели - ваши. Можно лишь
сделать вывод о том, что в целом отношение людей к товару
благоприятно и вы находитесь на правильном пути.

Отчет 518
5. Исследования рынка - объективный научный процесс,
дающий объективный результат

Нет точных инструментов

В математике главное - быть точным и логичным. А в


маркетинге главное - быть талантливым и творчески
мыслящим

Отчет 519
6. Исследования рынка позволяют идеально понять
потребности покупателей

Обработка результатов тоже субъективна!

Весь максимально достижимый спектр мнений респондентов


фактически сводится к субъективному мнению одного
человека, к его представлению о том, что среди всех
анализируемых мнений может быть верным или близким к
верному

Специалист – в маркетинге, не в определенном бизнесе. Ему –


сбор и первичная обработка. Выводы – специалистам в данном
бизнесе.

Отчет 520
7. Исследования рынка - гарантия выпуска успешного
продукта

Изучается существующий рынок


C момента исследования до момента вывода товара на рынок
должно пройти определенное время!

Сколько времени занимает разработка новой модели


автомобиля?

Если разрабатывать продукт для незанятой ниши, может


оказаться, что ее займут

Отчет 521
8. Врачу – исцелися сам

«Посмотрите на рекламу маркетинговых агентств! И эти люди


предлагают нам услуги по развитию нашего бизнеса?»

Маркетологам нужна не реклама, а сарафанное радио.

Специалисты по маркетинговым исследованиям должны


оцениваться по их маркетинговым исследованиям, а не по их
рекламе.

Отчет 522
8. Без посредников

Есть же Госкомстат!

В каталоге Госкомстата есть позиция «Оборудование для


кондитерской промышленности».
Предприятий по ней мало. Подавляющее большинство
производителей пищевого оборудования имеет широкий
ассортимент машин для нескольких подотраслей пищевой
промышленности. Они отчитываются по позиции «Оборудование
для перерабатывающей промышленности».
Данных нет.
Претензий ни к кому нет

«Хорошо, говорят практики, мы готовы искать. И все равно нам


не нужны для этого агентства»

Отчет 523
9. Сами с усами

Можно создать свое исследовательское подразделение.


Разумно:
1. Можно не найти нужного узкого специалиста в нужное время
2. Проще наладить контроль за своими работниками

Но аутсорсинг лучше – почему?

Отчет 524
10. Шибко грамотные

Исследователи пишут наукообразно, часто не понимают, зачем


нужен отчет. Их редко посвящают в это!!

Надо помочь принять управленческое решение

 Входить на тот или иной рынок или повременить с этим?

 Какой именно новый продукт надо разрабатывать?

 Какой ценовой или ассортиментной политики надо


придерживаться?

 Часто приходится браться за бесплатный консалтинг, не имея


всех данных.

Отчет 525
10. Шибко грамотные

Настоящий отчет должен содержать и часто


действительно содержит несколько частей для
менеджеров заказчика разного уровня, в том
числе и для руководства. Эта часть пишется
кратко, на нескольких страницах и не содержит
специальных терминов, зато в нее включают
основные выводы, которые, по мнению
исполнителей, должны помочь заказчику
принять необходимые решения

Отчет 526
11. Верхогляды

Нужны годы, чтобы понять бизнес.


Но эта специфичность часто преувеличивается практиками.
Всегда есть общие закономерности.

Коммерческий директор заказывает исследование цен своего


предприятия.
Сторонние консалтинговые агентства выясняют, кто чем
занимается на данном предприятии.

Кому говорят откровеннее?

Отчет 527
11. Кому они нужны, эти исследования?

Готовить менеджеров по продажам более полезно. В крайнем


случае - пробный маркетинг

Исследования нужны не во всех случаях.


Исследования бывают разные, от мониторинга цен до
полномасштабного обоснования выбора стратегии.

Прямые продажи и пробный маркетинг – не панацея, могут быть


вредны

Отчет 528
11. Кому они нужны, эти исследования?

Траут:
Пробный маркетинг категорически противопоказан, если
компания совершает так называемый «фланговый удар»:
компания, не являющаяся лидером рынка, выпускает на рынок
новый продукт, имеющий преимущества по сравнению с
товаром лидера в ограниченной области применения.
Недопустима даже малейшая утечка информации!

Но наблюдением за рынком можно засечь неосторожного


конкурента, решившего апробировать потихоньку новинку.

Отчет 529
11. Исследования с заранее известными результатами
опасны для карьеры!!!

Заказчик говорит:
надо провести фокус-группы;
надо собрать данные по этой анкете.

Результат будет печален.

Отчет 530
Смертельные исследования

Злоупотребление невразумительными фокус-группами.


Результаты нестабильны и не являются репрезентативными ни
для одного сегмента общей совокупности; результаты фокус-
групп по своей природе нельзя проецировать на весь рынок.

Отчет 531
Смертельные исследования

Обращение к другим людям с вопросом о том, что важно, а что


нет.
Вам дадут очевидный ответ; чаще всего назовут необходимое
условие для входа в товарную категорию: четыре колеса для
легкового автомобиля, наличие приятного вкуса у продукта
питания или чистящей способности у стирального порошка.

Отчет 532
Смертельные исследования

Блуждание по карте восприятия.


В данной методике предполагается, что разные люди разделяют
одно и то же восприятие торговых марок и товаров, т. е. что их
карты восприятия примерно одинаковы. Однако никаких
поводов верить в истинность этой посылки не существует. Не
показывают карты восприятия и того, как переместить вашу
торговую марку или товары из одной позиции в другую.

Отчет 533
Смертельные исследования

Изучение проблем покупателей при помощи анализа


разрывов.
Данный анализ направлен на выявление расхождений между
тем, чего хотят люди, и их удовлетворенностью тем, что они
имеют. Как правило, проводится на агрегированном уровне, из-
за чего результаты вводят исследователей в заблуждение.

Отчет 534
Смертельные исследования

Выявление причинно-следственных отношений при помощи


корреляционного/регрессионного анализа.
Если оценки приятного вкуса прохладительного напитка сильно
коррелируют с предпочтением к нему, мы предполагаем, что
именно приятный вкус побуждает людей покупать напиток
данной марки. Однако на самом деле может быть верно
обратное: люди, приобретающие напиток и отдающие
предпочтение именно ему, склонны считать его вкус приятным.
Корреляция и регрессия не позволяют установить, что от чего
зависит.

Отчет 535
Смертельные исследования

Проверка концепций по телефону.


Зачитывая описание концепции людям на другом конце провода,
исследователи волей-неволей должны выражать ее одной,
максимум несколькими фразами. В реальном мире аналогов
таких концепций не существует, кроме разве что
десятисекундных радиороликов.

Отчет 536
Смертельные исследования

Изучение уровня удовлетворения по почте.


Люди, отвечающие на почтовые опросы на предмет изучения
удовлетворения, обычно отвечают: “нормально”. Те же, кто очень
доволен или, наоборот, полностью разочарован, не станут
обременять себя заполнением анкет.

Отчет 537
Смертельные исследования

Использование оценок способности узнать рекламу в качестве


показателя ее эффективности.
Просто быть в состоянии узнать (или сказать, что знаешь) слоган,
визуальный элемент или сообщение, когда тебя об этом
просят, — это не то же самое, что по-настоящему вспомнить что-
либо (т. е. истинное воспоминание). Люди часто “узнают”
рекламные объявления, которые никогда нигде не
публиковались.

Отчет 538
Смертельные исследования

Оценка интересности концепции в конкурентном вакууме.


Изучать мнения людей о новых товарах и услугах необходимо в
контексте конкуренции. Чем реалистичнее этот контекст, тем
достовернее оценки.

Отчет 539
Смертельные исследования

Прогнозирование успеха новых товаров без учета издержек.


Не имея информации о затратах на производство и маркетинг,
спрогнозировать финансовые результаты невозможно. Одно
дело собрать кассу в $100 млн, потратив на съемки и
продвижение фильма $120 млн, и совсем другое собрать $100
млн, потратив $50 млн.

Отчет 540
Смертельные исследования

Принятие любого решения с рассмотрением слишком малого


числа альтернатив.
Реальность и маркетинг очень сложны, поэтому, чем больше
альтернативных целевых сегментов, рыночных позиций,
рекламных обращений, уровней цен и т. д. вы рассмотрите, тем
выше шансы на успех.

Отчет 541
Смертельные исследования

Производитель фасованных товаров решил осуществить


колоссальное изменение упаковки. Была выбрана радикально
новая форма, которая должна была “вывернуть отрасль
наизнанку и поставить с ног на голову”.
Компания организовала 18 фокус-групп. Потребители были в
восторге от внешнего вида новой упаковки.

Простая проверка эксплуатационных качеств наверняка показала


бы, что она течет.

Из-за этой ошибки конструкторов, которую участники фокус-


групп не могли заметить, новая упаковка влетела компании в
копеечку.
Отчет 542
Смертельные исследования

«Business Week»:
Для проверки тридцатисекундного телевизионного ролика
«Whiskas Homestyle Favorites» британский «Центр питания для
животных» провел фокус-группы с участием 200 кошек.

В первом, 15-секундном ролике хозяевам предлагается позвать


Мурку смотреть телевизор. В самом ролике демонстрируются
рыбки, клубки шерсти и кошачий корм. Как с гордостью заявил
представитель Kal Kan [фирма-производитель “Whiskas”],
примерно 6% кошек смотрели на экран, подергивали ушами
или подходили ближе к телевизору.

Отчет 543
Реалии

Только в США свыше 1000 организаций предлагают помещения


для модераторов фокус-групп и их клиентов. Есть даже люди,
специализирующиеся на составлении меню для менеджеров
агентств и организаций-клиентов, сидящих за односторонним
зеркалом и наблюдающих за дискуссией. Они-то как раз
удовлетворяют реальную потребность, потому что, как скажет
любой опытный промоутер фокус-групп, хорошая еда — залог
хорошей группы. Если вы хотите, чтобы наблюдатели за зеркалом
остались довольны — достаточно довольны, чтобы заказать
новую группу, — накройте им большой стол с блюдами из
ближайшего французского, тайского, китайского ресторана.

Отчет 544
Интеллектуальный анализ
данных
в менеджменте

Павлов Николай Вячеславович


pavlov@kafedrapik.ru
Требования к средствам
• Цель – получение информации из данных
обработки
 Неограниченный объём обрабатываемых
данных
 Разнородность данных:
 структурированные (база данных);
 слабоструктурированные (логи);
 неструктурированные (повести и рассказы);
 Результаты должны быть полезны;
 Инструменты для обработки сырых данных
должны быть просты в использовании.
Аналитика данных

http://www.olap.ru/basic/dm2.asp
Классы систем Data Mining
https://en.ppt-online.org/434959

Место OLAP
ERP (Enterprise Resource Planning)
системы
MES (Manufacturing Execution
Systems)
SCADA (Supervisory Control And Data
Acquisition)
Каналы Really Simple Syndication:
новости, товары, курсы валют, отзывы.
RSS Обновляемый контент
Дополнительное задание: найти и скачать
полезное.
Удалось найти новости Яндекса: Данные  Из
интернета адрес  OK. Поругается, но сделает.
Адрес https://news.yandex.ru/export.html :
правой кнопкой по рубрике  Копировать адрес
ссылки  вставить как адрес
• Приводит данные в порядок:
▫ исправляет регистр;
▫ исправляет числа-как-текст;
Power Query
▫ заполняет пропущенные данные;
▫ добавляет правильную "шапку" таблицы
▫ разбирает "слипшийся" текст на столбцы и склеивает
обратно
▫ делит дату на составляющие и т.д.
• Трансформирует таблицы, приводя их в желаемый
вид:
▫ фильтрует;
▫ сортирует;
▫ меняет порядок столбцов;
▫ транспонирует;
▫ добавляет итоги;
▫ разворачивает и сворачивает кросс-таблицы;
• Подставляет данные из одной таблицы в другую
(как функция ВПР (VLOOKUP) и ее аналоги).
https://www.planetaexcel.ru/techniques/24/5854/

Power Query
• Устанавливается как надстройка, добавляет
вкладку на ленту
• Все модификации запоминаются как команды на
языке M
• Запрос можно повторить, получив новые данные.
• Результат – как лист Excel
• Вид окна

Power Query
Надстройка Excel 2016 для анализа больших
объемов данных
• Загружает 15 форматов: базы данных, файлы Excel,
Power Pivot
текстовые (CSV), веб-каналы.
• Можно использовать Power Query – вообще можно
собирать что угодно
• Между загруженными таблицами настраиваются
связи = Модель Данных.
• Можно добавить дополнительные вычисления с
помощью
▫ вычисляемых столбцов (аналог столбца с
формулами в "умной таблице")
▫ мер (аналог вычисляемого поля в сводной таблице).
Запрос запоминается на языке DAX (Data Analysis
eXpressions)
• По Модели Данных на листе Excel строятся
интересующие нас отчеты в виде сводных таблиц и
диаграмм.
Особенности Power Pivot
• Нет предела по количеству
строк (как в Excel)
• Сжатие данных при загрузке в модель.
50 Мб исходный текстовый файл может
легко превратиться в 3-5 Мб после
загрузки.
• Быстрая работа (мощные
вычислительные средства)
Надстройка Excel для построения дэшборда
(dashboard)
Power View
• Исходные данные берутся из Модели Данных
Power Pivot
• Необходимо установить на вашем компьютере
Silverlight (бесплатный)
• Опыта использования дэшбордов нет!
• На сайте Microsoft есть обучающий курс по Power
View на русском языке
https://support.office.com/ru-ru/article/power-view-—-
обзор-и-обучение-5380e429-3ee0-4be2-97b7-
64d7930020b6
Все вышеперечисленное в расширенном виде,
бесплатно, но с регистрацией
• Загрузка данных из 70+ источников
Power BI
• Связывать Desktop
таблицы в модель (как в Power Pivot)
• Добавлять к данным меры и вычисляемые столбцы
• Создавать интерактивные отчеты (дэшборды)
• Публиковать созданные отчеты на сайте Power BI
Service (сайт; у каждого пользователя есть своя область
для работы.
• Power BI Mobile - приложение для iOS / Android /
Windows для просмотра (не редактирования)
• Power BI Desktop и Mobile, многое в Power BI Service
бесплатно.
• Коллективная работа; права доступа - тариф Pro: 10$ в
месяц за чел.
• Более 500 пользователей, отдельное хранилище и
сервер – тариф Premium.
• Ссылки в
https://www.planetaexcel.ru/techniques/24/5854/
Выбор метода анализа

Количество переменных
Нейросети 1 >1
Одномерный анализ Многомерный анализ

Анализ данных Количество зависимых переменных


0 1 >1
Анализ Анализ Декомпозиция
взаимозависимости зависимости задачи

Шкала переменных Шкала зависимой переменной


Н П И Н П И
Шкала Шкала Шкала
причинных причинных причинных
переменных переменных переменных
Н П И Н П И Н П И
переменными; кластерный анализ
Факторный анализ с фиктивными

Индекс предсказательной связи;

Ранговая корреляция Спирмана

с фиктивными переменными
коэффициент контингенции
Коэффициент конкордации

Дискриминантный анализ

Регрессионный анализ

Регрессионный анализ
кластерный анализ
Факторный анализ;
Кендалла
Ссылки
• ! https://affinelayer.com/pixsrv/ - улучшает Ваш рисунок
• ! https://www.everypixel.com/aesthetics - что изображено
на картинке
• ! https://demos.algorithmia.com/colorize-photos/ -
раскраска черно-белых фото
• https://daily.afisha.ru/brain/2318-7-shalostey-s-
neyrosetyami-algoritmy-ischut-pyanyh-gonyayut-kotov-
sochinyayut-pesni/ - приколы, например, о Гарри Поттере;
алкотестер, гоняет котов
• https://teachablemachine.withgoogle.com/ - TRAIN =
пофоткайте себя с поднятой рукой – обучится, что
поднятая рука = Hi. Рот открыт – О!, большой палец = OK.
На английском, но можно найти инструкцию на русском.
• https://make.girls.moe/#/ - девушки в стиле Аниме
Входы Комбинация Активация Выход

Обучение с учителем
1. Имеется набор примеров с правильными ответами 0 или 1.
Сложно ли их получить? Как их получить?
2. Имеется набор начальных значений весов и порога.
Предъявляем пример. Если ответ правильный – ничего не
делается. Если неправильный, надо корректировать
параметры. Что менять?
.Порог? Просто снизится чувствительность и будут новые
ошибки.
- Кто виноват, что получается 1 вместо 0?
- Тот вход, на который подан большой сигнал.
- Тот вход, вес которого большой (который «много»
пропускает).
Уменьшим его вес.
Предъявить все примеры = эпоха. Бывает более 10 000 эпох.
Программы
• Tensor Flow от Google.
https://www.tensorflow.org/
есть учебники, но нужно немного знать
Python.
• PyTorch для Python
• Самоклёп https://habr.com/ru/post/351922/
• Statistica

Учебные
• Для Excel
Методы ИАД
Машинное и глубокое обучение
• https://istio.com/rus/text/analyz/ - анализ текста
• http://www.rusf.ru/cgi-bin/fr.cgi - программа 2000
Онлайн программы
года, определяет автора текста из классиков (Шолохов)
• https://www.repustate.com/sentiment-analysis-api-
demo/ - sentiment -1 жуть, +1 счастье.

• https://voyant-tools.org/ - разные статистики текста


• https://wordsift.org/ - облако, но для и Для – разное!
• https://www.online-utility.org/text/analyzer.jsp -
статистика, для англ.
является я  мы
Интересен анализ ВКР
Хранение информации

Плоский файл = набор байт https://megapredmet.ru/1-53369.html


RSS Feeds = Really Simple Syndication
Таксономия = систематизация, типология
Онтология = формализация области знаний
Wikis = спец сайты, где пользователи меняют содержание
Процесс Text Mining
?
• Поиск информации. Какие документы
должны быть подвергнуты анализу? Найти их
Этапы
• Предварительная обработка
документов
▫ Удаление лишних слов
▫ Придание тексту более строгой формы
• Извлечение информации. Выделение в
них ключевых понятий для анализа
• Применение методов Text
Mining. Извлекаются
шаблоны и отношения,
имеющиеся в текстах
• Интерпретация результатов
Всегда много «воды»
• Морфологическое (о словах) удаление стоп-слов =
вспомогательных. "так как", "кроме того" и т. п.;
Предварительная обработка
• Стемминг — преобразование каждого слова в
нормальную форму.
«сжатие» , «сжатый»  «сжимать». Языково-
зависимо!
• N-граммы —альтернатива морфологическому
разбору и удалению стоп-слов.
N-грамма — это часть строки, состоящая из N символов.
«дата»  3-грамма «_да», «дат», «ата», «та_»
«дата»  4-грамма «_дат», «дата», «ата_».
Языконезависимо, но количество
неинформативных слов не уменьшается
• Приведение регистра.
«текст», «Текст», «ТЕКСТ»  «текст».
• Но остался ли смысл???
Извлекаются важные фрагменты.
Аннотирование. Метод
Важность определяется весом:

Weight(U) = Location(U) + KeyPhrase(U)


извлечения
+ StatTerm(U) + AddTerm(U).
• Вес Location зависит от того, где в тексте или в параграфе
появляется данный фрагмент — в начале, в середине или в
конце, а также используется ли он во вводной части или в
заключении.
• Вес KeyPhrase определяется по месту: «в заключение», «в
данной статье», «согласно результатам анализа»; по
оценочному термину: «отличный» или «малозначащий».
• Вес StatTerm отражает статистическую важность (частота
лексемы).
• Вес AddTerm зависит от того, появляется ли термин в
заголовке; в колонтитуле; в первом параграфе
или в пользовательском запросе (настройка под сегмент).
Аннотирование. Метод
обобщения
• Natural Language Processing, синтаксический разбор и
генерация естественно-языковых конструкций. Нужны
также справочники по здравому смыслу, по предметной
области, по отбору важного
• Традиционный лингвистический метод синтаксиче-
ского разбора предложений. Фрагмент упрощается
• Понимание естественного языка. Формируются
концептуальные структуры, отражающие всю исходную
информацию, которая аккумулируется в текстовой базе
знаний. Логика предикатов; семантическая сеть.
Пример: шаблон банковских транзакций
Очень сложно!
Извлечение с
помощью
Извлечение ключевых понятий
регулярных
выражений

Интеграция.
Факты комби-
нируются с
учетом
отношений.
Шаблон даты рождения
(расшифровка с https://regex101.com/)
Регулярные выражения
/(\d{1,2})\.(\d{1,2})\.?(\d{4})?/
• \d{1,2} matches a digit (equal to [0-9])
• {1,2} Quantifier — Matches between 1 and 2 times
• \. matches the character . literally (case sensitive)
• \d{1,2} matches a digit (equal to [0-9])
• {1,2} Quantifier — Matches between 1 and 2 times
• \.? matches the character . literally (case sensitive)
• ? Quantifier — Matches
between zero and one times
• \d{4} matches a digit (equal to [0-9])
• {4} Quantifier — Matches exactly 4 times
• ? Quantifier — Matches
between zero and one times
• Шаблон номера телефона
Регулярные выражения
/^(\s*)?(\+)?([- _():=+]?\d[-
_():=+]?){10,14}(\s*)?$/

Съедает следующие телефоны:


+7(903)888-88-88
8(999)99-999-99
+380(67)777-7-777
001-541-754-3010
+1-541-754-3010
19-49-89-636-48018
+233 205599853
Контент-анализ
• Количественный
▫ Количество символов
▫ Количество рисунков
▫ Время звучания текста
• Качественный
▫ Способ презентации (среди другой
информации или отдельно)
▫ Opinion mining – мнения из текста
▫ Sentiment analysis – тональность текста
Более глубокое изучение
• http://www.myshared.ru/slide/540138/ -
презентация про анализ текста
Web Mining
Комбинация:
• извлечение знаний из баз данных И
• эффективный поиск информации И
• искусственный интеллект И
• машинное обучение И
• обработка естественных языков.
Цели
• Помочь быстро найти нужное
• Извлечь из найденного знания и понять их
• Предоставить то, что интересно (например, подсказки при
выборе нужного товара)
Задачи
• анализ использования веб-ресурсов
• извлечение веб- структур (пример: цитирование)
• извлечение веб-контента
Результаты
• Описание пользователей сайта
• Описание покупателей в Интернет-магазинов.
• Описание типичных сессий посещений сайта и
навигационных траекторий пользователей.
• Описание групп и сегментов посетителей.
• Поиск зависимостей при использовании сайта и его услуг.
Автоматический перевод
Онлайн средства
• https://aws.amazon.com/ru/translate/ - 15 USD
за миллион знаков
• https://translate.yandex.ru/ - хорошо
переводит рус англ
• https://www.onlinedoctranslator.com/ru/ -
переводит файлы Office, почти сохраняет
форматирование
• https://context.reverso.net/перевод/ -
приводит примеры предложений с данным
словом или словосочетанием
Виды перевода
2013_039_Воронович_Машинный перевод
• Художественный (образы, эмоции, эстетика):
эпитеты, ритм фразы
Переводчик в прозе – раб,
Переводчик в поэзии - соперник.
(В.Жуковский)
• Общественно-политический (агитпроп,
эмоции, термины)
• Специальный (предметные области,
термины, точность)
Виды
• Ручной
• С электронным словарем
• Пред-, интер-, постредактирование
• Полностью автоматизированный
1. Получение предложения исходного текста из файла или из
буфера в памяти
Последовательность
2. Разбиение предложения на слова и определение границ
предложения (сокращения, инициалы, дефисы…)+
нормализация
3. Морфологический анализ исходного текста (часть речи, падеж,
число, род, предлоги, словосочетания (склеить ласты, kick
the bucket)
4. Синтаксический анализ исходного текста (омонимы,
согласование слов по падежу (думать туман)
5. Семантический анализ исходного текста (построение дерева
главных/зависимых слов; разрешение многозначности)
6. Перевод построенного дерева (базовые слова – дословно,
зависимые – по правилам согласования)
7. Согласование переведенного дерева – семантический,
синтаксический и морфологический синтез (окончательное
устранение многозначности; добавление приставок)
8. Запись переведённого предложения в файл или в буфер.
• Конверторы кодировок UTF-8, Windows 1251, CP866,
KOI8-R
• Преформаторы (выделение текста из документа)
Инструменты
• СУБД
• Лингвистический процессор
▫ Разбиение текста на предложения и слова
▫ Распознавание устойчивых словосочетаний (идиом)
▫ Расшифровка сокращений и аббревиатур
Морфологическое аннотирование исходного текста
▫ Синтаксический анализ и построение дерева зависимостей
▫ Семантический анализ и построение семантического графа
предложений
▫ Выбор переводного соответствия из словаря или корпуса
▫ Семантический синтез текста на переводном языке
▫ Построение синтаксической структуры предложения и
определения порядка слов в синтезируемом предложении
▫ Морфологический синтез словоформ в переведенном тексте.
Базы данных
• Лингвистическая база данных
▫ Лексико-грамматический классификатор
(части речи, род, падеж)
▫ Двуязычный морфологический словарь
(соответствие словоформ)
▫ Словарь сокращений и аббревиатур
▫ Словарь идиом
▫ Терминологический словарь предметной
области
▫ Синтаксический словарь (сочетаемость)
Как решать?
• Автоматически
▫ По правилам сочетаемости
▫ Контекстологические словари (алгоритмы
запроса к контексту) ЭС!
• Интерактивно
▫ Оператор выделяет подозрительные слова
▫ Выводится толковый словарь
▫ Оператор поясняет смысл слова
Проблемы
• Идентификация имени собственного
• Идентификация использования слова в
переносном смысле
• Политематичность реальных текстов
• Динамика языка, расширение словарей и
корпусов
https://ai-science.ru/kak-rabotaet-nejronnyj-mashinnyj-perevod/

Шаг 1: генерация контекста


На основе
слова и
предыдущего
контекста
Контекст =
набор чисел
Слова с
близкими
свойствами
располагаются
близко друг к
другу
Шаг 2. Формирование выхода

Формируется выход (вверху; зеленый)


По словам, которые есть в исходном тексте (к декодеру
снизу)
По модели внимания = на основании смеси исходных
контекстов (неясно, как работает)

Вам также может понравиться