Вы находитесь на странице: 1из 12

ЛЕКЦИЯ 8.

ДИСКРИМИНАНТНЫЙ АНАЛИЗ1

8.1. Назначение
Дискриминантный анализ (ДА) является статистическим методом,
который позволяет изучать различия между двумя и более группами
объектов по нескольким переменным одновременно. Этот метод часто
бывает полезен в социальных науках. Рассмотрим, например, такую
ситуацию.
Группа экспертов исследует возможность переговоров с террористами,
захватившими заложников. Их интересуют те особенности ситуации, при
которых было бы возможно безопасное освобождение заложников, даже если
требования террористов не выполнены. В качестве альтернативы, что
заложникам будет причинен вред, существует несколько переменных,
предсказывающих их благополучное освобождение. Например, число
террористов, наличие поддержки их местным населением, являются ли они
независимой группой или принадлежат к большой военной организации,
характер их устных заявлений, тип и количество оружия, отношение числа
террористов к числу заложников и т. д.
Изучая предыдущие инциденты, в которых власти отказались
выполнить требования террористов, эксперты должны найти ответ на
следующие вопросы:
1. какие из этих переменных могут быть полезными для предсказания судьбы
заложников:
2. как эти переменные могут быть связаны в математическую функцию для
предсказания наиболее вероятного исхода:
3. какова точность предсказания.
Дискриминантный анализ с успехом применяется в таких областях как
1
Текст этой лекции составлен на основании соответствующего раздел книги: Факторный, дискриминантный
и кластерный анализ / Дж.-О. Ким, Ч.У. Мьюллер, У.Р. Клекка и др. М., 1989.
психологическое тестирование, личностное и в целях профотбора или
аттестации кадров, анализ переписи населения, изучение эффекта от какого-
либо метода лечения, исследование экономических различий между
географическими районами и предприятиями, предсказание итогов
голосования и др.
Основным предположением дискриминантного анализа является то,
что существуют две или более группы, которые по некоторым переменным
отличаются от других групп, причем такие переменные могут быть измерены
по интервальной шкале либо по шкале отношений. Дискриминантный анализ
помогает выявлять различия между группами и дает возможность
классифицировать объекты по принципу максимального сходства.
Объекты (наблюдения) должны принадлежать одному из двух (или
более) классов (групп). Объекты являются основными единицами анализа.
Объектами изучения могут быть люди, животные, страны, экономика в
различные моменты времени и вообще все, что угодно. В примере с
террористами каждый предыдущий террористический акт есть объект. Класс
(группа) должен быть определен таким образом, чтобы каждое наблюдение
принадлежало одному и только одному классу. Последствия
террористических актов могут быть отнесены к одному из двух классов:
случаи успешного освобождения заложников и случаи, когда пострадали
некоторые или все заложники. Главная задача в случае с террористами
состоит в точном предсказании результатов будущих инцидентов. Поэтому
будущие инциденты могут рассматриваться как «нерасклассифицированные»
(«несгруппированные»).
«Дискриминантный анализ» можно разделить на методы
интерпретации межгрупповых различий и методы классификации
наблюдений по группам.
При интерпретации необходимо ответить на вопросы: возможно ли,
используя данный набор характеристик (переменных), отличить один класс
от другого: насколько хорошо эти характеристики позволяют провести
различение и какие из них наиболее информативны.
Метод, относящийся к классификации, связан с получением одной или
нескольких функций (уравнений), обеспечивающих возможность отнести
данный объект к одной из групп (классов). Эти функции, называются
классифицирующими. Например, если значения характеристик нового
террористического акта близки к соответствующим значениям прошлых
инцидентов, в которых все заложники были освобождены,
классифицирующая функция покажет, что для рассматриваемого события
более вероятен благоприятный исход. (После того как инцидент будет
исчерпан, станет известно, оправдался ли прогноз, однако для многих других
приложений подтвердить точность классификации не представляется
возможным.)
Характеристики, применяемые для того, чтобы отличать один класс от
другого, называются дискриминантными переменными. В примере с
террористами были упомянуты семь дискриминантных переменных (число
террористов, степень поддержки, количество оружия и т. д.). В общем
случае, число дискриминантных переменных не ограничено, но в сумме
число объектов должно всегда превышать число переменных по крайней
мере на два.
Итак, дискриминантный анализ используется для изучения различий
между несколькими группами по определенному набору дискриминантных
переменных.

8.2. Процедура и техника дискриминантного анализа


Дальнейшее изложение понятий и техники дискриминантного анализа
мы будем иллюстрировать примерами из психолого-педагогического
исследования, одной из задач которого была классификация учителей на
группы.
Для выполнения этого исследования были сформированы две группы
испытуемых. Первую группу, названную «рядовые» составили педагоги, чьи
профессиональные показатели не превышали среднего уровня (85 человек).
Во вторую, названную «элита» (45 человек), вошли педагоги, которые, по
мнению экспертов, были лучшими представителями своей профессии
(напомним, что ДА относится к задачам группировки испытуемых на
заданные группы или, что то же самое, к алгоритмам распознавания образов
«с учителем»).
В результате тестирования испытуемых было получено более 40
показателей (переменных)2, характеризующих каждого из них. Задача
состояла в выработке решающего правила (уравнения) для отнесения
каждого испытуемого к своей группе (классу). В ДА предполагается, что
если процент верных классификаций окажется высоким, то это значит, что
«учитель» справился со своей задачей, и мы можем пользоваться найденным
уравнением для классификации неизвестных испытуемых.
Важным является вопрос, все ли переменные, описывающие
испытуемых, нужно включать в обработку с помощью ДА? Следует иметь в
виду, что переменные, которые не дают значимых межгрупповых различий,
из ДА следует исключить. В нашем примере для определения переменных,
подлежащих исключению, было проведено сравнение групп по каждой
переменной с помощью t-критерия Стьюдента. Оказалось, что статистически
значимо группы различаются только по 8 из более чем 40 переменных.
Именно к этим переменным и была применена процедура ДА.
Процедуру и технику ДА будем обсуждать в соответствии с
последовательными этапами реализации компьютерной программы ДА в
пакете STATGRAF.

8.2.1. Процедуры интерпретации. Первый вопрос, который следует


обсудить, связан с методами интерпретации. Задача интерпретации связана с
определением числа и значимости канонических дискриминантных функций
и с выяснением их значений для объяснения различий между классами.

2
Переменными являлись шкалы тестов Кеттела, Фидлера и Розенцвейга
Каноническая дискриминантная функция является линейной
комбинацией дискриминантных переменных. Ее уравнение, называемое
дискриминантным, имеет следующий вид:
Fkm = U0+U1X1km+U2X2km+ … +UpXikm
где Fkm – значение канонической дискриминантной функции для m-го
объекта в группе K; Xikm – значение дискриминантной переменной Xi для m-
го объекта в группе K; Ui – коэффициенты, обеспечивающие выполнение
требуемых условий.
Коэффициенты для Fkm подбираются таким образом, чтобы ее средние
значения для различных классов как можно больше отличались друг от
друга.
STATGRAF рассчитывает стандартизированные и
нестандартизованные коэффициенты канонической дискриминантной
функции. Разница между ними заключается в следующем:
нестандартизованные коэффициенты – в отличие от стандартизованных –
рассчитываются на основании матрицы, содержащей исходные значения
наблюдений, которые не приведены к стандартной форме.
Нестандартизованные коэффициенты канонической
дискриминантной функции необходимы для определения положения
наблюдений (объектов) в дискриминантном пространстве (табл. 2.4.1).
Таблица 8.1
Нестандартизованные коэффициенты канонической дискриминантной
функции
В М Q1 Q4 АSОл МРСл 0-D E-D Const.

0,03 0,16 0,04 0,14 0,01 0,24 0,23 -0,18 -3,5

Именно они являются коэффициентами при переменных в


дискриминантном уравнении
F = 0,03В + 0,16Мк + 0,04Q1 + 0,14Q4 + 0,01ASOл 4 +
0,2МРСл + 0,23OD - 0,17ED - 3,5
Значение функции интерпретируется как координата объекта (учителя)
в пространстве этой функции. Пространство канонической дискриминантной
функции задается совокупностью объектов наблюдения, в нашем случае это
координаты 130 учителей (85 рядовых - гр. I и 45 элитных - гр. 2).
Значение дискриминантной функции измеряется в единицах
стандартного отклонения, то есть значение F для данного учителя
представляет число стандартных отклонений точки от главного центроида
или, другими словами, положение точки на оси, где нулевая точка - главный
центроид.
Центроид - это воображаемая точка, координаты которой есть среднее
значение переменных в данной группе. Главный центроид – это точка
пространства, в которой все дискриминантные переменные принимают
средние (по всем наблюдениям) значения. Другими словами, это центральное
положение всех точек, представляющих наблюдения. При графическом
изображении дискриминантных функций в главном центроиде помещается
начало координат, так как в этом случае рассматриваемые группы и объекты
соотносятся с центром системы.
У нас есть две группы - значит - два центроида: Ц1 = -0,43, Ц2 = +0,81
(эти значения также рассчитываются программой ДА STATGRAFа).
Центроиды можно использовать для изучения различий между группами, так
как они занимают положение типичных представителей соответствующей
группы.
Число канонических дискриминантных функций не может быть больше
числа групп минус 1. Значит при наличии двух групп возможна только одна
функция. В таком случае точки, соответствующие объектам, располагаются
вдоль некоторой прямой.
Можно построить график-гистограмму распределения объектов
относительно этой оси. В качестве примера мы нанесли на график значения
канонической дискриминантной функции для 10 первых членов из каждой
группы (рис. 8.1).
Расположив групповые гистограммы одну над другой, легко
сравнивать относительное положение групп. График показывает, что группы
вполне различимы. Центроиды хорошо отделимы друг от друга.
По значению канонической дискриминатной функции, вычисленной
для конкретного человека, можно сделать заключение о том, насколько
типично положение данного человека среди участников группы.
Возможность эта появляется потому, что дискриминантные значения
выражены в единицах стандартного отклонения, то есть имеют единый
масштаб. Например, значения канонической дискриминантной функции для
учителей с условными номерами 86, 89 и 92 равны соответственно 1,8; 0,7 и -
0,3. № 89 располагается рядом с центроидом группы (Ц2 = +0, 8) и может
считаться типичным ее представителем. № 86 и № 92 отклоняются от своего
центроида более чем на стандартное отклонение. Известно, что в пределах
стандартного отклонения лежит 68% всех наблюдений, значит № 89 и № 92
входят в оставшиеся 32%, то есть находятся на границах своей группы.

+ ++
++ ++ + + +

Гр.1 (рядовые) --* * * * *


ц1 ц2
-1 0 +1
-0,43 0,81

++
+ + +++ ++ +
Гр.2 (элита) --* * * * * * *
-1 ц1 0 ц2 +1
-0,43 -03 1,8
0,81

Рис. 8.1 Распределение значений канонической дискриминантной функции для


десяти произвольно взятых членов из каждой группы. Ось абсцисс является канонической
дискриминантной функцией, измеренной в единицах стандартного отклонения.

Стандартизованные коэффициенты показывают вклад переменной в


значение функции. Их полезно применять для выявления тех переменных,
которые значат больше других для характеристики изучаемой области
реальности. Абсолютная величина коэффициента анализируется в
стандартной форме: чем она больше, тем больше вклад этой переменной. Для
нашей функции максимален вклад переменной 0D, затем по убывающей
следуют шкалы ED, Мк, МРСл, Q4, Q1, В, ASOЛ. Этот ранжир указывает на
особую значимость для профессии педагога особенностей поведения в
конфликтных ситуациях, которые измеряются шкалами 0D и ED из методики
Розенцвейга. Причем, значимость переменной ОД (максимальный вклад) в
8,3 раза превосходит значимость переменной ASOл (минимальный вклад).

Таблица 8.2
Стандартизованные коэффициенты канонической дискриминантной
функции

B M Q1 Q4 ASOл MPCл O-D E-D


0.09 0.34 0.11 0.28 0.06 0.29 0.5 -0.39

8.2.2. Процедуры классификации. Следующий вопрос, который мы


обсудим, знакомясь с дискриминантным анализом, связан с методами
классификации.
Классификация – это особый вид деятельности исследователя, в
котором либо дискриминантные переменные, либо канонические
дискриминантные функции используются для предсказания класса, к
которому более вероятно принадлежит некоторый объект. Существует
несколько процедур классификации, но все они сравнивают положение
объекта с каждым из центроидов классов, требуют определения понятия
«расстояния» между объектом и каждым центроидом группы, чтобы можно
было приписать объект к «ближайшей» группе. Классификация проводится с
помощью линейной комбинации дискриминантных переменных. Ищется
такая комбинация, которая максимизирует различия между группами, но
минимизирует дисперсию внутри групп. Особая линейная комбинация для
каждой группы называется классифицирующая функция3. Она имеет вид:
Нк = Вк0 +Вк1Х1 + Вк2 Х2 +… + Вкn Хn
Где Нк – значение функции для группы К, а Вк – коэффициенты простой
классифицирующей функции. STATGRAF (и все другие компьютерные
программы ДА) рассчитывают эти коэффициенты. В нашем случае имеется
две группы, значит две классифицирующие функции:

Таблица 8.3
Коэффициенты простой классифицирующей функции
В МК Q1 Q4 ASOЛ МРСл OD ED const
Н1 0.2 0.7 0.36 1.2 0.37 5.54 1.68 3.1 47.6
Н2 0.24 0.88 0.41 1.33 0.36 5.83 1.97 2.84 52.16

HI = 0,2В + 0,7МК + 0,36Q1 + 1,2Q4 - 0,37ASOл +5,54МРСл +


+ 1,68OD + 3,1ED - 47,6
Н2 = 0,24В + 0,88МК + 0,41Q1 + 1,33Q4 - 0,36АSОл +
+ 5,83МРСл +1,9700 + 2,84ED - 52,16
Классификация производится следующим образом: подсчитываются
значения HI и Н2; объект относится к той группе, у которой значения Н
больше.
Проведем для примера классификацию трех человек из элитной группы
под условными номерами 1, 2, 3.
Таблица 8.4
№1 №2 №3
HI 42,9 36 35,8
H2 43 37 37,1

У всех трех значение Н2 больше, значит их следует отнести к элитной


группе. Здесь мы показали, как работает функция, классифицируя
"известных" учителей (тех, принадлежность которых к одной из групп
известна заранее). Именно на этих учителях строилась классифицирующая

3
Во многих работах именно эти функции называются дискриминантными, но чтобы не путать их с
каноническими дискриминантными функциями, мы будем называть их классифицирующими.
функция, происходило обучение системы. Теперь в уравнения можно
подставлять значения переменных неизвестных людей (например,
абитуриентов) и относить их к потенциально успешным или к таким, у кого
потенциал успешности под вопросом.

Обобщенную меру «расстояния» между объектом и каждым


центроидом группы предложил индийский статистик Махаланобис –
расстояние Махаланобиса D2, после вычисления которого для каждого
класса объект классифицируется в группу с наименьшим D2. Это класс, чей
типичный профиль по дискриминантным переменным больше похож на
профиль этого объекта. Если расстояние до ближайшего класса велико, то
согласие между профилями будет плохим, но по сравнению с любым другим
классом – хорошим.
Оказалось, что статистика D2 обладает теми же свойствами, что и
статистика 2. Расстояние, таким образом, измеряется в «2-единицах».
Поэтому, в соответствии с закономерностями 2-распределения, мы можем
ожидать, что большинство объектов будет группироваться вблизи
центроида, и их плотность будет убывать по мере удаления от центроида.
Зная расстояние от центроида, можно сказать, какая часть класса находится
ближе к центроиду, а какая – дальше от него. Следовательно, можно оценить
вероятность того, что объект, настолько-то удаленный от центроида,
принадлежит к классу. Эта вероятность рассчитывается компьютерными
программами ДА.
К классификации обычно обращаются как к средству предсказания
принадлежности к группе «неизвестных» объектов, но можно использовать
ее также для проверки точности процедуры классификации. Для этого
берутся «известные» объекты и к ним применяются правила классификации.
Доля правильно классифицированных объектов говорит о точности
процедуры и косвенно подтверждает степень разделения классов. Результат
описывается в «классификационной матрице».
В первой группе всего 85 человек. Из них классифицировано
правильно (отнесено к первой группе) 65 человек или 76 %, неправильно
(отнесено ко второй группе) 20 человек, то есть допущено 24% ошибок.
Аналогично из 45 человек второй группы верно классифицировано 33
человека или 73%.
Таблица 8.5
Итоговая классификация
«обучающая» Верный прогноз Ошибочный прогноз всего
группа частота процент частота процент частота процент
1 65 76,47 20 23,53 85 100
2 33 73,33 12 26,67 45 100

Всего верно классифицировано 65 + 33 = 98 человек из 130. Таким


образом, точность предсказания равна 98:130 = 0,75 или 75% Процентное
содержание как мера точности предсказания считается наиболее подходящей
мерой дискриминантной информации.

Упражнения
В таблице представлены данные по двум группам испытуемых с
высоким и низким организаторским потенциалом. Их деятельность
характеризуется показателями самоорганизации и способностью
организовать работу группы. С помощью компьютерной программы
дискриминантного анализа классифицировать трех неизвестных
испытуемых.

№ Показатель самоорганизация Способность


испытуем Группа организрвать
ого испытуемых группу
1 Высокий организаторский 23.4 9,1
2 потенциал 19,1 6,6
3 Х 17,5 5,2
4 17,2 10,1
5 Низкий организаторский 5,4 4,3
6 потенциал 6,6 5,5
7 Y 8,0 5,7
8 9,7 5,5
9 9,1 6,6
10 Подлежат дискриминации 9,9 7,4
11 Z 14,2 9,4
12 12,9 6,7

При оценке эффективности деятельности ряда организаций были


получены два класса организаций А и В. Используя их как обучающие
выборки, с помощью компьютерной программы дискриминантного анализа
классифицировать три неизвестные организации по показателям
удовлетворенности работников положением в организации и стиля
руководства организацией.

№ Показатель Удовлетворенность Стиль руководства


организац организации положением в
ии организации
1 Класс А, 1,47 3,90
2 Х 1,52 6,18
3 1,38 13,80
4 1,27 8,18
5 Класс В, 0,59 9,08
6 Y 0,57 2,10
7 0,46 6,5
8 0,53 13,3
10 Подлежат дискриминации 0,92 13,80
11 Z 1,21 4,8
12 0,63 12,33