Вы находитесь на странице: 1из 7

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

ПРИ ДИХОТОМИЧЕСКОМ ОЦЕНИВАНИИ

Часто при проведении анкетирования или


тестирования рассматриваются только два
значения переменной, например «0» и «1» («нет»
или «да»). Возникает ситуация т.н.
«дихотомического оценивания». Пусть группа
вопросов анкеты посвящена исследованию
одного признака. Задачей корреляционного
анализа в этом случае может быть оценка
тесноты связи между вопросами анкеты,
принадлежащими данной группе, а целью –
оценка качества самой анкеты в отношении
исследования рассматриваемого признака.
В простейшем учебном варианте
дихотомического оценивания изучают тесноту
связи только двух вопросов. В качестве
переменных рассматривают ответы на вопросы
анкеты Х и У со значениями «0» и «1». Эти
ответы были даны группой респондентов или
тестируемых. Исходной в таком случае является
матрица корреляции
У 0 1
Х
0 р11 р12

1 р21 р22

Здесь р11 – процентная доля респондентов,


ответивших «0» на оба вопроса, р12 – процентная
доля респондентов, ответивших «0» на вопрос Х
и «1» на вопрос У и т.д. Выполняется условие
нормировки
р11+ р12 + р21 + р 22=1 . (17.1)
Построим ряды распределения случайных
величин Х и У по отдельности. Для этого
складываем элементы корреляционной матрицы
по столбцам и по строкам:
Х
0 1 У 0 1
Х Х У У
Р р0 р1 Р р0 р1

р0Х = р 11+ р12 Х У У


, р1 = р 21+ р22 , р0 = р11+ р 21 , р1 = р12+ р 22 (17.2)
Находим параметры, аналогичные
определенным формулами (16.1) – (16.8).
Математические ожидания вычисляются по
формулам (5.2)
Х Х Х
M x =0⋅р 0 +1⋅р1 = р 1 ; (17.3)
У У У
M у =0⋅р0 +1⋅р1 = р1 . (17.4)
Дисперсии вычисляются по формуле (5.3)
2
D x=0 2⋅р0Х +12⋅р1Х −M 2x =р 1Х −( p1X )
; (17.5)
2
D y =02⋅рY0 +12⋅рY1 −M 2y =р Y1 −( pY1 )
. (17.6)
Средне квадратические отклонения
вычисляются по формулам (5.4)
, σ y= √ D y .
σ x =√ D x (17.7)
Ковариация вычисляется по формуле
К xу =0⋅0⋅р11 +0⋅1⋅р12 +1⋅0⋅р 21+1⋅1⋅р 22−М х⋅М у=
Х У
= р22− р1 ⋅р1
. (17.8)
Коэффициент корреляции вычисляется по
формуле
K xy
ρ xy =
. σ x⋅σ y (17.9)
При дихотомическом оценивании
принимается обычно градация степеней
корреляции, отличная от приведенной в разд. 16.
Степени тесноты связи при дихотомическом
оценивании
|ρ xy| Степень тесноты
корреляционной связи
0 Корреляционная связь
отсутствует
( 0 ÷ 0,3 ) Слабая корреляционная связь
[ 0,3 ÷ 0,7 ) Умеренная корреляционная
связь
[ 0,7 ÷ 1 ) Сильная корреляционная
связь
1 Функциональная связь (не
вероятностная)

В качественно составленной анкете теснота


связи между вопросами не должна быть велика (
ρ xy ≤0,3 ), иначе возникает дублирование
информации. Если для двух вопросов значение
ρ xy близко к 1, то один из них следует исключить.

Если существует отрицательная связь между


одним из вопросов анкеты, например Т, и
группой других вопросов, то вопрос Т, скорее
всего, относится к предметной области другого
признака. Его следует переформулировать или
исключить.

Пример решения типового задания по теме


«Корреляционный анализ при
дихотомическом оценивании»
Задание № 17. Респондент отвечает на
вопросы анкеты Х и У «да» (1 балл) или «нет» (0
баллов). Процентные доли различных вариантов
ответов сведены в матрицу корреляции.
Установить степень тесноты связи вопросов Х и
У.

У 0 1
Х
0 0.08 0.26
1 0.12 0.54

Решение. Построим ряды распределения


случайных величин Х и У по отдельности. По
формулам (17.2)

р0Х = р 11+ р12 = 0,08 + 0,26 = 0,34;


Х
р1 = р 21+ р22 = 0,12 + 0,54 = 0,66;
У
р0 = р11+ р 21 = 0,08 + 0,12 = 0,2;
У
р1 = р12+ р 22 = 0,26 + 0,54 = 0,8.

Тогда отдельные ряды распределения имеют


вид
Х
0 1 У 0 1
Р 0,34 0,66 Р 0,2 0,8

Заметим, что условие нормировки в каждом


ряде соблюдается – сумма вероятностей равна 1.
Найдем математические ожидания по
формулам (17.3), (17.4)
Х У
M x = р1 = 0,66; M у =р 1 = 0,8.
Найдем дисперсии по формулам (17.5), (17.6)
2
D x= р1Х −( p1X ) =0 , 66−0 ,66 2 =0 , 66−0 , 4356=0 , 2244
;
2
D y = рY1 −( pY1 ) =0,8−0,82 =0,8−0 , 64=0 ,16
.
Найдем средне квадратические отклонения
по формулам (17.7)
σ x =√ D x =√ 0,2244≈0 , 474 ; σ y= √ D y= √0 , 16≈0,4 .

Найдем ковариацию по формуле (17.8)


К xу = р22− р1Х⋅рУ1 =0 , 54−0 , 66⋅0,8=0 , 54−0 , 528=0 , 012 .
Найдем коэффициент корреляции по
формуле (17.9)
K xy 0 , 012
ρ xy = ≈ ≈0 , 063
σ x⋅σ y . 0 , 474⋅0,4

Вывод: теснота связи между вопросами


анкеты Х и У – слабая, что свидетельствует,
скорее всего о высоком качестве ее составления.
Для дальнейших выводов по качеству анкеты
следует установить степень тесноты связи между
другими ее вопросами.

Вам также может понравиться