Вы находитесь на странице: 1из 25

Casos y problemas

resueltos
Inferencia Estadstica no paramtrica
Estadsticas de asociacin
Contrastes con Chi-cuadrado

Estadstica

Aplicada a las Ciencias Sociales

-7Patricio Alcano Martnez


Derechos Reservados

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos


Inferencia Estadstica no paramtrica: contraste de asociacin con Chicuadrado Patricio Alcano Martnez Derechos Reservados

Palabras iniciales
Estimados usuari@s:
Este material que pongo a su disposicin, est elaborado a partir de
la recreacin de casos e investigaciones reales en distintos mbitos
de las Ciencias Sociales.
Los datos y situaciones pueden haber sido cambiados para
adecuarlos a contextos de enseanza aprendizaje. Por ello, fuera del
mbito de este documento, la informacin y conclusiones a las que
llegan los casos analizados no son necesariamente vlidas ni pueden
servir de referencia para otras construcciones.
Este volumen est dirigido a ejercitar el contraste de asociacin
entre variables categricas con Chi-cuadrado. El lector deber
manejar los conceptos y procedimientos elementales de contraste de
hiptesis y exhibir competencia en el clculo de probabilidades con la
tabla de la distribucin Chi-cuadrado.
Para trabajar con este material el usuario deber hacer uso de
calculadora cientfica, demostrando capacidad para operar con
habilidad con la misma.
Este material est concebido con fines educativos no comerciales y
su uso est permitido en ese mbito. Por lo mismo, no se permite su
uso comercial.
Este documento tiene Derechos Reservados.

Atentamente;
Patricio Alcano Martnez

En Santiago de Chile, marzo de 2012.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos


Inferencia No paramtrica: Contrastes de asociacin de variables categricas
Patricio Alcano Martnez Derechos Reservados

Caso 1: Estado civil y sntomas depresivos


Sobre la base de los resultados de un estudio, se ha afirmado que las madres casadas
presentan menos sntomas de depresin que las solteras. En una muestra de mujeres
de
18-19 aos con 1 hijo, se recab la siguiente informacin, en nmero de casos,
desagregadas por estado civil:
ESTADO CIVIL

SNTOMAS DEPRESIVOS

Total

No

Casadas

45

131

176

Solteras

83

127

210

Total

128

258

386

1.1. Contraste, con estos datos y un1% de significacin, la hiptesis de que el sntoma
depresivo de las mujeres est asociado a su estado civil. Construya sus conclusiones
respecto del caso.
1.2. Qu significa, en este contexto, cometer error de tipo II?
Solucin:
1.1. Situacin tpica de resolver a travs del contraste de hiptesis de asociacin con
la prueba Chi-cuadrado. La muestra es lo suficientemente grande como para utilizar
Chi- cuadrado de Pearson, esto es, sin correccin por continuidad de Yates.
Significacin:
= 0,01
Hiptesis:
H0: Los sntomas depresivos de la mujer son independientes de su estado civil
H1: Los sntomas depresivos de la mujer estn asociados a su estado civil
Estadstico de prueba:
2
(45 127 131 83) 386 = 8,4
2obs =
176 210 128
258
Valor p:

> 8,4) = 0,0037


* =
P(

p;1

Decisin:
Como * < 0,01 , se rechaza H0 al 1%.
Conclusin:
Los sntomas depresivos de la mujer estn asociados a su estado civil (p = 0,0037).
1.2. El error de tipo II consiste en no rechazar la hiptesis nula siendo que es falsa. En
este caso significa no rechazar la independencia entre sntomas depresivos y estado
civil, dado que en realidad s hay asociacin.

Caso 2: Consumo de cocana y terapia


En cierta universidad de USA, se realiz un estudio con 187 consumidores compulsivos
de cocana, los que fueron aleatoriamente asignados a acupuntura auricular o a terapia
de relajacin sin acupuntura. Durante el estudio, los sujetos fueron sometidos a
exmenes de orina para detectar la presencia de cocana en el organismo. De 103 sujetos
asignados a tratamiento de auriculopuntura, 35 presentaron evidencia de cocana en la
orina, mientras que entre los sometidos a relajacin, 51 de un total de 84.
2.1. A un nivel de significacin del 1%, contraste la hiptesis de que el consumo de
cocana durante el estudio result asociado al tipo de tratamiento.

Solucin:
Se trata de contrastar la posible asociacin entre dos variables categricas, dicotmicas:
Evidencia de cocana en la orina: S No
Tratamiento: Auriculopuntura Terapia de relajacin
Es aplicable una prueba de hiptesis de asociacin con la Chi-cuadrado.
Primeramente se llevarn los datos a una tabla de contingencia 2x2.

TRATAMIENTO
Auriculopuntura
Relajacin
Total

Cocana en la orina
S
No
35
68
51
33
86
101

Total
103
84
187

Significacin:
= 0,01
Hiptesis:
H0: La presencia de cocana en la orina es independiente del tratamiento
H1: La presencia de cocana en la orina est asociada al tipo de tratamiento
Estadstico de prueba:
2obs

2
(35 33 68 51) 187 = 13,3
=
103 84 86 33

Valor p:
* =
2
P(

> 13,3) = 0,0003


p;1

Decisin:
Como * < 0,01 , se rechaza H0 al 1%.
Conclusin:
La presencia de cocana en la orina est asociada al tipo de tratamiento (p =
0,0003).

Caso 3: Salud y sobrepeso


El grfico de la figura presenta, en N de casos, la evaluacin del estado general de salud
de una muestra de personas adulto mayor, segn si presentan peso normal o sobrepeso.
N de
casos

12
10
08
06
04
02
00

Peso normal
Sobrepeso

ESTADO DE SALUD
Bueno
Malo
Estado general de salud de adulto mayor, segn peso

3.1. Con los datos del grfico, analice, al 5%, la existencia de una relacin
significativa entre peso y estado general de salud en el adulto mayor.
3.2. En qu consiste cometer error de tipo I en este contraste?

Solucin:
3.1. Se cuenta con dos variables dicotmicas, con datos de frecuencia. Por esta razn es
aplicable una prueba de hiptesis de asociacin con la Chi-cuadrado.
Primero se llevarn los datos a una tabla de contingencia 2x2.
ESTADO DE
SALUD

PESO

Total

Normal

Sobrepeso

Bueno

12

20

Malo

10

14

Total

16

18

34

El tamao de la muestra es menor a 40, lo que hace aconsejable el uso de la Chicuadrado con correccin de Yates.
La frecuencia observada en una de las celdas es 4, menor que lo aconsejable en cada
celda, que es 5, lo que podra hacer pensar en cierta inestabilidad del clculo. Pero esa
14
16 = 6,6, por lo que todas las celdas
celda tiene una frecuencia esperada igual a
34
cumpliran con el mnimo aconsejable de 5 en su valor esperado.
Significacin:
= 0,5
Hiptesis:
H0: El estado general de salud del adulto mayor es independiente de su peso
H1: El estado general de salud del adulto mayor est asociado a su peso

Estadstico de prueba:
2
(12 10 8 5 0,5 34) 34 = 2,13
2obs =
20 14 16 18
Valor p:

> 2,13) = 0,1449


* =
P(

p;1

Decisin:
Como * > 0,05 , NO se rechaza H0 al 5%.

Conclusin:
El estado general de salud del adulto mayor no est asociado a su peso (p = 0,1449).

3.2. El error de tipo I es rechazar la hiptesis nula siendo que es verdadera.


En el marco del caso consiste en rechazar la independencia entre estado de salud y peso
en el adulto mayor, dado que en realidad estn asociados.

Caso 4: Desercin estudiantil


Una ONG realiza un estudio de desercin estudiantil en la educacin superior en una
muestra aleatoria de estudiantes de educacin superior. Los estudiantes fueron
segmentados segn gnero y tipo de carrera y se les hizo un seguimiento a lo largo del
primer semestre de estudio, instancia en la que se determin si haban abandonado o no
sus estudios.
Las variables estudiadas fueron las siguientes:
Deserta del sistema: 1 = S; 0 = No
Desercin:
Sexo del encuestado: 1 = Hombre; 2 = Mujer
Gnero:
Tipo de carrera:
Carrera de estudio del encuestado: 1 = Profesional; 2 =
Tcnica
2
Los datos obtenidos de la investigacin se analizaron con el test de independencia
, llegndose a las siguientes conclusiones:

C1: La desercin se da igual en hombres y mujeres (p = 0,0838)


C2: La desercin est asociada al tipo de carrera (p = 0,0184)

De acuerdo a esta informacin:


4.1. Indique cul fue la hiptesis nula en el contraste de la conclusin C1.
4.2. Para la conclusin C2, cul fue la decisin en el contraste?
4.3. Si ambas hiptesis fueron contrastadas al mismo nivel de significacin, de los
valores usuales en investigacin social, cul es ese valor?
4.4. Si la correlacin entre Desercin y Tipo de carrera fue de negativa y significativa,
qu conclusin puede sacar de ello?

Solucin:
Se trata del contraste de asociacin entre variable categricas, definidas con dos valores
dicotmicos. El contraste fue realizado con pruebas con la Chi-cuadrado.
4.1. En este tipo de contaste, la hiptesis nula siempre afirma la independencia entre las
variables. Por lo tanto, la hiptesis nula para el contraste que llev a la conclusin C1 fue:
H0: La desercin es independiente del sexo del estudiante.
4.2. Al afirmar asociacin entre variables, la conclusin C2 est refutando la
independencia entre desercin y tipo de carrera que plantea la hiptesis nula. Por lo tanto
la decisin fue rechazar la hiptesis nula a un nivel de significacin .
4.3. En la conclusin C1 no se rechaz la hiptesis nula con < 0,0838. Entonces
la significacin pudo ser 1% o 5%.
En la conclusin C2 se rechaz la hiptesis nula con > 0,0184. Entonces la
significacin pudo ser 5% o 10%.
Por lo tanto, la significacin utilizada en ambos contrastes fue =5%.
4.4. Correlacin negativa indica que los valores bajos de desercin (1 = S) estn
asociados a valores Altos de Tipo de carrera (2 = tcnica).
Por lo tanto se concluye que la desercin est asociada a las carreras tcnicas.

Caso 5: Percepcin de la situacin econmica


Se hizo en Chile un estudio hacia fines del ao 2010 con una muestra informantes
dirigentes sociales, 17 hombres y 15 mujeres, a fin de conocer su percepcin de la
situacin econmica del pas. Los resultados son los siguientes, en nmero de casos:
Sexo
Hombre
Mujer
Total

Percepcin de la situacin econmica


Buena
Aceptable
Deficiente
8
6
3
9
4
2
17
10
5

Total
17
15
32

5.1. Con un nivel de significacin del 10% realice un contraste de hiptesis para
responder a la afirmacin de que la percepcin de la situacin econmica est asociada
al gnero del encuestado.

Solucin:
5.1. Primero se calculan los valores esperados bajo la hiptesis de independencia
verdadera.
Valores esperados:
Sexo
Hombre
Mujer
Total

Percepcin de la situacin econmica


Buena
Aceptable
Deficiente
9,03
5,31
2,66
7,97
4,69
2,34
17
10
5

Total
17
15
32

Esta tabla tiene el 50% de las celdas con valores esperados menores que 5, lo que resta
validez al anlisis. Por lo tanto, se reorganizan los datos para llevarlos a una tabla de 2x2.
Como la variable Percepcin de la situacin econmica est medida a escala ordinal, se
juntarn los valores Aceptable y Deficiente en una misma categora. La tabla resultante
es la siguiente:
Sexo

Hombre
Mujer
Total

Percepcin de la situacin
econmica
Buena
AceptableDeficiente
8
9
9
6
17
15

Total
17
15
32

El tamao de la muestra hace aconsejable aplicar el contraste de asociacin mediante el


Chi-cuadrado con correccin de Yates.

Significacin:
= 0,10
Hiptesis:
H0: La percepcin de la situacin econmica es independiente del sexo del
encuestado.
H1: La percepcin de la situacin econmica est asociada al sexo del encuestado.
Estadstico de prueba: ( 8 6 9 9 0,5 32)2 32
17 15 17 15
= 0,1422
2Yates =

Valor p:
2

* = P(
p;

> 0,1422) = 0,706

Decisin:
No se rechaza H0, al 10%.
Conclusin:
La percepcin de la situacin econmica es independiente del sexo del encuestado
(p = 0,706)

Caso 6: Estado civil y situacin laboral de mujeres


Se realiza un estudio para esclarecer la posible asociacin entre el estado civil de las
mujeres y su situacin laboral, conjeturando inicialmente que las mujeres que
trabajan remuneradamente fuera del hogar son, fundamentalmente, solteras. Para los
efectos, el estudio investig a 44 mujeres casadas y 34 solteras, independientes entre
s. Los resultados se organizaron en una tabla como la siguiente:
Mujeres segn estado civil y situacin laboral
Trabaja
remuneradamente
S
No
Total

Estado civil
Casada
Soltera

44

Total

34

78

El anlisis de la tabla de contingencia dio los siguientes estadsticos:


Estadstica

valor

Chi2-Pearson
Chi2-con correccin de Yates
Test-G
Chi2-McNemar

5,4985432
4,4638738
5,5293445
2,88

0,0190
0,0346
0,0187
0,0897

Correlacin-fi
Q de Yule

-0,265507
-0,502551

0,0188

Con estos datos, y un 5% de significacin, realice el anlisis necesario para validar o


refutar las siguientes afirmaciones:
6.1. La situacin laboral de la mujer est asociada a su estado civil.
6.2. Las mujeres que trabajan remuneradamente son, fundamentalmente, solteras.

Solucin:
6.1. La situacin laboral de la mujer est asociada a su estado civil
Para estudiar la asociacin entre variables categricas en una tabla de 2x2 es utilizable el
test de asociacin con
de Pearson, con o sin correccin de Yates, el test G (razn de
2
2

verosimilitudes), que tambin se basa en . El test de McNemar no sirve en este caso,


ya que es aplicable a casos con muestras pareadas.
Las hiptesis del caso son las siguientes:
H0: La situacin laboral de la mujer es independiente de su estado civil
H1: La situacin laboral de la mujer est asociada a su estado civil
Los tres estadsticos basados en Chi cuadrado que aparecen en el cuadro, tienen un
valor p menor a la significacin del 5%, al igual que el test de Fisher. Estos cuatro
resultados

confirman el rechazo de la hiptesis de independencia. Por lo tanto, se puede afirmar,


que:
La situacin laboral de la mujer est asociada a su estado civil (p< 0,05).

6.2. Las mujeres que trabajan remuneradamente son, fundamentalmente, solteras.


Ya se concluy que la situacin laboral de la mujer est asociada a su estado civil. Falta
analizar ahora la direccin de dicha asociacin. Para los efectos sirven los dos estadsticos
que aparecen en la tabla de estadsticos: el coeficiente de correlacin y la Q de Yule.
Ambos estadsticos son negativos y existe un valor p menor al 5%. Esto hace concluir
que la correlacin entre estado civil y situacin laboral es inversa y significativa al 5%.
De acuerdo a la organizacin de la tabla de frecuencias, esta correlacin indica que la
situacin laboral de S trabaja remuneradamente, est correlacionada con el estado
civil Soltera.
Aunque la correlacin es baja en valor absoluto, es significativa, lo que lleva a
poder concluir que:
En la mujer, la situacin laboral de s, trabajando, est asociada, en forma
baja, pero significativa, a las solteras (p<0,05).

Caso 7: Obesidad en el tiempo


En el marco de una investigacin de la obesidad, se hizo un seguimiento a 40
adolescentes obesos y 40 no-obesos, todos independientes entre s. Cuando adultos, se
verific su estado de peso de los mismos, encontrando los siguientes datos:

ADULTOS
Obeso
No-obeso
Total

ADOLESCENTES
Obeso
No-obeso
16
21
24
19
40
40

Total
37
43
-

7.1. A un nivel de significacin del 10%, contraste la hiptesis de que los adolescentes
obesos suelen ser adultos obesos. Analice y formule una conclusin en el marco del
caso.

Solucin:
7.1. De acuerdo a la descripcin y datos dados, se trata de una muestra pareada en
una situacin antes-despus. Por lo tanto, es aplicable el contraste con el estadstico
Chi- cuadrado de McNemar.
Significacin:
= 0,10
Hiptesis:

H0: La obesidad es independiente de la etapa etaria del encuestado.


H1: La obesidad est asociada a la etapa etaria del encuestado.

Estadstico de prueba:
2McNemar =
Valor p:
Decisin:

(24 21)
24 + 21 = 0,2

2
* = P(
p; 1 > 0,2) = 0,6547

No se rechaza H0, al 10%.

Conclusin:
La obesidad es independiente de la etapa etaria del encuestado (p = 0,6547). Esto
significa que los adolescentes obsesos no necesariamente siguen sindolo cuando
adultos.

Caso 8: El debate televisivo, cambi la intencin de voto?


Se investiga la intencin de voto en las elecciones presidenciales en 240 sujetos. Despus
de un debate de los dos candidatos por televisin, se les volvi a consultar a los mismos
sujetos su intencin de voto, llegando a los datos de la tabla siguiente:

Intencin de voto
ANTES del debate
Votara por candidato

A
B
TOTAL

Intencin de voto
DESPUS del debate
Votara por candidato
A
B
51
45
80
64
131
109

TOTAL
96
144
240

8.1. Con estos datos, y un nivel de significacin del 5%, contraste la hiptesis de que el
debate televisivo cambi significativamente la intencin de voto.

Solucin:
8.1. De acuerdo a los datos dados y descripcin del caso, se trata de una muestra
pareada en una situacin antes-despus. Por lo tanto, es ideal realizar el contraste con el
estadstico Chi-cuadrado de McNemar.
Significacin:
= 0,10
Hiptesis:
H0: La intencin de voto es igual antes y despus del debate.
H1: La intencin de voto es distinta antes y despus del debate.
Estadstico de prueba:
(80 45 )
80 + 45

2
McNemar
=

= 9,8

Valor p:
2

* = P(
p;

> 9,8) = 0,0017

Decisin:
Se rechaza H0, al 5%.
Conclusin:
La intencin de voto cambi significativamente despus del debate televisivo (p =
0,0017).

Caso 9: Accidentes de trnsito con resultado de muerte


Se investiga una muestra aleatoria de accidentes de trnsito, segn sexo del conductor
(1 = mujer; 2 = hombre) y su hubo o no resultado de muerte (1 = s; 0 = no).
Se desea saber si sexo y accidentes de trnsito con resultados de muerte estn o no
asociados y la direccin de la asociacin, si la hubiera.
El anlisis de una tabla de 2x2 arroj los siguientes resultados de estadsticos:
2
= 4,2;
Q-Yule= 0,498
9.1. Sobre la base de estos resultados, construya las conclusiones del caso, al 5%
de significacin.

Solucin:
2
El estadstico se usa en el contraste de asociacin. Como la tabla es de 2x2, por ser
ambas variables dicotmicas, esta Chi-cuadrado tiene 1 grado de libertad. Por lo tanto, el
valor p de la prueba es: 0,0404, rechazndose la hiptesis de independencia, al 5% de
significacin.
Por otro lado, el estadstico Q de Yule indica una direccin positiva de la correlacin
entre sexo (hombre = 2 y Resultado de muerte (1 = s), ya que esos son los valores
mayores de ambas variables.
Por lo tanto, el anlisis nos permite afirmar la existencia de una asociacin
significativa entre sexo del conductor y accidente de trnsito con resultado de muerte (p
= 0,0404), verificndose que los resultados de muerte se asocian a los conductores
hombres.
Conclusin:
Al 5%, se puede afirmar que los accidentes con resultado de muerte estn
significativamente asociados a los conductores de sexo masculino (p<0,05).

Caso 10: Estrs post-terremoto


Despus del terremoto en Chile en febrero de 2010, se realizaron una serie de estudios
de los fenmenos sociales asociados al acontecimiento. Uno de ellos enfoc el estrs postterremoto de la poblacin en relacin al grupo socioeconmico de los sujetos.
La tabla adjunta muestra el estado de estrs pos-terremoto segn condicin
socioeconmica de un grupo de personas seleccionadas aleatoriamente.
Condicin
socioeconmica
Alta
Media
Baja
Total

Con estrs

Sin estrs

Total

15
20
60
95

25
32
15
72

40
52
75
167

10.1. Con estos datos, y a un nivel de significacin del 1%, est el estrs post-terremoto
asociado a la condicin socioeconmica?

Solucin:
Se trata de un contraste de hiptesis de asociacin entre variables categricas. Una es
dicotmica (estado de estrs) y otra ordinal de tres valores (Condicin
socioeconmica).
Para el contraste, se requiere una prueba con la Chi-cuadrado en una tabla de 3x2.
Como no se tiene una tabla de 2x2 no pueden ser utilizadas las frmulas de clculo
abreviados.
Hiptesis:
H0: fo = fe
El estrs pos-terremoto es independiente de la condicin
socioeconmica.
H1: fo fe
El estrs pos-terremoto NO es independiente de la condicin
socioeconmica.
Clculo de la frecuencia esperada:
En cada celda se calcula la frecuencia esperada.
Condicin
socioeconmica
Alta
Media
Baja
Total
1 fila, 1 columna:

fe =

Con estrs

Sin estrs

Total

22,8
29,6
42,6
95

17,2
22,4
32,4
72

40
52
75
167

40 95 = 22,8
167

1 fila, 2 columna se calcula por diferencia: 40 22,8 = 17,2

2 fila, 1 columna:

fe =

52 95 = 29,6
167

2 fila, 2 columna se calcula por diferencia: 52 29,6 = 22,4


3 fila, 1 columna: se puede calcular por diferencia: 95 22,8 29,6 = 42,6
3 fila, 2 columna se calcula por diferencia: 72 42,6 = 29,4

Clculo del estadstico de prueba:


Una vez calculadas todas las frecuencias esperadas, se calcula Chi-cuadrado:
2
2

) OBS =

(f

fe

e
f
=

2
(15 22,8)

22,8

2
(25 17,2)

17,2

2
(20 29,6)

29,6

2
2
(32 22,4)
(60 42,6)
(15 32,4)
+
+
22,4
42,6
32,4
2

OBS = 2,67 + 3,54 + 3,11 + 4,11 + 7,11 + 9,34 = 29,88


2

OBS = 29,9
Grados de libertad:
Para una tabla de 3 x 2 los grados de libertad son:
= (3 1) (2 1) = 2 gl.
Clculo del valor p:
2
* = P( > 29,9) = 0
p; 2

Decisin:
El valor p es prcticamente cero, por lo que se rechaza la hiptesis de
independencia, al 1%.
Conclusin:
El estado de estrs pos-terremoto NO es independiente de la condicin
socioeconmica (p = 0).

Caso 11: Universidades y GSE


Se investiga una muestra aleatoria de estudiantes universitarios, segn grupo
socioeconmico y tipo de universidad en la cual estudian (Estatales Privadas).

Universidades
Estatales
Privadas

Grupo socioeconmico
Medio alto
Medio bajo
17
4
19
2

Alto
13
38

Bajo
3
2

11.1. A un nivel del 5% haga una prueba de hiptesis con el test G para validar la
afirmacin que dice que los estudiantes universitarios de las universidades privadas
son preferentemente de los estratos socioeconmicos altos.

Solucin:
El test G, tambin llamado razn de verosimilitud, es una prueba de Chi-cuadrado, que
entrega mejores resultados que el de Pearson. Est dado por:
G =2

fo

ln

fo
fe

11.1. La tabla tiene un 50% de celdas que no cumplen con la cantidad mnima exigida
por la prueba de Chi-cuadrado. Para resolver esto, se fusionar la columna medio
bajo con bajo, quedando as:
Universidades
Estatales
Privadas
Total

Alto
13
38
51

Grupo socioeconmico
Medio alto
Medio bajo-bajo
17
7
19
4
36
11

Total
37
61
98

Ahora se procede a calcular las frecuencias esperadas en cada celda:


37
Para la celda Estatal/Alto: f e =
51 =19,3
98
Y as sucesivamente. Se llega a la siguiente tabla:
Universidades
Estatales
Privadas
Total

Alto
19,3
31,7
51

Grupo socioeconmico
Medio alto
Medio bajo-bajo
13,6
4,1
22,4
6,9
36
11

Total
37
61
98

La tabla result con una cela con la frecuencia esperada menor a 5, que es el valor
mnimo recomendado para la prueba. Pero, as mismo, se acepta hasta un 20% de
las celdas que no cumplan con el requisito. Como en este caso.
Por lo tanto, se procede al clculo del estadstico G.

Se calcula en cada celda el valor de: fo ln


Universidades
Alto
-5,11
6,83

Estatales
Privadas
Total

fo
fe

Grupo socioeconmico
Medio alto
Medio bajo-bajo
3,80
3,65
-3,13
-2,15

Total

3,89

El estadstico G es igual a:
G =2

fo ln

fo
fe

G = 2 (-5,11 + 3,80 + 3,65 + 6,83 3,13 2,15)


G = 2 3,89 = 7,78

Grados de libertad:
Para una tabla de 2 x 3 los grados de libertad son:
= (2 1) (3 1) = 2 gl.
Esta G es una Chi-cuadrado con 2 grados de libertad.
Valor p:

> 7,8) = 0,0202


*

2
= P(
p; 2

Decisin:
Con este valor del p-value, se rechaza la hiptesis nula de independencia, al 5%.
Conclusin:
El tipo de universidad de los estudiantes, est asociado al grupo socioeconmico
de estos (p = 0,0202).

Caso 12: IVE en Espaa


Se seleccionan 50 mujeres espaolas y 30 extranjeras residentes en Espaa, que se
realizaron una IVE 1 . A estas se les consult si ya se haban realizado una IVE
anterior.
El resultado es que, de las espaolas, 18 ya lo haban hecho anteriormente, mientras que
de las extranjeras, un total de 20.
12.1. Existe una diferencia en la realizacin de IVE anterior respecto de la
nacionalidad de las mujeres? Use un 10% de significacin.

Solucin:
12.1. Con los datos se construye la siguiente tabla:
IVE anterior
S
No
Total

Nacionalidad
Espaola
Extranjera
18
20
32
10
50
30

Total
38
42
80

Hiptesis:
H0: fo = fe
H1: fo fe
Estadstico de prueba:
Usando la forma abreviada del estadstico Chi-cuadrado de Pearson, se tiene:
2
obs
=

(18 10 20 32) 2 80 = 7,07.


38 42 50 30

Valor p:
P( 2 p; 1 > 7,07) = 0,0082 (segn tabla)
Como valor p < 0,10; se rechaza la hiptesis de homogeneidad al 10%. La diferencia es
relevante.
Haciendo un breve anlisis de % en cada columna, se tiene que el:
18
100 = 36,0%
50
De las mujeres espaolas se han hecho un IVE anterior, mientras que en las
extranjeras ese % llega al:
20
100 = 66,7%, sendo la diferencia, significativa, de acuerdo a test
30
realizado.
Conclusin:
La proporcin de mujeres que se realiza IVE es mayor en las mujeres extranjeras
residentes en Espaa que las espaolas (p = 0,0082).
1

IVE: Interrupcin Voluntaria del Embarazo.

Caso 13: Compra de caf


En un supermercado se observa a 46 personas que compran caf, de las cuales 27
llevan de la marca A, mientras que las restantes 19 llevan marca B.
13.1. Al 5%, constituye este dato un fundamento para afirmar que las
personas compran preferentemente el caf marca A?

Solucin:
13.1.
Las hiptesis son:
H0: las frecuencias observadas son iguales a las esperadas.
H1: las frecuencias observadas son distintas a las
esperadas.
En el marco del caso, la hiptesis nula afirma que la compra del caf es independiente de
la marca, que las personas compran por igual marca A o B y que las diferencias son
debidas al azar. La hiptesis alternativa afirma que hay diferencias en la marca que
compran.
La situacin se puede resumir como sigue:
Marca de caf

Frecuencia

A
27

Observada

Total
B
19

46

Clculo del valor de Chi-cuadrado.


Se calculan las frecuencias esperadas, bajo la hiptesis de que no hay diferencia por
marca de caf. Como se ve, si no hay diferencia, se espera que de las 46 personas, 23
compren caf A y 23 compren B.
Marca de caf

Frecuencia

A
27
23

Observada
Esperada

Total
B
19
23

Para la primera celda, el clculo es:


2
(27 23)
= 0,70
23
Para la segunda celda, el clculo es:
2
(19 23)
= 0,70
23
2

Por lo tanto, obs = 0,7 + 0,7 = 1,4


El valor p:
Grados de libertad: 2 celdas 1 = 1 gl.

46
46

* = 0,2367. Este resultado lleva a no rechazar la hiptesis nula.


Conclusin:
Con estos datos, no se puede afirmar que los compradores tienen preferencia por una
marca de caf.

Solucin con el test G:

Frecuencia
Observada
Esperada

Marca de caf
A
27
23

Total
B
19
23

46
46

Para la primera celda el valor es:


27
27 ln
= 4,33
23
Para la segunda celda el valor es:
19
19 ln
= 3,63
23
Estadstico de prueba G:
= 2 (4,33 3,63) = 1,4
G = 2obs

* = 0,2367
El resultado y conclusiones son equivalentes al de la prueba anterior.

Caso 14: Salud, ejercicio y sexo


Se investiga en una muestra aleatoria de personas algunas variables de sus hbitos
de vida, para lo cual se han recogido datos de las siguientes variables:
X1 = Estado general de salud (4 = muy bueno; 3 = bueno; 2 = regular; 1 = malo)
X 2 = Sexo (1 = femenino; 2 = masculino).
X 3 = Nivel de ejercicio diario (0 = Ninguno; 1 = Moderado y 2 = Intenso).
Con las tablas de contingencia correspondientes, fueron calculados los siguientes
estadsticos Chi-cuadrado para contrastes de asociacin:
2

14.1. ( X1 , X 2 ) = 8,2
, X 3 ) = 4,6

14.2. (

X
2

14.3. ( X , X ) = 6,2
1

Con esta informacin, analice y construya una conclusin al 5% para cada una de
las parejas de variables.

Solucin:
Calculando los valores p de cada estadstico, se tiene:
2

14.1. ( X1 , X 2 ) = 8,2
> 8,2) = 0,0421
Esta tabla tiene 3 grados de libertad. Entonces, * = P(
p; 3
2

Se rechaza H0, al 5%.


Conclusin: El estado general de salud est asociado al sexo (p = 0,0421).
( X 2 , X 3 ) = 4,6

14.2.
2

Esta tabla tiene 2 grados de libertad. Entonces, * = P(

> 4,6) = 0,1003

p; 2

No se rechaza H0, al 5%.


Conclusin: El nivel de ejercicio diario es independiente del sexo (p = 1003).
2

14.3. ( X1 , X 3 ) = 6,2
> 8,2) = 0,4012
Esta tabla tiene 6 grados de libertad. Entonces, * = P(
p; 3
2

No se rechaza H0, al 5%.


Conclusin: El estado general de salud es independiente del nivel de ejercicio
diario (p = 0,4012).

Tabla Chi-cuadrado
PROBABILIDAD p DE LA DISTRIBUCIN CHI CUADRADA A LA DERECHA DE i
2

p;

GRADOS DE LIBERTAD
1

2
p;

GRADOS DE LIBERTAD
1

2p;

GRADOS DE LIBERTAD
1

i2

2p;

GRADOS DE LIBERTAD
1

0,1

0,7518

0,9512

0,9918

3,1

0,0783

0,2122

0,3765

6,1

0,0135

0,0474

0,1068

9,1

0,0026

0,0106

0,0280

0,2

0,6547

0,9048

0,9776

3,2

0,0736

0,2019

0,3618

6,2

0,0128

0,0450

0,1023

9,2

0,0024

0,0101

0,0267

0,3

0,5839

0,8607

0,9600

3,3

0,0693

0,1920

0,3476

6,3

0,0121

0,0429

0,0979

9,3

0,0023

0,0096

0,0256

0,4

0,5271

0,8187

0,9402

3,4

0,0652

0,1827

0,3340

6,4

0,0114

0,0408

0,0937

9,4

0,0022

0,0091

0,0244

0,5

0,4795

0,7788

0,9189

3,5

0,0614

0,1738

0,3208

6,5

0,0108

0,0388

0,0897

9,5

0,0021

0,0087

0,0233

0,6

0,4386

0,7408

0,8964

3,6

0,0578

0,1653

0,3080

6,6

0,0102

0,0369

0,0858

9,6

0,0019

0,0082

0,0223

0,7

0,4028

0,7047

0,8732

3,7

0,0544

0,1572

0,2957

6,7

0,0096

0,0351

0,0821

9,7

0,0018

0,0078

0,0213

0,8

0,3711

0,6703

0,8495

3,8

0,0513

0,1496

0,2839

6,8

0,0091

0,0334

0,0786

9,8

0,0017

0,0074

0,0203

0,9

0,3428

0,6376

0,8254

3,9

0,0483

0,1423

0,2725

6,9

0,0086

0,0317

0,0752

9,9

0,0017

0,0071

0,0194

1,0

0,3173

0,6065

0,8013

4,0

0,0455

0,1353

0,2615

7,0

0,0082

0,0302

0,0719

10,0

0,0016

0,0067

0,0186

1,1

0,2943

0,5769

0,7771

4,1

0,0429

0,1287

0,2509

7,1

0,0077

0,0287

0,0688

10,1

0,0015

0,0064

0,0177

1,2

0,2733

0,5488

0,7530

4,2

0,0404

0,1225

0,2407

7,2

0,0073

0,0273

0,0658

10,2

0,0014

0,0061

0,0169

1,3

0,2542

0,5220

0,7291

4,3

0,0381

0,1165

0,2308

7,3

0,0069

0,0260

0,0629

10,3

0,0013

0,0058

0,0162

1,4

0,2367

0,4966

0,7055

4,4

0,0359

0,1108

0,2214

7,4

0,0065

0,0247

0,0602

10,4

0,0013

0,0055

0,0155

1,5

0,2207

0,4724

0,6823

4,5

0,0339

0,1054

0,2123

7,5

0,0062

0,0235

0,0576

10,5

0,0012

0,0052

0,0148

1,6

0,2059

0,4493

0,6594

4,6

0,0320

0,1003

0,2035

7,6

0,0058

0,0224

0,0550

10,6

0,0011

0,0050

0,0141

1,7

0,1923

0,4274

0,6369

4,7

0,0302

0,0954

0,1951

7,7

0,0055

0,0213

0,0526

10,7

0,0011

0,0047

0,0135

1,8

0,1797

0,4066

0,6149

4,8

0,0285

0,0907

0,1870

7,8

0,0052

0,0202

0,0503

10,8

0,0010

0,0045

0,0129

1,9

0,1681

0,3867

0,5934

4,9

0,0269

0,0863

0,1793

7,9

0,0049

0,0193

0,0481

10,9

0,0010

0,0043

0,0123

2,0

0,1573

0,3679

0,5724

5,0

0,0253

0,0821

0,1718

8,0

0,0047

0,0183

0,0460

11,0

0,0009

0,0041

0,0117

2,1

0,1473

0,3499

0,5519

5,1

0,0239

0,0781

0,1646

8,1

0,0044

0,0174

0,0440

11,1

0,0009

0,0039

0,0112

2,2

0,1380

0,3329

0,5319

5,2

0,0226

0,0743

0,1577

8,2

0,0042

0,0166

0,0421

11,2

0,0008

0,0037

0,0107

2,3

0,1294

0,3166

0,5125

5,3

0,0213

0,0707

0,1511

8,3

0,0040

0,0158

0,0402

11,3

0,0008

0,0035

0,0102

2,4

0,1213

0,3012

0,4936

5,4

0,0201

0,0672

0,1447

8,4

0,0038

0,0150

0,0384

11,4

0,0007

0,0033

0,0097

2,5

0,1138

0,2865

0,4753

5,5

0,0190

0,0639

0,1386

8,5

0,0036

0,0143

0,0367

11,5

0,0007

0,0032

0,0093

2,6

0,1069

0,2725

0,4575

5,6

0,0180

0,0608

0,1328

8,6

0,0034

0,0136

0,0351

11,6

0,0007

0,0030

0,0089

2,7

0,1003

0,2592

0,4402

5,7

0,0170

0,0578

0,1272

8,7

0,0032

0,0129

0,0336

11,7

0,0006

0,0029

0,0085

2,8

0,0943

0,2466

0,4235

5,8

0,0160

0,0550

0,1218

8,8

0,0030

0,0123

0,0321

11,8

0,0006

0,0027

0,0081

2,9

0,0886

0,2346

0,4073

5,9

0,0151

0,0523

0,1166

8,9

0,0029

0,0117

0,0307

11,9

0,0006

0,0026

0,0077

3,0

0,0833

0,2231

0,3916

6,0

0,0143

0,0498

0,1116

9,0

0,0027

0,0111

0,0293

12,0

0,0005

0,0025

0,0074

Elaborada con funcin DISTR.CHI(x;grados_de_libertad) de Excel. Gentileza PATOALKA. 2012. Derechos Reservados.

Distribucin Chi Cuadrado - Percentiles


Valores de

tales que la probabilidad sea menor o igual a la especificada (*).

i2

Grados de
libertad

0,005

0,01

0,025

0,05

0,10

0,15

0,20

0,30

0,40

0,50

0,60

0,70

0,80

0,85

0,90

0,925

0,95

0,975

0,99

0,995

1
2
3
4
5

0,00
0,01
0,07
0,21
0,41

0,00
0,02
0,11
0,30
0,55

0,00
0,05
0,22
0,48
0,83

0,00
0,10
0,35
0,71
1,15

0,02
0,21
0,58
1,06
1,61

0,04
0,33
0,80
1,37
1,99

0,06
0,45
1,01
1,65
2,34

0,15
0,71
1,42
2,19
3,00

0,27
1,02
1,87
2,75
3,66

0,45
1,39
2,37
3,36
4,35

0,71
1,83
2,95
4,04
5,13

1,07
2,41
3,66
4,88
6,06

1,64
3,22
4,64
5,99
7,29

2,07
3,79
5,32
6,74
8,12

2,71
4,61
6,25
7,78
9,24

3,17
5,18
6,90
8,50
10,01

3,84
5,99
7,81
9,49
11,07

5,02
7,38
9,35
11,14
12,83

6,63
9,21
11,34
13,28
15,09

7,88
10,60
12,84
14,86
16,75

6
7
8
9
10

0,68
0,99
1,34
1,73
2,16

0,87
1,24
1,65
2,09
2,56

1,24
1,69
2,18
2,70
3,25

1,64
2,17
2,73
3,33
3,94

2,20
2,83
3,49
4,17
4,87

2,66
3,36
4,08
4,82
5,57

3,07
3,82
4,59
5,38
6,18

3,83
4,67
5,53
6,39
7,27

4,57
5,49
6,42
7,36
8,30

5,35
6,35
7,34
8,34
9,34

6,21
7,28
8,35
9,41
10,47

7,23
8,38
9,52
10,66
11,78

8,56
9,80
11,03
12,24
13,44

9,45
10,75
12,03
13,29
14,53

10,64
12,02
13,36
14,68
15,99

11,47
12,88
14,27
15,63
16,97

12,59
14,07
15,51
16,92
18,31

14,45
16,01
17,53
19,02
20,48

16,81
18,48
20,09
21,67
23,21

18,55
20,28
21,95
23,59
25,19

11

2,60

3,05

3,82

4,57

5,58

6,34

6,99

8,15

9,24

10,34

11,53

12,90

14,63

15,77

17,28

18,29

19,68

21,92

24,73

12
13
14
15

3,07
3,57
4,07
4,60

3,57
4,11
4,66
5,23

4,40
5,01
5,63
6,26

5,23
5,89
6,57
7,26

6,30
7,04
7,79
8,55

7,11
7,90
8,70
9,50

7,81
8,63
9,47
10,31

9,03
9,93
10,82
11,72

10,18
11,13
12,08
13,03

11,34
12,34
13,34
14,34

12,58
13,64
14,69
15,73

14,01
15,12
16,22
17,32

15,81
16,98
18,15
19,31

16,99
18,20
19,41
20,60

18,55
19,81
21,06
22,31

19,60
20,90
22,18
23,45

21,03
22,36
23,68
25,00

23,34
24,74
26,12
27,49

26,22
27,69
29,14
30,58

26,76
28,30
29,82
31,32
32,80

16
17
18

5,14
5,70
6,26

5,81
6,41
7,01

6,91
7,56
8,23

7,96
8,67
9,39

9,31
10,09
10,86

10,31
11,12
11,95

11,15
12,00
12,86

12,62
13,53
14,44

13,98
14,94
15,89

15,34
16,34
17,34

16,78
17,82
18,87

18,42
19,51
20,60

20,47
21,61
22,76

21,79
22,98
24,16

23,54
24,77
25,99

24,72
25,97
27,22

26,30
27,59
28,87

28,85
30,19
31,53

32,00
33,41
34,81

19
20

6,84
7,43

7,63
8,26

8,91
9,59

10,12
10,85

11,65
12,44

12,77
13,60

13,72
14,58

15,35
16,27

16,85
17,81

18,34
19,34

19,91
20,95

21,69
22,77

23,90
25,04

25,33
26,50

27,20
28,41

28,46
29,69

30,14
31,41

32,85
34,17

36,19
37,57

21
22
23
24

8,03
8,64
9,26
9,89

8,90
9,54
10,20
10,86

10,28
10,98
11,69
12,40

11,59
12,34
13,09
13,85

13,24
14,04
14,85
15,66

14,44
15,28
16,12
16,97

15,44
16,31
17,19
18,06

17,18
18,10
19,02
19,94

18,77
19,73
20,69
21,65

20,34
21,34
22,34
23,34

21,99
23,03
24,07
25,11

23,86
24,94
26,02
27,10

26,17
27,30
28,43
29,55

27,66
28,82
29,98
31,13

29,62
30,81
32,01
33,20

30,92
32,14
33,36
34,57

32,67
33,92
35,17
36,42

35,48
36,78
38,08
39,36

38,93
40,29
41,64
42,98

25

10,52

11,52

13,12

14,61

16,47

17,82

18,94

20,87

22,62

24,34

26,14

28,17

30,68

32,28

34,38

35,78

37,65

40,65

44,31

41,40
42,80
44,18
45,56
46,93

30
35
40
45
50

13,79
17,19
20,71
24,31
27,99

14,95
18,51
22,16
25,90
29,71

16,79
20,57
24,43
28,37
32,36

18,49
22,47
26,51
30,61
34,76

20,60
24,80
29,05
33,35
37,69

22,11
26,46
30,86
35,29
39,75

23,36
27,84
32,34
36,88
41,45

25,51
30,18
34,87
39,58
44,31

27,44
32,28
37,13
42,00
46,86

29,34
34,34
39,34
44,34
49,33

31,32
36,47
41,62
46,76
51,89

33,53
38,86
44,16
49,45
54,72

36,25
41,78
47,27
52,73
58,16

37,99
43,64
49,24
54,81
60,35

40,26
46,06
51,81
57,51
63,17

41,76
47,66
53,50
59,29
65,03

43,77
49,80
55,76
61,66
67,50

46,98
53,20
59,34
65,41
71,42

50,89
57,34
63,69
69,96
76,15

53,67
60,27
66,77
73,17
79,49

60
70
80
90
100

35,53
43,28
51,17
59,20
67,33

37,48
45,44
53,54
61,75
70,06

40,48
48,76
57,15
65,65
74,22

43,19
51,74
60,39
69,13
77,93

46,46
55,33
64,28
73,29
82,36

48,76
57,84
66,99
76,20
85,44

50,64
59,90
69,21
78,56
87,95

53,81
63,35
72,92
82,51
92,13

56,62
66,40
76,19
85,99
95,81

59,33
69,33
79,33
89,33
99,33

62,13
72,36
82,57
92,76
102,95

65,23
75,69
86,12
96,52
106,91

68,97
79,71
90,41
101,1
111,67

71,34
82,26
93,11
103,90
114,66

74,40
85,53
96,58
107,6
118,50

76,41
87,68
98,86
109,97
121,02

79,08
90,53
101,9
113,2
124,34

83,30
95,02
106,6
118,1
129,56

88,38
100,4
112,3
124,1
135,81

91,95
104,2
116,3
128,3
140,17

Valores calculados usando la funcin PRUEBA.CHI.INV() de Excel.


Gentileza PATOALKA. 2012. Derechos Reservados.

34,27
35,72
37,16
38,58
40,00

Вам также может понравиться