Вы находитесь на странице: 1из 20

El estadstico Chi-

cuadrado y contrastes
asociados

Alumno: Jose Dario Millan Aranibar


Qu vamos hacer ahora?

Hay variables {- Muy relacionadas


- Muy poco relacionadas

Veamos un estadstico para ver si dos variables estn


o no asociadas


El estadstico Chi-cuadrado
El estadstico Chi-cuadrado

Las hiptesis son:

H0: Las variables en filas y columnas no estn asociadas


H1: Las variables en filas y columnas estn asociadas

Necesitamos frecuencias esperadas

f i. f. j
ei , j
n
EJEMPLO (supervivencia en el Titanic)

Sobrevive No sobrevive Total


Primera clase 194 128 322
Segunda clase 119 161 280
Tercera clase 138 573 711
Total 451 862 1313

Frecuencias esperadas
f1. f.1 322 x 451
e11 110,6
n 1313
f 2. f.1 280 x 451
e21 96,2
n 1313
Frecuencias esperadas
Sobrevive No sobrevive Total
Primera clase 110,6 211,4 322
Segunda clase 96,2 183,8 280
Tercera clase 244,2 466,8 711
Total 451 862 1313

Calculemos Chi-cuadrado

( f ij eij ) 2

2
exp
i j eij


Ya vuelven los matemticos a complicar las cosas
Traduccin

Tenemos dos tablas (sin totales):


Frecuencias absolutas Frecuencias esperadas
Sobrevive No sobrevive Sobrevive No sobrevive
Primera clase 194 128 Primera clase 110,6 211,4
Segunda clase 119 161 Segunda clase 96,2 183,8
Tercera clase 138 573 Tercera clase 244,2 466,8

1) Hagamos otra tabla, donde restamos a la primera la


segunda
Sobrevive No sobrevive
Primera clase (194-110,6) (128-211,4)
Segunda clase (119-96,2) (161-183,8)
Tercera clase (138-244,2) (573-466,8)
2) Este valor elevado al cuadrado

Sobrevive No sobrevive
Primera clase (194-110,6)^2 (128-211,4)^2
Segunda clase (119-96,2)^2 (161-183,8)^2
Tercera clase (138-244,2)^2 (573-466,8)^2

3) Dividido por el valor que tengamos en la segunda tabla


Sobrevive No sobrevive
Primera clase (194-110,6)^2/110,6 (128-211,4)^2/211,4
Segunda clase (119-96,2)^2/96,2 (161-183,8)^2/183,8
Tercera clase (138-244,2)^2/244,2 (573-466,8)^2/466,8
Obtenemos la siguiente tabla en nuestro ejemplo
Sobrevive No sobrevive

Primera clase
(194 110 ,6) 2 (128 211,4) 2
62 ,9 32 ,9
110 ,6 211,4
Segunda clase (119 96,2) 2
5,4
(181 183 ,8) 2
2,8
96,2 183 ,8
(138 244 ,2) 2 (573 466 ,8) 2
Tercera clase 46,2 24 ,2
244 ,2 466 ,8

( f ij eij ) 2
exp
2
62,9 32,9 5,4 2,8 46,2 24,2 174,4
i j eij
Probabilidad de un valor superior
- Alfa ()
Grados libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
Tenemos: exp
2
174,4

Ahora calculemos el valor de la tabla Chi-cuadrado

1) grados de libertad, son:


K = (nmero de fila-1)x(nmero de columnas-1)
= (3-1)x(2-1) = 2
2) El valor alfa (0,05 si no se dice).
3) El valor que buscamos
2
g .l .; 2
2;0, 05 5,99
SIGNIFICADO: La probabilidad de obtener
un valor mayor que 5,99 es 0,05
Tenemos: exp
2
174,4
g2.l .; 22;0,05 5,99

Por tanto:
exp
2
22;0,05


SIGNIFICADO: Las variables no son
independientes


SIGNIFICADO en el ejemplo: El salvamento de los viajeros
en el Titanic no fue independiente de su clase social.
Hemos hecho un contraste de hiptesis

Los pasos en un contraste son:

1) Fijar las hiptesis que se quieren contrastar: H0 H1


2) Fijar el nivel de significacin:
3) Elegir un estadstico de contraste:
( f ij eij ) 2
exp
2
k2( filas1) x ( columnas1);
i j eij
4) Se toma la decisin de rechazar o no la hiptesis:
exp k ; Aceptar H 0 Independientes
2 2

exp
2
k2; Rechazar H 0 Dependientes
Contraste de homogeneidad

1) Fijar las hiptesis que se quieren contrastar:

H0 Las subpoblaciones tienen idntica


distribucin para la variable Y.

H1 la distribucin de la variable Y en alguna


de estas subpoblaciones es diferente

2) Fijar el nivel de significacin:


3) Elegir un estadstico de contraste:
( f ij eij ) 2
exp
2
k2( filas1) x ( columnas1);
i j eij

4) Se toma la decisin de rechazar o no la hiptesis:

2
exp 2
k ; Aceptar H0

exp
2
k2; Rechazar H0
EJEMPLO
Se desea saber si la distribucin de los grupos
sanguneos es similar en los individuos de dos
poblaciones. Para ello se elige una muestra aleatoria
de cada una de ellas, obtenindose los siguientes
datos Qu decisin se debe tomar?

A B AB 0 Total
Muestra 1 90 80 110 20 300
Muestra 2 200 180 240 30 650
Total 290 260 350 50 950
f i. f. j
Calculamos las frecuencias esperadas: ei , j
n
A B AB 0
Muestra 1 91.5789 82.105 110.53 15.789
Muestra 2 198.421 177.89 239.47 34.211

Componentes de la Chi-cuadrado
(90 91,5789) 2
0,0272
91,5789
Estadstico de contraste:
( f ij eij ) 2
exp
2
0,0272 ... 1,76
i j eij
Calculemos el valor k2( filas1) x(columnas1);

Los grados de libertad:

k ( filas 1) x(columnas 1) ( 2 1) x( 4 1) 3
Entonces:

2
k ( filas1) x ( columnas1); 2
3;0, 05 7,81
La decisin de rechazar o no la hiptesis:

2
exp 2
k ; Aceptar H0
Cuando podemos aplicar el
estadstico Chi-cuadrado?

1) Siempre hacemos un contraste unilateral.

2) No debe usarse si hay frecuencias esperadas


inferiores a 1.

3) Como mximo el 20% de las frecuencias esperadas


pueden ser menores que el valor 5.
RESUMEN

- El estadstico Chi-cuadrado
- Fijar hiptesis
- Fijar nivel de significacin
- Grados de libertad
- Valores del estadstico
- Contraste de independencia
- Contraste de homogeneidad
- Condiciones de aplicar el Chi-cuadrado
GRACIAS POR
LA ATENCIN

Вам также может понравиться