Вы находитесь на странице: 1из 39

ESTADÍSTICA DESCRIPTIVA

Sesión 3:
DISTRIBUCIÓN CHI CUADRADO: PRUEBAS DE
INDEPENDENCIA Y HOMOGENEIDAD

Introducción
Pasos para probar una hipótesis estadística
Paso 1.- Planteamiento de hipótesis.
H0 : Hipótesis Nula: Es la afirmación sobre una o más
características de poblaciones que al inicio se supone cierta.
H1 : Hipótesis del Investigador: Es la afirmación contradictoria a H0,
y ésta es la hipótesis del investigador.

Paso 2.- Niveles de significación. (teórico)


El nivel de significación, o riesgo de cometer un error de tipo I,
es elegido de antemano por el investigador (= 0.1, = 0.05,
= 0.01).
Normalmente se acepta un riesgo del 5% (= 0.05), es decir, 5
veces de cada 100 se rechazará la hipótesis nula siendo
realmente cierta.
Pasos para probar una hipótesis estadística
Paso 3.- Estadístico de prueba.
En este caso se elige es estadístico de prueba (por
ejemplo: «Z» de la distribución normal ó una «T» de
student con su respectivos grados de libertad) para obtener
el valor de significación practico «P» mediante la tabla
correspondiente.
«P» Es el nivel de significación practico más pequeño que
conduce al rechazo de H0.
VALOR P

P>0.05 No significativo
P<0.05 Significativo
P<0.01 Muy significativo
P<0.001 Altamente significativo
Pasos para probar una hipótesis estadística
Paso 4.- Formular la regla de decisión
Si el p-valor <  Se rechaza H0
Si el p-valor ≥  No se rechaza H0

Paso 5.- Conclusión: Expresar la conclusión en términos del


problema de investigación.
En este caso se especifica la hipótesis estadística que no ha sido
rechazada indicando el nivel de significancia teórico considerado (α)
Asociación entre dos variables
I. VARIABLES CUALITATIVAS
Uso del Chi2: Pruebas de Independencia y
Homogeneidad

II. VARIABLES CUANTITATIVAS


• Análisis de Correlación Lineal Simple
• Análisis de Regresión Lineal Simple
Distribución Chi-cuadrada (2)
CARACTERÍSTICAS

1. Se lee con grados de libertad


g.l = (fila-1)(columna-1) n > 30
2. No tiene valores negativos (2). El valor mínimo es
CERO.

3. Todas las curvas son asimétricas

4. Cuando aumentan los grados de libertad las


curvas son menos elevadas y más extendidas a la
derecha.

5. Se utiliza para variables medidas en escala


nominal u ordinal.
1. Se lee con grados de libertad
g.l. = (fila-1)(columna-1)
Clase Desarrollo físico del niño

Social 1 2 3 4 5
1 2 14 28 40 18

2 1 21 25 25 9

3 1 12 12 12 2

4 6 17 34 33 6

g.l. = (fila-1)(columna-1)
= (4-1)(5-1) = (3)(4) = 12
CHI 2
Distribución Chi-cuadrada (2)
Fórmula de trabajo:

Ei= (Total de fila)(Total columna)


Gran total

Grados de libertad = (fila-1) (columna-1)

Mide el grado de concordancia entre los pares de


frecuencias observadas y esperadas de las celdas,
dado que la Ho sea verdadera
Hipertensión Arterial Total
. gl = 1 Si No
No Deportista 38 / 9/ 47
Deportista 31 / 22 / 53
Total 69 31 100

• Frecuencia Observada: Número de objetos o


individuos en la muestra que caen dentro de
cada categoría de la variable de interés.
• Frecuencia Esperada: Número de objetos o
individuos en la muestra que se espera observar
si la hipótesis nula respecto a la variable de
interés es verdadera.
Hipertensión Arterial Total
. gl = 1 Si No
No Deportista 38 / 32.43 9 / 14.57 47
Deportista 31 / 36.57 22 / 16.43 53
Total 69 31 100

Frecuencias Observadas (en la muestra)


Frecuencias Esperadas si Ho fuera verdadera

Cada Oi tiene
Ei= (Total de fila) (Total columna) una Ei
Gran total equivalente
Chi2 calculado X 2c
47 x69
E11   32.43
100
47 x31
E12   14.57 Hipertensión Total
100 Arterial

53x69 Si No
E21   36.57 No 38 9 47
100 Deportista
Deportista 31 22 53
53x31
E22   16.43 Total 69 31 100
100
 38  32.43  31  36.57   9  14.57   22  16.43
2 2 2 2

 
2
c   
32.43 36.57 14.57 16.43
 c2  5,8227
APLICACIONES DE
CHI2
1. PRUEBA DE
INDEPENDENCIA

2. PRUEBA DE
HOMOGENEIDAD
Prueba de independencia
•Conocer si dos criterios de clasificación son independientes
(no asociación o no relación) cuando se aplican al mismo
conjunto de datos.

•Se aplica cuando hay dos criterios de clasificación (dos


variables cualitativas) en una muestra de estudio

•Los totales marginales no están controlados por el investigador


(muestra aleatoria).
Hipertensión Total
Arterial
•Tipo de estudio Transversal. Si No
No 38 9 47
Deportista
Deportista 31 22 53
Total 69 31 100
Prueba de independencia
Ejemplo:Para estudiar la dependencia entre la
práctica de algún deporte y la hipertensión, se
seleccionó una muestra aleatoria simple de 100
personas, con los siguientes resultados:

Hipertensión Arterial Total


Si No
No 38 9 47
Deportista
Deportista 31 22 53
Total 69 31 100
Prueba de independencia
1. Verificar que sean variables cualitativas
2. Planteamiento de hipótesis
H0: La Hipertensión Arterial es independiente de la
práctica de algún deporte
H1: La Hipertensión Arterial está asociada a la práctica de
algún deporte
3. Determinación del nivel de significación
p< 0.05  para rechazar la H0

H0  No hay relación entre V1 y V2


H1  Hay relación entre V1 y V2
Prueba de independencia
4. Cálculo de frecuencias esperadas y 2:
47 x69
E11   32.43
100
47 x31
E12   14.57
100
53x69
E21   36.57
100
53x31
E22   16.43
100

5.  c2   38  32.43  31  36.57   9  14.57   22  16.43


2 2 2 2

  
32.43 36.57 14.57 16.43
X 2c  c2  5,8227
Prueba de independencia
6. Valor de p:
Consultando la tabla de 2 con g.l.=1 se observa:
2
X = 5.8227 Hipertensión Arterial Total

c Si No

p: ? No
Deportista
38 9 47

0.01<p<0.02 Deportista 31 22 53

Total 69 31 100

7. Decisión y conclusión:
Decisión: Siendo p < 0.05, se rechaza Ho.
Conclusión: La Hipertensión Arterial está
asociada con la práctica deportiva.
H1  Hay relación entre V1 y V2
PRACTICANDO LA TABLA
• El Dr. Bejarano está estudiando la relación
entre consumo de vitamina C y acción
antioxidante.
• Aplicando la prueba de X2 encontró un valor
de X2c = 7.36 con g.l=1:
• Indicar el valor p:
0.005<p<0.01

p< 0.05  Rechazo H0


1. PRUEBA DE
INDEPENDENCIA

2. PRUEBA DE
HOMOGENEIDAD
Prueba de homogeneidad
 Se aplica cuando se desea conocer si dos o más
muestras provienen de poblaciones
homogéneas con respecto a algún criterio de
clasificación (o la misma población).

 Tiene mayor posibilidad de uso cuando se


desarrollan estudios de tipo experimental.

 La hipótesis nula establece que las muestras se


extraen de la misma población.
Prueba de homogeneidad
Ejemplo:
Evaluar la presencia de hipertensión arterial en
pacientes provenientes de tres distritos de la ciudad
de Talara (Diciembre del 2006).

Hipertensión Distrito Total


Pariñas El Alto La Brea
Si 75 25 70 170
No 15 45 10 70
Total 90 70 80 240
Los 3 distritos son homogéneos respecto a la HTA?
Prueba de homogeneidad
1. Planteamiento de la hipótesis
• Ho: Las muestras provienen de
poblaciones homogéneas según la presencia
de hipertensión arterial.
• H1: Las muestras no provienen de
poblaciones homogéneas según la presencia
de hipertensión arterial.

2. Nivel de significación:
p < 0.05
Prueba de homogeneidad
3. Frecuencias esperadas y
4. cálculo de 2 :

170 x90 170 x70


E11   63.75 E12   49.58
240 240
170 x80 70 x90
E13   56.67 E21   26.25
240 240
70 x70 70 x80
E22   20.42 E23   23.34
240 240

 75  63.75   25  49.58  10  23.34 


2 2 2

 
2
c   ... 
63.75 49.58 23.34
 c2  59.34
Prueba de homogeneidad
5. Valor de p.
Consultando la tabla de 2 = 59.34
con g.l.= 2
se observa p = ? :
p < 0.005
6. Decisión y conclusión:
Decisión: Siendo p  0.05 H0  ?
se rechaza la hipótesis nula.
Conclusión: las muestras no provienen de
poblaciones homogéneas.
Es decir, la presencia de hipertensión arterial es
distinta en los tres distritos de la ciudad.
EJEMPLO 1
• En un estudio se estudia la relación entre
consumo de tabaco y cáncer pulmonar n=50

Cáncer Pulmonar TOTAL


Consumo SI NO
de SI 20 9 29
Tabaco
NO 10 21 16
TOTAL 30 20 50
¿Cuál caso es?

• Independencia
–1 muestra, 2 variables
Cáncer Pulmonar TOTAL

Consu SI NO
mo de

• Homogeneidad
Tabaco SI 20 9 29

NO 10 21 16

–2 muestras TOTAL 30 20 50
20 20 – 14.5
9 9 – 14.5 2929
Ei = ? 10 10 – 15.5
21 21 – 15.53131
30 30 30 30 6060

(20-14.5)2 / 14.5 +
(9- 14.5)2 / 14.5 +
(10- 15.5)2 / 15.5 +
H0 V1 y V2 no están
relacionadas (21- 15.5)2 / 15.5
al rechazarla X2c 
Si hay una relación entre el =8.074
consumo de tabaco y la
presencia de cáncer pulmonar.
g.l.= 1 p? H0?
p < 0.005  rechazo H0
EJEMPLO 2
• Evaluar si el estado nutricional y el
desempeño académico están asociados en los
niños de un colegio primaria.

Estado nutrición TOTAL


Desempeño Pobre Bueno
académico
Malo 105 15 120
satisfactorio 80 300 380
TOTAL 185 315 500
¿Cuál caso es?

• Independencia
–1 muestra, 2 variables
Estado TOTA
nutrición L
Desemp Pobre Bueno
eño
académi

• Homogeneidad co Malo 105 15 120

satisfact 80 300 380


–2 muestras TOTAL
orio

185 315 500


Prueba de independencia
1. Planteamiento de la hipótesis
• Ho: El desempeño académico es
independiente del estado nutricional.

• H1: El desempeño académico está


asociado al estado nutricional.

2. Nivel de significación:
p < 0.05
Prueba de independencia
3. Frecuencias esperadas
E1: 44.4 E2: 75.6
E3: 140.6 E4: 239.4

4. Cálculo de 2 :

172.75
Prueba de independencia
5. Valor de p.
Consultando la tabla de 2 = 172.75
con g.l.= 1
se observa p = ? :
p < 0.05
6. Decisión y conclusión:
Decisión: Siendo p  0.05 H0  ?
se rechaza la hipótesis nula.
Conclusión: El desempeño académico está asociado
al estado nutricional.
VARIABLE
EJEMPLO 3 CUALITATIVA?
• Evaluar el grado de consumo de fármacos en
4to y 5to año de un colegio secundaria

Consumo de fármacos TOTAL


Año Experimental Casual Moderado
4to 56 45 24 125
5to 46 22 33 101
TOTAL 102 67 57 226

INDEPENDENCIA? HOMOGENEIDAD?
Prueba de homogeneidad
1. Planteamiento de la hipótesis
• Ho: Las muestras provienen de
poblaciones homogéneas según el grado de
consumo de FÁRMACOS

• H1: Las muestras no provienen de


poblaciones homogéneas según el grado de
consumo de FARMACOS.

2. Nivel de significación:
p < 0.05
Prueba de homogeneidad
3. Frecuencias esperadas

4. cálculo de 2 :

E1: 56.4 E2: 37.1 E3: 31.5


E4: 45.6 E5: 29.9 E6: 25.5

7.8
Prueba de homogeneidad
5. Valor de p.
Consultando la tabla de 2 = 7.8
con g.l.= 2
se observa p = ? :
0.01 < p < 0.025
6. Decisión y conclusión:
Decisión: Siendo p  0.05 H0  ?
se rechaza la hipótesis nula.
Conclusión: las muestras no provienen de
poblaciones homogéneas con respecto al grado de
uso de fármacos.

Вам также может понравиться