Вы находитесь на странице: 1из 26

EPE

MA 148 ESTADÍSTICA INFERENCIAL

TEMA:

APLICACIONES DE LA CHI-CUADRADO
.
LOGRO DE APRENDIZAJE

LOGRO DE APRENDIZAJE DE LA UNIDAD:

Al finalizar la Unidad 2, el alumno obtiene


conclusiones relevantes sobre la distribución y
asociación de variables, aplicando pruebas de
bondad de ajuste y con tablas de contingencia a
un conjunto de datos.
LOGRO DE APRENDIZAJE

Al finalizar la sesión el alumno será capaz de :

• Determinar si dos variables categóricas están relacionadas.


• Verificar si una variable categórica se distribuye homogéneamente
en dos o más subpoblaciones.
• Diferenciar una prueba de independencia y prueba de
homogeneidad de subpoblaciones.
• Tomar decisiones en el ámbito de su especialidad usando la prueba
de Independencia de dos variables categóricas.
• Tomar decisiones en el ámbito de su especialidad usando la prueba
de homogeneidad de subpoblaciones.
TEMARIO DE LA SESIÓN

 Prueba de Independencia de variables


 Prueba de Homegeneidad de proporciones
MOTIVACIÓN

Si a un joven recién egresado le


ofrecieran un préstamo ¿Para qué
lo utilizaría?

Si a una persona de mayor edad le


ofrecieran un préstamo ¿Para qué
lo utilizaría?
MOTIVACIÓN

¿ESTÁN RELACIONADAS LAS VARIABLES?

EDAD DEL MOTIVO DEL


CLIENTE PRÉSTAMO
MOTIVACIÓN

• ¿Si una mujer tuviera acceso a un préstamo personal,


que le interesaría comprar?
• ¿Si un hombre tuviera acceso a un préstamo
personal, que le interesaría comprar?

¿Tendrán las mismas prioridades?


MOTIVACIÓN

Distribución del motivo del préstamo Distribución del motivo del préstamo de
de las mujeres los hombres

Homogénea (=)
o
No homogénea
(≠)

¿La distribución del motivo del préstamo es


diferente para el grupo de mujeres y hombres?
USOS DE LA DISTRIBUCION CHI CUADRADO

Las pruebas Chi-cuadrada permiten comparar las frecuencias


observadas (obtenidas de la muestra) con frecuencias esperadas
(valores teóricos) según un modelo supuesto.

Esta característica de la distribución Chi-cuadrado permite efectuar


las siguientes pruebas:
1. Prueba de independencia.
2. Prueba de homogeneidad de proporciones
(o de subpoblaciones).
3. Pruebas de bondad de ajuste a una distribución de
probabilidades.
PRUEBA DE INDEPENDENCIA

Esta prueba permite evaluar si dos variables categóricas


están relacionadas.
Por ejemplo, El director de mercadotecnia de un diario
de la capital se pregunta: ¿Existe relación entre el
sector de residencia del lector y la sección del periódico
que lee con prioridad?
PRUEBA DE INDEPENDENCIA

• Carácterísticas de esta prueba:

• Se consideran dos variables categóricas.


• Se elige una muestra de n elementos, donde cada uno de
ellos es clasificado según dos criterios diferentes.
• El interés es saber si los dos criterios de clasificación
están estadísticamente relacionados.
• Cada uno de los criterios tiene diferentes niveles,
digamos f niveles para el primer criterio y c niveles para el
segundo criterio.
PRUEBA DE INDEPENDENCIA

1. Hipótesis:
H0: Las variables son independientes (No están relacionadas)
H1: Las variables no son independientes (están relacionadas)
2. Nivel de significación: 
3.Estadística de prueba:
f c
(Oij  Eij ) 2
2  
i 1 j 1
Eij
 [(2 f 1)*(c 1)]

f  número de filas
c  número de columnas
PRUEBA DE INDEPENDENCIA

4. Región crítica:

Zona de
rechazo
1-α

5. Decisión:
Rechazar Ho si:
 2
cal  2
[1 ; ( f 1) ( c 1)]

6. Conclusión.
EJEMPLO 1

El jefe de una planta industrial desea determinar si


existe relación entre el rendimiento en el trabajo y
turno laboral del empleado. Se tomó una muestra
aleatoria de 382 empleados y se obtuvo las
frecuencias que se presentan en la siguiente tabla de
contingencia:
Rendimiento Turno laboral
en el trabajo Mañana Tarde Noche Total
Deficiente 21 58 27 106
Promedio 26 77 58 161
Muy bueno 7 47 61 115
Total 54 182 146 382

Con un nivel de significación de 0.01, ¿la calificación


del rendimiento del trabajador está asociada con el
turno en el que labora el empleado?
EJEMPLO 1

SOLUCION:
1.

H0: El rendimiento en el trabajo, es independiente del


turno laboral del trabajador.
No hay relación entre el rendimiento en el trabajo y
el turno laboral del trabajador.
H1: El rendimiento en el trabajo, no es independiente del
turno laboral del trabajador.
Hay relación entre el rendimiento en el trabajo y el
turno laboral del trabajador.
EJEMPLO 1

Valores observados:

Rendimiento en Turno laboral 2


𝜒𝑐𝑎𝑙 = 21.6911
el trabajo Mañana Tarde Noche Total
Deficiente 21 58 27 106 2
𝜒0.01,4 = 13.2767
Promedio 26 77 58 161
Muy bueno 7 47 61 115
2 2
Total 54 182 146 382 𝜒𝑐𝑎𝑙 > 𝜒0.01,4

Valores esperados: Entonces, se RHo


Rendimiento Turno laboral
en el trabajo Mañana Tarde Noche Total Conclusión:
Deficiente 14.9843 50.5026 40.5131 106
Promedio 22.7592 76.7068 61.5340 161 El rendimiento en el trabajo
Muy bueno 16.2565 54.7906 43.9529 115 no es independiente del
Total 54 182 146 382 turno laboral
PRUEBA DE HOMOGENEIDAD DE SUB
POBLACIONES

• Características

• Se desea verificar si la distribución de los sujetos de la


población (variable categórica) es la misma en todas las
k sub-poblaciones.
• Se tienen k muestras independientes tomadas de cada
una de las k poblaciones, el tamaño de las muestras no
son necesariamente iguales.
• La variable de interés tiene r niveles.
PRUEBA DE HOMOGENEIDAD DE SUB
POBLACIONES

¿La distribución de las personas que están a favor o


en contra del alcalde de Lima es la misma en los tres
distritos ?

La Molina La Victoria San Isidro

30000
20000 15000
25000
15000 20000 10000
10000 15000
10000 5000
5000
5000
0 0
0
A f avor En cont ra A f avor En cont ra A f avor En contr a
PRUEBA DE HOMOGENEIDAD DE SUB
POBLACIONES

Aceptación del
Variable categórica A favor
desempeño del
Alcalde En contra

Distritos Poblaciones

De cada distrito se selecciona una muestra

La Molina La Victoria San Isidro


PRUEBA DE HOMOGENEIDAD DE SUB
POBLACIONES

1. Planteamiento de hipótesis:
H0: La distribución de los sujetos de la población (variable categórica)
es homogénea en las k subpoblaciones.
H1: La distribución de los sujetos de la población (variable categórica)
NO es homogénea en las k subpoblaciones.
2. Nivel de significación
3. Estadística de prueba: r k (Oij  Eij ) 2
  
2
≈ 𝑿𝟐 [𝟏 −∝, 𝒓 − 𝟏 𝒌 − 𝟏 ]
i 1 j 1 Eij
4. Regiones críticas:
5. Decisión: se rechaza H0
6. Conclusión:
 cal   tab
2 2

20
EJEMPLO 2

El gerente de una empresa publicitaria desea evaluar la publicidad por


televisión de un nuevo producto. Los anuncios se exhibieron por separado a
grupos de consumidores en un auditorio; donde cada consumidor sólo mira
uno de los tres anuncios y después emite una opinión acerca del producto
que varía desde 1 (muy favorable) hasta 5 (muy desfavorable). Los resultados
se muestran en la siguiente tabla:

Opinión
Anuncio 1 2 3 4 5 Total
A 31 85 89 44 42 291
B 51 139 74 18 8 290
C 39 91 65 34 61 290
Total 121 315 228 96 111 871

¿Hay evidencias estadísticas para afirmar que la distribución de la opinión


emitida por los consumidores no es la misma para los distintos anuncios? Use
un nivel de significación del 3%
EJEMPLO 2

1. Hipótesis
Ho: La opinión emitida por los consumidores es similar para los tres
anuncios
H1: La opinión emitida por los consumidores no es similar para los
tres anuncios.
2. Nivel de significación: =0.03

3. Estadística de prueba:
r k (Oij  Eij ) 2
 2   ~ 𝑿𝟐 [𝟏 −∝, 𝒓 − 𝟏 𝒌 − 𝟏 ]
i 1 j 1 Eij
4. Región crítica y criterios de decisión:

Zona de
rechazo

5. Decisión: Chi calculado=75.3402 > Chi critico=17.0105


Se rechaza Ho.
6. Conclusión: Con un nivel de significación de 0.03 hay suficiente
evidencia estadística para RECHAZAR Ho, es decir que la opinión de los
consumidores no es similar para los tres anuncios.
Valores observados:
Opinión
Anuncio 1 2 3 4 5 Total
A 31 85 89 44 42 291
B 51 139 74 18 8 290
C 39 91 65 34 61 290
Total 121 315 228 96 111 871

Valores esperados :
Opinión
Anuncio 1 2 3 4 5 Total
A 40.4259 105.2411 76.1745 32.0735 37.0850 291
B 40.2870 104.8794 75.9127 31.9633 36.9575 290
C 40.2870 104.8794 75.9127 31.9633 36.9575 290
Total 121 315 228 96 111 871
EVALUACIÓN
La llegada al país de bancos con capitales sólidos ha originado una mayor competencia y por
ende una mayor oferta de servicios. En su afán por consolidar su participación en el
mercado, los bancos vienen ofertando novedosos tipos de ahorro y ofreciendo diferentes
tipos de créditos. Por lo tanto se ha realizado un estudio para analizar esta problemática.

EDAD DE LAS PERSONAS SUJETAS DE CRÉDITO

TIPO DE CRÉDITO Menos de 30 años Entre 30 y 40 años Más de 40 años

Hombre Mujer Hombre Mujer Hombre Mujer

Autos 20 10 15 10 40 30

Casa 5 12 8 15 25 15

Propósito General 25 5 20 25 30 15

Se realizó un muestreo estratificado según grupo de edad y se seleccionó una muestra de 77


personas con una edad “Menos de 30 años”, 93 personas con una edad entre 30 y 40 años,
y 155 personas mayores de 40 años. ¿Se puede afirmar que el tipo de crédito no se
distribuye de la misma manera en el tipo de edad de los clientes? Presente la tabla de
contingencia correspondiente y la hipótesis relevante en este estudio.
Continúa reforzando lo aprendido
Desarrollando los ejercicios propuestos
de la unidad en el Aula Virtual

Вам также может понравиться