Вы находитесь на странице: 1из 8

Prueba de Ji Cuadrado X

DATOS ENUMERATIVOS
Ing: Rosmery Mayta Huatuco 2010
OBJETIVOS: 1.- Enumerar las caractersticas de la distribucin ji cuadrada. 2.- Realizar una prueba de hiptesis comparando un conjunto observado de frecuencias y una distribucin esperada. 3.- Efectuar una prueba de hiptesis de normalidad aplicando la distribucin ji cuadrada. 4. Llevar a cabo una prueba de hiptesis para determinar si estn relacionados dos criterios de clasificacin.

DISTRIBUCION X2
La prueba X es una medida de compatibilidad entre una frecuencia observada (o) de un determinado evento o una de sus caracterstica y la frecuencia terica esperada (e), con base en una distribucin supuesta. Cada X depende del tamao de la muestra (n); para muestras pequeas (o pocos grado de libertad, g.l.) esta distribucin esta fuertemente sesgada en direccin positiva.

PROPIEDADES:
1.-Los valores de X son mayores o iguales que cero. 2.-La forma de una distribucin X depende del gl =n-1. en consecuencia hay una familia de distribucin X. 3.-El rea bajo una curva X y sobre el eje horizontal es uno. 4.- La distribucin X no son simtricas tienen colas estrechas que se extienden a la derecha; esto es, estn sesgadas hacia la derecha. 5.-El valor de X siempre es positivo. 6.-En Tanto que la muestra se incrementa en tamao, X tiende a aproximarse a la distribucin normal.

2-2

P r o b a b i l i d a d

CHI-SQUARE DISTRIBUTION CHICHI-SQUARE DISTRIBUTION


gl = 3 gl = 5 gl = 10

Prueba de bondad de ajuste: frecuencias esperadas iguales

2
Valores de chi - cuadrada

Sean fo y fe las frecuencias observada y esperada respectivas. Procedimiento para realizar la Prueba de Hipotesis 1.- Ho : No hay diferencia entre fo y fe Ha : Existe una diferencia entre fo y fe 2.- El nivel de significancia: 3.- Definir el estadstico : X2 : 4.- Establecer la regin de aceptacin y rechazo: El valor crtico es: X 2 (,K-1) Grados de Libertad: K-1 K= Numero de categoras

PROBLEMA
5.-Calculo del estadstico y tomar una decisin:
( f f )2 0 e x2 = fe

Si Xk pertenece a la regin critica entonces se rechaza la hiptesis nula de lo contrario se acepta

En el siguiente cuadro se encuentra los datos de ausentismo se recolectaron en una planta manufacturera. Con un nivel de significancia de 0.05, realizar una prueba para determinar si existe diferencia en el tasa de ausentismo por da de la semana. Da Frecuencia

Lunes Martes Mircoles Jueves Viernes

120 45 60 90 130

Solucin 1.- H0 :

No existe diferencia entre observadas y esperadas de ausentismo.

las

frecuencias

Ha: Existe una diferencia entre las frecuencias observadas y esperadas de ausentismo.

2.- Nivel de significancia: =0.05 3.- el estadistico es :X2 Calculo de frecuencias esperadas iguales: (120 + 45 + 60 + 90 + 130) / 5 = 89.

X2 k = 2/89

(120 89) 2/89 + (45-89) 2/89+. (130-89)

= 60.89 4.- Establecer la regla de decisin: G.L: k-1 =5-1=4

X2 0.05,4 =9.488 5) Como el X2 k es mayor que el terico entonces se rechaza la hiptesis nula y se acepta la alternativa. Si existe diferencia en la frecuencia observada y esperada del ausentismo

PROBLEMA 1 El director de seguridad de la empresa Honda , de Estados Unidos , tom muestras al azar el archivo de accidentes menores , y los clasific de acuerdo con el tiempo en que tuvo lugar cada uno . Utilizando la prueba de bondad de ajuste y el nivel de significancia de 0.01, Determine si los accidentes estn distribuidos uniformemente o no durante el da . De una breve explicacin acerca de la conclusin .
Hora 8 a 9 am. 9 a 10 am. 10 a 11 am. 11 a 12 pm. 1 a 2 pm. 2 a 3 pm. 3 a 4 pm. 4 a 5 pm. N de accidentes 6 6 20 8 7 8 19 6

Hora 8-9 9-10 10-11 11-12 1-2 2-3 3-4 4-5

N accid. ( fo) 6 6 20 8 7 8 19 6 = 80

Fe 10 10 10 10 10 10 10 10

( fo fe ) -4 -4 10 -2 -3 -2 9 4

( fo fe )2 16 16 100 4 9 4 81 16

( fo fe )2/fe 1.6 1.6 10 0.4 0.9 0.4 8.1 1.6 = 24.6

X2 0.01 , 7 = 18.475 4) gl = k 1 = 8 1 = 7 X2 0.01 , 7 = 18.475

Solucin : 1)

Planteamos la hiptesis nula y la hiptesis alternativa Ho : La cantidad de accidentes estn distribuidos uniformemente durante el da . Ha : La cantidad de accidentes no estn distribuidos uniformemente durante el da . 2) Nivel de Significancia : = 0.01 X2 = [ ( fo fe )2 / fe]
5) Como X2 k cae en la regin critica , rechazamos la Ho y aceptamos la Ha , esto quiere decir que los accidentes no estn distribuidos uniformemente durante el da .

3)

PRUEBA DE BONDAD DE AJUSTE FRECUENCIAS ESPERADAS DESIGUALES

Clculos
Estado Casado Viudo
Divorciado

El U.S. Bureau of the Census indica que 63.9% de la poblacin est casada, 7.7% es viuda, 6.9% divorciada (y no vuelta a casar) y 21.5% soltera (nunca casada). Una muestra de 500 adultos del rea de Filadelfia indica que 310 personas estaban casadas, 40 viudas, 30 divorciadas y 120 solteras. Para .05 de nivel de significancia Se puede concluir que el rea de Filadelfia es diferente al de Estados Unidos como un todo?

fe

(f0 fe)2 / fe

310 40 30 120 500

319.5 38.5 34.5 107.5

.2825 .0584 .5870 1.4535 2.3814

Soltero Total

PRUEBA DE BONDAD DE AJUSTE PARA PROBAR LA NORMALIDAD

Paso 1: H0 : El rea de Filadelfia es igual al de Estados Unidos en cuanto a su estado civil. Ha : El rea de Filadelfia es diferente al de Estados Unidos en cuanto a su estado civil. Paso 2: =0.05 Paso 3: X2 k = 2.38 24 x 2 > 7.815, gl = 3, x2 = 2.3824 Paso 4:. X2 0.05,3 =7.815 es mayor que el X2 k = 2.38 24 se acepta la hiptesis nula

Propsito: Probar si las frecuencias observadas en una distribucin de frecuencias se ajusta a la distribucin normal terica. Procedimiento:
Determinar la media y la desviacin estndar de la distribucin de frecuencias. Calcular el valor z para el lmite inferior y superior de cada clase. Determinar la Fe para cada categora Usar la prueba de bondad de ajuste X2 y luego seguir el mismo procedimiento para la prueba de hipotesis.

PRUEBA DE BONDAD DE AJUSTE PARA PROBAR LA NORMALIDAD

Nota: Los grados de libertad de X2 esta dado por: K-m-1 K: Es el nmero de categoras m: Es el nmero de parmetros calculados

La estacin radiodifusora de FM, cuyo distintivo es ALFA, cree que la edad de sus radioescuchas siguen una distribucin probabilstica normal para confirmar esto se tomo una muestra de 50 oyentes y los resultados fueron ordenados en la siguiente tabla de distribucin de frecuencias. Tiene una media =44.8 y una = 9.36 Al nivel de significancia del 10% Se puede concluir razonablemente que distribucin de las edades se aproximan a una de tipo normal?
Edad 20 hasta 30 30 hasta 40 40 hasta 50 50 hasta 60 60 hasta 70 Frecuencia 1 15 22 8 4

Solucin Calculamos valores de Z : los Z30 = Z40 = Z50 = Z60 =


X

= 30 44.8
9.36

= -1.58

EDAD

Fo

Valor de Z

area

Fe

40 44.8 9.36

= -0.51
De menos a 40 16 MENOS a -0.51 0.3059 15.295

50 44.8 9.36
60 44.8 9.36

=0.55
40 50 22 -0.51 a 0.55 0.4029 20.145

=1.62
50 A mas 12 0.55 a MAS 0.2912 14.56

Luego procedemos a calcular las reas que vienen a ser las probabilidades , se reducen a tres categoras, porque las frecuencias esperadas deben ser mayor que cinco , se suman las reas y luego se determinan las frecuencias esperadas.

Ho : Las edades se distribuyen en forma normal ( Fo Fe)2 Ha : Las edades no estn distribuidas en Fe forma normal 2.- = 0.10 3.- El estadistico es X 2
1)

PROBLEMA NORMALIDAD
Una muestra de 500 donativos a la Fundacion de artritis se presenta con la siguiente distribucin de frecuencias. Es razonable concluir que se tiene una distribucin normal con media de $10 y desviacin estndar de $2? Use .05 de nivel de fsignificancia. e Nota: Para calcular para la primera clase, primero se calcula la probabilidad de esta clase. fe P(X<6) = P [Z<(6-10)/2]=.0228. As, es (.0228)(500)=11..4

4.- Xk2 =
gl: k-1 gl : 3-1 = 2 cuadrado ) X2
0.1,2

= 4.60 ( de la tabla de ji

5.- Como Xk2 = 0.6534 es menor que X2 = 4 60 pertenece a la regin de

SOLUCION
cantidad gastada

PROCEDIMIENTO
rea

f0

fe

(f0 fe)2 / fe

Paso 1:

<$6 $6-8 $8-10 $10-12 $12-14 >$14


Total

20 60 140 120 90 70
500

.02 .14 .34 .34 .14 .02

11.40 67.95 170.65 170.65 67.95 11.40


500

6.49 .93 5.50 15.03 7.16 301.22


336.33

Paso 2: =0 .05 Paso 3.

H0 : La donativos sigue una distribucin normal. Ha : La donativos no sigue una distribucin normal.

Paso 4: X2 k = 336.33
X2 = 11.05 , gl. K-1= 5

Paso 4:. X2 k = 336.33 se rechaza la H0 se acepta la hiptesis alternativa. Los donativos no siguen una distribucin normal.

ANALISIS DE CONTINGENCIA
Se usa para probar si dos caractersticas o variables estn relacionadas. La prueba de X2 tambin puede aplicarse para un proyecto de investigacin relacionado con dos caractersticas. En este caso el valor de fe se calcula mediante la siguiente frmula: fe = (total por regln)(total por columna) Gran total y los grados de libertad se hallan por la siguiente frmula: gl = (#reglones - 1)(#columnas - 1) .

Problema
Se pidi a una muestra de empleados en una gran planta industrial qumica que indicara su preferencia por uno de tres planes de pensin o retiro. Los resultados se presentan en la tabla que sigue. Parece haber alguna relacin entre el plan de pensin seleccionados y la clasificacin del trabajo de los empleados? Utilice el nivel de significancia de 0.01.

Seguimos el siguiente procedimiento: 1.- Ho: No existe relacin entre el plan de seleccionado y la clasificacin del trabajo empleados

pensin de los

Ha: Existe relacin entre el plan de pensin seleccionado y la clasificacin del trabajo de los empleados 2.- = 0.01 3.- X2 4.- g.l = (renglones - 1)*(columnas -1) = (3 - 1)(3 - 1) = 4 X2t (0.01, 4) = 13.277

5.-

El valor de X2k cae en la regin de rechazo entonces se rechaza la Ho, esto quiere decir que existe relacin entre el plan de pensin seleccionado y la clasificacin del trabajo de los empleados Salida en Minitab:

Chi-Square Test: Plan A, Plan B, Plan C Expected counts are printed below observed counts Plan A Plan B Plan C Total 1 10 16 29 55 18.17 25.27 11.56 2 19 80 19 118 38.98 54.22 24.80 3 81 57 22 160 52.85 73.51 33.63 Total 110 153 70 333 Chi-Sq = 3.672+ 3.401+ 26.303 +10.240 +12.262+1.358+14.990+3.709+ 4.024 = 79.960 DF = 4, P-Value = 0.000

Problema
Doscientos hombres de diversos niveles gerenciales, seleccionados al azar, fueron entrevistados con respecto a su inters o preocupacin acerca de asuntos ambientales. La respuesta de cada persona se registr en una de tres categoras: inters nulo, algo de inters y gran preocupacin. Los resultados fueron:

Utilice el nivel de significancia de 0.01 para determinar si existe o no relacin entre el nivel directivo o gerencial y el inters en asuntos ambientales. Solucin: Seguimos el siguiente procedimiento: 1.- Ho: No existe relacin entre el nivel directivo o gerencial y el inters en asuntos ambientales. Ha: Existe relacin entre el nivel directivo o gerencial y el inters en asuntos ambientales.

2.- = 0.01 3.- X2 4 .gl = (renglones - 1)*(columnas -1) = (4 1)*(3 - 1) = 6 X2t (0.01, 6) = 16.812 Si el X2k > 16.812 se rechaza la H0

5.- Clculos

El valor de X2k cae en la regin de aceptacin entonces se acepta la Ho, esto quiere decir que no existe relacin entre el nivel directivo o gerencial y el inters en asuntos ambientales.

Salida en Minitab: Chi-Square Test: sin inters, algo, gran preocupacin Expected counts are printed below observed counts sin inte algo gran pre Total 1 15 13 12 40 14.00 12.00 14.00 2 20 19 21 60 21.00 18.00 21.00 3 7 7 6 20 7.00 6.00 7.00 4 28 21 31 80 28.00 24.00 28.00 Total 70 60 70 200 Chi-Sq = 0.071 + 0.083 + 0.286 + 0.048 + 0.056 + 0.000 +0.000 + 0.167 + 0.143 + 0.000 + 0.375 + 0.321 = 1.550 DF = 6, P-Value = 0.956

PROBLEMA PROPUESTO
Sexo
T r a b a jo

H ogar 20 30 50

O tr o 10 10 20

T o ta l 90 60 150

Existe una relacin entre el lugar de un accidente y el sexo de la persona accidentada? Una muestra de 150 accidentes presentada a la polica estaba clasificada por tipo y sexo. Con =0.05 de nivel de significancia, Se puede concluir que el sexo y el lugar del accidente estn relacionados?

H o m b re

60 20 80

M u je r T o ta l

Nota: La frecuencia esperada para la interseccin hombre-trabajo se calcula como (90)(80)/150 = 48. De manera similar, se pueden calcular las frecuencias esperadas para las otras celdas.

LIMITACIONES DE X :
Si hay un nmero pequeo de frecuencias esperadas puede llevar a conclusiones errneas. Como la fe est en el denominador y la divisin entre un nmero pequeo produce un cociente demasiado grande. Las frecuencias esperadas deben ser cinco o ms. Para ms de dos celdas la X no debe aplicarse, si ms del 20% de las celdas fe tienen frecuencias menos de cinco.

Para resolver este problema se debe unir categorias

Вам также может понравиться