Вы находитесь на странице: 1из 4

Prueba de independencia

Cuando la informacin se clasifica de acuerdo a dos o ms atributos, se puede utilizar la prueba de independencia para determinar si los principios o criterios empleados para la clasificacin cruzada son independientes o no; es decir, existe correlacin entre uno y otro criterio o no. La variable 1 tiene c niveles o clases y la variable 2 tiene r niveles, por lo tanto, el nmero de elementos de la muestra que cae dentro de categora se puede resumir en la siguiente forma:

Variable 2 1 2 ... r nj

Var1 2 ..... ... ... ... ... ...

c-1

Total nj n1 n2 ... nr n

N11 N12 N21 N22 ... nr1 n.1 ... nr2 n.2

n1c-1 n1c n2c-1 n2c ... n.c-1 ... n.c nrc-1 nrc

nij : es el nmero de observado de elementos de la muestra que cae en el i-simo nivel de clasificacin de la variable 2 y el j-simo nivel de clasificacin de la variable 1. Sea pij la probabilidad de que un elemento seleccionado al azar caiga en el i-simo nivel de clasificacin de la variable 2 y el j-simo de la variable 1. Si los dos mtodos de clasificacin son independientes o las variables son independientes, la probabilidad de que un elemento seleccionado al azar caiga en la clase ij es el producto de la probabilidad de que caiga en la clase i por la probabilidad de que caiga en la clase j. Entonces, suponiendo independencia de las dos variables:

La estadstica de trabajo es:

(3.16) Regla de decisin El valor de la tabla se halla en una distribucin chi-cuadrado con (r-1)(c-1) grados de libertad y una confiabilidad de (1- ). Como se puede observar en la figura 3.24. Si T < no se rechaza La hiptesis nula, en caso contrario se rechaza.

Figura 3.24 Regla de decisin: prueba de independencia Nota . La frecuencia esperada en cada celda debe ser mayor o igual a cinco (eij 5); si no se cumple sta condicin, se deben unir las clasificaciones adyacentes de menor frecuencia y volver a hacer la prueba. Si es una celda la que no cumple la condicin, se puede dejar as, ya que no afecta seriamente la prueba, salvo que eij <1. El supuesto de que cada eij 5 es muy importante en una tabla dos por dos ya que slo tiene 1 grado de libertad. Si no se cumple sta condicin se debe utilizar otro procedimiento. El supuesto de que cada eij 5 es muy importante en una tabla dos por dos ya que slo tiene 1 grado de libertad. Si no se cumple sta condicin se debe utilizar otro procedimiento.

Ejemplo
Con el propsito de saber si existe relacin entre el nmero de artculos defectuosos y el proceso manufacturero utilizado se toma una muestra aleatoria de los artculos producidos por cada proceso, obtenindose los siguientes resultados: PROCESO No DEFECTUOSO DEFECTUOSO TOTAL A B C TOTAL 94 90 85 269 6 10 12 28 100 100 97 297

Utilizando un nivel de confianza del 95 por ciento, qu conclusin puede obtener? Solucin H0 : No existe relacin o dependencia entre el proceso utilizado y el nmero de artculos defectuosos H1 : Existe relacin entre el proceso utilizado y el nmero de artculos defectuosos La estadstica de trabajo a utilizar es la expresin 3.16. Las frecuencias esperadas son:

La estadstica de trabajo es:

Con una confiabilidad del 95 por ciento, en la tabla de la distribucin chi-cuadrado con 2 grados de libertad (r=3, c=2, entonces: (r-1)(c-1)=2) se obtiene un valor de 5,.99, (figura 3.23), por lo tanto la estadstica de trabajo cae en la zona de no rechazo de la hiptesis nula, es decir no se rechaza que el proceso utilizado y el nmero de artculos defectuosos producidos son independientes.

Вам также может понравиться