Академический Документы
Профессиональный Документы
Культура Документы
Las distribucin Chi cuadrado, se derivan de la distribucin Normal y estn relacionadas con la
teora del muestreo pequeo n< 30.
Son muy importantes pues son la base de metodologas inferenciales, tales como Intervalos de
Confianza y Pruebas de Hiptesis.
En otros estudios se les define como la suma de diferencias cuadrticas relativas entre valores
experimentales (observados) y valores tericos (esperados).
La denominada Distribucin Chi Cuadrado (que usualmente se escribe y se lee como: Ji Cuadrado), es
una distribucin cuadrtica de la probabilidad que utiliza bsicamente variables aleatorias continuas. La
Distribucin Chi Cuadrado de la probabilidad se denota mediante la letra griega minscula ji elevada al
cuadrado (2), y consiste en establecer un espacio continuo delimitado por la suma de los cuadrados de n
variables aleatorias que son independientes entre s, espacio dentro del cual la variable X puede asumir
cualquiera de los infinitos valores que lo conforman, y por tanto para establecer el valor aproximado de una
variable X dentro de ese espacio se procede a incluir una estimacin de sus posibles lmites que estn dados
por los distintos Grados de Libertad que pueden existir entre las variables aleatorias analizadas que dan
origen al referido espacio. En otras palabras, la Distribucin Chi Cuadrado en un delimitado espacio
conjuga un determinado nmero de variables aleatorias independientes entre s, con unos valores de
probabilidad ubicados entre 1 y 0 que son atribuibles a esas variables, y con unos lmites de la probabilidad
para el verdadero valor de X delimitados por los Grados de Libertad atribuibles a las variables aleatorias
analizadas.
En otro ejemplo, si se afirma que en una sala hay un conjunto de 30 personas, conformado por 3 clases de
razas independientes entre s, pues algunas de esas personas son caucsicas, otras son negras y otras son
asiticas, entonces basta con saber que en la sala hay 12 personas caucsicas y 9 negras para poder calcular
exactamente que las restantes 9 personas son asiticas, es decir, en este caso hay 3 clases de datos
independientes entre s, pero para poder conocer cul es el valor de una clase particular de esos datos es
siempre necesario conocer previamente el valor de las otras 2 clases de datos; en otras palabras, si slo se
sabe que en la sala hay 12 personas caucsicas, ese dato resulta insuficiente para poder saber con exactitud
cuntas son negras y cuntas son asiticas dentro de las restantes 18 personas de la sala, y si slo se sabe
que en la sala 9 personas son asiticas, ese dato por s slo tambin resulta insuficiente para poder saber
cuntas son negras y cuntas son caucsicas dentro de las restantes 21 personas de la sala, motivo por el
cual se concluye que el Grado de Libertad o grado de independencia existente entre las tres clases de datos
tiene un valor de 2, pues nicamente conociendo el valor de 2 clases de datos se puede saber con exactitud
cmo estn distribuidas las tres clases de razas dentro de la poblacin total del conjunto analizado.
En realidad la distribucin ji-cuadrada es la distribucin muestral de s2. O sea que si se extraen todas las
muestras posibles de una poblacin normal y a cada muestra se le calcula su varianza, se obtendr la
distribucin muestral de varianzas.
Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el estadstico X2. Si se
elige una muestra de tamao n de una poblacin normal con varianza, el estadstico:
Tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1grados de libertad y se
denota X2 (X es la minscula de la letra griega ji). El estadstico ji-cuadrada est dado por:
La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n-3) = (gl-
2).
Distribucin
2 Chi-cuadrado
Para denotar el valor crtico de una distribucin X2 con gl grados de libertad se usa el smbolo
; este valor crtico determina a su derecha un rea de bajo la curva X2 y sobre el eje
horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en el lado izquierdo
y a lo largo del lado superior de la misma tabla.
Clculo de Probabilidad
El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para saber cmo se va a
comportar la varianza o desviacin estndar en una muestra que proviene de una distribucin normal.
Ejemplos:
1. Suponga que los tiempos requeridos por un cierto autobs para alcanzar uno de sus destinos en una
ciudad grande forman una distribucin normal con una desviacin estndar =1 minuto. Si se elige al
azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2.
Solucin:
2. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una poblacin normal
con varianza =6 , tenga una varianza muestral:
Solucin.
Al buscar este nmero en el rengln de 24 grados de libertad nos da un rea a la derecha de 0.05. Por lo
que la P(s2 >9.1) = 0.05
Aqu se tienen que buscar los dos valores en el rengln de 24 grados de libertad. Al buscar el valor de
13.846 se encuentra un rea a la derecha de 0.95. El valor de 42.98 da un rea a la derecha de 0.01.
Como se est pidiendo la probabilidad entre dos valores se resta el rea de 0.95 menos 0.01 quedando
0.94.
Por lo tanto la P(3.462 s2 10.745) = 0.94
Estimacin de la Varianza
Para poder estimar la varianza de una poblacin normal se utilizar la distribucin ji-cuadrada.
Los valores de X2 dependern de nivel de confianza que se quiera al cual le llamamos . Si nos
ubicamos en la grfica se tiene:
Ejemplos:
1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por
cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de
confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye
estacompaa, suponga una poblacin normal.
Solucin:
Se puede observar en la grfica anterior que el valor de X2 corre en forma normal, esto es de
izquierda a derecha. Por lo tanto, el intervalo de confianza de 95% para la varianza es:
Grficamente:
Se observa que la varianza corre en sentido contrario, pero esto es slo en la grfica. La
interpretacin quedara similar a nuestros temas anteriores referentes a estimacin. Con un nivel de
confianza del 95% se sabe que la varianza de la poblacin de los pesos de los paquetes de semillas
de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.
Solucin:
Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.
Se busca en la tabla los valores correspondientes con 5 grados de libertad, obtenindose dos
resultados. Para X2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07.
Entonces el intervalo de confianza est dado por: