Академический Документы
Профессиональный Документы
Культура Документы
Diremos que una distribucin de probabilidad sigue una distribucin normal de media x y
desviacin tpica , y lo representaremos por N(x; ) cuando la representacin grfica de su
funcin de densidad es una curva positiva continua, simtrica respecto a la media, de
mximo en la media, y que tiene 2 puntos de inflexin, situados a ambos lados de la media
(x y x + respectivamente) y a distancia de ella, es decir de la forma:
2 2
Su importancia se debe fundamentalmente a la frecuencia con la que distintas variables
asociadas a fenmenos naturales y cotidianos siguen, aproximadamente, esta distribucin.
Dependiendo de los valores que tomen x y , la grfica de esta funcin puede ser ms o
menos alargada, achatada, etc., pero en cualquier caso siempre tiene las mismas
condiciones de simetra, continuidad, etc., reseadas anteriormente. En el caso de la
distribucin normal de parmetros x y , la funcin de densidad viene dada por:
(x x )2
1
2 2
f ( x) =
e
2 2
El rea encerrada bajo la curva normal N(x; ) siempre es 1.
Tiene una nica moda, que coincide con su media y su mediana.
La distancia entre la lnea trazada en la media y el punto de inflexin de la curva es
igual a una desviacin tpica (). Cuanto mayor sea , ms aplanada ser la curva de la
densidad.
El rea bajo la curva comprendida entre los valores situados aproximadamente a dos
desviaciones estndar de la media es igual a 0.95. En concreto, existe un 95% de
posibilidades de observar un valor comprendido en el intervalo ( 1.96 , + 1.96 ) .
De entre todas las curvas normales N(x; ), la ms sencilla, usada y conocida es aquella
que tiene por media 0 y por desviacin tpica 1, N(0, 1). Esta normal estndar se suele
representar por Z. La grfica de esta curva se denomina campana de Gauss y se puede
observar en la figura:
X x
=
2
2
2
n
;2 =
Si estandarizamos:
x x
~ N (0,1)
n
En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se
encontrar la media poblacional si slo se conoce una media muestral ( ), con una
confianza determinada. . Habitualmente se manejan valores de confianza del 95% y 99%.
Apuntes de Estadstica Aplicada Ing. Eder Vicua, FQIQ UNMSM - 2009
s es la desviacin tpica de una muestra. Estos vienen a ser los lmites de confianza para .
Distribucin t de Student
La distribucin-t o distribucin t de Student es una distribucin de probabilidad que surge
del problema de estimar la media de una poblacin normalmente distribuida cuando el
tamao de la muestra es pequeo. Esta es la base del popular test de la t de Student para la
determinacin de las diferencias entre dos medias muestrales y para la construccin del
intervalo de confianza para la diferencia entre las medias de dos poblaciones.
La distribucin t surge, en la mayora de los estudios estadsticos prcticos, cuando la
desviacin tpica de una poblacin se desconoce y debe ser estimada a partir de los datos
de una muestra.
Aparicin y especificaciones de la distribucin t de Student
Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas
normalmente, con media y varianza 2. Sea
X n = ( X 1 + ... + X n ) / n
la media muestral y
s 2 ( x) =
1 n
( x i x )2
n 1 i =1
Z=
Xn
/ n
Xn
Sn / n
f (t ) =
[( + 1) / 2]
( / 2)
(1 + t
( +1) / 2
( z ) = t z 1e t dt
0
s
s
< < x + t / 2
n
n
(
(
)
)
t =
= 2 1
= x 2 x1
1
1
S 2 +
n1 n 2
con
= n1 + n2 2
S2 =
1 s12 + 2 s 22
1 + 2
1 1
1 1
P ( x1 x2 ) t( ; 1 / 2 ) S 2 + = 1 2 (x1 x2 ) + t( ; 1 / 2 ) S 2 + = 1
n1 n2
n1 n2
Apuntes de Estadstica Aplicada Ing. Eder Vicua, FQIQ UNMSM - 2009
2
tiene una distribucin muestral que es una distribucin ji-cuadrado con grados de libertad
= n - 1 y se denota 2 ( es la minscula de la letra griega ji). El estadstico ji-cuadrado
est dado por:
(n 1) s 2
2 =
2
2
=
2
f ( x ) =
(1 / 2)
( 2)
1 x
2
2
La tabla que se utilizar para estos apuntes es la del libro de probabilidad y estadstica de
Walpole, la cual da valores crticos 2 (gl) para veinte valores especiales de . Para
denotar el valor crtico de una distribucin 2 con gl grados de libertad se usa el smbolo
2 (gl); este valor crtico determina a su derecha un rea de bajo la curva 2 y sobre el
eje horizontal. Por ejemplo para encontrar 20.05 (6) en la tabla se localiza 6 gl en el lado
izquierdo y = 0.05 a o largo del lado superior de la misma tabla.
Clculo de Probabilidad
El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para saber
como se va a comportar la varianza o desviacin estndar en una muestra que proviene de
una distribucin normal.
Ejemplos:
1. Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus
destinos en una ciudad grande forman una distribucin normal con una desviacin estndar
= 1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de
que la varianza muestral sea mayor que 2.
Primero se encontrar el valor de ji-cuadrada correspondiente a s2=2 como sigue:
2 =
(n 1) s 2
(17 1)(2)
(1) 2
2 =
2 =
(n 1)s 2
(n 1) s 2
2
2 =
Aqu se tienen que buscar los dos valores en el rengln de 24 grados de libertad. Al buscar
el valor de 13.846 se encuentra un rea a la derecha de 0.95. El valor de 42.98 da un rea a
la derecha de 0.01. Como se est pidiendo la probabilidad entre dos valores se resta el rea
de 0.95 menos 0.01 quedando 0.94.
Por lo tanto la P(3.462 s2 10.745) = 0.94
Estimacin de la Varianza
Para poder estimar la varianza de una poblacin normal se utilizar la distribucin jicuadrada.
(n 1)s 2
2 =
2
2 =
(n 1)s 2
2
<
<
2
2
/ 2
1 / 2
Ejemplos:
1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto
distribuidas por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46.
Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de
semillas de pasto que distribuye esta compaa, suponga una poblacin normal.
Primero se calcula la desviacin estndar de la muestra:
Se puede observar en la grfica anterior que el valor de 2 corre en forma normal, esto es
de izquierda a derecha.
Por lo tanto, el intervalo de confianza de 95% para la varianza es:
2
max
=
2
min
=
Grficamente:
Se observa que la varianza corre en sentido contrario, pero esto es slo en la grfica. La
interpretacin quedara similar a nuestros temas anteriores referentes a estimacin. Con un
nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los
paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.
2. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la
variabilidad de los resultados que producen muestras estndar. En un estudio de la cantidad
de calcio en el agua potable, el cual se efecta como parte del control de calidad, se analiz
seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados
en partes por milln fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los
resultados de la poblacin para este estndar, usando un nivel de confianza del 90%.
Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.
Se busca en la tabla los valores correspondientes con 5 grados de libertad, obtenindose
dos resultados. Para 2(0.95,5)= 1.145 y para 2(0.0,5)= 11.07.
Entonces el intervalo de confianza esta dado por:
2
max
=
11.07
10
Teorema. Si U y W son dos variables aleatorias independientes, cada una con distribucin
Chi Cuadrado con 1 y 2 grados de libertad, respectivamente, entonces la distribucin de
la siguiente variable aleatoria
U / 1
F=
W / 2
est dada por:
1 + 2
1
. ( 1 + 2 )
2 21 1
1 f 2 1 1 + 1 f 2
,
f>0
g( f ) =
1 2 2
2 2
y se denomina "distribucin F con 1 y 2 grados de libertad" (1 grados de libertad en el
numerador y 2 grados de libertad en el denominador).
Notacin. Usaremos la notacin F 1 , 2 P para denotar el valor de la distribucin F con 1
grados de libertad en el numerador, 2 grados de libertad en el denominador y una
probabilidad acumulada de P hacia la derecha (o una probabilidad de 1 - P hacia la
1
izquierda). Puede demostrarse que F 1 , 2 P =
, si se invierte la definicin de la
F 1 , 2 1 P
distribucin F.
La aplicacin principal para la cual se desarroll la distribucin F es la comparacin de dos
varianzas (de poblaciones normales).
Sea X 11 , X 12 ,..., X 1n 1 una muestra aleatoria (n1) tomada de una poblacin normal con
varianza 12 , y sea X 21 , X 22 ,..., X 2 n 2 otra muestra aleatoria (n2) tomada de una poblacin
normal con varianza 22 . Si queremos realizar alguna inferencia sobre la igualdad o no de
las varianzas, nos podemos basar en el hecho que las siguientes relaciones
12 =
(n1 1)s12
12
y 22 =
(n2 1)s 22
22
son variables aleatorias con distribuciones Chi cuadrado con 1 y 2 grados de libertad,
respectivamente, y con las cuales podemos construir la distribucin F. El siguiente teorema
Teorema. Si s12 y s22 son las varianzas muestrales de dos variables aleatorias
independientes de tamaos n1 y n2 tomadas de poblaciones normales con varianzas y,
entonces, la relacin
s12 / 12 s12 22
F= 2 2 = 2 2
s2 / 2 s2 1
tiene una distribucin F con n1 -1 y n2 -1 grados de libertad.
Apuntes de Estadstica Aplicada Ing. Eder Vicua, FQIQ UNMSM - 2009
11
12
13
14