Вы находитесь на странице: 1из 32

5 Distribuciones Muestrales

1. Introduccin

Al definir la estadstica se explic que la probabilidad se trabaja desde la poblacin hacia la muestra, mientras
que la inferencia estadstica se trabaja en sentido contrario, es decir, de la muestra hacia la poblacin. Por lo
tanto, para comenzar con la inferencia, necesitamos hacer un breve recuento del concepto de poblacin y
definir con claridad el concepto de muestra aleatoria.

Una poblacin representa el estado de la naturaleza o la forma de las cosas con respecto a un fenmeno
aleatorio, el cual puede identificarse a travs de una caracterstica medible. Por ejemplo, el nivel de colesterol
en la sangre de una persona. Como la inferencia estadstica se formula con base en una muestra de
elementos de la poblacin de inters, el proceso por el cual se obtiene la muestra ser aquel que asegure una
buena muestra. Una buena manera de escoger una muestra resulta cuando el proceso de muestreo
proporciona a cada elemento de la poblacin una oportunidad igual e independiente de ser incluido en la
muestra. Si la poblacin consta de N elementos y de stos se toma una muestra de tamao n, el proceso de
muestreo debe asegurar que cada posible muestra de tamao n tenga la misma posibilidad de ser
seleccionada. Este procedimiento conduce a lo que se denomina como muestreo aleatorio simple.

La naturaleza de la informacin estadstica requiere una total imparcialidad en la seleccin de la muestra. Al


extraer una muestra aleatoria debemos analizar las caractersticas de la poblacin. Muchas veces sta no
consta de objetos tangibles a partir de los cuales se selecciona un cierto nmero para formar la muestra. La
poblacin puede estar formada por un nmero infinito de posibles resultados para alguna caracterstica de
inters. Sea X esta caracterstica, la cual puede estar definida por una funcin de densidad f(x,),
correspondiente a la poblacin.

Las siguientes son las formas de realizar el muestreo para esta poblacin:

a) Se disea un experimento y se lleva a cabo para extraer la primera observacin X1 de la caracterstica


medible. El experimento se repite bajo las mismas condiciones para extraer la segunda observacin X2. El
proceso se contina de igual manera hasta obtener n observaciones de la caracterstica de inters {X1,
X2,.,Xn}. Las observaciones se obtienen a travs de ensayos independientes que ocurren cada vez que el
experimento se repite bajo las mismas condiciones. Cada una de las observaciones X1, X2,.,Xn es una
variable aleatoria cuya distribucin de probabilidad es idntica a la de la poblacin.

Situacin diferente ocurre cuando la seleccin se lleva a cabo de objetos tangibles de una poblacin que
consta de un nmero finito de elementos. La caracterstica medible puede ser un atributo o una medicin
cuantitativa como la duracin de un servicio. En este caso existen dos formas de tomar la muestra.

b) Despus de llevar a cabo una mezcla adecuada de cada uno de los elementos de la poblacin, se
extrae uno, se observa la caracterstica medible. Sea X1 esta observacin. El elemento se repone a la
poblacin, sta vuelve a mezclarse y se extrae el segundo elemento X2. El proceso se contina hasta que se
obtengan n observaciones X1, X2,.,Xn de la caracterstica X. Este proceso se denomina muestreo con
reemplazamiento.
.
c) Despus de llevar a cabo una mezcla adecuada de cada uno de los elementos de la poblacin, se
seleccionan n elementos uno despus del otro, sin reemplazo. Este proceso se denomina muestreo sin
reemplazamiento.

En el caso b) cada una de las observaciones X1, X2,.,Xn es una variable aleatoria cuya funcin de densidad
es idntica a la de la poblacin original. En el caso c) las observaciones X1, X2,.,Xn son variables aleatorias
cuyas distribuciones marginales son iguales a la de la poblacin. La diferencia entre estas dos tcnicas es el
concepto de independencia. En el caso b) las observaciones X1, X2,.,Xn constituyen un conjunto de
variables aleatorias independientes e idnticamente distribuidas, dado que por el proceso de reemplazo
ninguna observacin se ve afectada por las dems. En el caso c) las observaciones no son independientes.

En este captulo presentaremos los elementos requeridos para analizar las distribuciones y los principales
resultados obtenidos cuando se toma una muestra aleatoria de una poblacin infinita, o de una poblacin finita
pero con reemplazamiento. En un captulo posterior presentaremos las tcnicas para analizar los resultados
obtenidos al tomar una muestra de una poblacin finita, sin reemplazamiento.
Bernardo A. Caldern C. Distribuciones muestrales 2

Muestreo
Proceso de toma de muestras, anlisis y la obtencin de conclusiones.

Muestra aleatoria
Sea X1, X2,...,Xn un conjunto de variables aleatorias independientes e idnticamente distribuidas (iid). Se dice
que X1, X2,...,Xn forman una muestra aleatoria de tamao n- ma(n)

Parmetro poblacional
Las caractersticas se refieren a la informacin bsica de inters sobre las unidades muestreadas. Se
denomina parmetro al valor que toma una caracterstica de la poblacin. Por ejemplo: El verdadero
porcentaje de votantes a favor de determinado candidato, la resistencia media a la rotura de un envase, el
porcentaje medio de defectuosos que da un proceso. Estos parmetros los denotaremos, por lo general,
mediante la letra griega .

Generalmente el objetivo de los estudios de muestreo es estimar uno o ms parmetros de la poblacin.


Generalmente estos parmetros se refieren o a la media poblacional, que denotaremos por , o a la
proporcin poblacional, que denotaremos por la letra .

Estadstico T

Se denomina Estadstico T a cualquier funcin de la muestra aleatoria, y que no depende de ningn


parmetro desconocido. El estadstico lo denotaremos por T

T = t(X1, X2,, Xn)

Ejemplos de estadsticos son la media muestral, la proporcin muestral o la varianza muestral, entre otros.
Los estadsticos son variables aleatorias, y como tales tiene una funcin de densidad. Su funcin de densidad
se denomina distribucin muestral.

2. Principales estadsticos

2.1. Media muestral

La media muestral se define como:


n
Xi
X = i=1
n
Se supone que la muestra aleatoria proviene de una poblacin (finita o infinita), caracterizada por los
2
siguientes parmetros: E(X) = y V(X) =

Algunas de las propiedades de la media muestral son:

a) Valor esperado: E( X )
1 n 1 n 1 n 1n 1
E( X) = E Xi = E Xi = E( Xi) = = n =
n i =1 n i =1 n i =1 n i =1 n

b) Varianza muestral: V( X )
1 n 1 n
V( X) = V Xi = V Xi
2
n i =1 n i =1

Como se trata de una muestra aleatoria compuesta por variables independientes, entonces la varianza de una
suma es la suma de las varianzas, por lo cual:
Bernardo A. Caldern C. Distribuciones muestrales 3

1 n 1 n 1 n 2 1 2
V (X )= V ( X i) = V ( X ) = = n 2 =
n2 i = 1 n2 i = 1 n2 i = 1 n2 n

donde V(Xi) = V(X) = 2 porque las variables son idnticamente distribuidas.

En resumen se tiene que:


2
E( X) = y V( X) =
n
Recurdese que la varianza es una medida de la variabilidad o dispersin de los datos alrededor de la media.
Una varianza pequea implica una alta probabilidad de que la variable aleatoria tome un valor cercano de la
media.

Para un tamao de muestra n grande la varianza de la media muestral V( X) es muy pequea lo cual implica
que existe una alta probabilidad de que X tome un valor muy cerca de su media. Esto es parte de lo que se
conoce como la Ley de los grandes nmeros.

2.2. Proporcin muestral P

Si se toma una muestra aleatoria X1, X2,...,Xn , donde cada Xi toma los valores 0 1, (por ejemplo, cero si la i-
sima persona no est de acuerdo con determinada propuesta, y uno en caso de que lo este, cero si el i-
simo artculo es bueno y uno si es defectuoso), la proporcin muestral P se define como:
n
Xi
P= i = 1 =X
n
La variable aleatoria Xi sigue una distribucin de Bernoulli con parmetro . Su valor esperado y su varianza
estn dados por

E(Xi) = , V (Xi) = (1 - )
n
La variable aleatoria X= Xi tiene una distribucin binomial, cuyas principales caractersticas son:
i =1
n
p(x)= x (1) n x , x =0, 1, 2,...,n
x
E(X) = n, V (X) = n (1 - )

Algunas de las propiedades de la proporcin muestral P son:

a) Valor esperado: E(P)

1 n 1 n 1 n 1n 1
E(P) = E Xi = E Xi = E( Xi) = = n =
n i =1 n i =1 n i =1 n i =1 n

b) Varianza: V(P)
1 n 1 n
V(P) = V Xi = V Xi
2
n i =1 n i =1

Como se trata de una muestra aleatoria compuesta por variables independientes, entonces la varianza de
una suma es la suma de las varianzas, por lo cual:
Bernardo A. Caldern C. Distribuciones muestrales 4

1 n 1 n 1 n 1 (1 ) 2
V( X ) = V( x i)= V(X) = (1 ) = n(1 ) = =
n2 i = 1 n2 i = 1 n2 i = 1 n2 n n
2
donde V(Xi) = V(X) = = (1-) porque las variables son idnticamente distribuidas.

En resumen se tiene que:


2
(1 )
E(P) = , V(P) = =
n n
2
2.3. Varianza muestral S

La varianza muestral est definida como:


n 2
( xi x )
S = i=1 n 1
2

Para simplificar los clculos la varianza muestral puede calcularse como:


n 2 n
2
( X i X) ( Xi2 2 X Xi + X )
2 i=1
S = n 1 = i=1
n 1
n n n n
2 2
Xi2 2 X Xi + X Xi2 2 XnX + n X
i=1 i=1 i=1
= = i=1
n 1 n 1
2
n n
2 n
Xi2 nX
2 n Xi X i
2 i=1 i=1 i =1
S = n 1
=
n(n 1)

A la raz cuadrada positiva de la varianza se la denomina desviacin estndar muestral, es decir:

S = S2
Propiedades de la varianza muestral

a) Valor esperado E(S2)


n 2 n 2
( X X ) ( X 2 n X )
i i=1 i
E( S 2 ) =E i =1 =E
n 1 n 1


1 n 2 1 n 2
E(S2)= E ( X 2nX ) = E ( X 2) nE( X )

n 1 i=1 i i
n 1 i=1
Como se vio anteriormente, la varianza de una variable aleatoria puede expresarse en trminos de su
segundo y primer momentos como:

V(X) = E(X2) [E(X)]2

Por lo cual el segundo momento E(X2) puede expresarse como:


2 2 2 2
E(X ) = V(X) + [E(X)] = +

De igual manera el segundo momento de la distribucin de la media puede expresarse como:


Bernardo A. Caldern C. Distribuciones muestrales 5

2 2
E( X 2) = V( X ) + ( E ( X ) ) = + 2
n
Por lo tanto el valor esperado de la varianza E(S2) puede expresarse como:
2 2 2 2
1 n 2 2
2 n + n n
( + )n( + ) =
2
E(S2)= =2
n 1 i=1 n
n 1
Se ha demostrado que el valor esperado de la varianza muestral es igual a la varianza poblacional. Esa es la
razn por la cual al calcular la varianza muestral se divide por n-1 y no por el tamao de la muestra (n), en
cambio en el clculo de la varianza poblacional se divide por el tamao de la poblacin (N).

b) Varianza

Se puede demostrar que la varianza de la varianza muestral est dada por:

2 4
V(S2) = n >1
n 1
2.4. Estadsticos de orden

Sea X1, X2,...,Xn una muestra aleatoria de tamao n de variables independientes e idnticamente distribuidas.
Los valores de las variables corresponden al orden en que fue tomada la muestra. Suponga que la muestra
aleatoria se ordena de menor a mayor. Sea X(i) la variable aleatoria que ocupa el puesto i en la muestra,
donde X(1) corresponde al menor valor, y X(n) al mayor valor de la muestra. Estas nuevas variables aleatorias
reciben el nombre de estadsticos de orden.

X (1) = Min{X i}, i = 1,2,...,n : Estadstico de orden 1

X (n ) = Max{X i}, i = 1,2,...,n : Estadstico de orden n

3. Distribuciones Lmites

3.1. Desigualdad de Chebyshev


2
Teorema. Sea X una variable aleatoria con E(X) = y varianza V(X) = . Sea cualquier nmero positivo,
entonces
2
P ( X )
2
En muchas aplicaciones, el valor se expresa como mltiplo de la desviacin estndar como k, entonces la
desigualdad de Chebyshef se expresa como:
1
P( X k)
k2
Cuando la variable de inters no es una observacin individual sino una media muestral X , entonces el valor
esperado est dado por E( X ) = y varianza V( X ) = 2/n. En este caso la desigualdad de Chebyshev estar
dada por:
2
P( X )
2
n
1
P( X k x )
2
k
Esto nos dice que cuando n es grande, la probabilidad de que haya alguna diferencia entre la verdadera
media y su estimador X tiende a cero, es decir, que cuando n, entonces X .
Bernardo A. Caldern C. Distribuciones muestrales 6

Ejemplo. Se tiene un lote grande de artculos y se desea estimar la fraccin defectuosa usando muestreo
aleatorio simple. Usando la desigualdad de Chebyshev, se desea encontrar el tamao de muestra n tal que la
probabilidad sea al menos del 95% de que la fraccin defectuosa difiera de la verdadera fraccin defectuosa
en no ms de 0.10.

3.2. La Ley de los Grandes Nmeros

Suponga que X1, X2,...,Xn es una secuencia arbitraria de variables aleatorias con valores esperados EX1),
n
E(X2),...,E(Xn). Suponga adems que la variable aleatoria Xi tiene varianza para cada valor de n entero.
i=1
1 n
Teorema. Si V Xi 0 cuando n y es un nmero positivo, entonces,
n i=1
1 n
P (Xi E(Xi)) 0 cuando n
n i = 1
o equivalentemente
1 n
P (X i E(X i)) < 1 cuando n
n i = 1
Definicin. Una secuencia de variables aleatorias Zn converge en probabilidad o converge estocsticamente
a una constante "a" si para cada nmero positivo
P( Zn a ) 0 cuando n
P
Simblicamente: Zn a
El teorema enunciado anteriormente puede escribirse como:
1 n P
( Xi E( Xi)) 0 cuando n
n i=1
El teorema anterior se le conoce como la Ley dbil de los grandes nmeros.

Colorario: Si X es la media muestral de una ma(n) de una poblacin inducida por una variable aleatoria X
2
con media y varianza , y si >0, entonces

{ }
P X 0 cuando n

P{ X < }1 cuando n
P
X cuando n
Conclusin: Si la muestra es grande existe una alta probabilidad de que la media muestral X est cerca de la
media poblacional .

Escogiendo un tamao de muestra suficientemente grande podemos hacer que la probabilidad de que la
media muestral tienda a la media poblacional sea tan alta (tan cerca de uno) como queramos.

3.3. Aplicacin a la Distribucin Binomial

Sea X el resultado de un ensayo de Bernoulli {0,1}, (por ejemplo, la inspeccin de un artculo) con P(X=1) = ,
y P(X=0) = q= 1 - .
Sea Sn el nmero de xitos (artculos defectuosos) en los n ensayos de Bernoulli. El nmero medio de xitos
por ensayo X puede calcularse como:
Bernardo A. Caldern C. Distribuciones muestrales 7

n
Xi
S
X= i = 1 = n
n n
Colorario. (Teorema de Bernoulli). Si Sn representa el nmero de xitos en n ensayos independientes de un
evento con probabilidad , y si > 0, entonces


P Sn 0 cuando n
n

P sn < 1 cuando n
n

P = Sn
P
cuando n
n
Conclusin: Si la muestra es grande existe una alta probabilidad de que la proporcin muestral P est cerca
de la verdadera proporcin poblacional .

Combinacin lineal de variables normales

Teorema. Sea X1, X2,..., Xn un conjunto de variables aleatorias distribuidas normalmente con valores
2
esperados i y varianzas i , para i=1,2,...,n, entonces
n
Y = ai Xi
i=1
n n
2 2 2
se distribuye normalmente con valores esperado y = ai i y varianza y = ai i , donde los ai son
i=1 i=1
valores constantes.

Ejemplo. Una estacin de gasolina vende tres clases de combustibles: Diesel, gasolina corriente y gasolina
extra, a precios de $2,100, $3,050 y $3,900 el galn, respectivamente. Suponga que la cantidad vendida
diariamente de cada tipo se distribuye normalmente con medias 300, 500 y 1,000 galones, y desviaciones
estndares de 80, 50 y 100 galones, respectivamente. Se pide calcular:
a) El ingreso medio diario
b) La desviacin estndar
c) La probabilidad de que el ingreso diario supere los 6 millones de pesos? Los 7? Los 8?

4. Distribuciones muestrales

Se denomina distribucin muestral a la funcin de densidad de un estadstico y esta funcin puede depender
o no de parmetros desconocidos.

Sea X1, X2,...,Xn una muestra aleatoria de tamao n de variables independientes e idnticamente distribuidas,
con una funcin de densidad f(x,), donde es un parmetro desconocido (o un conjunto de parmetros).

Sea el conjunto de todos los valores que puede tomar.

Sea = {f(x, ), } el conjunto que representa la familia de todas las posibles funciones de densidad
obtenidas para cualquier valor de .

La funcin de densidad conjunta de la muestra aleatoria X1, X2,...,Xn est dada por:
n
f x1, x 2 ,..., xn ( x1, x 2 ,..., xn)= f 1( x1, )f 2 ( x 2 , )... f n ( xn , )= f i( xi , )
i=1
Como las variables son idnticamente distribuidas, la funcin de densidad conjunta puede expresarse como:
Bernardo A. Caldern C. Distribuciones muestrales 8

n
f ( x1,x2 ,..., xn ,)= f ( xi ,)
i=1
x 1-x
Ejemplo. Si X Bernoulli() Bin(1,) f(x) = (1 - )
n n
n
1
f ( x1,x2 ,..., xn ,)= xi (1 ) xi =i xi (1 )n xi
=1 i =1
i=1
2 2
Ejemplo: Si X N(, ) = {1, 2} 1 = , 2 = .

e (x )
1 /2
2 2
f ( x) = , < x +
2
n
) / 22 = 1 ( xi) / 22
n
f ( x1,x 2 ,..., xn ,)=
n 1
e (x i
2
e
2

i=1 2 i =1
2
5. Teorema Central del Lmite (Distribucin de la media X )

Importancia: El teorema central del lmite (TCL) nos permite usar la distribucin normal como la distribucin de
las medias de muestras grandes, sin interesar cual sea la distribucin original de las variables aleatorias.

Teorema. Sea X1, X2,...,Xn una muestra aleatoria de tamao n de variables independientes e idnticamente
distribuidas tomadas de una poblacin infinita, con media y varianza 2, entonces la distribucin lmite de

X
Z=
/ n
es la distribucin normal estndar (0,1), cuando n , (independiente de la distribucin de X1, X2,...,Xn).

Otra forma de presentar el TCL es la siguiente:

Si X1, X2,...,Xn es una muestra aleatoria de tamao n de variables independientes e idnticamente distribuidas
tomadas de una poblacin infinita, con media y varianza 2, y si X es la media muestral, entonces su
distribucin muestral tiende a una distribucin normal con media y varianza 2/n cuando n.
X N(, 2 / n) cuando n

Ejemplo grfico

Con el fin de ilustrar grficamente el TCL presentaremos la distribucin de la media muestral obtenida al
lanzar dos dados, en comparacin con la distribucin individual de cada dado.
Si X representa el resultado obtenido al lanzar un
dado, entonces su funcin de probabilidad est
dada por: Lanzamiento de un dado
1
p( x ) = , x = 1, 2, 3, 4, 5, 6 0,20
6
Probabilidad

0,15
0,10
0,05
0,00
1 2 3 4 5 6
Resultado

con la anterior representacin grfica.


Bernardo A. Caldern C. Distribuciones muestrales 9

Consideremos ahora el lanzamiento de dos dados.


Teorema Central el Lmite. Promedio de
Sean X1 y X2 los respectivos resultados. Sea X la Probabilid
cuatro lanzamientos
media respectiva. La tabla siguiente presenta su ad
respectiva distribucin de probabilidad (la cual 0.12

haba sido analizada previamente al estudiar el


0.1
concepto de variable aleatoria, y considerar la
suma de los dos dados). 0.08

Distribucin de la media de dos dados 0.06

Suma Media X P(X) 0.04

2 1.0 1/36 0.02

3 1.5 2/36
0
4 2.0 3/36 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6

5 2.5 4/36 Valor medio

6 3.0 5/36
7 3.5 6/36
parecerse ms a una distribucin normal que a su
8 4.0 5/36 distribucin original. Si continuamos promediando
9 4.5 4/36 ms variables, la distribucin resultante se
aproximar an ms a una distribucin. La
10 5.0 3/36 siguiente grfica presenta los resultados al
11 5.5 2/36 promediar cuatro lanzamientos de la moneda.
12 6.0 1/36 Observacin importante:

Su representacin grfica se presenta en la figura Debe tenerse en cuenta que si n entonces la


siguiente. varianza de X (= 2/n) tiende a cero, lo cual
implica a su vez que X . Lo que el TCL dice
Promedio del lanzamiento de dos es que cuando el tamao muestral es grande, la
dados media de una muestra aleatoria tiende a seguir la
distribucin normal. Cundo n es lo
suficientemente grande?. En general depende de
0,20
Probabilidad

la distribucin original de la variable aleatoria X;


0,15
sin embargo, para variables continuas y n 30, la
0,10
aproximacin normal se aplica, no importa cual
0,05
0,00
sea la distribucin original. Para n< 30 la
aproximacin es vlida segn la forma de la
distribucin original.
1

Resultado
Si la distribucin original es continua y uniforme
(por ejemplo el caso de los nmeros aleatorios
que van de cero a uno), para que el promedio
Como se puede observar, el cambio en la forma tienda hacia una distribucin normal, se requieren
de la distribucin es bastante notable, al pasar de muestras de por lo menos 10 observaciones (esto
una distribucin completamente plana (uniforme se determinado mediante pruebas de bondad de
discreta) a una distribucin que, aunque no es ajuste).
normal, si tiende a
Ejemplo: Una mquina vendedora de refrescos est programada para que la cantidad de refrescos que sirve
sea una variable aleatoria con una media de 200 mililitros y una desviacin estndar de 15 mililitros. Cul es la
probabilidad de que la cantidad media de refresco servido en una muestra aleatoria de 36 refrescos sea por lo
menos 204 mililitros?. Realice los clculos usando la desigualdad de Chebyshev y el TCL.

Se tiene lo siguiente: = 200, = 15, n = 36

a) Usando la desigualdad de Tchevyshef, se tiene:


2
P( X ) donde = 4,
2
n
2
P( X 4) 15 = 0.39
2
364
Sin embargo, se tiene que
P( X 4) = P( X 4) + P( X 4) 0.39 P( X 4) 0.195
suponiendo una distribucin simtrica.

b) Usando el TCL:
X 204 200
P( X 4) = P P( Z 1.6) = 0.0548
/ n 15 / 6

Con la desigualdad de Chebyshev donde no se hace ninguna suposicin sobre la distribucin de la
media, tenemos que la probabilidad es menor que 0.195, y usando el teorema central del lmite se tiene
que la probabilidad es .0548 (menor que 0.195)

Ejemplo: Continuando con el ejemplo anterior


a) Cul es el error mximo que se est dispuesto a aceptar en la estimacin de la media, si se especifica
una probabilidad de 0.05?
b) Cul debe ser el tamao de la muestra de tal forma que el error mximo que se cometa en la estimacin
de la media sea de 4 mililitros con una probabilidad de 0.05 o menos?

Solucin:

a) Queremos determinar el valor de de tal forma que


P( X ) 0.05

P( X ) = P( X ) + P( X ) = 0.05

( )
X
P X ) = P

/ n 15 / 6
X
+ P

/ n 15 / 6

( )

P X ) = P Z


+ P Z
15 / 6


15 / 6
Como la probabilidad del error es de 0.05, y la distribucin es simtrica, entonces la probabilidad de un
error menor de - es 0.025 y la probabilidad de un error superior a + es tambin de 0.025. Por lo tanto,
los valores de -/(15/6) y +/(15/6) corresponden a los valores de la distribucin normal que tienen reas
de 0.025 a la izquierda y +0.025 a la derecha, respectivamente. Es decir1,
+
15 / 6 z0.975
= z0.025 ,
15 / 9 z0.025
= = = 1.96
Por lo tanto = (1.96 x15 / 6) = 4.9

b) Queremos determinar el valor de n de tal forma que

1
Notacin: El valor ZP corresponde al valor de la distribucin normal que tiene un rea de P a la derecha, o 1-
P hacia la izquierda
Bernardo A. Caldern C. Distribuciones muestrales 11

P( X ) equivalent emente P( X ) 1 , donde = 0.05, y = 4.


De nuevo | X -| - X - +. Por lo tanto:
P( X ) = P( X +) 1

(
P X ) = P )


X


/ n / n / n
1

La anterior expresin puede escribirse como:
P( X ) ) = P(z1 / 2 Z z / 2) =1
donde
+
= z1 / 2 = z / 2 , = z / 2
/ n / n

Por lo tanto el tamao de muestra requerido est dado por:

2 2
Z / 2 = 15x1.96 = 54
n =
4
La frmula anterior es una frmula general para determinar el tamao de la muestra cuando se muestrea de
una poblacin infinita. Si se muestrea de una poblacin finita(N) es necesario reemplazar la desviacin
estndar de la media / n por la desviacin estndar de la media cuando se muestrea de la poblacin
Nn
finita, que est dada por . El tamao de muestra resultante est dado por:
n N 1

2 2
Z1 / 2 N
n=
2 2 2
(N1)+ Z1 / 2

Teorema de Moivre. Si Sn es el nmero de xitos en n ensayos independientes de un evento con


probabilidad , y si a y b son dos nmeros reales con a<b, entonces

{ } 1 b
2/2
P n a n1 ) < Sn < n + a n1 ) = e z dz , cuando n .
2 a
Es decir, el teorema de DeMoivre dice que cuando el tamao de la muestra es grande, la distribucin Binomial
se puede aproximar por una distribucin normal con media E(X) = = n y varianza V(X) = 2 = n(1-).

Problemas:

1) Suponga que el nmero de barriles de petrleo crudo que produce un pozo diariamente es una
variable aleatoria con una distribucin no especificada. Si se observa la produccin de 64 das, seleccionadas
en forma aleatoria, y se sabe que la desviacin estndar del nmero de barriles por da es 16 barriles,
a) Determine la probabilidad de que la produccin de un da no exceda de la media en ms de 32 barriles.
b) Determine la probabilidad de que la produccin media se encuentre a no ms de 4 barriles del verdadero
valor de la produccin diaria. (Use la desigualdad de Chebyshef y el TCL).

2) Para realizar un experimento se le ha suministrado una resistencia. Como se desea estimar la


resistencia muy exactamente, usted realiza 36 mediciones con el mismo mtodo, cuya experiencia previa
indica que tiene una varianza de 10 ohmios. La medida promedio de sus mediciones da 52 ohms.
a) Cul es la probabilidad de que su promedio de 52 ohms est en error por mas de 1 ohm?
b) Cul es la probabilidad a priori de que se obtengan valores muestrales para los cuales la media muestral
X difiera de la media poblacional por ms de un ohm?
Bernardo A. Caldern C. Distribuciones muestrales 12

c) Cul es el error mximo que se puede cometer si se desea que la probabilidad a priori de que se
cometa dicho error no exceda de 0.05?
d) Cuntas mediciones deben realizarse con el fin de obtener una probabilidad a priori de 0.05 de que el
promedio muestral difiera de la verdadera resistencia media por ms de 1 ohm?
2
3) Considere el proceso de seleccin de una muestra de una distribucin que tiene una varianza =
10, pero con una media desconocida. Cul debe ser el tamao de la muestra para que la media X se
encuentre dentro de un intervalo igual a dos unidades de la media poblacional, con una probabilidad de por lo
menos 0.90
a) Usando la desigualdad de Chebyshef (n = 25)
b) Usando el TCL. (n = 7)

4) Un inspector de pesos y medidas visita una planta de empacado para verificar que el peso neto de
las cajas sea el indicado en stas. El gerente de la planta asegura al inspector que el peso promedio de cada
caja es de 750 gr. con una desviacin estndar de 5 gr. El inspector selecciona, al azar, 100 cajas y encuentra
que el peso promedio es de 748 gr. Bajo estas condiciones, qu tan probable es tener un peso de 748 o me-
nos? Qu actitud debe tomar el inspector?

5) La probabilidad de que un basquetbolista anote en un lanzamiento que realice es 0.5. Si realiza 20


lanzamientos, cul es la probabilidad de que anote al menos en 9 lanzamientos?
a) Usando la distribucin exacta.
b) Usando la aproximacin normal sin factor de correccin de continuidad.
c) Usando la aproximacin normal con factor de correccin de continuidad
d) Es aplicable la aproximacin de Poisson?

Distribucin de la media para poblaciones finitas

Si un experimento consiste en seleccionar uno o ms valores de un conjunto finito de nmeros (C1, C2,..., CN),
este conjunto recibe el nombre de poblacin finita de tamao N.

Si se realiza un muestreo de esta poblacin sin reemplazo, es decir, sin sustitucin de los elementos
muestreados previamente, entonces, los diferentes elementos de la muestra (X1, X2,..., Xn) no son
independientes.

Definicin. Si X1 es el primer elemento de la muestra, X2 es el segundo valor tomado,...,Xn es el n simo valor


tomado, la distribucin de probabilidad conjunta de estas variables aleatorias est dada por:
1
f ( x1, x 2 ,..., x n) =
N(N 1)(N 2)...(n n + 1)
y X1, X2,..., Xn constituyen la muestra aleatoria (n).

La probabilidad de tomar una muestra cualquiera de tamao n de una poblacin de N elementos est dada
N
por 1
n
La distribucin marginal de cualquier Xj est dada por:
1
f ( x j) = , para xj = C1, C2,...,CN
N
La distribucin marginal conjunta de dos variables aleatorias cualesquiera Xk y Xs est dada por:
1
g( x k , x s) =
N(N 1)
Se puede demostrar que la covarianza entre Xk y Xs est dada por:
2
COV( Xk , X s) =
N1
Teorema: Si X es la media de una muestra aleatoria de tamao n tomada de una poblacin finita de tamao
2
N con media y varianza , entonces
Bernardo A. Caldern C. Distribuciones muestrales 13

2 Nn
E( X) = y V( X) =
n N1
Nn
El trmino recibe el nombre de factor de correccin para poblacin finita. Si N>>n este factor tiende a
N1
uno, y la varianza muestral ser igual a 2/n (como si se tratara de una poblacin infinita).

6. Distribucin de la proporcin

Sea X1, X2,...,Xn una muestra aleatoria tomada de una poblacin con una distribucin de Bernoulli con
parmetro . Por lo tanto su funcin de probabilidad, su media y su varianza estn dadas por:
p( x i) = x i (1 )1 x i , x i = 0,1
E(X) = , V(X) = (1 - )

Si P es la proporcin muestral, definida como


n
Xi
X + X 2 + ... + X n i = 1
P= 1 = =X
n n
2
(1 )
con E(P) = , V(P) = =
n n

En virtud del Teorema Central del Lmite, como P es la media muestral de los diferentes valores de Xi,
entonces P tiende a seguir una distribucin normal con los parmetros dados anteriormente, es decir, P
(1 )
Normal , . tambin la variable aleatoria
n
P
Z=
( 1 )
n
sigue una distribucin normal estndar con media cero y varianza unitaria, cuando el tamao de la muestra n
es grande.

7. Distribucin de la diferencia entre proporciones

Sea X11, X12 ,..., X1n1 una muestra aleatoria (n1) tomada de un proceso de Bernoulli con parmetro 1. Sea
X12 , X22 ,..., X2n2 una muestra aleatoria (n2) tomada de un proceso de Bernoulli con parmetro 2. Estamos
interesado en conocer la distribucin de la diferencia de proporciones muestrales P1 P2.

X11+ X12 + X1n1


Sabemos que P1 = se distribuye normalmente con una valor esperado 1 y una varianza
n1
1(1 1) cuando n es grande. De forma similar X21+ X22 + X2n
1 P2 = 2
se distribuye normalmente con
n1 n2
una valor esperado 2 y una varianza
2 (1 2) cuando n es grande.
2
n2
Tenemos que:
Bernardo A. Caldern C. Distribuciones muestrales 14

E(P1 P 2 )= 1 2

V(P1 P 2 )= 1
(1 1)
+ 2
(1 2)
n1 n2
Como tanto P1 como P2 se distribuyen normalmente, entonces su diferencia tambin se distribuyen
normalmente con los parmetros arriba mencionados. Es decir,

P1 P 2 Normal 1 2 ,
1 (11) + 2 (12) .
n1 n 2
tambin la variable aleatoria Z definida como
P1 P 2 (1 2 )
Z=
1 (1 1) 2 (1 2)
+
n1 n2
tiene una distribucin normal cuando n1 y n2 son grandes.

Si se desea verificar si las dos distribuciones son iguales, se tendra entonces que analizar si 1 = 2 , es
decir, 1 2 = 0.

Ejemplo: Un artculo del New York Times en 1987 report que se puede reducir el riesgo de sufrir ataques al
corazn ingiriendo aspirina. Para llegar a esta conclusin el cronista se bas en los resultados de un
experimento diseado, en donde participaron dos grupos de personas. A un grupo de 11,034 personas se le
suministr una dosis diaria de una pastilla que no contena ninguna droga, y de estos 189 sufrieron
posteriormente ataques al corazn, mientras que al otro grupo de 11,037 se les suministr una aspirina, y slo
104 lo sufrieron.

Considera Usted que el cronista del New York Times estaba en lo correcto?.

8. Distribucin Chi Cuadrado

Definicin. Una variable aleatoria X tiene una distribucin Chi Cuadrado Ji dos si su funcin de densidad de
probabilidad est dada por:
1 / 2 1 x / 2 ,
/2 x e x0
f (x) = 2 ( / 2)
0 , x<0

donde es el nmero de grados de libertad, o simplemente grados de libertad.

La distribucin Chi Cuadrado es un caso particular de la distribucin Gamma, cuya funcin de densidad est
dada por:

f ( t )= e t
(t )k 1 t 0
(k )
donde (k) es la funcin gamma de k. Los valores correspondientes de los parmetros y k son = 1/2 y
k = /2.

El valor esperado y la varianza de la distribucin Chi cuadrado estn dados por:

E(X) = , V(X) = 2
Notacin: Si una variable tiene una distribucin Chi cuadrado con grados de libertad, lo denotaremos como
2
Chi()
Teoremas
Bernardo A. Caldern C. Distribuciones muestrales 15

1) Si Z es una variable aleatoria con distribucin normal (0, 1), entonces Z2 tiene una distribucin Chi
Cuadrado con un grado de libertad ( = 1).
2) Si Z1, Z2, ...,Zn es un conjunto de n variables independientes e idnticamente distribuidas con distribucin
normal (0,1), entonces

Z = Z12 + Z22 + ... + Zn2


tiene una distribucin Chi Cuadrado con n grados de libertad.
3) Si X1, X2, ...,Xk es un conjunto de k variables independientes con distribuciones Chi Cuadrado con 1, 2,
..., k grados de libertad, respectivamente, entonces la variable aleatoria

X = X1 + X2 +...+ Xk

tiene una distribucin Chi Cuadrado con = 1 + 2 +...+ k grados de libertad.

4) Sean X1 y X2 dos variables aleatorias. Si X1 tiene una distribucin ji dos con 1 grados de libertad, y
X1 + X2 tiene otra distribucin Chi cuadrado con > 1 grados de libertad, entonces X2 tiene una
distribucin Chi cuadrado con - 1 grados de libertad.

2
Teorema. Si X y S son la media y la varianza de una ma(n) tomada de una poblacin normal con media y
2
varianza , entonces
a) X y S2 son independientes.
(n 1) S2
b) La variable aleatoria tiene una distribucin Chi Cuadrado con n-1 grados de libertad.
2

La parte a) no se demostrar. A continuacin se presenta la demostracin de la parte b. Para ello considere la
n
(Xi ) . Esta expresin puede representarse de la siguiente manera, sumando y
2
siguiente suma:
i=1
restando X .

[ ]
n 2 n n
(Xi ) = ( Xi X) + ( X ) = ( Xi X) + 2 ( Xi X)( X ) + ( X )
2 2 2
i=1 i=1 i=1
n n n n
(X i ) = ( X i X) + 2 ( X ) ( Xi X) + ( X )
2 2 2
i=1 i=1 i=1 i=1
n n
(Xi ) = ( Xi X) + n ( X )
2 2 2

i =1 i =1

n
( Xi X) es igual al cero. Si dividimos ambas expresiones por , se tiene:
2
dado que
i=1
N 2
2 ( Xi X) X
2
n X
i = I=1
2
+n


i=1
Si multiplicamos y dividimos la primera parte de la expresin de la derecha por (n 1) tenemos que:
2 2
n X (n 1) S2 X
i = 2
+
/ n
i=1
Bernardo A. Caldern C. Distribuciones muestrales 16

2
X n
Observando la expresin anterior tenemos que el trmino i sigue una distribucin Chi Cuadrado
i=1
2
X
con n grados de libertad, y el trmino
/ n sigue tambin una distribucin Chi Cuadrado pero con un

(n 1) S2
grado de libertad. Por lo tanto, la expresin sigue una distribucin Chi Cuadrado con n-1 grados
2

de libertad.

Tabulacin. La funcin de distribucin no puede calcularse en forma analtica; sin embargo, ha sido tabulada
para diferentes valores de la probabilidad acumulada, y para varios grados de libertad. En algunas tablas se
presenta la cola hacia la izquierda (probabilidad acumulada), y en otras la cola hacia la derecha. Para aquellos
valores que no se encuentren en la tabla, se puede usar interpolacin lineal, mediante la siguiente frmula:


P = Pi1 + Pi Pi1 (X Xi1)
Xi Xi1
2
Notacin. Usaremos la notacin ,P para denotar el valor de la distribucin Chi cuadrado con grados de
libertad y una cola de P hacia la derecha (o una probabilidad acumulada de 1-P hacia la izquierda).

Problema: Haciendo uso de la relacin existente entre las distribuciones gama y chi cuadrado, demuestre que
la varianza de la varianza poblacional est dada por
2 4
V(S2) = , n >1
n 1
Ejemplo. Suponga que el espesor de un componente de un semiconductor es una dimensin crtica. El
proceso de produccin de tal caracterstica se distribuye normalmente con una desviacin estndar de 0.6
milsimas de pulgada. Para controlar el proceso se toman muestras peridicas de veinte piezas, y se define
un lmite de control con base en una probabilidad de 0.01 de que la varianza muestral exceda dicho lmite, si
el proceso est bajo control.

Qu se puede concluir si para una muestra dada la desviacin estndar es 0.84 milsimas de pulgada?

Solucin. La variable aleatoria de inters para nuestro caso es X2 = (n1) S2 / 2 . Si denotamos por LSC el
lmite superior de control, entonces tenemos que se debe cumplir que:
(n1) S2 2
P( X
2
> LSC) = P > LSC = 0.01 P (n1) S LSC = 0.99
2 2

Por lo tanto, debemos buscar en la tabla de la distribucin Chi Cuadrado, con 19 grados de libertad, el valor

19,0.01 ,
2
que tenga una probabilidad hacia la derecha de 0.01 ( hacia la izquierda de 0.99), denotado por

correspondiente a 36.19, el cual debe satisfacer la siguiente desigualdad:


2
(n 1) S

2
Se acepta si = 36.19

2 19, 0.01

19,0.01
2 2
2
O tambin se acepta si S (n 1)
= 0.6857
Por lo tanto el criterio de decisin se puede expresar en una de las dos formas siguientes:
2 (n1) S2 19 x 0.842
a) Se calcula = X = 2
= 2
= 37.24
0.6
Bernardo A. Caldern C. Distribuciones muestrales 17

Como X2 = 37.24 > 36.19 la muestra no proviene de un proceso con una desviacin estndar de 0.60.

b) Se calcula S2 = .842 = 0.7056. Como 0.7056 > 0.6857 se llega a la misma conclusin de que no es
probable que la muestra tomada provenga de una poblacin con una desviacin estndar de 0.60
milsimas de pulgada.

Ejemplo. Un fabricante de bateras para automviles garantiza que sus bateras duran, en promedio tres aos
con una desviacin estndar de un ao. Si cinco de sus bateras tienen duraciones de 1.9, 2.4 , 3.0, 3.5 y 4.3
aos, puede asegurarse que las bateras tiene una duracin estndar de un ao?. Suponga que la duracin
de las bateras sigue una distribucin normal.

Tenemos que: X = 3.0, 2


S = 0.815
2 (n1) S2 4 x 0.815
X = 2
= = 3.26
1
Buscando en la tabla chi cuadrado para cuatro grados de libertad encontramos para X2 = 2.75 una
2
probabilidad P de 0.4 y para X = 4.04 la probabilidad es P = 0.6. Usando interpolacin lineal, tenemos una
probabilidad aproximada de 0.479. Si la muestra proviene de una poblacin con desviacin estndar de uno,
la probabilidad de que la muestra no pertenezca a esta distribucin es de 1-0.479 = 0.521, la cual es
excesivamente alta. Por lo tanto, no hay evidencia para concluir que la muestra no pertenece a una poblacin
con una varianza de uno.

9. Distribucin t

( X )
Se sabe que X se distribuye normalmente con una media y una varianza 2/n, o la variable Z = se
/ n
distribuye normalmente con media cero y varianza unitaria. Sin embargo, para calcular Z se requiere que
sea conocido. Por lo tanto, se requiere una distribucin para el caso en que sea desconocido y se pueda
reemplazar por un estimativo, tal como S. Tal distribucin es la distribucin t.

Teorema. Sean Y y Z dos variables aleatorias independientes, Y con una distribucin Chi cuadrado con
grados de libertad, y Z con una distribucin normal estndar (0,1), entonces la distribucin de la variable
Z
T=
Y/
est dado por:
+1 +1

( ) 2 2
f (t) = 2 1+ t , <t<+
( / 2)
y se denomina distribucin t distribucin de Student, con grados de libertad.

Origen: WS Gosset public inicialmente la distribucin bajo el seudnimo de Student.

Propiedades generales

a) El valor esperado es cero E(T)= 0


b) Distribucin simtrica con respecto a cero.

c) La varianza de T est dada por V(T ) = , >2
2
d) La varianza de T es ligeramente mayor de 1.0, es decir, es ligeramente mayor que la de la distribucin
normal estandarizada.
e) Para n 30 la distribucin t tiende hacia la distribucin normal.

Tabulacin. La funcin de distribucin no puede calcularse en forma analtica; sin embargo, ha sido tabulada
para diferentes valores de la probabilidad acumulada, y para varios grados de libertad. Como la distribucin es
Bernardo A. Caldern C. Distribuciones muestrales 18

simtrica, solamente se presentan probabilidades acumuladas para valores positivos de t (t0). Los valores
que se presentan en los encabezamientos de las columnas de la tabla corresponden a las probabilidades de
exceder los respectivos valores de t, es decir, presentan las colas a la derecha de los valores respectivos de
t. Para encontrar probabilidades correspondientes a valores negativos de t hay que hacer uso de la propiedad
de simetra de la distribucin t que nos dice que (-t) = 1 - (t).

Notacin. Usaremos la notacin t ,P para denotar el valor de la distribucin t con grados de libertad y una
probabilidad acumulada de P hacia la derecha (o una probabilidad de 1-P hacia la izquierda).

La aplicacin fundamental para la cual se usa esta distribucin se presenta en el siguiente teorema.

2
Teorema. Si X y S son la media y la varianza de una muestra aleatoria de tamao n tomada de una
2
poblacin normal con media y varianza , entonces la variable
( X )
T=
S/ n
tiene la distribucin t con n-1 grados de libertad.

Demostracin: Sabemos que


(n1) S2
Y= 2
tiene una distribucin Chi Cuadrado con n-1 grados de libertad, y que

( X )
Z= tiene una distribucin normal (0,1). Entonces si aplicamos la definicin de la distribucin
/ n
t tenemos:
( X )
Z / n ( X )
T= = =
Y/ (n1) S 2 S/ n
2
(n 1)

Ejemplo. En un recorrido de prueba de una hora cada uno, el consumo promedio de gasolina de un motor fue
16.4 galones, con una desviacin estndar de 2.1 galones. Se quiere saber si es cierta la afirmacin de que
el consumo promedio de gasolina es 12 galones/hora.

Respuesta. Tenemos la siguiente informacin: n = 16, X = 16.4, s = 2.1 y = 12.0


Para responder la pregunta debemos verificar que tan probable es que una muestra de 16.4 galones
pertenezca a una distribucin con una media de 12. Por lo tanto, debemos calcular la probabilidad de que la
media muestral sea mayor o igual que 16.4 si la verdadera media de donde proviene dicha muestra es 12
galones. Esto es:

X 16.4 12.0
P( X 16.4) = P P(T 8.38)

S / n 2 . 1/ 16
Buscando en la tabla de la distribucin t con 15 grados de libertad, tenemos que para una probabilidad de
0.005 el respectivo valor de t es 2.947, lo cual implica que la probabilidad para t = 8.38 es cero). Por lo tanto,
concluimos que la probabilidad de obtener una muestra con una media de 16.4 de una poblacin cuya media
es 12.0 es cero, es decir, que el consumo promedio de gasolina no es 12 galones/hora, sino que es superior.

10. Distribucin F

Es la distribucin muestral aplicable para la relacin de dos varianzas.

Teorema. Si U y W son dos variables aleatorias independientes, cada una con distribucin Chi Cuadrado con
1 y 2 grados de libertad, respectivamente, entonces la distribucin de la siguiente variable aleatoria
Bernardo A. Caldern C. Distribuciones muestrales 19

U / 1
F=
W / 2
est dada por:
1 + 2 1

1
( +
2 1 2
)
2
1 2 1 / 21 1
f 1+ f , f >0
g (f ) = 1 2

2 2 2 2

0 eoc
y se denomina distribucin F con 1 y 2 grados de libertad (1 grados de libertad en el numerador y 2
grados de libertad en el denominador).

Notacin. Usaremos la notacin , 2,P para denotar el valor de la distribucin F con 1 grados de libertad
F1
en el numerador, 2 grados de libertad en el denominador y una probabilidad acumulada de P hacia la
1
derecha (o una probabilidad de 1-P hacia la izquierda). Puede demostrarse que F1, 2,P = , si se
F 2,1,1P
invierte la definicin de la distribucin F.

La aplicacin principal para la cual se desarroll la distribucin F es la comparacin de dos varianzas (de
poblaciones normales).

2
Sea X11, X12 ,..., X1n1 una muestra aleatoria (n1) tomada de una poblacin normal con varianza 1 , y sea
2
X12 , X22 ,..., X2n2 otra muestra aleatoria (n2) tomada de una poblacin normal con varianza 2 . Si
queremos realizar alguna inferencia sobre la igualdad o no de las varianzas, nos podemos basar en el hecho
que las siguientes relaciones
2 (n1 1) S12 2 (n2 1) S22
X1 = 2
y X2 = 2
1 2
son variables aleatorias con distribuciones Chi cuadrado con 1 y 2 grados de libertad, respectivamente, y
con las cuales podemos construir la distribucin F. El siguiente teorema clarifica este aspecto.
2 2
Teorema. Si S1 y S2 son las varianzas muestrales de dos variables aleatorias independientes de tamaos
2 2
n1 y n2 tomadas de poblaciones normales con varianzas 1 y 2 , entonces, la relacin
2
/ 2 2 2
F = S12 12 = S21 22
S 2 / 2 S 2 / 1
tiene una distribucin F con n1 1 y n2 -1 grados de libertad.

2 2
Demostracin. Si llamamos U y W a los dos relaciones X1 y X2 dadas anteriormente, y aplicamos la
definicin de la distribucin F, llegamos directamente al resultado deseado.

Tabulacin. De nuevo, la funcin de distribucin no puede calcularse en forma analtica; sin embargo, ha sido
tabulada para diferentes valores de la probabilidad acumulada, y para varios grados de libertad en el
numerador y en el denominador. Para cada valor de la probabilidad debe calcularse una tabla diferente. Los
valores de las probabilidades dados en las tablas corresponden a las probabilidades de exceder los
respectivos valores de F, es decir, presentan las colas a la derecha del valor respectivo de F. Las tablas estn
construidas bajo la suposicin de que la distribucin original de las variables aleatorias es normal.

11. Distribucin de la diferencia entre dos medias


Bernardo A. Caldern C. Distribuciones muestrales 20

2 2
Sean X1 y X2 dos variables aleatorias con valores esperados 1 y 2 y varianzas 1 y 2 , respectivamente.
Por ejemplo, X1 puede ser la duracin de una batera para carro de una marca, y X2 la duracin de una batera
de otra marca diferente. Si los medias 1 y 2 son desconocidas, podramos estar interesados en conocer si
ambas bateras tienen la misma duracin media. En forma similar, si las varianzas son desconocidas,
podramos estar interesados en saber si son iguales o no. Para realizar estas inferencias, se pueden someter
a pruebas idnticas diferentes bateras, controlando los factores externos, de tal forma que las diferencias se
deban exclusivamente a la clase de marca probada

Inicialmente estaremos interesados en verificar si ambas distribuciones tienen la misma media poblacional, es
decir si 1 = 2 equivalentemente 1 - 2 = 0.

Suponga que X11, X12 ,..., X1n 1


es una muestra aleatoria de tamao n1 tomada de una poblacin con

2
media 1 y varianza 1 , y X12 , X22 ,..., X2n2 es otra muestra aleatoria de tamao n2 tomada de una
2
poblacin con media 2 y varianza 2 . Si deseamos realizar alguna inferencia sobre 1 - 2, nos podemos
basar en la distribucin de la diferencia de las medias muestrales X1 X2 . Por el TCL sabemos que tanto

X1 como X2 se distribuyen normalmente con los siguientes parmetros:


2 2
X1 Normal (1, 1 / n1) , X 2 Normal (2 , 2 / n2)
Ahora bien, para la diferencia de las medias muestrales X1 X2 se tiene:
E(X1 X 2 )= 1 2

2 2
V(X1 X 2 ) = V ( X1) + V ( X 2) = 1 + 2
n1 n 2
Para conocer la distribucin muestral de las diferencias entre las medias se debe saber si las varianzas
poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe saber si son
iguales o diferentes. Cada uno de estos tres casos se analizar por separado.

a) Distribucin de la diferencia entre dos medias cuando las varianzas son conocidas.

2 2
Si las varianzas 1 y 2 son conocidas, tanto X1 como X2 se distribuyen normalmente. Por lo tanto la
distribucin de la diferencia entre las medias muestrales X1 X2 es normal con el valor esperado y la
varianza dados anteriormente, es decir,
2 2
, 1 + 2
X1 X 2 Normal
1 2 n
1 n 2
De acuerdo con lo anterior la siguiente variable aleatoria tiene una distribucin normal estndar:
X1 X 2 (1 2)
Z=
12 2
+ 2
n1 n 2
Por lo tanto, con base en la expresin anterior se pueden realizar inferencias con respecto a la diferencia de
medias poblacionales, bajo el supuesto de que las varianzas sean conocidas. Si adems, son iguales, la
expresin anterior se puede expresar como:
X X 2 (1 2)
Z= 1
1 1
+
n1 n 2
Bernardo A. Caldern C. Distribuciones muestrales 21

b) Distribucin de la diferencia entre dos medias cuando las varianzas son desconocidas pero
2 2 2
iguales ( 1 = 2 = )

Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadstica para verificar si
stas son iguales o diferentes. Para realizar esta prueba debemos hacer uso de la distribucin F para verificar
si la relacin de varianzas es igual a uno o diferente de uno.

Para cada una de las dos muestras se definen sus respectivas varianzas como:

1 n1 2 1 n2 2
S12 = (X1 j X1) , S12 = ( X 2 j X 2)
n1 1 j = 1 n 2 1 j = 1
( n1 1) S 2 (n 2 1) S 2
Adems
1 y 2 tienen distribuciones chi cuadrado con n - 1 y n -1 grados de libertad
1 2
2 2

respectivamente. Por lo tanto su suma tambin sigue otra distribucin chi cuadrado con n1 + n2 2 grados de
libertad. Es decir:
(n1 1) S12 (n 2 1) S2
2 2 ( + 2)
Y = + n1 n 2
2 2

Ahora bien, si Z es una variable normal (0,1) y Y tiene una distribucin chi cuadrado con grados de libertad,
Z
entonces la variable T = tiene una distribucin t con grados de libertad. Para nuestro caso la
Y/
variable Z corresponde a la distribucin de la diferencia de las dos medias, con varianzas conocidas, y la
variable chi cuadrado corresponde a la variable Y acabada de definir. Por lo tanto
X X 2 (1 2)
Z= 1
1 1
+
n1 n 2 X1 X 2 (1 2)
T= =
( n1 1) S 2 + ( n 2 1) S2 1
(n1 1) S12 (n 2 1) S 2
2 1 2 +
1
+ /( n1 + n 2 2) n1 + n 2 2 n1 n 2
2 2

X1 X2 (1 2)
T= t(n1 + n2 2)
1 1
Sp +
n1 n2
2 (n1 1) S12 + (n2 1) S22
donde S p= es un estimador ponderado de la varianza poblacional 2 obtenida
n1 + n2 2
ponderando las varianzas poblacionales por sus respectivos grados de libertad.

c) Distribucin de la diferencia entre dos medias cuando las varianzas son desconocidas y
2 2
diferentes ( 1 2 )
Cuando las varianzas son diferentes se puede demostrar que la siguiente variable aleatoria T sigue una
distribucin t con grados de libertad, donde
Bernardo A. Caldern C. Distribuciones muestrales 22

T=
X X
1 2 1 2
( )
t
S2 S2
1 + 2
n n
1 2
y el nmero de grados de libertad est dado por:

V=
(S12 / n1 + S22 / n2 )2
2 2
S2 / n S2 / n
1 1 + 2 2
n1 1 n2 1
Ejemplo. El gerente de una refinera piensa modificar el proceso para producir gasolina a partir de petrleo
crudo. El gerente har la modificacin slo si la gasolina promedio que se obtiene por este nuevo proceso
(expresada como un porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con base en un
experimento de laboratorio y mediante el empleo de dos muestras aleatorias de tamao 12, una para cada
proceso, la cantidad de gasolina promedio del proceso en uso es de 24.6 con una desviacin estndar de 2.3,
y para el proceso propuesto fue de 28.2 con una desviacin estndar de 2.7. El gerente piensa que los
resultados proporcionados por los dos procesos son variables aleatorias independientes normalmente
distribuidas con varianzas iguales. Con base en esta evidencia, debe adoptarse el nuevo proceso?

12. Problemas
2
Ejercicios varios

5-65. Si X y Y son variables aleatorias normales independientes con E(X) = 0, V(X) = 4, E(Y) = 10 y V(Y) = 9.
Calcule lo siguiente:
a. E(2X +3Y) b. V(2X + 3Y)
c. P(2X +3Y < 30) d. P(2X + 3Y < 40)
Respuestas : a) 30 b) 97c) 0.5 d) 0.846
5-66. Suponga que la variable aleatoria X representa la longitud, en pulgadas, de una pieza perforada. Sea Y
la longitud de la pieza en milmetros. Si E(X) = 5 pulgadas, cul es la media de Y?
5-67. La envoltura de plstico para un disco magntico est formada por dos hojas. El espesor de cada una
tiene una distribucin normal con media 1.5 milmetros y desviacin estndar de 0.1 milmetros. Las
hojas son independientes.
a. Determine la media y la desviacin estndar del espesor total de las dos hojas.
b. Cul es la probabilidad de que el espesor total sea mayor que 3.3 milmetros?
Respuestas :a) = 3 mm, = 0.1414 b) 0.017
5-68. El ancho del marco de una puerta tiene una distribucin normal con media 24 pulgadas y desviacin
estndar de 1/8 de pulgada. El ancho de la puerta tiene una distribucin normal con media 23 y7/8
pulgadas y desviacin estndar de 1/16 pulgadas. Suponga independencia.
a. Determine la media y la desviacin estndar de la diferencia entre el ancho del marco y el de la
puerta.
b. Cul es la probabilidad de que la diferencia entre el ancho del marco y el de la puerta sea mayor
que 1/4 de pulgada?
c. Cul es la probabilidad de que la puerta no quepa en el marco?
5-69. Un componente en forma de U est formado por tres piezas, A, B y C. La figura ilustra el componente.
La longitud de A tiene una distribucin normal con media de 10 milmetros y desviacin estndar de 0.1
milmetros. El espesor de las piezas B y C est distribuido normalmente con media de 2 milmetros y
desviacin estndar de 0.05 milmetros. Suponga que todas las dimensiones son independientes.
a. Determine la media y la desviacin estndar de la longitud del hueco D.
b. Cul es la probabilidad de que el hueco D sea menor que 5.9 milmetros?

2
Ejercicios tomados de "Probabilidad y Estadstica Aplicada la Ingeniera". Douglas C. Montgomery y George C.
Runger. McGraw Hill, 1997.
Bernardo A. Caldern C. Distribuciones muestrales 23

X X
D
B C

Y
Figura 5-21 Figura para el ejercicio 5-69.
Respuestas: a) E(D) =6 mm, D = 0.1225 mm b) 0.206
5-70. El llenado de las latas de una bebida suave lo hace una mquina de llenado automtica, con una
desviacin estndar de 0.5 onzas de lquido. Suponga adems que los volmenes con que se llenan
las latas son variables aleatorias normales independientes.
a. Cul es la desviacin estndar del volumen de llenado promedio de 100 latas?
b. Si el volumen de llenado promedio es 12.1 onzas, cul es la probabilidad de que el volumen de
llenado promedio de 100 latas sea menor que 12 onzas de lquido?
e. Cul debe ser el valor del volumen de llenado promedio para que la probabilidad sea 0.005 de que
el promedio en 100 latas sea menor que 12 onzas de lquido?
5-71 El espesor de la pelcula fotoprotectora en un proceso de fabricacin de semiconductores tiene una
media de 10 micrmetros y una desviacin estndar de 1 micrmetro. Supngase que el espesor tiene
una distribucin normal, y que el espesor entre diferentes obleas es independiente.
a. Calcule la probabilidad de que espesor promedio de 10 obleas sea mayor que 11 o menor que 9
micrmetros.
b. Determine el nmero de obleas que es necesario medir para que la probabilidad sea 0.01 de que el
espesor promedio sea mayor que 11 micrmetros.
3
Desigualdad de Chebychev y distribucin normal
5-72. El espesor de la pelcula fotoprotectora en un proceso de fabricacin de semiconductores tiene una
media de 10 micrmetros y una desviacin estndar de 1 micrmetro. Acote la probabilidad de que el
espesor sea menor que 6 o mayor que 14 micrmetros.
5-73. Suponga que X tiene una distribucin uniforme continua dentro del rango 0< x < 10. Utilice la regla de
Chebychev para acotar la probabilidad de que X difiera de su media por ms de dos desviaciones
estndar y compare el resultado con el valor real de la probabilidad. Respuestas: 0.25 contra 0
5-74. Suponga que X tiene una distribucin exponencial con media 20. Utilice la regla de Chebychev para
acotar la probabilidad de que X difiera de su media por ms de dos y tres desviaciones estndar, y
compare los resultados con el valor real de la probabilidad en cada caso.
5-75. Suponga que X tiene una distribucin Poisson con media . Utilice la regla de Chebychev para acotar
la probabilidad de que X difiera de su media por ms de dos y tres desviaciones estndar, y compare
los resultados con el valor real de la probabilidad en cada caso.
Respuestas: y contra 0.136 y 0.000046
5-76. Considere el proceso de taladrar agujeros en tarjetas de circuito impreso. Suponga que la desviacin
estndar de los dimetros es 0.01 y que stos son independientes. Suponga adems que se utiliza el
promedio de 500 dimetros para estimar la media del proceso.
a. Si la probabilidad de que el promedio medido se encuentre dentro de alguna cota alrededor de la
media del proceso, es al menos de 15/16, cul es el valor de la cota?
b. Si se supone que los dimetros tienen una distribucin normal, determine una cota tal que la
probabilidad de que el promedio medido est ms cercano a la media del proceso que la cota, sea
al menos de 15/16.
5-97. El peso de un caramelo pequeo tiene una distribucin normal con media 0.1 onzas desviacin
estndar de 0.01 onzas. Suponga que se colocan 16 caramelos en un paquete y que los pesos de
stos son independientes.
a. Cules son la media y la varianza del peso neto del paquete?

3
"Probabilidad y Estadstica Aplicada la Ingeniera". Douglas C. Montgomery y George C. Runger. McGraw Hill, 1997.
Bernardo A. Caldern C. Distribuciones muestrales 24

b. Cul es la probabilidad de que el peso neto del paquete sea menor que 1.6 onza
c. Si se colocan 17 caramelos en cada paquete, cul es la probabilidad de que peso neto de un
paquete sea menor que 1.6 onzas?. Respuestas: a ) E(X) = 1.6, V(X) = 0.0016 b) 0.5 c) 0.008
5-98. El tiempo para que un sistema automatizado localice una pieza en un almacn, tiene u distribucin
normal con media de 45 segundos y desviacin estndar de 30 segundos. Suponga que se hacen
pedidos independientes por 10 piezas.
a. Cul es la probabilidad de que el tiempo promedio necesario para localizar las piezas sea mayor
que 60 segundos?
b. Cul es la probabilidad de que el tiempo total necesario para localizar las piezas sea mayor que
600 segundos?
5-99. El ensamble mecnico empleado en el motor de un automvil tiene cuatro componentes importantes.
Los pesos de los componentes son independientes y estn distribuidos normalmente con las siguientes
medias y desviaciones estndar (en onzas):
componente Media Desviacin estndar
tapa izquierda 4.0 0.4
tapa derecha 5.5 0.5
ensamble de cojinetes 10.0 0.2
ensamble de tornillos 8.0 0.5
a. Cul es la probabilidad de que el peso de un ensamble sea mayor que 29.5 onzas?
b. Cul es la probabilidad de que el peso promedio de ocho ensambles independientes sea mayor que
29 onzas? Respuestas: a) 0.008 b) 0
4
Ejercicios para TCL
6-18. Se fabrica tubera PVC con un dimetro promedio de 1.01 in y desviacin estndar de 0.003 in.
Encuentre la probabilidad de que en una muestra aleatoria de n =9 secciones de tubera, el dimetro
promedio de la muestra sea mayor que 1.009 in y menor que 1.012 in.
6-19. Suponga que se toman muestras aleatorias de tamao n = 25 de una poblacin normal con media 100
y desviacin estndar 10. Cul es la probabilidad de que la media muestral se encuentre dentro del
intervalo de -1.8 y +1 desviaciones estndares ? Respuestas: 0.805
6-20. En la fabricacin de una alfombra se utiliza una fibra sinttica con una resistencia a la tensin que tiene
una distribucin normal con media 75.5 psi y desviacin estndar 3.5 psi. Encuentre la probabilidad de
que en una muestra aleatoria de n = 6 especmenes de fibra, la media de la resistencia a la tensin en
la muestra sea mayor que 75.75 psi.
6-21. Considere la fibra sinttica del ejercicio anterior. Cmo cambia la desviacin estndar de la media
muestral cuando el tamao de la muestra aumenta desde n = 6 hasta n = 49?
6-22. La resistencia a la compresin del concreto tiene una media de 2500 psi y una desviacin estndar de
50 psi. Encuentre la probabilidad de que la media muestral de una muestra aleatoria de n = 5
especmenes est en el intervalo de 2499 a 2510 psi.
6-23. Considere los especmenes de concreto del ejemplo anterior. Cul es el error estndar de la media
muestral? Respuestas: 22.361
6-24. Una poblacin normal tiene una media de 100 y una varianza de 25. De qu tamao debe ser la
muestra aleatoria que se tome de esta poblacin para que el error estndar del promedio de la muestra
sea 1.5?
6-25. Suponga que la variable aleatoria X tiene la distribucin uniforme continua
1, 0 x 1
f ( x) =
0 en cualquierotro caso
Suponga que se toma una muestra aleatoria de n = 12 observaciones de esta distribucin. Cul es la
distribucin de probabilidad de X 6 ?. Encuentre la media y la varianza de esta cantidad.
Respuestas:-11/2, 1/144

4
"Probabilidad y Estadstica Aplicada la Ingeniera". Douglas C. Montgomery y George C. Runger. McGraw Hill, 1997.
Bernardo A. Caldern C. Distribuciones muestrales 25

6-26. Suponga que X tiene una distribucin uniforme discreta


1 / 3, x = 1,2,3
f (x) =
0 en cualquierotro caso
De esta poblacin se toma una muestra aleatoria de tamao n = 36. Encuentre la probabilidad de que
la media muestral sea mayor que 2.1 pero menor que 2.5. Suponga que la media muestral puede
medirse hasta la dcima ms cercana.
6-27. El tiempo que un pasajero invierte esperando en un punto de revisin de un aeropuerto es una variable
aleatoria con media de 8.2 minutos y desviacin estndar de 1.5 minutos. Suponga que se observa
una muestra aleatoria de n =49 pasajeros. Encuentre la probabilidad de que el tiempo de espera
promedio en la fila para estos clientes sea
a. Menor que 10 minutos
b. Entre 5 y 10 minutos
c. Menor que 6 minutos
Respuestas: a) 1 b) 1 c) 0
6-28. Se toma una muestra aleatoria de tamao n = 16 de una poblacin normal que tiene una media de 75 y
una desviacin estndar de 8. De otra poblacin normal se toma una muestra aleatoria de tamao n2 =
9; esta poblacin tiene una media de 70 y una desviacin estndar de 12. Sean X y X las
1 2

medias de cada muestra, respectivamente. Encuentre


a. La probabilidad de que X 1 X 2 sea mayor que cuatro.
b. La probabilidad de que 3.5 X 1 X 2 5.5.

6-29. Una compaa que vende artculos electrnicos compara la brillantez de dos tipos diferentes de
cinescopios para su uso en televisores. El cinescopio de tipo A tiene una brillantez promedio de 100
con una desviacin estndar de 16, mientras que el cinescopio de tipo B tiene una brillantez promedio
desconocida, pero se supone que la desviacin estndar es la misma que la del cinescopio de tipo A.
Se toma una muestra aleatoria de n = 25 cinescopios de cada tipo y se calcula X A X B . Si B es
igual o mayor que A el fabricante adoptar el cinescopio de tipo B para utilizarlo en los televisores
que fabrica. La diferencia observada es X A X B = 3.5. Qu decisin tomar el fabricante y por
qu?
6-30. La elasticidad de un polmero es afectada por la concentracin de un reactivo. Cuando se utiliza una
concentracin baja, la elasticidad promedio verdadera es 55, mientras que cuando se emplea una
concentracin alta, la elasticidad promedio es 60. La desviacin estndar de la elasticidad es 4, sin
importar cul sea la concentracin. Si se toman dos muestras aleatorias de tamailo 16, encuentre la
probabilidad de que X alta X baja > 2
5
Ejercicios par TCL y distribucin de diferencias
1. Verifique la siguiente frmula de clculo del valor de la varianza de una muestra:
2
n n
n xi2 ( x i)
2= i =1 i =1
S n( n 1)
5. Si X1, X2,..., Xn son variables aleatorias independientes que tienen distribuciones de Bernoulli idnticas
con el parmetro ,entonces X es la proporcin de aciertos en n ensayos, que representamos como .
(1 )
Verifique que E( ) = , Var( ) =
n
8 La que sigue es una condicin suficiente para el teorema de lmite central: si las variables aleatorias X1,

5
Estadstica Matemtica con Aplicaciones. John E. Freund y Ronald E. Walpole. Prentice Hall Hispanoamericana S.A.,
pgina 287-289
Bernardo A. Caldern C. Distribuciones muestrales 26

X2, ...,Xn son independientes y estn uniformemente limitadas (es decir, hay una constante k positiva tal
que la probabilidad de que cualquiera de los trminos Xi tome un valor mayor que k o menor que -k sea
0), entonces si la varianza de Yn = X1 + X2 ++Xn se vuelve infinita cuando n, la distribucin de la
media estandarizada de las Xi tiende a la distribucin normal estndar. Demuestre que esta condicin
suficiente se cumple para una secuencia de variables aleatorias independientes Xi que tienen las
distribuciones de probabilidad:
i
1 1
para xi = 1 ( )
f i ( xi ) = 2 2
1 1 i
2 para x i = ( ) 1
2
13. Si se selecciona una muestra aleatoria de tamao n de la poblacin finita que consta de los primeros N
enteros positivos, demuestre que
( N + 1)
a) la media de la distribucin de X es
2
( N + 1)( N n)
b) la varianza de la distribucin de X es
12n
c) la media y la varianza de la distribucin de Y = n X son
( N + 1) n( N + 1)( N n)
E (Y ) = y V (Y ) =
2 12
6
Distribucin normal y aproximaciones
14. Cuntas muestras diferentes de tamao n = 3 se pueden tomar de una poblacin finita de tamao
a) N = 12; b) N = 20; c) N = 50?
15. Si se toma una muestra aleatoria de tamao n = 4 de una poblacin finita de tamao N = 200, cul es
la probabilidad de cada muestra posible? (R/0.000000015)
16 Si se toma una muestra aleatoria de tamao n = 3 de una poblacin finita de tamao N = 50, cul es
la probabilidad de que un elemento en particular de la poblacin sea incluido en la muestra?
17. En relacin con una muestra aleatoria de una poblacin infinita, qu le sucede al error estndar de la
media si el tamao de la muestra
a) se aumenta de 30 a 120;
b) se aumenta de 80 a 180;
c) se disminuye de 450 a 50;
d) se disminuye de 250 a 40?
R/a) Se divide entre 2 b) se divide entre 1.5 c) se multiplica por 3 d) se multiplica por 2.5)
18. Determine el valor del factor de correccin de la poblacin finita para
a) n = 5 y N = 200;
b) n = 50 y N = 300;
c) n = 200 y N = 800.
19. De una poblacin infinita con la media = 75 y la varianza 2 = 256, se toma una muestra al azar de
tamao n = 100. Si aplicamos el teorema de Chebyshev, con qu probabilidad podemos afirmar que
el valor que se obtenga de X estar entre 67 y 83? (R/ Cuando menos 24/25)
20 Utilice el teorema de lmite central en vez del de Chebyshev para resolver otra vez el ejercicio anterior.
21 De una poblacin infinita con la media = 128 y la desviacin estndar = 6.3, se toma una muestra
aleatoria de tamao n = 81. Con qu probabilidad podemos afirmar que el valor que se obtenga de X
no estar entre 126.6 y 129.4, si utilizamos
a) el teorema de Chebyshev;

6
Estadstica Matemtica con Aplicaciones. John E. Freund y Ronald E. Walpole. Prentice Hall Hispanoamericana S.A.,
pgina 289-291.
Bernardo A. Caldern C. Distribuciones muestrales 27

b) el teorema de lmite central.


(R/ a) Cuando mas 1/4 b) 0.0456
22. Resuelva otra vez el inciso b) del ejercicio anterior, suponiendo que la poblacin no es infinita, sino
finita y de tamao N = 400.
23. De una poblacin normal con = 51.4 y = 6.8, se toma una muestra al azar de tamao 64. Cul es
la probabilidad de que la media de la muestra
a) exceda de 52.9;
b) est entre 50.5 y 52.3;
c) sea menor que 50.6?
(R/ a) 0.0388 b) 0.7100 c) 0.1736
24. De una poblacin normal con = 25, se toma una muestra aleatoria de tamao 100. Cul es la
probabilidad de que la media de la muestra difiera de la media de la poblacin en 3 o ms en una u
otra forma?
25. De cada una de dos poblaciones con medias iguales y las desviaciones estndar 1 = 20 y 2 = 30, se
toman muestras aleatorias independientes de tamao 400. Mediante el uso del teorema de Chebyshev,
qu podemos afirmar, con una probabilidad de cuando menos 0.99, acerca del valor que
obtendremos de X 1 X 2 ?. (R/ El valor est entre -18.25 y 18.025)

26. Suponiendo que las dos poblaciones del ejercicio anterior son normales, utilice el resultado del
ejercicio 4 para obtener k al que P(-k < X 1 X 2 <k) = 0.99.

27. De dos poblaciones normales con las medias 1 = 78 y 2 = 75, y las varianzas 12 = 150 y 22 = 200,
se toman muestras aleatorias independientes de tamao n1 = 30 y n2 = 50. Use los resultados del
ejercicio 4 para obtener la probabilidad de que la media de la primera muestra exceder la de la
segunda muestra cuando menos en 4.8. (R/ 0.05)
28. La proporcin real de familias de cierta ciudad, que son dueas, no arrendatarios, de su casa es 0.70.
Si al azar se entrevistan a 84 familias de esta ciudad y sus respuestas a la pregunta de si son dueas o
no de su casa- se consideran valores de variables aleatorias independientes que tienen distribuciones
de Bernoulli idnticas con el parmetro =0.70, con qu probabilidad podemos afirmar que el valor
que se obtenga de la proporcin de la muestra - $ - estar entre 0.64 y 0.76, usando
a) el teorema de Chebyshev;
b) el teorema de lmite central?
29. La proporcin real de hombres partidarios de cierta propuesta de impuestos es 0.40 y la proporcin
correspondiente de mujeres es 0.25; n1 = 500 hombres y n2 = 400 mujeres son entrevistados al azar y
sus respuestas individuales se consideran como los valores de variables aleatorias independientes que
tienen distribuciones de Bernoulli con los parmetros respectivos 1 = 0.40 y 2 = 0.25. Qu podemos
afirmar, segn el teorema de Chebyshev, con una probabilidad de cuando menos 0.9975 acerca del
valor que obtendremos para $1 $ 2 , la diferencia entre dos proporciones de la muestra de
respuestas favorables? Utilice el resultado del ejercicio 6. (R/ t = -1.35; los datos fundamentan la
afirmacin)
7
Ejercicios Distribuciones Ji-Cuadrado, t y F
6-31. Para una distribucin ji-cuadrada, encuentre los siguientes valores:


2 2 2
a. b. c.
0.95,8 0.0.5,10 0. 99 ,18
Respuestas: a) 2.73 b) 9.34 c) 23.8
6-32. Para una distribucin ji-cuadrada, encuentre los siguientes valores:


2 2 2
a. b. c.
00.025,10 0.01,15 0. 99 ,18

7
"Probabilidad y Estadstica Aplicada la Ingeniera". Douglas C. Montgomery y George C. Runger. McGraw Hill, 1997.
Bernardo A. Caldern C. Distribuciones muestrales 28


2
6-33. Para una distribucin ji-cuadrada, encuentre tal que
,v

a.
2 ) = 0.975
P( X 10 b.
2 ) = 0.025
P( X 15
,10 ,15
c.
2 ) = 0.045
P(26.296 X 16 ,16
Respuestas: a)20.48 b) 6.26 c) 34.3


2
6-34. Para una distribucin ji-cuadrada, encuentre tal que
,v

a.
2 ) = 0.95
P( X 5 b.
2 ) = 0.20
P( X 10
,5 ,10
c.
2 ) = 0.20
P(12.549 X 10 ,10
6-35. Se toma una muestra aleatoria de n =25 observaciones de una poblacin normal que tiene una
2
varianza = 10. Encuentre la probabilidad de que la varianza de la muestra sea mayor que 16.4. R/
0.025
6-36. Para una distribucin t, encuentre los siguientes valores:
a. t0.025,10 b. t0.015,15 c. t0.01,20
6-37. Para una distribucin t, encuentre los siguientes valores:
a. t0.01,10 b. t0.05,10 c. t0.01,11
Respuestas: a) 2.76 b) 1.73 c) 2.72
6-38. Para una distribucin t, encuentre t,v tal que
a. P(T10 t,10) = 0.95 b. P(T15 t,15) = 0.01 c. P(T8 > t,8) = 0.90
6-39. Para una distribucin t, encuentre t,v tal que
a. P(T20 t,20) = 0.90 b. P(T15 > t,15) = 0.95 c. P(1.476 T8 t,5) = 0.075
Respuestas: a) 1.325 b) 1.753 c) 2.571
6-40. Una poblacin normal tiene una media conocida igual a 10, y una varianza desconocida. De esta
poblacin se toma una muestra aleatoria de tamao 25. Los resultados en la muestra son una media
de 11 y una desviacin estndar muestral de 4.2. Cun inusuales son estos resultados?
6-41. Para una distribucin F, encuentre lo siguiente:
a. f0.025,4,9 b. f0.05,15,10 c. f0.95,6,8 d. f0.90,24,24
Respuestas: a) 1.63 b) 2.85 c) 0.241 d) 0.588
6-42. Si S12 y S22 son las varianzas muestrales de muestras aleatorias independientes de tamaos n1 = 10 y
n2 = 20, tomadas de poblaciones normales que tienen las mismas varianzas, encuentre P(S12/S22
2.42).
6-43. Suponga que se tiene una variable aleatoria distribuida normalmente con media y varianza 2, y que
de esta distribucin se toma una muestra aleatoria de cinco observaciones. Cul es la funcin de
densidad de probabilidad conjunta de la muestra?
6-44. Los transistores tienen una vida til que est distribuida de manera exponencial, con parmetro . Se
toma una muestra aleatoria de n transistores. Cul es la funcin de densidad de probabilidad conjunta
de la muestra?
6-45. Suponga que X tiene una distribucin uniforme desde 0 hasta 1. Se toma una muestra aleatoria de
tamao 4 de X. Cul es la funcin de densidad de probabilidad conjunta de la muestra?
6-46. Un especialista en adquisiciones compra 25 resistores del vendedor 1, y 30 del vendedor 2. Sean X1,1,
X1,2,. .. , X1,25 las resistencias observadas del vendedor 1, las cuales se supone que estn distribuidas
de manera normal e independiente, con media 100 y desviacin estndar 1.5 . De manera similar;
sean X2,1, X2,2,... , X2,30 las resistencias observadas del vendedor 2, las cuales se supone que estn
distribuidas de manera normal e independiente, con media 105 y desviacin estndar 2.0 . Cul
es la distribucin de muestreo de X 1 X 2
Bernardo A. Caldern C. Distribuciones muestrales 29

6-47. Considere el problema de los resistores del ejercicio 6-46. Cul es el error estndar de X 1 X 2 ?
Respuestas: 0.4726
6-48. De una distribucin normal con media 50 y desviacin estndar 12, se toma una muestra aleatoria de
36 observaciones. Encuentre la probabilidad de que la media muestral est en el intervalo 47 < X <
53.
6-49. Es importante la hiptesis de normalidad en el ejercicio 6-48 Por qu? R/ No
6-50. Se realizan pruebas en una muestra aleatoria de n =9 elementos estructurales para determinar su
resistencia a la compresin. Se sabe que la media verdadera de la resistencia a la compresin es =
5500 psi y que la desviacin estndar es = 100 psi. Encuentre la probabilidad de que la resistencia
promedio a la compresin de la muestra sea mayor que 4985 psi.
6-51. Una poblacin normal tiene una media conocida de 50 y una varianza desconocida. De esta poblacin
se toma una muestra aleatoria de tamao n = 16; los resultados obtenidos de la muestra son x = 52 y
s = 1.5. Cun inusuales son estos resultados?
2
6-52. Se toma una muestra aleatoria de tamao n = 16 de una poblacin normal que tiene una varianza =
5. Encuentre la probabilidad de que la varianza de la muestra sea menor o igual que 7.44.
6-53. Un fabricante de dispositivos semiconductores toma una muestra aleatoria de 100 chips y los prueba;
cada chip se clasifica como defectuoso o no defectuoso. Sea Xi = 0 si el chip no es defectuoso, y Xi = 1
si el chip es defectuoso. La fraccin de chips defectuosos de la muestra es
X 1 + X 2 +...+ X 100
p$ =
100
Cul es la distribucin de muestreo de la variable aleatoria p$ ? R/ Aproximadamente normal
8
Distribuciones Ji Cuadrada, t y F

3. Verifique la identidad
n n
( X i )2 = ( X i X )2 + n ( X )2
i =1 i =1
utilizada en clase
5. Si el intervalo de X es el conjunto de todos los nmeros reales positivos, demuestre que para k > O
a) la probabilidad de que la variable aleatoria 2 X 2n tome un valor menor que k es igual a la
X n k2
probabilidad de que la variable aleatoria tome un valor menor que k +
2n 2 2n
b) Si X tiene una distribucin ji cuadrada con n grados de libertad, entonces para n grande la
distribucin de 2 X 2n puede determinarse, aproximadamente, con la distribucin normal
estndar.

Utilice tambin el resultado del inciso b) y el teorema 8.10 para demostrar que paran grande la varianza
2
de la distribucin muestral de S es, aproximadamente,
2(n 1)
6. Determine valores aproximados de la probabilidad de que una variable aleatoria X que tiene una
distribucin ji cuadrada con 50 grados de libertad, tome un valor mayor que 68.0
X
a) tratando a con = 50 como una variable aleatoria con distribucin normal estndar;
2

8
Estadstica Matemtica con Aplicaciones. John E. Freund y Ronald E. Walpole. Prentice Hall Hispanoamericana S.A.,
pgina 302-306
Bernardo A. Caldern C. Distribuciones muestrales 30

b) tratando a 2 X 2 con 50 como una variable aleatoria con distribucin normal


estndar.
Asimismo, juzgue los mritos de estas aproximaciones, dado que el valor real de la probabilidad
redondeado a cinco decimales) es 0.04596.

9. Si x y y son independientes, x tiene una distribucin normal con = 5 y la varianza 2 = 15 y Y tiene


una distribucin ji cuadrada con cinco grados de libertad, determine P(X - 5 > 3Y) (R/ 0.0763)

11. Demuestre que para > 2 la varianza de la distribucin t con grados de libertad es
2
12. Utilice la frmula de Stirling, del ejercicio 3 de la pgina 19, para demostrar que cuando la

n n
distribucin t se aproxima a la distribucin normal estndar. (Frmula de Stirloing n! = 2n
e
donde e es la base de los logaritmos naturales.

14. Pruebe que la distribucin t con un grado de libertad es una distribucin de Cauchy.

15. Demuestre que la distribucin F con 4 y 4 grados de libertad est dada por
6F 4

g (F) = (1+ F) para F > 0


0 en cualquier otra parte
y utilice esta densidad para obtener la probabilidad de que para muestras aleatorias independientes de
S12
tamao 5, tomadas de dos poblaciones normales con la misma varianza, tome un valor menor
S12
que o mayor que 2. (R/ 14/27)
1
16. Si X tiene una distribucin F con 1 y 2 grados de libertad, demuestre que Y = tiene una
X
distribucin F con 2 y 1 grados de libertad. (Este teorema es de importancia en la obtencin de
valores de F que no aparecen en la tabla.
1
17. Utilice el resultado del ejercicio 16 para probar que F 1 , 1, 2 = F 2, 1
,

18. Pruebe que para 2 > 2 la media de la distribucin F es


, e Investigue lo que sucede cuando
2

2 2
2 es igual a 1 y 2.

19. Si X tiene una distribucin beta con =


1
y =
2
, demuestre que
2 2

F=
2
X
2
(1 X )
tiene una distribucin F con 1 y 2 grados de libertad.
20. Si X tiene una distribucin F con 1 y 2 grados de libertad, pruebe que cuando 2 la distribucin de
1X tiende a la distribucin ji cuadrada con 1 grados de libertad.
21. Demuestre que si X tiene la distribucin t con grados de libertad, entonces X2 tiene la distribucin F
con 1 y grados de libertad.
22. Integre la densidad ji cuadrada apropiada para obtener la probabilidad de que la varianza de una
2
muestra aleatoria de tamao 5 de una poblacin normal con = 25 quede entre 20 y 30.
Bernardo A. Caldern C. Distribuciones muestrales 31

23. La afirmacin de que la varianza de una poblacin normal es 2 = 25 se rechazar si la varianza de


una muestra aleatoria de tamao 16 excede 54.668 o es menor que 12.102. Cul es la probabilidad
de que se rechace esta afirmacin aunque 2 = 25? (R/ 0.055)
24. La afirmacin de que la varianza de una poblacin normal es 2 = 4 se rechazar si la varianza de una
muestra aleatoria de tamao 9 excede 7.7535. Cul es la probabilidad de que se rechace esta
afirmacin aunque 2 = 4?

25. Una muestra aleatoria de tamao 25, tomada de una poblacin normal, tiene la media x = 47 y la
desviacin estndar s = 7. Basando nuestra decisin en el valor estadstico t podemos decir que la
informacin dada soporta la conjetura de que la media de la poblacin es = 42? (R/ 3.57, los datos no
soportan la conjetura)

26 Tomada de una poblacin normal, una muestra aleatoria de tamao 12 tiene la media x = 27.8 y la
2
varianza s = 3.24. Basando nuestra decisin en el valor estadstico t, podemos decir que la
informacin dada soporta la afirmacin de que la media de la poblacin es = 28.5?
27. Si s21 y s22 son las varianzas de variables aleatorias independientes de tamao n1 = 61 y n2 = 31 de
2 2 2 2
poblaciones normales con 1 = 12 y 2 = 18, determine P(s 1/s2 > 1.16). (R/ 0.05)
28. Si s21 y s22 son las varianzas de variables aleatorias independientes de tamao n1 = 10 y n2 = 15
tomadas de poblaciones normales con varianzas iguales, obtenga P(s21/s22 <4.03).
DISTRIBUCIONES MUESTRALES

(X ) (X )
1) Distribucin de la media: a) Z= N (0,1) , b) T = t n 1
/ n S/ n
(1 ) P
2) Distribucin de la proporcin P Normal , . Z= N(0,1)
n ( 1 )
n
1(11) + 2 (12) .
3) Diferencia de proporciones: P1 P 2 Normal 1 2 ,
n1 n2
1 / 2 1 x / 2 ,
/2 x e x0
4) Distribucin Chi Cuadrado: f (x) = 2 ( / 2)
0 , x<0

(n 1) S2 2
= nmero de grados de libertad, o grados de libertad. X =
2
n 1
2

5) Distribucin t de Student, con grados de libertad.
+1 +1

( ) 2 2
Z 2 1+ t
T= , f (t) = , <t<+
Y/ ( / 2)
6) Distribucin F (1 grados de libertad en el numerador y 2 grados de libertad en el denominador).
U / 1
U y W son dos vas independientes con distribuciones Chi Cuadrado con 1 y 2 grados de libertad, F= ,
W / 2
1 + 2 1

1
(
+
2 1 2
)
2 1 f
2 1 / 21 1
1+ f , f >0
g (f ) = 1 2
2 2
2 2

0 eoc
2 2 2 2
1/
F= S = S
2
1
2 2
1 2
2
tiene una distribucin F con n1 1 y n2 -1 grados de libertad.
2/
S 2 S 2/ 1
7) Distribucin de la diferencia entre dos medias
d) Varianzas conocidas:
12 2 X1 X 2 (1 2)
+ 2 , Z = N(0,1)
X1 X 2 Normal 1 2 ,
n1 n 2 2
1 2 2

+
n1 n 2
2 2 2
e) Varianzas desconocidas pero iguales ( 1 = 2 = )

X1 X 2 (1 2) ( n1 1) S 2 + (n 2 1) S 2
T= 2
t (n1 + n 2 2) , S p = 1 2
1 1 n1 + n 2 2
Sp +
n1 n 2
2 2
f) Varianzas desconocidas y diferentes ( 1 2 )

T=
X X
1 2 1 2
(
t , V =
)
S12 / n1 + S22 / n2 ( )2
2 2
S2 S2 S2 / n S2 / n
1 + 2 1 1 + 2 2
n n n1 1 n2 1
1 2

Вам также может понравиться