Академический Документы
Профессиональный Документы
Культура Документы
Muestreo Estadstico
En esta tema sentaremos las bases del muestreo estadstico y estudiaremos las distribuciones de algunos
estadsticos a partir de una muestra.
71
Borrador RAM EST. SIS. 15-03-2004 72
En algunos de estos casos ser luego impracticable localizar a los individuos seleccionados y convencerlos
de que respondan, muchos no querrn.
6.2. Inferencias
Nuestro inters es estudiar la distribucin de probabilidad de la muestra o de alguna funcin de la muestra
y de esta inferir resultados de la distribucin de probabilidad de la poblacin.
Ejemplo 107 Supongamos que queremos estimar cul es nmero medio de discos de ordenador defectuosos en
las cajas de 10 discos de una determinada marca. Para ello tomamos una m.a.s de cuatro cajas X 1 , X2 X3 , X4
y obtenemos los siguientes resultados:
primera caja : 1 defectuoso
segunda caja : 2 defectuosos
tercera caja : 0 defectuoso
cuarta caja : 1 defectuosos
Definimos el estadstico media aritmtica como:
X1 + X 2 + X 3 + X 4
X = T (X1 , X2 , X3 , X4 ) =
4
En este caso X = 1.
Supongamos que tomamos repetidas muestras de tamao 4 y los resultados son:
1 En realidad los nmeros aleatorios generados por diversos tipos de algoritmos son pseudoalatorios; son nmeros que superan
M. M. M. M. M. M. M. M. M. M.
1 2 3 4 5 6 7 8 9 10
0 1 3 0 0 1 0 0 0 1
1 1 1 0 1 1 1 0 0 2
0 1 2 1 0 0 1 2 0 1
1 1 2 2 1 3 0 0 1 1
M. M. M. M. M. M. M. M. M. M.
11 12 13 14 15 16 17 18 19 20
0 0 1 2 0 2 1 2 1 1
1 0 1 0 1 1 2 0 0 1
1 0 2 0 1 1 0 1 1 0
3 3 1 0 0 2 1 0 1 1
Las medias aritmticas de cada muestra son:
0.50 1.00 2.00 0.75 0.50
1.25 0.50 0.50 0.25 1.25
1.25 0.75 1.25 0.50 0.50
1.50 1.00 0.75 0.75 0.75
Entonces:
1
PX (0.25)) = P (X = 0.25) = = 0.05
20
6
PX (0.50)) = P (X = 0.50) = = 0.30
20
5
PX (0.75)) = P (X = 0.75) = = 0.25
20
2
PX (1)) = P (X = 1) = = 0.10
2
4
PX (1.25)) = P (X = 1.25) = = 0.20
20
1
PX (1.50)) = P (X = 1.5) = = 0.05
20
1
PX (2)) = P (X = 2) = = 0.05
20
Esta sera una aproximacin a la distribucin muestral del estadstico X a partir de los datos de varias
muestras.
Pero que el valor esperado sea X no quiere decir que X sea exactamente X . Estudiemos la varianza de
X. Como X1 , . . . , Xn son independientes tenemos que:
1 1 1 2 1 2
a) V ar(X) = n2 V ar(X1 + X2 + + Xn ) = n2 (V ar(X1 ) + V ar(X2 ) + + V ar(Xn )) = n2 nX = n X
b) Luego si n es suficientemente grande ( o cuando n ) la varianza tender a estar muy prxima a cero.
Ejemplo 108 No siempre tendremos independencia entre X1 , . . . , Xn . Por ejemplo supongamos que queremos
averiguar cuntos votos afirmativos hay en una urna con 10 votos. Tenemos dos opciones para realizar la m.a.s.:
a) Tomar un voto al azar anotar su resultado y devolverlo a la urna, repetir el proceso 3 veces ms. (muestreo
con reemplazamiento).
En ambos casos la muestra obtenida es una m.a.s. pues todos los subconjuntos de individuos tienen igual
probabilidad de ser elegidos.
Pero en el primer caso tenemos independencia entre cada una de las observaciones mientras que en el
segundo esto no es as.
En la prctica se elige siempre el muestreo consistente en observar n individuos distintos. Si n es pequeo con
respecto a N podemos suponer que las variables son prcticamente independientes. Si no, tenemos que corregir
la varianza multiplicndola por lo que se llama factor de poblacin finita y tendremos que
2 1 2 N n
X = V ar(X) =
n X N 1
Que recuerda la varianza de una Hipergeomtrica.
Frecuentemente utilizaremos la expresin tipificada de la media muestral:
X X X X
Z= = X
X
n
Adems si aplicamos el T.L.C. para tamaos muestrales grandes la distribucin de Z es una normal estndar.
Resultado importantsimo pues sea cual sea la distribucin de X la distribucin de X ser conocida
si n es suficientemente grande.
Distribucin muestral de X
2
Sea X la v.a. de inters de una cierta poblacin con E(X) = X y V ar(X) = X y sea X1 , . . . , Xn una
muestra aleatoria simple de dicha poblacin:
a) X = E(X) = X
2 1 2 X
b) X = n X y la desviacin tpica de X es X =
n
que tambin recibe el nombre de error estndar de X.
c) En el caso en que el tamao muestral n no sea pequeo en relacin al tamao de la poblacin entonces
tenemos que aplicar el factor de correccin de poblacin finita en el clculo del error estndar de X:
2 1 2 N n
X =
n X N 1
q
X N n
y el error estndar ser X =
n N 1
X X
Z= X
n
es una normal estndar. O lo que es lo mismo X es una normal con media X y desviacin tpica X
Borrador RAM EST. SIS. 15-03-2004 75
Ejemplo 109 El precio medio por m2 de venta de casas nuevas durante el ltimo ao en una determinada
ciudad fue de 115000 pts. La desviacin tpica de la poblacin fue de 25000 pts. Se toma una muestra aleatoria
de 100 casas nuevas de esta ciudad.
a) Cul es la probabilidad de que la media muestral de los precios de venta sea menor que 110000 pts?
b) Cul es la probabilidad de que la media muestral de los precios de venta est entre 113000 pts y 117000 pts?
c) Cul es la probabilidad de que la media muestral de los precios de venta est entre 114000 pts y 116000 pts?
d) Sin hacer clculos, razonar en cul de los siguientes rangos resulta ms probable que se encuentre la media
muestral de los precios de venta:
Supongamos que el nmero de casas de la ciudad sea muy grande en relacin al tamao muestral n = 100.
Entones si X es la v.a. precio de una casa de la ciudad el enunciado nos dice que X = E(X) = 115000. y X =
X
25000. Tomamos una m.a.s. X1 , . . . , X100 de precios entonces F X = X = 115000 y X = n
= 25000
100
= 2500
XX X115000
Adems Z = X
= 2500 sigue aproximadamente una distribucin normal estndar.
n
Solucin:
a) P (X 110000) =
P (Z 110000115000
2500 ) = P (Z 2) = FZ (2) = 1 FZ (2) = 1 0.9772 = 0.0228
b) P (113000 X 117000) =
P ( 113000115000
2500 Z 117000115000
2500 ) = FZ (0.8) FZ (0.8) = 2FZ (0.8) 1 = 2(0.7881) 1 = 0.5762
c) P (114000 X 116000) =
P ( 114000115000
2500 Z 116000115000
2500 ) = FZ (0.4) FZ (0.4) = 2FZ (0.8) 1 = 2(0.6554) 1 = 0.3108
d) La media aritmtica de los precios X sigue aproximadamente una distribucin normal entonces grfi-
camente el intervalo de mayor probabilidad ser el que mayor rea cubra bajo la curva normal (centrada en
115000) y ese intervalo es 116000 pts.-118000 pts.
Definicin 110 Sea X el nmero de xitos en una muestra binomial de n observaciones, con probabilidad de
xito p. Entonces la proporcin de xitos en la muestra es:
pX = X
n , y se denomina proporcin muestral.
Borrador RAM EST. SIS. 15-03-2004 76
Distribucin en el muestreo de pX
Sea pX la proporcin de xitos en una muestra aleatoria de n observaciones. Entonces:
E(X) np
a) E(pX ) = E( X
n)= n = n =p
V ar(X) np(1p) p(1p)
b) La distribucin muestral de pX tiene varianza p2X = V ar( X
n) = n2 = n2 = n y por lo tanto
q
p(1p)
su desviacin tpica es pX = n
que recibe tambin el nombre de error estndar de la proporcin muestral
c) Si n es pequeo en relacin al tamao de la poblacin N tenemos que aplicar el factor de correccin de
poblacin finita y entonces el error estndar de pX es
q q
pX = p(1p)
p
N n
N 1
d) Si el tamao muestral es grande (por ejemplo n > 30 o mejor n > 40) entonces
pX p
Z= pX
se distribuye aproximadamente como una normal estndar o lo que es lo mismo p X se distribuye aproxima-
damente como una normal con esperanza pX y varianza pX .
e) Cuando no se verifiquen las condiciones de aproximacin utilizaremos la distribucin t de Student que veremos
el el siguiente tema.
Observacin Notemos que si n crece el error estndar disminuye y entonces p estar ms cerca del valor
real p.
Ejemplo 111 El dueo de una tienda de discos ha comprobado que el 20 % de los clientes que entran en su
tienda realizan una compra. Cierta maana entraron en esa tienda 180 personas, que pueden ser consideradas
como una muestra aleatoria de todos sus clientes.
a) Cul ser la media de la proporcin muestral de clientes que realizaron alguna compra?
b) Cul es la varianza de la proporcin muestral?
c) Cul es el error estndar de la proporcin muestral?
d) Cul es la probabilidad de que la proporcin muestral sea mayor que 0.15?
Solucin: El tamao de la muestra es pequeo en relacin al nmero total de clientes. Tenemos que p = 0.2
(probabilidad de xito en la venta). Sea X= nmero de clientes que compran entre los 180, entonces:
a) pX = p = 0.2
p(1p) 0.2(10.2)
b) p2X = n = 180 = 0.0009
q
p(1p)
c) pX = n = 0.0009 = 0.03
pX p pX 0.2
d) Como n es grande entonces Z = pX = 0.03 sigue aproximadamente una distribucin normal estndar,
entonces:
0.150.2
P (pX > 0.15) = 1 P (pX 0.15) = 1 P (Z 0.03 ) = 1 FZ (1.67) = FZ (1.6) = 0.9452
Pn Pn
2 (Xi X)2 Xi2 2
Proposicin 113 1. SX = i=1
n = i=1
n X
2 n1 2
2. E(SX )= n X
Pn
2 n Xi2 2
3. SX = n1
i=1
n X
2 2
4. E(SX ) = X
Demostracin: Se deja como ejercicio (recomendado).
2
6.2.5. Distribucin en el muestreo de SX
Con las notaciones anteriores tenemos que:
2 2
a) E(SX ) = X
2
(n1)SX
b) Si la distribucin de la poblacin es normal entonces la variable 2
X
se distribuye segn una ley 2n1
es una v.a. que diremos que se distribuye chi-cuadrado con n grados de libertad y lo notaremos por 2n
La funcin de densidad de una 2n es :
1
f (x) = x(n/2)1 ex/2
2n/2 (n/2)
R +
con x 0 y (n/2) = 0
u(n/2)1 eu du la llamada funcin gamma.
Su funcin de distribucin se puede calcular pero por nuestra comodidad est tabulada.
Ejemplo 114 Las rentabilidades mensuales de cierto tipo de acciones son independientes unas de otras, y
siguen una distribucin normal con desviacin tpica 1.7. Se toma una muestra de 12 meses.
a) Hallar la probabilidad de que la desviacin tpica muestral sea menor que 2.5.
b) Hallar la probabilidad de que la desviacin tpica muestral sea mayor que 1.
Borrador RAM EST. SIS. 15-03-2004 78
2
Solucin Sea X= rentabilidad de las acciones. Sabemos que X = (1.7)2 adems como la distribucin de
2
(n1)SX
la poblacin es normal y n = 12 tenemos que 2
X
sigue una distribucin 211 .
2 2
(121)SX
2
a) P (SX < 2.5) = P (SX P ( (1.7)2 < (121)(2.5)
< (2.5)2 ) = (1.7)2 ) = P (211 < 23.7889) P (211 < 24.725) =
0.99.
2 (121)S 2 (121)1
b) P (SX > 1) = P (SX > 1) = P ( 1.72 X > 1.72 ) = P (211 > 3.80623) = 1 P (211 > 3.816) =
1 0.25 = 0.975