Вы находитесь на странице: 1из 8

Captulo 6

Muestreo Estadstico

En esta tema sentaremos las bases del muestreo estadstico y estudiaremos las distribuciones de algunos
estadsticos a partir de una muestra.

6.1. Conceptos bsicos


Aunque en el captulo de Estadstica Descriptiva ya vimos algunos de los conceptos bsicos sobre muestras,
no est de ms que los repitamos y ampliemos a continuacin:
Poblacin: Conjunto de individuos con una caracterstica observable comn.
Muestra: Subconjunto de la poblacin del que se espera que la represente.
El objetivo de la estadstica inferencial es obtener informacin sobre el conjunto de la poblacin a partir de
un subconjunto representativo de ella llamado muestra.
En la prctica lo ms comn es conocer slo una parte de la poblacin y lo que queremos es averiguar por
ejemplo qu esperanza o qu varianza o . . . tiene determinada poblacin.
Inferir informacin de una muestra es contestar preguntas sobre el total de la poblacin a partir del estudio
de una muestra representativa de la misma.

Pasos en un estudio con muestreo


a) Qu informacin se necesita?
b) Cul es la informacin relevante? Se dispone de acceso a todos los individuos de la poblacin?
c) Cmo seleccionamos los individuos de la muestra?
d) Qu mtodo emplearemos para obtener la informacin de los individuos de la muestra?
e) Qu herramientas utilizaremos para hacer inferencias?

f) Qu conclusiones podemos obtener?


g) Si las conclusiones son fiables y suficientes redactar informe, en caso contrario ir a (a).

6.1.1. Tipos de muestreo


Muestreo Aleatorio Simple (es el que estudiaremos en este tema)
Muestro Estratificado (por sexos, edades, nivel estudios,. . . variables de perfil)
Muestreo por Conglomerados (por ejemplo por provincias, barrios,. . . )
Muestreo Polietpico.
Muestreo no probabilstico.
Y otros . . .

71
Borrador RAM EST. SIS. 15-03-2004 72

Muestreo aleatorio simple


Queremos seleccionar una muestra de tamao n (es decir formada por n individuos) de una poblacin
de tamao N . Obtendremos una muestra aleatoria simple (m.a.s.) cuando todas las muestras posibles de n
individuos tengan la misma probabilidad de ser elegidas.
El tener una m.a.s de una poblacin junto con un tamao muestral adecuado nos asegurar la representati-
vidad suficiente de la muestra.
Observaciones
El proceso mismo del muestreo aleatorio simple es complejo.
Una forma sencilla es numerar, si es posible a todos los individuos de la poblacin y sortearlos eligiendo
nmeros como si se tratase de una lotera (por ejemplo con una tabla de nmeros aleatorios 1 o con un
generador de nmeros aleatorios).
En ocasiones esto es impracticable o muy caro:
a) Poblacin mundial de seres humanos.
b) Poblacin de llamadas a una centralita telefnica.
c) Poblacin de votantes en las prximas elecciones locales y autonmicas.

En algunos de estos casos ser luego impracticable localizar a los individuos seleccionados y convencerlos
de que respondan, muchos no querrn.

6.2. Inferencias
Nuestro inters es estudiar la distribucin de probabilidad de la muestra o de alguna funcin de la muestra
y de esta inferir resultados de la distribucin de probabilidad de la poblacin.

Estadsticos y distribuciones muestrales


Tenemos una m.a.s. de una poblacin y deseamos obtener informacin sobre la media o la varianza pobla-
cionales. Estas inferencias las basaremos en un estadstico, que estudiaremos en ms profundidad en los temas
siguientes y que no es ms que una funcin que depende de la muestra. p e: media aritmtica, proporcin
muestral. . .

6.2.1. Distribucin muestral de un estadstico


La distribucin muestral o distribucin en el muestreo de un estadstico es la distribucin de probabilidad de
los valores que puede tomar el estadstico en todas las posibles muestras, es decir la distribucin de la variable
aleatoria que define el estadstico.

Ejemplo 107 Supongamos que queremos estimar cul es nmero medio de discos de ordenador defectuosos en
las cajas de 10 discos de una determinada marca. Para ello tomamos una m.a.s de cuatro cajas X 1 , X2 X3 , X4
y obtenemos los siguientes resultados:
primera caja : 1 defectuoso
segunda caja : 2 defectuosos
tercera caja : 0 defectuoso
cuarta caja : 1 defectuosos
Definimos el estadstico media aritmtica como:
X1 + X 2 + X 3 + X 4
X = T (X1 , X2 , X3 , X4 ) =
4
En este caso X = 1.
Supongamos que tomamos repetidas muestras de tamao 4 y los resultados son:
1 En realidad los nmeros aleatorios generados por diversos tipos de algoritmos son pseudoalatorios; son nmeros que superan

determinados test de aleatoriedad


Borrador RAM EST. SIS. 15-03-2004 73

M. M. M. M. M. M. M. M. M. M.
1 2 3 4 5 6 7 8 9 10
0 1 3 0 0 1 0 0 0 1
1 1 1 0 1 1 1 0 0 2
0 1 2 1 0 0 1 2 0 1
1 1 2 2 1 3 0 0 1 1

M. M. M. M. M. M. M. M. M. M.
11 12 13 14 15 16 17 18 19 20
0 0 1 2 0 2 1 2 1 1
1 0 1 0 1 1 2 0 0 1
1 0 2 0 1 1 0 1 1 0
3 3 1 0 0 2 1 0 1 1
Las medias aritmticas de cada muestra son:
0.50 1.00 2.00 0.75 0.50
1.25 0.50 0.50 0.25 1.25
1.25 0.75 1.25 0.50 0.50
1.50 1.00 0.75 0.75 0.75
Entonces:
1
PX (0.25)) = P (X = 0.25) = = 0.05
20
6
PX (0.50)) = P (X = 0.50) = = 0.30
20
5
PX (0.75)) = P (X = 0.75) = = 0.25
20
2
PX (1)) = P (X = 1) = = 0.10
2
4
PX (1.25)) = P (X = 1.25) = = 0.20
20
1
PX (1.50)) = P (X = 1.5) = = 0.05
20
1
PX (2)) = P (X = 2) = = 0.05
20
Esta sera una aproximacin a la distribucin muestral del estadstico X a partir de los datos de varias
muestras.

6.2.2. Distribucin en el muestreo de la media muestral


La distribcuin del estadstico puede seguir un modelo preestablecido si se cumplen varias condiciones. Por
ejemplo, supongamos que hemos tomado una m.a.s. de n observaciones de una v.a. X en una poblacin de
media X y desviacin tpica X .
Representemos por X1 , X2 , . . . , Xn los elementos de n observaciones independientes que forman una m.a.s.
de sta poblacin. Cada una de las observaciones de la poblacin son as mismo v.a. con la misma esperanza y
varianza que la poblacin.
Llamaremos media aritmtica de la muestra (media muestral) X1 , . . . , Xn a
Pn
Xi
X = i=1
n
Observaciones: Notemos que:
1 1
a) E(X) = n E(X1 + X2 + + X n ) = n (X + X + + X ) = X
b) El valor esperando de la media aritmtica de la muestra es la media poblacional. Entonces el estadstico
media muestral estima la media poblacional. Dicho de otra forma la esperanza de la distribucin muestral
de la media aritmtica es la media poblacional.
Borrador RAM EST. SIS. 15-03-2004 74

Pero que el valor esperado sea X no quiere decir que X sea exactamente X . Estudiemos la varianza de
X. Como X1 , . . . , Xn son independientes tenemos que:
1 1 1 2 1 2
a) V ar(X) = n2 V ar(X1 + X2 + + Xn ) = n2 (V ar(X1 ) + V ar(X2 ) + + V ar(Xn )) = n2 nX = n X

b) Luego si n es suficientemente grande ( o cuando n ) la varianza tender a estar muy prxima a cero.

Ejemplo 108 No siempre tendremos independencia entre X1 , . . . , Xn . Por ejemplo supongamos que queremos
averiguar cuntos votos afirmativos hay en una urna con 10 votos. Tenemos dos opciones para realizar la m.a.s.:

a) Tomar un voto al azar anotar su resultado y devolverlo a la urna, repetir el proceso 3 veces ms. (muestreo
con reemplazamiento).

b) Tomar sucesivamente 4 votos de la urna sin reemplazarlos. (muestreo sin reemplazamiento).

En ambos casos la muestra obtenida es una m.a.s. pues todos los subconjuntos de individuos tienen igual
probabilidad de ser elegidos.
Pero en el primer caso tenemos independencia entre cada una de las observaciones mientras que en el
segundo esto no es as.
En la prctica se elige siempre el muestreo consistente en observar n individuos distintos. Si n es pequeo con
respecto a N podemos suponer que las variables son prcticamente independientes. Si no, tenemos que corregir
la varianza multiplicndola por lo que se llama factor de poblacin finita y tendremos que

2 1 2 N n
X = V ar(X) =
n X N 1
Que recuerda la varianza de una Hipergeomtrica.
Frecuentemente utilizaremos la expresin tipificada de la media muestral:

X X X X
Z= = X
X
n

Adems si aplicamos el T.L.C. para tamaos muestrales grandes la distribucin de Z es una normal estndar.
Resultado importantsimo pues sea cual sea la distribucin de X la distribucin de X ser conocida
si n es suficientemente grande.

Distribucin muestral de X
2
Sea X la v.a. de inters de una cierta poblacin con E(X) = X y V ar(X) = X y sea X1 , . . . , Xn una
muestra aleatoria simple de dicha poblacin:

a) X = E(X) = X
2 1 2 X
b) X = n X y la desviacin tpica de X es X =
n
que tambin recibe el nombre de error estndar de X.

c) En el caso en que el tamao muestral n no sea pequeo en relacin al tamao de la poblacin entonces
tenemos que aplicar el factor de correccin de poblacin finita en el clculo del error estndar de X:

2 1 2 N n
X =
n X N 1
q
X N n
y el error estndar ser X =
n N 1

d) Si la distribucin de la poblacin (X) es normal entonces la variable aleatoria:

X X
Z= X

n

es una normal estndar. O lo que es lo mismo X es una normal con media X y desviacin tpica X
Borrador RAM EST. SIS. 15-03-2004 75

e) Si la distribucin de la poblacin no es normal pero el tamao muestral es suficientemente grande entones


por el T.L.C. la distribucin de Z tambin se aproxima a una normal estndar y por lo tanto X se aproxima
a una normal con media X y desviacin tpica X

Ejemplo 109 El precio medio por m2 de venta de casas nuevas durante el ltimo ao en una determinada
ciudad fue de 115000 pts. La desviacin tpica de la poblacin fue de 25000 pts. Se toma una muestra aleatoria
de 100 casas nuevas de esta ciudad.
a) Cul es la probabilidad de que la media muestral de los precios de venta sea menor que 110000 pts?
b) Cul es la probabilidad de que la media muestral de los precios de venta est entre 113000 pts y 117000 pts?
c) Cul es la probabilidad de que la media muestral de los precios de venta est entre 114000 pts y 116000 pts?
d) Sin hacer clculos, razonar en cul de los siguientes rangos resulta ms probable que se encuentre la media
muestral de los precios de venta:

113000 pts.- 115000 pts.


114000 pts.- 116000 pts.
115000 pts.- 117000 pts.
116000 pts.- 118000 pts.

Supongamos que el nmero de casas de la ciudad sea muy grande en relacin al tamao muestral n = 100.
Entones si X es la v.a. precio de una casa de la ciudad el enunciado nos dice que X = E(X) = 115000. y X =
X
25000. Tomamos una m.a.s. X1 , . . . , X100 de precios entonces F X = X = 115000 y X = n
= 25000

100
= 2500
XX X115000
Adems Z = X

= 2500 sigue aproximadamente una distribucin normal estndar.
n
Solucin:
a) P (X 110000) =
P (Z 110000115000
2500 ) = P (Z 2) = FZ (2) = 1 FZ (2) = 1 0.9772 = 0.0228
b) P (113000 X 117000) =
P ( 113000115000
2500 Z 117000115000
2500 ) = FZ (0.8) FZ (0.8) = 2FZ (0.8) 1 = 2(0.7881) 1 = 0.5762
c) P (114000 X 116000) =
P ( 114000115000
2500 Z 116000115000
2500 ) = FZ (0.4) FZ (0.4) = 2FZ (0.8) 1 = 2(0.6554) 1 = 0.3108
d) La media aritmtica de los precios X sigue aproximadamente una distribucin normal entonces grfi-
camente el intervalo de mayor probabilidad ser el que mayor rea cubra bajo la curva normal (centrada en
115000) y ese intervalo es 116000 pts.-118000 pts.

6.2.3. Distribucin en el muestro de una proporcin muestral


La proporcin muestral de un evento en una poblacin vendr generalmente asociada a una variable binomial
(si la poblacin es pequea ser Hipergeomtrica).
Por ejemplo si tomamos una muestra de tamao n, determinar el porcentaje de votos
Pn que recibir el Partido
P.X. en las prximas elecciones es lo mismo que determinar el parmetro p de X = i Xi nmero de votantes
de P.X. en la muestra de tamao n, que es B(n, p) y donde cada Xi es una Ber(p) independiente de forma que
Xi = 1 si el isimo individuo y cero en caso contrario, as que la proporcin muetral es la media aritmtica de
observaciones Ber(p).
Ser realmente binomial? notemos que en la muestra no preguntaremos dos veces al mismo individuo, luego
las observaciones no son exactamente independientes, pero si el tamao de la poblacin es grande respecto a la
muestra podemos considerarlas as, ya que la probabilidad de repuesta afirmativa no cambia (es despreciable el
cambio).

Definicin 110 Sea X el nmero de xitos en una muestra binomial de n observaciones, con probabilidad de
xito p. Entonces la proporcin de xitos en la muestra es:
pX = X
n , y se denomina proporcin muestral.
Borrador RAM EST. SIS. 15-03-2004 76

Distribucin en el muestreo de pX
Sea pX la proporcin de xitos en una muestra aleatoria de n observaciones. Entonces:
E(X) np
a) E(pX ) = E( X
n)= n = n =p
V ar(X) np(1p) p(1p)
b) La distribucin muestral de pX tiene varianza p2X = V ar( X
n) = n2 = n2 = n y por lo tanto
q
p(1p)
su desviacin tpica es pX = n
que recibe tambin el nombre de error estndar de la proporcin muestral
c) Si n es pequeo en relacin al tamao de la poblacin N tenemos que aplicar el factor de correccin de
poblacin finita y entonces el error estndar de pX es
q q
pX = p(1p)
p
N n
N 1

d) Si el tamao muestral es grande (por ejemplo n > 30 o mejor n > 40) entonces
pX p
Z= pX

se distribuye aproximadamente como una normal estndar o lo que es lo mismo p X se distribuye aproxima-
damente como una normal con esperanza pX y varianza pX .
e) Cuando no se verifiquen las condiciones de aproximacin utilizaremos la distribucin t de Student que veremos
el el siguiente tema.

Observacin Notemos que si n crece el error estndar disminuye y entonces p estar ms cerca del valor
real p.

Ejemplo 111 El dueo de una tienda de discos ha comprobado que el 20 % de los clientes que entran en su
tienda realizan una compra. Cierta maana entraron en esa tienda 180 personas, que pueden ser consideradas
como una muestra aleatoria de todos sus clientes.
a) Cul ser la media de la proporcin muestral de clientes que realizaron alguna compra?
b) Cul es la varianza de la proporcin muestral?
c) Cul es el error estndar de la proporcin muestral?
d) Cul es la probabilidad de que la proporcin muestral sea mayor que 0.15?
Solucin: El tamao de la muestra es pequeo en relacin al nmero total de clientes. Tenemos que p = 0.2
(probabilidad de xito en la venta). Sea X= nmero de clientes que compran entre los 180, entonces:
a) pX = p = 0.2
p(1p) 0.2(10.2)
b) p2X = n = 180 = 0.0009
q
p(1p)
c) pX = n = 0.0009 = 0.03
pX p pX 0.2
d) Como n es grande entonces Z = pX = 0.03 sigue aproximadamente una distribucin normal estndar,
entonces:
0.150.2
P (pX > 0.15) = 1 P (pX 0.15) = 1 P (Z 0.03 ) = 1 FZ (1.67) = FZ (1.6) = 0.9452

6.2.4. Distribucin muestral de la varianza muestral


2
Definicin 112 Sea X1 , . . . , Xn una m.a.s. de una poblacin (X) con E(X) = X y V ar(X) = X . Llamare-
mos varianza
P muestral a :
n
2 (Xi X)2
SX = i=1n1
p
SX = + SX2 recibe el nombre de desviacin tpica muestral.

Denotaremos por SX2
= n1 2
n SX y SX = SX .
Borrador RAM EST. SIS. 15-03-2004 77

Pn  Pn 
2 (Xi X)2 Xi2 2
Proposicin 113 1. SX = i=1
n = i=1
n X

2 n1 2
2. E(SX )= n X
 Pn 
2 n Xi2 2
3. SX = n1
i=1
n X

2 2
4. E(SX ) = X
Demostracin: Se deja como ejercicio (recomendado).

2
6.2.5. Distribucin en el muestreo de SX
Con las notaciones anteriores tenemos que:
2 2
a) E(SX ) = X
2
(n1)SX
b) Si la distribucin de la poblacin es normal entonces la variable 2
X
se distribuye segn una ley 2n1

9.4.2. La distribucin 2n (chi-cuadrado con n g.l.)


Si X1 , X2 , . . . , Xn son n v.a. independientes y Xi N (0, 1) entonces:

X = X12 + X22 + . . . + Xn2

es una v.a. que diremos que se distribuye chi-cuadrado con n grados de libertad y lo notaremos por 2n
La funcin de densidad de una 2n es :
1
f (x) = x(n/2)1 ex/2
2n/2 (n/2)
R +
con x 0 y (n/2) = 0
u(n/2)1 eu du la llamada funcin gamma.

Grfica de la funcin de densidad de una 2

Su funcin de distribucin se puede calcular pero por nuestra comodidad est tabulada.

Ejemplo 114 Las rentabilidades mensuales de cierto tipo de acciones son independientes unas de otras, y
siguen una distribucin normal con desviacin tpica 1.7. Se toma una muestra de 12 meses.
a) Hallar la probabilidad de que la desviacin tpica muestral sea menor que 2.5.
b) Hallar la probabilidad de que la desviacin tpica muestral sea mayor que 1.
Borrador RAM EST. SIS. 15-03-2004 78

2
Solucin Sea X= rentabilidad de las acciones. Sabemos que X = (1.7)2 adems como la distribucin de
2
(n1)SX
la poblacin es normal y n = 12 tenemos que 2
X
sigue una distribucin 211 .
2 2
(121)SX
2
a) P (SX < 2.5) = P (SX P ( (1.7)2 < (121)(2.5)
< (2.5)2 ) = (1.7)2 ) = P (211 < 23.7889) P (211 < 24.725) =
0.99.
2 (121)S 2 (121)1
b) P (SX > 1) = P (SX > 1) = P ( 1.72 X > 1.72 ) = P (211 > 3.80623) = 1 P (211 > 3.816) =
1 0.25 = 0.975

Вам также может понравиться