Вы находитесь на странице: 1из 8

TEMA 1

CONCEPTO DE MUESTREO PROBABILSTICO.

DISTRIBUCIN DE UN ESTIMADOR EN EL MUESTREO.

ERROR CUADRTICO MEDIO Y SUS COMPONENTES.

MTODOS DE SELECCIN Y PROBABILIDAD DE LA UNIDAD DE


PERTENECER A LA MUESTRA.

MTODOS ESPECIALES DE SELECCIN CON PROBABILIDADES


PROPORCIONALES AL TAMAO.
Muestreo Tema 1

l. CONCEPTO DE MUESTREO PROBABILSTICO.

La inferencia estadstica es un razonamiento deductivo en el que a partir de las frecuencias


observadas de una variable tratamos de deducir el modelo probabilstico que ha generado
los datos.

Existen diferentes formas de hacer inferencia. Cuando lo que queremos es describir una
variable o las relaciones existentes entre un conjunto de variables, utilizamos tcnicas de
muestreo, consistentes en extraer un conjunto representativo de la poblacin en estudio.
Cuando hablamos de poblacin, nos estamos refiriendo a un conjunto de elementos en los
cuales se estudia una determinada caracterstica. Ahora bien, en multitud de ocasiones no
resulta posible estudiar todos ellos pues este estudio puede implicar la destruccin de los
elementos, o puede resultar un anlisis demasiado costoso, o este puede llevar demasiado
tiempo. En esas situaciones seleccionaramos un conjunto representativo de la poblacin,
al que llamamos muestra, con el cual podemos obtener una informacin similar a la dada
por un censo, es decir, un estudio exhaustivo de todos sus elementos, con mayor rapidez y
menor coste.

Designamos por u1 ,..., u N a las N unidades que constituye la poblacin finita objeto de
estudio. Una sucesin ordenada de n elementos de la poblacin u i1 ,..., u in se denomina
muestra de tamao n.

Pues bien, un proceso mediante el cual se selecciona una de estas muestras, de modo que
cada una tenga una determinada probabilidad de ser elegida decimos que es un
procedimiento de muestreo probabilstico. El mecanismo aleatorio empleado por el
investigador para seleccionar la muestra debe definir en el conjunto de muestras posibles S
una funcin de probabilidad p tal que:
p ( s ) 0, p( s) 1
sS

2.DISTRIBUCIN DE UN ESTIMADOR EN EL MUESTREO.

Sea X la variable aleatoria en estudio, y x1 ,..., x n una muestra extrada de la poblacin


cuyos elementos poseen la caracterstica X. Supongamos que X tiene una distribucin
conocida caracterizada por unos parmetros que nos son desconocidos, y cuyo valor
vamos a inferir a partir de la informacin de la muestra.
Llamaremos estadstico a cualquier funcin de las observaciones mustrales
T ( X 1 ,..., X n ) , donde cada X i es una v.a con la misma distribucin que X. Llamaremos
estimador a cualquier estadstico cuyo valor utilicemos para estimar ; siendo la
estimacin el valor del estimador para una muestra concreta.

Al tratar de determinar las propiedades de los estimadores, nos encontramos con la


dificultad de que el estimador es un v.a, pues es una funcin T ( X 1 ,..., X n ) de n v.a, cuyo
valor varia de muestra en muestra. La distribucin que sigue esta v.a. se denomina
distribucin del estimador en el muestreo, la cual depender en general de la poblacin de
la que sea extrada la muestra y del tamao muestral n. Su clculo matemtico es , en
general, complicado. Sin embargo, siempre podemos deducirla de manera aproximada por
diferentes mtodos. En otros casos, las comparaciones entre estimadores no requieren

2
Muestreo Tema 1

conocer toda la distribucin, sino slo sus principales momentos, que s pueden tener un
clculo ms factible.

3. ERROR CUADRTICO MEDIO Y SUS COMPONENTES.

Diremos que un estimador de es insesgado o centrado si el valor promedio de


sobre todas las muestras posibles es igual a .

El hecho de que un estimador sea centrado no es definitivo para elegir a ese estimador para
llevar a cabo la estimacin. Por ejemplo, puede ocurrir que un estimador fuera centrado
1 pero tuviera una alta variabilidad y por tanto ser muy poco preciso, y eligiramos otro
2 de menor variabilidad, aunque sesgado.

'

A fin de elegir entre dos estimadores con propiedades contrapuestas, o bien entre dos
estimadores con diferentes sesgos, un criterio muy utilizado es el de escoger aqul que
presente un menor error cuadrtica medio, definido as:


E.C .M .() E ( ) E ( E () E () ) E ( E ()) 2
( E () )
que es la suma de la varianza de y el cuadrado de su sesgo. La primera componente da
lugar al concepto de precisin, y ambas juntas, al de acuracidad.

4.MTODOS DE SELECCIN Y PROBABILIDAD DE LA UNIDAD


DE PERTENECER A LA MUESTRA.

En primer lugar, podemos clasificar los procedimientos de seleccin en:

Seleccin con reposicin, donde la unidad muestral es devuelta a la poblacin una


vez observada, por lo que puede volver a ser seleccionada de nuevo en la muestra.

Seleccin sin reposicin, donde la unidad muestral no se devuelve a la poblacin


tras ser observada, y por tanto todas las unidades mustrales son distintas entre si.

Atendiendo a esta clasificacin, podemos destacar los siguientes procedimientos bsicos de


seleccin:

a) Seleccin con probabilidades iguales y sin reposicin: todas las unidades de la


poblacin tienen igual probabilidad de ser elegida en cada seleccin, siendo esta
probabilidad 1/N en la primera seleccin, 1/(N-1) en la segunda, l/(N-2) en la tercera
3
Muestreo Tema 1

As, si u1 ,..., u n es una muestra cualquiera, su probabilidad de seleccin es

1 1 1

N N 1 N n 1

considerando que son muestras iguales con los mismos elementos sin fijarnos en su
orden, entonces,
p u1 ,...u n ( n!( N n)!) / N !

pues hay n! rdenes diferentes. En ambos casos todas las muestras tienen igual
probabilidad de ser elegidas.

Si definimos las variable auxiliares e1 ,..., e N ,

1, si ui muestra , i
ei
0 , si ui muestra , 1 i
Se tiene que E (ei ) i .

Entonces ,
N N
n E ei i
i 1 i 1

Llamando ij a la probabilidad de que u i , u j estn en la muestra , y sean X u i las


muestras que contienen u i y X u j las que contienen u j , entonces

i p ( X (u i )) , ij p( X (u , u
i, j
i j ))

y al sumar los valores ij para j i aparecern repetidas n-1 veces las muestras que
contienen u i ; por existir en cada una n-1 unidades con j i , luego


i j
ij (n 1) i


i i j
ij n(n 1)

4
Muestreo Tema 1

Adems, la probabilidad de que u i sea seleccionada en la primera, segunda, tercera,


etc. selecciones es respectivamente

1
N

N 1 1 1

N N 1 N

N 1 N 2 1
....
N N 1 N

b) Seleccin con probabilidades iguales y con reposicin: todas las unidades de la


poblacin tiene igual probabilidad de ser elegidas en cada seleccin, siendo esta
probabilidad 1/N en cada una de ellas.

Si u1 ,..., u n es una muestra cualquiera, la probabilidad que tiene de ser seleccionada


ser 1 / N n pues las selecciones son independientes entre s al ser el procedimiento
con reposicin. Ahora bien, si consideramos muestras iguales las que contienen los
mismos elementos aunque en distinto orden entonces esta probabilidad variar de una
muestra a otra.

Si definimos las v.a

ei n de veces u i est en la muestra

entonces por construccin el vector aleatorio e1 ,..., e N sigue una distribucin

1 1
M n n, ,...,
N N
y por tanto

n
E ( ei )
N

1 1
Var (ei ) n 1
N N

n
Cov (ei , e j )
N

La probabilidad de que la unidad u i est en la muestra ser n/N, pues las selecciones
son independientes entre s.

5
Muestreo Tema 1

c) Seleccin sistemtica con arranque aleatorio, supongamos que tenemos una poblacin
de tamao N, u1 ,..., u N , con N=nk. El procedimiento consiste en seleccionar
aleatoriamente un nmero entero entre 1 y k, de modo que si este nmero es j, se
seleccionan la unidad , u j , as como u j 1 ,..., u j ( n 1) k .Todas las muestra posibles
tienen entonces igual probabilidad de ser seleccionada, 1/k, que coincide con la
probabilidad de elegir a j entre 1 y k.

Esta seleccin tiene la ventaja de extender la muestra sobre toda la poblacin, y ser de
fcil aplicacin. Sin embargo, puede llevar a introducir sesgos debido al hecho de que
cada unidad en la muestra es seleccionada con una periodicidad constante, k.

d) Seleccin con probabilidades desiguales sin reposicin: en ocasiones resulta ms


conveniente en trminos de representatividad asignar probabilidades desiguales de
seleccin a las unidades de la poblacin, con el fin de respetar ciertas diferencias que
puedan existir entre tales unidades.
El caso ms comn consiste en asignar probabilidades proporcionales al tamao M i
de las unidades. El caso sin reposicin responde entonces al caso de una urna donde
hay M bolas donde M i de ellas representan a u i , para i=l,....,N, y se seleccionan al
azar n de ellas. Cada vez que una unidad se selecciona se retiran de la urna todas las
bolas que le representan.
Entonces, la probabilidad de elegir a u i en la primera seleccin es
Mi
M

en la segunda
M j Mi
ji M M M
j

y as sucesivamente.

No mantiene las probabilidades proporcionales al tamao.

e) Seleccin con probabilidades desiguales con reposicin: si definimos las v.a

1, si ui muestra , i
ei
0 , si ui muestra , 1 i
Se tiene , por construccin que el vector aleatorio e1 ,..., e N sigue una distribucin
M n n, p1 ,..., p N , siendo pi la probabilidad de seleccin de u i , y por tanto

E (ei ) n pi
Var (ei ) np i (1 pi )
y
6
Muestreo Tema 1

Cov (ei , e j ) n pi p j
Mi
En el caso de probabilidades proporcionales al tamao, pi , la seleccin
M
consistira en elegir un nmero aleatorio entre 1 y M y seleccionar u i si ese n est en
el intervalo ( M 1 ... M i 1 , M 1 ... M i . Es lo que se conoce comnmente como
mtodo de los intervalos.

5.MTODOS ESPECIALES DE SELECCIN CON


PROBABILIDADES PROPORCIONALES AL TAMAO.

Con objeto de tener que formar los intervalos en la aplicacin del mtodo anterior, Lahiri
(1951) propuso el siguiente mtodo (mtodo de Lahiri):

Sea M 0 M i i , y elijamos aleatoriamente i y j con 1 i N , 1 j M 0 . Si j M i , se


selecciona u i ; si j M i se repite el proceso. As, la probabilidad de una seleccin sin
efecto de u i ser
1 M0 Mi

N M0

Y la probabilidad de una seleccin sin efecto cualquiera que fuera la unidad es

N
1 M0 Mi M
p 1
i 1 N M0 N M 0

Entonces, la probabilidad de que u i , sea seleccionada, calculada como la suma de las


probabilidades de que sea seleccionada en infinitos intentos sera:

1 Mi 1 M 1 M M i N M 0 M i
p i p i ...
N M0 N M0 N M0 N M 0 M M

es decir se conservan efectivamente las probabilidades de seleccin como proporcionales


al tamao.

Podemos presentar tambin otro mtodo de seleccin sin reposicin y probabilidades


proporcionales al tamao, llamado de seleccin con probabilidades gradualmente
variables, propuesto por Snchez-Crespo, en el cual cuando una bola de la urna es
observada sta no se devuelve, pero tampoco se retiran todas las bolas que representan esa
misma unidad. As, cada u i slo puede estar en la muestra un n de veces igual al mnimo
de M i y n.

Este mtodo tambin conserva las probabilidades de seleccin:

1 seleccin:
Mi
p (u i )
M

7
Muestreo Tema 1

2 seleccin:
M i ( M i 1) M i M j
M i M i 1 M j Mi M i ( M i 1) M i ( M M i ) M i

j i

M M 1 j i M M 1 M ( M 1) M ( M 1) M

Y as sucesivamente.

Mtodo de Poisson: para cada unidad de la poblacin se selecciona aleatoriamente un


nmero, m , entre 0 y 1. Si m i , se selecciona u i . Ninguna unidad se selecciona ms
de una vez. El tamao de la muestra no es fijo, y es igual a

n i

solo en su valor esperado:

N N N
E ei E (ei ) i n
i 1 i 1 i 1

Вам также может понравиться