Академический Документы
Профессиональный Документы
Культура Документы
Existen diferentes formas de hacer inferencia. Cuando lo que queremos es describir una
variable o las relaciones existentes entre un conjunto de variables, utilizamos tcnicas de
muestreo, consistentes en extraer un conjunto representativo de la poblacin en estudio.
Cuando hablamos de poblacin, nos estamos refiriendo a un conjunto de elementos en los
cuales se estudia una determinada caracterstica. Ahora bien, en multitud de ocasiones no
resulta posible estudiar todos ellos pues este estudio puede implicar la destruccin de los
elementos, o puede resultar un anlisis demasiado costoso, o este puede llevar demasiado
tiempo. En esas situaciones seleccionaramos un conjunto representativo de la poblacin,
al que llamamos muestra, con el cual podemos obtener una informacin similar a la dada
por un censo, es decir, un estudio exhaustivo de todos sus elementos, con mayor rapidez y
menor coste.
Designamos por u1 ,..., u N a las N unidades que constituye la poblacin finita objeto de
estudio. Una sucesin ordenada de n elementos de la poblacin u i1 ,..., u in se denomina
muestra de tamao n.
Pues bien, un proceso mediante el cual se selecciona una de estas muestras, de modo que
cada una tenga una determinada probabilidad de ser elegida decimos que es un
procedimiento de muestreo probabilstico. El mecanismo aleatorio empleado por el
investigador para seleccionar la muestra debe definir en el conjunto de muestras posibles S
una funcin de probabilidad p tal que:
p ( s ) 0, p( s) 1
sS
2
Muestreo Tema 1
conocer toda la distribucin, sino slo sus principales momentos, que s pueden tener un
clculo ms factible.
El hecho de que un estimador sea centrado no es definitivo para elegir a ese estimador para
llevar a cabo la estimacin. Por ejemplo, puede ocurrir que un estimador fuera centrado
1 pero tuviera una alta variabilidad y por tanto ser muy poco preciso, y eligiramos otro
2 de menor variabilidad, aunque sesgado.
'
A fin de elegir entre dos estimadores con propiedades contrapuestas, o bien entre dos
estimadores con diferentes sesgos, un criterio muy utilizado es el de escoger aqul que
presente un menor error cuadrtica medio, definido as:
E.C .M .() E ( ) E ( E () E () ) E ( E ()) 2
( E () )
que es la suma de la varianza de y el cuadrado de su sesgo. La primera componente da
lugar al concepto de precisin, y ambas juntas, al de acuracidad.
1 1 1
N N 1 N n 1
considerando que son muestras iguales con los mismos elementos sin fijarnos en su
orden, entonces,
p u1 ,...u n ( n!( N n)!) / N !
pues hay n! rdenes diferentes. En ambos casos todas las muestras tienen igual
probabilidad de ser elegidas.
1, si ui muestra , i
ei
0 , si ui muestra , 1 i
Se tiene que E (ei ) i .
Entonces ,
N N
n E ei i
i 1 i 1
i p ( X (u i )) , ij p( X (u , u
i, j
i j ))
y al sumar los valores ij para j i aparecern repetidas n-1 veces las muestras que
contienen u i ; por existir en cada una n-1 unidades con j i , luego
i j
ij (n 1) i
i i j
ij n(n 1)
4
Muestreo Tema 1
1
N
N 1 1 1
N N 1 N
N 1 N 2 1
....
N N 1 N
1 1
M n n, ,...,
N N
y por tanto
n
E ( ei )
N
1 1
Var (ei ) n 1
N N
n
Cov (ei , e j )
N
La probabilidad de que la unidad u i est en la muestra ser n/N, pues las selecciones
son independientes entre s.
5
Muestreo Tema 1
c) Seleccin sistemtica con arranque aleatorio, supongamos que tenemos una poblacin
de tamao N, u1 ,..., u N , con N=nk. El procedimiento consiste en seleccionar
aleatoriamente un nmero entero entre 1 y k, de modo que si este nmero es j, se
seleccionan la unidad , u j , as como u j 1 ,..., u j ( n 1) k .Todas las muestra posibles
tienen entonces igual probabilidad de ser seleccionada, 1/k, que coincide con la
probabilidad de elegir a j entre 1 y k.
Esta seleccin tiene la ventaja de extender la muestra sobre toda la poblacin, y ser de
fcil aplicacin. Sin embargo, puede llevar a introducir sesgos debido al hecho de que
cada unidad en la muestra es seleccionada con una periodicidad constante, k.
en la segunda
M j Mi
ji M M M
j
y as sucesivamente.
1, si ui muestra , i
ei
0 , si ui muestra , 1 i
Se tiene , por construccin que el vector aleatorio e1 ,..., e N sigue una distribucin
M n n, p1 ,..., p N , siendo pi la probabilidad de seleccin de u i , y por tanto
E (ei ) n pi
Var (ei ) np i (1 pi )
y
6
Muestreo Tema 1
Cov (ei , e j ) n pi p j
Mi
En el caso de probabilidades proporcionales al tamao, pi , la seleccin
M
consistira en elegir un nmero aleatorio entre 1 y M y seleccionar u i si ese n est en
el intervalo ( M 1 ... M i 1 , M 1 ... M i . Es lo que se conoce comnmente como
mtodo de los intervalos.
Con objeto de tener que formar los intervalos en la aplicacin del mtodo anterior, Lahiri
(1951) propuso el siguiente mtodo (mtodo de Lahiri):
N
1 M0 Mi M
p 1
i 1 N M0 N M 0
1 Mi 1 M 1 M M i N M 0 M i
p i p i ...
N M0 N M0 N M0 N M 0 M M
1 seleccin:
Mi
p (u i )
M
7
Muestreo Tema 1
2 seleccin:
M i ( M i 1) M i M j
M i M i 1 M j Mi M i ( M i 1) M i ( M M i ) M i
j i
M M 1 j i M M 1 M ( M 1) M ( M 1) M
Y as sucesivamente.
n i
N N N
E ei E (ei ) i n
i 1 i 1 i 1