Академический Документы
Профессиональный Документы
Культура Документы
INTRODUCCION
En el presente trabajo se hablara sobre la estimacin de parmetros. Para ello se mencionaran algunos
conceptos bsicos de la Estadstica Inferencial que sern necesarios para la construccin y el estudio de
las estimaciones:
Poblacin: conjunto homogneo de individuos sobre los que se estudian caractersticas observables con el
objetivo de extraer alguna conclusin. Por abuso de notacin, en ocasiones nos referimos a la distribucin que
sigue la variable de inters en vez de al conjunto de individuos. As, se dice que estamos ante una poblacin
Normal indicando que la variable que nos interesa sigue una distribucin normal.
Estadstico: cualquier funcin de la muestra. Por ejemplo, la media o la varianza muestrales son estadsticos.
Estimadores: son estadsticos independientes de los parmetros de la poblacin, y que se utilizan para
es el parmetro de inters, el estimador se denotar por . En el caso de una poblacin
aproximarlos. Si
Normal, podemos considerar la media muestral como estimador de la media poblacional (es decir, X =
2 2
) y la varianza muestral como estimador de la varianza poblacional (s = ). Para una distribucin
Bi(m; p), donde m denota el nmero de pruebas de Bernoulli, la proporcin p se puede estimar a partir
2
de la proporcin poblacional (que denotaremos por p). Por tanto, X , s y p son estimadores puntuales
2
de , (en distribucin Normal) y p (en distribucin Binomial), respectivamente.
Mtodo de muestreo: procedimiento para seleccionar una muestra. Si en una poblacin queremos
obtener una muestra de un cierto tamao n (siendo n menor que el tamao de la poblacin), la manera de
obtener esta muestra no es nica. En este tema, consideraremos muestras aleatorias simples (m.a.s.).
Las estimaciones puntuales de los parmetros se obtienen a partir de una muestra aleatoria simple X1; : : : ; Xn
de la variable X . Si calculamos el valor del estimador a partir de distintas muestras, los resultados que
obtendremos sern diferentes. Es decir, los estimadores, al estar construidos a partir de muestras aleatorias, son
aleatorios y en consecuencia, tienen una distribucin. La distribucin de los estimadores se denomina
distribucin en el muestreo. Describimos a continuacin los estimadores para la proporcin (en distribucin
Binomial) y para la media y la varianza (en distribucin Normal) y sus respectivas distribuciones en el
muestreo, que sern tenidas en cuenta a la hora de construir los intervalos de confianza.
Estimacin en poblaciones
2 2
Una v.a. X N (; ) queda caracterizada por dos parmetros: la media y la varianza (o la desviacin tpica
). A continuacin, introduciremos los estimadores para estos parmetros y sus distribuciones en el muestreo. Es
2
importante resaltar que tanto para la estimacin de como de , debemos tener en cuenta el efecto del tamao
muestral y adems, al estimar la media, tambin debemos ver si la varianza poblacional es conocida o desconocida.
Estimacin de la media .
Supongamos que disponemos de X1; : : : ; Xn una m.a.s. de X N (; 2). La media poblacional se puede estimar
n
con la media muestral X =
1 Xi , cuya distribucin en el muestreo tambin es Normal:
n
i=1
X
2
X N ; n :
Adems, dado que tenemos una Normal, podramos tipificarla y obtener una N (0; 1):
X
/
n N (0; 1): (1)
La distribucin es consecuencia de que la suma de variables Normales es tambin una variable Normal.
2
Este resultado es vlido si la varianza poblacional es conocida. Esta distribucin se puede interpretar
de la siguiente forma:
2
Si la varianza es desconocida no podemos utilizar la distribucin obtenida en (1), y debemos substituir
2 2
por un estimador. La varianza puede ser estimada por la varianza muestral:
n
2 1X 2
s =n (Xi X ) (2)
i=1
Estos estimadores se vern con ms detalle en la siguiente seccin. Entonces, si queremos estimar la media a partir
2
de una m.a.s. X1; : : : ; Xn y no conocemos la varianza, en la expresin (1) substituimos (equivalentemente,
) por un estimador de la siguiente manera:
n
t
s/ n 1 S / N (0; 1) si n > 30;
X =X n1
si n 30;
TStudent
2
En la estimacin de la media se hace necesario utilizar un estimador de la varianza , en caso de que
2 2
esta no sea conocida. Para ello podemos utilizar la varianza muestral s o la cuasivarianza muestral S ,
que vienen dadas por (2) y (3), respectivamente. Es fcil ver la relacin entre ellas, ya que:
2 2 n s2:
s = n 1 S 2 ;o bien S =
n n1
Estos dos estimadores slo se distinguen en su denominador, y para n grande, no hay diferencias importantes
entre ellos. Como la varianza muestral o la cuasivarianza proporcionarn valores (aleatorios) positivos, su
2
distribucin tendr como soporte [0; ). Esta distribucin ser la distribucin Chi-cuadrado (distribucin JI-
2
CUADRADO). Si X1; : : : ; Xn es una m.a.s. de variables normales con varianza , entonces:
2
ns (n 1)S
2 2 2
2 ; o bien ;
2
n1 n1
2
donde n 1 es una distribucin Chi-cuadrado con (n 1) grados de libertad. Esta distribucin es
asimtrica y con soporte la semirrecta real positiva, como puede verse en la Figura 4.
Esta distribucin es necesaria cuando el tamao de la muestra es pequeo. Para n suficientemente grande,
2
podemos aproximar una distribucin n (Chi-cuadrado con n grados de libertad) por una N (n; 2n).
Estimacin por intervalos de confianza
En algunas ocasiones, no slo estamos interesados en dar una estimacin puntual del valor del parmetro
desconocido, y el objetivo se centra en obtener un rango de valores entre los que se encuentre el
parmetro de la distribucin con una cierta probabilidad, es decir, un intervalo de confianza.
Construiremos intervalos de confianza para la proporcin p en la distribucin Binomial y para la media
en la distribucin Normal. Los estimadores que hemos introducido para la proporcin y la media (p y X ,
respectivamente) son simtricos y podemos calcular o aproximar su error tpico. La frmula general para
el clculo de intervalos de confianza ser:
De este modo, obtendremos intervalos de confianza centrados en el estimador, y cuya amplitud vendr
determinada por su error tpico (donde interviene el tamao de la muestra) y por el cuantil de la
distribucin correspondiente, que estar relacionado con la cobertura del intervalo.
q
p(1p)
IC para p al 95 %: p 1:96
n
q
p(1p)
IC para p al 99 %: p 2:57
n
ya que para una cobertura 1 = 0:9 = 90 % ( = 0:1), el cuantil z1 /2 = 1:64. Del mismo modo, para
una cobertura del 1 = 0:95 = 95 % ( = 0:05) el cuantil es z1 /2 = 1:96 y para un cobertura del
1 = 0:99 = 99 % ( = 0:01) el cuantil es z1 /2 = 2:57.
2
1. La varianza es conocida. En ese caso, el IC para viene dado por:
Xz
1 /2
n
donde z1 /2 es el cuantil de una N (0; 1) que tomar valores 1.64 para cobertura del 90 %, 1.96
para cobertura del 95 % y 2.57 para cobertura del 99 % (al igual que en los intervalos para la
proporcin que vimos en la seccin anterior).
2
2. La varianza es desconocida pero n es grande. Cuando la varianza no es conocida, la distribucin de la
media X es una T-Student, que para tamao muestral n 30 se puede aproximar por una N (0; 1). En este
caso, se debe aproximar el error tpico obteniendo el siguiente intervalo de confianza:
s S
Xz Xz
1 /2 ;o bien
1 /2 n
n1
donde nuevamente z1 /2 es el cuantil de una N (0; 1).
2
3. La varianza es desconocida y n es pequeo. En este caso, debemos considerar los cuantiles de
la distribucin T-Student, quedando el intervalo de confianza como:
s S
Xt Xt
n1;1 /2 ;o bien n1;1 /2 n
n1
donde tn1;1 /2 son los correspondientes cuantiles de una distribucin T-Student con (n 1)
grados de libertad. Estos cuantiles estn tabulados.
En el caso de los intervalos de confianza para , se puede observar que para un nivel de significacin fijo,
a mayor varianza, mayor longitud del intervalo. El efecto contrario se produce a medida que aumenta el
tamao muestral. En ese caso, se reduce la longitud del intervalo. Cuando no conocemos la varianza,
2
obtenemos tambin intervalos ms amplios que en el caso de conocida, ya que los cuantiles de la
distribucin t son ms extremos que para la N (0; 1).
r 2
1 /2 n L
2
Longitud de un IC de nivel (1 ) para , con conocida:
2 2
4z1 /2
L z 2
=2 1 /2 n n = L
2
Longitud de un IC de nivel (1 ) para , con desconocida y n grande:
2 2
S 4z1 /2S
L z
=2 1 /2 n n = L2
2 2
L z s 4z1 /2s
=2 1 /2 n= L2 +1
n1
DESARROLLO DE LA PRACTICA