Вы находитесь на странице: 1из 15

TEMA 6 : ESTIMACIN

TEMA 6
ESTIMACIN

1.ESTIMACIN PUNTUAL
1.1 INTRODUCCIN
1.2 PROPIEDADES DE LOS ESTIMADORES
1.3 MTODO DE CLCULO DE LOS ESTIMADORES
2. ESTIMACIN POR INTERVALOS DE CONFIANZA
2.1 CASOS PARTICULARES
2.1.1 INTERVALO DE CONFIANZA PARA LA MEDIA
2.1.2 INTERVALO DE CONFIANZA PARA LA PROPORCIN
2.1.3 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS
2.1.4 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE
PROPORCIONES
2.1.5 INTERVALO DE CONFIANZA PARA LA VARIANZA
2.1.6 INTERVALO DE CONFIANZA PARA EL COCIENTE DE
VARIANZAS
3. PRECISIN Y TAMAO DE LA MUESTRA

Curso 02-03
2

TEMA 6 : ESTIMACIN

TEMA 6
ESTIMACIN

1. ESTIMACIN PUNTUAL
1.1. INTRODUCCIN
En todo este tema vamos a suponer que estamos estudiando una poblacin
2
cuya distribucin es conocida excepto en un parmetro ( , , ,. ..) al que
llamaremos . A la distribucin de la poblacin la denotaremos por f(x).
Diremos que nos encontramos ante un problema de estimacin cuando,
dada una poblacin con una distribucin f(x) donde es un parmetro
desconocido, aventuremos o infiramos en base a los datos muestrales
X1 , X2 ,..., Xn el valor de . Si al inferir el parmetro damos un nico valor
estaremos ante un problema de estimacin puntual.
Estimador puntual $ X1 , X2 ,..., Xn : ser una funcin de la muestra
aleatoria (un estadstico) que utilizaremos para estimar el valor del parmetro
.
Estimacin $ : valor obtenido del estimador al sustituir por los valores de
una muestra completa.
Cuando no haya lugar para la confusin designaremos al estimador
simplemente por $.
Un estimador es, por tanto, un estadstico y, por ello, es una v.a. con una
determinada distribucin de probabilidad llamada distribucin muestral.
Dado un parmetro, podramos utilizar distintos estimadores puntuales para
estimarlo. Por ejemplo, para estimar la varianza de la poblacin podemos
utilizar la varianza muestral o la cuasi-varianza muestral. Cul es mejor?
Veamos a continuacin como comprobar si un estadstico es un buen
estimador de un parmetro. Para ello le exigiremos una serie de propiedades.
Como el estadstico es una variable aleatoria, las propiedades se las tenemos
que exigir a su distribucin de probabilidad.
1.2. PROPIEDADES DE LOS ESTIMADORES.
Un estadstico se considera un buen estimador de un parmetro si cumple:
ser insesgado, ser consistente y ser eficiente.

Curso 02-03
3

TEMA 6 : ESTIMACIN

A. INSESGADEZ

Un estimador es insesgado si E . Es decir, su distribucin est


centrada en el parmetro a estimar.
Ejemplos:

Sea

VarX

una

X , X ,..., X

m.a.s.

tal

E X

que

a) Consideremos como estimador de la media poblacional a la media


muestral. Es decir Xn . Por el tema anterior, sabemos que E X n .
Por tanto, la media muestral es estimador insesgado de la media poblacional.
b) Supongamos como estimador de la varianza poblacional a la varianza

2 sn2 . Del tema anterior , sabemos que E s2n


muestral,

n 1
. Por
n
2

tanto, la varianza muestral no es un estimador insesgado de la varianza


poblacional .

c) Consideremos ahora como estimador de la varianza poblacional a la


2 sn 2 . Del tema anterior sabemos que
cuasi-varianza muestral,
2
2
E sn . Por tanto, la cuasi-varianza muestral es un estimador insesgado
de la varianza poblacional.

B. CONSISTENCIA
Diremos que es un estimador consistente de si cumple:

lim E
n

lim Var 0

lim P 1

Esto significa que si tomramos la mayor muestra posible, el estimador


coincidira con el valor del parmetro.
Ejemplo: Veamos que los estimadores de los cuales hemos hablado en el
apartado anterior son consistentes.
a) Si consideramos Xn . Se cumple que E X n y VarX n
Pero tomando lmites, lim

0 . Por tanto, X es estimador consistente.


n
s . Se cumple que:
b) Si consideramos
n 1
2n 1
E s

y
Vars

n
n
n

Tomando lmites,

lim
n

n 1

n
2

lim
n

Curso 02-03
4

2n 1
0
n

2
Por tanto, sn es un estimador consistente de .
2

TEMA 6 : ESTIMACIN

sn . Se cumple que
c) Si consideremos
2

E s
2

Vars
n

Tomando lmites,

lim
2

lim
n

2
n 1

n 1

0
4

Por tanto, sn es un estimador consistente de la varianza poblacional.


2

C. EFICIENCIA
Dados dos estimadores de , 1 y 2 , decimos que 1 es ms eficiente que

2 , si Var 1 Var 2 . Nos interesa el que tenga menos dispersin. Para


comparar la eficiencia se construye el cociente

Var

1

. Si es mayor que 1,

Var

2

entonces es ms eficiente; si es igual a 1, entonces ambos estimadores son


igual de eficientes; si es menor que 1, entonces es ms eficiente.
2

2
Ejemplo: Consideremos como estimadores de a sn y sn . Calculamos el
cociente de las varianzas:
2

2( n 1)

Vars
(n 1)
n

1 Por tanto, s es ms eficiente.


2
Vars
n

(n 1)
4

1.3. MTODOS DE CLCULO DE LOS ESTIMADORES.


De los diferentes mtodos de clculo de los estimadores, nosotros veremos:
a) Estimacin por el mtodo de los momentos.
b) Estimacin mximo-verosmil.
A. ESTIMCIN POR EL MTODO DE LOS MOMENTOS
Consiste en tomar como estimadores de los momentos poblacionales a los
momentos muestrales. Se obtiene una ecuacin de donde podemos despejar el
parmetro a estimar.
B. ESTIMACIN MXIMO-VEROSMIL
Sea X una variable aleatoria con distribucin f ( x; ) donde es el
X1 , X2 ,... Xn n variables aleatorias
parmetro desconocido. Sean
independientes con la misma distribucin que X; es decir, sea ( X1 , X2 ,... Xn )
una m.a.s. Bajo estas condiciones la distribucin conjunta de las variables
aleatorias X1 , X2 ,... Xn ser igual al producto de las marginales.
Curso 02-03
5

TEMA 6 : ESTIMACIN

f ( x , x , ..., x ; ) f ( x ; ) f ( x ;)...f ( x ; )
1

Si consideramos x1 , x2 ,.. . xn fijos y estudiamos esta funcin como funcin


de recibe el nombre de funcin de verosimilitud y se denota por V( ).
Sean 1 u1 ( X1 , X2 , ... Xn ) , 2 u2 ( X1 , X2 ,... Xn ) , etc. diversos
estimadores de . De todos ellos pretendemos elegir el que haga mxima la
funcin de verosimilitud. Es decir, un estimador ser estimador mximoverosmil (EMV) de si maximiza V( ).
Debido a que la funcin de verosimilitud es no negativa, continua y
creciente, alcanzar su mximo en los mismos puntos que su logaritmo y por
ello, y por razones de clculo se suele maximizar ln V ( ) cuando esta
depende de exponenciales.As pues, deberemos resolver la siguiente ecuacin:

d( ln V ())
0
d
En el caso de dos o ms parmetros desconocidos, el procedimiento es el
mismo. Por ejemplo, si tuviramos V (1 ,2 , 3 ) los tres estimadores mximo
verosmiles sern los que maximizan la funcin V (1 ,2 , 3 ) o su logaritmo.
Se obtendran al resolver las ecuaciones siguientes:

d( ln V ( , , ) )
0 ^
d
d( ln V ( , , ) )
0
d
d( ln V ( , , ) )
0
d
1

Propiedades de los EMV


a) Son consistentes.
b) Son asintoticamente eficientes. Es decir, tienen la varianza mnima
cuando el tamao muestral tiende a infinito.
c) Si es estimador suficiente de , el EMV de es funcin de .
d) Son asintoticamente normales. Es decir, su distribucin tiende a la
distribucin normal cuando tiende a infinito el tamao de la muestra.
e) Si es EMV de , entonces g( ) es EMV de g( ), siendo g una
aplicacin biyectiva.

Curso 02-03
6

TEMA 6 : ESTIMACIN

Ejemplo: Obtener el EMV del parmetro de una v.a. X que sigue una
distribucin de Bernouilli, X Be( p) . Su funcin de cuanta es

f ( x; p) p (1 p)
x

1 x

Si elegimos una muestra de tamao n, la funcin de verosimilitud


correspondiente ser:

V ( p) f ( x ; p) f ( x ; p)
. ..f ( x ; p) p (1 p)
(1 p)
p
x1

xi

1 x1

p (1 p)
x2

1 x 2

. .. p (1 p)
xn

xi

Tomando logaritmos tenemos

ln V ( p) x ln p (n x ) ln(1 p)
i

Para obtener el EMV de p debemos resolver la ecuacin d( ln V ( p)) 0

dp

En este caso

d( ln V ( p))
1
( 1)
x
( n x )
0
dp
p
(1 p)
i

Haciendo operaciones e igualando denominadores obtenemos:

(1 p)x p(n x ) x px np px x np 0
i


Despejando el valor de p obtenemos el estimador p
Por tanto EMV(p)=

x
i

x
i

. Es decir, la proporcin de xitos de la muestra.

2.ESTIMACIN POR INTERVALOS DE CONFIANZA


En la estimacin puntual atribuimos al parmetro el valor correspondiente
del estimador obtenido en la muestra aleatoria de tamao n. Es claro, que
dicho valor dificilmente coincidir con el verdadero valor del parmetro aunque
el tamao de la muestra sea muy grande.
La estimacin por intervalos consiste en atribuir al parmetro desconocido
un rango de posibles valores (en base a los datos muestrales) que tengan una
alta probabilidad de incluir entre ellos al valor del parmetro desconocido. Para
ello ser imprescindible conocer la distribucin muestral del estadstico
utilizado.
El intervalo estimado que debe contener al parmetro se llama intervalo
confidencial o de confianza. Denominamos lmites confidenciales a los
extremos de dicho intervalo. Llamaremos nivel de confianza a la probabilidad

Curso 02-03
7

1 x n

TEMA 6 : ESTIMACIN

de que un intervalo contenga al parmetro desconocido y se suele denotar por


1 . Se llama nivel de riesgo o de significacin al valor de .
Es decir, P a, b 1 . Esto indica que el (1 )% de intervalos
construidos contendrn al parmetro desconocido.
Denominaremos error muestral mximo a la diferencia entre el valor de la

b a
estimacin muestral y el valor del parmetro; es decir, E
.
2

Ejemplo: Sea el parmetro desconocido y el estimador que


2
consideramos el cual sigue una distribucin N (, ) . Supongamos un error
muestral mximo E 2 .

Si calculamos la probabilidad de tener ese error o uno menor, obtendremos:

2 P 2 2(2) ( 2 )
P 2
=

2(2) 1 0, 9544 ya que el estimador segua una distribucin normal.

2
P

Esta probabilidad podemos escribirla tambin de la siguiente forma:

P 2 2 P 2 2 P 2 2

2, 2
P

Por tanto, el intervalo de confianza 2, 2 tiene un nivel de


confianza 1 =0'9544 o un nivel de significacin de =0'0456. Esto equivale
a decir que tenemos la confianza 0'9544 de que, extraida una muestra y
calculado el valor de , ste no se aleja del parmetro ms de dos
desviaciones tpicas o un riesgo de 0'0456 de que se aleja ms de esa
cantidad.
Dicho de otro modo, si sale una muestra en que est en la zona rayada el
intervalo no contendr a .

Curso 02-03
8

TEMA 6 : ESTIMACIN

Normalmente lo que se hace es fijar de antemano el nvel de confianza y se


busca el intervalo correspondiente a ese nvel de confianza utilizando la
distribucin muestral del estadstico.
2.1 CASOS PATICULARES
2.1.1 INTERVALO DE CONFIANZA PARA LA MEDIA
Si desconocemos la distribucin de la poblacin, podemos hallar un intervalo
de confianza para la media, basndonos en un resultado que conocemos como
Desigualdad de TChebychev.
Sea X una v.a. cualquiera con media y varianza 2 . Se cumple que:
P

k
k
1

X 1

Usando el anterior resultado, aplicndolo a la variable aleatoria X y tomando

, obtendramos que el intervalo para un nivel 1 sera:

, X

n
n
n

Para analizar los resultados que presentamos a continuacin, supongamos


2
una poblacin que se distribuye normal de media y varianza poblacional
. Tambin servirn cuando la poblacin no es normal pero el tamao muestral
es grande.
2

a) Si es conocida.

X
n

Ya sabemos que

N( 0,1) . Sea z1

normal; es decir, ( z) 1

el percentil de la distribucin

P z
1

Curso 02-03
9

z 1
1

2
n

X
n

TEMA 6 : ESTIMACIN

Haciendo operaciones P Xn z

Xn z

1
n

Por tanto, el intervalo de confianza para ser:

Xn z1

, X z
n

b) Si es desconocida.
En este caso tenemos que

X
n 1 t
s
n

n 1

Por el mismo razonamiento anterior, si llamamos tn


distribucin t de Student tal que P tn

x 1

1
1

al percentil de la

, el intervalo de confianza

al nivel de significacin (o equivalentemente, al nivel de confianza 1- )


ser:

Xn tn

s
, X t
n 1

s
n 1

1
1
2

n 1
1

Ejemplo: Extraemos una m.a.s. de 61 estudiantes universitarios. Responden


a una prueba de inteligencia espacial, en la que alcanzan una media de 80 y
una varianza de 100. Entre qu lmites se hallar la verdadera inteligencia
espacial media de los estudiantes, a un nivel de confianza del 99%?

1 0' 99 0' 01 1

0' 995

La varianza poblacional es desconocida y la poblacin no es normal, pero el


tamao muestral es mayor que 30, por tanto, el intervalo correspondiente ser:

Xn tn

s
, X t
n 1
n

1
1
2

s
n 1
n

n 1
1

Buscamos en las tablas la distribucin t de Student t60

0 ,9 9 5

2' 66.

Sabemos que Xn 80 y sn 10. Sustituyendo en el intervalo de confianza


tenemos:

10
10
80 2' 66 60 , 80 2' 66 60

por tanto, 76' 57,83' 43 con un nivel de confianza del 99%.


2.1.2 INTERVALO DE CONFIANZA PARA LA PROPORCIN

Curso 02-03
10

TEMA 6 : ESTIMACIN

Si en una poblacin Bernouilli de parmetro p definimos la v.a. X= n xitos


en la muestra, X sigue una distribucin binomial de parmetros (n,p). Si la
muestra es grande, tenemos que la proporcin muestral P=X/n se distribuye

aproximadamente como una normal N p,

pq
y podremos usar el teorema
n

central del lmite.


En una poblacin Bernoulli, p , 2 p(1 p) y si denotamos por P a
la proporcin en la muestra Xn P . As pues podemos aplicar el intervalo de
confianza para la media con varianza conocida visto anteriormente,
sustituyendo lo anterior y aproximando p(1-p) por P(1-P). un intervalo de
confianza aproximado para p a nivel 1 sera:

P z1

P (1 P )
, P z
n

P (1 P )

Ejemplo: Uno de los lderes de un colectivo laboral desea plantear una


cuestin a todos los miembros del grupo. Si ms de la mitad respondieran NO
entonces preferira no plantearla para no minar su prestigio. Para salir de
dudas, elige aleatoriamente a 100 trabajadores a los que hace la pregunta y
slo 30 responden NO. Entre qu lmites se hallar la verdadera proporcin al
nivel del 95%?
Como el tamao muestral es grande, podemos aplicar el teorema central del
lmite. Tenemos 1 0' 95 1

0' 975 z

1' 96

Sustituyendo los valores en el intervalo correspondiente:

0' 3 0' 7
0' 30' 7
, 0' 3 1' 96
0' 2102, 0' 3898
0' 3 1' 96
100
100

Por tanto, la verdadera proporcin est en el intervalo 0' 2102, 0' 3898
con un nivel de confianza del 95%.
2.1.3 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS.
Suponemos dos poblaaciones independientes

X N ( , ) ,

Y N( , )

Tomamos muestras de tamao n1 y n2 , respectivamente.


a) Si 1 y 2 son conocidas, como Xn Yn
2

el intervalo de confianza ser:

Curso 02-03
11

2
2

1
2
N 1 2 ,

,
n1
n2

TEMA 6 : ESTIMACIN

1 2 Xn Y n z
1

b)

Si

X Y
n1

n2

n s n s 1 1

n n 2 n n
2

X n1 Y n 2 tn1 n 2 2

son

tn

n 2 2

, X Y

n1

n2

desconocidas

pero

2
2

n2

iguales,

como

, el intervalo de confianza ser:

n1 s12 n 2 s22 1

n1 n2 2 n1 n 2

, X n Y n tn

n1 n2 2 n1 n 2

n1 s12 n2 s22 1

n 2 2

Ejemplo: Dos universidades pblicas tienen dos mtodos distintos para


inscribir a sus alumnos. Los dos desean comprobar el tiempo promedio que
toma la inscripcin de los alumnos. En cada universidad se tomaron los
tiempos de inscripcin de 31 alumnos tomados al azar. Las medias y
desviaciones tpicas muestrales fueron: x 20' 3 , s x 2' 5 , y 23 , s y 3 . Si se
supone que el muestreo se llev a cabo en dos poblaciones normales e
independientes, obtener los intervalos de confianza al nivel de riesgo 0'05 para
la diferencia entre las medias del tiempo de inscripcin para las dos
universidades,
2

a) suponiendo que las varianzas poblacionales son x 9 , y 10 .


b) suponiendo que las varianzas poblacionales son desconocidas pero
iguales.
Para el apartado a

0 05 1 0 ' 95 1

0 ' 975 z

1' 96

Sustituyendo los valores en el intervalo obtenemos:

1 2 20' 3 23 1' 96

9
31

10
31

, 20' 3 23 1' 96

9
31

10

31

2' 7 1' 53, 2 ' 7 1' 53 4 ' 23, 1' 17

Para el apartado b, buscamos en la tabla de la t de Student t31

31

2 0 '9 75

2 .

Sustituyendo los valores en el intervalo obtenemos:

20' 3 23 2

31
2' 32

31 3 1 1
, 20' 3 23 2
31 31 2 31 31
2

31 3 1 1
31 31
31 31 2

31
2' 32

2' 7 1' 4, 2' 7 1' 44' 1, 1' 3

Curso 02-03
12

TEMA 6 : ESTIMACIN

2.1.4 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE


PROPORCIONES.
Sean X Be( p1 ) e Y Be( p2 ) dos poblaciones independientes con p1 y
p2 desconocidos. Extraemos muestras de tamao n1 y n2 , respectivamente.

Como P1 P2 N p1 p2 ,

p q p q

y desconocemos los valores de


n
n
1

p y p , aproximaremos las proporciones poblacionales por las proporciones


1

muestrales correspondientes. Por tanto, el intervalo de confianza ser:

p p P P z
1

P Q P Q

, P P z
n
n
1

P Q P Q

n
n
1

p p p, entonces E P P 0 y
1
n P n P
1
VarP P pq
. Lo que haremos es sustituir p por
n n
n
n
Caso particular: Si tenemos

Ejemplo: En dos grandes empresas se lleva a cabo un estudio sobre la


proporcin de mujeres entre sus empleados diplomados y licenciados. De cada
empresa se toma una m.a.s. de 40 empleados entre los diplomados y
licenciados, obtenindose que en la empresa A haba 16 mujeres y en la
empresa B, 22 mujeres. Obtener el intervalo de confianza para la diferencia de
proporciones poblacionales al nivel de confianza 0'96 Podemos pensar que la
proporcin es la misma?

1 0' 96 1
P
1

Sustituyendo en el intervalo:

0' 4 0' 55 2' 05

0' 4
0' 6
40

16
0' 4
40
0' 55
0' 45

40

0' 98 z

2' 05

P
2

22
0' 55
40

, 0' 4 0' 55 2' 05

0' 4
0' 6
40

=0' 15 0' 2265, 0'15 0' 22650' 3765, 0' 0765

0' 55
0' 45
40

El intervalo contiene al cero, pero el extremo inferior se aleja bastante de cero.


2.1.5 INTERVALO DE CONFIANZA PARA LA VARIANZA.
Si tenemos una poblacin X N ( , ) con 2 desconocida, entonces
2

n 1 sn21

Curso 02-03
13

2n 1

TEMA 6 : ESTIMACIN

El intervalo de confianza para la varianza poblacional al nivel de confianza


1 lo podemos obtener como sigue:

(n 1)sn21
P 2n 1
2n 1 1
2
1

2
2
Despejando 2 tenemos:

Es decir,

(n 1)sn21 (n 1)sn21

,
2n 1
2n 1

1
2
2
2

Ejemplo: De acuerdo con las tablas de altura, los varones tienen una altura
superior a las mujeres en la poblacin espaola. Segn las ltimas tablas en el
servicio militar, los varones entre 18 y 20 aos presentan una varianza de
0'0529. de las mujeres no tenemos informacin, por ello tomamos una muestra
de 101 mujeres entre 18 y 20 aos y obtenemos
Entre qu valores se
encontrar la verdadera varianza a un nivel de 0'95 de confianza?

Sustituyendo en el intervalo tendremos:

2.1.6 INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS.


La distribucin muestral del cociente de varianzas muestrales, cuando
tenamos dos poblaciones normales e independientes era:

A partir de aqu deducimos el intervalo de confianza para el cociente de


varianzas poblacionales al nivel de y obtenemos

Ejemplo: Con los datos del ejemplo de la pag. 11 , calcular el intervalo de


confianza para el cociente de varianzas al nivel de confianza 0'95. Podramos
aceptar la suposicin de que las varianzas poblacionales son iguales?
y

Curso 02-03
14

TEMA 6 : ESTIMACIN

Sustituyendo en el intervalo obtenemos


El intervalo contiene al 1 y los extremos estn bastante prximos al 1. Hay
mayor diferencia por el extremo inferior, lo que indica que la varianza de la
poblacin X es menor que la de la poblacin Y.
3. PRECISIN Y TAMAO DE LA MUESTRA
En general, cuanto ms estrecho es un intervalo de confianza mayor
precisin tendr nuestra estimacin (ser menor el error muestral mximo).
Ahora bien, la amplitud de un intervalo depende de dos factores: el nivel de
confianza que decidimos utilizar y el tamao del error tpico (es la desviacin
tpica) del estadstico utilizado como estimador.
Si disminuimos el nivel de confianza, diminuye la amplitud del intervalo, pero
aumenta el riesgo. Debemos intentar reducir la amplitud del intervalo
manteniendo constante el nivel de confianza; para ello hay que reducir el error
tpico del estimador.
En el caso de la media, el error tpico es . Por lo tanto, variando el tamao
muestral variaremos el error tpico. Al aumentar n, disminuye . Por tanto,
manipulando el tamao de la muestra podemos obtener los intervalos de la
precisin que deseemos.
Para la media:

Para la proporcin:
Ejemplo: Queremos estimar la media de una poblacin normal con varianza
poblacional igual a 4. qu tamao muestral debemos tomar para que E=0'02
al nivel de confianza 0'95?
Como conocemos la varianza poblacional, el tamao muestral ser:
=
y si queremos un error E=1 al mismo nivel de confianza? En este caso
= . Redondeamos n=16.

Curso 02-03
15

Вам также может понравиться