Estimación

TEMA ESTIMACIÓN
1. Introducción y definiciones
2. Estimación puntual. Propiedades deseables de los

estimadores
2.1. Introducción y definiciones
2.2. Estimadores Insegados
3. Estimación por intervalos de confianza

3.1. Introducción
3.2. Intervalos de confianza para una población
normal
2.1. Intervalos de confianza para la media
2.2. Intervalo de confianza para la varianza
3. Intervalos de confianza para dos poblaciones
Normales independientes
3.1. Intervalos de confianza para la diferencia de
medias
3.2. Intervalos de confianza para el cociente de
varianzas
4. Intervalo de confianza para una proporción
5. Intervalo de confianza para la diferencia de
proporciones
203
 1. Introducción y definiciones
 Supongamos que conocemos la distribución de la

característica de interés de una población
 La función de densidad o masa de probabilidad depende

del vector de parámetros  : f ( x ;  )
 Se desean estimar los parámetros a partir de una

muestra
¿Cómo hacer esta estimación?
Estimación puntual: Se busca un estimador, que con

base a los datos muestrales dé origen a un valor puntual
que utilizamos como estimación del parámetro
 Estimación por intervalos: Se determina un intervalo

aleatorio que, de forma probable, contiene el verdadero
valor del parámetro. Este intervalo recibe el nombre de
intervalo de confianza
204
 Ejemplo
Consideramos una variable aleatoria, X, que estudia el

grosor de los troncos de los pinos de un Parque Natural.
Se sabe que dicha variable se puede ajustar al modelo de
la distribución Normal, pero no se conocen la media ni la
desviación típica del grosor de los troncos.
 R
X N  ;  
 0
 La función de densidad de la distribución Normal

depende del vector de parámetros     ,  
 Estos parámetros son desconocidos
 Se desea estimarlos a partir de una muestra tomada

entre todos los pinos del Parque Natural
205
2. Estimación puntual. Propiedades
deseables de los estimadores
 2.1. Introducción y definiciones
Sea X1, …, X n una muestra aleatoria simple con función

de densidad f ( x ;  )
Sea un estadístico T = u ( X 1 , …, X n )
El problema es encontrar una función que proporcione el

mejor estimador de 
El estimador, T, del parámetro  debe tener una

distribución concentrada alrededor de  y la varianza
debe ser lo menor posible
P[  h  T   + h]
debería ser grande
h  +h
206
 Error cuadrático medio
P [  h  T   + h ]
debería ser grande
h  +h
Para estudiar la variabilidad de los valores del estimador

alrededor del parámetro se hace uso de una cantidad
llamada error cuadrático medio
Definición. Error cuadrático medio
Sea T un estimador de  . Se define
ECM ( T ) = E [( T   ) 2 ] = Var [ T ] + [   E [ T ] ] 2
207
 2.2. Estimadores Insesgados
 Definición. Sesgo de un Estimador
Sea T el estimador del parámetro . Se define el sesgo

del estimador como
  E[T]
 Definición. Estimador Insesgado
T es un estimador insesgado de  si y sólo si
E[T] =  para todo 
NOTA: En este caso ECM ( T ) = Var [ T ]
208
3. Estimación por intervalos de confianza
 3.1. Introducción
Se desea calcular un intervalo aleatorio que contenga al

verdadero valor del parámetro, , con una cierta
probabilidad
h1(T)    h2(T)
 Las funciones h1 y h2 son funciones de un estadístico T

relacionado con el parámetro a estimar en cada caso
 Definición: Nivel de confianza (1)

El nivel de confianza, 1, es la probabilidad de que un
intervalo de confianza contenga al verdadero valor del
parámetro.
P [ h1 ( T )    h 2 ( T ) ] = 1
209
 Definición: Intervalos de confianza bilaterales
P [ h1(T)    h2(T) ] = 1
 Definición: Intervalos de confianza unilaterales
P [  h1(T) ] = 1
P [  h2(T) ] = 1
 NOTA: De cada 100 intervalos construidos a partir

de 100 muestras, 100 ( 1 ) % deberían contener al
verdadero valor del parámetro.
( )

Intervalo aleatorio
( )
  fijo
.................
( )

( )

210
 3.2. Intervalos de confianza para una
población normal
 Se muestrea una población normal para estimar los

parámetros de esta población
X1 , … , X n m.a.s. de una población X N ( ,  )
Independientes entre sí
X 1, X 2 ,... X n
Xi N (, )
Se desea estimar alguno de los parámetros, o ambos,
según sea o no conocido el otro
211
3.2.1. Intervalos de confianza para la media
 Se desea estimar la media poblacional mediante un

intervalo de confianza
 Varianza poblacional conocida  2

0
Estadístico asociado al parámetro a estudiar  : T  X

(media muestral).
 Distribución de la media muestral:

  
X  N ; 0   Z
 X     N  0; 1
 n 0
 
n
P   z / 2  Z  z / 2   1  
/2 1 /2
z1 / 2   z / 2 z / 2
212
 
P   z / 2  Z  z / 2   P   z / 2 
X  
 z / 2   1  
 0 
 
 n 
 0 0 
P   z / 2  X    z / 2  1
 n n 
 0 0 
P   X  z / 2      X  z / 2  1
 n n 
 0 0 
P  X  z / 2    X  z / 2  1
 n n 
 0 0 
P  X  z / 2    X  z / 2   1 
 n n 
 I.C. para , con varianza conocida, al nivel de

confianza 1 .
 0 0 
 X  z / 2 , X  z / 2 
 n n
 
213
 I.C. para , con varianza conocida, al nivel de
confianza 1 
 0 0 
 X  z / 2 , X  z / 2 
 n n
 
NOTA:
• A medida que aumenta el tamaño de la muestra
disminuye la amplitud del intervalo
• A medida que el nivel de confianza es mayor aumenta la

amplitud del intervalo
214
 Ejemplo. Se desea estudiar el peso en gramos del fruto
producido por una planta. Para ello se tomó una muestra
de 16 plantas observando los siguientes pesos: 506, 508,
499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506,
502, 509, 496. El peso del fruto de cada planta es una v.a.
Normal con desviación típica 5 gr. Obtener un intervalo
de confianza al nivel de confianza 0.9 para el peso medio
del fruto de esta planta.
Solución.-
I.C. para  con varianza conocida
al nivel de confianza 1
 0 0 
 X  z / 2 , X  z / 2 
 n n 
x  503.75; n  16;  02  25 ;  0  5
215
 0 0 
 X  z / 2 , X  z / 2 
 n n 
x  503.75; n  16;  02  25 ;  0  5
1    0.90;   0.10;  2  0.05 
z / 2  z0.05  1.645
0.05 0.90 0.05
 z 0.05  1.645 z 0.05  1.645
 5 5
 503.75  1.645 , 503.75  1.645  
4 4
 501.69, 505.81
216
 Varianza poblacional desconocida
 Estimador: X
Distribución muestral: T
 X  
 tn 1
S
n
1 2
Cuasidesviación típica S
n 1 i
X  X  
i
/2 1 /2
t1 / 2  t / 2 t / 2
 
P  t / 2; n 1  T  t / 2; n 1   1  
 
 
P  t / 2; n1 

X  
 t / 2; n1   1  
 S 
 n 
217
 

P  t / 2; n1 
X  
 t / 2 ; n1   1  
 S 
 n 
 S S 
P  t / 2; n1  X    t / 2; n1  1
 n n
 S S 
P   X  t / 2; n1      X  t / 2; n 1  1
 n n
 S S 
P  X  t / 2; n1     X  t / 2; n1  1
 n n
 S S 
P  X  t / 2; n 1    X  t / 2; n1  1
 n n
I.C. para  con varianza desconocida

 S S 
 X  t / 2;n 1 , X  t / 2;n1 
 n n
218
 Ejemplo. Se desea estudiar el peso en gramos del
fruto producido por una planta. Para ello se tomó una
muestra de 16 plantas observando los siguientes pesos:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493,
496, 506, 502, 509, 496. Del peso del fruto sólo se
conoce que es una v.a. Normal. Obtener un intervalo de
confianza al nivel de confianza 0.9 para el peso medio
del fruto de esta planta.
Solución
 S S 
 X  t / 2; n1 , X  t / 2; n1 
 n n 
I.C. para  con varianza desconocida

x  503.75 ; S  6.2022 ; n  16
219
 S S 
 X  t / 2; n1 , X  t / 2; n1 
 n n 
x  503.75 ; S  6.2022 ; n  16
1    0.90;   0.10;  2  0.05 
t / 2; n1  t 0.05;15  1.753
0.05 0.90 0.05
t 0.05  1.753 t 0.05  1.753
 6.2022 6.2022 
 503 . 75  1.753  , 503 . 75  1.753 
 
4 4 
 501.0319, 506.4681
220
 3.2.2. Intervalo de confianza para la varianza
 Media poblacional desconocida
2 1 2
Estimador: Cuasivarianza S 
n 1 i
X X  
i
 Distribución muestral
n 2

 Xi  X 
 n  1 S 2
i 1    n21
2 2
P  12 / 2;n 1   n21  2 / 2;n 1   1  

 
 2 
2  n  1 S 2
P  1 / 2; n1    / 2; n1   1  
 2 

/2 /2
1
12 / 2;n 1 2
 / 2;n 1
221
 2 
2  n  1 S 2
P  1 / 2; n1    / 2; n1   1  
 2 
2  2 
1  / 2; n 1 1  / 2; n 1
P     1
 n 1 S 2 2 2
     n  1  S 
 2 2 
 
n  1 S   
n  1 S
P 2   1
2 2 
 / 2; n1 
 1 / 2; n 1 
 2 2 
( n  1) S ( n  1) S 
P 2   1
 2  2 
  / 2;n1 1 / 2;n 1 
I.C. para  2, con media poblacional desconocida,

 2 2 
 ( n  1) S ( n  1) S 
,
2  2 
  / 2; n1 1 / 2 ; n 1 
222
 Ejemplo
Se desea estimar la varianza del nivel de nistamina en un
ungüento. Se conoce por larga experiencia que su
distribución sigue una ley Normal. Se toma una muestra
de 9 ungüentos, dando el nivel siguiente (en millones de
unidades/gr): 1, 0.9, 1.5, 2.8, 3.1, 3.2, 2.5, 1.9, 2. Estimar
la varianza mediante dos intervalos de confianza al nivel
de confianza del 99% y del 95%.
Solución
2 1 2
Cuasivarianza: S 
n 1   xi  x   0.74
i
Nivel de confianza: 1   = 0.99;  = 0.01;  / 2 = 0.005
2 / 2;n 1   0.005;8
2  22.0; 12 / 2;n1   0.995;8
2  1.34
0.005 0.005
0.99
2  20.005;8  22.0
0.995;8  1.34
 2 2 
 ( n  1) S , ( n  1) S    8  0.74 , 8  0.74  
2 2   22.0 1.34 
 
  / 2; n1 1 / 2; n 1 
  0.2691, 4.4179 
223
Nivel de confianza: 1   = 0.95
1   = 0.95;  = 0.05;  / 2 = 0.025
1 2
Cuasi-varianza: S2    xi  x   0.74
n 1
i
 2 / 2 ; n1   0.025
2
; 8  17.5
 12 / 2; n1   0.975;8

2
 2.18
0.025 0.025
0.95
2
0.975;8  2.18  20.025;8  17.5
 2 2 
 ( n  1) S ( n  1) S   8  0.74 8  0.74 
,  , 
2 2   17.5 2.18 
  / 2; n1 1 / 2; n1 
  0.3383, 2.7156
224
3.3. Intervalos de confianza para dos
poblaciones Normales independientes
 Se muestrean dos poblaciones normales para estimar

los parámetros “comparativamente”
Sean las variables aleatorias X e Y tales que

X N ( X ;  X )
Independientes
Y N (  Y ; Y )
Consideramos:
m.a.s. de tamaño nX de X X , S X2
X1, X 2 ,..., X n
x
m.a.s. de tamaño n Y de Y
Y , S Y2
Y1, Y2 ,..., Yn Y
 Se desean estimar comparativamente los parámetros

de ambas poblaciones
225
 7.3.3.1. Intervalos de confianza para la
diferencia de medias
 Varianzas poblacionales conocidas
Estimador: T  X  Y
 Distribución muestral:
 X  Y     X  Y 
Z  N (0; 1)
 X2  Y2

nX nY
P   z / 2  Z  z / 2   1  
/2 1 /2
z1 / 2   z / 2 z / 2
226
P   z / 2  Z  z / 2   1  
 
 

P   z / 2 
  
X  Y   X  Y  
 z / 2   1  
 2 2 
  X Y 
  
nX nY
 
 2 2
  X  Y
 
P  X  Y  z / 2
nX

nY
  X  Y 


2 2 
 X Y 
 
 X  Y  z / 2
nX

nY 
1


I.C. para  X   Y con varianzas poblacionales

conocidas, al nivel de confianza 1 
 2 2
  X  Y 
 X Y  z
 /2
nX

nY 
 
227
 Ejemplo
Se utilizan habitualmente en una fábrica de cerveza dos tipos de
genes A y B cuya actividad contribuye a proveer de nitrógeno a
los granos de la cebada. El contenido proteico de los granos
influye en el sabor de la bebida, la estabilidad de la espuma y la
nutrición de las levaduras que realizan la fermentación para la
producción del alcohol. Se desea comparar el aumento de
proteínas que se produce en los granos de cebada con ambos
genes. Para un nivel de confianza 0.9, se selecciona una
muestra de 20 cubas con cebada con el gen A, obteniéndose una
ganancia media de proteínas de 0.4 mgr. Simultáneamente se
selecciona otra muestra de tamaño 19 con el gen B y se obtiene
una ganancia media de 0.5 mgr. Se conoce por experiencia
previa que las variables objeto de estudio, ganancia de proteínas
con ambos genes, son normales con varianzas de 0.05 para la
cebada con el gen A y 0.1 para la cebada con el gen B. Estimar
la diferencia de ganancia medio.
Solución
n A  20 ; x A  0.4 ;  2A  0.05
nB  19 ; xB  0.5 ;  B2  0.1
 2 2 2 2 
x  x  z  
A  B, x x z  
A B
 A B  / 2 n A nB A B  /2
n A nB 
 
228
n A  20 ; x A  0.4 ;  2A  0.05
nB  19 ; xB  0.5 ;  B2  0.1
 2 2 2 2 
x  x  z  
A  B , x x z  
A B
 A B  / 2 A B  / 2
n A nB n A nB 
 
1    0.90;   0.10;  2  0.05 
z / 2  z0.05  1.645
0.05 0.90 0.05
 z 0.05  1.645 z 0.05  1.645
 0.05 0.1 0.05 0.1 

 0.4  0.5  1.645  , 0.4  0.5  1.645  
 20 19 20 19 
  0.2449, 0.0449
229
 Varianzas poblacionales desconocidas
2 2
pero iguales X Y
 Distribución muestral
T
 X  Y     X  Y 
t n X  nY  2
1 1
Sp 
n X nY
2
(n X  1) S X  (nY  1) SY2
Sp 
n X  nY  2
P  t / 2;n X  nY 2  tn X  nY 2  t / 2;n X  nY 2   1  

 
t n X  nY  2
/2 1 /2
t1 / 2  t / 2 t / 2
230
P  t / 2;n X  nY 2  tn X  nY 2  t / 2;n X  nY  2   1  
 
 
 
P  t / 2; n X  nY  2 
 
X  Y   X  Y  
 t / 2; n X  nY  2  
 1 1 
 Sp  
 n X nY 
 1 1
P  X  Y  t / 2; n X  nY  2  S p    X  Y 
 n X nY
1 1 
 X  Y  t / 2; n X  nY  2  S p   1
n X nY 

I.C. para  X   Y , al nivel de confianza 1 , con

varianzas poblacionales desconocidas pero iguales y
muestras pequeñas
 1 1 
 X  Y  t / 2; n X  nY 2  S p  
 n X nY 

231
 Ejemplo
Se utilizan habitualmente en una fábrica de cerveza dos tipos de
genes A y B cuya actividad contribuye a aumentar el contenido
proteico de los granos de cebada. Se desea comparar el aumento
de proteínas que se produce en los granos de cebada con ambos
genes. Para un nivel de confianza 0.9, se considera una muestra
de 22 cubas con cebada con el gen A, obteniéndose un aumento
de 0.4 mgr con una varianza de 0.03. Simultáneamente se
considera una muestra de 20 cubas con el gen B y se obtiene un
aumento proteínico medio de 0.5 mgr con una varianza de 0.09.
Se conoce por experiencis previas que las variables objeto de
estudio, aumento de proteinas con los dos genes, son normales
con varianzas poblacionales iguales. Estimar la diferencia de
engorde medio.
Solución
 1 1 
 x A  xB  t / 2; n A  nB  2  S p  
 n A n B
n A  22 ; x A  0.4 ; ˆ A2  0.03
nB  20 ; xB  0.5 ; ˆ B2  0.09
232
n A  22 ; x A  0.4 ; ˆ A2  0.03
nB  20 ; xB  0.5 ; ˆ B2  0.09
nA ˆ 2 nB ˆ 2
S A2   A  0.0316 ; S B2   B  0.095
nA  1 nB  1
1    0.90;   0.10;  2  0.05 
t / 2; n A  nB  2  t 0.05;40  1.684
2 2
(n A  1) S A  (nB  1) S B
Sp   0.2484
n A  nB  2
t n X  nY 2  t40
0.05 0.90 0.05
t 0.05  1.684 t0.05  1.684

 1 1 
x  x  t
 A B  / 2;n A  nB  2S p  
 n A nB 
  0.2292, 0.0292
233
 Varianzas poblacionales desconocidas
Tamaños muestrales grandes
 Distribución muestral:
 X  Y     X   Y  n X , nY  
Z   N (0; 1)
2 2
SX SY

nX nY
P   z / 2  Z  z / 2   1  
/2 1 /2
z1 / 2   z / 2 z / 2
NOTA: La aproximación se considera correcta para

n X y n Y > 30
234
P   z / 2  Z  z / 2   1  
 
 
 
P   z / 2 

X  Y   X  Y  
 z / 2   1  
 2 2 
 S X SY 
  
n X nY
 
 2 2
 S X S Y
 
P  X  Y  z / 2 
n X nY
  X  Y 


2 2 
S X SY 

 X  Y  z / 2  
n X nY   1


I.C. para X   Y , al nivel de confianza 1  , con

varianzas poblacionales desconocidas y muestras grandes
 2 2
 SX SY 

 X  Y  z / 2 
n X nY 
 
235
 Ejemplo
Se utilizan habitualmente en una fábrica de cerveza dos
tipos de genes A y B cuya actividad contribuye a
aumentar el contenido proteico de los granos de cebada.
Se desea comparar el aumento de proteínas que se
produce en los granos de cebada con ambos genes. Para
un nivel de confianza 0.9, se considera una muestra de
100 cubas con cebada con el gen A, obteniéndose un
aumento de 0.5 mgr con una cuasivarianza de 0.08.
Simultáneamente se seleccionan otras120 cubas con
cebada con el gen B y se obtiene un aumento medio de
0.2 mgr con una cuasivarianza de 0.09. Estimar la
diferencia de engorde medio.
Solución
 S A2 S B2 
 x  x   z  
 A B  /2
n A nB 
 
n A  100 ; x A  0.5 ; S A2  0.08
nB  120 ; xB  0.2 ; S B2  0.09
236
n A  100 ; x A  0.5 ; S A2  0.08
nB  120 ; xB  0.2 ; S B2  0.09
1    0.90;   0.10;  2  0.05 
z / 2  z0.05  1.645
0.05 0.90 0.05
 z 0.05  1.645 z 0.05  1.645
 S A2 S B2 
 x  x   z  
 A B  /2
n A nB 
 
 0.08 0.09 0.08 0.09 

  0.5  0.2  1.645  , 0.5  0.2  1.645  
 100 120 100 120 
  0.2352, 0.3648
237
3.3.2. Intervalo de confianza para el
cociente de varianzas:  X2 /  Y2
nX
1 2
S X2

n X  1 i 1

Xi  X 
Estimador: T  nY
S Y2 1 2

nY  1 i 1

Yi  Y 
Distribución muestral
S X2
 X2 S X2  Y2
F   Fn X 1, nY 1
S Y2 S Y2  X2
 Y2
P  F1 / 2; nX 1, n Y 1  F n X 1, nY 1  F / 2; n X 1, nY 1   1  

 
/2 /2
1
F1 / 2 ; n X 1, n Y 1 F / 2 ; n X 1, nY 1
238
P  F1 / 2; nX 1, nY 1  F nX 1, nY 1  F / 2; nX 1, nY 1   1  
 
  Y2 S X2 
P  F1 / 2; nX 1, nY 1   F / 2; nX 1, nY 1   1  
  X2 S Y2 
 
 S Y2  Y2 S 2 
P  F1 / 2; nX 1, nY 1   F / 2; nX 1, nY 1 Y   1
 2 2 2 
SX  X SX
 
2

1 SX  2X 2
SX 1

P     1
 F1 / 2; n 1, n 1 2 2 2
X Y SY  Y S Y F / 2; nX 1, nY 1 
 
2

1 SX  2X 2
SX 1

P     1
 F / 2; n 1, n 1 2 2
SY  Y S Y F1 / 2; nX 1, nY 1 
2
 X Y

239
2

1 SX  2X SX
2
1

P     1 
 F / 2; n 1, n 1 2 2
SY  Y S Y F1 / 2; n X 1, n Y 1 
2
 X Y

1
 F / 2; nY 1, n X 1
F1 / 2; nX 1, nY 1
2

1 SX  2X 2 
SX
P    F / 2; nY 1, n X 1   1
2
 F / 2; n 1, n 1
X Y SY  Y2 SY2 
 
2 2
I.C. para  X /  Y con medias poblacionales
desconocidas, al nivel de confianza 1
 2 2
1 SX SX 
 , F / 2 ; nY 1 , n X 1 
 F / 2; n 1, n 1 2 2
X Y SY SY 
 
240
 Ejemplo
Una central lechera recibe diariamente leche de dos
granjas A y B. Deseando estudiar la calidad de los
productos se eligen dos muestras al azar de la leche
suministrada por cada una de las granjas analizando el
contenido en grasa. Para la granja A se han tomado 11
muestras obteniéndose una cuasivarianza de 0.034,
mientras que para la granja B ha sido de 0.027 en un total
de 16 muestras.
Es conocido por experiencia previa que los contenidos
medios en grasa de la granjas son normales e
independientes. Estimar el cociente de varianzas al nivel
de confianza de 0.98.
Solución

1 S A2 S 2A 
 , F / 2; n 1, n 1

S B2 S B2 
 F / 2; nA 1, n B 1 B A
 
n A  11 ; S A2  0.034 ; nB  16 ; S B2  0.027
241
n A  11 ; S A2  0.034 ; nB  16 ; S B2  0.027
1    0.98;   0.02;  2  0.01 
F / 2; n A 1, nB 1  F 0.01;10, 15  3.80

F / 2; nB 1, n A 1  F 0.01;15, 10  4.56

1 S A2 S 2A 
 , F / 2; n B 1, nA 1 2  
 F / 2; nA 1, n B 1 2
SB SB 
 
 1 0.034 0.034 
  , 4.56    0.3314, 5.7422
 3.80 0.027 0.027 
242
 3.4. Intervalo de confianza para una
proporción
 Se muestrea una población para estimar el parámetro

proporción
p : proporción de éxitos en la población

X : “número de éxitos en n realizaciones independientes”
n conocido
X B (n; p)
Parámetro a estimar: p
Estimador puntual de p: p̂ = X / n
Distribución asintótica ( n   ):
n  

X  N np ; npˆ 1  pˆ  
X n  
 pˆ 1  pˆ  
pˆ    N  p; 
n  n 
 
pˆ  p n  
Z  N  0; 1
pˆ ( 1  pˆ )
n
243
pˆ  p n
Z  N (0;1)
pˆ 1  pˆ 
n
/2 /2
1
z1 / 2   z / 2 z / 2
P [ z / 2  Z  z / 2 ]  1  
pˆ  p
P [ z / 2   z / 2 ]  1  
pˆ (1  pˆ )
n
 pˆ 1  pˆ  pˆ 1  pˆ  
P  pˆ  z / 2  p  pˆ  z / 2   1 
 n n 
 
I.C. para el parámetro proporción, al nivel 1
 pˆ 1  pˆ  pˆ 1  pˆ  
 pˆ  z / 2 , pˆ  z / 2 
 n n 
 
244
 Ejemplo
Se ignora la proporción de estudiantes de una
determinada titulación que fuman habitualemente. Para
dar una estimación se ha tomado una muestra de 100
estudiantes observando que 15 de ellos son fumadores
habituales. Hallar un intervalo de confianza al nivel de
confianza del 0.95 para la proporción estudiantes que
fuman.
Solución
15
pˆ   0.15 ; z / 2  z0.025  1.96
100
 pˆ 1  pˆ  pˆ 1  pˆ  
 pˆ  z / 2 , pˆ  z / 2 
 n n 
 
 0.15  0.85 0.15  0.85 

 0.15  1.96 , 0.15  1.96 
 100 100 
  0.081, 0.219
245
 3.5. Intervalo de confianza para la
diferencia de proporciones
Se muestrean dos poblaciones independientes para

estimar la diferencia de proporciones
p1  p2 : diferencia de proporciones de éxitos en la población

X : “número de éxitos en nX realizaciones independientes”
Y : “número de éxitos en nY realizaciones independientes”
nX y nY conocidos
Parámetro a estimar : p1  p 2 pˆ1  pˆ 2  X n X  Y nY
Estimador puntual de p1  p 2 : pˆ1  pˆ 2  X n X  Y nY
Distribución asintótica  n X , nY   : 
X Y 
n X , nY 
pˆ1  pˆ 2   
n X nY
 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
N  p1  p2 ;  
 nX nY 
 
246
 pˆ1  pˆ 2    p1  p 2  nX , n Y  
Z 
 N (0; 1)
pˆ1 1  pˆ1  pˆ 2 1  pˆ 2 

nX nY
/2 /2
1
z1 / 2   z / 2 z / 2
P   z / 2  Z  z / 2  
 
 

P   z 2 

 pˆ1  pˆ 2   p1  p 2  
 z 2   1  
 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
  
nX nY
 
247
 
 

P   z 2 
ˆ 
 p1  p2   p1  p 2
ˆ  
 z 2   1  
 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
  
 nX nY 
 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2 
P  pˆ1  pˆ 2   z 2
 nX

nY

 p1  p 2  

pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
  pˆ1  pˆ 2   z 2   1
nX nY 

I.C. para la diferencia de proporciones, al nivel

de confianza 1
 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
 pˆ1  pˆ 2   z 2  
 nX nY 
 
248
 Ejemplo
Se desea comparar las proporciones de colectivo LGBTI
en hombres y mujeres con edades mayores de 60 años.
Para dar una estimación se ha tomado una muestra de 80
personas, de las que 5 de ellas son de este tipo entre los
hombres (A), y hay 8 de 100 en el grupo de las mujeres.
Halla un intervalo de confianza al nivel de confianza del
0.95 para la diferencia de proporciones los dos grupos.
Solución
5
pˆ1   0.0625 ; z / 2  z 0.025  1.96
80
8
ˆp2   0.08 ; n X  80 ; nY  100
100
 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
 pˆ1  pˆ 2   z 2  
 nX nY 
 
 
0.0625  0.08  1.96 0.0625(1  0.0625)  0.08(1  0.08) 
 80 100 
 
  0.0926, 0.0576 
249

Estimación

Загружено:

Сведения о документе

Исходное описание:

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Estimación

Загружено:

Авторское право:

Доступные форматы

TEMA ESTIMACIÓN

2. Estimación puntual. Propiedades deseables de los

3. Estimación por intervalos de confianza

 Supongamos que conocemos la distribución de la

 La función de densidad o masa de probabilidad depende

 Se desean estimar los parámetros a partir de una

¿Cómo hacer esta estimación?

Estimación puntual: Se busca un estimador, que con

 Estimación por intervalos: Se determina un intervalo

Consideramos una variable aleatoria, X, que estudia el

 La función de densidad de la distribución Normal

 Estos parámetros son desconocidos

 Se desea estimarlos a partir de una muestra tomada

 2.1. Introducción y definiciones

Sea X1, …, X n una muestra aleatoria simple con función

El problema es encontrar una función que proporcione el

El estimador, T, del parámetro  debe tener una

Para estudiar la variabilidad de los valores del estimador

Definición. Error cuadrático medio

Sea T un estimador de  . Se define

 Definición. Sesgo de un Estimador

Sea T el estimador del parámetro . Se define el sesgo

 Definición. Estimador Insesgado

T es un estimador insesgado de  si y sólo si

E[T] =  para todo 

NOTA: En este caso ECM ( T ) = Var [ T ]

Se desea calcular un intervalo aleatorio que contenga al

 Las funciones h1 y h2 son funciones de un estadístico T

 Definición: Nivel de confianza (1)

P [ h1(T)    h2(T) ] = 1

 Definición: Intervalos de confianza unilaterales

 NOTA: De cada 100 intervalos construidos a partir

 Se muestrea una población normal para estimar los

X1 , … , X n m.a.s. de una población X N ( ,  )

 Se desea estimar la media poblacional mediante un

 Varianza poblacional conocida  2

Estadístico asociado al parámetro a estudiar  : T  X

 Distribución de la media muestral:

/2 1 /2

 I.C. para , con varianza conocida, al nivel de

• A medida que el nivel de confianza es mayor aumenta la

1    0.90;   0.10;  2  0.05 

0.05 0.90 0.05

 z 0.05  1.645 z 0.05  1.645

/2 1 /2

I.C. para  con varianza desconocida

I.C. para  con varianza desconocida

1    0.90;   0.10;  2  0.05 

t / 2; n1  t 0.05;15  1.753

0.05 0.90 0.05

t 0.05  1.753 t 0.05  1.753

 Media poblacional desconocida

P  12 / 2;n 1   n21  2 / 2;n 1   1  

I.C. para  2, con media poblacional desconocida,

1   = 0.95;  = 0.05;  / 2 = 0.025

 12 / 2; n1   0.975;8

 Se muestrean dos poblaciones normales para estimar

Sean las variables aleatorias X e Y tales que

 Se desean estimar comparativamente los parámetros

 Varianzas poblacionales conocidas

/2 1 /2

I.C. para  X   Y con varianzas poblacionales