Вы находитесь на странице: 1из 47

TEMA ESTIMACIÓN

1. Introducción y definiciones

2. Estimación puntual. Propiedades deseables de los


estimadores
2.1. Introducción y definiciones
2.2. Estimadores Insegados

3. Estimación por intervalos de confianza


3.1. Introducción
3.2. Intervalos de confianza para una población
normal
2.1. Intervalos de confianza para la media
2.2. Intervalo de confianza para la varianza
3. Intervalos de confianza para dos poblaciones
Normales independientes
3.1. Intervalos de confianza para la diferencia de
medias
3.2. Intervalos de confianza para el cociente de
varianzas
4. Intervalo de confianza para una proporción
5. Intervalo de confianza para la diferencia de
proporciones

203
 1. Introducción y definiciones

 Supongamos que conocemos la distribución de la


característica de interés de una población

 La función de densidad o masa de probabilidad depende


del vector de parámetros  : f ( x ;  )

 Se desean estimar los parámetros a partir de una


muestra

¿Cómo hacer esta estimación?

Estimación puntual: Se busca un estimador, que con


base a los datos muestrales dé origen a un valor puntual
que utilizamos como estimación del parámetro

 Estimación por intervalos: Se determina un intervalo


aleatorio que, de forma probable, contiene el verdadero
valor del parámetro. Este intervalo recibe el nombre de
intervalo de confianza

204
 Ejemplo

Consideramos una variable aleatoria, X, que estudia el


grosor de los troncos de los pinos de un Parque Natural.
Se sabe que dicha variable se puede ajustar al modelo de
la distribución Normal, pero no se conocen la media ni la
desviación típica del grosor de los troncos.

 R
X N  ;  
 0

 La función de densidad de la distribución Normal


depende del vector de parámetros     ,  

 Estos parámetros son desconocidos

 Se desea estimarlos a partir de una muestra tomada


entre todos los pinos del Parque Natural

205
2. Estimación puntual. Propiedades
deseables de los estimadores

 2.1. Introducción y definiciones

Sea X1, …, X n una muestra aleatoria simple con función


de densidad f ( x ;  )
Sea un estadístico T = u ( X 1 , …, X n )

El problema es encontrar una función que proporcione el


mejor estimador de 

El estimador, T, del parámetro  debe tener una


distribución concentrada alrededor de  y la varianza
debe ser lo menor posible

P[  h  T   + h]
debería ser grande

h  +h

206
 Error cuadrático medio

P [  h  T   + h ]
debería ser grande

h  +h

Para estudiar la variabilidad de los valores del estimador


alrededor del parámetro se hace uso de una cantidad
llamada error cuadrático medio

Definición. Error cuadrático medio

Sea T un estimador de  . Se define

ECM ( T ) = E [( T   ) 2 ] = Var [ T ] + [   E [ T ] ] 2

207
 2.2. Estimadores Insesgados

 Definición. Sesgo de un Estimador

Sea T el estimador del parámetro . Se define el sesgo


del estimador como

  E[T]

 Definición. Estimador Insesgado

T es un estimador insesgado de  si y sólo si

E[T] =  para todo 

NOTA: En este caso ECM ( T ) = Var [ T ]

208
3. Estimación por intervalos de confianza

 3.1. Introducción

Se desea calcular un intervalo aleatorio que contenga al


verdadero valor del parámetro, , con una cierta
probabilidad
h1(T)    h2(T)

 Las funciones h1 y h2 son funciones de un estadístico T


relacionado con el parámetro a estimar en cada caso

 Definición: Nivel de confianza (1)


El nivel de confianza, 1, es la probabilidad de que un
intervalo de confianza contenga al verdadero valor del
parámetro.
P [ h1 ( T )    h 2 ( T ) ] = 1

209
 Definición: Intervalos de confianza bilaterales

P [ h1(T)    h2(T) ] = 1

 Definición: Intervalos de confianza unilaterales

P [  h1(T) ] = 1
P [  h2(T) ] = 1

 NOTA: De cada 100 intervalos construidos a partir


de 100 muestras, 100 ( 1 ) % deberían contener al
verdadero valor del parámetro.

( )

Intervalo aleatorio
( )
  fijo
.................
( )

( )

210
 3.2. Intervalos de confianza para una
población normal

 Se muestrea una población normal para estimar los


parámetros de esta población

X1 , … , X n m.a.s. de una población X N ( ,  )

Independientes entre sí
X 1, X 2 ,... X n
Xi N (, )
Se desea estimar alguno de los parámetros, o ambos,
según sea o no conocido el otro

211
3.2.1. Intervalos de confianza para la media

 Se desea estimar la media poblacional mediante un


intervalo de confianza

 Varianza poblacional conocida  2


0

Estadístico asociado al parámetro a estudiar  : T  X


(media muestral).

 Distribución de la media muestral:


  
X  N ; 0   Z
 X     N  0; 1
 n 0
 
n

P   z / 2  Z  z / 2   1  

/2 1 /2

z1 / 2   z / 2 z / 2

212
 
P   z / 2  Z  z / 2   P   z / 2 
X  
 z / 2   1  
 0 
 
 n 

 0 0 
P   z / 2  X    z / 2  1
 n n 

 0 0 
P   X  z / 2      X  z / 2  1
 n n 

 0 0 
P  X  z / 2    X  z / 2  1
 n n 

 0 0 
P  X  z / 2    X  z / 2   1 
 n n 

 I.C. para , con varianza conocida, al nivel de


confianza 1 .

 0 0 
 X  z / 2 , X  z / 2 
 n n
 

213
 I.C. para , con varianza conocida, al nivel de
confianza 1 

 0 0 
 X  z / 2 , X  z / 2 
 n n
 

NOTA:
• A medida que aumenta el tamaño de la muestra
disminuye la amplitud del intervalo

• A medida que el nivel de confianza es mayor aumenta la


amplitud del intervalo

214
 Ejemplo. Se desea estudiar el peso en gramos del fruto
producido por una planta. Para ello se tomó una muestra
de 16 plantas observando los siguientes pesos: 506, 508,
499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506,
502, 509, 496. El peso del fruto de cada planta es una v.a.
Normal con desviación típica 5 gr. Obtener un intervalo
de confianza al nivel de confianza 0.9 para el peso medio
del fruto de esta planta.

Solución.-
I.C. para  con varianza conocida
al nivel de confianza 1

 0 0 
 X  z / 2 , X  z / 2 
 n n 

x  503.75; n  16;  02  25 ;  0  5

215
 0 0 
 X  z / 2 , X  z / 2 
 n n 

x  503.75; n  16;  02  25 ;  0  5

1    0.90;   0.10;  2  0.05 

z / 2  z0.05  1.645

0.05 0.90 0.05

 z 0.05  1.645 z 0.05  1.645

 5 5
 503.75  1.645 , 503.75  1.645  
4 4

 501.69, 505.81

216
 Varianza poblacional desconocida

 Estimador: X

Distribución muestral: T
 X  
 tn 1
S
n

1 2
Cuasidesviación típica S
n 1 i
X  X  
i

/2 1 /2

t1 / 2  t / 2 t / 2

 
P  t / 2; n 1  T  t / 2; n 1   1  
 
 
P  t / 2; n1 

X  
 t / 2; n1   1  
 S 
 n 

217
 

P  t / 2; n1 
X  
 t / 2 ; n1   1  
 S 
 n 

 S S 
P  t / 2; n1  X    t / 2; n1  1
 n n

 S S 
P   X  t / 2; n1      X  t / 2; n 1  1
 n n

 S S 
P  X  t / 2; n1     X  t / 2; n1  1
 n n

 S S 
P  X  t / 2; n 1    X  t / 2; n1  1
 n n

I.C. para  con varianza desconocida


al nivel de confianza 1

 S S 
 X  t / 2;n 1 , X  t / 2;n1 
 n n

218
 Ejemplo. Se desea estudiar el peso en gramos del
fruto producido por una planta. Para ello se tomó una
muestra de 16 plantas observando los siguientes pesos:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493,
496, 506, 502, 509, 496. Del peso del fruto sólo se
conoce que es una v.a. Normal. Obtener un intervalo de
confianza al nivel de confianza 0.9 para el peso medio
del fruto de esta planta.

Solución

 S S 
 X  t / 2; n1 , X  t / 2; n1 
 n n 

I.C. para  con varianza desconocida


al nivel de confianza 1

x  503.75 ; S  6.2022 ; n  16

219
 S S 
 X  t / 2; n1 , X  t / 2; n1 
 n n 

x  503.75 ; S  6.2022 ; n  16

1    0.90;   0.10;  2  0.05 

t / 2; n1  t 0.05;15  1.753

0.05 0.90 0.05

t 0.05  1.753 t 0.05  1.753

 6.2022 6.2022 
 503 . 75  1.753  , 503 . 75  1.753 
 
4 4 

 501.0319, 506.4681

220
 3.2.2. Intervalo de confianza para la varianza

 Media poblacional desconocida

2 1 2
Estimador: Cuasivarianza S 
n 1 i
X X  
i

 Distribución muestral
n 2

 Xi  X 
 n  1 S 2
i 1    n21
2 2

P  12 / 2;n 1   n21  2 / 2;n 1   1  


 

 2 
2  n  1 S 2
P  1 / 2; n1    / 2; n1   1  
 2 

/2 /2
1

12 / 2;n 1 2
 / 2;n 1

221
 2 
2  n  1 S 2
P  1 / 2; n1    / 2; n1   1  
 2 

2  2 
1  / 2; n 1 1  / 2; n 1
P     1
 n 1 S 2 2 2
     n  1  S 

 2 2 
 
n  1 S   
n  1 S
P 2   1
2 2 
 / 2; n1 
 1 / 2; n 1 

 2 2 
( n  1) S ( n  1) S 
P 2   1
 2  2 
  / 2;n1 1 / 2;n 1 

I.C. para  2, con media poblacional desconocida,


al nivel de confianza 1

 2 2 
 ( n  1) S ( n  1) S 
,
2  2 
  / 2; n1 1 / 2 ; n 1 

222
 Ejemplo
Se desea estimar la varianza del nivel de nistamina en un
ungüento. Se conoce por larga experiencia que su
distribución sigue una ley Normal. Se toma una muestra
de 9 ungüentos, dando el nivel siguiente (en millones de
unidades/gr): 1, 0.9, 1.5, 2.8, 3.1, 3.2, 2.5, 1.9, 2. Estimar
la varianza mediante dos intervalos de confianza al nivel
de confianza del 99% y del 95%.
Solución
2 1 2
Cuasivarianza: S 
n 1   xi  x   0.74
i
Nivel de confianza: 1   = 0.99;  = 0.01;  / 2 = 0.005
2 / 2;n 1   0.005;8
2  22.0; 12 / 2;n1   0.995;8
2  1.34

0.005 0.005
0.99

2  20.005;8  22.0
0.995;8  1.34

 2 2 
 ( n  1) S , ( n  1) S    8  0.74 , 8  0.74  
2 2   22.0 1.34 
 
  / 2; n1 1 / 2; n 1 

  0.2691, 4.4179 

223
Nivel de confianza: 1   = 0.95

1   = 0.95;  = 0.05;  / 2 = 0.025

1 2
Cuasi-varianza: S2    xi  x   0.74
n 1
i

 2 / 2 ; n1   0.025
2
; 8  17.5

 12 / 2; n1   0.975;8


2
 2.18

0.025 0.025
0.95

2
0.975;8  2.18  20.025;8  17.5

 2 2 
 ( n  1) S ( n  1) S   8  0.74 8  0.74 
,  , 
2 2   17.5 2.18 
  / 2; n1 1 / 2; n1 

  0.3383, 2.7156

224
3.3. Intervalos de confianza para dos
poblaciones Normales independientes

 Se muestrean dos poblaciones normales para estimar


los parámetros “comparativamente”

Sean las variables aleatorias X e Y tales que


X N ( X ;  X )
Independientes
Y N (  Y ; Y )
Consideramos:
m.a.s. de tamaño nX de X X , S X2
X1, X 2 ,..., X n
x

m.a.s. de tamaño n Y de Y
Y , S Y2
Y1, Y2 ,..., Yn Y

 Se desean estimar comparativamente los parámetros


de ambas poblaciones

225
 7.3.3.1. Intervalos de confianza para la
diferencia de medias

 Varianzas poblacionales conocidas

Estimador: T  X  Y

 Distribución muestral:
 X  Y     X  Y 
Z  N (0; 1)
 X2  Y2

nX nY

P   z / 2  Z  z / 2   1  

/2 1 /2

z1 / 2   z / 2 z / 2

226
P   z / 2  Z  z / 2   1  

 
 

P   z / 2 
  
X  Y   X  Y  
 z / 2   1  
 2 2 
  X Y 
  
nX nY
 

 2 2
  X  Y
 
P  X  Y  z / 2
nX

nY
  X  Y 


2 2 
 X Y 
 
 X  Y  z / 2
nX

nY 
1

I.C. para  X   Y con varianzas poblacionales


conocidas, al nivel de confianza 1 

 2 2
  X  Y 
 X Y  z
 /2
nX

nY 
 

227
 Ejemplo
Se utilizan habitualmente en una fábrica de cerveza dos tipos de
genes A y B cuya actividad contribuye a proveer de nitrógeno a
los granos de la cebada. El contenido proteico de los granos
influye en el sabor de la bebida, la estabilidad de la espuma y la
nutrición de las levaduras que realizan la fermentación para la
producción del alcohol. Se desea comparar el aumento de
proteínas que se produce en los granos de cebada con ambos
genes. Para un nivel de confianza 0.9, se selecciona una
muestra de 20 cubas con cebada con el gen A, obteniéndose una
ganancia media de proteínas de 0.4 mgr. Simultáneamente se
selecciona otra muestra de tamaño 19 con el gen B y se obtiene
una ganancia media de 0.5 mgr. Se conoce por experiencia
previa que las variables objeto de estudio, ganancia de proteínas
con ambos genes, son normales con varianzas de 0.05 para la
cebada con el gen A y 0.1 para la cebada con el gen B. Estimar
la diferencia de ganancia medio.

Solución
n A  20 ; x A  0.4 ;  2A  0.05

nB  19 ; xB  0.5 ;  B2  0.1

 2 2 2 2 
x  x  z  
A  B, x x z  
A B
 A B  / 2 n A nB A B  /2
n A nB 
 

228
n A  20 ; x A  0.4 ;  2A  0.05

nB  19 ; xB  0.5 ;  B2  0.1
 2 2 2 2 
x  x  z  
A  B , x x z  
A B
 A B  / 2 A B  / 2
n A nB n A nB 
 

1    0.90;   0.10;  2  0.05 

z / 2  z0.05  1.645

0.05 0.90 0.05

 z 0.05  1.645 z 0.05  1.645

 0.05 0.1 0.05 0.1 


 0.4  0.5  1.645  , 0.4  0.5  1.645  
 20 19 20 19 

  0.2449, 0.0449

229
 Varianzas poblacionales desconocidas
2 2
pero iguales X Y

Estimador: T  X  Y

 Distribución muestral

T
 X  Y     X  Y 
t n X  nY  2
1 1
Sp 
n X nY

2
(n X  1) S X  (nY  1) SY2
Sp 
n X  nY  2

P  t / 2;n X  nY 2  tn X  nY 2  t / 2;n X  nY 2   1  


 
t n X  nY  2

/2 1 /2

t1 / 2  t / 2 t / 2

230
P  t / 2;n X  nY 2  tn X  nY 2  t / 2;n X  nY  2   1  
 

 
 
P  t / 2; n X  nY  2 
 
X  Y   X  Y  
 t / 2; n X  nY  2  
 1 1 
 Sp  
 n X nY 

 1 1
P  X  Y  t / 2; n X  nY  2  S p    X  Y 
 n X nY

1 1 
 X  Y  t / 2; n X  nY  2  S p   1
n X nY 

I.C. para  X   Y , al nivel de confianza 1 , con


varianzas poblacionales desconocidas pero iguales y
muestras pequeñas

 1 1 
 X  Y  t / 2; n X  nY 2  S p  
 n X nY 

231
 Ejemplo
Se utilizan habitualmente en una fábrica de cerveza dos tipos de
genes A y B cuya actividad contribuye a aumentar el contenido
proteico de los granos de cebada. Se desea comparar el aumento
de proteínas que se produce en los granos de cebada con ambos
genes. Para un nivel de confianza 0.9, se considera una muestra
de 22 cubas con cebada con el gen A, obteniéndose un aumento
de 0.4 mgr con una varianza de 0.03. Simultáneamente se
considera una muestra de 20 cubas con el gen B y se obtiene un
aumento proteínico medio de 0.5 mgr con una varianza de 0.09.
Se conoce por experiencis previas que las variables objeto de
estudio, aumento de proteinas con los dos genes, son normales
con varianzas poblacionales iguales. Estimar la diferencia de
engorde medio.
Solución

 1 1 
 x A  xB  t / 2; n A  nB  2  S p  
 n A n B

n A  22 ; x A  0.4 ; ˆ A2  0.03
nB  20 ; xB  0.5 ; ˆ B2  0.09

232
n A  22 ; x A  0.4 ; ˆ A2  0.03
nB  20 ; xB  0.5 ; ˆ B2  0.09
nA ˆ 2 nB ˆ 2
S A2   A  0.0316 ; S B2   B  0.095
nA  1 nB  1

1    0.90;   0.10;  2  0.05 

t / 2; n A  nB  2  t 0.05;40  1.684

2 2
(n A  1) S A  (nB  1) S B
Sp   0.2484
n A  nB  2

t n X  nY 2  t40

0.05 0.90 0.05

t 0.05  1.684 t0.05  1.684


 1 1 
x  x  t
 A B  / 2;n A  nB  2S p  
 n A nB 
  0.2292, 0.0292

233
 Varianzas poblacionales desconocidas
Tamaños muestrales grandes

Estimador: T  X  Y

 Distribución muestral:

 X  Y     X   Y  n X , nY  
Z   N (0; 1)
2 2
SX SY

nX nY

P   z / 2  Z  z / 2   1  

/2 1 /2

z1 / 2   z / 2 z / 2

NOTA: La aproximación se considera correcta para


n X y n Y > 30

234
P   z / 2  Z  z / 2   1  
 
 
 
P   z / 2 

X  Y   X  Y  
 z / 2   1  
 2 2 
 S X SY 
  
n X nY
 

 2 2
 S X S Y
 
P  X  Y  z / 2 
n X nY
  X  Y 


2 2 
S X SY 

 X  Y  z / 2  
n X nY   1

I.C. para X   Y , al nivel de confianza 1  , con


varianzas poblacionales desconocidas y muestras grandes

 2 2
 SX SY 

 X  Y  z / 2 
n X nY 
 

235
 Ejemplo
Se utilizan habitualmente en una fábrica de cerveza dos
tipos de genes A y B cuya actividad contribuye a
aumentar el contenido proteico de los granos de cebada.
Se desea comparar el aumento de proteínas que se
produce en los granos de cebada con ambos genes. Para
un nivel de confianza 0.9, se considera una muestra de
100 cubas con cebada con el gen A, obteniéndose un
aumento de 0.5 mgr con una cuasivarianza de 0.08.
Simultáneamente se seleccionan otras120 cubas con
cebada con el gen B y se obtiene un aumento medio de
0.2 mgr con una cuasivarianza de 0.09. Estimar la
diferencia de engorde medio.

Solución

 S A2 S B2 
 x  x   z  
 A B  /2
n A nB 
 

n A  100 ; x A  0.5 ; S A2  0.08

nB  120 ; xB  0.2 ; S B2  0.09

236
n A  100 ; x A  0.5 ; S A2  0.08

nB  120 ; xB  0.2 ; S B2  0.09

1    0.90;   0.10;  2  0.05 

z / 2  z0.05  1.645

0.05 0.90 0.05

 z 0.05  1.645 z 0.05  1.645

 S A2 S B2 
 x  x   z  
 A B  /2
n A nB 
 

 0.08 0.09 0.08 0.09 


  0.5  0.2  1.645  , 0.5  0.2  1.645  
 100 120 100 120 

  0.2352, 0.3648

237
3.3.2. Intervalo de confianza para el
cociente de varianzas:  X2 /  Y2

nX
1 2

S X2

n X  1 i 1

Xi  X 
Estimador: T  nY
S Y2 1 2

nY  1 i 1

Yi  Y 
Distribución muestral

S X2
 X2 S X2  Y2
F   Fn X 1, nY 1
S Y2 S Y2  X2
 Y2

P  F1 / 2; nX 1, n Y 1  F n X 1, nY 1  F / 2; n X 1, nY 1   1  


 

/2 /2
1

F1 / 2 ; n X 1, n Y 1 F / 2 ; n X 1, nY 1

238
P  F1 / 2; nX 1, nY 1  F nX 1, nY 1  F / 2; nX 1, nY 1   1  
 

  Y2 S X2 
P  F1 / 2; nX 1, nY 1   F / 2; nX 1, nY 1   1  
  X2 S Y2 
 

 S Y2  Y2 S 2 
P  F1 / 2; nX 1, nY 1   F / 2; nX 1, nY 1 Y   1
 2 2 2 
SX  X SX
 

2

1 SX  2X 2
SX 1

P     1
 F1 / 2; n 1, n 1 2 2 2
X Y SY  Y S Y F / 2; nX 1, nY 1 
 

2

1 SX  2X 2
SX 1

P     1
 F / 2; n 1, n 1 2 2
SY  Y S Y F1 / 2; nX 1, nY 1 
2
 X Y

239
2

1 SX  2X SX
2
1

P     1 
 F / 2; n 1, n 1 2 2
SY  Y S Y F1 / 2; n X 1, n Y 1 
2
 X Y

1
 F / 2; nY 1, n X 1
F1 / 2; nX 1, nY 1

2

1 SX  2X 2 
SX
P    F / 2; nY 1, n X 1   1
2
 F / 2; n 1, n 1
X Y SY  Y2 SY2 
 

2 2
I.C. para  X /  Y con medias poblacionales
desconocidas, al nivel de confianza 1

 2 2
1 SX SX 
 , F / 2 ; nY 1 , n X 1 
 F / 2; n 1, n 1 2 2
X Y SY SY 
 

240
 Ejemplo
Una central lechera recibe diariamente leche de dos
granjas A y B. Deseando estudiar la calidad de los
productos se eligen dos muestras al azar de la leche
suministrada por cada una de las granjas analizando el
contenido en grasa. Para la granja A se han tomado 11
muestras obteniéndose una cuasivarianza de 0.034,
mientras que para la granja B ha sido de 0.027 en un total
de 16 muestras.
Es conocido por experiencia previa que los contenidos
medios en grasa de la granjas son normales e
independientes. Estimar el cociente de varianzas al nivel
de confianza de 0.98.

Solución


1 S A2 S 2A 
 , F / 2; n 1, n 1

S B2 S B2 
 F / 2; nA 1, n B 1 B A
 

n A  11 ; S A2  0.034 ; nB  16 ; S B2  0.027

241
n A  11 ; S A2  0.034 ; nB  16 ; S B2  0.027

1    0.98;   0.02;  2  0.01 

F / 2; n A 1, nB 1  F 0.01;10, 15  3.80


F / 2; nB 1, n A 1  F 0.01;15, 10  4.56


1 S A2 S 2A 
 , F / 2; n B 1, nA 1 2  
 F / 2; nA 1, n B 1 2
SB SB 
 

 1 0.034 0.034 
  , 4.56    0.3314, 5.7422
 3.80 0.027 0.027 

242
 3.4. Intervalo de confianza para una
proporción

 Se muestrea una población para estimar el parámetro


proporción

p : proporción de éxitos en la población


X : “número de éxitos en n realizaciones independientes”
n conocido
X B (n; p)
Parámetro a estimar: p
Estimador puntual de p: p̂ = X / n

Distribución asintótica ( n   ):
n  

X  N np ; npˆ 1  pˆ  
X n  
 pˆ 1  pˆ  
pˆ    N  p; 
n  n 
 
pˆ  p n  
Z  N  0; 1
pˆ ( 1  pˆ )
n
243
pˆ  p n
Z  N (0;1)
pˆ 1  pˆ 
n

/2 /2
1

z1 / 2   z / 2 z / 2
P [ z / 2  Z  z / 2 ]  1  

pˆ  p
P [ z / 2   z / 2 ]  1  
pˆ (1  pˆ )
n

 pˆ 1  pˆ  pˆ 1  pˆ  
P  pˆ  z / 2  p  pˆ  z / 2   1 
 n n 
 

I.C. para el parámetro proporción, al nivel 1

 pˆ 1  pˆ  pˆ 1  pˆ  
 pˆ  z / 2 , pˆ  z / 2 
 n n 
 

244
 Ejemplo
Se ignora la proporción de estudiantes de una
determinada titulación que fuman habitualemente. Para
dar una estimación se ha tomado una muestra de 100
estudiantes observando que 15 de ellos son fumadores
habituales. Hallar un intervalo de confianza al nivel de
confianza del 0.95 para la proporción estudiantes que
fuman.
Solución
15
pˆ   0.15 ; z / 2  z0.025  1.96
100

 pˆ 1  pˆ  pˆ 1  pˆ  
 pˆ  z / 2 , pˆ  z / 2 
 n n 
 

 0.15  0.85 0.15  0.85 


 0.15  1.96 , 0.15  1.96 
 100 100 

  0.081, 0.219

245
 3.5. Intervalo de confianza para la
diferencia de proporciones

Se muestrean dos poblaciones independientes para


estimar la diferencia de proporciones

p1  p2 : diferencia de proporciones de éxitos en la población


X : “número de éxitos en nX realizaciones independientes”
Y : “número de éxitos en nY realizaciones independientes”
nX y nY conocidos
Parámetro a estimar : p1  p 2 pˆ1  pˆ 2  X n X  Y nY

Estimador puntual de p1  p 2 : pˆ1  pˆ 2  X n X  Y nY

Distribución asintótica  n X , nY   : 
X Y 
n X , nY 
pˆ1  pˆ 2   
n X nY

 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
N  p1  p2 ;  
 nX nY 
 

246
 pˆ1  pˆ 2    p1  p 2  nX , n Y  
Z 
 N (0; 1)
pˆ1 1  pˆ1  pˆ 2 1  pˆ 2 

nX nY

/2 /2
1

z1 / 2   z / 2 z / 2

P   z / 2  Z  z / 2  

 
 

P   z 2 

 pˆ1  pˆ 2   p1  p 2  
 z 2   1  
 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
  
nX nY
 

247
 
 

P   z 2 
ˆ 
 p1  p2   p1  p 2
ˆ  
 z 2   1  
 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
  
 nX nY 

 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2 
P  pˆ1  pˆ 2   z 2
 nX

nY

 p1  p 2  

pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
  pˆ1  pˆ 2   z 2   1
nX nY 

I.C. para la diferencia de proporciones, al nivel


de confianza 1

 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
 pˆ1  pˆ 2   z 2  
 nX nY 
 

248
 Ejemplo
Se desea comparar las proporciones de colectivo LGBTI
en hombres y mujeres con edades mayores de 60 años.
Para dar una estimación se ha tomado una muestra de 80
personas, de las que 5 de ellas son de este tipo entre los
hombres (A), y hay 8 de 100 en el grupo de las mujeres.
Halla un intervalo de confianza al nivel de confianza del
0.95 para la diferencia de proporciones los dos grupos.

Solución
5
pˆ1   0.0625 ; z / 2  z 0.025  1.96
80
8
ˆp2   0.08 ; n X  80 ; nY  100
100

 pˆ1 1  pˆ1  pˆ 2 1  pˆ 2  
 pˆ1  pˆ 2   z 2  
 nX nY 
 
 
0.0625  0.08  1.96 0.0625(1  0.0625)  0.08(1  0.08) 
 80 100 
 

  0.0926, 0.0576 

249

Вам также может понравиться