Вы находитесь на странице: 1из 17

Unidad temtica 4.

Estimacin de parmetros
4.1 Estimacin de parmetros
Estimacin es el proceso de inferir los posibles valores de alguna
caracterstica de la poblacin, va la informacin de una muestra.

Propiedades importantes que es conveniente que tenga un estimador

a) Que el estimador sea insesgado, lo que ocurre cuando la distribucin de las


muestras del estimador est centrada en el parmetro, es decir, que la
media de la distribucin de las muestras del estimador ser el parmetro:

Grfica 1

b) Tambin es conveniente que la desviacin estndar del estimador (error


estndar) sea lo ms pequea posible, con lo cual se dice que es eficiente
el estimador:

Grfica 2
c) Que sea consistente el estimador, lo cual sucede si su valor siempre se
acerca al parmetro que se estime a medida que se aumenta el tamao de
la muestra.

Grfica 3

Por lo anterior se concluye que:


es el mejor estimador de

y la desviacin estndar de la distribucin de las muestras, slo si se busca que el


estimador sea insesgado, logrndose esto con:

(xi x )2
=
1

y entonces:

La estimacin se puede realizar de dos formas: puntual o por intervalo.

Estimacin puntual

Siempre que la poblacin de inters est normalmente distribuida o que las


condiciones del teorema del lmite central se cumplan [n t 30, pero n/ N < 0.5 o
bien N > 2n y en el caso de proporcin n S o n(1- S) t 5] y ya sea que el muestreo
provenga de una poblacin grande o pequea, la media y la proporcin de la
distribucin de las muestras son estimadores insesgados, eficientes y consistentes
de los parmetros correspondientes.

Ejemplo: suponga que un concesionario de una sucursal de comida rpida


desea reunir informacin sobre las utilidades anuales de poseedores actuales de
franquicias. La experiencia pasada sugiere que las utilidades estn distribuidas
normalmente; una muestra aleatoria de 12 sucursales produjo los siguientes datos
de utilidades, en miles de dlares, para el ao inmediato anterior:

61242 10404 91053 48912


28785 76326 67422 40056
92203 96803 97657 92233

Tabla 1

a) Cul es la estimacin puntual de la utilidad anual media de todas las


sucursales con franquicia?

Para responder a lo cuestionado slo es necesario determinar la media de


la muestra x y luego inferir bajo estimacin puntual que es el valor del parmetro
P. As:


= = (61242 + 28785 + 92203 + 10404 + + 48912 + 40056 + 92233)12

= 66899.667 = 66 899 666.67

b) Cul es la estimacin puntual de la desviacin estndar de las utilidades


anuales de todas las sucursales con franquicia?

Nuevamente para responder a lo solicitado se determina el estadstico S y


se infiere bajo estimacin puntual que es el valor del parmetro V. As:

(xi x )2
= =
1

[(61242 66899.667) + (28785 66899.667) + + (92233 66899.667) ]12 1 =

29 383 .11669 = 29 383 116.69 1

c) Entre todos los concesionarios, cul es la proporcin de utilidades de ms de


50 000 de miles de dlares?; y de menos de 20 000 de miles de dlares?
Para utilidades mayores de 50 000 000 dlares se tiene por frecuencias relativas
que

( > 50 000 000) = 812 = 0.6666 = 66.66%

( > 20 000 000) = 112 = 0.08 = 8%

d) Por qu deseara un concesionario obtener el tipo de informacin


detallado en los incisos anteriores?

Con base en la informacin obtenida, el concesionario podra fijar pagos


anuales por derecho o los precios de las franquicias por vender.

Ejercicio: la siguiente informacin son los salarios y el sexo de los gerentes


que administran las concesiones de un giro especial de negocios de una poblacin
pequea.

Gerentes Salario anual (000 dlls) Sexo


A 39 M
B 41 F
C 25 F
D 55 M
E 40 M

Tabla 2

a) Se busca determinar los parmetros media, desviacin estndar y la


proporcin de mujeres.
b) Si se extraen muestras de tamao 3 sin reemplazo, cunto valen las medias
de las muestras, los estimadores insesgados de la desviacin estndar
poblacional y las proporciones de las muestras de mujeres?

Ahora, al analizar la diferencia que hay entre el parmetro y el estadstico,


por ejemplo para la media, x se tiene el error de estimacin, denotado por E,
as pues, x = E

El error de estimacin es la diferencia entre el parmetro estimado y el


estadstico, o bien, es la distancia entre una estimacin y el valor real del
parmetro; por ejemplo para la media =
Debemos reconocer que cualquier parmetro que se estime es igual al
estadstico que sirve como estimacin puntual ms menos el error de estimacin
E, ya que este puede ser negativo o positivo, luego para la media esto queda
establecido por

Estimacin por intervalo

La inevitable incertidumbre sujeta a cualquier estimacin puntual se puede


hacer explcita si se presenta una estimacin por intervalo, indicada -por ejemplo-
para la media, como I y S son los lmites del intervalo por abajo y arriba
de un valor del estadstico y con la ayuda del error estndar del estimador.
Entonces el parmetro desconocido se supone que se encuentra dentro del
intervalo, pero no necesariamente en su centro. Los lmites pueden estar a una
fraccin o a un mltiplo de un error estndar, a cualquier lado de la estimacin
puntual.

Ahora se mencionarn dos caractersticas que tiene la estimacin por


intervalo, las cuales son la precisin y la confianza.

En cuanto a precisin, no resulta obvio que el mejor estimador puntual cae


en el centro del mejor estimador por intervalo; en muchos casos no sucede as y
ms an, no es necesariamente cierto que el mejor estimador por intervalo sea
una funcin del mejor estimador puntual. Luego hay precisin de acuerdo al ancho
del intervalo.

Por confianza entendemos la probabilidad de que el intervalo contenga al


parmetro. Esa probabilidad o confianza se llama coeficiente de confianza. Por
consiguiente al intervalo se le designa como intervalo de confianza. La mayora de
los intervalos de confianza usados en estadstica producen coeficientes de
confianza aproximados puesto que las suposiciones en los que stos se basan no
son satisfechas exactamente en la prctica.

Ntese cmo un valor de Z pequeo para intervalos de confianza que se


distribuyen normalmente, significa una mayor precisin en la estimacin (un
intervalo ms angosto) pero tambin implica un menor grado de confianza en la
estimacin. Un valor de Z grande quiere decir menor precisin (un intervalo ms
amplio) pero implica un mayor grado de confianza.

Existe un concepto llamado cota del error de estimacin, el cual se


establece como dos desviaciones estndar

2 = 2

y si se tiene una distribucin normal es de donde Z = 1.96 (por tablas


ya utilizadas y proporcionadas en la unidad temtica anterior)

4.2 Estimacin de la media poblacional


Como ya se dijo anteriormente para estimar un parmetro como la P dentro
de un intervalo a d P d b, se tiene que a y b se determinan de las observaciones
de la muestra. Se utilizar el concepto de intervalo de confianza cuando esta
aproximacin permita que al estadstico se le asocie un valor de probabilidad con

el intervalo. Ahora por el teorema del lmite central se sabe que = es

asintticamente normal con media cero y varianza uno. Por la tabla de reas de la
distribucin normal estndar sabemos que para 0 d Z d 1.96 le corresponde una
probabilidad de 0.4750 por lo tanto se establece que:


1.96 1.96 = .9500 = 95%

O bien


1.96 + 1.96 = .9500 = 95%

Ahora si establecemos que:



= 1.96

y

= + 1.96

tenemos que:

( ) = 0.95 = 95%

Lo que indica que como la distribucin muestral de medias es



asintticamente normal con = y = , al sustituirlos y despejar el

parmetro P tenemos un intervalo (a, b) el cual genera 95 de 100 intervalos, por
medio de los estadsticos, que contienen al parmetro P, es decir como x es una
variable aleatoria tenemos:

Grfica 4

Que toma varios valores, sean , , , , , luego tenemos que al


tomar los intervalos:

1.96 1.96


1.96 1.96

Como se ve en la grfica, ocurre que intervalos del tipo 1 y 2 s contienen


al parmetro P, pero otros como no lo contienen, luego como la probabilidad de
que P se encuentre dentro del intervalo x 1.96 es del 95% se dice que ocurren
95 veces en 100 que P se encuentre entre esos lmites. As
Los intervalos de confianza pueden estimar cualquier tipo de parmetro, por
ejemplo: media, desviacin estndar, proporcin, etc.

Ejemplo: supongamos que tenemos una poblacin de tamao siete que


consta de los siguientes elementos: 1, 2, 3, 4, 5, 6 y 7. Si seleccionamos muestras
de tamao dos sin reemplazo, cul es el intervalo de confianza para la media si
se tiene un coeficiente de confianza del 90%?

N = 7 elementos

7 7! 67
= = = 21
2 2! 5! 2

n = 2 elementos

(1,2) (1,3) (1,4) (1,5) (1,6) (1,7)

(2,3) (2,4) (2,5) (2,6) (2,7)

(3,4) (3,5) (3,6) (3,7)

(4,5) (4,6) (4,7)

(5,6) (5,7)

(6,7)

1 + 2 + 3 + 4 + 5 + 6 + 7 28
= = = =4
7 7

1 + 4 + 9 + 16 + 25 + 36 + 49 140
= = 4 = 16 = 20 16 = 4
7 7

Luego

= 4 = 4 = 2

Ahora por la Distribucin muestral de medias y el Teorema del Lmite


Central se tiene que:

= = 4
2 72 2 5
= = = = 1.66 = 1.29
n 1 2 7 1 2 6

Consultando la tabla de la distribucin normal estndar se tiene que para


una probabilidad de 90% la z = 1.645; Ms an P (-1.645 z 1.645) = .90

Pero como:

obtenemos:

donde:

= = (1.645)(1.29) = 2.12.

Ahora, como el coeficiente de confianza es de 90% quiere decir que el 10%


de los intervalos creados no tendrn incluido el valor de la media poblacional, es
decir, en el ejemplo como hay 21 muestras el 10% de stas es 2.1 luego cabe
esperar que en dos intervalos no se localizar la media poblacional:

(1,2) = 1.5 1.5 2.12 1.5 + 2.12 0.62 3.62

(6,7) = 6.5 6.5 2.12 6.5 + 2.12 4.38 8.62

No contienen a la mediaP puesto que sta vale 4, lo cual confirma lo ya


anteriormente enunciado.

Otro ejemplo de aplicacin al slo dar un intervalo para la estimacin es:

Ejemplo:

Joel Faras es un corredor de la Bolsa de Valores y siente curiosidad por


saber el tiempo, que transcurre entre la colocacin y ejecucin de una orden del
mercado. Joel muestreo 45 rdenes y descubri que el tiempo medio de ejecucin
era de 24.3 minutos con una desviacin estndar de 3.2 minutos. Ayuda a Joel
construyendo un intervalo de confianza del 96% para estimar el tiempo medio de
ejecucin.
= 45

= 24.3 minutos

= 3.2

Coeficiente de confianza del 96% por tablas de Normal Estndar del cero
a un z positivo, que z = r 2.05

3.2
=
45

3.2
24.3 2.05
45

24.3 0.9779

23.32

O bien:

(23.32 25.28) = 96%

Ejercicio: recientemente la Secretaria de Hacienda tom una muestra de


200 devoluciones de impuestos y encontr que el monto promedio de reembolso
de impuestos de la muestra llegaba a 425.39 pesos, con una desviacin estndar
de la muestra de 107.10 pesos.

a) estime el reembolso medio de impuestos y la desviacin estndar de la


poblacin.
b) utilizando las estimaciones puntuales del inciso anterior, construya un intervalo
en el que se tenga 94% de certeza de que la media de la poblacin estar en l.

4.3 Estimacin de la proporcin poblacional


Lo correspondiente al parmetro de proporcin S para esta teora de
estimacin, es de forma anloga a lo del parmetro P con los respectivos
()
parmetros de la distribucin muestral de proporciones = y =

()
= ya vista en la unidad temtica anterior. Por ello se tiene:

Ejemplo:

En una encuesta reciente de la agencia Gallup se observ que en una


muestra de 1200 residentes de la Ciudad de Mxico, el 82% de los entrevistados
consideran a la contaminacin de la atmsfera como un serio problema.
Determine la estimacin pertinente a un coeficiente de confianza del 93% para la
proporcin real que consideran la contaminacin del aire como un problema serio.

= 1200

= 82% = .82

Coeficiente de confianza del 93% por tablas de Normal Estndar del cero
a un z positivo, que = 1.81.

(1 ) (. 82)(1 .82) (. 82)(.18)


= = = .012
1200 1200

. 82 1.81(.012)

. 82 .02

. 80 0.84

O bien:

(0.80 0.84) = 93%

Ejercicio:

Un inspector de granos en un puerto martimo descubre descomposicin en 40


de 120 lotes de trigo embarcado en el puerto, seleccionados aleatoriamente.
Se busca un intervalo de confianza del 92% para l, aplicable a la proporcin
real de lotes con trigo descompuesto en los embarques procedentes de ese
puerto.

Interpretacin
Si todas las muestras posibles de un tamao dado se seleccionan de una
poblacin dada, si todos los valores posibles de un estimador se calculan y si un
intervalo de confianza de un ancho dado se construye alrededor de cada uno de
estos valores, entonces el porcentaje de intervalos resultantes que contendr el
verdadero valor de la poblacin usualmente ser de un 68.2%, 95.4% 99.7%.

Contextos donde se puede plantear la estimacin:

a) En un negocio en el que se tiene el inters de establecer una sucursal en un


barrio, localizado en una comunidad que tenga en trmino medio ingresos
superiores a la media nacional. Cmo se puede hallar la media de los ingresos
de una comunidad determinada?

La respuesta es seleccionar una muestra, se determinara la media de esta


muestra y se empleara como estimacin de la media poblacional de los ingresos
en la comunidad.

b) El negociante tambin puede estar interesado en conocer la dispersin de los


ingresos, para determinar la amplitud de los precios de los productos que
vendera.

La respuesta es si la desviacin estndar de la poblacin es desconocida,


puede ser estimada por la de la muestra, pero cuidando que se obtenga con el
(xi x )2 (xi x)2
estimador insesgado, es decir con 2 = o bien =

c) Una cadena de almacenes est interesada en conocer la proporcin de plumas


defectuosas que llegan en cada remesa.

La respuesta es ante la imposibilidad por razones prcticas de revisar todas


las plumas, se toma una muestra y se utiliza como estimacin la proporcin de
defectuosas de la muestra para estimar la proporcin de defectuosas en la
poblacin.
Distribucin t de student y sus aplicaciones al muestreo
La distribucin de los valores t no sigue una distribucin normal, pero su
uso y forma para una cierta n (pequea, menor de 30 datos) son anlogas a las de
la distribucin normal estndar Z. La distribucin t es tambin simtrica con
respecto al origen de la escala de la t donde:


= =

Cuando la verdadera desviacin estndar de la poblacin V es desconocida


y el error estndar del estadstico es estimado a partir de una muestra , la
diferencia es expresada en el valor t anterior.

Cuando el valor de t es obtenido bajo el comportamiento referido para


varios tamaos de muestra se genera la tabla de la distribucin t, la cual deber
ser usada en la estimacin y/o prueba de hiptesis.

La forma de cada distribucin t est afectada por el nmero de grados de


libertad (gl), el que se calcula a partir del tamao de la muestra n menos el nmero
de parmetros desconocidos, en este caso uno, siendo la desviacin estndar
poblacional V. El valor de n 1 en la frmula de t, representa el nmero de grados
de libertad.

En la prctica solamente los valores de t ms frecuentemente usados estn


tabulados en forma compactada. La tabla de la distribucin t da los valores
seleccionados de t para reas de los extremos y puede ser adaptada fcilmente
para rea de un extremo.

Modelos para la estimacin por intervalo


Intervalo de confianza para la media

a) Cuando la muestra es grande (n > 30) y se conoce la V entonces la


Distribucin muestral de medias (DMM) se distribuye normalmente,
tenemos .
x Cuando se desconoce V, se puede estimar por y tenemos:

donde:

= =

b) Cuando la muestra es pequea (n < 30), la distribucin de la poblacin es
aproximadamente normal y V se desconoce, tenemos x donde t se
obtiene por tablas considerndola bajo 1 menos el coeficiente de confianza
y gl = n1.

Intervalo de confianza para la proporcin

a) Cuando la muestra es grande (n > 30) y se conoce V entonces la


Distribucin muestral de proporciones (DMP) es aproximadamente normal y
() ()
z donde =
tenemos =

x Cuando no se conoce V se puede estimar por y tenemos:


donde
(
) (
)
= =

b) Cuando la muestra es pequea (n< 30), la poblacin se distribuye
aproximadamente normal y V se desconoce, tenemos donde t se
obtiene por tablas considerndola bajo 1 menos el coeficiente de confianza
y gl = n1.

4.4. Determinacin del tamao de la muestra


Para determinar el tamao de la muestra necesario en estimacin y para los
parmetros media y proporcin, slo hay que utilizar algebra y despejar la
incgnita n de la expresin que representa al error estndar correspondiente.
Considerar antes qu tipo de poblacin se est trabajando finita o infinita.

a) Para la media con poblacin infinita se parte de:

Considerando slo:

= z =

y despejando a n tenemos:


= = =

y queda:

Para la media con poblacin finita se parte de:


= z = z
1
y se obtiene

=
1
+

b) Para la proporcin con poblacin infinita se parte de:

Considerando slo:

(1 )
= z = z
n

y despejando a n tenemos:

(1 ) (1 )
= =

Para la proporcin con poblacin finita se parte de:


(1 )
= z = z
n 1
y se obtiene
(1 )
=
1 (1 )
+

Ejemplo:

En una fbrica proveedora se desea saber el promedio de clientes que


entran a hacer pedidos diarios, se sabe que la desviacin estndar diaria de
clientes es 22. Se quiere determinar el tamao de la muestra que debe usarse si
se tiene un intervalo de confianza del 97.8% para la media y con una cota de error
de estimacin de r 8, y si hay un total de 178 clientes.

V = 22 clientes

Coeficiente de Confianza del 97.8% por tablas de Normal Estndar del cero a
un z positivo, que = 2.29.

E=r8

N = 178 clientes

Se utilizar el modelo de tamao de muestra con poblacin finita para la media:

(22)
= =
1 178 1 8 (22)
+ 178 +
(2.29) 178

484 484
= =
64 484 (. 9944) (12.2042) + 2.7191
(. 9944) + 178
5.2441

484 484
= = 35.58
12.1359 + 2.7191 14.855

luego debe usarse una muestra de 36 clientes para realizar la estimacin.

Ejemplo:

Asegrese que se desea obtener una muestra en una ciudad de 2000


familias para encontrar la proporcin de los que poseen 2 o ms automviles. Si
ests seguro de que no ms del 30% de las familias tendrn 2 o ms automviles
y no deseas que un intervalo de confianza del 95.45% vare ms de 5 puntos
porcentuales alrededor de la proporcin real, qu tamao de muestra se
requiere?

N = 2000 familias
S = 30% = .30

Coeficiente de Confianza del 95.45% por tablas de Normal Estndar del cero a
un z positivo, que = 2.00

= .05

Se utilizar el modelo de tamao de muestra con poblacin finita para la


proporcin:

(1 ) (. 30)(1 .30)
= =
1 (1 ) 2000 1 (. 05) . 30(1 .30)
+ +
2000 2 2000

(. 30)(. 70) . 21
= =
. 0025 (. 30)(. 70) . 21
(. 9995) + (. 9995) (. 000625) +
4 2000 2000

. 21 . 21
= = = 287 288
. 0006246875 + .000105 . 0007296875

288 familias se requieren para la estimacin.

Ejercicio:

Una encuestadora poltica quera la proporcin de ciudadanos que


favoreceran a su partido con su votacin en las prximas elecciones. La
encuestadora quera un 90% de confianza de que su prediccin sea correcta con
aproximacin de 0.04 de la proporcin real, qu tamao de muestra se
necesita? Se requiere realizar el clculo para varios valores de la proporcin
poblacional a suponer para encontrar el ms conservador.

Вам также может понравиться