Вы находитесь на странице: 1из 14

ESTIMACION PUNTUAL

La estadstica provee tcnicas que permiten obtener conclusiones generales a partir de un


conjunto limitado pero representativo de datos. Cuando inferimos no tenemos garanta de
que la conclusin que obtenemos sea exactamente correcta. Sin embargo, la estadstica
permite cuantificar el error asociado a la estimacin.
La mayora de las distribuciones de probabilidad dependen de cierto nmero de
parmetros. Por ejemplo: P (), N (, 2), Bi(n, p), etc. Salvo que estos parmetros se
conozcan, deben estimarse a partir de los datos.
El objetivo de la estimacin puntual es usar una muestra para obtener nmeros que, en
algn sentido, sean los que mejor representan a los verdaderos valores de los parmetros
de inters.
Supongamos que se selecciona una muestra de tamao n de una poblacin. Antes de
obtener la muestra no sabemos cul ser el valor de cada observacin. As, la primera
observacin puede ser considerada una v.a. X1, la segunda una v.a. X2, etc. Por lo tanto,
antes de obtener la muestra denotaremos X1, X2,...., Xn a las observaciones y, una vez
obtenida la muestra, denotaremos x1, x2,...., xn a los valores observados.
Definicin: Un estimador puntual de un parmetro es un valor que puede ser
considerado representativo de y se indicar . Se obtiene a partir de alguna funcin
de la muestra.
Ejemplo: Con el fin de estudiar si un dado es o no equilibrado, se arroja el dado 100 veces
en forma independiente, obtenindose 21 ases. Qu valor podra utilizarse, en base a
esa informacin, como estimacin de la probabilidad de as? Parece razonable utilizar la
frecuencia relativa de ases.
En este caso, si llamamos p a la probabilidad que queremos estimar: p = 21/100 = 0.21

1.1 PROPIEDADES DE LOS ESTIMADORES

Un estimador es un estadstico (esto es, una funcin de la muestra) usado para estimar
un parmetro desconocido de la poblacin. La media de la muestra puede ser un
estimador de la media de la poblacin , y la proporcin de la muestra se puede utilizar
como un estimador de la proporcin de la poblacin.
Una estimacin es un valor especfico observado de un estadstico (estimador).Podemos
hacer dos tipos de estimaciones concernientes a una poblacin: una estimacin de
intervalo y una estimacin puntual.
Insesgadez:
Si el valor del estadstico muestral es igual al parmetro poblacional que se estudia, se
dice que el estudio muestral es un estimador insesgado del parmetro poblacional.

Por lo tanto, el valor esperado, o media, de todos los posibles valores de un estadstico
muestral insesgado es igual al parmetro poblacional que se estudia.
Eficiencia:
Se dice que el estimador puntual con menor error estndar tiene mayor eficiencia relativa
que los otros. Cuando se muestrean poblaciones normales, el error estndar de la media
muestral es menor que el error estndar de la mediana muestral. Por tanto, la media
muestral es ms eficiente que la mediana muestral.
Consistencia:
Un estimador puntual es consistente si el valer del estimador puntual tiende a estar ms
cerca del parmetro poblacional a medida que el tamao de la muestra aumenta.
En otras palabras, una muestra grande tiende a proporcionar mejor estimacin puntual
que una pequea.

1.2 VARIANZA Y ERROR CUADRATICO Y MEDIO DE UN ESTIMADOR

Se llama error cuadrtico medio del estimador a: ECM(*) = E[ (*-)2 ]


Si el error cuadrtico medio es un nmero pequeo, podramos asegurar que error que
estamos cometiendo en la estimacin es pequeo (en media), e inversamente, si el ECM
es un nmero grande, cabe esperar que la estimacin que realicemos no sea muy
precisa.
A partir de esta idea vamos a deducir las propiedades ms importantes que debe cumplir
un estimador para ser considerado aceptable.
Vamos ahora a encontrar otra expresin para el ECM de un estimador:
ECM(*) = E[ (*-)2 ] = E[ ( { *- E[*] } - { -E[*] } ) 2 ] =
= E[ ( *- E[*] ) 2 ] + E[ ( -E[*] ) 2 ] - 2 E[( *- E[*] )( -E[*] ) ] =
= Var (*) + ( -E[*] ) 2 - 2( -E[*] ) E[( *- E[*] ) ] =
= Var (*) + ( -E[*] ) 2
De esta manera podemos observar que el error cuadrtico medio que cometemos al
realizar una estimacin es la suma de dos contribuciones positivas.
En primer lugar el tamao del error vendr determinado por la varianza del estimador, es
decir, por su precisin. Si el estimador tiene poca capacidad de variacin para los distintas
muestras que podamos tomar esto contribuir de forma positiva a la obtencin de un error
ms pequeo.
En segundo lugar el tamao del error vendr determinado por la diferencia entre el valor
medio que tome el estimador y el parmetro desconocido. As, por ejemplo, si para los
distintos valores mustrales la media del estimador coincide con habremos obtenido un
buen estimador.
Observamos finalmente que las propiedades que nos van a permitir medir la calidad de un
estimador estn en funcin de sus dos primeros momentos: la media y la varianza de un
estimador.

1.3 DISTRIBUCIONES DE MUESTREO

Distribucin muestral
Es una lista de todos los valores posibles de un estadstico y la probabilidad asociada a
cada valor. Se considerarn la distribucin muestral de medias y la de proporciones.
Cuando el tamao de una muestra n es ms pequea que el tamao N de una poblacin,
2 o ms muestras se pueden extraer de una poblacin, ejemplo:
Si tengo 30 alumnos como N y quiero muestras de tamao 3 (n), entonces:
se pueden obtener hasta
2) Obtener todas las muestras posibles de tamao 2 de la siguiente poblacin:
N = {a, e, i, o, u}
10 C 2 = 10 Observar que se calcula con COMBINACIONES
Posteriormente un determinado estadstico (x media, s desviacin estndar , p
probabilidad, etc.) podr ser calculado para c/u de las muestras, en estos casos se habla
de Distribucin Muestral del Estadstico.
Una distribucin muestral es entonces todo el conjunto de muestras posibles ms todo el
conjunto del estadstico de c/u de las muestras.

1.4 DISTRIBUCIONES DE MUESTREO PARA MEDIAS Y PROPORCIONES

Distribucin Muestral de Medias.


Cada muestra de tamao n que podemos extraer de una poblacin proporciona
una media. Si consideramos cada una de estas medias como valores de una
variable aleatoria podemos estudiar su distribucin que llamaremos distribucin
muestral de medias.
Si tenemos una poblacin normal N (m,s) y extraemos de ella muestras de
tamao n, la distribucin muestral de medias sigue tambin una distribucin
normal

Si la poblacin no sigue una distribucin normal pero n>30, aplicando el


llamado Teorema central del lmite la distribucin muestral de medias se
aproxima tambin a la normal anterior.

Distribucin muestral de proporciones.


En numerosas ocasiones se plantea estimar una proporcin o porcentaje. En estos casos
la variable aleatoria toma solamente dos valores diferentes (xito o fracaso), es decir
sigue una distribucin binomial y cuando la extensin de la poblacin es grande la
distribucin binomial B(n,p) se aproxima a la normal

Para muestras de tamao n>30, la distribucin muestral de proporciones sigue una


distribucin normal

Donde p es la proporcin de uno de los valores que presenta la variable estadstica en la


poblacin y q=1-p.

1.5 DISTRIBUCION JI CUADRADA

En realidad la distribucin ji-cuadrada es la distribucin muestral de s 2. O sea


que si se extraen todas las muestras posibles de una poblacin normal y a
cada muestra se le calcula su varianza, se obtendr la distribucin muestral de
varianzas.
Para estimar la varianza poblacional o la desviacin estndar, se necesita
conocer el estadstico X2. Si se elige una muestra de tamao n de una
poblacin normal con varianza

, el estadstico:

Tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1
grados de libertad y se denota X2 (X es la minscula de la letra griega ji). El
estadstico ji-cuadrada esta dado por:

Donde n es el tamao de la muestra, s2 la varianza muestral y


la varianza
de la poblacin de donde se extrajo la muestra. El estadstico ji-cuadrada
tambin se puede dar con la siguiente expresin:

Aplicaciones
La distribucin tiene muchas aplicaciones en inferencia estadstica. La ms conocida es
la de la denominada prueba utilizada como prueba de independencia y como prueba de
bondad de ajuste y en la estimacin de varianzas. Pero tambin est involucrada en el
problema de estimar la media de una poblacin normalmente distribuida y en el problema
de estimar la pendiente de una recta de regresin lineal, a travs de su papel en la
distribucin t de Student.
Aparece tambin en todos los problemas de anlisis de varianza por su relacin con la
distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias
independientes con distribucin .

1.6 DISTRIBUCION T STUDENT

En probabilidad y estadstica, la distribucin-t o distribucin t de Student es una


distribucin de probabilidad que surge del problema de estimar la media de una poblacin
normalmente distribuida cuando el tamao de la muestra es pequeo. sta es la base del
popular test de la t de Student para la determinacin de las diferencias entre dos medias
muestrales y para la construccin del intervalo de confianza para la diferencia entre las
medias de dos poblaciones.
La distribucin t surge, en la mayora de los estudios estadsticos prcticos, cuando la
desviacin tpica de una poblacin se desconoce y debe ser estimada a partir de los datos
de una muestra.

En la generalidad de los casos, no disponemos de la desviacin standard de la poblacin,


sino de una estimacin calculada a partir de una muestra extrada de la misma y por lo tanto
no podemos calcular Z. En estos casos calculamos el estadstico T:

T=

xx i

n1

s=

Donde S es la desviacin standard muestral, calculada con n-1 grados de libertad.


Ntese que utilizamos S, la Desviacin Standard de una Muestra, en lugar de , la
Desviacin Standard de la Poblacin.
El estadstico T tiene una distribucin que se denomina distribucin T de Student, que
est tabulada para 1, 2, 3,... etc. grados de libertad de la muestra con la cual se calcul la
desviacin standard.
La distribucin T tiene en cuenta la incertidumbre en la estimacin de la desviacin
standard de la poblacin, porque en realidad la tabla de T contiene las distribuciones de
probabilidades para distintos grados de libertad.
La distribucin T es ms ancha que la distribucin normal tipificada Para un nmero de
grados de libertad pequeo. Cuando los grados de libertad tienden a infinito, la
distribucin T tiende a coincidir con la distribucin normal standard. Es decir, en la medida
que aumentemos el nmero de observaciones de la muestra, la desviacin standard
calculada estar ms prxima a la desviacin standard de la poblacin y entonces la
distribucin T correspondiente se acerca a la distribucin normal standard. El uso de la
distribucin T presupone que la poblacin con que estamos trabajando tiene una
distribucin normal.

1.7 DISTRIBUCION F FISHER

Usada en teora de probabilidad y estadstica, la distribucin F es una distribucin de


probabilidad continua. Tambin se le conoce como distribucin F de Snedecor (por
George Snedecor) o como distribucin F de Fisher-Snedecor.
Una variable aleatoria de distribucin F se construye como el siguiente cociente:

donde

U1 y U2 siguen una distribucin chi-cuadrado con d1 y d2 grados de libertad


respectivamente, y

U1 y U2 son estadsticamente independientes.

La distribucin F aparece frecuentemente como la distribucin nula de una prueba


estadstica, especialmente en el anlisis de varianza. Vase el test F.
La funcin de densidad de una F(d1, d2) viene dada por

para todo nmero real x 0, donde d1 y d2 son enteros positivos, y B es la funcin beta.

La funcin de distribucin es

donde I es la funcin beta incompleta regularizada.

ESTIMACION DE INTERVALOS
2.1 INTERVALOS DE CONFIANZA
En el contexto de estimar un parmetro poblacional, un intervalo de confianza es un rango
de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del
parmetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo
construido se denomina nivel de confianza, y se denota 1. La probabilidad de
equivocarnos se llama nivel de significancia y se simboliza . Generalmente se
construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes
son los intervalos con =10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la distribucin Normal
Estndar cumple 1:
P(-1.96 < z < 1.96) = 0.95

(lo anterior se puede comprobar con una tabla de probabilidades o un programa


computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribucin N( ,
cumple:

Despejando

en la ecuacin se tiene:

El resultado es un intervalo que incluye al


de confianza al 95% para la media

), entonces el 95% de las veces se

el 95% de las veces. Es decir, es un intervalo

cuando la variable X es normal y

es conocido.

2.2 INTERVALOS DE CONFIANZA PARA LA MEDIA Y VARIANZA CONOCIDA

Este caso que planteamos es ms a nivel terico que prctico: difcilmente vamos a poder
conocer con exactitud

mientras que

es desconocido. Sin embargo nos aproxima del

modo ms simple a la estimacin confidencial de medias. Para estimar


que mejor nos va a ayudar es

, el estadstico

, del que conocemos su ley de distribucin:

Esa ley de distribucin depende de (desconocida). Lo ms conveniente es hacer que la


ley de distribucin no dependa de ningn parmetro desconocido, para ello tipificamos:

Este es el modo en que haremos siempre la estimacin puntual: buscaremos una relacin
en la que intervengan el parmetro desconocido junto con su estimador y de modo que
estos se distribuyan segn una ley de probabilidad que es bien conocida y a ser posible
tabulada.
De este modo, fijado

, consideramos la v.a.

y tomamos un intervalo

que contenga una masa de probabilidad de


. Este intervalo lo queremos tan
pequeo como sea posible. Por ello lo mejor es tomarlo simtrico con respecto a la media
(0), ya que all es donde se acumula ms masa (vase la figura 8.1). As las dos colas de
la distribucin (zonas ms alejadas de la media) se repartirn a partes iguales el resto de
la masa de probabilidad, .

2.3 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS,


VARIANZA DESCONOCIDA

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS


DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS PERO
IGUALES.
Si
s12 y s22 son las medias y las varianzas de dos muestras aleatorias de tamao n1
y n2, respectivamente, tomadas de dos poblaciones normales e independientes con
varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100(
) por ciento para la diferencia entre medias es:

en donde:

es el estimador combinado de la desviacin estndar comn de la poblacin con n1+n2 2


grados de libertad.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS


DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS PERO
DIFERENTES.
Consideremos ahora el problema de encontrar una estimacin por intervalos de 1- 2
cuando no es probable que las varianzas poblacionales desconocidas sean iguales. La
estadstica que se usa con ms frecuencia en este caso es:

que tiene aproximadamente una distribucin t con

grados de libertad, donde:

Como
rara vez es nmero entero, lo redondeamos al nmero entero ms cercano
menor. Esto es si el valor de nu es de 15.9 se redondear a 15.
Al despejar la diferencia de medias poblacionales de la formula de t nos queda:

2.4 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE LAS


DISTRIBUVIONES NORMALES VARIANZAS DESCONOCIDAS

CASO DE VARIANZAS DESCONOCIDAS Y DIFERENTES.

Cuando tenemos razones para suponer que la varianza no es comn, no podemos utilizar
el estadstico anterior. Hemos de destacar que, en esta situacin, no existe un mtodo
exacto que permita obtener el intervalo de confianza deseado. Lo ms que tenemos son
aproximaciones a la solucin. Un intervalo aproximado con nivel de confianza (1 ) 100
% es

,
donde 1 y 2 son las varianzas muestrales corregidas para cada poblacin y donde t/2 es
el valor de una distribucin t de Student con g grados de libertad, donde

Si los grados de libertad resultantes son decimales, puede optarse por hacer una
interpolacin entre los dos valores enteros ms cercanos o bien por tomar el valor ms
desfavorable, aquel que suponga un radio mayor para el intervalo de confianza y que
coincide con el redondeo a la baja de los grados de libertad.

CASO DE VARIANZA DESCONOCIDA Y COMUN


Supondremos la existencia de dos poblaciones sobre las que una variable determinada
sigue una distribucin Normal con idntica varianza en las dos. Sobre la poblacin 1, la
variable sigue una distribucin N(1, ) y, sobre la poblacin 2, sigue una distribucin N(2,
). Igualmente supondremos que disponemos de dos muestras aleatorias independientes,
una para cada poblacin, de tamaos muestrales n1 y n2 respectivamente.
El objetivo es construir un intervalo de confianza, con nivel de confianza (1 ) 100 %,
para la diferencia de medias 1 2
El mtodo se basa en la construccin de una nueva variable D, definida como la
diferencia de las medias mustrales para cada poblacin

Esta variable, bajo la hiptesis de independencia de las muestras, sigue una distribucin
Normal de esperanza 1 2 y de varianza

La estimacin conjunta, a partir de las dos muestras, de la varianza comn viene dada por
la expresin

y, utilizando la propiedad de que la variable

sigue una distribucin 2 con n1 + n2 2 grados de libertad, podemos construir un


estadstico pivote que siga una distribucin t de Student y que nos proporciona la frmula
siguiente para el intervalo de confianza para la diferencia de medias:

donde t/2 es el valor de una distribucin t de Student con n1 + n2 2 grados de libertad que
deja a su derecha una probabilidad de /2.

2.5 INTERVALOS DE CONFIANZA PARA PROPORCIONES

En este caso, interesa construir un intervalo de confianza para una proporcin o un


porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensin,
fumadoras, etc.)
Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:

O bien:

Donde p es el porcentaje de personas con la caracterstica de inters en la poblacin (o


sea, es el parmetro de inters) y p es su estimador muestral.
Luego, procediendo en forma anloga al caso de la media, podemos construir un intervalo
de 95% de confianza para la proporcin poblacional p.

2.6 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES

En la seccin anterior se vio el tema de la generacin de las distribuciones muestrales, en


donde se tena el valor de los parmetros, se seleccionaban dos muestras y podamos
calcular la probabilidad del comportamiento de los estadsticos. Para este caso en
particular se utilizar la distribucin muestral de diferencia de proporciones para la
estimacin de las misma. Recordando la formula:

Despejando P1-P2 de esta ecuacin:

Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al hacer el
despeje nos queda las dos proporciones poblacionales y es precisamente lo que
queremos estimar, por lo que se utilizarn las proporciones de la muestra como
estimadores puntuales: