Вы находитесь на странице: 1из 18

ESTIMACIN ESTADSTICA

Prof.: Sergio Moscoso Cerda



1.0 Introduccin

La inferencia estadstica se define como la parte del Mtodo Estadstico que,
por medio de un razonamiento inductivo, extiende los resultados obtenidos en
una muestra a la poblacin de la cual se extrajo dicha muestra.

1.1 Parmetro:
Es un valor constante, por lo general desconocido, que describe una
caracterstica de la poblacin

1.2 Estadstica:
Variable que puede tomar cualquier valor que va a depender de la muestra
seleccionada

1.3 Estimador de un Parmetro
Estadstica que cumple la condicin de que sus posibles valores sean posibles
valores del parmetro

2.0 La inferencia estadstica tiene relacin con:

i) Estimacin Puntual

ii) Estimacin por Intervalos

iii) Ensayos de Hiptesis o Docimasias


2.1 Estimacin de parmetros
La estimacin de parmetros consiste en inferir el valor de algn parmetro
desconocido de la poblacin, sobre la base de una muestra. La estimacin de
parmetros puede ser de dos tipos: Puntual o de Intervalo

2.1.1 Estimacin Puntual
Los modelos poblacionales estn identificados por constantes o parmetros,
usualmente desconocidos para nosotros.

Por ejemplo, para estimar la proporcin poblacional p
*
parece razonable usar
el valor que en nuestra muestra presenta la estadstica
p
(proporcin
muestral).

2.2 Estimacin por intervalos
Este tipo de estimacin consiste en dar un conjunto de posibles valores que
pueda tomar el parmetro en base a la muestra dada, esta estimacin se basa
en la teora de probabilidades y es necesario conocer la distribucin muestral
del estimador que se esta utilizando.

2.3 Docimasia de Hiptesis
Consiste en probar la veracidad de una hiptesis planteada, respecto a alguna
caracterstica de la poblacin. Esto se basa en los resultados obtenidos
empricamente en una investigacin y las conclusiones obtenidas tienen
carcter probabilstica.

3.0 Distribuciones Muestrales
La distribucin de muestreo es una distribucin terica de un estimador, la que
se obtiene tomando al azar todas las posibles muestras de un mismo tamao
de una misma poblacin

3.1 Distribucin muestral de un promedio muestral

Teorema 1:


X
=



2
2
x
n

=


Teorema n 2: Si la poblacin es de tamao N, si el muestreo es sin
reposicin, y si el tamao de la muestra es
N n
, entonces se tiene:



2
2
1
x
N n
n N


| |
=
|

\ .



Si se muestrea una poblacin que tiene distribucin de probabilidad
desconocida, la distribucin de muestreo de la media y varianza
n
2

y si el
tamao de la muestra es grande ( 30 n ), llegamos a uno de los teoremas ms
tiles en Estadstica; se le conoce como Teorema del Lmite Central

Teorema n 3: Teorema del Lmite Central
Si
n
x x x ,..., ,
2 1
es una muestra aleatoria de tamao n tomada de una
poblacin (finita o infinita) con media y varianza
2
, y si x es la media
muestral, entonces, la forma del lmite de la distribucin es.




Cuando el tamao de muestra tiende a infinito corresponde utilizar la
distribucin Normal Estndar o cuando se conoce la varianza poblacional.

Cuando el tamao de la muestra es menor que 30 o cuando la varianza
poblacional se desconoce corresponde utilizar la distribucin t, conocida
como la distribucin t de Student.

3.2 Distribucin muestral de una proporcin
A s como lo hicimos en la distribucin muestral de medias, anlogamente se
pueden comprobar y demostrar los siguientes resultados.

Si el estimador p representa la proporcin muestral de una poblacin con
proporcin P, entonces:

La distribucin de la proporcin muestral p es aproximadamente normal
con:

i) Promedio:
p
P =


ii) Varianza:
2
p
PQ
n
=



iii) Valor estndar:
2
p
p P
z

=



Donde Q = 1 P proporcin del fracaso y n es el tamao de la muestra.


Esta aproximacin es aplicable para tamaos de muestras grandes tales
que:



5 y 5 con 1 np nq q p =



3.3 La Varianza corregida poblacional se define como:

2
2

1
n S
n
=




Por otra parte, supongamos que la variable aleatoria x tiene distribucin
poblacional gaussiana de parmetros y
2
. Si medimos X en una m.a. de
n observaciones la varianza muestral S
2
de esa muestra es un valor de la
variable aleatoria S
2
. La teora estadstica demuestra que la variable aleatoria:



( )
2
2
2
1 n s

=



Tiene distribucin muestral chicuadrado de parmetro v = (n 1), donde v son
los grados de libertad

Definimos
2

como el valor para el cual el rea bajo la curva a su derecha es


igual a y como depende de los grados de libertad para su clculo utilizamos
la tabla de la distribucin chicuadrado. As
2
/ 2

es tal que el rea bajo la


curva a su derecha es
2

, mientras que
2
1 / 2


es tal que el rea bajo la curva
a su izquierda es
2

.

Caractersticas de
2


a) Es una distribucin asimtrica

b) Slo toma los valores positivos y es asinttica con respecto al eje de las x
positivas
(0 <
2
< ).

c) Tiene un nico parmetro v llamado grados de libertad

d) La area comprendida entre la curva y el eje de las x es 1



Como la distribucin chicuadrado aparece en muchas aplicaciones importantes,
se ha tabulado. La tabla contiene valores de
derecha, situada debajo de la curva chi
igual a . Esto es,
2
,v

es tal que


2 2
,
( )
v
P

=


Cuando v excede de 30, las probabilidades relac
chicuadrado suelen aproximarse con el uso de distribuciones normales

3.4 Distribucin muestral de un cuociente de varianzas (Dos poblaciones
Normales)
Si consideramos el estadstico

i) Un cuociente grande o pequeo
las varianzas

ii) Un cuociente prximo a uno (1) indicara una pequea diferencia
entre las varianzas


Sean 1
2
S y 2
2
S varianzas muestrales basadas en muestras aleatorias
independientes de tamaos n
medias
1 2
y y varianzas
siguiente estadstico:


cuadrado aparece en muchas aplicaciones importantes,
se ha tabulado. La tabla contiene valores de
2
,v

es tal que el rea a su


situada debajo de la curva chicuadrado con v grados de libertad es
v
es tal que
,
( )
v
=

excede de 30, las probabilidades relacionadas con la distribucin
suelen aproximarse con el uso de distribuciones normales
3.4 Distribucin muestral de un cuociente de varianzas (Dos poblaciones
Si consideramos el estadstico
2
1
2
2
S
S
puede ocurrir que:
Un cuociente grande o pequeo indicara una gran diferencia entre
Un cuociente prximo a uno (1) indicara una pequea diferencia
entre las varianzas
varianzas muestrales basadas en muestras aleatorias
independientes de tamaos n
1
y n
2
extradas de poblaciones normales, con
y varianzas
2 2
1 2
y respectivamente. Entonces se tiene el

cuadrado aparece en muchas aplicaciones importantes,
es tal que el rea a su
grados de libertad es
ionadas con la distribucin
suelen aproximarse con el uso de distribuciones normales
3.4 Distribucin muestral de un cuociente de varianzas (Dos poblaciones
indicara una gran diferencia entre
Un cuociente prximo a uno (1) indicara una pequea diferencia
varianzas muestrales basadas en muestras aleatorias
extradas de poblaciones normales, con
respectivamente. Entonces se tiene el

|
|
.
|

\
|
|
|
.
|

\
|
=
|
|
.
|

\
|

|
|
.
|

\
|

=
2
2
2
2
1
2
1
2
2
2
2
2
2
2
1
2
1
1
2
1

) 1 (
) 1 (

S
S
n
S n
n
S n
F
.


Donde:


) 1 (

1
1
2
1
1
2

=
n
S n
S
y
) 1 (

2
2
2
2
2
2

=
n
S n
S



Si 2
2
1
2
= entonces la estadstica
2
2
1
2

S
S
tiene distribucin F (en memoria de
R.A. Fisher) de parmetros V
1
= n
1
1 y V
2
= n
2
-1. Donde V
1
y V
2
son
los grados de libertad del numerador y denominador respectivos de la
distribucin F

La distribucin F se encuentra tabulada en los percentiles 95 y 99 por lo tanto si
quisiramos calcular percentiles 0,05 o 0,01 no lo podramos hacer, este
problema nos conduce al siguiente teorema.

Teorema 5: Sea p un percentil con v
1
y v
2
grados de libertad, entonces se
tiene que:



2 , 1
1 2
,
, , 1
1
v v p
v v p
F
F =



3.5 Distribucin de muestra de diferencias entre medias
Si 1 X representa el promedio de una caracterstica observada en una muestra
de tamao
1
n de una poblacin normal con media
1
y varianza
2
y 2 X
representa el promedio de esa caracterstica en una muestra de tamao
2
n
de una poblacin normal con
2
2
y tal que ambas poblaciones sean
independientes, entonces se tiene que:

La diferencia de las medias muestrales ( ) 2 1 X X sigue una distribucin
normal con:

a) Promedio:


1 2
1 2
1 2
x x
x x

= =


b) Varianza:

|
|
.
|

\
|
+ =
2 1
2 2
1 1
2 1
n n
x x



3.6 Distribucin muestral de diferencias entre proporciones

Si p
1
es la proporcin de una caracterstica observada en una muestra de
tamao
1
n de una poblacin con proporcin P
1
y p
2
es la proporcin de esa
caracterstica en una muestra de tamao
2
n de una poblacin con proporcin P
2
, y ambas poblaciones son independientes, entonces se tiene que:


La diferencia de estas proporciones muestrales (p
1
p
2
) sigue una
distribucin aproximadamente normal con:


a) Promedio:
2 1
2 1
P P
p p
=




b) Varianza:


2
1 2
1 1 2 2
1 2
P P
p q p q
n n



= +




5.0 Intervalos de Confianza

5.1 Intervalo de confianza para estimar un promedio Estimacin con
poblacin normal y varianza conocida

Consideremos, en general, una muestra de n observaciones independientes,
X
1
, X
2
,..., X
n
de una variable X que nos interesa. Supongamos que X tiene
distribucin normal de parmetros
2
y y que
2
sea conocida. Ya
sabemos que
|
.
|

\
|

=
n
x
Z



Tendr distribucin normal de parmetros
2
0 y 1 = =

Supongamos que = 0,05, encontrar el intervalo de confianza para estimar

Solucin:

( )
1, 96 1, 96 1 P Z =


y como = 0,05, entonces se tiene que:


( ) 1, 96 1, 96 0, 95 P Z =


Luego, sustituyendo el valor de Z, se tiene que:





Despejando

se tiene:



1, 96 1, 96 0, 95 P x x
n n

| |
+ =
|
\ .




Diremos que:


1.96 , 1.96 x x
n n
(
+
(




1, 96 1.96 0, 95
x
P
n

| |
|

|
=
| | |
| |
\ .
\ .
Es un intervalo de confianza del 95% para estimar el parmetro

Ntese que el limite inferior y el limite superior son funciones de
son ellos mismos variables aleatorias. La situacin grafica es la siguiente:


Por lo tanto, slo el 5% de las muestras tendrn probabilidades que est
de estos lmites

Un planteamiento general nos lleva al siguiente teorema

Teorema 6: Intervalo de confianza para

Si x es el valor de la media de una muestra aleatoria de tamao
una poblacin normal con varianza conocida
(1- )100% para estimar el promedio

/ 2 / 2
P x z x z
n n

| |
< < + =
|
\ .


5.2 Intervalo de confianza para estimar un promedio
y varianza desconocida

Como no siempre se conoce la varianza poblacional debemos utilizar el
siguiente teorema

Teorema 7: Intervalo de confianza para

Si x y s son los valores de la media y desviacin estndar de una muestra
aleatoria de tamao n tomada de una poblacin normal
desconocida
2
, un intervalo de confianza del (1
por:
Es un intervalo de confianza del 95% para estimar el parmetro


Ntese que el limite inferior y el limite superior son funciones de
x
, por tanto,
son ellos mismos variables aleatorias. La situacin grafica es la siguiente:
Por lo tanto, slo el 5% de las muestras tendrn probabilidades que est
Un planteamiento general nos lleva al siguiente teorema
Teorema 6: Intervalo de confianza para con
2
conocida
es el valor de la media de una muestra aleatoria de tamao n tomada de
una poblacin normal con varianza conocida
2
, un intervalo de confianza del
estimar el promedio est dado por:
/ 2 / 2
(1 ) 100% P x z x z
n n



| |
< < + =
|
\ .
.2 Intervalo de confianza para estimar un promedio con poblacin normal
Como no siempre se conoce la varianza poblacional debemos utilizar el
Teorema 7: Intervalo de confianza para y varianza desconocida
son los valores de la media y desviacin estndar de una muestra
tomada de una poblacin normal con varianza
un intervalo de confianza del (1- )100% para est dado

, por tanto,
son ellos mismos variables aleatorias. La situacin grafica es la siguiente:


Por lo tanto, slo el 5% de las muestras tendrn probabilidades que estn fuera
tomada de
un intervalo de confianza del
(1 ) 100%

con poblacin normal
Como no siempre se conoce la varianza poblacional debemos utilizar el
desconocida
son los valores de la media y desviacin estndar de una muestra
con varianza
est dado

( )
/ 2, 1 / 2, 1
1 100%
n n
s s
P x t x t
n n



| |
< < + =
|
\ .



Para n 30 , esta formula del intervalo de confianza y el teorema 4 con
sustituida por s producir casi los mismos resultados

Obsrvese que el coeficiente de confianza corresponde a la distribucin t


5.3 Tamao de la muestra
Dado el intervalo de confianza

/ 2 / 2
x z x z
n n


< < +



La precisin (error) del intervalo de confianza es


/ 2
z
n




Esto significa que al utilizar x para estimar

, el error:




E x =


Por lo tanto, se debe considerar el error como:


/ 2
E z
n





Con una confianza de (1 - ) 100%
El tamao apropiado de la muestra se obtiene al seleccionar n de modo que:



/ 2
E z
n

=



Definicin: Si x se utiliza como estimacin de , entonces puede tenerse una
confianza de (1 - )100% de que el error x no ser mayor que una
cantidad especfica de E cuando el tamao de la muestra sea:

Primera aproximacin


2
/ 2
0
Z
n
E


| |
=
|
\ .



Luego tenemos las siguientes opciones:


i)
0
Si 0, 05 n N <


Donde N es el tamao de la poblacin

Entonces, se tiene que el tamao de la muestra es:

n = n
0

ii)
0
0, 05 Si n N


Donde N es el tamao de la poblacin.

Entonces, se tiene que el tamao de la muestra es:



0
0
1
n
n
n
N
=
+



5.4 Intervalos de confianza para diferencias de medias

Como en el punto 3.5 se estableci que:

2
1 x x
Es una variable aleatoria que tiene una distribucin normal y varianzas
poblacionales conocidas, entonces se tiene:


a) Media

2 1
2 1
=
x x



b) Varianza

2
2
2
1
1
2
2
2 1
n n
x x

+ =



c) Valor estndar (z)

( ) ( )
2 1
2
2 1
2 1
x x
x x
Z





Tiene distribucin normal estndar


Al sustituir Z en
2 2
1 P Z Z Z


| |
< < =
|
\ .
nos lleva a formular el siguiente
teorema:

Teorema 8: Intervalo de confianza para
2 1
con
1 2
y conocidas

Si 1 2 x y x son los valores de las medias de muestras aleatorias
independientes de tamao
1 2
n y n tomadas de poblaciones normales con
varianzas conocidas
2 2
1 2
y , un intervalo de confianza del ( ) 1 100%
para
2 1
est dado por:



( )
( )
1 2 1 2
2 2
1 2 1 2
/2 1 2 /2
( ) ( ) 1 100%
x x x x
P x x Z x x Z



< < + =


En virtud del teorema del lmite central, este resultado puede usarse con
muestras aleatorias independientes de poblaciones normales con las varianzas
conocidas
2 2
1 2
y , siempre que
1 2
n y n sean lo suficientemente grandes.


Tamao de la muestra

Si se conocen (al menos aproximadamente) las desviaciones estndar
1 2
y y los tamaos de las dos muestras son iguales (n
1
= n
2
= n), entonces
puede determinarse el tamao de la muestra requerido de modo que se tenga
una confianza del (1- ) 100 % en que el error en la estimacin de
1 2
y por
1 2 x x sea menor. El tamao de la muestra requerido es:



( )
2 2
/ 2
0 1 2
z
n
E


| |
= +
|
\ .



Luego, tendramos que:


i)
0
Si 0, 05 n N <


Donde N es el tamao de la poblacin

Entonces, se tiene que el tamao de la muestra es:


n = n
0


ii)
0
0, 05 Si n N


Donde N es el tamao de la poblacin

Entonces, se tiene que el tamao de la muestra es:



0
0
1
n
n
n
N
=
+



Teorema 9: Intervalo de confianza para
2 1
con
2 1
= y
desconocidas

Si
1 2
x y x son los valores de las medias de muestras aleatorias
independientes de tamao
1 2
n y n tomadas de poblaciones normales con
varianzas desconocidas pero iguales, un intervalo de confianza del
(1 - ) 100% para
2 1
est dado por:



( )

1 2
1 ,
1 2
1 1

v
x x t
n n

+
.


Con


2 2
2
1 1 2 2
1 2
( 1) ( 1)

2
n S n S
n n

+
=
+



5.5 Intervalos de confianza para proporciones

Existen muchos problemas en los cuales debemos obtener proporciones,
probabilidades, porcentajes o tasas. En muchos casos se debe suponer que se
muestrea una poblacin Binomial. Utilizando el hecho que para n grandes la
distribucin Binomial puede obtenerse aproximadamente con una distribucin
normal, es decir que la variable aleatoria.


) 1 ( p np
np x
Z

=



Se puede considerar como si tuviese la distribucin normal estndar

Teorema 10: Intervalo de confianza de muestra grande para P

Un intervalo de confianza aproximado del (1- )100% para el parmetro
Binomial P est dado por:



/ 2 / 2
.(1 ) .(1 )

p p p p
p z P p z
n n

| |

+
|
|
\ .



Donde
x
p
n
=



Tamao de la muestra para estimar P si se tiene informacin sobre P



2
/ 2
0
(1 )
Z
n P P
E

(
=
(




Luego, tendramos que:


i)
0
Si 0, 05 n N <


Donde N es el tamao de la poblacin

Entonces, se tiene que el tamao de la muestra es:


n = n
0

ii)
0
0, 05 Si n N


Donde N es el tamao de la poblacin

Entonces, se tiene que el tamao de la muestra es:



0
0
1
n
n
n
N
=
+



Como no siempre se tiene informacin de P, en este caso sustituimos por P
cualquiera de sus valores que se aproxime a
2
1
. Si en tal informacin,
hacemos uso del hecho que P (1 P) no puede ser mayor que
4
1
, que es el
resultado para P =
2
1
. Por lo tanto se tiene que:

Tamao de la muestra para estimar P sin informacin sobre P




2
/ 2
0
1
4
Z
n
E

(
=
(




Luego, tendramos que:



i)
0
Si 0, 05 n N <



Donde N es el tamao de la poblacin

Entonces, se tiene que el tamao de la muestra es:


n = n
0

ii)
0
0, 05 Si n N


Donde N es el tamao de la poblacin

Entonces, se tiene que el tamao de la muestra es:



0
0
1
n
n
n
N
=
+








5.6 Intervalos de confianza para diferencias entre proporciones

Frecuentemente se desea calcular la diferencia entre los parmetros
binomiales P
1
y P
2
sobre la base de muestras independientes tomadas de
poblaciones binomiales. Por lo que esto nos conduce al siguiente teorema.

Teorema 11: Intervalo de confianza de muestra grande para P
1
- P
2
Un intervalo de confianza aproximado del (1 - ) 100% para P
1
- P
2
, la
diferencia entre dos parmetros binomiales, est dada por:



1 1 2 2
1 2 / 2
1 2
(1 ) (1 )
( )
p p p p
p p Z
n n

| | | |

+
| |
\ . \ .



Donde


1
1
1

n
x
p =
y
2
2
2

n
x
p =

5.7 Intervalos de confianza para varianzas

Dada una muestra aleatoria de tamao n tomada de una poblacin normal,
podemos obtener un intervalo de confianza del (1- )100 % para la varianza
utilizando el hecho que



( )
2
2
1 n s




Es una variable aleatoria que tiene distribucin chicuadrado





Teorema 12: Intervalo de confianza para
2


Si S
2
es el valor de la varianza de una muestra aleatoria de tamao n tomada
de una poblacin normal, un intervalo de confianza del (1- )100 % para S
2

est dado por:



( ) ( )
2 2
2
2 2
1 / 2, 1 / 2, 1
1 1
n n
n S n S




< <



Tambin, se pueden obtener lmites de confianza del (1- ) 100% para
como:


2
=


Lo que quiere decir que se debe extraer raz de cada lmite del intervalo de
confianza de
2



5.8 Intervalo de confianza para razones de dos varianzas

Si S
2
1
y S
2
2
son dos varianzas de muestras aleatorias independientes de
tamaos n
1
y n
2
tomadas de dos poblaciones normales, un intervalo de
confianza del (1- )100% para
1
2

, esta dado por:





2 1
1 2
2 2 2
1 1 1
/ 2, 1, 1
2 2 2
2 1 / 2, 1, 1 2 2
1

n n
n n
S S
F
S F S



< <



Tambin, se puede obtener un intervalo de confianza para
1
2


Como
2
1 1
2
2 2


=
, entonces para obtener un intervalo de Confianza del
cuocientes de desviaciones se debe extraer raz de cada limite del intervalo de
confianza de
2
1
2
2

Вам также может понравиться