Академический Документы
Профессиональный Документы
Культура Документы
=
Teorema n 2: Si la poblacin es de tamao N, si el muestreo es sin
reposicin, y si el tamao de la muestra es
N n
, entonces se tiene:
2
2
1
x
N n
n N
| |
=
|
\ .
Si se muestrea una poblacin que tiene distribucin de probabilidad
desconocida, la distribucin de muestreo de la media y varianza
n
2
y si el
tamao de la muestra es grande ( 30 n ), llegamos a uno de los teoremas ms
tiles en Estadstica; se le conoce como Teorema del Lmite Central
Teorema n 3: Teorema del Lmite Central
Si
n
x x x ,..., ,
2 1
es una muestra aleatoria de tamao n tomada de una
poblacin (finita o infinita) con media y varianza
2
, y si x es la media
muestral, entonces, la forma del lmite de la distribucin es.
Cuando el tamao de muestra tiende a infinito corresponde utilizar la
distribucin Normal Estndar o cuando se conoce la varianza poblacional.
Cuando el tamao de la muestra es menor que 30 o cuando la varianza
poblacional se desconoce corresponde utilizar la distribucin t, conocida
como la distribucin t de Student.
3.2 Distribucin muestral de una proporcin
A s como lo hicimos en la distribucin muestral de medias, anlogamente se
pueden comprobar y demostrar los siguientes resultados.
Si el estimador p representa la proporcin muestral de una poblacin con
proporcin P, entonces:
La distribucin de la proporcin muestral p es aproximadamente normal
con:
i) Promedio:
p
P =
ii) Varianza:
2
p
PQ
n
=
iii) Valor estndar:
2
p
p P
z
=
Donde Q = 1 P proporcin del fracaso y n es el tamao de la muestra.
Esta aproximacin es aplicable para tamaos de muestras grandes tales
que:
5 y 5 con 1 np nq q p =
3.3 La Varianza corregida poblacional se define como:
2
2
1
n S
n
=
Por otra parte, supongamos que la variable aleatoria x tiene distribucin
poblacional gaussiana de parmetros y
2
. Si medimos X en una m.a. de
n observaciones la varianza muestral S
2
de esa muestra es un valor de la
variable aleatoria S
2
. La teora estadstica demuestra que la variable aleatoria:
( )
2
2
2
1 n s
=
Tiene distribucin muestral chicuadrado de parmetro v = (n 1), donde v son
los grados de libertad
Definimos
2
, mientras que
2
1 / 2
es tal que el rea bajo la curva
a su izquierda es
2
.
Caractersticas de
2
a) Es una distribucin asimtrica
b) Slo toma los valores positivos y es asinttica con respecto al eje de las x
positivas
(0 <
2
< ).
c) Tiene un nico parmetro v llamado grados de libertad
d) La area comprendida entre la curva y el eje de las x es 1
Como la distribucin chicuadrado aparece en muchas aplicaciones importantes,
se ha tabulado. La tabla contiene valores de
derecha, situada debajo de la curva chi
igual a . Esto es,
2
,v
es tal que
2 2
,
( )
v
P
=
Cuando v excede de 30, las probabilidades relac
chicuadrado suelen aproximarse con el uso de distribuciones normales
3.4 Distribucin muestral de un cuociente de varianzas (Dos poblaciones
Normales)
Si consideramos el estadstico
i) Un cuociente grande o pequeo
las varianzas
ii) Un cuociente prximo a uno (1) indicara una pequea diferencia
entre las varianzas
Sean 1
2
S y 2
2
S varianzas muestrales basadas en muestras aleatorias
independientes de tamaos n
medias
1 2
y y varianzas
siguiente estadstico:
cuadrado aparece en muchas aplicaciones importantes,
se ha tabulado. La tabla contiene valores de
2
,v
\
|
|
|
.
|
\
|
=
|
|
.
|
\
|
|
|
.
|
\
|
=
2
2
2
2
1
2
1
2
2
2
2
2
2
2
1
2
1
1
2
1
) 1 (
) 1 (
S
S
n
S n
n
S n
F
.
Donde:
) 1 (
1
1
2
1
1
2
=
n
S n
S
y
) 1 (
2
2
2
2
2
2
=
n
S n
S
Si 2
2
1
2
= entonces la estadstica
2
2
1
2
S
S
tiene distribucin F (en memoria de
R.A. Fisher) de parmetros V
1
= n
1
1 y V
2
= n
2
-1. Donde V
1
y V
2
son
los grados de libertad del numerador y denominador respectivos de la
distribucin F
La distribucin F se encuentra tabulada en los percentiles 95 y 99 por lo tanto si
quisiramos calcular percentiles 0,05 o 0,01 no lo podramos hacer, este
problema nos conduce al siguiente teorema.
Teorema 5: Sea p un percentil con v
1
y v
2
grados de libertad, entonces se
tiene que:
2 , 1
1 2
,
, , 1
1
v v p
v v p
F
F =
3.5 Distribucin de muestra de diferencias entre medias
Si 1 X representa el promedio de una caracterstica observada en una muestra
de tamao
1
n de una poblacin normal con media
1
y varianza
2
y 2 X
representa el promedio de esa caracterstica en una muestra de tamao
2
n
de una poblacin normal con
2
2
y tal que ambas poblaciones sean
independientes, entonces se tiene que:
La diferencia de las medias muestrales ( ) 2 1 X X sigue una distribucin
normal con:
a) Promedio:
1 2
1 2
1 2
x x
x x
= =
b) Varianza:
|
|
.
|
\
|
+ =
2 1
2 2
1 1
2 1
n n
x x
3.6 Distribucin muestral de diferencias entre proporciones
Si p
1
es la proporcin de una caracterstica observada en una muestra de
tamao
1
n de una poblacin con proporcin P
1
y p
2
es la proporcin de esa
caracterstica en una muestra de tamao
2
n de una poblacin con proporcin P
2
, y ambas poblaciones son independientes, entonces se tiene que:
La diferencia de estas proporciones muestrales (p
1
p
2
) sigue una
distribucin aproximadamente normal con:
a) Promedio:
2 1
2 1
P P
p p
=
b) Varianza:
2
1 2
1 1 2 2
1 2
P P
p q p q
n n
= +
5.0 Intervalos de Confianza
5.1 Intervalo de confianza para estimar un promedio Estimacin con
poblacin normal y varianza conocida
Consideremos, en general, una muestra de n observaciones independientes,
X
1
, X
2
,..., X
n
de una variable X que nos interesa. Supongamos que X tiene
distribucin normal de parmetros
2
y y que
2
sea conocida. Ya
sabemos que
|
.
|
\
|
=
n
x
Z
Tendr distribucin normal de parmetros
2
0 y 1 = =
Supongamos que = 0,05, encontrar el intervalo de confianza para estimar
Solucin:
( )
1, 96 1, 96 1 P Z =
y como = 0,05, entonces se tiene que:
( ) 1, 96 1, 96 0, 95 P Z =
Luego, sustituyendo el valor de Z, se tiene que:
Despejando
se tiene:
1, 96 1, 96 0, 95 P x x
n n
| |
+ =
|
\ .
Diremos que:
1.96 , 1.96 x x
n n
(
+
(
1, 96 1.96 0, 95
x
P
n
| |
|
|
=
| | |
| |
\ .
\ .
Es un intervalo de confianza del 95% para estimar el parmetro
Ntese que el limite inferior y el limite superior son funciones de
son ellos mismos variables aleatorias. La situacin grafica es la siguiente:
Por lo tanto, slo el 5% de las muestras tendrn probabilidades que est
de estos lmites
Un planteamiento general nos lleva al siguiente teorema
Teorema 6: Intervalo de confianza para
Si x es el valor de la media de una muestra aleatoria de tamao
una poblacin normal con varianza conocida
(1- )100% para estimar el promedio
/ 2 / 2
P x z x z
n n
| |
< < + =
|
\ .
5.2 Intervalo de confianza para estimar un promedio
y varianza desconocida
Como no siempre se conoce la varianza poblacional debemos utilizar el
siguiente teorema
Teorema 7: Intervalo de confianza para
Si x y s son los valores de la media y desviacin estndar de una muestra
aleatoria de tamao n tomada de una poblacin normal
desconocida
2
, un intervalo de confianza del (1
por:
Es un intervalo de confianza del 95% para estimar el parmetro
Ntese que el limite inferior y el limite superior son funciones de
x
, por tanto,
son ellos mismos variables aleatorias. La situacin grafica es la siguiente:
Por lo tanto, slo el 5% de las muestras tendrn probabilidades que est
Un planteamiento general nos lleva al siguiente teorema
Teorema 6: Intervalo de confianza para con
2
conocida
es el valor de la media de una muestra aleatoria de tamao n tomada de
una poblacin normal con varianza conocida
2
, un intervalo de confianza del
estimar el promedio est dado por:
/ 2 / 2
(1 ) 100% P x z x z
n n
| |
< < + =
|
\ .
.2 Intervalo de confianza para estimar un promedio con poblacin normal
Como no siempre se conoce la varianza poblacional debemos utilizar el
Teorema 7: Intervalo de confianza para y varianza desconocida
son los valores de la media y desviacin estndar de una muestra
tomada de una poblacin normal con varianza
un intervalo de confianza del (1- )100% para est dado
, por tanto,
son ellos mismos variables aleatorias. La situacin grafica es la siguiente:
Por lo tanto, slo el 5% de las muestras tendrn probabilidades que estn fuera
tomada de
un intervalo de confianza del
(1 ) 100%
con poblacin normal
Como no siempre se conoce la varianza poblacional debemos utilizar el
desconocida
son los valores de la media y desviacin estndar de una muestra
con varianza
est dado
( )
/ 2, 1 / 2, 1
1 100%
n n
s s
P x t x t
n n
| |
< < + =
|
\ .
Para n 30 , esta formula del intervalo de confianza y el teorema 4 con
sustituida por s producir casi los mismos resultados
Obsrvese que el coeficiente de confianza corresponde a la distribucin t
5.3 Tamao de la muestra
Dado el intervalo de confianza
/ 2 / 2
x z x z
n n
< < +
La precisin (error) del intervalo de confianza es
/ 2
z
n
Esto significa que al utilizar x para estimar
, el error:
E x =
Por lo tanto, se debe considerar el error como:
/ 2
E z
n
Con una confianza de (1 - ) 100%
El tamao apropiado de la muestra se obtiene al seleccionar n de modo que:
/ 2
E z
n
=
Definicin: Si x se utiliza como estimacin de , entonces puede tenerse una
confianza de (1 - )100% de que el error x no ser mayor que una
cantidad especfica de E cuando el tamao de la muestra sea:
Primera aproximacin
2
/ 2
0
Z
n
E
| |
=
|
\ .
Luego tenemos las siguientes opciones:
i)
0
Si 0, 05 n N <
Donde N es el tamao de la poblacin
Entonces, se tiene que el tamao de la muestra es:
n = n
0
ii)
0
0, 05 Si n N
Donde N es el tamao de la poblacin.
Entonces, se tiene que el tamao de la muestra es:
0
0
1
n
n
n
N
=
+
5.4 Intervalos de confianza para diferencias de medias
Como en el punto 3.5 se estableci que:
2
1 x x
Es una variable aleatoria que tiene una distribucin normal y varianzas
poblacionales conocidas, entonces se tiene:
a) Media
2 1
2 1
=
x x
b) Varianza
2
2
2
1
1
2
2
2 1
n n
x x
+ =
c) Valor estndar (z)
( ) ( )
2 1
2
2 1
2 1
x x
x x
Z
Tiene distribucin normal estndar
Al sustituir Z en
2 2
1 P Z Z Z
| |
< < =
|
\ .
nos lleva a formular el siguiente
teorema:
Teorema 8: Intervalo de confianza para
2 1
con
1 2
y conocidas
Si 1 2 x y x son los valores de las medias de muestras aleatorias
independientes de tamao
1 2
n y n tomadas de poblaciones normales con
varianzas conocidas
2 2
1 2
y , un intervalo de confianza del ( ) 1 100%
para
2 1
est dado por:
( )
( )
1 2 1 2
2 2
1 2 1 2
/2 1 2 /2
( ) ( ) 1 100%
x x x x
P x x Z x x Z
< < + =
En virtud del teorema del lmite central, este resultado puede usarse con
muestras aleatorias independientes de poblaciones normales con las varianzas
conocidas
2 2
1 2
y , siempre que
1 2
n y n sean lo suficientemente grandes.
Tamao de la muestra
Si se conocen (al menos aproximadamente) las desviaciones estndar
1 2
y y los tamaos de las dos muestras son iguales (n
1
= n
2
= n), entonces
puede determinarse el tamao de la muestra requerido de modo que se tenga
una confianza del (1- ) 100 % en que el error en la estimacin de
1 2
y por
1 2 x x sea menor. El tamao de la muestra requerido es:
( )
2 2
/ 2
0 1 2
z
n
E
| |
= +
|
\ .
Luego, tendramos que:
i)
0
Si 0, 05 n N <
Donde N es el tamao de la poblacin
Entonces, se tiene que el tamao de la muestra es:
n = n
0
ii)
0
0, 05 Si n N
Donde N es el tamao de la poblacin
Entonces, se tiene que el tamao de la muestra es:
0
0
1
n
n
n
N
=
+
Teorema 9: Intervalo de confianza para
2 1
con
2 1
= y
desconocidas
Si
1 2
x y x son los valores de las medias de muestras aleatorias
independientes de tamao
1 2
n y n tomadas de poblaciones normales con
varianzas desconocidas pero iguales, un intervalo de confianza del
(1 - ) 100% para
2 1
est dado por:
( )
1 2
1 ,
1 2
1 1
v
x x t
n n
+
.
Con
2 2
2
1 1 2 2
1 2
( 1) ( 1)
2
n S n S
n n
+
=
+
5.5 Intervalos de confianza para proporciones
Existen muchos problemas en los cuales debemos obtener proporciones,
probabilidades, porcentajes o tasas. En muchos casos se debe suponer que se
muestrea una poblacin Binomial. Utilizando el hecho que para n grandes la
distribucin Binomial puede obtenerse aproximadamente con una distribucin
normal, es decir que la variable aleatoria.
) 1 ( p np
np x
Z
=
Se puede considerar como si tuviese la distribucin normal estndar
Teorema 10: Intervalo de confianza de muestra grande para P
Un intervalo de confianza aproximado del (1- )100% para el parmetro
Binomial P est dado por:
/ 2 / 2
.(1 ) .(1 )
p p p p
p z P p z
n n
| |
+
|
|
\ .
Donde
x
p
n
=
Tamao de la muestra para estimar P si se tiene informacin sobre P
2
/ 2
0
(1 )
Z
n P P
E
(
=
(
Luego, tendramos que:
i)
0
Si 0, 05 n N <
Donde N es el tamao de la poblacin
Entonces, se tiene que el tamao de la muestra es:
n = n
0
ii)
0
0, 05 Si n N
Donde N es el tamao de la poblacin
Entonces, se tiene que el tamao de la muestra es:
0
0
1
n
n
n
N
=
+
Como no siempre se tiene informacin de P, en este caso sustituimos por P
cualquiera de sus valores que se aproxime a
2
1
. Si en tal informacin,
hacemos uso del hecho que P (1 P) no puede ser mayor que
4
1
, que es el
resultado para P =
2
1
. Por lo tanto se tiene que:
Tamao de la muestra para estimar P sin informacin sobre P
2
/ 2
0
1
4
Z
n
E
(
=
(
Luego, tendramos que:
i)
0
Si 0, 05 n N <
Donde N es el tamao de la poblacin
Entonces, se tiene que el tamao de la muestra es:
n = n
0
ii)
0
0, 05 Si n N
Donde N es el tamao de la poblacin
Entonces, se tiene que el tamao de la muestra es:
0
0
1
n
n
n
N
=
+
5.6 Intervalos de confianza para diferencias entre proporciones
Frecuentemente se desea calcular la diferencia entre los parmetros
binomiales P
1
y P
2
sobre la base de muestras independientes tomadas de
poblaciones binomiales. Por lo que esto nos conduce al siguiente teorema.
Teorema 11: Intervalo de confianza de muestra grande para P
1
- P
2
Un intervalo de confianza aproximado del (1 - ) 100% para P
1
- P
2
, la
diferencia entre dos parmetros binomiales, est dada por:
1 1 2 2
1 2 / 2
1 2
(1 ) (1 )
( )
p p p p
p p Z
n n
| | | |
+
| |
\ . \ .
Donde
1
1
1
n
x
p =
y
2
2
2
n
x
p =
5.7 Intervalos de confianza para varianzas
Dada una muestra aleatoria de tamao n tomada de una poblacin normal,
podemos obtener un intervalo de confianza del (1- )100 % para la varianza
utilizando el hecho que
( )
2
2
1 n s
Es una variable aleatoria que tiene distribucin chicuadrado
Teorema 12: Intervalo de confianza para
2
Si S
2
es el valor de la varianza de una muestra aleatoria de tamao n tomada
de una poblacin normal, un intervalo de confianza del (1- )100 % para S
2
est dado por:
( ) ( )
2 2
2
2 2
1 / 2, 1 / 2, 1
1 1
n n
n S n S
< <
Tambin, se pueden obtener lmites de confianza del (1- ) 100% para
como:
2
=
Lo que quiere decir que se debe extraer raz de cada lmite del intervalo de
confianza de
2
5.8 Intervalo de confianza para razones de dos varianzas
Si S
2
1
y S
2
2
son dos varianzas de muestras aleatorias independientes de
tamaos n
1
y n
2
tomadas de dos poblaciones normales, un intervalo de
confianza del (1- )100% para
1
2
< <
Tambin, se puede obtener un intervalo de confianza para
1
2
Como
2
1 1
2
2 2
=
, entonces para obtener un intervalo de Confianza del
cuocientes de desviaciones se debe extraer raz de cada limite del intervalo de
confianza de
2
1
2
2