Вы находитесь на странице: 1из 30

89

Captulo 4. DISTRIBUCIONES EN EL MUESTREO ................. 91




4.1 Distribucin en el muestreo de la media ............................. 92

4.2 Funcin generatriz de momentos de la distribucin de la media
y de la poblacin .................................................................. 95

4.3 Distribuciones en el muestreo de la media ......................... 97
Distribucin de la media muestral,
X
, cuando X~N (0,1) ....... 98
Distribucin de la media muestral,
X
, cuando X~N(
x

,
x

) . 100
Distribucin de la media muestral ,
X
, cuando X tiene
distribucin diferente a la normal ...................................... 105

4.3 Factor de correccin para poblaciones finitas .................... 112



CASOS DE ESTUDIO, PREGUNTAS Y PROBLEMAS ............... 116

Caso 4.1: Edades y estaturas del curso Inferencia Estadstica. .. 116

Problemas ......................................................................... 117



Bibliografa ................................................................... 117



90



91
Captulo 4. DISTRIBUCIONES EN EL MUESTREO
Hasta aqu se ha desarrollado el concepto de probabilidad y sus
distribuciones asociadas, ahora utilizando aquella base se comenzar con
el enfoque de la forma en que los estadsticos de la muestra se pueden
utilizar para hacer inferencias sobre los parmetros de la poblacin.
Es necesario darse cuenta de que el investigador estadstico, a travs de
los datos recolectados en una encuesta, se interesa en sacar conclusiones
de la poblacin y no de la muestra. Por ejemplo, un encuestador poltico
se interesa en los resultados de la muestra solo como medio para estimar
la proporcin real de votos que recibir cada candidato entre la poblacin
de votantes.
En la prctica, una muestra individual de tamao determinado se
selecciona aleatoriamente entre la poblacin. Las unidades muestrales se
van a obtener mediante, por ejemplo, una tabla de nmeros aleatorios. A
fin de poder utilizar la media de la muestra para estimar la media de la
poblacin se deberan examinar todas las muestras posibles de la
poblacin y calcular una media para cada muestra. La distribucin de
estos resultados se denomina distribucin en el muestreo, en la prctica
con la seleccin de una muestra, y utilizando la teora de la probabilidad,
se hacen inferencias a la poblacin.
La inferencia estadstica es uno de los objetivos de la investigacin
estadstica. La inferencia se hace utilizando estadsticos de la muestra;
los estadsticos son mediciones que se realizan en la muestra para
estimar las mismas mediciones de la poblacin que se denominan
parmetros.
El investigador estadstico, a travs de las medidas que obtiene de una
muestra, busca sacar conclusiones respecto de la poblacin y no respecto
de la muestra.




En la siguiente tabla se observa la relacin entre estadsticos y
parmetros

Caracterstica Parmetros Estimador
Media
x

X
Diferencia entre las medias de dos poblaciones
2 1
x x

2 1
X X
Proporcin
t p
Varianza
2
X
o
2
X
s
Desviacin estndar
X
o
X
s


Ej empl o. Un encuestador poltico se interesa en los resultados de la muestra
slo como medio para estimar la proporcin de votos que recibir cada
candidato entre la poblacin de votantes.

92







En la prctica, una muestra individual de tamao determinado se
selecciona aleatoriamente entre la poblacin. Las unidades muestrales se
obtienen mediante, por ejemplo, una tabla de nmeros aleatorios. En el
caso hipottico, a fin de poder utilizar la media de la muestra para
estimar la media de la poblacin se deben examinar todas las muestras
posibles de la poblacin y calcular una media para cada muestra. La
distribucin de estos resultados se denomina distribucin en el muestreo.
Aunque en la prctica se ha seleccionado solo una muestra, se debe
examinar el concepto de la distribucin en el muestreo, con el propsito
de poder utilizar la teora de la probabilidad para hacer inferencias en
cuanto a los valores de la poblacin.
En este mdulo se estudiarn las distribuciones en el muestreo sin
estudiar especficamente como se obtiene una muestra aleatoria, tema
que ser abordado ms adelante.


4.1 Distribucin en el muestreo de la media
Existen diversas medidas con que se pueden caracterizar los datos de la
muestra. Dentro de las medidas de posicin, tanto el modo como la
mediana y la media, calculadas de los datos muestrales, podran ser
considerados estadsticos tiles para estimar la media poblacional.
No obstante, el mejor estimador para inferir la media poblacional, es la
media aritmtica obtenida de los datos muestrales. Esto es as pues, este
estadstico, tiene tres propiedades deseables y muy importantes en todo
proceso de estimacin: es insesgado, eficiente y consistente.
La media aritmtica, obtenida de los datos de una muestra aleatoria, es
una variable aleatoria, ya que se ha calculado a partir de un proceso de
estimacin aleatorio. Por lo tanto, al ser una variable aleatoria tiene una
distribucin de probabilidad, una esperanza matemtica y una varianza.
Esta propiedad es propia de todo estadstico calculado con datos
provenientes de una muestra aleatoria.
Para el caso particular de la media aritmtica de los datos de una
muestra aleatoria, se demostrar empricamente que
X
X E = ) (
Esto es, la esperanza matemtica de la media aritmtica de los datos
obtenidos a partir de una muestra aleatoria, es igual al parmetro
poblacional que se est estimando (la media de la poblacin). Al cumplir
Ej empl os.
El estadstico X , que surge de una muestra, es estimador del parmetro
x
, en
la poblacin.
El estadstico
2 1
X X , diferencia de las medias provenientes de dos muestras,
es estimador del parmetro
2 1
x x
, que indica la diferencia en las medias
proveniente de dos poblaciones.

93
con esta propiedad, se dice que la media aritmtica es un estimador
insesgado de la media poblacional.
Por lo tanto, si se toma una cantidad determinada de muestras aleatorias
de una poblacin, n muestras, y de cada una se calcula, a partir de los
datos observados de una variable, una media aritmtica, se obtendrn n
medias aritmticas muestrales. La esperanza matemtica de todas estas
medias aritmticas muestrales es la media de la poblacin,
X
n
i
i
n
X
=

=1

































Ex per i ment o. Bajo el supuesto de que la variable X representa el nmero de
visitas al dentista en un ao determinado por individuos de una cierta poblacin, y
que es una variable aleatoria discreta con distribucin uniforme. Esto es, X puede
asumir solo valores enteros y cada uno de estos valores se observa con la misma
probabilidad. El Cuadro 4.1 y el Grfico 4.1 muestran la frecuencia relativa en la
poblacin.

Cuadro 4.1

Valores de X
Frecuencia
relativa en la
poblacin
Grfico 4.1

0 0.1
1 0.1
2 0.1
3 0.1
4 0.1
5 0.1
6 0.1
7 0.1
8 0.1
9 0.1
1.0


Identificando con a el valor mnimo y con b el valor mximo de X, la media de una
distribucin uniforme discreta es
5 . 4
2
9 0
2
) ( =
+
=
+
= =
b a
X E
X

y la desviacin estndar:
87 . 2
12
1 ] 1 ) 0 9 [(
12
1 ] 1 ) [(
2 2
=
+
=
+
=
a b
X
o
De modo que la media y la desviacin estndar de la poblacin bajo estudio asumen
los valores 4.5 y 2.87.
De esta poblacin se extraen 100 muestras posibles de tamao 5. Es decir, se
seleccionan 5 personas al azar de la poblacin y se le pregunta cuntas veces visit
al dentista en el ao. En una de las muestras las respuestas de las personas fueron:
0
0.1
f
r
e
c
u
e
n
c
i
a
0 1 2 3 4 5 6 7 8 9 10
X

94





































PERSONA NUMERO DE VISITAS
Primera 2
Segunda 0
Tercera 4
Cuarta 1
Quinta 1
Sobre esta muestra se calcula la media aritmtica:

( )
.
2 0 4 1 1
5
16
+ + + +
=
Este experimento se repiti 100 veces y se calcularon 100 medias aritmticas. Los
resultados del experimento se muestran en el Cuadro 4.2:

Cuadro 4.2
Valores de la Media de la muestra X Frecuencia
Intervalo Punto Medio Absoluta Relativa
0.5 a 1.499 1 1 0.01
1.5 a 2.499 2 5 0.05
2.5 a 3.499 3 12 0.12
3.5 a 4.499 4 31 0.31
4.5 a 5.499 5 28 0.28
5.5 a 6.499 6 15 0.15
6.5 a 7.499 7 5 0.05
7.5 a 8.499 8 3 0.03
8.5 a 9.499 9 0 0.00
100 1.00

Aunque la variable (y, por lo tanto, los datos individuales) solo pueden tomar
valores enteros entre 0 y 9, las medias de las muestras no sern, generalmente,
enteros y la distribucin muestral ser una distribucin de frecuencias cuyas clases
estarn definidas por intervalos y no por puntos. Se sabe que para representar cada
clase se puede elegir un valor, como, por ejemplo, el centro de cada intervalo.

Las principales caractersticas de esta distribucin son
Media = =

=
9
1 i
i i
f X 1 (0.01) + 2 (0.05) + 3 (0.12) + 4 (0.31) + 5 (0.28)
+ 6 (0.15) + 7 (0.05) + 8 (0.03) + 9 (0.00) = 4.60
Desviacin estndar 1.3638 f 4.60) X (
9
1 i
i
2
i
= =

=


Los resultados indican que un 59% de los valores estimados (0.31+0.28) estn
comprendidos en el intervalo 1 alrededor del valor real 4.5 y que el 86% de las
estimaciones estn comprendidas en el intervalo 2 alrededor de dicho valor.
Realizado el mismo experimento con la variante de tomar 100 muestras de tamao
10 se obtuvo la siguiente caracterstica
Media 57 . 4
9
1
=

= i
i i
f X ,Desviacin estndar 0416 . 1 ) 57 . 4 (
9
1
2
= =

= i
i i
f X

95
Los resultados del experimento permiten realizar las siguientes
generalizaciones
a) la media de la muestra, X , es un estimador insesgado de la media
de la poblacin,
X

b) a medida que aumenta el tamao de la muestra, la distribucin
muestral de X se va concentrando cada vez ms en torno a la
media de la poblacin y, por tanto, X es un estimador consistente
de
X

c) el estimador X es ms estable de una muestra a otra que la
mediana o el modo, esto lo convierte en un estimador eficiente.

Queda claro que se ha trabajado con distribuciones muestrales
experimentales. Si se lo hubiese hecho con las distribuciones tericas se
hubieran obtenido idnticos resultados pero con mucho menos trabajo ya
que slo se tomara una muestra.


4.2 Funcin generatriz de momentos de la distribucin de la media
y de la poblacin

A que es igual la funcin generatriz de momentos de la suma de
variables aleatorias independientes
1
X
1
, X
2
,.X
n
?

La funcin generatriz de momentos de una variable aleatoria continua es:
( ) ( )dx x f e e E M
x x
x
}


= =
u u
(1)

Si la variable aleatoria es discreta, se expresa
( ) ( )

= =
X
x x
x
x f e e E M
u u


(
X
M , o ) (u
X
M donde u es el parmetro, simboliza la funcin generatriz
de momentos de una variable aleatoria)

La funcin generatriz de momentos de la sumatoria de variables
aleatorias independientes en el parmetro

1
Variable aleatoria independiente: la probabilidad de ocurrencia de una variable no depende de la
probabilidad de ocurrencia de la otra.


96
( )
( )
{ }
n
n
x ... x x
x ... x x
e E M
+ + +
+ + +
=
2 1
2 1
(2)

Aplicando la propiedad distributiva
{ }
n
x
....
x x x
e e e e E
3 2 1
(3)

Dado que las variables son independientes lo anterior puede expresarse
( )
1
x
e E ( )
2
x
e E ( )
xn
e E (4)

Por (1) se sabe que
( )
x
x
M e E =
u


Si tenemos en cuenta (1) en (4) tendremos
( ) M
x
1
( ) M
x
2
. ( ) M
n
x
(5)

Pero en muestreo aleatorio las caractersticas de la poblacin se obtienen
a partir de las caractersticas de la muestra
( ) M
i
x
= ( ) u
n
X
M (6)

Por ende ( ) M
n
x
es la funcin generatriz de momento elevado a la
potencia n.


En sntesis, la funcin generatriz de momentos de una suma de variables
independientes
( ) M
n
x ... x x + + +
2 1

es el producto de las n funciones generatrices de momentos del
parmetro para las n variables
( ) u
x
M ( ) u
x
M . ( ) u
x
M
y esto es igual a la funcin generatriz de momentos del parmetro
elevado a la n
( ) M
n
x




97
( ) M
n
x ... x x + + +
2 1
= ( ) u
x
M ( ) u
x
M . ( ) u
x
M = ( ) M
n
x
(7)


La funcin generatriz de momentos del producto de una constante por
una variable para el parmetro

,
( )
cx
M
, es la funcin generatriz de
momentos del producto del parmetro (u ) por la constante (c) para la
variable X , ( ) c M
x
; es decir que:
( ) M
cx
= ( ) c M
x
(8)

Con (7) y (8) se puede hallar la funcin generatriz de momentos de la
media de la muestra en el parmetro u ( ( ) M
x
)
( ) M
x
=
( )
( ) M
n
x ... x x
n
+ + +
2 1
1
=
( )
|
.
|

\
|
+ + +
n

M
n
x ... x x
2 1


Con este ltimo resultado y teniendo en cuenta (7)
( ) |
.
|

\
|
=
n

M M
n
x
x
(9)

La funcin generatriz de momentos de la X en el parmetro ( ) es la
funcin generatriz de momentos de la variable X elevado a la n en el
parmetro n
La expresin (9) relaciona la funcin generatriz de momentos de la media
muestral y de la poblacin.


4.3 Distribuciones en el muestreo de la media
Con una poblacin de valores de
X
y muestras aleatorias de tamao n,
de donde se obtiene
X
(de cada muestra), se analizar Cmo se
distribuye
X
? La respuesta no es nica, depende de cul sea la
distribucin de probabilidades de la variable X. Atendiendo a esto, se
tendrn tres alternativas, segn se est en presencia de:
X ~N (0,1)
X ~N (
x
,
x
o )
X ~ (
x
,
x
o ) con cualquier tipo de distribucin de probabilidad



98
Distribucin de la media muestral,
X
, cuando X~N (0,1)

Si la variable aleatoria X~N (
x
,
x
o ), su funcin de densidad es
( )
(
(

|
.
|

\
|
=
o

t o
x
e x f
2
2
1
2
1
; -<X <

Si se define

x
x

x
Z

= (10)

donde Z ~ N(0,1) entonces Z es una variable aleatoria normal centrada
y reducida
2
, denominada variable normal estndar. La funcin de
densidad de Z es
( )
|
.
|

\
|

=
2
2
1
2
1
Z
e Z f
t


La funcin generatriz de momentos de la variable Z, usando (1), es
( ) { } ( )dz z f e e E M
Z Z
z
}



= =

(11)

Reemplazando ( ) z f por su igual
( ) = u
z
M dz e
2
1
e
2
Z
2
1
Z
|
.
|

\
|

}
t
u
= dz e e
Z
Z
|
|
.
|

\
|

}
2
2
2
1
u
t
(12)

En la ltima expresin se tiene un producto de exponente de igual base
2
2
Z
Z
e e


el resultado de este producto es conservar la base y sumar los
exponentes
2
2
Z
Z
e

(13)

2
Una variable centrada es aquella a la que se le ha restado, a cada valor, el de su media;
y es reducida cuando se la divide por su desvo.

99

A fin de encontrar una expresin menos compleja, se suma y resta
2
2
1

en el exponente de e

2
Z
Z
2
u +
2
2
1

2
2
1


Al ordenar convenientemente y sacar factor comn
2
1

( )
2 2 2
2
1
2
2
1
Z Z + +

Se tiene el desarrollo del cuadrado
3

( )
2 2
2
1
2
1
Z +


En sntesis:
( )
2
2
2
2
1
Z
2
1
2
Z
Z u u u + = (14)

Reemplazando (14) en (13)


2
2
Z
Z
e e

=
( )
(

+
2 2
2
1
2
1
- Z
e =
( )
2 2
2
1
2
1
Z
e e


(15)

El resultado de (15) en (12) da lugar a una nueva expresin de la funcin
generatriz de momentos de la variable Z en el parmetro u

( ) M
z
=
( )
dz e e
Z
2 2
2
1
2
1
2
1
u u
t
}



=
( )
dz e
e
Z
}



|
.
|

\
|
2
2
2
1
2
1
2
u
u
t
(16)


3
Definir el binomio
( )
2
Z u
es equivalente a
( )
2
u Z
. En esta oportunidad es conveniente adoptar la
segunda expresin para que, en la sustitucin de variables que se realiza en (16), dz sea positivo.

100
La diferencia entre (16) y (12) radica en la expresin a integrar, (16) es
ms sencilla y se resuelve sustituyendo variables. Para lo cual se define
t Z = u

Entonces si z t =
dz dt = (porque es constante)

Remplazando en (16)
( ) M
z
= dt e
e
t
}

|
.
|

\
|
2
2
2
1
2
1
2t
u


Esta ltima expresin tiene la ventaja de contener una integral notable
cuyo resultado es t 2
dt e
t
}

2
2
1
= t 2 (17)

Entonces
( ) M
z
= dt e
e
t
}

|
.
|

\
|
2
2
2
1
2
1
2t
u
=
t
u
2
2
2
1
|
.
|

\
|
e
t 2 =
|
.
|

\
|
2
2
1
u
e


En sntesis, si N(0,1) ~ X se est trabajando con una variable aleatoria
estandarizada Z. La funcin generatriz de momentos de la variable Z en
el parmetro u es una exponencial con exponente 2
2
u
( ) M
z
=
|
|
.
|

\
|
2
2

e (18)

Al derivar ( ) u
z
M , se encuentran los momentos de orden 1 y 2 que
permiten hallar la media y la varianza de X cuando N(0,1) ~ X



Distribucin de la media muestral,
X
, cuando X~N(
x

,
x

)


101
Retomando la variable normal estndar definida en (10), si se multiplica
en ambos miembros por
X
o , la diferencia entre la observacin de la
variable y la media es la medida estndar por el desvo:
x x
x Z = (19)

La funcin generatriz de la variable aleatoria normal centrada
x
x , en
el parmetro u , es la funcin generatriz de momentos de la medida
estndar por el desvo en el parmetro u
( ) ( ) M M
x x
z x
=

(donde
x
o es constante)

Si se tiene en cuenta lo visto en (8), donde ( ) M
cx
= ( ) c M
x
, la funcin
generatriz de momentos de la variable centrada
X
x en el parmetro
u , es la funcin generatriz de momentos de la medida estndar por el
desvo en el parmetro u , que es igual a la funcin generatriz de
momentos de la variable estndar Z en el parmetro u o
X

( ) ( ) ( ) M M M
x z z x
x x
= =



Por (18) se sabe que ( )
2
2

z
e M = la funcin generatriz de momentos de
la variable Z en el parmetro u es
2
2
e
u


Entonces
( )
( )
( )
(

|
|
.
|

\
|
= =
2
2
2
1
2
x
x

x z
e e M

Es decir, la funcin generatriz de momentos de la variable normal
aleatoria centrada
X
x en el parmetro u es
( )
( )
(

=
2
2
1
x
x

x
e M (20)

La variable aleatoria Z fue reexpresada de acuerdo a (19), si se suma
x

en ambos miembros se tiene la expresin de la variable aleatoria X
x x
Z X o + = (21)

La funcin generatriz de momentos de una variable aleatoria x en el
parmetro u , teniendo en cuenta (21), es la funcin generatriz de

102
momentos de la suma de un producto (la variable Z ponderada por el
desvo) y una constante en el parmetro u
( ) ( ) M M
x x
z x +
= (22)

Pero, teniendo en cuenta una propiedad de funcin generatriz de
momentos
( ) ( ) u u
u
x
c
x c
M e M =
+
(23)
y la ya expresada en (8), ( ) M
cx
= ( ) c M
x
, la expresin (22) es igual a
( ) ( ) ( ) M e M M
x z

z x
x
x x
= =
+
(24)

La funcin generatriz de momentos de la variable X en el parmetro u es
el producto de una constante,
u
X
e , y la funcin generatriz de momentos
de una variable Z en el parmetro u o
x
.

Con el resultado alcanzado en (18), se reexpresa ( ) u o
x z
M de (24)
( )
( )
2
2


x
e M
x z
=

y se tiene

( )
|
.
|

\
|
+
=
2 2
2
1

x x
e M
x
(25)

(25) es es la funcin generatriz de momentos de la variable aleatoria X
normal de media
x
y desviacin estndar
x


En (9) se haba hallado la funcin generatriz de momentos de la media
muestral en el parmetro u
( ) |
.
|

\
|
=
n

M M
n
x
x

sustituyendo por (25) la funcin generatriz de momentos de la variable
aleatoria X elevada a la n
n
n 2
1
n
n
X
2
2
2
x x
e
n
M
(
(

=
|
.
|

\
|
+
u
o
u

u



103
Por lo tanto, la funcin generatriz de momentos de la media muestral, X
,
cuando X se distribuye normal es

( )
n
n
n
n
n
n
n
n
n
n n
n
n n
x
x x x x x x x x
e e e e e e e M
2
2
2
2
2
2
2
2
2
2
2
2
2
1
2
1
2
1
2
1 u
o
u

u
o
u

u
o
u

u
o
u

u =
|
|
|
.
|

\
|
|
|
.
|

\
|
=
(
(

=
(
(

=
+

( ) = M
x

n
x x
e
2
2
2
1 u
o u +
(26)


Al comparar las funciones generatrices de momentos de las variables X y
X
dadas en (25) y (26)


( )
2
X
2
X

2
1

e M
+
=
u
X


( )
n
X
2
o
u
2
X

2
1

X
e M
+
=


se acepta el teorema que dice: Si la variable aleatoria X asociada a una
poblacin tiene distribucin normal de media
x
y desviacin estndar
x
,
entonces la variable aleatoria X asociada a la distribucin de medias de
las muestras tambin es normal, de media:

( )
X
X
X E = =
y desvo:
n

X
X
=

Para demostrar el teorema se calcula el momento de orden 1 y el
momento de orden 2. Para esto se deriva la funcin generatriz de
momentos respecto de , y se evala cuando en 0. Entonces,

( )
|
|
.
|

\
|
+ =
c
c
=
+
n

M
M
2
X
n 2
1

X
1
X u
u
o u
X
2
2
X
(27)
Evaluando en = 0

104
X X
0
n

e M
2
X
n

2
1

1
2
X X
=
|
|
.
|

\
|
+ =
+
2
0
0

De modo que el momento de orden 1 es
( )
X 1
X E M = =
(28)


Para hallar el momento de orden 2, se deriva la derivada que dio origen
al momento de orden 1:
( )
n

e
n

M
M
2
X
n

2
1

2
2
X
X
n

2
1

2
X
2
2
2
X 2
X
2
X 2
X
+ +
+
|
|
|
.
|

\
|
+ =
c
c
= (29)
Evaluando en = 0
n

e 0
n

e M
2
X 0
2
2
X
X
0
2
+
|
|
|
.
|

\
|
+ =
Entonces el momento centrado de orden 2 es
n

M
2
X 2
X
2
+ =

La varianza de X es,
( )
n

M M X V
2
X 2
X
2
X 2
X
2
1
2
2
X
= + = = =
y el desvo de X ser
n

X
2
X
X
= = (30)

Los resultados alcanzados en (28) y (30) confirman la aseveracin del
teorema.

En sntesis, si
) , N( ~ X
X X

la funcin generatriz de momentos de la
variable aleatoria X en el parmetro

es
( )
2
X
2
X

2
1

X
e M
+
=

y la funcin

105
generatriz de momentos de la variable aleatoria
X
es
( )
n

2
1

X
X 2
X
e M
2

+
=

siendo
)
n
, N( ~ X
X
X

.


Distribucin de la media muestral ,
X
, cuando X tiene distribucin
diferente a la normal

Es decir, que pasa si X tiene alguna distribucin distinta a la normal pero
tiene una
X
y un
X
o .

Para demostrarlo se define
n

X
t
X
x
X
x

=

=
A una variable aleatoria estandarizada correspondiente a la distribucin
de medias de las muestras.

La funcin generatriz de momentos de t en el parmetro

( ) ( ) M M
n

X
t
X
x

= donde
n

X
es constante

Aplicando lo visto en (8) que ( ) ( ) C M M
X CX
=

( )
|
|
|
|
.
|

\
|
=

n


M M
X
X
t
X
donde
X
es constante

En (23) se vio que ( ) ( ) M e M
X
C
X C
=
+
, con lo cual


106
( )
|
|
|
|
.
|

\
|
=


M e M
X
X
n
t
X
X
o
u


Pero en (9) se vio que ( ) |
.
|

\
|
=
n

M M
n
X X


Entonces,
( )
|
|
.
|

\
|
=
|
|
|
|
.
|

\
|
=

n

M e
n


M e M
X
n
X

n
X
n
X

n
t
X
x
X
x
n
(31)

Esto es as porque
n

n
n
n
n
n
n

X
X
2
1
X
1
2
1
X
2
1
X X
= = = = =



Al tomar logaritmo natural en (31)
( ) | |
(
(

|
|
.
|

\
|

=
n

M In n

n
M In
X
X
X
x
t
(32)

Hay que tener en cuenta que
( ) { }
X
X
e E M =

y que
X
e
puede desarrollarse en series de potencias
...
3!
w
2!
w
w 1 e
3 2
w
+ + + + =

Entonces
( )
( ) ( )

+ + + + = ...
3!
X
2!
X
X 1 E M
3 2
X



107
La esperanza es distributiva respecto de la suma
( ) { } { }
( ) ( )
...
3!
X
E
2!
X
E X E 1 E M
3 2
X
+

+ + =

Pero luego { } { } X E C CX E =
( ) { } { } { } { } ... X E
3!

X E
2!

X E 1 E M
3 2
X
+ + + + =
3 2


De modo que la funcin generatriz de la variable X es
( ) ...
3!

2!

1 M
l
3
l
2
l
1 X
+ + + + =
3 2
(33)

Donde se ha tenido en cuenta que { } { } 1 C C E 1 E = = =
;
y que,
{ }
l
1
X E = es el momento con respecto al origen de la variable aleatoria
X de rdenes crecientes.

Derivando sucesivamente la expresin (33)
( )
(
(

+ + + + + = ...
4!

3!

2!

1
d
d
M
d
d
l
4
4
l
3
3
l
2
2
l
1
X

...
2 3 4
4

2 3
3

2
2
0
l
4
3 l
3
2 l
2
l
1
+

+

+ + + =
Si 0 = entonces ( )
l
1
X
M
d
d
=


A continuacin se busca la segunda derivada
( )
(

+
/
/
+
/
/
+
/
/
+ = ...
2 3 4
4

2 3
3

2
2

d
d
M
d
d
l
4
l
3
2 l
2
l
1
X
2
2
3

...
2 3
3

2
2
0
l
4
2 l
3
l
2
+

+ + + =

Si 0 = entonces ( )
l
2
X
2
2
M
d
d
=


108

Luego la tercer derivada
( )
(

+
/
/
+
/
/
+ = ...
2 3
3

2
2

d
d
M
d
d
l
4
2 l
3
l
2
X
3
3

... 0
l
4
l
3
+ + + = u

Si 0 = entonces ( )
l
3
X
3
3
M
d
d
=


Las derivaciones anteriores permiten generalizar el resultado en la
siguiente expresin
( )
l
X
M
d
d
k
k
k

u
=
=0


La derivada k-sima respecto al parmetro
,
k veces, evaluada en
0 = , es el k-simo momento de la variable aleatoria con respecto al
origen.

En (32) se tena que
( ) | |
(
(

|
|
.
|

\
|

=
n

M In n

n
M In
X
X
X
x
t


En (33) se encontr una expresin para
|
|
.
|

\
|
n

M
X
X
, reemplazando


( ) | |
(
(

(
+ + +

+ + + +

=
...
n

4!
1

n

3!
1

2!
1

n

1 ln n

n
M In
l
4
2
4
4
X
4
l
3
2
3
3
X
3
l
2 2
X
2
l
1
X X
x
t

(34)

Si n>30 se lo considera lo suficientemente grande como para que lo
contenido en el corchete sea una suma de trminos que tiende a 1 + algo
cercano a 0. Esto se puede desarrollar usando una expansin en serie de
potencia donde

109

( ) ...
4
Z
3
Z
2
Z
Z Z 1 In
4 3 2
+ + = + Z <1

Z ser igual a
...
n

4!
1

3!
1

2!
1

Z
l
4
4
X
2
4
4
l
3
3
X
2
3
3
l
2
2
X
2
l
1
X
+ + + + =

que es la expresin que se encuentra entre corchetes en (34).


Si se desarrolla la serie en potencia
( )
... ...
n

4!
1

n

3!
1

2!
1

4
1
...
n

4!
1

n

3!
1

2!
1

3
1
...
n

4!
1

n

3!
1

2!
1

2
1
...
n

4!
1

n

3!
1

2!
1

Z 1
4
l
4
4
X
2
4
4
l
3
3
X
2
3
3
l
2 2
X
2
l
1
X
3
l
4
4
X
2
4
4
l
3
3
X
2
3
3
l
2 2
X
2
l
1
X
2
l
4
4
X
2
4
4
l
3
3
X
2
3
3
l
2 2
X
2
l
1
X
l
4
4
X
2
4
4
l
3
3
X
2
3
3
l
2 2
X
2
l
1
X
+
(
(

+ + + +

(
(

+ + + + +
+
(
(

+ + + +

(
(

+ + + + = + Ln


Luego se tienen que desarrollar los cuadrados, los cubos, las cuartas
potencias para poder agrupar

2
l
4
4
X
2
4
4
l
3
3
X
2
3
3
l
2
2
X
2
l
1
X
...
n

4!
1

3!
1

2!
1

(
(
(

+ + + +

A B


El desarrollo del cuadrado da lugar a la expresin



110
( )
2
l
4
4
X
2
4
4
l
3
3
X
2
3
3
l
2
2
X
2
l
4
4
X
2
4
4
l
3
3
X
2
3
3
l
2
2
X
2
l
1
X
2
l
1
2
X
2
...
n

4!
1

3!
1

2!
1
...
n

4!
1

3!
1

2!
1

2
n

(
(
(

+ + + +
+
(
(
(

+ + + +


Se tiene
( )
( )

+
(
(

+
+ +
+ + + + = +
2
2
X
2
l l
1
2
5
5
X
5
l
3
l
1
2
4
4
X
4
l
2
l
1
2
3
3
X
3
2
l
1
2
X
2
l
4
4
X
2
4
4
l
3
3
X
2
3
3
l
2
2
X
2
l
1
X
n 2!


n 4!


n 3!

n 2

...
n

4!
1

3!
1

2!
1

Z 1 In
4


( ) ( ) ( ) + +
(

+ = +
l
2
l
1
l
3
3
X
2
3
3
2
l
1
l
2
2
X
2
l
1
X

n

3!
1

n

2!
1

Z 1 In


Volviendo a (32) y teniendo en cuenta lo anterior
( ) | | ( )
( ) + +
+
(

+ +

=
l
2
l
1
l
3
3
X
2
3
3
2
l
1
l
2
2
X
2
l
1
X X
x
t

n 3!
n

n 2!
n

n
n

n
M In

simplificando y reordenando:
( ) | |
( )
+

+ +

=
3
3
X
2
1
l
2
l
1
l
3 2
2
X
2
l
1
l
2 l
1
X X
x
t

n 3!

2!

n
M In trminos en
k
en k>3



111
Teniendo en cuenta que
l
1
X
= y que ( )
2
l
1
l
2
2
X
= :
( ) | | + +
(

=
2
2
X
2
X
X
x
X
x
t

2!

n
M In

( ) | |
2

M In
2
t
=
donde, los trminos
k
tienden a 0 cuando n


Entonces ( ) | |
2
2
u
u =

t
n
M In lim (35)

Es decir ( )
2
2
u
u e M lim
t
n
=

porque
2
2
2
2
u
u
= e In


Si se compara (35) con (18)
( ) | |
2
2
u
u =

t
n
M In lim
( )
2
2

Z
e M =

se observa que la funcin generatriz de momentos de la variable
aleatoria estndar t tiende a la funcin generatriz de momentos de la
distribucin normal estndar a medida que el tamao de la muestra
aumenta.

Este se puede expresar en el siguiente teorema: Si X es una variable
aleatoria con cualquier distribucin de probabilidad de media
X
y
desviacin estndar
X
, para la cual existe su funcin generatriz de
momentos, entonces la variable aleatoria X tiende asintticamente a la
distribucin normal de media
X
y desviacin estndar n
X
.
En el Teorema Central del Lmite radica la importancia de la distribucin
normal, ya que basta con que el tamao de la muestra sea
suficientemente grande, mayor a 30, para poder asegurar la buena
aproximacin de la distribucin de medias de la muestra a la distribucin

112
normal, independientemente de la propia distribucin que tenga la
poblacin de donde se extraigan las muestras.
Con los subincisos anteriores queda resuelto el problema de la
distribucin de probabilidad de las medias de las muestras, cuando estas
provienen de una poblacin normal o de una poblacin con cualquier
distribucin de probabilidad y el tamao de las muestras es grande. En
ambos casos se recurre a la distribucin normal.


4.3 Factor de correccin para poblaciones finitas
Las poblaciones pueden ser finitas o infinitas. Si de una poblacin finita
se obtienen muestras con reemplazo, puede considerarse tericamente
que la poblacin es infinita, ya que cualquier nmero de muestras pueden
obtenerse de la poblacin sin agotarla. Adems, para casi cualquier
propsito prctico, el muestreo de poblaciones finitas de tamao muy
grande puede considerase como muestreo de poblaciones infinitas.
De acuerdo al concepto de muestreo aleatorio, el muestreo sin reemplazo
de poblaciones finitas no conduce a muestras aleatorias, debido a que al
dejar permanentemente fuera el elemento ya extrado, influye en la
probabilidad de extraccin del siguiente; o sea, que las pruebas sucesivas
para obtener una muestra no son independientes. Esto no ocurre si la
poblacin es infinita.
Resumiendo lo anterior puede decirse que, para obtener muestras
aleatorias, el muestreo debe ser de cualquier tipo en poblaciones infinitas
y slo con reemplazo en poblaciones finitas, a excepcin del caso de
poder considerar a la poblacin infinita por ser de tamao muy grande.
Con respecto al teorema, cabe indicar que cuando la poblacin es finita y
el muestreo se realiza sin reemplazo, hay que incluir -en la determinacin
de o
X
- el valor del tamao de la poblacin, es decir,
1

=
N
n N
n
X
X
o
o
donde
1

N
n N
recibe el nombre de factor de correccin para poblaciones
finitas en muestreo sin reemplazo. Obsrvese que este factor de
correccin tiende a cero cuando N n .

Ej empl o. La vida til de los focos fabricados por una empresa tiene distribucin
normal de media 200 horas y desviacin estndar 25 horas. Calcular la
probabilidad de que la duracin media de 25 focos escogidos al azar sea superior
a 208 horas.
De acuerdo al enunciado del problema, la poblacin de las duraciones de los focos
de la empresa tiene distribucin normal de parmetros.
200 =
x
horas y 25 =
x
o horas
y puede considerarse que es de tamao infinito. Entonces, la distribucin de las
medias de las muestras tambin tendr distribucin normal de parmetros:

113
25 = n focos
200 = =
x
x
horas
5
25
25
= = =
n
x
x
o
o horas
Estandarizando la variable aleatoria X , se tiene
5
200
=

=
X
X
Z
x
x
o


Si , 208 = X 6 . 1
5
200 208
=

= z
Por lo tanto, la probabilidad de que la media de los 25 focos de la muestra tenga
un valor mayor a 208 horas valdr:
( ) ( ) 6 . 1 208 > = > z P X P
( ) 6 . 1 1 s = z P
9452 . 0 1 =
0548 . 0 =
Slo el 5.48% de los focos de la muestra tendrn una vida superior a las 208
horas, es decir, un solo foco.



Ej empl o. Los pesos de 600 ejes producidos en un torno tienen distribucin
normal de media 53 kg y desviacin estndar de 2.5 kg. Estos se empacan en
cajas de 10, las que soportan hasta 540 kg de peso. Si se envan 35 de estas
cajas, calcular cuntas cajas cabe esperar se rompan por exceso de peso.

La poblacin de pesos de los ejes tiene distribucin normal de acuerdo al
enunciado explcito del problema. Sus parmetros son:

, 600 = N , 53Kg
x
= Kg
x
5 . 2 = o

Como la poblacin es normal, la distribucin de medias de las muestras tambin
es normal, y sus parmetros valen;

10 = n Kg
x
x
53 = =

Kg
N
n N
n
x
x
785 . 0
1 600
10 600
10
5 . 2
1
=

=
o
o

Una caja de ejes se romper por exceso de peso, si el peso conjunto de los 10
ejes es mayor de 540 kg; y el peso conjunto de los 10 ejes es mayor de 540 kg si
el peso medio de los 10 ejes es superior a 54kg (540/10).


114
Entonces, se trata de calcular cuntas de las 35 muestras tienen media mayor de
54 kg, lo que se har por medio del clculo de la probabilidad ( ) 54 > X P , en
donde X tiene distribucin normal de media 53 y desviacin estndar 0.785.

Estandarizando 54 = X , se tiene
274 . 1
785 . 0
53 54
=

=
x
x
X
z
o



Por lo tanto,
( ) ( ) 274 . 1 54 > = > z P X P
( ) 274 . 1 1 s = z P
8987 . 0 1 =
1013 . 0 =
El 10.13% de las 35 cajas se rompern, o sea, de 3 a 4 cajas.



Ej empl o. Los tabiques comprimidos que se usan en una construccin tienen un
peso medio de 5.50 kg y una desviacin estndar de 0.85 kg. Estos se elevan en
lotes al lugar en donde se emplean por medio de una gra cuyo lmite de
seguridad es de 200 kg. Calcular el tamao mximo de los lotes de manera de
que la probabilidad de exceder el lmite de seguridad de la gra sea menor de
5%.

Como en el ejemplo anterior, se vuelve a tener una poblacin de pesos cuyos
parmetros son
Kg
x
50 . 5 = y Kg
x
85 . 0 = o
con distribucin de probabilidad desconocida.
La simple comparacin entre el peso de un tabique y el lmite de seguridad de la
gra, hace que los lotes de tabiques que se cargan den muestras de tamao
grande. Esto permite asegurar que la distribucin de medias de las muestras de
pesos de los tabiques es aproximadamente normal de parmetros
Kg
x
x
50 . 5 = = y
n n
x
x
85 . 0
= =
o
o
en donde slo se sabe que n es grande (mayor de 30).
El peso de la muestra de n tabiques excede el lmite de seguridad de la gra de
200 kg, si la media de la muestra es superior a 200/n. Se busca saber cul es el
tamao de la muestra del lote (cantidad de tabiques) que hace que el lmite de
seguridad sea superado. El problema se plantea como:
05 . 0
200
< |
.
|

\
|
>
n
X P
Estandarizando x resulta
n
X
X
z
x
x
85 . 0
50 . 5
=

=
o


Si
n
X
200
= ;

115
Entonces
n
n
z
85 . 0
50 . 5
200

=
n
n
85 . 0
50 . 5 200
=

De modo que
05 . 0
85 . 0
50 . 5 200 200
<
|
|
.
|

\
|
> = |
.
|

\
|
>
n
n
z P
n
X P
lo que es lo mismo 95 . 0
85 . 0
50 . 5 200
>
|
|
.
|

\
|
s
n
n
z P

De la tabla de probabilidades de la normal se obtiene que sta es efectivamente
mayor de 0.95 si el valor crtico de z es mayor o igual a 1.654.
Luego se obtiene
645 . 1
85 . 0
50 . 5 200
>

n
n

n n 398 . 1 50 . 5 200 >
Elevando ambos miembros al cuadrado
( ) ( )
2
2
n 398 1 n 50 5 200 . . >
n n n 955 . 1 25 . 30 2200 40000
2
> +
0 40000 955 . 2201 25 . 30
2
> + n n
Resolviendo la ecuacin se obtienen las races 34.86 y 37.93. Cada una de estas
races representa dos tamaos de muestras diferentes.



Si
n
n
z
85 . 0
50 . 5 200
s , cuando
645 . 1 93 . 37
645 . 1 86 . 34
s =
s =
z n
z n

Luego
95 . 0 ) 645 . 1 (
05 . 0 ) 645 . 1 (
= <
= <
z P
z P

Se busca que el tamao del lote no supere el lmite de seguridad de la gra fijado
en el 5%. Por esta razn, el tamao de muestra requerido es
86 . 34 s n






116

CASOS DE ESTUDI O, PREGUNTAS Y PROBLEMAS
Caso 4.1: Edades y estaturas del curso Inferencia Estadstica.
El tema de estudio es la distribucin de las edades y las estaturas en el
curso de Inferencia Estadstica del presente ciclo lectivo.

El objetivo general es conocer las medidas antropomtricas de la
poblacin; especficamente se busca hallar la media de estatura y la
media de edad, adicionalmente utilizar la teora de distribuciones en el
muestreo para inferir datos a la poblacin.

Se parte de las siguientes premisas:
-la existencia de datos extremos en la muestra aumenta la dispersin
de la media
-a medida que aumenta el nmero de muestras, la media de las
muestras tiende a la media de la poblacin
Para realizar este estudio se debe:
a) Generar una tabla de datos de n observaciones por 2 variables
cuantitativas; donde. la unidad de observacin sean los alumnos
de Inferencia Estadstica, y las variables su respectivas edad y
estatura.
b) Cada alumno debe 1.seleccionar cinco muestras de tamao cinco.
2.calcular la media de cada muestra
3.calcular la media de las cinco muestras
c) Generar una tabla con las medias de cada una de las cinco
muestras generadas por cada alumno, el nmero de observaciones
de esta tabla ser nx5, y calcular la media de las medias.
d) Generar una tabla con la media de cada alumno, el nmero de
observaciones de esta tabla ser n, y calcular la media de las
medias.
e) En la tabla generada en a), calcular la media de la poblacin.
f) Comparar las medias obtenidas en c), d) y e).







117

Problemas
4.1. Las calificaciones de examen final de un curso de introduccin a la
estadstica, tiene distribucin normal con una media de 73 y una
desviacin estndar de 8.
1. cul es la probabilidad de obtener cuando mucho una
calificacin de 91, en este examen?
2. qu porcentaje de estudiantes calific entre 65 y 89?
3. qu porcentaje de estudiantes calific entre 81 y 89?
4. cul debe ser la calificacin final del examen, si solo el 5% de
los estudiantes examinados tuvieron calificacin ms alta?
El profesor decide aprobar al 10% de los alumnos que tengan la
mayor nota, sin que importe su calificacin.
5. El alumno que haya obtenido una calificacin de 81 en este
examen, aprueba o no?.
Con una calificacin de 68 en un examen en que la media es 62 y la
desviacin es 3,
6. el alumno aprueba o no?.
7. Cul de las dos situaciones es ms conveniente para el
alumno? Mestrelo estadsticamente y explquelo.



Bi bl i ogr af a
o Berenson, M. y Levine, D. (1996) Estadstica Bsica en Administracin.
Prentice Hall. Mxico.
o Daniel, W.W. (1999) Bioestadstica, base para el anlisis de las ciencias de
la salud. Tercera Edicin. Editorial Limussa. Mxico.
o Dixon W.J. y Massey F.J. (1957) Introduction to Statistical Analysis. Nueva
York, McGraw-Hill.
o Hernndez Sampieri, R.; Fernndez Collado, C. y Baptista Lucio, P. (2000)
Metodologa de la Investigacin. Segunda Edicin. McGraw Hill. Mxico.
o Kazmier, L. y Diaz Mata, A. (1993) Estadstica Aplicada a la Administracin
y a la Economa. Mc.Graw Hill. Mxico.
o Kinnear, T. Taylor, J. (1993) Investigacin de Mercados. Un enfoque
aplicado. Mc.Graw Hill.
o Mao, J.C.T. (1980) Anlisis Financiero. El Ateneo. Buenos Aires.
o Mendenhall, W. Wackerly, D. Scheaffer, R. (1990) Estadstica Matemtica
con Aplicaciones. Grupo Editorial Iberoamerica. 2Edicin.
o Meyer, P.L. (1973) Probabilidad y Aplicaciones Estadsticas. Fondo
Educativo Interamericano. Mxico.

118
o Padua, J. (1996) Tcnicas de Investigacin Aplicadas a las Ciencias
Sociales. Fondo de Cultura Econmica. Mxico.
o Tramutola, C.D. Modelos Probabilsticos y Decisiones Financieras.
E.C.Moderna. Lectura de Administracin de Empresas. Capital Federal.

Вам также может понравиться