Вы находитесь на странице: 1из 16

6.

DISTRIBUCIONES
MUESTRALES

CONTENIDO

6 DISTRIBUCIONES MUESTRALES ........................................ 127


6.1 INTRODUCCION................................................................................... 127

6.2 PARMETROS Y ESTADSTICOS ...................................................... 128

6.3 DISTRIBUCIN DEL PROMEDIO MUESTRAL ................................... 129

6.4 DISTRIBUCIN DE LA FRECUENCIA RELATIVA ............................. 135

6.5 DISTRIBUCION DE LA VARIANZA MUESTRAL................................. 136

6.6 EJERCICIOS PROPUESTOS ............................................................... 137

APNDICE..................................................................................................... 139
DISTRIBUCIONES MUESTRALES 127

6 DISTRIBUCIONES MUESTRALES

6.1 INTRODUCCIN

En el captulo 1 hemos definido la inferencia estadstica como un proceso que usa


informacin proveniente de la muestra para generalizar y tomar decisiones acerca de toda la
poblacin en estudio. Sin embargo, hasta el momento hemos trabajado la muestra y la
poblacin por separado.
En el captulo 2, trabajamos herramientas tiles en el anlisis exploratorio de los datos
provenientes de una muestra, tanto grficos como resmenes numricos para extraer
informacin de inters para la inferencia. Hablamos de distribuciones de frecuencias y
estadsticos.
En los captulos 3, 4 y 5, a travs del lenguaje de la probabilidad, tratamos los modelos para
las poblaciones que pueden ser de inters, sobre las cuales nos interesa sacar conclusiones, o
tomar una decisin. Definimos las variables aleatorias, sus distribuciones de probabilidad,
parmetros y algunos modelos frecuentes.
Podemos hacer un cuadro comparativo entre caractersticas del anlisis exploratorio de datos y
de la inferencia estadstica:

Anlisis exploratorio de datos Inferencia estadstica

Su objetivo es la exploracin de los datos Su objetivo es responder preguntas


muestrales, en busca de regularidades concretas sobre la poblacin, planteadas
interesantes. antes de la obtencin de los datos.

Las conclusiones slo se aplican a las Las conclusiones se extienden a toda la


unidades de anlisis y a las circunstancias poblacin en estudio.
para las cuales se obtuvieron los datos.

Las conclusiones se basan en lo que Las conclusiones se explicitan con un grado


vemos en los datos. de confianza.

Muchas de las tcnicas utilizadas en inferencia exigen, tambin, que la distribucin de los datos
tenga determinadas caractersticas. El anlisis de datos es de gran ayuda en este aspecto,
para descubrir observaciones atpicas y otras desviaciones que puedan perturbar una correcta
inferencia. Por lo tanto, en la prctica podemos observar cmo el anlisis exploratorio de los
datos y la inferencia estadstica se complementan.

Como se mencion en el captulo I, muy frecuentemente es necesario seleccionar una muestra


de unidades de la poblacin, para extraer conclusiones respecto de la misma, en base a las
observaciones muestrales (ver Muestra, pag. 7).

Sintetizando:
Cuando el inters reside en generalizar las conclusiones de los resultados observados a la
poblacin en estudio o queremos tomar una decisin sobre la poblacin en base a una
muestra, estamos frente a un problema de inferencia estadstica.
Para que este proceso sea adecuado, debemos tener en cuenta:

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 128

Plantear claramente el problema.


Delimitar la poblacin en estudio1
Definir si el objetivo reside en estimar el valor de un parmetro desconocido de la
poblacin (por ej. , , p) a partir de un estadstico calculado con los datos de una
muestra o decidir sobre valores hipotticos que asignamos a dichos parmetros.
Hacer un correcto diseo para la obtencin de los datos muestrales 2. Los resultados de
las tcnicas para la inferencia que se utilizarn slo sern vlidos si la muestra es
obtenida por mtodos aleatorios, que son los mtodos que dan confianza de
seleccionar muestras representativas de la poblacin. Un buen diseo para la
obtencin de los datos, es la mejor garanta de que la inferencia tenga valor.
Tener en cuenta y verificar los requerimientos de las tcnicas a aplicar

6.2 PARMETROS Y ESTADSTICOS

Un parmetro es un nmero que describe algn aspecto de la poblacin en estudio. En la


prctica, en la mayora de los casos (poblacin infinita, pruebas destructivas, etc) el valor del
parmetro es desconocido.
Un estadstico es un nmero que se calcula a partir de los datos muestrales. Si se lo utiliza
para estimar un parmetro desconocido, se lo conoce con el nombre de estimador.
El objetivo de este captulo y los prximos es desarrollar el por qu y cmo se utilizan los
estadsticos para estimar a los correspondientes parmetros.
Tengamos en cuenta que el valor del parmetro es fijo, mientras que el valor de un estadstico
est en funcin de la muestra seleccionada y por lo tanto podr variar de una muestra a otra.
Si de alguna manera, pudiramos medir la precisin de este proceso, es decir, si pudiramos
evaluar si el valor del estadstico va a estar cerca del valor del parmetro correspondiente, para
cualquier muestra extrada de la poblacin, entonces estaramos en condiciones de hacer
buenas inferencias. Es aqu donde la tcnica de muestreo y el tamao de la muestra juegan
un papel fundamental.
Como se mencion en el captulo I, pag. 8 trabajaremos con muestras aleatoria simples, en
donde cada elemento de una muestra de tamao n es una variable aleatoria, siendo X1, X2,
Xn, variables independientes entre s3.
Slo cuando se utiliza el azar para escoger los elementos que conforman una muestra,
podemos describir cmo vara el estadstico. Al obtener de forma repetida de una poblacin
distintas muestras del mismo tamao, podemos encontrar la distribucin muestral del
estadstico, como veremos seguidamente.

1
As, por ej., si se quiere analizar cierta caracterstica de los alumnos que cursaron en la Fac. Reg. Rosario de la
UTN en los aos 2005 y 2006 y la muestra se elige seleccionando alumnos al azar solamente de los que cursaron
durante esos aos en ISI, las conclusiones que se extraigan a partir de esta muestra sern vlidas slo para la
poblacin de los alumnos de ISI, pero no para todos los alumnos de la Fac. Reg. Rosario.
2
Ya hemos dicho que en el curso slo se trabajar con muestras aleatorias simples.
3
En el caso de poblaciones finitas, el muestreo debe ser con reposicin para que la ocurrencia de una observacin
no aumente o disminuya la probabilidad de ocurrencia de otra (ver ej. 1 y 2, pag. 58, Cap. III)

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 129

Denominamos variabilidad muestral al hecho de que el valor de un estadstico vara en un


muestreo aleatorio repetido. Para comprenderlo podemos recurrir a la teora de la probabilidad
o la simulacin a partir de un ejemplo sencillo, como el que se plantea a continuacin.

6.3 DISTRIBUCION DEL PROMEDIO MUESTRAL


Consideramos:
V Variable aleatoria X: edad de hermanos de una familia, en aos
Tamao de la poblacin N=4
Espacio muestral Sx = {2, 4, 6, 8}
Distribucin de probabilidad Uniforme discreta

Distribucin de Probabilidad de X
Tabla 1
x P(X=x) 0,30

2 0,25 0,25

Probabilidad
0,20
4 0,25
0,15
6 0,25
0,10
8 0,25
0,05
1 0,00
2 4 6 8

Parmetros: Esperanza Matemtica x = 5 x: edad en aos

Varianza 2x = 5

V Tomamos muestras de tamao 2, con reposicin. Cada muestra es de la forma (x1 ; x2),
donde:
Tabla 2
Xi es el i-simo elemento de la muestra. Muestra, n=2
x1 x2 Promedio
Simbolizaremos con x al promedio muestral y con S al desvo estndar 2 2 2
de la muestra.
2 4 3
2 6 4
En la tabla 2 estn todas las posibles muestras con sus
2 8 5
correspondientes promedios.
4 2 3
4 4 4
Observamos que tanto el primer elemento de la muestra como el 4 6 5
segundo son variables aleatorias, ya que, antes de realizar el muestreo, 4 8 6
no sabemos qu valores tomarn. Si consideramos la distribucin de 6 2 4
probabilidad de cada una de ellas, resultan idnticas a la distribucin de
6 4 5
probabilidad de la poblacin de la cual fueron extradas las muestras,
6 6 6
siendo por lo tanto, iguales los parmetros estadsticos:
6 8 7
xi = 5 y 2xi = 5 8 2 5
8 4 6
En la tabla 2, tambin se visualiza que el promedio muestral es una 8 6 7
variable aleatoria. 8 8 8

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 130

Consideramos ahora esta nueva variable aleatoria

X : edad promedio de 2 hermanos elegidos al azar de entre los 4, con reposicin.

Como podemos observar en la Tabla 2, para la variable X :


Espacio muestral S x = {2, 3, 4, 5, 6, 7, 8}
La distribucin de probabilidad es:
Distribucin del promedio muestral, n=2
Tabla 3: n=2
x Probabilidad 0,30

2 0,0625 0,25

Probabilidad
3 0,1250 0,20

4 0,1875 0,15

5 0,2500 0,10

0,05
6 0,1875
0,00
7 0,1250
2 3 4 5 6 7 8
8 0,0625
1,0000 Prom edio de la m uestra de tam ao 2

Parmetros: Esperanza Matemtica x = 5


Varianza x2 = 2.5

Observemos que la distribucin del promedio adopta una forma completamente distinta de
la distribucin uniforme de los datos de origen.

V Repitiendo la experiencia, con muestras de tamaos 3, 4 y 5 respectivamente, obtenemos


las distribuciones de los promedios que mostramos a continuacin, acompaadas de las
grficas respectivas:

n=3 n=4 n=5


Promedio Probabilidad Promedio Probabilidad Promedio Probabilidad
2,00 0,015625 2 0,00390625 2 0,00097656
2,67 0,046875 2,5 0,01562500 2,4 0,00488281
3,33 0,093750 3 0,03906250 2,8 0,01464844
4,00 0,156250 3,5 0,07812500 3,2 0,03417969
4,67 0,187500 4 0,12109375 3,6 0,06347656
5,33 0,187500 4,5 0,15625000 4 0,09863281
6,00 0,156250 5 0,17187500 4,4 0,13183594
6,67 0,093750 5,5 0,15625000 4,8 0,15136719
7,33 0,046875 6 0,12109375 5,2 0,15136719
8,00 0,015625 6,5 0,07812500 5,6 0,13183594
1 7 0,03906250 6 0,09863281
7,5 0,01562500 6,4 0,06347656
8 0,00390625 6,8 0,03417969
1 7,2 0,01464844
7,6 0,00488281
8 0,00097656
1

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 131

0,30
Distribucin del promedio muestral, n=2

0,25

Probabilidad
0,20

0,15

0,10
0,05

0,00
2 3 4 5 6 7 8
Prom edio de la m uestra de tam ao 2

0,20 Distribucin del promedio muestral, n=3

0,15
Probabilidad

0,10

0,05

0,00
2,00 2,67 3,33 4,00 4,67 5,33 6,00 6,67 7,33 8,00
Prom edio de la m ue stra de tam ao 3

Distribucin del promedio muestral, n=4


0,20

0,15
Probabilidad

0,10

0,05

0,00
2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8
Prom e dio de la m ue stra de tam ao 4

0,20
Distribucin del promedio muestral, n=5

0,15
Probabilidad

0,10

0,05

0,00
2 2,4 2,8 3,2 3,6 4 4,4 4,8 5,2 5,6 6 6,4 6,8 7,2 7,6 8
Promedio de la m uestra de tam ao 5

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 132

En las grficas anteriores podemos comprobar una aplicacin del Teorema Central del Lmite:
a medida que aumenta el tamao de la muestra la distribucin de probabilidad del promedio
muestral se hace cada vez ms acampanada, concentrndose alrededor del promedio de la
poblacin original.
Tabla 4
La Tabla 4 permite comparar los parmetros esperanza
matemtica y varianza de la poblacin original, con la Poblacin x =5 x2 = 5
esperanza matemtica y varianza de las poblaciones de Tamao de
los promedios muestrales antes descriptas. muestra x x2
2 5 2,5
Vemos que las medias poblacionales se mantienen
3 5 1,667
iguales a 5 (la esperanza matemtica de las edades de
los 4 hermanos), mientras que las varianzas 4 5 1,25
poblacionales disminuyen su valor a medida que 5 5 1
aumenta el tamao de la muestra.

Al considerar la distribucin de los valores tomados por el estadstico X en todas las muestras
de un mismo tamao n de la misma poblacin, obtenemos la distribucin muestral de X .

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 133

Generalizando:

Distribucin muestral de la media muestral X

Si las muestras aleatorias simples de tamao n son tomadas de una poblacin con
media poblacional y desvo estndar poblacional , la distribucin muestral de
X tiene las siguientes propiedades:


1) x = E( X ) =

Es decir, el promedio de todos los posibles valores de X es igual al parmetro



2) x =
n
Cuando el tamao de la muestra aumenta, la medida de dispersin disminuye. Es
decir, a medida que el nmero de observaciones obtenidas aumenta, el promedio
de los valores observados se acerca ms y ms a (Ley de los grandes
nmeros)
3) Si la poblacin de la cual se extraen las muestras es normal,
la distribucin de X es tambin normal con media y desvo como los dados en los
puntos anteriores, para cualquier tamao muestral n.

4) Si la poblacin de la cual se extraen las muestras no es normal,
pero el tamao muestral es suficientemente grande, la distribucin de X es
aproximadamente normal con media y desvo como los dados en los puntos
anteriores. Suficientemente grande en la prctica significa un tamao de muestra n
30 (Teorema Central del Lmite).
El tamao n de la muestra, necesario para que X se aproxime a una distribucin
normal depende de la distribucin de la poblacin. En el caso de que las muestras
se extraigan de una poblacin uniforme son suficiente 6 observaciones para que la
distribucin del promedio muestral sea aproximadamente normal.

5) Si la poblacin de la cual se extraen las muestras es normal,
con media poblacional y desvo estndar poblacional , pero sta es
desconocida, se reemplaza por S (desvo estndar muestral) y la estadstica
(x )
deja de tener distribucin normal estandarizada y tiene una distribucin t
S/ n
(a)
Student con n-1 grados de libertad :
(X )
t n 1;
S/ n

(Ver demostraciones en el Apndice)

(a)
La apariencia general de la distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas
y unimodales y el valor mximo de la ordenada se alcanza en la media = 0. Sin embargo esta distribucin tiene
colas ms amplias que la normal. Existe una distribucin t distinta para cada tamao de muestra. Una distribucin t
viene determinada por un parmetro llamado grados de libertad. A medida que aumentan los grados de libertad, la
curva de densidad t se parece ms a la curva de la N(0,1), ya que la estimacin de por s se va haciendo ms
precisa.

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 134

La propiedad 1 indica que el estimador X es insesgado, ya que el centro de su


distribucin muestral es igual al valor del parmetro poblacional correspondiente.

La propiedad 2 hace a la variabilidad o precisin del estimador y vemos que a medida


que el tamao muestral crece la precisin del estimador es mayor, ya que la variacin
alrededor del parmetro desconocido disminuye (propiedad de convergencia). Si la
distribucin de un estadstico muestra valores muy alejados, se dice que carece de
precisin.

Idealmente buscamos un estimador que cumpla estas dos propiedades: que sea insesgado y
convergente4:

Un estadstico es insesgado si el centro de su distribucin muestral es igual al


valor del parmetro poblacional correspondiente.

Un estadstico es convergente si su desviacin estndar disminuye a medida


que el tamao de muestra crece.

El estadstico X , por poseer estas propiedades, es un buen estimador de .


Estas propiedades tambin se cumplen para la proporcin muestral o frecuencia relativa ( fr ) y
la varianza muestral ( S n2 1 ), siendo por lo tanto respectivamente, buenos estimadores de la
proporcin poblacional (p) y varianza poblacional ( 2 ), como veremos en los puntos 6.4 y 6.5.-

En general, la notacin que utilizaremos para los estimadores es la siguiente:

Parmetro Estimador
= X
p p = fr

2 2 = Sn2 -1

4
Estas condiciones permiten controlar los errores de estimacin al aumentar el tamao de la muestra, como
veremos ms adelante.

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 135

6.4 DISTRIBUCION DE LA FRECUENCIA RELATIVA o PROPORCIN


MUESTRAL

El estadstico p = f r es un buen estimador del parmetro p (proporcin poblacional o


probabilidad).
Si simulramos tomar muchas muestras de igual tamao y en cada una de ellas calculramos
la proporcin de veces que ocurre un suceso A, hallaramos:

La distribucin de la proporcin muestral es aproximadamente normal 5


Su media se encuentra cerca de la proporcin poblacional p
Su desviacin estndar se hace menor a medida que el tamao de la muestra se hace
mayor.

Generalizando:

Distribucin muestral de la p = f r (proporcin muestral)

Si de una poblacin donde p representa la proporcin de elementos que tienen


cierta caracterstica A, se toman muestras aleatorias simples de tamao n, la
distribucin muestral de la proporcin muestral o frecuencia relativa ( p = f r ) de las
veces que ocurre A en n, tiene las siguientes propiedades:

1) E (fr) = p
Es decir, el promedio de todos los posibles valores de fr es igual al parmetro p.

) p(1 p )

2) p) = Var(p ) =
n
Cuando el tamao de la muestra aumenta, la medida de dispersin disminuye. Es
decir, a medida que el nmero de observaciones obtenidas aumenta, el promedio
de los valores observados se acerca ms y ms a p (Ley de los grandes nmeros).
Observe que para un tamao de muestra fijo, la mxima desviacin estndar se
encuentra en p = 0,5


3) Si n es suficientemente grande (b), la distribucin de p = f r
se comporta aproximadamente como una distribucin normal con media y
desviacin estndar como las dadas en los puntos 1 y 2.
) p(1 - p)
p es aproximada mente N p;
n

(Ver demostraciones en el Apndice)

5
Para poder aproximar la distribucin Binomial a la Normal, el tamao de muestra n debe ser suficientemente
grande. Como regla emprica esta aproximacin es apropiada si np > 5 (Cap. 4).

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 136

6.5 DISTRIBUCION DE LA VARIANZA MUESTRAL

El estadstico S n2 1 es un buen estimador del parmetro 2 (varianza poblacional).6


Si simulramos tomar muchas muestras de igual tamao y en cada una de ellas calculramos
la varianza muestral, hallaramos:
La media de la varianza muestral se encuentra cerca de la varianza poblacional
2

Su desviacin estndar se hace menor a medida que el tamao de la muestra se hace


mayor.

Generalizando:

Distribucin muestral de la S 2 (varianza muestral)

Si de una poblacin se toman muestras aleatorias simples de tamao n, la


distribucin muestral de la varianza muestral S n2 1 , tiene las siguientes propiedades:


1) E ( S2 ) = 2

Es decir, el promedio de todos los posibles valores de S n2 1 es igual al parmetro 2

24

2) V(S 2 ) = S2 2 =
n -1
Cuando el tamao de la muestra aumenta, la medida de dispersin disminuye. Es
decir, a medida que el nmero de observaciones obtenidas aumenta, el promedio de
los valores observados de S2 se acerca ms y ms a 2 (Ley de los grandes
nmeros).

3) Si la poblacin de la cual se extraen las muestras es normal,
2
(n 1) S
la variable tiene una distribucin ji cuadrado ( 2 ) con n - 1 grados de
2
libertad (b):
(n 1) S 2
n2 -1
2


4) Si n es suficientemente grande, la distribucin de la variable
2
se ve como una distribucin normal con media y desviacin estndar como las
dadas en los puntos 1 y 2.

(Ver demostraciones en el Apndice)

(b)
Las distribuciones ji cuadrado son una familia de distribuciones que slo toman valores positivos y que son
asimtricas hacia la derecha. Una distribucin ji cuadrado viene determinada por un parmetro llamado grados de
libertad. A medida que aumentan los grados de libertad, las curvas de densidad son menos asimtricas y por lo
tanto, los valores mayores son ms probables.

6 2
Utilizaremos la notacin S para identificar a la variable Sn2-1 (varianza muestral).

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 137

En este material hemos tratado el comportamiento de las distribuciones muestrales de algunos


estimadores cuando se toman muestras aleatorias simples.

Se analiz que si el tamao de muestra es ms grande, la distribucin de estos estimadores


tiende a centrarse ms y ms alrededor del valor del parmetro que se quiere estimar.

En la prctica no se conocer el verdadero parmetro poblacional (por eso la estimacin) y se


tomar una sola muestra (no muchas como cuando se simul la distribucin del promedio
muestral), pero son las propiedades (insesgado y convergencia) las que garantizan que cuando
la muestra que se toma sea grande habr una alta probabilidad de que el valor que toma el
estimador (estimacin) est cerca del verdadero valor del parmetro que se quiere estimar.

6.6 EJERCICIOS PROPUESTOS 7

1.- El 9 % de los individuos de una regin tiene sangre tipo B. En una muestra simple al azar de
400 personas de esa poblacin se encontr que 12,5 % tenan sangre tipo B.
a) Indique:
- valor numrico del parmetro: .
- valor numrico del estadstico: .
- identifique en trminos del problema al parmetro y al estadstico
b) Cul es la probabilidad de que una nueva muestra aleatoria de tamao 400 contenga
por lo menos un porcentaje de 12,5 % de personas con sangre tipo B?
2.- Considere la variable aleatoria X: peso de alumnos varones de UTN, FRRO.
Se conoce que esta variable tiene una distribucin normal con promedio 75 kg y una
desviacin estndar de 7 kg.
a) Grafique y compare las distribuciones muestrales de X cuando se extraen muestras
aleatorias simples de:
* 10 alumnos * 30 alumnos * 100 alumnos
b) Cul es la proporcin de muestras de tamao 30 que arrojarn un valor del promedio
alejado del promedio poblacional en a lo sumo 2 desviaciones estndares?

3.- Suponga que el 60% de todos los estudiantes de la UTN, Reg. Rosario acceden a
informacin sobre cursos por medio de Internet.
a) Grafique en forma aproximada la distribucin para la posible proporcin muestral basada
en una muestra aleatoria simple de 100 estudiantes.
b) Cul es la probabilidad de observar una proporcin muestral de 0,50 basada en una
muestra aleatoria simple de tamao 100 si la proporcin poblacional fuese de 0,60?
Explique.

4.- Sea X el nmero de accidentes por semana en una esquina dada. Suponga que la media de
X es 2,2 y el desvo estndar de X es 1,4.
a) Sea X el nmero promedio de accidentes por semana en un ao, o sea, n= 52 semanas.
cul es la distribucin aproximada de la media muestral? Bosqujela.

7
Los ejercicios 1, 3 y 4 fueron extrados y adaptados del mdulo Nmero 7: Distribuciones muestrales de la
Coleccin Mtodos Estadsticos I., redactado por docentes de la UNR y extractado del libro Interactive Statistics
de Martha Aliaga, Universidad de Michigan, 2002.

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 138

b) cul es la probabilidad de que el promedio de accidentes por semana en un ao sea


menor que 2?
c) Cun probable es que el nmero total de accidentes por ao sea menor que 100?.
100
Sugerencia: P (Total < 100) = P (Promedio < ).
52
5.- Un contratista de obras viales ha tomado un contrato para construir una carretera de
hormign de 800 km. de longitud. La carretera a construir ser inspeccionada por vialidad
tomando muestras de tamao 9 por cada 5 km. construidos. El tramo de 5 km. se aceptar
sin objeciones si la media de los espesores de las 9 determinaciones supera 149 mm. En
este caso la ganancia para el contratista es de 5000$ en los 5 km.
Si el promedio de las 9 determinaciones de los espesores se encuentra entre 140 mm y 149
mm tambin se aprueba el tramo pero con una quita en el precio, obtenindose entonces
una utilidad de 2300$.
En cualquier otro caso se debe rehacer el tramo, lo que significa una prdida de 3000$.
La variable aleatoria espesor tienen distribucin normal con esperanza matemtica igual a
145 mm y desvo estndar igual a 15 mm.
Considere la variable aleatoria utilidad por tramo de 5 km. Encuentre su distribucin de
probabilidad, esperanza matemtica y varianza.
Cul es la probabilidad de que la construccin de los 800 km. d una utilidad inferior a
300.000$ si los espesores son independientes de tramo a tramo?

6.- Demuestre que X es un estimador consistente de mediante el empleo de la desigualdad


de Chebyshev (vea ley de los grandes nmeros en apndice)

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 139

APNDICE

1.- Promedio Muestral o Media Aritmtica


1 n
X= Xi
n 1
Siendo E(X) = y V(X) = 2
y teniendo una Muestra Aleatoria Simple de tamao n (X1, X2,..Xn),
2
entonces E( Xi ) = y V(Xi) = (estas condiciones fueron visualizadas en pag. 129 para
muestras de tamao 2).

1 n 1 n
1 n
1
Luego E ( X )= E [
n 1
Xi ] = E Xi =
n 1 n
E ( Xi) =
1 n
n =

1 n 1 n
1 n 1 1
V ( X )=V [
n 1
Xi ] = 2 V Xi = 2 VXi = 2 nV Xi = 2
n 1 n 1 n n

Con respecto a la distribucin la variable promedio muestral podemos decir:

a) Si la variable aleatoria X se distribuye normalmente, por propiedad reproductiva :



X N ,
n

b) Si la variable X tiene cualquier distribucin pero n 30 aplicando el Teorema Central del


Lmite, la distribucin aproximada es :

X N ,
n

2.- Proporcin Muestral o Frecuencia Relativa

Sea una experiencia aleatoria y un suceso A asociado a la misma. Se realizan n


repeticiones independientes de la experiencia. Se definen las variables:

nA : nmero de veces que ocurre A en las n repeticiones independientes de la experiencia

fA :proporcin de veces que ocurre A en las n repeticiones independientes de la experiencia


nA
siendo fA =
n
La variable aleatoria nA tiene distribucin binomial con E (nA) = n.p y 2 (nA) = n.p.(1-p)

p(1 p )
y en consecuencia E ( fA ) = p y 2 ( fA ) =
n

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 140

3.- Varianza muestral (S2)

En la pgina 135 se plantea, para el caso en que la variable X se distribuya normalmente, que:

E ( S2 ) = 2

24
V ( S2 ) = S2 2 =
n -1

A continuacin se demuestran ambas igualdades.

( X ) ( X ) 2
Si X N ( , ) N (0, 1) 2
21

y en consecuencia :

n
( Xi ) 2

=1 2
2n por propiedad reproductiva de la distribucin ji cuadrado

Se demuestra que:

n
( Xi X )2 (n 1) S 2

=1 2
2n-1 o en forma equivalente:
2
2n-1

Adems, para una variable 2n sus parmetros son E (2n) = n y V (2n) = 2 n

y en consecuencia para 2n-1 E (2n-1 ) = n 1 y V (2n-1) = 2(n1) (1)

Reemplazando en (1)

(n 1) S 2
E = ( n 1) E ( S2 ) = 2
2

(n 1) S 2 (n 1) 2 V(S 2 ) 2 4
V = = 2 ( n 1) V ( S2 ) =
2 4 (n 1)

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 141

4.- LEY DE LOS GRANDES NUMEROS

En el captulo 3 se dijo que despus de un gran nmero de repeticiones de una experiencia, la


proporcin de veces que ocurre un suceso en las n repeticiones (frecuencia relativa), se acerca
a la probabilidad de ese suceso. Esto se conoce como ley de los grandes nmeros y se
puede demostrar matemticamente a partir de las leyes de probabilidad 8.
Consideremos una experiencia aleatoria y un suceso A asociado a la misma. Se realizan
n repeticiones independientes de la experiencia y se definen las variables:
nA : nmero de veces que ocurre A en las n repeticiones de la experiencia
fA : proporcin de veces que ocurre A en las n repeticiones de la experiencia

nA
siendo f A =
n

Se conoce que P(A) = p se mantiene constante en las n repeticiones de la experiencia.


Se demuestra que para un nmero positivo :

p (1 - p)
P ( | fA p | < ) > 1 - 2 y lm P ( | f A p < ) = 1
n n

es decir, que cuando n tiende a infinito la frecuencia relativa tiende a la probabilidad ( definicin
frecuencial de probabilidad ).

Demostracin :

nA Bi ( n , p ) E ( nA ) = n p 2 ( nA ) = n p ( 1 p )

p (1 p)
y en consecuencia E ( fA ) = p 2 ( fA ) =
n

Aplicando la desigualdad de Tchebychev :

p (1 p) 1
P fA p k > 1 2 (1)
n k

p (1 p) n 2
Sea = k entonces k 2 =
n p (1 p)

Reemplazando en (1), se obtiene lo que se quera demostrar:

p (1 - p)
P ( | fA p | < ) > 1 - 2

n

8
La ley de los grandes nmeros se puede demostrar tambin a partir del comportamiento del promedio muestral. A
medida que el nmero de observaciones obtenidas aumenta, la media de los valores observados se acerca ms y
ms a .

G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso

Вам также может понравиться