Вы находитесь на странице: 1из 66

Distribuciones Fundamentales de

Muestreo y Descripciones de Datos


UCR ECCI
CI-1352 Probabilidad y Estadstica
Prof. M.Sc. Kryscia Daviana Ramrez Benavides
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 2
Muestreo Aleatorio
En este tipo de muestreo, todos los individuos de la poblacin
pueden formar parte de la muestra, tienen una probabilidad
positiva.
El resultado de un experimento estadstico se puede registrar
como un valor numrico o como una representacin
descriptiva.
Cuando se lanza un par de dados y el total es el resultado de inters,
se registra un valor numrico.
Cuando a los estudiantes de cierta escuela se les hace pruebas de
sangre y el tipo sanguneo es de inters, se registra una
representacin descriptiva.
En cualquier estudio, el nmero de observaciones posibles
puede ser pequeo, grande pero finito o infinito.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 3
Muestreo Aleatorio (cont.)
Una poblacin consiste en la totalidad de las observaciones en
las que se est interesado.
Conjunto de todos los elementos que cumplen una determinada
caracterstica.
Conjunto de todos los valores de una variable aleatoria.
Los elementos de la poblacin se llaman observaciones,
individuos o unidades estadsticas.
El nmero de observaciones en la poblacin se define como el
tamao de la poblacin.
El nmero total de observaciones puede ser finito o infinito.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 4
Muestreo Aleatorio (cont.)
La variable estadstica es una propiedad caracterstica de la
poblacin que estamos interesados en estudiar.
Tipos de variables estadsticas:
Cualitativa: No se expresa mediante un nmero. Por ejemplo, el tipo
sanguneo de los estudiantes de cierta escuela.
Cuantitativa: Se expresa mediante un nmero, hay dos tipos:
Cuantitativa Discreta: Slo admite valores aislados, toma un nmero
determinado de valores. Por ejemplo, el resultado total que se obtiene a
lanzar dos dados.
Cuantitativa Continua: Puede admitir cualquier valor dentro de un
intervalo, puede tomar cualquier valor entre los valores dados. Por
ejemplo, medir la presin atmosfrica cada da del pasado al futuro.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 5
Muestreo Aleatorio (cont.)
Una variable estadstica cualitativa se puede convertir a una
variable aleatoria discreta, para poner realizar su estudio y
anlisis.
Cada observacin en una poblacin es un valor de una
variable aleatoria X que tiene alguna distribucin de
probabilidad f(x).
Se puede hablar de poblacin binomial, poblacin normal, o en
general, la poblacin f(x), para referirse a una poblacin cuyas
observaciones son valores de una variable aleatoria que tiene una
distribucin binomial, una distribucin normal o una distribucin f(x).
Por lo tanto, la media y la varianza de una variable aleatoria o
distribucin de probabilidad tambin se les denomina la media y la
varianza de la poblacin correspondiente.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 6
Muestreo Aleatorio (cont.)
En el campo de la inferencia estadstica el estadstico se
interesa en llegar a conclusiones con respecto a la poblacin
cuando es imposible o poco prctico observar todo el conjunto
de observaciones que constituyen la poblacin.
La poblacin de una produccin de cierto producto, sera imposible
probar toda la produccin si se tienen que vender.
Los costos exorbitantes tambin pueden ser un factor prohibitivo para
estudiar toda la poblacin.
Por lo que se depende de un subconjunto de observaciones
para hacer inferencias con respecto a la poblacin.
Una muestra es un subconjunto de una poblacin.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 7
Muestreo Aleatorio (cont.)
Si se quiere inferencias vlidas a partir de la muestra para la
poblacin, se debe obtener muestras que sean representativas
de la poblacin.
Cualquier procedimiento de muestreo que produzca
inferencias que sobreestimen o subestimen de forma
consistente alguna caracterstica de la poblacin se dice que
est sesgado.
Para evitar cualquier posibilidad de sesgo en el procedimiento
de muestreo, es deseado elegir una muestra aleatoria en el
sentido de que las observaciones se realizan de forma
independiente y al azar.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 8
Muestreo Aleatorio (cont.)
Sean X
1
, X
2
, , X
n
variables aleatorias independientes, cada
una con la misma distribucin de probabilidad f(x). Se define
entonces a X
1
, X
2
, , X
n
como una muestra aleatoria de
tamao n de la poblacin f(x) y se escribe su distribucin de
probabilidad conjunta como
( ) ( ) ( ) ( )
n n
x f x f x f x x x f ... ,..., ,
2 1 2 1
=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 9
Algunos Estadsticos Importantes
El propsito principal al seleccionar muestras aleatorias es
obtener informacin acerca de los parmetros desconocidos de
la poblacin.
Por ejemplo, se quiere saber la proporcin de una poblacin
que toman una marca de caf determinada.
Aqu se podra preguntar a cada uno de los bebedores de caf de la
poblacin en cuestin, si toman la marca de caf.
En su lugar, se selecciona una muestra aleatoria grande y se calcula la
proporcin de personas que prefieren la marcad de caf.
El valor se utiliza ahora para hacer una inferencia con respecto a
la proporcin p verdadera.
p

UCR-ECCI CI-1352 Probabilidad y Estadstica


Distribuciones Fundamentales de Muestreo y Descripciones de Datos 10
Algunos Estadsticos Importantes (cont.)
Ahora, es una funcin de los valores observados en la
muestra aleatoria; como son posibles muchas muestras
aleatorias a partir de la misma poblacin, se espera que
variara algo de una muestra a otra.
Es decir, es un valor de una variable aleatoria que
representamos con P.
Tal variable aleatoria se llama estadstico, la cual se puede
definir como cualquier funcin de las variables aleatorias que
forman una muestra aleatoria.
p

UCR-ECCI CI-1352 Probabilidad y Estadstica


Distribuciones Fundamentales de Muestreo y Descripciones de Datos 11
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
Si X
1
, X
2
, , X
n
representan una muestra aleatoria de tamao
n, entonces la media de la muestra se define mediante el
estadstico
Si el estadstico X toma el valor
cuando X
1
toma el valor de x
1
, X
2
toma el valor de x
2
, y as
sucesivamente.
n
X X X
n
X
X
n
n
i
i
+ + +
= =

2 1
1
n
x x x
n
x
x
n
n
i
i
+ + +
= =

2 1
1
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 12
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
Si X
1
, X
2
, , X
n
representan una muestra aleatoria de tamao
n, acomodada en orden creciente de magnitud, entonces la
mediana de la muestra se define mediante el estadstico
( )
( )

+ =
+
+
par es si
2
impar es si
~
1 2 / 2 /
2 / 1
n
X X
n X
X
n n
n
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 13
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
Si X
1
, X
2
, , X
n
, no necesariamente diferentes, representan
una muestra aleatoria de tamao n, entonces la moda de la
muestra Mes aquel valor de la muestra que ocurre ms a
menudo o con mayor frecuencia.
La moda puede no existir, y cuando existe no necesariamente
es nica.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 14
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
La media de la muestra:
Es la medida de localizacin central ms comnmente utilizada en
estadstica.
Emplea toda la informacin disponible.
Las distribuciones de medias que se obtienen en muestreos repetidos
de una poblacin son bien conocidos, y en consecuencia los mtodos
que se utilizan en la inferencia estadstica para estimar se basan en
la media de la muestra.
La nica desventaja real, es que puede resultar afectada de manera
adversa por valores extremos.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 15
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
La mediana de la muestra:
Es fcil de calcular si el nmero de observaciones es relativamente
pequeo.
No resulta influida por valores extremos.
Al tratar con muestras que se seleccionan de poblaciones, las medias
de las muestras por lo general no variarn tanto de una muestra a otra
como las medianas. Por lo tanto, si se desea estimar el centro de una
poblacin con base en un valor de la muestra, la media es ms estable
que la mediana.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 16
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
La moda de la muestra:
Es la menos utilizada de las tres.
Para conjuntos pequeos su valor casi no tiene utilidad, si es que
existe.
Slo tiene sentido significativo en una gran cantidad de datos.
No requiere clculo, lo que se considera una ventaja.
Se puede usar para datos cualitativos como cuantitativos, lo que se
considera una ventaja.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 17
Algunos Estadsticos Importantes
Variabilidad en la Muestra (cont.)
Las medidas de localizacin central o posicin no dan por s
mismas una descripcin adecuada de los datos. Es importante
conocer cmo se dispersan las observaciones del promedio.
La variabilidad de una muestra juega un papel muy importante
en el anlisis de datos.
La variabilidad de un proceso y de un producto es un hecho real en
los sistemas cientficos y de ingeniera.
La variabilidad en valores de poblacin y datos de una muestra es un
hecho real.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 18
Algunos Estadsticos Importantes
Variabilidad en la Muestra (cont.)
El rango (recorrido o amplitud) de una muestra aleatoria X
1
,
X
2
, , X
n
, se define con el estadstico , donde
X
min
y X
max
son, respectivamente, las observaciones ms
grande y ms pequea de la muestra.
El rango falla al medir la variabilidad entre la observacin
superior y la inferior, pero tiene algunas aplicaciones tiles.
En la industria, el rango se puede determinar al especificar por
adelantado que una medicin particular de los artculos que
salen de una lnea de produccin deba caer dentro de cierto
intervalo.
min max
X X
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 19
Algunos Estadsticos Importantes
Variabilidad en la Muestra (cont.)
Si X
1
, X
2
, , X
n
representan una muestra aleatoria de tamao
n, entonces la varianza de la muestra se define mediante el
estadstico
El valor calculado de S
2
para una muestra dada se denota con
s
2
.
La varianza se define, esencialmente, como el promedio de los
cuadrados de las desviaciones de las observaciones de su
media.
( )
( )

=
n
i
i
n
X X
S
1
2
2
1
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 20
Algunos Estadsticos Importantes
Variabilidad en la Muestra (cont.)
Teorema. Si S
2
es la varianza de una muestra aleatoria de
tamao n, se puede escribir como
( ) 1
2
1 1
2
2

|
.
|

\
|

=

= =
n n
X X n
S
n
i
i
n
i
i
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 21
Algunos Estadsticos Importantes
Variabilidad en la Muestra (cont.)
La desviacin estndar de la muestra, que se denota con S,
es la raz cuadrada positiva de la varianza de la muestra.
La cantidad n 1 a menudo se denomina grados de libertad
asociados con la varianza estimada. Los grados de libertad
representan el nmero de piezas de informacin
independientes disponibles para calcular la variabilidad.
( )
( )

=
n
i
i
n
X X
S
1
2
1
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 22
Presentaciones de Datos y Mtodos Grficos
En la estadstica, con frecuencia se hace la suposicin de que
la distribucin es normal.
La informacin grfica con respecta a la validez de esta
suposicin se puede obtener de presentaciones como los
diagramas de tronco y hojas, y los histogramas de frecuencias.
A continuacin se introduce la nocin de grficas de
probabilidad normal y grficas de cuantiles.
Estas grficas se utilizan en estudios que tienen grados de
complejidad que varan, con el objetivo principal de que las grficas
proporcionen una verificacin diagnstica de la suposicin de que los
datos vienen de una distribucin normal.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 23
Presentaciones de Datos y Mtodos Grficos
(cont.)
Los estadsticos vistas anteriormente proporcionan medidas
simples, mientras que una representacin grfica agrega
informacin adicional en trminos de una imagen.
Las muestras mltiples se pueden comparar de forma grfica.
Las grficas de datos pueden sugerir relaciones entre variables.
Las grficas pueden ayudar en la deteccin de anomalas o de
observaciones de datos apartados en las muestras.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 24
Presentaciones de Datos y Mtodos Grficos
Grfico de Caja y Extensin (cont.)
Esta grfica encierra el rango intercuartil de los datos en una
caja que tiene la mediana representada dentro.
El rango intercuartil tiene como extremos el percentil 75
(cuartil superior) y el percentil 25 (cuartil inferior).
Adems, de la caja se prolongan extensiones, que muestran las
observaciones extremas en la muestra.
Para muestras razonablemente grandes, la presentacin
muestra el centro de la localizacin, la variabilidad y el grado
de asimetra.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 25
Presentaciones de Datos y Mtodos Grficos
Grfico de Caja y Extensin (cont.)
Una variacin que se llama grfica de caja puede
proporcionar a quien la ve informacin con respecto a cuales
observaciones son datos apartados.
Los datos apartados son observaciones que se consideran
inusualmente alejadas de la masa de datos.
Tcnicamente, se puede considerar un dato apartado como una
observacin que representa un evento raro; es decir, existe una
probabilidad pequea de obtener un valor tan alejado de la masa de
datos.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 26
Presentaciones de Datos y Mtodos Grficos
Grfico de Caja y Extensin (cont.)
Ejemplo. Los valores de nicotina de 40 cigarrillos son:
1,09 1,92 2,31 1,79 2,28
1,74 1,47 1,97 0,85 1,24
1,58 2,03 1,70 2,17 2,55
2,11 1,86 1,90 1,68 1,51
1,64 0,72 1,69 1,85 1,82
1,79 2,46 1,88 2,08 1,67
1,37 1,93 1,40 1,64 2,09
1,75 1,63 2,37 1,75 1,69
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 27
Presentaciones de Datos y Mtodos Grficos
Grfico de Caja y Extensin (cont.)
Se tienen las siguientes estadsticas:
Descriptive Statistics
40 1,83 ,72 2,55 1,7743 ,39046 ,152 Valores de Nicotina
N Range Minimum Maximum Mean Std. Deviation Variance
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 28
Presentaciones de Datos y Mtodos Grficos
Grfico de Caja y Extensin (cont.)
0,80 1,20 1,60 2,00 2,40 2,80
Valores de Nicotina
A A A
Grfica de Caja y Extensin
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 29
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles (cont.)
El propsito de estas grficas es describir, en forma de
muestra, la funcin de distribucin acumulada que se present
en captulos anteriores.
Un cuantil de una muestra, q(f), es un valor para el que una
fraccin especfica f de los valores de los datos es menor que o
igual a q(f).
Un cuantil representa una estimacin de una caracterstica de
una poblacin, o ms bien, la distribucin terica.
La mediana de la muestra es q(0.5), el cuartil superior
(percentil 75) es q(0.75) y el cuartil inferior (percentil 25) es
q(0.25).
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 30
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles (cont.)
Una grfica de cuantiles simplemente grafica los valores de
los datos en el eje vertical contra una evaluacin emprica de
la fraccin de observaciones excedidas por los valores de los
datos.
Para la propsitos tericos esta fraccin se calcula con
donde i es el orden de las observaciones cuando se clasifican
de inferior a superior.
4
1
8
3
+

=
n
i
f
i
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 31
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles (cont.)
A diferencia de la grfica de caja y extensin, la grfica de
cuantiles realmente muestra todas las observaciones.
Todos los cuantiles, incluida la mediana y los cuantiles
inferior y superior, se pueden aproximar de forma visual.
Las indicaciones de agrupaciones relativamente grandes
alrededor de valores especficos se indican por pendientes
cercanas a cero, mientras que los datos dispersos en ciertas
reas producen pendientes ms abruptas.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 32
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles-Cuantiles Normales (cont.)
La grfica de cuantiles-cuantiles normales toma ventaja de lo
que se conoce acerca de los cuantiles de la distribucin
normal.
La metodologa incluye una grfica de los cuantiles empricos
recin presentados contra el cuantil correspondiente de la
distribucin normal.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 33
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles-Cuantiles Normales (cont.)
La expresin para un cuantil de una variable aleatoria N(,)
es muy complicada. Una buena aproximacin est dada por:
La expresin para un cuantil de una variable aleatoria N(0,1)
es:
( ) ( ) | | { }
14 . 0
14 . 0
,
1 91 . 4 f f f q + =

( ) ( ) | | { }
14 . 0
14 . 0
1 , 0
1 91 . 4 f f f q =
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 34
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles (cont.)
La grfica de cuantiles-cuantiles normales es una grfica de
y
(i)
(observaciones ordenadas) contra q
0,1
(f
i
), donde
Una relacin cercana a una lnea recta sugiere que los datos
provienen de una distribucin normal.
La interseccin en el eje vertical es una estimacin de la media
de la poblacin y la pendiente es una estimacin de la
desviacin estndar.
4
1
8
3
+

=
n
i
f
i
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 35
Distribuciones Muestrales
La distribucin de probabilidad de un estadstico se llama
distribucin muestral.
Esta distribucin depende del tamao de la poblacin, el
tamao de las muestras y el mtodo de eleccin de las
muestras.
Existen distribuciones muestrales de X y S
2
, que son el
mecanismo a partir del cual se hace inferencias de los
parmetros y
2
.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 36
Distribuciones Muestrales (cont.)
La distribucin muestral de X con tamao muestral n es la
distribucin que resulta cuando un experimento se lleva a cabo
una y otra vez y resultan los diversos valores de X.
Esta distribucin muestral describe la variabilidad de los promedios
muestrales alrededor de la media de la poblacin .
Se aplica el mismo principio en el caso de la distribucin de
S
2
.
Esta distribucin produce informacin acerca de la variabilidad de los
valores de s
2
alrededor de
2
en experimentos que se repiten.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 37
Distribuciones Muestrales de Medias
Suponga que se tiene una muestra aleatoria de n observaciones
que se toma de una poblacin normal con media y varianza

2
.
Cada observacin X
i
, i = 1, 2, , n, de la muestra aleatoria
tendr entonces la misma distribucin normal que la poblacin
que se muestrea.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 38
Distribuciones Muestrales de Medias (cont.)
Teorema. Si X
1
, X
2
, , X
n
son variables aleatorias
independientes que tienen distribuciones normales con medias

1
,
2
,
n
y varianzas
1
2
,
2
2
,
n
2
respectivamente,
entonces la variable aleatoria
tiene una distribucin normal con media
y varianza
n n
X a X a X a Y + + + = ...
2 2 1 1
n n Y
a a a + + + = ...
2 2 1 1
2 2 2
2
2
2
2
1
2
1
2
...
n n Y
a a a + + + =
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 39
Distribuciones Muestrales de Medias (cont.)
Segn el teorema donde se establece la propiedad reproductiva
de la distribucin normal, se concluye que
tiene distribucin normal con media y varianza
n
X X X
X
n
+ + +
=
...
2 1
n n n
X X
2
2
2 2 2
2
... ...


=
+ + +
= =
+ + +
=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 40
Distribuciones Muestrales de Medias (cont.)
Aunque se tomen muestras de una poblacin con distribucin
desconocida, finita o infinita, la distribucin muestral de X an
ser aproximadamente normal con media y varianza
2
/n,
siempre que el tamao de la muestra sea grande.
Teorema del Lmite Central. Si X es la media de una
muestra aleatoria de tamao n tomada de una poblacin con
media y varianza
2
, entonces la forma lmite de la
distribucin de
conforme n , es la distribucin normal estndar n(z;0,1).
n
X
Z


=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 41
Distribuciones Muestrales de Medias (cont.)
La aproximacin normal para X por lo general ser buena:
Si n 30 sin importar la forma de la poblacin.
Si n < 30, slo si la poblacin no es muy diferente a una distribucin
normal.
Si se sabe que la poblacin es normal, la distribucin muestral de la
media seguir una distribucin normal exacta, no importa que tan
pequeo sea el tamao de las muestras.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 42
Distribuciones Muestrales de Medias (cont.)
Inferencias sobre la media de la poblacin:
Una aplicacin muy importante del teorema del lmite central es la
determinacin de valores razonables de la media de la poblacin .
Se utiliza para la prueba de hiptesis, estimacin, control de calidad,
y otros.
Distribucin muestral de la diferencia entre dos promedios:
Una aplicacin importante de estas distribuciones incluye dos
poblaciones, para compararlas.
Esta comparacin es la diferencia de las medias de las poblaciones.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 43
Distribuciones Muestrales de Medias (cont.)
Teorema. Si se extraen al azar muestras independientes de
tamao n
1
y n
2
de dos poblaciones, discretas o continuas, con
medias
1
y
2
, y varianzas
2
1
y
2
2
, respectivamente,
entonces la distribucin muestral de las diferencias de las
medias, X
1
X
2
, est distribuida aproximadamente de forma
normal con media y varianza dadas por
De aqu se obtiene Z, es aproximadamente una variable
normal estndar
( ) ( )
2
2
2 1
2
1
2 1
2 1
n n
X X
Z


+

=
2
2
2
1
2
1
2
2 1
2 1 2 1
n n
X X X X

+ = =

UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 44
Distribuciones Muestrales de Medias (cont.)
La aproximacin normal para X
1
X
2
por lo general ser
buena:
Si n
1
30 y n
2
30 sin importar la forma de las dos poblaciones.
Si n
1
< 30 y n
2
< 30, slo si las dos poblaciones no son muy
diferentes a una distribucin normal.
Si se sabe que las dos poblaciones son normales, la distribucin
muestral de la diferencia de las medias seguir una distribucin
normal exacta, no importa que tan pequeo sea el tamao de las
muestras.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 45
Distribucin Muestral de S
2
Si S
2
es la varianza de la muestra aleatoria de tamao n que se
toma de una poblacin normal que tiene la varianza
2
,
entonces la estadstica
tiene distribucin ji cuadrado con v = n 1 grados de libertad.
La tabla A.5 da los valores de
2

para diversos valores de y


v. Las reas son los encabezados de las columnas; los grados
de libertad v se dan en la columna izquierda; y las entradas de
las tabla son lo valores
2
.
( ) ( )

=
n
i
i
X X S n
1
2
2
2
2
2
1

UCR-ECCI CI-1352 Probabilidad y Estadstica


Distribuciones Fundamentales de Muestreo y Descripciones de Datos 46
Distribucin Muestral de S
2
(cont.)
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 47
Distribucin Muestral de S
2
(cont.)
Exactamente 95% de una distribucin ji cuadrado yace entre

2
0.975
y
2
0.025
.
Un valor
2
que cae a la derecha de
2
0.025
es improbable que
ocurra, a menos que el valor supuesto de
2
sea demasiado
pequeo.
De manera similar, un valor
2
que cae a la izquierda de
2
0.975
es improbable que ocurra, a menos que el valor supuesto de
2
sea demasiado grande.
Es decir, es posible entre un valor
2
a la izquierda de
2
0.975
o
a la derecha de
2
0.025
cuando
2
es correcta, pero si esto debe
ocurrir, es ms probable que el valor supuesto de
2
sea un
error.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 48
Distribucin Muestral de S
2
(cont.)
Grados de libertad como medicin de la informacin muestral:
Cuando los datos (los valores en la muestra) se utilizan para calcular
la media, hay 1 grado de libertad menos en la informacin que se
utiliza para estimar la varianza.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 49
Distribucin t
En muchos escenarios experimentales el conocimiento de
ciertamente no es ms razonable que el conocimiento de la
media de la poblacin .
A menudo una estimacin de la debe proporcionar la misma
informacin muestral que produce el promedio muestral x.
Como resultado, una estadstica natural a considerar para
tratar con las inferencias sobre es
puesto que S es el anlogo de la muestra para .
n S
X
T

=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 50
Distribucin t (cont.)
Si el tamao de la muestra es pequeo, los valores de S
2
fluctan de forma considerable de una muestra a otra, y la
distribucin T se desva de forma apreciable de la distribucin
normal estndar.
Si el tamao de la muestra es suficientemente grande, n 30,
la distribucin T no difiere de manera considerable de la
normal estndar.
Sin embargo, si n < 30, es til tratar con la distribucin exacta
de T.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 51
Distribucin t (cont.)
Para desarrollar la distribucin muestral de T se supondr que
la muestra aleatoria se seleccion de una poblacin normal:
entonces, se puede escribir
donde Z tiene distribucin normal estndar y V tiene
distribucin ji cuadrado con v = n 1 grados de libertad.
En poblaciones normales X y S
2
son independientes, y en
consecuencia lo son Z y V.
( ) ( )
( ) 1
2 2

=
n V
Z
S
n X
T


( )
2
2
1

S n
V
n
X
Z

=

=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 52
Distribucin t (cont.)
Teorema. Sea Z una variable aleatoria normal estndar y V
una variable aleatoria ji cuadrado con v grados de libertad. Si
Z y V son independientes, entonces la distribucin de la
variable aleatoria T, donde
est dada por
Esta se conoce como la distribucin t con v grados de
libertad, v = n 1 si la muestra tiene tamao n.
v V
Z
T =
( )
( ) | |
| |
( )
+ < <
|
|
.
|

\
|
+

+
=
+
t
v
t
v v
v
t h
v 2 1
2
1
2
2 1

UCR-ECCI CI-1352 Probabilidad y Estadstica


Distribuciones Fundamentales de Muestreo y Descripciones de Datos 53
Distribucin t (cont.)
Corolario. Sean X
1
, X
2
, , X
n
variables aleatorias
independientes que son normales con media y desviacin
estndar . Sea
Entonces la variable aleatoria tiene una
distribucin t con v = n 1 grados de libertad.
( )

= =

= =
n
i
i
n
i
i
n
X X
S
n
X
X
1
2
2
1
1
n S
X
T

=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 54
Distribucin t (cont.)
A la distribucin t se le suele llamar como distribucin t de
Student.
La distribucin de T es similar a la distribucin de Z, pues
ambas son simtricas alrededor de una media de cero y ambas
tienen forma de campana.
La diferencia entre las dos distribuciones es que la
distribucin t es ms variable que la distribucin normal
estndar, ya que los valores de T dependen de las
fluctuaciones de X y S
2
, mientras que los valores de Z
dependen slo de X de una muestra a otra.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 55
Distribucin t (cont.)
La distribucin de T difiere de la de Z en que la varianza de T
depende del tamao de la muestra y siempre es mayor que 1.
Cuando el tamao de la muestra tiende a infinito, n por
lo que v = , las dos distribuciones sern la misma.
Se acostumbra a representar con t

el valor t por arriba del cual


se encuentra un rea igual a .
Como la distribucin t es simtrica alrededor de una media de
cero, se tiene t
1-
= -t

.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 56
Distribucin t (cont.)
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 57
Distribucin t (cont.)
Exactamente 95% de una distribucin t con v = n 1 grados
de libertad caen entre -t
0.025
y t
0.025
.
Un valor t que cae por debajo de -t
0.025
o por arriba de t
0.025
tiende hacer creer que ha ocurrido un evento muy raro o quiz
que la suposicin acerca de es un error.
Si esto ocurre, se toma la ltima decisin y se afirma que el
valor supuesto de es errneo.
De hecho, un valor t que cae por debajo de -t
0.01
o por arriba
de t
0.01
proporcionara incluso fuerte evidencia de que el valor
supuesto de es bastante improbable.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 58
Distribucin t (cont.)
La distribucin t se usa de manera extensa en problemas que
tienen que ver con inferencia acerca de la media de la
poblacin o en problemas que implican muestras
comparativas.
El uso de la d distribucin t y la consideracin del tamao de
la muestra no se relacionan con el teorema del lmite central.
El uso de la distribucin normal estndar en lugar de T para n
30 slo implica que S es un estimador suficientemente
bueno de en este caso.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 59
Distribucin F
La distribucin F encuentra enorme aplicacin en la
comparacin de varianzas muestrales. Las aplicaciones se
encuentran en problemas que involucran dos o ms muestras.
La estadstica F se define como la razn de dos variables
aleatorias ji cuadradas independientes, dividida cada una entre
su nmero de grados de libertad. De aqu, se puede escribir
donde U y V son variables aleatorias independientes que
tienen distribuciones ji cuadradas con v
1
y v
2
grados de
libertad, respectivamente.
2
1
v V
v U
F =
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 60
Distribucin F (cont.)
Teorema. Sean U y V dos variables aleatorias independientes
que tienen distribuciones ji cuadradas con v
1
y v
2
grados de
libertad, respectivamente. Entonces la distribucin de la
variable aleatoria F, donde
est dada por
Esta se conoce como la distribucin F con v
1
y v
2
grados de
libertad.
2
1
v V
v U
F =
( )
( ) | |( )
( ) ( )
( )
( )

+ < <
+


+
=
+

caso otro 0
0
1
2 2
2
2
2 1
1 2
2 1
2 1 2 1
2 1
1
2
1
f
v f v
f
v v
v v v v
f h
v v
v
v
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 61
Distribucin F (cont.)
La curva de la distribucin F depende no slo de los dos
parmetros v
1
y v
2
, sino tambin del orden en el que se
establecen. Una vez que se dan estos dos valores, se puede
identificar la curva.
Sea f

por arriba del cual se encuentra un rea igual a . La


tabla A.6 da valores de f

slo para = 0.05 y = 0.01 para


varias combinaciones de los grados de libertad v
1
y v
2
.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 62
Distribucin F (cont.)
f

f
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 63
Distribucin F (cont.)
Por medio del siguiente teorema, la tabla A.6 tambin se
puede utilizar para encontrar valores de f
0.95
y f
0.99
.
Teorema. Al escribir f

(v
1
,v
2
) para f

con v
1
y v
2
grados de
libertad, se obtiene
( )
( )
2 1
2 1 1
,
1
,
v v f
v v f

UCR-ECCI CI-1352 Probabilidad y Estadstica


Distribuciones Fundamentales de Muestreo y Descripciones de Datos 64
Distribucin F (cont.)
Teorema. Si S
2
1
y S
2
2
son las varianzas de muestras aleatorias
independientes de tamao n
1
y n
2
tomadas de poblaciones
normales con varianza
2
1
y
2
2
, respectivamente, entonces
tiene una distribucin F con v
1
= n
1
1 y v
2
= n
2
1 grados de
libertad.
2
2
2
1
2
1
2
2
2
2
2
2
2
1
2
1
S
S
S
S
F

= =
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 65
Distribucin F (cont.)
La distribucin F se usa en situaciones de dos muestras para
extraer inferencias acerca de las varianzas de poblacin.
Tambin, se aplica a muchos otro tipos de problemas en los
que las varianzas estn involucradas.
De hecho, la distribucin F se llama distribucin de razn de
varianzas.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 66
Referencias Bibliogrficas
Walpole, R.E.; Myers, R.H.; Myers, S.L. & Ye, K.
Probabilidad y estadstica para ingeniera y ciencias. Octava
Edicin. Pearson Prentice-Hall. Mxico, 2007.

Вам также может понравиться