Академический Документы
Профессиональный Документы
Культура Документы
2 1
1
n
x x x
n
x
x
n
n
i
i
+ + +
= =
2 1
1
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 12
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
Si X
1
, X
2
, , X
n
representan una muestra aleatoria de tamao
n, acomodada en orden creciente de magnitud, entonces la
mediana de la muestra se define mediante el estadstico
( )
( )
+ =
+
+
par es si
2
impar es si
~
1 2 / 2 /
2 / 1
n
X X
n X
X
n n
n
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 13
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
Si X
1
, X
2
, , X
n
, no necesariamente diferentes, representan
una muestra aleatoria de tamao n, entonces la moda de la
muestra Mes aquel valor de la muestra que ocurre ms a
menudo o con mayor frecuencia.
La moda puede no existir, y cuando existe no necesariamente
es nica.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 14
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
La media de la muestra:
Es la medida de localizacin central ms comnmente utilizada en
estadstica.
Emplea toda la informacin disponible.
Las distribuciones de medias que se obtienen en muestreos repetidos
de una poblacin son bien conocidos, y en consecuencia los mtodos
que se utilizan en la inferencia estadstica para estimar se basan en
la media de la muestra.
La nica desventaja real, es que puede resultar afectada de manera
adversa por valores extremos.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 15
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
La mediana de la muestra:
Es fcil de calcular si el nmero de observaciones es relativamente
pequeo.
No resulta influida por valores extremos.
Al tratar con muestras que se seleccionan de poblaciones, las medias
de las muestras por lo general no variarn tanto de una muestra a otra
como las medianas. Por lo tanto, si se desea estimar el centro de una
poblacin con base en un valor de la muestra, la media es ms estable
que la mediana.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 16
Algunos Estadsticos Importantes
Tendencia Central de la Muestra (cont.)
La moda de la muestra:
Es la menos utilizada de las tres.
Para conjuntos pequeos su valor casi no tiene utilidad, si es que
existe.
Slo tiene sentido significativo en una gran cantidad de datos.
No requiere clculo, lo que se considera una ventaja.
Se puede usar para datos cualitativos como cuantitativos, lo que se
considera una ventaja.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 17
Algunos Estadsticos Importantes
Variabilidad en la Muestra (cont.)
Las medidas de localizacin central o posicin no dan por s
mismas una descripcin adecuada de los datos. Es importante
conocer cmo se dispersan las observaciones del promedio.
La variabilidad de una muestra juega un papel muy importante
en el anlisis de datos.
La variabilidad de un proceso y de un producto es un hecho real en
los sistemas cientficos y de ingeniera.
La variabilidad en valores de poblacin y datos de una muestra es un
hecho real.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 18
Algunos Estadsticos Importantes
Variabilidad en la Muestra (cont.)
El rango (recorrido o amplitud) de una muestra aleatoria X
1
,
X
2
, , X
n
, se define con el estadstico , donde
X
min
y X
max
son, respectivamente, las observaciones ms
grande y ms pequea de la muestra.
El rango falla al medir la variabilidad entre la observacin
superior y la inferior, pero tiene algunas aplicaciones tiles.
En la industria, el rango se puede determinar al especificar por
adelantado que una medicin particular de los artculos que
salen de una lnea de produccin deba caer dentro de cierto
intervalo.
min max
X X
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 19
Algunos Estadsticos Importantes
Variabilidad en la Muestra (cont.)
Si X
1
, X
2
, , X
n
representan una muestra aleatoria de tamao
n, entonces la varianza de la muestra se define mediante el
estadstico
El valor calculado de S
2
para una muestra dada se denota con
s
2
.
La varianza se define, esencialmente, como el promedio de los
cuadrados de las desviaciones de las observaciones de su
media.
( )
( )
=
n
i
i
n
X X
S
1
2
2
1
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 20
Algunos Estadsticos Importantes
Variabilidad en la Muestra (cont.)
Teorema. Si S
2
es la varianza de una muestra aleatoria de
tamao n, se puede escribir como
( ) 1
2
1 1
2
2
|
.
|
\
|
=
= =
n n
X X n
S
n
i
i
n
i
i
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 21
Algunos Estadsticos Importantes
Variabilidad en la Muestra (cont.)
La desviacin estndar de la muestra, que se denota con S,
es la raz cuadrada positiva de la varianza de la muestra.
La cantidad n 1 a menudo se denomina grados de libertad
asociados con la varianza estimada. Los grados de libertad
representan el nmero de piezas de informacin
independientes disponibles para calcular la variabilidad.
( )
( )
=
n
i
i
n
X X
S
1
2
1
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 22
Presentaciones de Datos y Mtodos Grficos
En la estadstica, con frecuencia se hace la suposicin de que
la distribucin es normal.
La informacin grfica con respecta a la validez de esta
suposicin se puede obtener de presentaciones como los
diagramas de tronco y hojas, y los histogramas de frecuencias.
A continuacin se introduce la nocin de grficas de
probabilidad normal y grficas de cuantiles.
Estas grficas se utilizan en estudios que tienen grados de
complejidad que varan, con el objetivo principal de que las grficas
proporcionen una verificacin diagnstica de la suposicin de que los
datos vienen de una distribucin normal.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 23
Presentaciones de Datos y Mtodos Grficos
(cont.)
Los estadsticos vistas anteriormente proporcionan medidas
simples, mientras que una representacin grfica agrega
informacin adicional en trminos de una imagen.
Las muestras mltiples se pueden comparar de forma grfica.
Las grficas de datos pueden sugerir relaciones entre variables.
Las grficas pueden ayudar en la deteccin de anomalas o de
observaciones de datos apartados en las muestras.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 24
Presentaciones de Datos y Mtodos Grficos
Grfico de Caja y Extensin (cont.)
Esta grfica encierra el rango intercuartil de los datos en una
caja que tiene la mediana representada dentro.
El rango intercuartil tiene como extremos el percentil 75
(cuartil superior) y el percentil 25 (cuartil inferior).
Adems, de la caja se prolongan extensiones, que muestran las
observaciones extremas en la muestra.
Para muestras razonablemente grandes, la presentacin
muestra el centro de la localizacin, la variabilidad y el grado
de asimetra.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 25
Presentaciones de Datos y Mtodos Grficos
Grfico de Caja y Extensin (cont.)
Una variacin que se llama grfica de caja puede
proporcionar a quien la ve informacin con respecto a cuales
observaciones son datos apartados.
Los datos apartados son observaciones que se consideran
inusualmente alejadas de la masa de datos.
Tcnicamente, se puede considerar un dato apartado como una
observacin que representa un evento raro; es decir, existe una
probabilidad pequea de obtener un valor tan alejado de la masa de
datos.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 26
Presentaciones de Datos y Mtodos Grficos
Grfico de Caja y Extensin (cont.)
Ejemplo. Los valores de nicotina de 40 cigarrillos son:
1,09 1,92 2,31 1,79 2,28
1,74 1,47 1,97 0,85 1,24
1,58 2,03 1,70 2,17 2,55
2,11 1,86 1,90 1,68 1,51
1,64 0,72 1,69 1,85 1,82
1,79 2,46 1,88 2,08 1,67
1,37 1,93 1,40 1,64 2,09
1,75 1,63 2,37 1,75 1,69
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 27
Presentaciones de Datos y Mtodos Grficos
Grfico de Caja y Extensin (cont.)
Se tienen las siguientes estadsticas:
Descriptive Statistics
40 1,83 ,72 2,55 1,7743 ,39046 ,152 Valores de Nicotina
N Range Minimum Maximum Mean Std. Deviation Variance
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 28
Presentaciones de Datos y Mtodos Grficos
Grfico de Caja y Extensin (cont.)
0,80 1,20 1,60 2,00 2,40 2,80
Valores de Nicotina
A A A
Grfica de Caja y Extensin
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 29
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles (cont.)
El propsito de estas grficas es describir, en forma de
muestra, la funcin de distribucin acumulada que se present
en captulos anteriores.
Un cuantil de una muestra, q(f), es un valor para el que una
fraccin especfica f de los valores de los datos es menor que o
igual a q(f).
Un cuantil representa una estimacin de una caracterstica de
una poblacin, o ms bien, la distribucin terica.
La mediana de la muestra es q(0.5), el cuartil superior
(percentil 75) es q(0.75) y el cuartil inferior (percentil 25) es
q(0.25).
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 30
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles (cont.)
Una grfica de cuantiles simplemente grafica los valores de
los datos en el eje vertical contra una evaluacin emprica de
la fraccin de observaciones excedidas por los valores de los
datos.
Para la propsitos tericos esta fraccin se calcula con
donde i es el orden de las observaciones cuando se clasifican
de inferior a superior.
4
1
8
3
+
=
n
i
f
i
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 31
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles (cont.)
A diferencia de la grfica de caja y extensin, la grfica de
cuantiles realmente muestra todas las observaciones.
Todos los cuantiles, incluida la mediana y los cuantiles
inferior y superior, se pueden aproximar de forma visual.
Las indicaciones de agrupaciones relativamente grandes
alrededor de valores especficos se indican por pendientes
cercanas a cero, mientras que los datos dispersos en ciertas
reas producen pendientes ms abruptas.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 32
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles-Cuantiles Normales (cont.)
La grfica de cuantiles-cuantiles normales toma ventaja de lo
que se conoce acerca de los cuantiles de la distribucin
normal.
La metodologa incluye una grfica de los cuantiles empricos
recin presentados contra el cuantil correspondiente de la
distribucin normal.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 33
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles-Cuantiles Normales (cont.)
La expresin para un cuantil de una variable aleatoria N(,)
es muy complicada. Una buena aproximacin est dada por:
La expresin para un cuantil de una variable aleatoria N(0,1)
es:
( ) ( ) | | { }
14 . 0
14 . 0
,
1 91 . 4 f f f q + =
( ) ( ) | | { }
14 . 0
14 . 0
1 , 0
1 91 . 4 f f f q =
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 34
Presentaciones de Datos y Mtodos Grficos
Grfica de Cuantiles (cont.)
La grfica de cuantiles-cuantiles normales es una grfica de
y
(i)
(observaciones ordenadas) contra q
0,1
(f
i
), donde
Una relacin cercana a una lnea recta sugiere que los datos
provienen de una distribucin normal.
La interseccin en el eje vertical es una estimacin de la media
de la poblacin y la pendiente es una estimacin de la
desviacin estndar.
4
1
8
3
+
=
n
i
f
i
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 35
Distribuciones Muestrales
La distribucin de probabilidad de un estadstico se llama
distribucin muestral.
Esta distribucin depende del tamao de la poblacin, el
tamao de las muestras y el mtodo de eleccin de las
muestras.
Existen distribuciones muestrales de X y S
2
, que son el
mecanismo a partir del cual se hace inferencias de los
parmetros y
2
.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 36
Distribuciones Muestrales (cont.)
La distribucin muestral de X con tamao muestral n es la
distribucin que resulta cuando un experimento se lleva a cabo
una y otra vez y resultan los diversos valores de X.
Esta distribucin muestral describe la variabilidad de los promedios
muestrales alrededor de la media de la poblacin .
Se aplica el mismo principio en el caso de la distribucin de
S
2
.
Esta distribucin produce informacin acerca de la variabilidad de los
valores de s
2
alrededor de
2
en experimentos que se repiten.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 37
Distribuciones Muestrales de Medias
Suponga que se tiene una muestra aleatoria de n observaciones
que se toma de una poblacin normal con media y varianza
2
.
Cada observacin X
i
, i = 1, 2, , n, de la muestra aleatoria
tendr entonces la misma distribucin normal que la poblacin
que se muestrea.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 38
Distribuciones Muestrales de Medias (cont.)
Teorema. Si X
1
, X
2
, , X
n
son variables aleatorias
independientes que tienen distribuciones normales con medias
1
,
2
,
n
y varianzas
1
2
,
2
2
,
n
2
respectivamente,
entonces la variable aleatoria
tiene una distribucin normal con media
y varianza
n n
X a X a X a Y + + + = ...
2 2 1 1
n n Y
a a a + + + = ...
2 2 1 1
2 2 2
2
2
2
2
1
2
1
2
...
n n Y
a a a + + + =
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 39
Distribuciones Muestrales de Medias (cont.)
Segn el teorema donde se establece la propiedad reproductiva
de la distribucin normal, se concluye que
tiene distribucin normal con media y varianza
n
X X X
X
n
+ + +
=
...
2 1
n n n
X X
2
2
2 2 2
2
... ...
=
+ + +
= =
+ + +
=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 40
Distribuciones Muestrales de Medias (cont.)
Aunque se tomen muestras de una poblacin con distribucin
desconocida, finita o infinita, la distribucin muestral de X an
ser aproximadamente normal con media y varianza
2
/n,
siempre que el tamao de la muestra sea grande.
Teorema del Lmite Central. Si X es la media de una
muestra aleatoria de tamao n tomada de una poblacin con
media y varianza
2
, entonces la forma lmite de la
distribucin de
conforme n , es la distribucin normal estndar n(z;0,1).
n
X
Z
=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 41
Distribuciones Muestrales de Medias (cont.)
La aproximacin normal para X por lo general ser buena:
Si n 30 sin importar la forma de la poblacin.
Si n < 30, slo si la poblacin no es muy diferente a una distribucin
normal.
Si se sabe que la poblacin es normal, la distribucin muestral de la
media seguir una distribucin normal exacta, no importa que tan
pequeo sea el tamao de las muestras.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 42
Distribuciones Muestrales de Medias (cont.)
Inferencias sobre la media de la poblacin:
Una aplicacin muy importante del teorema del lmite central es la
determinacin de valores razonables de la media de la poblacin .
Se utiliza para la prueba de hiptesis, estimacin, control de calidad,
y otros.
Distribucin muestral de la diferencia entre dos promedios:
Una aplicacin importante de estas distribuciones incluye dos
poblaciones, para compararlas.
Esta comparacin es la diferencia de las medias de las poblaciones.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 43
Distribuciones Muestrales de Medias (cont.)
Teorema. Si se extraen al azar muestras independientes de
tamao n
1
y n
2
de dos poblaciones, discretas o continuas, con
medias
1
y
2
, y varianzas
2
1
y
2
2
, respectivamente,
entonces la distribucin muestral de las diferencias de las
medias, X
1
X
2
, est distribuida aproximadamente de forma
normal con media y varianza dadas por
De aqu se obtiene Z, es aproximadamente una variable
normal estndar
( ) ( )
2
2
2 1
2
1
2 1
2 1
n n
X X
Z
+
=
2
2
2
1
2
1
2
2 1
2 1 2 1
n n
X X X X
+ = =
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 44
Distribuciones Muestrales de Medias (cont.)
La aproximacin normal para X
1
X
2
por lo general ser
buena:
Si n
1
30 y n
2
30 sin importar la forma de las dos poblaciones.
Si n
1
< 30 y n
2
< 30, slo si las dos poblaciones no son muy
diferentes a una distribucin normal.
Si se sabe que las dos poblaciones son normales, la distribucin
muestral de la diferencia de las medias seguir una distribucin
normal exacta, no importa que tan pequeo sea el tamao de las
muestras.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 45
Distribucin Muestral de S
2
Si S
2
es la varianza de la muestra aleatoria de tamao n que se
toma de una poblacin normal que tiene la varianza
2
,
entonces la estadstica
tiene distribucin ji cuadrado con v = n 1 grados de libertad.
La tabla A.5 da los valores de
2
=
n
i
i
X X S n
1
2
2
2
2
2
1
2
0.975
y
2
0.025
.
Un valor
2
que cae a la derecha de
2
0.025
es improbable que
ocurra, a menos que el valor supuesto de
2
sea demasiado
pequeo.
De manera similar, un valor
2
que cae a la izquierda de
2
0.975
es improbable que ocurra, a menos que el valor supuesto de
2
sea demasiado grande.
Es decir, es posible entre un valor
2
a la izquierda de
2
0.975
o
a la derecha de
2
0.025
cuando
2
es correcta, pero si esto debe
ocurrir, es ms probable que el valor supuesto de
2
sea un
error.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 48
Distribucin Muestral de S
2
(cont.)
Grados de libertad como medicin de la informacin muestral:
Cuando los datos (los valores en la muestra) se utilizan para calcular
la media, hay 1 grado de libertad menos en la informacin que se
utiliza para estimar la varianza.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 49
Distribucin t
En muchos escenarios experimentales el conocimiento de
ciertamente no es ms razonable que el conocimiento de la
media de la poblacin .
A menudo una estimacin de la debe proporcionar la misma
informacin muestral que produce el promedio muestral x.
Como resultado, una estadstica natural a considerar para
tratar con las inferencias sobre es
puesto que S es el anlogo de la muestra para .
n S
X
T
=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 50
Distribucin t (cont.)
Si el tamao de la muestra es pequeo, los valores de S
2
fluctan de forma considerable de una muestra a otra, y la
distribucin T se desva de forma apreciable de la distribucin
normal estndar.
Si el tamao de la muestra es suficientemente grande, n 30,
la distribucin T no difiere de manera considerable de la
normal estndar.
Sin embargo, si n < 30, es til tratar con la distribucin exacta
de T.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 51
Distribucin t (cont.)
Para desarrollar la distribucin muestral de T se supondr que
la muestra aleatoria se seleccion de una poblacin normal:
entonces, se puede escribir
donde Z tiene distribucin normal estndar y V tiene
distribucin ji cuadrado con v = n 1 grados de libertad.
En poblaciones normales X y S
2
son independientes, y en
consecuencia lo son Z y V.
( ) ( )
( ) 1
2 2
=
n V
Z
S
n X
T
( )
2
2
1
S n
V
n
X
Z
=
=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 52
Distribucin t (cont.)
Teorema. Sea Z una variable aleatoria normal estndar y V
una variable aleatoria ji cuadrado con v grados de libertad. Si
Z y V son independientes, entonces la distribucin de la
variable aleatoria T, donde
est dada por
Esta se conoce como la distribucin t con v grados de
libertad, v = n 1 si la muestra tiene tamao n.
v V
Z
T =
( )
( ) | |
| |
( )
+ < <
|
|
.
|
\
|
+
+
=
+
t
v
t
v v
v
t h
v 2 1
2
1
2
2 1
= =
n
i
i
n
i
i
n
X X
S
n
X
X
1
2
2
1
1
n S
X
T
=
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 54
Distribucin t (cont.)
A la distribucin t se le suele llamar como distribucin t de
Student.
La distribucin de T es similar a la distribucin de Z, pues
ambas son simtricas alrededor de una media de cero y ambas
tienen forma de campana.
La diferencia entre las dos distribuciones es que la
distribucin t es ms variable que la distribucin normal
estndar, ya que los valores de T dependen de las
fluctuaciones de X y S
2
, mientras que los valores de Z
dependen slo de X de una muestra a otra.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 55
Distribucin t (cont.)
La distribucin de T difiere de la de Z en que la varianza de T
depende del tamao de la muestra y siempre es mayor que 1.
Cuando el tamao de la muestra tiende a infinito, n por
lo que v = , las dos distribuciones sern la misma.
Se acostumbra a representar con t
.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 56
Distribucin t (cont.)
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 57
Distribucin t (cont.)
Exactamente 95% de una distribucin t con v = n 1 grados
de libertad caen entre -t
0.025
y t
0.025
.
Un valor t que cae por debajo de -t
0.025
o por arriba de t
0.025
tiende hacer creer que ha ocurrido un evento muy raro o quiz
que la suposicin acerca de es un error.
Si esto ocurre, se toma la ltima decisin y se afirma que el
valor supuesto de es errneo.
De hecho, un valor t que cae por debajo de -t
0.01
o por arriba
de t
0.01
proporcionara incluso fuerte evidencia de que el valor
supuesto de es bastante improbable.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 58
Distribucin t (cont.)
La distribucin t se usa de manera extensa en problemas que
tienen que ver con inferencia acerca de la media de la
poblacin o en problemas que implican muestras
comparativas.
El uso de la d distribucin t y la consideracin del tamao de
la muestra no se relacionan con el teorema del lmite central.
El uso de la distribucin normal estndar en lugar de T para n
30 slo implica que S es un estimador suficientemente
bueno de en este caso.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 59
Distribucin F
La distribucin F encuentra enorme aplicacin en la
comparacin de varianzas muestrales. Las aplicaciones se
encuentran en problemas que involucran dos o ms muestras.
La estadstica F se define como la razn de dos variables
aleatorias ji cuadradas independientes, dividida cada una entre
su nmero de grados de libertad. De aqu, se puede escribir
donde U y V son variables aleatorias independientes que
tienen distribuciones ji cuadradas con v
1
y v
2
grados de
libertad, respectivamente.
2
1
v V
v U
F =
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 60
Distribucin F (cont.)
Teorema. Sean U y V dos variables aleatorias independientes
que tienen distribuciones ji cuadradas con v
1
y v
2
grados de
libertad, respectivamente. Entonces la distribucin de la
variable aleatoria F, donde
est dada por
Esta se conoce como la distribucin F con v
1
y v
2
grados de
libertad.
2
1
v V
v U
F =
( )
( ) | |( )
( ) ( )
( )
( )
+ < <
+
+
=
+
caso otro 0
0
1
2 2
2
2
2 1
1 2
2 1
2 1 2 1
2 1
1
2
1
f
v f v
f
v v
v v v v
f h
v v
v
v
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 61
Distribucin F (cont.)
La curva de la distribucin F depende no slo de los dos
parmetros v
1
y v
2
, sino tambin del orden en el que se
establecen. Una vez que se dan estos dos valores, se puede
identificar la curva.
Sea f
f
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 63
Distribucin F (cont.)
Por medio del siguiente teorema, la tabla A.6 tambin se
puede utilizar para encontrar valores de f
0.95
y f
0.99
.
Teorema. Al escribir f
(v
1
,v
2
) para f
con v
1
y v
2
grados de
libertad, se obtiene
( )
( )
2 1
2 1 1
,
1
,
v v f
v v f
= =
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 65
Distribucin F (cont.)
La distribucin F se usa en situaciones de dos muestras para
extraer inferencias acerca de las varianzas de poblacin.
Tambin, se aplica a muchos otro tipos de problemas en los
que las varianzas estn involucradas.
De hecho, la distribucin F se llama distribucin de razn de
varianzas.
UCR-ECCI CI-1352 Probabilidad y Estadstica
Distribuciones Fundamentales de Muestreo y Descripciones de Datos 66
Referencias Bibliogrficas
Walpole, R.E.; Myers, R.H.; Myers, S.L. & Ye, K.
Probabilidad y estadstica para ingeniera y ciencias. Octava
Edicin. Pearson Prentice-Hall. Mxico, 2007.