Вы находитесь на странице: 1из 44

Distribución t de Student

Distribución t de Student

Función de densidad de probabilidad

Función de distribución de probabilidad

Parámetros
grados de libertad (real)

Dominio

Función de densidad (pdf)


Función de distribución (cdf)
donde es la función
hipergeométrica

Media
para , indefinida
para otros valores

Mediana

Moda

Varianza
para , indefinida
para otros valores

Coeficiente de simetría
para

Curtosis
para

Entropía

 : función digamma,

 : función beta

Función generadora de (No definida)


momentos (mgf)

[editar datos en Wikidata]

En probabilidad y estadística, la distribución t (de Student) es unadistribución de


probabilidad que surge del problema de estimar lamedia de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las
diferencias entre dos medias muestrales y para la construcción del intervalo de
confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce
la desviación típica de una población y ésta debe ser estimada a partir de los datos de una
muestra.

Índice
[ocultar]
 1Caracterización
 2Aparición y especificaciones de la distribución t de Student
 3Intervalos de confianza derivados de la distribución t de Student
 4Historia
 5Distribución t de Student no estandarizada
 6Referencias
 7Enlaces externos

Caracterización[editar]
La distribución t de Student es la distribución de probabilidad del cociente

donde

 Z es una variable aleatoria distribuida según una normal típica (de media nula
y varianza 1).

 V es una variable aleatoria que sigue una distribución χ² con grados de


libertad.
 Z y V son independientes

Si μ es una constante no nula, el cociente es una variable aleatoria que sigue

la distribución t de Student no central con parámetro de no-centralidad .

Aparición y especificaciones de la distribuciónt de


Student[editar]
Supongamos que X1,..., Xn son variables aleatorias independientesdistribuidas
normalmente, con media μ y varianza σ2. Sea

la media muestral. Entonces

sigue una distribución normal de media 0 y varianza 1.


Sin embargo, dado que la desviación estándar no siempre es conocida de
antemano, Gosset estudió un cociente relacionado,

es la cuasivarianza muestral y demostró que la función de densidad


de T es
donde es igual a n − 1.
La distribución de T se llama ahora la distribución-t de Student.

El parámetro representa el número de grados de libertad. La

distribución depende de , pero no de o , lo cual es


muy importante en la práctica.

Intervalos de confianza derivados de la


distribución t de Student[editar]
El procedimiento para el cálculo del intervalo de confianza basado
en la t de Student consiste en estimar la desviación típica de los

datos S y calcular el error estándar de la media: , siendo

entonces el intervalo de confianza para la media: .


Es este resultado el que se utiliza en el test de Student: puesto
que la diferencia de las medias de muestras de dos distribuciones
normales se distribuye también normalmente, la
distribución t puede usarse para examinar si esa diferencia puede
razonablemente suponerse igual a cero.
Para efectos prácticos el valor esperado y la varianza son:

y para

Historia[editar]
La distribución de Student fue descrita en 1908 por William Sealy
Gosset. Gosset trabajaba en una fábrica de cerveza,Guinness,
que prohibía a sus empleados la publicación de artículos
científicos debido a una difusión previa de secretos industriales.
De ahí que Gosset publicase sus resultados bajo
el seudónimo de Student.1

Distribución t de Student no
estandarizada[editar]
La distribución t puede generalizarse a 3 parámetros,

introduciendo un parámero locacional y otro de escala .


El resultado es una distribución t de Student no
estandarizada cuya densidad está definida por:2

Equivalentemente, puede escribirse en términos

de (correspondiente a la varianza en vez de a


la desviación estándar):
Otras propiedades de esta versión de la distribución t
son:2

Referencias[editar]
1. Volver arriba↑ Walpole, Roland; Myers, Raymond
y Ye, Keying (2002). Probability and Statistics for
Engineers and Scientists. Pearson Education.
2. ↑ Saltar a:a b Jackman, Simon (2009). Bayesian
Analysis for the Social Sciences. Wiley. p. 507.

Enlaces externos

Prueba t de Student
En estadística, una prueba t de Student, prueba t-Student, o Test-T es
cualquier prueba en la que el estadístico utilizado tiene una distribución t de Student si
la hipótesis nula es cierta. Se aplica cuando la población estudiada sigue unadistribución
normal pero el tamaño muestral es demasiado pequeño como para que el estadístico en el
que está basada la inferencia esté normalmente distribuido, utilizándose una estimación de
la desviación típica en lugar del valor real. Es utilizado en análisis discriminante.

Índice
[ocultar]

 1Historia
 2Usos
 3Estadísticos T y Z
 4Pruebas t para dos muestras apareadas y desapareadas
o 4.1Desapareada
o 4.2Apareada
 5Cálculos
o 5.1Prueba t para muestra única
o 5.2Pendiente de una regresión lineal
o 5.3Prueba t para dos muestras independientes
 5.3.1Iguales tamaños muestrales, iguales varianzas
 5.3.2Diferentes tamaños muestrales, iguales varianzas
 5.3.3Diferentes tamaños muestrales, diferentes varianzas
o 5.4Prueba t dependiente para muestras apareadas
 6Ejemplos desarrollados
o 6.1Varianzas desiguales
o 6.2Varianzas iguales
 7Alternativas a la prueba t para problemas de locación
 8Pruebas multivariadas
o 8.1Prueba T 2 monomuestral
o 8.2Prueba T 2 bimuestral
 9Implementaciones
 10Lecturas adicionales
 11Referencias
 12Enlaces externos
o 12.1Calculadores en línea

Historia[editar]
El estadístico t fue introducido por William Sealy Gosset en 1908, un químico que
trabajaba para la cervecería Guinness deDublín. Student era su seudónimo de escritor.123
Gosset había sido contratado gracias a la política de Claude Guiness de reclutar a los
mejores graduados de Oxford y Cambridge, y con el objetivo de aplicar los nuevos
avances en bioquímica y estadística al proceso industrial de Guiness.2 Gosset desarrolló el
test t como una forma sencilla de monitorizar la calidad de la famosa cerveza stout. Publicó
su test en la revista inglesa Biometrika en el año 1908, pero fue forzado a utilizar un
seudónimo por su empleador, para mantener en secreto los procesos industriales que se
estaban utilizando en la producción. Aunque de hecho, la identidad de Gosset era
conocida por varios de sus compañeros estadísticos.4

Usos[editar]
Entre los usos más frecuentes de las pruebas t se encuentran:

 El test de locación de muestra única por el cual se comprueba si la media de una


población distribuida normalmente tiene un valor especificado en una hipótesis nula.

 El test de locación para dos muestras, por el cual se comprueba si las medias de dos
poblaciones distribuidas en forma normal son iguales. Todos estos test son
usualmente llamados test t de Student, a pesar de que estrictamente hablando, tal
nombre sólo debería ser utilizado si las varianzas de las dos poblaciones estudiadas
pueden ser asumidas como iguales; la forma de los ensayos que se utilizan cuando
esta asunción se deja de lado suelen ser llamados a veces comoPrueba t de Welch.
Estas pruebas suelen ser comúnmente nombradas como pruebas t desapareadas o
de muestras independientes, debido a que tienen su aplicación más típica cuando las
unidades estadísticas que definen a ambas muestras que están siendo comparadas
no se superponen.5

 El test de hipótesis nula por el cual se demuestra que la diferencia entre dos
respuestas medidas en las mismas unidades estadísticas es cero. Por ejemplo,
supóngase que se mide el tamaño del tumor de un paciente con cáncer. Si el
tratamiento resulta efectivo, lo esperable sería que el tumor de muchos pacientes
disminuyera de tamaño luego de seguir el tratamiento. Esto con frecuencia es referido
como prueba t de mediciones apareadas o repetidas.56

 El test para comprobar si la pendiente de una regresión lineal difiere estadísticamente


de cero.

Estadísticos T y Z[editar]

La mayor parte de las pruebas estadísticas t tienen la forma , donde Z y s son


funciones de los datos estudiados. Típicamente, Z se diseña de forma tal que resulte
sensible a la hipótesis alternativa (p.ej. que su magnitud tienda a ser mayor cuando la
hipótesis alternativa es verdadera), mientras que s es un parámetro de escala que permite
que la distribución de T pueda ser determinada.

Por ejemplo, en una prueba t de muestra única, , donde es la media muestral de


los datos, n es el tamaño muestral, y σ es la desviación estándar de la población de

datos; s en una prueba de muestra única es , donde es la desviación estándar


muestral.
Las asunciones subyacentes en una prueba t son:

 Que Z sigue una distribución normal bajo la hipótesis nula.


 ps2 sigue una distribución χ2 con p grados de libertad bajo la hipótesis nula, y
donde p es una constante positiva.
 Z y s son estadísticamente independientes.
En una prueba t específica, estas condiciones son consecuencias de la población que está
siendo estudiada, y de la forma en que los datos han sido muestreados. Por ejemplo, en la
prueba t de comparación de medias de dos muestras independientes, deberíamos realizar
las siguientes asunciones:

 Cada una de las dos poblaciones que están siendo comparadas sigue una distribución
normal. Esto puede ser demostrado utilizando una prueba de normalidad, tales como
una prueba Shapiro-Wilk o Kolmogórov-Smirnov, o puede ser determinado
gráficamente por medio de un gráfico de cuantiles normales Q-Q plot.

 Si se está utilizando la definición original de Student sobre su prueba t, las dos


poblaciones a ser comparadas deben poseer las mismas varianzas, (esto se puede
comprobar utilizando una prueba F de igualdad de varianzas, una prueba de Levene,
una prueba de Bartlett, o una prueba Brown-Forsythe, o estimarla gráficamente por
medio de un gráfico Q-Q plot). Si los tamaños muestrales de los dos grupos
comparados son iguales, la prueba original de Student es altamente resistente a la
presencia de varianzas desiguales.7 La Prueba de Welch es insensible a la igualdad
de las varianzas, independientemente de si los tamaños de muestra son similares.

 Los datos usados para llevar a cabo la prueba deben ser muestreados
independientemente para cada una de las dos poblaciones que se comparan. Esto en
general no es posible determinarlo a partir de los datos, pero si se conoce que los
datos han sido muestreados de manera dependiente (por ejemplo si fueron
muestreados por grupos), entonces la prueba t clásica que aquí se analiza, puede
conducir a resultados erróneos.

Pruebas t para dos muestras apareadas y desapareadas[editar]


Las pruebas-t de dos muestras para probar la diferencia en las medias pueden ser
desapareadas o en parejas. Las pruebas t pareadas son una forma de bloqueo estadístico,
y poseen un mayor poder estadístico que las pruebas no apareadas cuando las unidades
apareadas son similares con respecto a los "factores de ruido" que son independientes de
la pertenencia a los dos grupos que se comparan.[cita requerida] En un contexto diferente,
las pruebas-t apareadas pueden utilizarse para reducir los efectos de los factores de
confusión en un estudio observacional.
Desapareada[editar]
Las pruebas t desapareadas o de muestras independientes, se utilizan cuando se obtienen
dos grupos de muestras aleatorias, independientes e idénticamente distribuidas a partir de
las dos poblaciones a ser comparadas. Por ejemplo, supóngase que estamos evaluando el
efecto de un tratamiento médico, y reclutamos a 100 sujetos para el estudio. Luego
elegimos aleatoriamente 50 sujetos para el grupo en tratamiento y 50 sujetos para el grupo
de control. En este caso, obtenemos dos muestras independientes y podríamos utilizar la
forma desapareada de la prueba t. La elección aleatoria no es esencial en este caso, si
contactamos a 100 personas por teléfono y obtenemos la edad y género de cada una, y
luego se utiliza una prueba t bimuestral para ver en que forma la media de edades difiere
por género, esto también sería una prueba t de muestras independientes, a pesar de que
los datos son observacionales.
Apareada[editar]
Las pruebas t de muestras dependientes o apareadas, consisten típicamente en una
muestra de pares de valores con similares unidades estadísticas, o un grupo de unidades
que han sido evaluadas en dos ocasiones diferentes (una prueba tde mediciones
repetitivas). Un ejemplo típico de prueba t para mediciones repetitivas sería por ejemplo
que los sujetos sean evaluados antes y después de un tratamiento.
Una prueba 't basada en la coincidencia de pares muestrales se obtiene de una muestra
desapareada que luego es utilizada para formar una muestra apareada, utilizando para ello
variables adicionales que fueron medidas conjuntamente con la variable de interés.8
La valoración de la coincidencia se lleva a cabo mediante la identificación de pares de
valores que consisten en una observación de cada una de las dos muestras, donde las
observaciones del par son similares en términos de otras variables medidas. Este enfoque
se utiliza a menudo en los estudios observacionales para reducir o eliminar los efectos de
los factores de confusión.

Cálculos[editar]
Las expresiones explícitas que pueden ser utilizadas para obtener varias pruebas t se dan
a continuación. En cada caso, se muestra la fórmula para una prueba estadística que o
bien siga exactamente o aproxime a una distribución t de Student bajo la hipótesis nula.
Además, se dan los apropiados grados de libertad en cada caso. Cada una de estas
estadísticas se pueden utilizar para llevar a cabo ya sea un prueba de una cola o prueba
de dos colas.
Una vez que se ha determinado un valor t, es posible encontrar un valor p asociado
utilizando para ello una tabla de valores de distribución t de Student. Si el valor p calulado
es menor al límite elegido por significancia estadística (usualmente a niveles de
significancia 0,10; 0,05 o 0,01), entonces la hipótesis nula se rechaza en favor de la
hipótesis alternativa.
Prueba t para muestra única[editar]
En esta prueba se evalúa la hipótesis nula de que la media de la población estudiada es
igual a un valor especificado μ0, se hace uso del estadístico:

donde es la media muestral, s es la desviación estándar muestral y n es el tamaño


de la muestra. Los grados de libertad utilizados en esta prueba se corresponden al
valor n − 1.
Pendiente de una regresión lineal[editar]
Supóngase que se está ajustando el modelo:
donde xi, i = 1, ..., n son conocidos, α y β son desconocidos, y εi es el error aleatorio en los
residuales que se encuentra normalmente distribuido, con un valor esperado 0 y una
varianza desconocida σ2, e Yi, i = 1, ..., n son las observaciones.
Se desea probar la hipótesis nula de que la pendiente β es igual a algún valor
especificado β0 (a menudo toma el valor 0, en cuyo caso la hipótesis es que x e y no están
relacionados).
sea

Luego

tiene una distribución t con n − 2 grados de libertad si la hipótesis nula es verdadera. El


error estándar de la pendiente:

puede ser reescrito en términos de los residuales:

Luego se encuentra dado por:

Prueba t para dos muestras independientes[editar]


Iguales tamaños muestrales, iguales varianzas[editar]
Esta prueba se utiliza solamente cuando:

 los dos tamaños muestrales (esto es, el número, n, de participantes en cada grupo)
son iguales;
 se puede asumir que las dos distribuciones poseen la misma varianza.
Las violaciones a estos presupuestos se discuten más abajo.
El estadístico t a probar si las medias son diferentes se puede calcular como sigue:

Donde

,
es la desviación estándar combinada, 1 = grupo uno, 2 = grupo 2. El denominador de t es
el error estándar de la diferencia entre las dos medias.
Por prueba de significancia, los grados de libertad de esta prueba se obtienen como 2n − 2
donde n es el número de participantes en cada grupo.
Diferentes tamaños muestrales, iguales varianzas[editar]
Esta prueba se puede utilizar únicamente si se puede asumir que las dos distribuciones
poseen la misma varianza. (Cuando este presupuesto se viola, mirar más abajo). El
estadístico t si las medias son diferentes puede ser calculado como sigue:

Donde

Nótese que las fórmulas de arriba, son generalizaciones del caso que se da cuando
ambas muestras poseen igual tamaño (sustituyendo n por n1 y n2).

es un estimador de la desviación estándar común de ambas muestras: esto se


define así para que su cuadrado sea un estimador sin sesgo de la varianza común sea
o no la media iguales. En esta fórmula, n = número de participantes, 1 = grupo uno, 2
= grupo dos. n − 1 es el número de grados de libertad para cada grupo, y el tamaño
muestral total menos dos (esto es, n1 + n2 − 2) es el número de grados de libertad
utilizados para la prueba de significancia.
Diferentes tamaños muestrales, diferentes varianzas[editar]
Esta prueba es también conocida como prueba t de Welch y es utilizada únicamente
cuando se puede asumir que las dos varianzas poblacionales son diferentes (los
tamaños muestrales pueden o no ser iguales) y por lo tanto deben ser estimadas por
separado. El estadístico t a probar cuando las medias poblacionales son distintas
puede ser calculado como sigue:

donde

Aquí s2 es el estimador sin sesgo de la varianza de las dos muestras, n = número de

participantes, 1 = grupo uno, 2 = grupo dos. Nótese que en este caso, no es la


varianza combinada. Para su utilización en pruebas de significancia, la distribución de
este estadístico es aproximadamente igual a una distribución t ordinaria con los grados
de libertad calculados según:

Esta ecuación es llamada la ecuación Welch–Satterthwaite. Nótese que la verdadera


distribución de este estadístico de hecho depende (ligeramente) de dos varianzas
desconocidas.
Prueba t dependiente para muestras apareadas[editar]
Esta prueba se utiliza cuando las muestras son dependientes; esto es, cuando se trata
de una única muestra que ha sido evaluada dos veces (muestras repetidas) o cuando
las dos muestras han sido emparejadas o apareadas. Este es un ejemplo de un test de
diferencia apareada.
Para esta ecuación, la diferencia D entre todos los pares tiene que ser calculada. Los
pares se han formado ya sea con resultados de una persona antes y después de la
evaluación o entre pares de personas emparejadas en grupos de significancia (por
ejemplo, tomados de la misma familia o grupo de edad: véase la tabla). La media (XD)
y la desviación estándar (sD) de tales diferencias se han utilizado en la ecuación. La
constante μ0 es diferente de cero si se desea probar si la media de las diferencias es
significativamente diferente de μ0. Los grados de libertad utilizados son n − 1.

Ejemplo de muestras repetidas Ejemplo de pares emparejados

Número Nombre Test 1 Test 2 Par Nombre Edad Test

1 Miguel 35% 67% 1 Juan 35 250

2 Melanie 50% 46% 1 Joana 36 340

3 Melisa 90% 86% 2 Jaimito 22 460

4 Michell 78% 91% 2 Jesica 21 200

Ejemplos desarrollados[editar]
Sea A1 denotando un grupo obtenido tomando 6 muestras aleatorias a partir de un
grupo mayor:

y sea A2 denotando un segundo grupo obtenido de manera similar:

Estos podrían ser, por ejemplo, los pesos de tornillos elegidos de un montón.
Vamos a llevar a cabo la prueba de hipótesis contando como hipótesis nula de que
la media de las poblaciones de las cuales hemos tomado las muestras son iguales.

La diferencia entre las dos medias de muestras, cada uno denotado por , la cual
aparece en el numerador en todos los enfoques de dos muestras discutidas
anteriormente, es

La desviaciones estándar muestrales para las dos muestras son aproximadamente


0,05 y 0,11 respectivamente. Para muestras tan pequeñas, una prueba de igualdad
entre las varianzas de las dos poblaciones no es muy poderoso. Pero ya que los
tamaños muestrales son iguales, las dos formas de las dos pruebas t se pueden
desarrollar en forma similar en este ejemplo.
Varianzas desiguales[editar]
Si se decide continuar con el enfoque para varianzas desiguales (discutido
anteriormente), los resultados son
y

El resultado de la prueba estadística es aproximadamente 1,959. El valor p para la


prueba de dos colas da un valor aproximado de 0,091 y el valor p para la prueba de
una cola es aproximadamente 0,045.
Varianzas iguales[editar]
Si se sigue el enfoque para varianzas iguales (discutido anteriormente), los resultados
son

Ya que el tamaño de las muestras es igual (ambas tienen 6 elementos), el resultado


de la prueba estadística es nuevamente un valor que se aproxima a 1.959. Debido a
que los grados de libertad son diferentes de la prueba para varianzas desiguales, los
valores P difieren ligeramente de los obtenidos un poco más arriba. Aquí el
valor p para la prueba de dos colas es aproximadamente 0,078, y el valor p para una
cola es aproximadamente 0,039. Así, si hubiera una buena razón para creer que las
varianzas poblacionales son iguales, los resultados serían algo más sugerentes de
una diferencia en los pesos medios de las dos poblaciones de tornillos.

Alternativas a la prueba t para problemas de


locación[editar]
La prueba t provee un mecanismo exacto para evaluar la igualdad entre las medias de
dos poblaciones que tengan varianzas iguales, aunque el valor exacto de las mismas
sea desconocido. El test de Welch es una prueba aproximadamente exacta para el
caso en que los datos poseen una distribución normal, pero las varianzas son
diferentes. Para muestras moderadamente grandes y pruebas de una cola, el
estadístico t es moderadamente robusto a las violaciones de la asunción de
normalidad.9
Para ser exactos tanto las pruebas t como las z requiere que las medias de las
muestras sigan una distribución normal, y la prueba t adicionalmente requiere que la
varianza de las muestras siga una distribución Chi-cuadrado (χ2), y que la media
muestral y la varianza muestral sean estadísticamente independientes. La normalidad
de los valores individuales de los datos no es un requisito para que estas condiciones
se cumplan. Por el teorema del límite central, las medias muestrales de muestras
moderadamente grandes también aproximan una distribución normal, incluso si los
datos individuales no están normalmente distribuidos. Para datos no normales, la
distribución de la varianza muestral puede desviarse sustancialmente de una
distribución χ2. Sin embargo, si el tamaño muestral es grande, el teorema de
Slutsky indica que la distribución de las varianzas muestrales ejerce un efecto muy
pequeño en la distribución de la prueba estadística. Si los datos son substancialmente
no normales, y el tamaño muestral es pequeño, la prueba t puede entregar resultados
equivocados.
Cuando la asunción de normalidad no se sostiene, una alternativa no paramétrica a la
prueba t puede ofrecer un mejor poder estadístico. Por ejemplo, para dos muestras
independientes cuando la distribución de datos es asimétrica (esto es, que la
distribución está sesgada) o la distribución tiene colas muy grandes, entonces el test
de suma de posiciones (ranks) de Wilcoxon (conocido también como prueba U de
Mann-Whitney) puede tener de tres a cuatro veces mayor poder estadístico que una
prueba t.91011
La contraparte no paramétrica a la prueba t de muestras apareadas es la prueba
Wilcoxon de suma de posiciones con signo para muestras pareadas. Para una
discusión sobre cuando hacer una elección entre las alternativas t y no paramétricos,
consulte a Sawilowsky.12
El análisis de varianza "one-way" generaliza la prueba t de dos muestras para casos
donde los datos pertenecen a más que dos grupos.

Pruebas multivariadas[editar]
Una generalización del estadístico t de Student llamada estadístico t cuadrado de
Hotelling, permite la comprobación de hipótesis en múltiples (y a menudo
correlacionadas) mediciones de la misma muestra. Por ejemplo, un investigador puede
presentar un número de sujetos a un test de múltiples escalas de personalidad (p.ej el
de cinco grandes rasgos de personalidad). Debido a que las medidas de este tipo
suelen estar muy correlacionadas, no es aconsejable llevar a cabo varias pruebas
univariadas, ya que esto supondría descuidar la covarianza entre las medidas e inflar
la probabilidad de rechazar falsamente al menos una hipótesis (error de tipo I). En este
caso una única prueba múltiple es preferible para llevar a cabo las pruebas de
hipótesis. El estadístico t de Hosteling sigue una distribución T 2, sin embargo en la
práctica, esta distribución se utiliza muy raramente, y en cambio se suele convertir en
una distribución de tipo F.
Prueba T 2 monomuestral[editar]
Para una prueba multivariable de única muestra, la hipótesis es que el vector medio (

) es igual a un vector ( ) dado. La prueba estadística se define como:

Donde n es el tamaño muestral, es el vector de columnas medio

y una matriz de covarianza muestral .


Prueba T 2 bimuestral[editar]
Para un test multivariable de dos muestras, la hipótesis es que los vectores medios (

, ) de las dos muestras son iguales. La prueba estadística se define como:

Implementaciones[editar]
La mayoría de los programas tipo hoja de cálculo y paquetes estadísticos de lenguajes
de programación, tales como QtiPlot,OpenOffice.org Calc, LibreOffice
Calc, LISREL, Microsoft
Excel, SAS, SPSS, Stata, DAP, gretl, R, Python ([1]), PSPP,Infostat y Minitab, y
PRISMA6 incluyen implementaciones del test t de Student.

Lecturas adicionales[editar]
 Boneau, C. Alan (1960). «The effects of violations of assumptions underlying
the t test». Psychological Bulletin 57 (1): 49-64. doi:10.1037/h0041412.
 Edgell, Stephen E., & Noon, Sheila M (1984). «Effect of violation of normality on
the t test of the correlation coefficient».Psychological Bulletin 95 (3): 576-
583. doi:10.1037/0033-2909.95.3.576.

Referencias[editar]
1. Volver arriba↑ Richard Mankiewicz, The Story of Mathematics (Princeton University
Press), p.158.
2. ↑ Saltar a:a b O'Connor, John J.; Robertson, Edmund F., «Prueba t de Student»(en
inglés), MacTutor History of Mathematics archive, Universidad de Saint Andrews.
3. Volver arriba↑ Fisher Box, Joan (1987). «Guinness, Gosset, Fisher, and Small
Samples». Statistical Science 2 (1): 45-52. JSTOR 2245613.doi:10.1214/ss/1177013437.
4. Volver arriba↑ Raju TN (2005). «William Sealy Gosset and William A. Silverman: two
"students" of science». Pediatrics 116(3): 732-5. PMID 16140715.doi:10.1542/peds.2005-1134.
5. ↑ Saltar a:a b Fadem, Barbara (2008). High-Yield Behavioral Science (High-Yield
Series). Hagerstwon, MD: Lippincott Williams & Wilkins. ISBN 0-7817-8258-9.
6. Volver arriba↑ Zimmerman, Donald W. (1997). «A Note on Interpretation of the Paired-
Samples t Test». Journal of Educational and Behavioral Statistics22 (3): 349-
360. JSTOR 1165289.
7. Volver arriba↑ Markowski, Carol A; Markowski, Edward P. (1990). «Conditions for the
Effectiveness of a Preliminary Test of Variance». The American Statistician44 (4): 322-
326. JSTOR 2684360.doi:10.2307/2684360.
8. Volver arriba↑ David, HA; Gunnink, Jason L (1997). «The Paired t Test Under Artificial
Pairing». The American Statistician 51 (1): 9-12.JSTOR 2684684.doi:10.2307/2684684.
9. ↑ Saltar a:a b Sawilowsky S., Blair R. C. (1992). «A more realistic look at the robustness
and type II error properties of the t test to departures from population
normality».Psychological Bulletin 111 (2): 353-360. doi:10.1037/0033-2909.111.2.352.
10. Volver arriba↑ Blair, R. C.; Higgins, J.J. (1980). «A comparison of the power of
Wilcoxon’s rank-sum statistic to that of Student’s t statistic under various nonnormal
distributions.». Journal of Educational Statistics 5 (4): 309-
334.JSTOR 1164905.doi:10.2307/1164905.
11. Volver arriba↑ Fay, MP; Proschan, MA (2010).«Wilcoxon-Mann-Whitney or t-test? On
assumptions for hypothesis tests and multiple interpretations of decision
rules». Statistics Surveys4: 1-39. PMC 2857732.PMID 20414472. doi:10.1214/09-SS051.
12. Volver arriba↑ Sawilowsky S (2005). «Misconceptions leading to choosing the t test
over the Wilcoxon Mann-Whitney U test for shift in location parameter». Journal of
Modern Applied Statistical Methods 4 (2): 598-600.

 O'Mahony, Michael (1986). Sensory Evaluation of Food: Statistical Methods and


Procedures. CRC Press. p. 487. ISBN 0-824-77337-3.
 Press, William H.; Saul A. Teukolsky, William T. Vetterling, Brian P. Flannery
(1992). Numerical Recipes in C: The Art of Scientific Computing. Cambridge
University Press. pp. p. 616. ISBN 0-521-43108-5.

Enlaces externos[editar]
 Wikiversidad alberga proyectos de aprendizaje sobre Prueba t de Student.
 Un artículo conceptual sobre el test t de Student
 Tabla de distribuciones t de Student
Calculadores en línea[editar]

 Realizar un test-T online: test-T

UNIDAD III

TEORIA DE PEQUEÑAS MUESTRAS O TEORIA EXACTA DEL


MUESTREO

En las unidades anteriores se manejó el uso de la distribución z, la


cual se podía utilizar siempre y cuando los tamaños de las muestras
fueran mayores o iguales a 30 ó en muestras más pequeñas si la
distribución o las distribuciones de donde proviene la muestra o las
muestras son normales.

En esta unidad se podrán utilizar muestras pequeñas siempre y


cuando la distribución de donde proviene la muestra tenga un
comportamiento normal. Esta es una condición para utilizar las tres
distribuciones que se manejarán en esta unidad; t de student, X2 ji-
cuadrada y Fisher.

A la teoría de pequeñas muestras también se le llama teoría exacta


del muestreo, ya que también la podemos utilizar con muestras
aleatorias de tamaño grande.

En esta unidad se verá un nuevo concepto necesario para poder


utilizar a las tres distribuciones mencionadas. Este concepto es
"grados de libertad".

Para definir grados de libertad se hará referencia a la varianza


muestral:
Esta fórmula está basada en n-1 grados de libertad (degrees of
freedom). Esta terminología resulta del hecho de que si bien s2 está
basada en n cantidades ..., éstas suman cero,
así que especificar los valores de cualquier n-1 de las cantidades
determina el valor restante. Por ejemplo, si n=4 y

; y , entonces automáticamente
tenemos , así que sólo tres de los cuatro valores
de están libremen te determinamos 3 grados de libertad.

Entonces, en esta unidad la fórmula de grados de libertad será n-1 y


su simbología

DISTRIBUCION "t DE STUDENT"

Supóngase que se toma una muestra de una población normal con


media y varianza Si es el promedio de las n observaciones
que contiene la muestra aleatoria, entonces la

distribución es una distribución normal estándar.


Supóngase que la varianza de la población es desconocida.
¿Qué sucede con la distribución de esta estadística si se
reemplaza por s? La distribución t proporciona la respuesta a esta
pregunta.

La media y la varianza de la distribución t son


 y para >2, respectivamente.

La siguiente figura presenta la gráfica de varias distribuciones t. La


apariencia general de la distribución t es similar a la de la distribución
normal estándar: ambas son simétricas y unimodales, y el valor
máximo de la ordenada se alcanza en la media  Sin embargo,
la distribución t tiene colas más amplias que la normal; esto es, la
probabilidad de las colas es mayor que en la distribución normal. A
medida que el número de grados de libertad tiende a infinito, la forma
límite de la distribución t es la distribución normal estándar.
Propiedades de las distribuciones t

1. Cada curva t tiene forma de campana con centro en 0.


2. Cada curva t, está más dispersa que la curva normal estándar z.
3. A medida que aumenta, la dispersión de la curva t
correspondiente disminuye.
4. A medida que , la secuencia de curvas t se aproxima a
la curva normal estándar, por lo que la curva z recibe a veces el
nombre de curva t con gl =

La distribución de la variable aleatoria t está dada por:

Esta se conoce como la distribución t con grados de libertad.

Sean X1, X2, . . . , Xn variables aleatorias independientes que son


todas normales con media y desviación estándar . Entonces la

variable aleatoria tiene una distribución t con = n-1 grados


de libertad.

La distribución de probabilidad de t se publicó por primera vez en 1908


en un artículo de W. S. Gosset. En esa época, Gosset era empleado
de una cervecería irlandesa que desaprobaba la publicación de
investigaciones de sus empleados. Para evadir esta prohibición,
publicó su trabajo en secreto bajo el nombre de "Student". En
consecuencia, la distribución t normalmente se llama distribución t de
Student, o simplemente distribución t. Para derivar la ecuación de esta
distribución, Gosset supone que las muestras se seleccionan de una
población normal. Aunque esto parecería una suposición muy
restrictiva, se puede mostrar que las poblaciones no normales que
poseen distribuciones en forma casi de campana aún proporcionan
valores de t que se aproximan muy de cerca a la distribución t.

La distribución t difiere de la de Z en que la varianza de t depende del


tamaño de la muestra y siempre es mayor a uno. Unicamente cuando
el tamaño de la muestra tiende a infinito las dos distribuciones serán
las mismas.

Se acostumbra representar con el valor t por arriba del cual se


encuentra un área igual a . Como la distribución t es simétrica

alrededor de una media de cero, tenemos ; es decir, el


valor t que deja un área de a la derecha y por tanto un área
de a la izquierda, es igual al valor t negativo que deja un área
de en la cola derecha de la distribución. Esto es, t0.95 = -t0.05, t0.99=-
t0.01, etc.

Para encontrar los valores de t se utilizará la tabla de valores críticos


de la distribución t del libro Probabilidad y Estadística para Ingenieros
de los autores Walpole, Myers y Myers.

Ejemplo:

El valor t con = 14 grados de libertad que deja un área de 0.025 a la


izquierda, y por tanto un área de 0.975 a la derecha, es

t0.975=-t0.025 = -2.145
Si se observa la tabla, el área sombreada de la curva es de la cola
derecha, es por esto que se tiene que hacer la resta de . La
manera de encontrar el valor de t es buscar el valor de en el
primer renglón de la tabla y luego buscar los grados de libertad en la
primer columna y donde se intercepten y se obtendrá el valor
de t.

Ejemplo:

Encuentre la probabilidad de –t0.025 < t < t0.05.

Solución:

Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de


0.025 a la izquierda, encontramos un área total de 1-0.05-0.025 =
0.925.

P( –t0.025 < t < t0.05) = 0.925

Ejemplo:

Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra
aleatoria de tamaño 15 que se selecciona de una distribución normal.

Solución:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad


nos damos cuenta que a este valor le corresponde un área de 0.05 a
la izquierda, por ser negativo el valor. Entonces si se resta 0.05 y
0.045 se tiene un valor de 0.005, que equivale a Luego se busca
el valor de 0.005 en el primer renglón con 14 grados de libertad y se
obtiene un valor de t = 2.977, pero como el valor de está en el
extremo izquierdo de la curva entonces la respuesta es t = -2.977 por
lo tanto:

P(-2.977 < t < -1.761) = 0.045

Ejemplo:

Un ingeniero químico afirma que el rendimiento medio de la población


de cierto proceso en lotes es 500 gramos por milímetro de materia
prima. Para verificar esta afirmación toma una muestra de 25 lotes
cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda
satisfecho con su afirmación. ¿Qué conclusión extraería de una
muestra que tiene una media de 518 gramos por milímetro y una
desviación estándar de 40 gramos? Suponga que la distribución de
rendimientos es aproximadamente normal.

Solución:

De la tabla encontramos que t0.05 para 24 grados de libertad es de


1.711. Por tanto, el fabricante queda satisfecho con esta afirmación si
una muestra de 25 lotes rinde un valor t entre –1.711 y 1.711.

Se procede a calcular el valor de t:

Este es un valor muy por arriba de 1.711. Si se desea obtener la


probabilidad de obtener un valor de t con 24 grados de libertad igual o
mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De
aquí que es probable que el fabricante concluya que el proceso
produce un mejor producto del que piensa.

INTERVALO DE CONFIANZA PARA ; CON DESCONOCIDA

Si y s son la media y la desviación estándar de una muestra


aleatoria de una población normal con varianza , desconocida, un
intervalo de confianza de
( )100% para es:
donde /2 es el valor t con = n-1 grados de libertad, que deja un
área de /2 a la derecha.

Se hace una distinción entre los casos de conocida


y desconocida al calcular las estimaciones del intervalo de
confianza. Se debe enfatizar que para el primer caso se utiliza el
teorema del límite central, mientras que para desconocida se hace
uso de la distribución muestral de la variable aleatoria t. Sin embargo,
el uso de la distribución t se basa en la premisa de que el muestreo se
realiza de una distribución normal. En tanto que la distribución tenga
forma aproximada de campana, los intervalos de confianza se pueden
calcular cuando la varianza se desconoce mediante el uso de la
distribución t y se puede esperar buenos resultados.

Con mucha frecuencia los estadísticos recomiendan que aun cuando


la normalidad no se pueda suponer, con desconocida y n 30, s
puede reemplazar a y se puede utilizar el intervalo de confianza:

Por lo general éste se denomina como un intervalo de confianza de


muestra grande. La justificación yace sólo en la presunción de que con
una muestra grande como 30, s estará muy cerca de la real y de
esta manera el teorema del límite central sigue valiendo. Se debe
hacer énfasis en que esto es solo una aproximación y que la calidad
de este enfoque mejora a medida que el tamaño de la muestra crece
más.

Ejemplos:

1. El contenido de siete contenedores similares de ácido sulfúrico


son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Encuentre un
intervalo de confianza del 95% para la media de todos los
contenedores si se supone una distribución aproximadamente
normal.

Solución:
La media muestral y la desviación estándar para los datos dados
son:

10 y s= 0.283

En la tabla se encuentra que t0.025=2.447 con 6 grados de


libertad, de aquí, el intervalo de confianza de 95% para es:

Con un nivel de confianza del 95% se sabe que el promedio del


contenido de los contenedores está entre 9.47 y 10.26 litros.

2. Un artículo publicado en el Journal of Testing and


Evaluation presenta las siguientes 20 mediciones del tiempo de
combustión residual en segundos de especímenes tratados de
ropa de dormir para niños:

9.85 9.93 9.75 9.77 9.67

9.87 9.67 9.94 9.85 9.75

9.83 9.92 9.74 9.99 9.88

9.95 9.95 9.93 9.92 9.89

Se desea encontrar un nivel de confianza del 95% para el


tiempo de combustión residual promedio. Supóngase que el
tiempo de combustión residual sigue una distribución normal.

Solución:

La media muestral y la desviación estándar para los datos dados son:

9.8525 y s= 0.0965
En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de
aquí, el intervalo de confianza de 95% para es:

Por lo tanto, se tiene una confianza del 95% de que el tiempo de


combustión residual promedio se encuentra entre 9.8073 y 9.8977
segundos.
PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL, VARIANZA
DESCONOCIDA

Ciertamente sospechamos que las pruebas sobre una media


poblacional con desconocida, debe incluir el uso de la
distribución t de Student. La estructura de la prueba es idéntica a la
del caso de conocida, con la excepción de que el valor en la
estadística de prueba se reemplaza por la estimación de s calculada y
la distribución normal estándar se reemplaza con una distribución t.

Ejemplos:

1. El Instituto Eléctrico Edison publica cifras del número anual de


Kilowatt-hora que gastan varios aparatos eléctrodomésticos. Se
afirma que una aspiradora gasta un promedio de 46 kilowatt-
hora al año. Si una muestra aleatoria de 12 hogares que se
incluye en un estudio planeado indica que las aspiradoras
gastan un promedio de 42 kilowatt-hora al año con una
desviación estándar de11.9 kilowatt-hora, ¿esto sugiere con un
nivel de significancia de 0.05 que las aspiradoras gastan, en
promedio, menos de 46 kilowatt-hora anualmente? Suponga que
la población de kilowatt-hora es normal.

Solución:
1. Datos:
= 46 kilowatt-hora

s= 11.9 kilowatt-hora

= 42 kilowatt-hora

n = 12

= 0.05

3. Ensayo de hipótesis

Ho; = 46 kilowatt-hora

H1; < 46 kilowatt-hora

4. Regla de decisión:

Si tR -1.796 No se rechaza Ho

Si tR < -1.796 Se rechaza Ho

5. Cálculos:

6. Justificación y decisión:

Como –1.16 > -1.796, por lo tanto no se rechaza Ho y se


concluye con un nivel de significancia del 0.05 que el número
promedio de kilowwatt-hora que gastan al año las aspiradoras
no es significativamente menor que 46.

Solución por el otro método:


Regla de decisión:

Si 39.83 No se Rechaza Ho

Si < 39.83 Se rechaza Ho

Como la = 42 y este valor no es menor que 39.83 por lo tanto no se


rechaza Ho.

Se puede aprovechar este ejemplo para calcular el valor de P , como


el valor de t calculada es de –1.16, se busca en la tabla y se ve que el
area a la izquierda de este valor es de 0.135 con 11 grados de
libertad, por lo tanto no se rechaza Ho., ya que sería un valor alto para
un nivel de significancia.

1. Un artículo publicado en la revista Materials


Engineering describe los resultados de pruebas de resistencia a
la adhesión de 22 especímenes de aleación U-700. La carga
para la que cada especímen falla es la siguiente en MPa:

19.8 18.5 17.6 16.7 15.8

15.4 14.1 13.6 11.9 11.4


11.4 8.8 7.5 15.4 15.4

19.5 14.9 12.7 11.9 11.4

10.1 7.9

¿Sugieren los datos que la carga promedio de falla es mayor


que 10Mpa? Supóngase que la carga donde se presenta la falla
tiene una distribución normal, y utilicese = 0.05. Calcule el
valor de P.

Solución:
1. Datos:

= 10

s = 3.55

= 13.71

n = 22

= 0.05

3. Ensayo de hipótesis

Ho; = 10

H1; > 10

4. Regla de decisión:

Si tR 1.721 no se rechaza Ho.

Si tR> 1.721 se rechaza Ho.

5. Cálculos:
6. Justificación y decisión.

Como 4.90 >1.721 se rechaza Ho y se concluye con un nivel de


significancia del 0.05 que la carga de falla promedio es mayor
que 10Mpa.

Existe otra manera de resolver este ejercicio, tomando la decisión en


base al estadístico real, en este caso la media de la muestra. De la
fórmula de la distribución muestral de medias se despeja la media de
la muestra:

Regla de decisión:

Si 11.30 No se rechaza Ho

Si > 11.30 Se rechaza Ho

Como la media de la muestral es de 13.71 MPa y es mayor al valor de


la media muestral límite de 11.30 por lo tanto se rechaza Ho y se llega
a la misma conclusión.

Para calcular el valor de P se va a la tabla y se busca en 21 grados de


libertad el valor de t = 4.90. Se obseva que el valor mayor de t que se
encuentra en la tabla con 21 grados de libertad es de 3.819 el cual le
corresponde un área a la derecha de 0.0005, por lo que para el valor
de 4.90 el valor de P es practicamente cero, y esto apoya la
decisión de rechazar Ho.
3. Los pesos en libras de una muestra aleatoria de bebés de seis
meses son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Haga
una prueba con nivel de 5% de significancia para determinar si
el peso promedio de todos los bebés de seis meses es distinto a
14 libras, suponga que sus pesos se distribuyen normalmente y
calcule el valor de P.

Solución:
1. Datos:

= 14 libras

s = 1.21 libras

= 14.3 libras

n=8

= 0.05

2. Ensayo de hipótesis

Ho; = 14 libras

H1; 14 libras

3. Regla de Decisión:

Si –2.365 tR 2.365 No se rechaza Ho

Si tR < -2.365 ó si tR > 2.365 Se rechaza Ho

4. Cálculos:
5. Justificación y decisión:

Como –2.365 0.7012 2.365 por lo tanto, no se rechaza Ho y


se concluye con un nivel de significancia del 0.05 que el peso
promedio de todos los bebés de seis meses es de 14 libras.

Solución por el otro método:

12.98 y 15.01

Regla de decisión:

Si 12.98 15.01 No se rechaza Ho

Si < 12.98 ó > 15.01 se rechaza Ho

Como la = 14.3 libras, entonces no se rechaza Ho .

Para calcular el valor de P se busca en la tabla el valor de 0.7012 con


7 grados de libertad. Se obseva que este valor no se encuentra pero
se puede interpolar entre los valores de 0.549 y 0.896 con áreas de
0.30 y 0.20 respectivamente. Interpolando linealmente se obtiene el
valor de 0.2561.
Error tipo II ó

El error tipo II se calcula de la misma forma en la que se calculó con la


distribución z. Se realizarán algunos ejercicios en los cuales se
determinará la probabilidad de cometer el error tipo II, utilizando la
tabla de la distribución.

Existen curvas características de operación en los libros con diferentes


grados de libertad para determinar los tamaños de muestra
correspondientes según el grado de error que se quiera, recordando
que entre mayor sea el tamaño de muestra menor será el error.

1. Se sabe que los voltajes de una marca de pilas tamaño C se


distribuyen normalmente, se probó una muestra aleatoria de 15
y se encontró que la media es de 1.4 volts con una desviación
estándar de 0.21 volts. En el nivel de significancia de 0.01:

a. ¿Indica esto que la media de los voltajes es menor que 1.5


volts?
b. Calcular la probabilidad de cometer el error tipo II si el voltaje
promedio real de las pilas es de 1.3 volts.

Solución:
1. Datos:

= 1.5 volts.

s= 0.21 volts

= 1.4 volts.

n = 15

= 0.01

2. Ensayo de hipótesis
Ho; = 1.5 volts

H1; < 1.5 volts

3. Regla de decisión:

Si tR -2.624 No se rechaza Ho

Si tR < -2.624 Se rechaza Ho

5. Cálculos:

6. Justificación y decisión:

Como –1.84 > -2.624, por lo tanto no se rechaza Ho y se


concluye con un nivel de significancia del 0.01 que los voltajes
de las pilas tamaño C no son menores a 1.5.

Para calcular el error tipo II se tiene que obtener el valor de de la


siguiente forma:
Para encontrar el valor de se busca en la tabla de la distribución t el
valor de 1.05 con 14 grados de libertad. Como este valor no se
encuentra en la tabla se interpola entre 0.868 y 1.076 con un área de
0.20 y 0.15 respectivamente. Al interpolar se obtiene un área de
0.15612 y esta es la probabilidad de cometer el error tipoII cuando la
media verdadera es de 1.3 volts y un tamaño de muestra de 15.

2. Para el ejercicio del peso de los bebés de 6 meses, calcular el


error tipo II, si los pesos verdaderos hubieran sido de 11 y 14.5
libras.

Solución:

Primero se calculan los valores de :


En este último cálculo para se tendrá que analizar las áreas de los
dos extremos, pues estas no están dentro de la región de aceptación,
por lo tanto no se deben de tomar en cuenta para el error tipo II.

Se busca en la tabla el valor de 3.55 con 7 grados de libertad, y al


interpolar nos da un área de 0.00475. El área correspondiente a 1.19
con 7 grados de libertad es de 0.1479. Por lo que =1-
(0.00475+0.1479)= 0.8473

3. Para el ejercicio en donde se dan los resultados de pruebas de


resistencia a la adhesión de 22 especímenes de aleación U-
700., encontrar la probabilidad de cometer el error tipo II si la
carga promedio de falla es igual a 11.

Solución:

Primero se obtendrá el valor del estadístico límite:


Distribución T de Students.
Tiene características similares a la distribución normal, su diferencia principal radica en las áreas de los
extremos las cuales son más amplias, como consecuencia de que usualmente se trabaja con muestras
pequeñas. La sintaxis en Excel es: DISTR.T(x;grados_de_libertad;colas)
X es el valor numérico al que se ha de evaluar la distribución. Grados_de_libertad es un entero que indica
el número de grados de libertad. Colas especifica el número de colas de la distribución que se ha de
devolver. Toma los valores de 1 o 2.

El nombre de la distribución se debe a su autor W.S. Gosset, quien le dio el seudónimo


de T de Student ante la imposibilidad de presentar sus trabajos so pena de perder su
empleo, esto sucedió a principio del siglo XX.
Esta distribución es recomendada cuando se requiere estimar la media poblacional y no
se conoce la desviación estándar y por lo tanto, hay que estimarla, eso si, siempre y
cuando la distribución original sea aproximadamente normal.
Otro término utilizado en ésta distribución continua, es el de grados de libertad (g.l), el
cual de manera intuitiva se expone así:
Y= x ± x ± x ± x , para satisfacer la ecuación, tres variables se pueden cambiar a
1 2 3 4

libertad, pero un de ellos no, por eso, cuando se tiene una sola muestra, se hable de n-1
g.l. A medida que se aumenten los g.l. la distribución t, se aproxima a la distribución Z
de la normal. Otra lectura que se puede dar es que los g.l es una medida del número de
observaciones independientes en la muestra, que se usan para estimar la desviación
estándar.
En general, cuando el tamaño de muestra no sea muy pequeño y la simetría no sea alta,
se puede usar para estimar la media poblacional cuando no se conoce la desviación.
En general, las características relevantes del modelo se sintetizan en la siguiente
diapositiva.
TABLA DE LA DISTRIBUCION t - Student
La tabla da áreas 1 - a , para valores menores o iguales a t y n g.l, se construyó con Excel.
1-a
n 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032

6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707


7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169

11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106


12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947

16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921


17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787

26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779


27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750

40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704


60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
¥ 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576

Es importante resaltar que al ser una distribución simétrica al tener información sobre
un valor positivo, se obtiene el dato para el mismo valor con signo negativo.
Un hecho de relevancia significativa, es que se utiliza para calcular probabilidades con
respecto al promedio, en estos casos, el divisor al estandarizar los valores se divide
sobre S/ Ö n, término que se conoce como el error estándar de la media y mide la
variabilidad de la media entre muestra y muestra. A mayor tamaño de muestra, menor es
el error estándar de la media.
Por último, se puede afirmar, la distribución t es útil para realizar inferencias acerca de
la media poblacional cuando no se conoce s y la población es normal, independiente del
n, no obstante, aún cuando la distribución sea un tanto sesgada, la t sigue siendo
apropiada, esto se conoce como una distribución robusta, es decir, a cambios moderados
de los supuestos, el modelo sigue siendo valido. Como en el caso de la distribución
normal, ésta distribución también usa valores tabulados, tal como se aprecian en la tabla
precedente, teniendo en cuenta, que a medida que los g.l aumenten los valores tienden a
ser igual a los encontrados en la tabla Z.
Ejemplo 1: Los valores de las matriculas de estudiantes en una universidad privada
tienen un comportamiento aproximadamente normal, donde el promedio es de
2.100.000. Se seleccionan 8 liquidaciones, siendo los valores los siguientes: 1.950.000,
2.100.000, 2.250.000, 1.890.000, 2.250.000, 1.950.000, 2.050.000, 2.350.000.
Determine la probabilidad de que:
· El promedio sea menor de 2.000.000.
· El promedio se encuentre entre 2.000.000 y 2.200.000
· El promedio sea mayor o igual a 2.500.000
Solución manual:
Sea X = Liquidación matriculas.
m = 2.100.000 ; s = ?
=2.098.750 s=168.644.8085 n=8
a) P( <2.000.000)=P( <2.000.000)
P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)
La probabilidad se encuentra entre 0.9 y 0.95, según la tabla T que se encuentra más
adelante, no obstante, al t ser negativo, la probabilidad está entre 0.1 y 0.05, es decir, los
valores complementarios..
Para buscar en la tabla, se tiene en cuenta la fila con 7 g.l y se ubica el 1.677, el cual se encuentra entre
los valores mencionados. De ahí que sea importante utilizar el Excel, que nos permite calcular la
probabilidad exacta.

b) P (2.000.000 < < 2.200.000)= P( <2.200.000) ? P( £ 2.000.000).


Luego de tipificar, se tiene:
P(t<3.35) ? P(t<-1.677) = 0.995 ?0.075= 0.92
Existe una alta probabilidad de que el promedio de las matriculas se encuentre entre 2.000.000 y
2.200.000.

c) P( >2.500.000)= P(t> 6.70) = 1- P(t< 6.70)= 1-1=0


Dado que el valor de 6.70 es mucho mayor que el ubicado en la tabla de 3.49 y
corresponde a 0.995, es claro, entonces, que para valores mayores de 3.49, la
probabilidad será de 1.
Por lo tanto, la probabilidad de que el promedio de matricula sea superiora a 2.500.000
es cero.
Solución Excel:
a) P( <2.000.000)=P( <2.000.000)
P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)
Como se dijo utilizando la tabla, la probabilidad está entre 0.1 y 0.05. La probabilidad exacta es de
0.0687. Es decir, la probabilidad de que el promedio de matricula que pagan los estudiantes sea menor de
2.000.000 es baja.

=DISTR.T(1.677;7;1)= 0.0687
b) P (2.000.000 < < 2.200.000)= P( <2.200.000) ? P( £ 2.000.000).
Luego de tipificar, se tiene:
P(t<3.35) ? P(t<-1.677) = 0.995 ?0.075= 0.92
(1- =DISTR.T(3.35;7;1) - =DISTR.T(1.677;7;1)= ?
(1- 0.006125) ? 0.06872 = 0.9251
Los resultados son similares a los ya presentados. Por la forma de calcular el Excel las probabilidades, se
resta a uno la probabilidad de 3.35, es decir, el programa calcula la cola de la derecha.
c) P( >2.500.000)= P(t> 6.70) = =DISTR.T(6.7;7;1) = 0.00013
Se observa fácil, que el Excel permite calcular las probabilidades de manera más
exactas que las usadas comúnmente (tablas). Esto es importante tenerlo en cuenta, ya
que cuando se tienen poblaciones muy grandes, esas pequeñas diferencias se convierten
en significativas.
Ejemplo 2: Los puntajes de un grupo de estudiantes se comportan normal, con
promedio de 50, sin embargo, no se conoce la desviación. Se tomó una m.a de 9
estudiantes encontrando una varianza de 36 y un promedio de 52. Cuál es la
probabilidad de que el promedio:
· Sea mayor de 54?
· Sea menor que 54?
· Esté comprendido entre 48 y 52 puntos?
Solución manual:
Sea X = Puntaje estudiantes.
m = 50 puntos ; s = ?
=52 s =36 s=6 n=9
2

a) P( >54)=1- P(t<(54-50)/(6/3)) = 1- P(t<2) = 1- 0.9625 = 0.0375


1-a
n 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355

Como se observa en la tabla, el 2.0 se encuentra entre 1.86 y 2.306, valores que
corresponden a las áreas de 0.95 y 0.975. Realizando una estimación burda, se
promedian los dos valores correspondientes a las áreas. Encontrando que la probabilidad
de que el promedio del puntaje de los estudiantes sea mayor de 54 es muy baja, 0.0375.
c) P( <54)= P(t<(54-50)/(6/3)) = P(t<2) = 0.9625. Por el contrario de lo anterior, es muy
probable que el promedio del puntaje de los estudiantes sea menor de 54, dicha
probabilidad equivale al 0.9625.
d) P(48< >52)=P( <52)-P( <48)=P(t<(52-50)/(6/3))-P(t<(48-50)/(6/3))=
P(t<1)- P(t<-1)= 0.825 ?(1-0.825) = 0.65
La probabilidad es de 0.65. Se aprecia que al ser simétrica la distribución t, se calcula la
probabilidad utilizando el inverso.
Solución Excel:
Los valores de t, estan diseñados para valores mayores, por eso, se le resta la unidad cuando se quiere
calcular un valor hacia la izquierda, situación diferente a la tabla.

a) P( >54)= P(t>2) = =DISTR.T(2;8;1) = 0.04025


b) P( <54)= P(t<2)= (1 - =DISTR.T(2;8;1)) = 0.95975
c) P(48< >52)= P( <52)-P( <48) = P(t<1)-P(t<-1)=
(1 - =DISTR.T(1;8;1))- =DISTR.T(1;8;1))
= (1 - 0.1732.97) ? 0.173297 = 0.6534
Última modificación: Saturday, 30 de April de 2016, 11:53
Saltar Navegación

Navegación
 Página Principal
o Curso actual
 Muestreo

 Participantes
 Tema 2

 Disribución T de Students
o Cursos

En este momento está usando el acceso para invitados (Entrar)

Prueba t de Student para Muestras Independientes


Por Félix Ramos Salamanca

Año de 2010

Este procedimiento se utiliza para determinar si dos variables están


relacionadas. La variable independiente es una variable dicotómica por lo cual
se tienen dos muestras -cada una asociada con un valor de la variable
independiente. Por ejemplo, si la variable independiente es sexo, se
seleccionaría aleatoriamente a un grupo de mujeres y otro de hombres. Si la
variable independiente fuera la presencia o no de música en un ambiente de
trabajo, se podría seleccionar aleatoriamente a dos grupos de trabajo. Un
grupo trabajaría en un lugar ambientado con música y el otro grupo no.

La prueba t de Student es una prueba paramétrica, por lo que para que su uso
sea válido se requiere cumplir con las siguientes suposiciones básicas:
Suposiciones básicas para la aplicación de pruebas
parametricas
 Variable Dependiente medida por lo menos en un nivel de intervalos.
 Asignación aleatoria de los individuos que conforman cada una de las
muestras.
 Muestras representativas en términos de número y de composición.
 Distribución normal de la variable dependiente en la población bajo
estudio.

Estas suposiciones tienen su razón de ser. La primera condición es clara pues


hay que calcular medias y varianzas, lo que hace necesario que esta variable
tenga la propiedad de aditividad que solamente se alcanza en el nivel de
medición de intervalos. Las otras tres condiciones tienen la finalidad de
establecer las condiciones para que las leyes de la probabilidad operen
óptimamente.

Adicionalmente la prueba t de Student hace la suposición de que las varianzas


de la variable dependiente en ambas muestras son aproximadamente iguales.

Las pruebas paramétricas pueden tolerar leves infracciones a estas


suposiciones básicas: las muestras pueden ser pequeñas, la distribución de la
variable dependiente puede apartarse algo de la normalidad, etcetera. Sin
embargo cuando son muchas o graves estas infracciones deberia optarse por
un procedimiento no paramétrico, como una U de Mann-Whitney, una prueba
de la mediana o incluso una Ji-cuadrada.

La aplicación de la prueba t de Student plantea dos modelos alternativos. De


acuerdo con el primer modelo, ambas muestras provienen de la misma
población, por lo que si tomamos sus medias y las comparamos, la diferencia
obtenida debería ser pequeña -la diferencia que se esperaría como producto
del error de muestreo. El otro modelo plantea que la variable independiente
tiene efecto sobre la variable dependiente, por lo que ambos grupos no son
iguales y la diferencia entre ellos debería ser grande en comparación con lo
que se esperaría del error de muestreo.

Por ejemplo supongamos que la variable independiente es el sexo (masculino


y femenino) y la variable dependiente es la estatura. Para hacer nuestro
estudio seleccionaríamos al azar una muestra grande de mujeres y otra
muestra grande de hombres. De acuerdo con el primer modelo, supondríamos
que ambas muestras están formadas por humanos y la diferencia entre los
promedios de ambos grupos serían pequeñas. El segundo modelo supone que
la variable sexo influye sobre la estatura y que se tendría no una sino dos
poblaciones (una formada por hombres y otra formada por mujeres) que
tienen valores diferentes de estatura: en este caso la diferencia entre las
medias de estatura de ambas muestras seria grande.

Para evaluar la magnitud de la diferencia entre las medias se establece como


modelo una distribución que representa las diferencias que cabria esperar del
error de muestreo. De esta manera, la diferencia entre ambas muestras se
compara con el error estándar de esta distribución muestral de diferencias. El
resultado de la comparación es un valor estandarizado (t) que deberá ubicarse
en la distribución t de Student. La forma de la distribución proporciona la
probabilidad de encontrar dentro de una misma población una diferencia igual
o mayor que la obtenida entre las medias de nuestros grupos. Si es poco
probable que esa diferencia provenga de dos grupos de la misma población se
podría concluir que los dos grupos son de diferentes poblaciones lo que
indicaria que la variable independiente tiene una relación con la variable
dependiente.

Ejemplo de prueba de hipótesis


Ahora veremos un ejemplo de la aplicación de la prueba t de Student en la
prueba de hipótesis.

La suposición que hace la hipótesis de nulidad es que ambas muestras


pertenecen a la misma distribución. De este modo, se plantea una distribución
muestral formada por todas las diferencias que se pueden formar a partir de
dos muestras de esa distribución (la distribución muestral de diferencias). El
hallazgo de una diferencia muy grande (p ≤ 0.05) entre las medias de nuestros
datos, arrojaría dudas sobre la hipótesis de nulidad, lo que nos permitiría
rechazarla, reclamando el apoyo para la hipótesis alterna.

En esta página se muestra un procedimiento para la estimación de esta


probabilidad. Se reúnen los datos por grupo y se calcula la media de cada
grupo. El signo de la diferencia entre ambas medias debe coincidir con el
signo de la diferencia anticipado en la hipótesis alterna, en caso de que ésta
haya sido unidireccional; en caso de tener una hipótesis bidireccional el signo
no importa.

Como ejemplo vamos a suponer que se desea comparar a dos grupos de


estudiantes respecto de su habilidad de lectura después de haber impratido a
uno de ellos un programa instruccional. De acuerdo con el diseño empleado,
los alumnos del primer grupo deberían tener una ejecución inferior a la
mostrada por los estudiantes del segundo grupo.

Datos
Grupo
2
Grupo 1

10 9 12 14 14
14 15 17 13 20
11 12 10 19 13
22 15 17 13 22
10 10 12 16 17
19 14 15 18 18

23 18

Las hipótesis estadísticas serían las siguientes:

---o < Se espera una diferencia


H1: < H1: -
tambien→ 0 negativa

---o ≥ La diferencia será positiva o


H0: ≥ H0: -
tambien→ 0 mínima

Para proceder a la prueba comenzamos por anotar el número de datos, la


media y la varianza de cada grupo, obteniendo los siguientes resultados:

Resultados por grupo

Cálculo Grupo 1 Grupo 2

n 15 17

12.6 17.2353

S2 8.5429 10.1912

S 2.9228 3.1924

EE de la media 0.7547 0.7743

En primer lugar debemos ver si la relación que aparece entre los valores de
nuestras medias coincide con la predicción que hace la hipótesis alterna o con
la que hace la hipótesis de nulidad.
Como se puede ver, la media de la primera muestra es menor que la media de
la segunda muestra, como lo propone la hipótesis alterna, por lo que
procedemos a medir qué tan grande es la diferencia entre las medias. Como
primer paso obtendremos los intervalos de confianza del 95% para las medias
de ambos grupos:

Resultados por grupo

Calculo Grupo 1 Grupo 2

12.6 17.2353

11.1208 15.7177
IC
14.0792 18.7529

Se puede observar en esta tabla que los intervalos de confianza de ambas


medias no se traslapan, lo que permite anticipar que la diferencia entre ambas
medias va a ser muy grande.

Esta relación puede apreciarse en la siguiente gráfica. El punto central


representa la media de cada grupo y los bigotes se extienden a los limites
superior e inferior del intervalo de confianza respectivo.

20

20

18

16

14

12

10

Intervalos de confianza para ambas medias

En segundo lugar examinamos las varianzas para ver si se cumple la


condición de homoscedasticidad. En este caso el valor W de Levene es de
0.2191 con 1 y 30 grados de libertad. Como el valor crítico es F=4.1709
podemos continuar asumiendo que las varianzas son homogéneas y calcular el
error estándar de la distribución muestral de diferencias a partir de la
combinacion de varianzas con la fórmula

y los resultados son:

Calculo Resultado

Dif -4.6353

EEdif 1.0874

t -4.2627

gl 30

Sig. p < 0.001

La diferencia entre ambos grupos es significativa con p < 0.001 para una
prueba bilateral, por lo que se puede considerar que el programa instruccional
sí influyó en la habilidad de lectura.

Desea ensayar la prueba con sus propios datos?

Вам также может понравиться