Вы находитесь на странице: 1из 8

T para muestras relacionadas

Samuel Martı́nez
February 24, 2020

1 Pruebas de Dos muestras


La comparación de dos grupos poblaciones es una de las situaciones más comunes
que se afrontan al utilizar la estadı́stica.
• El objetivo es la comparación de las respuestas de dos tratamientos o la
comparación de las caracterı́sticas de las dos poblaciones.
• Tenemos muestras diferentes.
La comparación entre dos grupos depende de dos hechos básicos:
• La distribución de los datos se ajustan a una distribución normal.
• Si las muestras son Independientes o son relacionadas

1.1 Grupos Dependientes


Durante el análisis de datos es muy común desear comparar muestras que
provienen del mismo grupo de interés.
1. El intervalo de confianza para la diferencia entre dos muestras relacionadas
se define como:
sd
d ± t(α;n−1) √ (1)
n
2. El estadı́stico calculado para la prueba de hipótesis para muestras rela-
cionadas se define como:
d − µd
t = sd (2)

n
Donde,

P
di
d=
sn
(di − d)2
P
sd =
n−1

1
y t(α,n−1) es el valor asociado en la tabla de distribución t al nivel de confi-
anza.

1.2 Ejemplos
1. Una empresa de investigación de mercados emplea una muestra de indi-
viduos para calificar el potencial de compra de un determinado producto
antes y después de que los individuos vean un comercial de televisión ac-
erca del mismo. La calificación del potencial de compra se hace con una
escala del 0 al 10, con los valores más altos indicando un mayor potencial
de compra.

después antes
6 5
6 4
7 7
4 3
3 5
9 8
7 5
6 6

Use α = 0.05 y los datos de la tabla siguiente para probar esta hipótesis
y haga un comentario sobre la utilidad del comercial.
Desarrollo:
Primero debemos encontrar las diferencias:

después antes di
6 5 1
6 4 2
7 7 0
4 3 1
3 5 -2
9 8 1
7 5 2
6 6 0

P 5
Donde di = 5 y entonces d = = 0.625 y de manera similar se tiene
8
que sd = 1.30247

2
(a) • H0 : µdespues ≤ µantes
• Ha : µdespues > µantes
0.625 − 0
(b) tcalculado = √ = 1.357
1.30247/ 8
(c) t(α;n−1) = 1.8946
(d) |tcalculado | > |tcritico |, NO Rechace H0

Existe evidencia estadı́sticamente significativa de que los individuos de-


spués de observar el comercial no modificaron su potencial de compra.
El valor p de la prueba es 0.1084, que confirma la conclusión anterior.
2. StreetInsider.com presenta las ganancias por acción, en 2002, de una mues-
tra de empresas importantes (12 de febrero de 2003). Antes de 2002, anal-
istas financieros pronosticaron las ganancias por acción de estas empresas.
Use los datos siguientes para estudiar las diferencias entre las ganancias
reales por acción y las estimaciones de los analistas.

Empresa Real Estimación


AT yT 1.29 0.38
American Express 2.01 2.31
Citigroup 2.59 3.43
Coca-cola 1.60 1.78
Dupont 1.84 2.18
ExxonMovil 2.72 2.19
GeneralElectric 1.51 1.71
JohnsonyJohnson 2.28 2.18
McDonald 0.77 1.55
Wal-mart 1.81 1.74

(a) Use α = 0.05 y pruebe si existe diferencia entre la media poblacional


real y la media poblacional estimada de las ganancias por acción.
¿Cuál es el valor-p? ¿A qué conclusión se llega?
(b) Con 95% de confianza, ¿cuál es el intervalo de confianza de la difer-
encia estimada de las ganancias?

(a) Desarrollo:
i. • H0 : µreal = µestima
• Ha : µreal 6= µestima
−0.1030 − 0
ii. tcalculado = √ = −0.605
0.53850/ 10
iii. t(α;n−1) = 2.2622
iv. |tcalculado | > |tcritico |, NO Rechace H0

3
Existe evidencia estadı́sticamente significativa de que no hay diferen-
cia entre los valores reales y los pronósticos realizados por los analis-
tas.
El valor p de la prueba es 0.560, que confirma la conclusión anterior.
(b) Se tiene que:
• x = −0.1030
• n = 10
• s = 0.535850
• Confianza 95%

0.53850
−0.1030±2.2622 ∗ √
10
[−0.48822;0.28222]

El verdadero promedio de la diferencia entre los valores pronósticados


por los analistas y los valores observados se encuentran entre -0.48822
y 0.28222 con una confianza del 95%

4
1.3 Ejercicios
1. Las personas que viajan por avión, suelen elegir de qué aeropuerto salir
con base en el costo del vuelo. Para determinar de qué aeropuerto es
más costoso salir, se recolectan datos (en dólares) de una muestra de
vuelos a ocho ciudades partiendo de estos dos aeropuertos (The Cincinnati
Enquirer, 19 de febrero de 2006). Un investigador sostiene que es mucho
más costoso partir de Dayton, que de Louisville. Use los datos muestrales
para ver si favorecen tal afirmación. Como nivel de significancia use α =
0.05.

Destino Dayton louisville


Chicago 319 142
Michigan 192 213
Oregon 503 317
Atlanta 256 387
Seattle 339 317
Indiana 379 167
Miami 268 273
Dallas 288 274

2. Un centro de acondicionamiento fisico anuncia un riguroso programa. El


club asegura que después de un mes de seguir el programa, un participante
promedio será capaz de hacer ocho lagartijas más en 2 minutos que las
que podı́a hacer al principio. ¿La muestra aleatoria de 10 participantes en
el programa, cuyos datos se dan en la tabla siguiente, apoya la afirmación
del club?. Utilice un nivel de significancia de 0.025.

Participante 1 2 3 4 5 6 7 8 9 10
Antes 38 11 34 25 17 38 12 27 32 29
Después 45 24 41 39 30 44 30 39 40 41

5
3. En una encuesta realizada a estudiantes de posgrado, una pregunta pedı́a
asentar qué promedio general de calificaciones tenı́an en sus estudios, y
para evaluar la exactitud de estas respuestas se decidió tomar una muestra
de 12 de esos estudiantes para comparar sus respuestas contra los datos
que estaban anotados en los registros escolares. En la tabla siguiente se
muestran los resultados que se obtuvieron:

Estudiante Calificación según la encuesta Calificación según los registros escolares


1 8.5 8.2
2 9.0 9.1
3 7.3 7.0
4 9.4 9.0
5 6.0 6.0
6 8.7 8.1
7 9.1 8.7
8 8.8 8.9
9 9.2 8.9
10 7.9 7.5
11 8.0 7.8
12 8.4 8.1

Compruebe si existe diferencia entre el promedio de calificaciones que los


estudiantes respondieron en la encuesta y las que se tienen registradas en
los archivos escolares, con un nivel de significación de 1 por ciento.
4. En una clı́nica de reducción de peso se afirma que su programa permite
reducir en promedio más de 6 kg. En la tabla siguiente se muestra el
resultado que obtuvieron 10 personas. Compruebe si la afirmación de la
clı́nica es correcta, con un nivel de significación de 5 por ciento.

Cliente peso antes peso después


1 85.9 77.1
2 91.7 86.5
3 100.2 96.7
4 94.1 87.4
5 88.2 81.7
6 80.3 73.3
7 87.7 79.1
8 91.9 85.1
9 94.6 84.6
10 105.9 92.6

6
5. En los últimos tiempos hay una cantidad cada vez mayor de opciones
de entretenimiento que compiten por el tiempo de los consumidores. En
2004, la televisión por cable y el radio superaron a la televisión abierta, a
la música grabada y a los periódicos, convirtiéndose en los medios de en-
tretenimiento más usados. Con una muestra de 15 individuos se obtienen
los datos de las horas por semana que ven televisión por cable y de las
horas por semana que escuchan la radio.

Individuos Televisión Radio


1 22 25
2 8 10
3 25 29
4 22 19
5 12 13
6 26 28
7 22 23
8 19 21
9 21 21
10 23 23
11 14 15
12 14 18
13 14 17
14 16 15
15 24 23

Use como nivel de significancia 0.05 y haga una prueba para la diferencia
entre las medias poblacionales de la cantidad de horas de televisión por
cable y de la cantidad de horas de radio.
6. Hoaglin, Mosteller, and Tukey (1983) present data on blood levels of beta-
endorphin as a function of stress. They took beta-endorphin levels for 19
patients 12 hours before surgery, and again 10 minutes before surgery.
The data are presented below, in fmol/ml:

12 hours 10 6.5 8 12 5 11.5 5 3.5 7.5 5.8


4.7 8 7 17 8.8 17 15 4.4 2
10 minutes 6.5 14 13.5 18 14.5 9 18 42 7.5 6
25 12 52 20 16 15 11.5 2.5 2

Based on these data, what effect does increased stress have on endorphin
levels?

7
7. Hout, Duncan, and Sobel (1987) reported on the relative sexual satisfac-
tion of married couples. They asked each member of 91 married couples
to rate the degree to which they agreed with “Sex is fun for me and my
partner” on a four-point scale ranging from “never or occasionally” to “al-
most always.” The data appear below (I know it’s a lot of data, but it’s
an interesting question):

Husband 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Wife 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3
Husband 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
Wife 3 4 4 4 1 1 2 2 2 2 2 2 2 2 3
Husband 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3
Wife 3 3 4 4 4 4 4 4 4 1 2 2 2 2 2
Husband 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4
Wife 3 3 3 3 4 4 4 4 4 4 4 4 4 1 1
Husband 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
Wife 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3
Husband 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
Wife 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4

Start out by running a matched-sample t test on these data. Why is a


matched-sample test appropriate?
8. Se realizó un estudio con un grupo de 11 adolescentes entre las edades
de 15 a 16 años que se encuentra en la cabecera departamental de Quet-
zaltenango. Se aplica una terapia cognitivo-conductual para el desen-
volvimiento de sus habilidades sociales, pruebe que existe una diferencia
estadı́sticamente significativa entre la intervención pretest y postest.

Pre.Test Post.Test
C1 4 13
C2 6 19
C3 13 27
C4 16 32
C5 23 32
C6 23 27
C7 23 27
C8 27 38
C9 32 69
C10 38 38
C11 56 69

Вам также может понравиться