Вы находитесь на странице: 1из 14

SOLUCIN TALLER ESTADSTICA APLICADA

Usar las salidas del software R para dar solucin a las siguientes situaciones
1. Se cree que la pureza del oxgeno producido con un proceso de fraccionamiento est
relacionada con el porcentaje de hidrocarburos en el condensador principal de la unidad
de procesamiento. A continuacin los datos de veinte muestras :
Pureza (%)
86.91
89.85
90.28
86.34
92.58
87.33
86.29
91.86
95.61
89.86
96.73
99.42
98.66
96.07
93.65
87.31
95.00
96.85
85.20
90.56

Hidrocarburos (%)
1.02
1.11
1.43
1.11
1.01
0.95
1.11
0.87
1.43
1.02
1.46
1.55
1.55
1.55
1.40
1.15
1.01
0.99
0.95
0.98

a. Ajustar un modelo de regresin lineal simple a los datos.

pureza=77.86+11.8 (hidro)

b. Probar la significancia del modelo, usando la prueba T y F.

Prueba de F

H 0 : i= i +1= i+n=0
H 1 : i+ n 0

Para esto miramos el valor del F-stadistic y lo comparamos con el valor crtico al nivel
de confianza de 0.05, observamos que el valor calculado 11.47 que es mayor que el
valor tabulado (4.1). As rechazamos Ho. Decimos que el modelo es significativo en sus
variables.
Prueba de T
Parmetro estimado del porcentaje de hidrocarburos. Se desea probar
H 0 : 1=0 vs H 1 : 1 0

El estadstico de inters en este caso es:


T=

1
S c ii

T=

11.8
=3.38
3.485

Si se escoge nivel de significancia 0.05, el valor critico de t es = 2.1. As se rechazara


la hiptesis nula, y se llega a la conclusin que hay una relacin lineal entre el
porcentaje de hidrocarburos y el porcentaje de pureza del oxgeno.

c. Determinar un intervalo de confianza de 95% para la pendiente.

As un I.C al 95% para la pendiente es (4.4%; 19.1%)

d. Calcular el coeficiente de correlacin y el coeficiente de determinacin, e intrprete.

Coeficiente de Determinacin:

R 2=

SSr 148.31
=
=0.38
SST 232.83

Por tanto el 38% de la variabilidad de pureza del oxgeno es explicada por el


porcentaje de hidrocarburos. Es decir una proporcin de variabilidad relativamente alta.
Coeficiente de Correlacin
r= R2=0.62
Podemos notar que el grado de asociacin positiva entre el porcentaje de pureza del
oxgeno y el porcentaje de hidrocarburo es muy cercano a 1.
e. Verifique si el valor del coeficiente de correlacin de la muestra tiene una magnitud
suficiente para indicar que en la poblacin las dos variables de inters estn
correlacionadas.
Como el coeficiente de correlacin es positivo, es decir, de 0.62 cercano a 1, no es perfecta
la asociacin entre el porcentaje de pureza del oxgeno y el porcentaje de hidrocarburos.
2. Myers y Montgomery (Response Surface Methodology, 1995,pp. 267-268) describe un
experimento para determinar la influencia de:
X1 - Temperatura del bao cido
X2 - Concentracin del cido de cascada
X3 - Temperatura del agua
X4 - Concentracin de sulfuro
X5 - Cantidad de blanqueador de cloro

Sobre una medida adecuada de la blancura del rayn (y). Los ingenieros que hicieron
este experimento desean minimizar la medida. Los resultados experimentales se
muestran a continuacin
Temperatura
del cido
35
35
35
35
35
35
35
35
55
55
55
55
55
55
55
55
25
65
45
45
45
45
45
45
45
45

Concentracin
del cido
0.3
0.3
0.3
0.3
0.7
0.7
0.7
0.7
0.3
0.3
0.3
0.3
0.7
0.7
0.7
0.7
0.5
0.5
0.1
0.9
0.5
0.5
0.5
0.5
0.5
0.5

Temperatura
del agua
82
82
88
88
82
82
88
88
82
82
88
88
82
82
88
88
85
85
85
85
79
91
85
85
85
85

Concentracin
de sulfuro
0.2
0.3
0.2
0.3
0.2
0.3
0.2
0.3
0.2
0.3
0.2
0.3
0.2
0.3
0.2
0.3
0.25
0.25
0.25
0.25
0.25
0.25
0.15
0.35
0.25
0.25

Hacer un anlisis detallado de los resultados.


Miremos anlisis por regresin estimando el siguiente modelo:

blancura ( y )=+ 1 Ta+ 2 Ca+ 3 Tea+ 4 Cs+ 5 Cb


As:

Cantidad de
blanqueador
0.3
0.5
0.5
0.3
0.5
0.3
0.3
0.5
0.5
0.3
0.3
0.5
0.3
0.5
0.5
0.3
0.4
0.4
0.4
0.4
0.4
0.4
0.4
0.4
0.2
0.6

76.5
76.0
79.9
83.5
89.5
84.2
85.7
99.5
89.4
97.5
103.2
108.7
115.2
111.5
102.3
108.1
80.2
89.1
77.2
85.1
71.5
84.5
77.5
79.2
71.0
90.2

De lo anterior podemos notar el porcentaje de variabilidad explicado por el modelo, es decir de


un 48.2%. Haciendo prueba de significancia del modelo o prueba F podemos ver que el F
calculado de 3.72 es mayor al valor critico tabulado de 2.54, por tal se rechaza la hiptesis nula
de que todos los parmetros estimados son iguales a cero. Obteniendo el siguiente modelo
especfico:

blancura ( y )=35.2+ 0.7Ta +20.2 Ca+ 0.79Tea+25.5 Cs+17.2Cb


Y

obtenemos

intervalos

de

confianza

al

95%

para

los

parmetros:

3. Davidson (Update on Ozone Trends in Californias South Coast Air Basin, Air Waste,
43, 226, 1993) estudi las concentraciones de ozono en la Cuenca area de la costa sur
de California, durante los aos 1976 a 1992. Cree que la cantidad de das en las que las
concentraciones de ozono fueron mayores que 0.20 ppm (la respuesta) depende del

ndice metereolgico estacional, que es el promedio estacional de la temperatura con


850 milibars (el regresor). La siguiente tabla muestra los datos
Ao
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991

Das
91
105
106
108
88
91
58
82
81
65
61
48
61
43
33
36

a. Trazar un diagrama de dispersin con los datos.

b. Estimar la ecuacin de prediccin.

ndice
16.7
17.1
18.2
18.1
17.2
18.2
16.0
17.2
18.0
17.2
16.9
17.1
18.2
17.3
17.5
16.6

Nmero de dias=192.894+ 15.296(indice)


c. Probar la significancia de la regresin.
Prueba de F

H 0 : i= i +1= i+n=0
H 1 : i+ n 0

As miramos el valor del F-stadistic y lo comparamos con el valor crtico al nivel de

confianza de 0.05, observamos que el valor calculado 2.36 que es menor que el valor
tabulado (4.5). As no rechazamos Ho. Decimos que el modelo no es significativo en
sus variables. El ndice meteorolgico estacional no es significativo para explicar el
nmero de das en que la concentracin de ozono fue mayor a 0.20 ppm

d. Construya el intervalo de confianza para

1 , e interprete.

As con un nivel de confianza del 95% podemos decir que el parmetro B1 se encuentra
entre (-4.9; 35.5)
e. Verifique si el valor del coeficiente de correlacin de la muestra tiene una magnitud
suficiente para indicar que en la poblacin las dos variables de inters estn
correlacionadas.

Veamos el grfico de dispersion entre los dias y el indice meteorologico

Nos lo ratifica el anterior grfico, no hay grado de asociacin entre las variables en
cuestin, el ndice meteorolgico no es significativo para explicar el nmero de das en
que la concentracin de ozono fue mayor a 0.20ppm
4. Un embotellador de bebidas gaseosas analiza las rutas de servicio de las mquinas
expendedoras de su sistema de distribucin. Le interesa predecir el tiempo necesario
para que el representante de ruta atienda las mquinas expendedoras en una tienda.
Esta actividad de servicio consiste en abastecer la mquina con productos
embotellados, y algo de mantenimiento o limpieza. El ingeniero industrial responsable
del estudio ha sugerido que las dos variables ms importantes que afectan el tiempo de
entrega Y son la cantidad de cajas de producto abastecido, X 1, y la distancia caminada
por el representante, X2. El ingeniero ha reunido 25 observaciones de tiempo de entrega
que se ven en la siguiente tabla. Se ajustar el modelo de regresin lineal mltiple.

Observacin
numero

Tipo de
(minutos)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

16.68
11.50
12.03
14.88
13.75
18.11
8.00
17.83
79.24
21.50
40.33
21.00
13.50
19.75
24.00
29.00
15.35
19.00
9.50
35.10
17.90
52.32
18.75
19.83
10.75

entrega

Cantidad
de cajas

Distancia
(pies)

7
3
3
4
6
7
2
7
30
5
16
10
4
6
9
10
6
7
3
17
10
26
9
8
4

560
220
340
80
150
330
110
210
1460
605
688
215
255
462
448
776
200
132
36
770
140
810
450
635
150

a. Obtenga la ecuacin de Regresin Mltiple estimada.

As:

time=2.34 +1.61 ( cajas )+ 0.014(Distancia)

b. Interprete los coeficientes de regresin.

Del parmetro

1 pendiente para el nmero de cajas, podemos interpretarlo, por cada

unidad adicional de cajas transportada el tiempo de atencin de las mquinas


expendedoras aumenta 1.61 minutos, hay una relacin positiva entre estas dos
variables.
Del parmetro

pendiente para la distancia recorrida, podemos interpretarlo, por

cada pie adicional recorrido el tiempo de atencin de las mquinas expendedoras


aumenta 0.014 minutos, hay una relacin positiva entre estas dos variables.
c. Realice una prueba de hiptesis para verificar la relacin lineal entre las tres variables,
use

=0.01 .

Realicemos prueba F, con el nivel de significancia del 99%

H 0 : i= i +1= i+n=0
H 1 : i+ n 0

As miramos el valor del F-stadistic y lo comparamos con el valor crtico al nivel de

confianza de 0.01, observamos que el valor calculado 261.2 que es mayor que el
valor tabulado (5.71). As rechazamos Ho. Decimos que el modelo es significativo en
sus variables. La distancia en pies recorrida y el nmero de cajas son variables
significativo para explicar el tiempo de atencin de las mquinas expendedoras.

d. Evale la fuerza de la relacin lineal entre Y y las variables independientes de manera


individual, use

=0.01 .

Parmetro estimado del nmero de cajas. Se desea probar

H 0 : 1=0 vs H 1 : 1 0

El estadstico de inters en este caso es:


T=

1
S c ii

T=

1.61
=9.4
0.17

Si se escoge nivel de significancia 0.01, el valor critico de t es = 2.83. As se rechazara


la hiptesis nula, y se llega a la conclusin que hay una relacin lineal entre el nmero
de cajas abastecidas y el tiempo de atencin a las mquinas expendedoras.
Parmetro estimado de la distancia caminada. Se desea probar
H 0 : 1=0 vs H 1 : 1 0

El estadstico de inters en este caso es:


T=

1
S c ii

T=

0.014
=3.9
0.003

Si se escoge nivel de significancia 0.01, el valor critico de t es = 2.83. As se rechazara


la hiptesis nula, y se llega a la conclusin que hay una relacin lineal entre la
distancia caminada y el tiempo de atencin a las mquinas expendedoras.

e. Construya los intervalos de confianza de 95% para los

i , e interprete.

As con un nivel de confianza del 95% podemos decir que los parmetros para el nmero
de cajas abastecidas y la distancia caminada (pies) se encuentran en los siguientes
intervalos de confianza.
Cajas (1.2; 1.96)
Distancia (0.006; 0.02)
5. La siguiente tabla representa los resultados de un experimento para comparar cuatro
tcnicas de mezclado diferentes (1, 2, 3, 4) sobre la resistencia de tensin de cuatro
clases de cemento (A, B, C, D) Existe algn indicio de qu tcnica de mezclado afecta la
resistencia?
MEZCLADO
1
2
3
4

A
3129
3200
2800
2600

B
3000
3000
2900
2700

C
2865
2975
2985
2600

D
2890
3150
3050
2765

Miremos anlisis de varianza

Realizando la interaccin podemos evidenciar el indicio de que la tcnica de mezclado nmero


dos afecta positivamente la resistencia de tensin del cemento A. Podemos verlo en el
siguiente grfico.

6. Se pueden emplear dos tipos diferentes de puntas en un probador de dureza Rockwell.


Se seleccionan ocho lingotes de una aleacin de nquel y cada uno se prueba dos veces
con cada punta. En la siguiente tabla se encuentran las lecturas de dureza en la escala C
de Rockwell utilice

=0.05

para determinar si las dos puntas producen o no las

mismas lecturas de pureza.


LINGOTE
PUNTA I
PUNTA II
1
63
60
2
52
51
3
58
56
4
60
59
5
55
58
6
57
54
7
53
52
8
59
61
determinar que las das puntas producen en promedio distintas lecturas de pureza.

Bajo esto
podemos

7. Una empresa reparadora de lavadoras desea estudiar desea estudiar el efecto el efecto de la
marca y el centro de servicio de reparacin en minutos. Se eligieron tres marcas de lavadoras y
tres centros de servicio. Cada centro fue asignado para efectuar una reparacin de dos
lavadoras de cada marca. Los resultados se muestran en la siguiente tabla.

Centro 1

Marca A
52 36

Marca B
48 56

Marca C
59 50

Centro 2
Centro 3

51 40
37 40

61
44

50
40

58 55
65 60

a. Existe algn efecto debido a las marcas?


b. Si los centros son homogneos entre s, responda de nuevo el literal a).
c. Existe algn efecto debido a los centros de servicios?
d. Existe algn efecto debido a la interaccin?
Nota: para el tem a) y b), considere una sola observacin, resultado de hallar el promedio entre
los dos registros, por ejemplo: (52+36)/2 = 44

8. En un estudio de 2989 fallecimientos por cncer, se registr el lugar de cada uno (casa,
cuidado intensivo en hospitales, hospital de atencin permanente) y la edad al fallecimiento,
resultando en la tabla dada de frecuencia en dos sentidos. Mediante el uso de un nivel de
significancia de .01, pruebe la hiptesis nula que de la edad y el lugar del fallecimiento son
independientes.
Lugar

E
d
a
d

Casa
15 - 54
55 - 64
65 - 74
Ms de 74

94
116
156
138

Cuidado
Intensivo
418
524
581
558

Atencin
permanente
23
34
109
238

9. Se clasificaron 445 estudiantes segn su frecuencia de consumo de mariguana, y consumo de


alcohol y de drogas sicotrpicas por parte de los padres. Sugiere la informacin que los
consumos de padres t estudiante son independientes en la poblacin de la que se sac la
muestra? Utilice el mtodo del valor

para llegar a una conclusin.

Nivel de consumo de mariguana del estudiante


Consumo
de alcohol
y drogas
de padres

Ninguno
Uno
Ambos

Nunca
141
68
17

Ocasional
54
44
11

Regular
40
51
19

Вам также может понравиться