Академический Документы
Профессиональный Документы
Культура Документы
ESTADISTICA INFERENCIAL II
OBJETIVO:
Conocer y aplicar tcnicas de diseo
experimental, con el objeto de tomar
decisiones para analizar, evaluar y mejorar
procesos logsticos e industrial.
Adquirir criterios y herramientas de diseo
experimental para planificar experimentos
eficazmente en los procesos logsticos e
industriales.
UNIDAD I:
REGRESION LINEAL SIMPLE Y MULTIPLE
Para
ilustrar
el
concepto, considrense
los datos de la tabla 1.
En
esta
tabla,
se
relaciona la cantidad de
fibra (madera) en la
pulpa con la resistencia
del producto (papel).
Porcentaje Resistenci
de fibra X
a
Y
4
134
135
142
10
149
12
144
14
160
16
156
18
157
20
168
22
166
24
167
26
171
28
174
30 de resistencia
183 de pulpa
Tabla 1. datos
El diagrama de dispersin
es una
grafica en la que cada punto trazado representa
un par de valores observados por las variables
independiente y dependiente. El valor de la
variable independiente X, se traza en relacin con
el eje horizontal y el valor de la variable
dependiente Y, en relacin con el eje vertical. La
naturaleza de la relacin entre dos variables
puede tomar muchas formas, que van desde
algunas funciones matemticas sencillas a otras
en extremo complicadas. La relacin ms
elemental consiste en una lnea recta o relacin
lineal.
Plan A
Relacin lineal positiva
Plan B
Relacin lineal negativa
Plan c
No hay relacin entre X y Y
Plan D
Plan E
Plan F
Relacin curvilnea positiva
Relacin curvilnea en forma de URelacin curvilnea negativa
El anlisis de
regresin lineal
simple
se refiere a encontrar la lnea
recta que mejor se ajuste a
los datos. El mejor ajuste
puede definirse de varias
maneras.
Quiz
la
ms
sencilla sea encontrar la lnea
recta
para
la
cual
las
diferencias entre los valores
reales
y
los
valores
Y = o + 1X +
E (X/Y) = o + 1X
Ec. 5
Ec. 6
Ec. 7
Tabla 2 Procedimiento para realizar los clculos para la regresin simple para los datos de la
resistencia de la pulpa.
Xi
Yi
134
145
142
10
149
12
144
14
160
16
156
18
157
20
168
22
166
24
167
26
171
28
174
XiYi
Yi i
Sxy = 39150
Sxx = 4996 1 =
Medias de Y y X
o = Y - 1X = 158.286 (1.6242)(17) =
130.67
Por lo tanto, la lnea recta que mejor explica la relacin entre
porcentaje de fibra y resistencia del papel, est dada por
La estadstica inferencial es el
proceso de usar la informacin de una
muestra para describir el estado de una
poblacin. Sin embargo es frecuente que
usemos la informacin de una muestra
para probar un reclamo o conjetura sobre
la poblacin. El reclamo o conjetura se
refiere a una hiptesis. El proceso que
corrobora si la informacin de una
muestra sostiene o refuta el reclamo se
llama prueba de hiptesis
La Hiptesis estadstica es la
afirmacin que se hace de un
parmetro de la poblacin. Est
afirmacin se toma como tentativa,
ya que el verdadero valor del
parmetro no se conoce. Tiene los
siguientes elementos:
Ho = 1 = 0
Ha = 1
0
Ec. 8
Ec- 14
Ec. 16
Conclusiones
Hemos rechazado las hiptesis nulas
en ambos anlisis (de regresin y de
varianza) concluyendo que la ecuacin
de regresin:
Resistencia = 130.67 + 1.62 % Fibra
Es significativo por lo tanto podemos
afirmar que nuestro modelo es
importante para predecir la resistencia
Ejercicio
/ tarea 2
1.- Cul es el propsito general del anlisis de regresin?
2.- En el anlisis de regresin intervienen dos tipos de variables: las independientes y las
dependientes. Explique con sus palabras y a travs de ejemplos, las caractersticas de estos
dos tipos de variables.
3.- En el artculo de Concrete Research (Caractersticas del concreto cerca de la superficie:
Permeabilidad intrnseca), se presentaron los datos sobre la resistencia a la compresin y la
permeabilidad intrnseca de varias mezclas y curados de concreto. Las cantidades resumidas
son n = 14, Yi = 572, = 23 530, Xi = 43, = 157,42, y XiYi = 1 697,80. Suponga que las dos variables
se relacionan de acuerdo con el modelo de regresin lineal simple.
a) Calcule las estimaciones de mnimos cuadrados de la pendiente y la ordenada al origen
b) Use la ecuacin de la recta ajustada para predecir la permeabilidad que se observara
cuando la resistencia a la compresin es = 4,3.
c) D una estimacin puntual de la permeabilidad media cuando la resistencia a la
compresin es = 3,7.
d) Suponga que el valor observado de la permeabilidad para X = 3,7 es Y = 46,1
Coeficiente de determinacin .
Un primer criterio para evaluar la calidad
del ajuste es observar la forma en que el
modelo se ajust a los datos. En el caso de
la regresin lineal simple esto se distingue
al observar si los puntos tienden a
ajustarse razonablemente bien a la lnea
recta (vase la figura 3). Pero otro criterio
ms cuantitativo es el que proporciona el
coeficiente de determinacin, el cual
est definido por:
EC. 17
Coeficiente de determinacin
ajustado . Este coeficiente se calcula
de la siguiente manera:
EC. 18
Ec. 19
Regresin lineal
mltiple
En muchas situaciones prcticas existen varias variables
independientes que se cree que influyen o estn
relacionadas con una variable de respuesta Y, y por lo
tanto ser necesario tomar en cuenta si se quiere predecir
o entender mejor el comportamiento de Y
Por ejemplo, para explicar o predecir el consumo de
electricidad en una casa habitacin tal vez sea necesario
considerar el tipo de residencia, el nmero de personas
que la habitan, la temperatura promedio de la zona,
Y = 0 + 1X1+ 2X2 +
+ kXk + Ec. 22
Para
encontrar
los
coeficientes
de
regresin (0 , 1 y 2)
mltiple mediante el
mtodo
de
mnimos
cuadrados seria de la
siguiente manera
X1
X2
X1 y
64
57
4096
3249
64
3648
71
59
10
5041
3481
100
4189
53
49
2809
2401
36
2597
67
62
11
4489
3844
121
4154
55
51
3025
2601
64
2805
58
50
3364
2500
49
2900
77
55
10
5929
3025
100
4235
57
48
3249
2304
81
2736
56
52
10
3136
2704
100
2912
51
42
2601
1764
36
2142
76
61
12
5776
3721
144
4636
68
57
4624
3249
81
3876
48139
34843
976
40830
X2 y
X1 X2
1/12 (R1) = R1
x
R1
12
R2
643
R3
106
R1
5779
976
X = 643 Y =106
0 34843 1 5779
12
R2
643
-643R1+
R2 =
R2
R3
106
643
Z=
753
240830
106
6796
753
34843
5779
5779
976
40830
6796
R1
1
643
106
53,5833
34,843.
5,779.
8.8333
5,779.
976
62.75
40,830.
6796
R1
R2
1
0
53.5833
388.9381
8.8333
99.1881
62.75
481.75
-106R1 + R3 = R3
R1
R2
R3
X=
0
Y = 1 Z = 2
1
0
106
53.5833
388.9381
5779
8.8333
99.1881
976
62.75
481.75
6796
53,5833
388.9381
99.1702
8.8333
99.1881
39.6702
62.75
481.75
144.5
53.5833
1
99.1702
8.8333
0.2550
39.6702
62.75
1.2386
144.5
R1
1
R2
0
R3
0
1/388.9381(R2) = R2
R1
R2
R3
1
0
0
1/388.9381(R2) = R2
X = 0 Y = 1 Z = 2
R1
R2
R3
53.5833
1
99.1702
8.8333
0.2550
39.6702
62.75
1.2386
144.5
R3-99.1702(R2)+R3 =
R1
1
53,5833
R2
0
1
R3
0
99.1702
8.8333
0.2550
39.6702
62.75
1.2386
144.5
8.8333
0.2550
14.3818
62.75
1.2386
21.6677
R1
R2
R3
1
0
0
1
0
0
53.5833
1
0
X = 0 Y = 1
R1
1
53.583
3
R2
0
1
R3
0
1/14.3818(R3) = 0
R3
R1
R2
0
0
R3
53,583
3
1
0
Z = 2
8.8333
62.75
0.2550
14.381
8
1.2386
21.667
7
8.8333
62.75
0.2550
1
1.2386
1.5066
Z = 1.5066,
despeje
Y
Y
Y
Y
+
+
+
=
0.2550z = 1.2386
0.2550 (1.5066) = 1.2386
0.3841 = 1.2386
1.2386 0.3841 = 0.8545
Ahora calculamos a X
X + 53.5833y + 8.8333z = 62.75
X + 53.5833(0.8545) + 8.8333(1.5066) = 62,75
X + 45.7869 + 13.3082 = 62.75
X + 59.0951 = 62.75
X = 62.75 59.0951=
X = 3.6549
Esto quiere decir que ahora los valores de 0, 1 y 2
son los mismo valores que tienen X, Y y Z
Siguiendo
la
misma secuencia
de
la
multiplicacin
para
el
denominador, as
como para 1 y
2.
1 = 0.8546
1.5063
2 =
H0: 1 = 2 = . k = 0
H1: j 0 para al menos una j = 1,2, .,
k
Aceptar Ho significa que ningn trmino o variable en el
modelo tiene una contribucin significativa al explicar la
variable de respuesta Y. Mientras que rechazar Ho implica
que por lo menos un trmino en el modelo contribuye de
manera significativa a explicar Y. El procedimiento para
Ejemplo
Se probar la significacin de la regresin
(con =0.05) utilizando los datos de los
pesos , estaturas y edades de la tabla 3
H0: 1 = 2 = . k = 0
H1: j 0 para al menos un j = 1,2,
., k
El valor de Fo calculado por formula nos da un
valor de Fo = 10.9402, por comodidad
observamos el resumen arrojado por Excel y/o
2, 12 2 1) =
F(0.05
2, 9) =
4.26
se rechaza la
Hiptesis nula
Dado que el valor encontrado en formula es mayor al punto crtico en
base al nivel de significancia por lo que rechazamos la hiptesis nula y
aceptamos la alterna lo cual implica que por lo menos un trmino en el
Tabla 5
Coeficiente de determinacin
El que un modelo sea significativo no
necesariamente implica que sea bueno
en trminos de que explique la
variacin de los datos. Por ello es
importante
tener
mediciones
adicionales de la calidad del ajuste del
modelo, como las grficas de residuales
y el coeficiente de determinacin.
Ec. 26
Ambos
= 0.7085
aj = 0.6437
0 <aj < 1
0 <0.6437 0.7085 < 1
Intervalos de confianza y
prediccin en regresin mltiple
En los modelos de regresin mltiple con
frecuencia
es
conveniente
construir
estimaciones de intervalos de confianza para los
coeficientes de regresin . Por ejemplo, a partir
de la tabla 4 es claro que un estimador por
intervalos de cada coeficiente en lo individual
est dado por:
Regresin no lineal
Si las dos variables X y Y se relacionan segn
un modelo de lnea recta, se habla de
regresin lineal simple
Parbola de Regresin
En muchos casos, es una funcin de segundo
grado la que se ajusta lo suficiente a la
situacin real dada.
La expresin general de un polinomio de 2
grado es:
Y = a+ bx +
donde a, b y c son los parmetros.
1.25
11.2
5
20
30.5
15
68
XY
e=Y-
277. 120 68
0
0.064
5
5
4
13.funcin
11 parablica:
55.5
0.012
Ajuste3de una
= a + bX13.
+c 0
6
6
8
Aplicando el mtodo de los mnimos cuadrados se obtiene el siguiente
sistema de ecuaciones y resolviendo este sistema se obtiene que:
a
= -0.450
55
225 979
b = 0.4932
c = 1.1428
Modelo potencial:
Si tomamos logaritmos en la expresin de la funcin
potencial, obtendremos:
Modelo exponencial:
Tomando logaritmos en la expresin de la
funcin exponencial, obtendremos:
Modelo logartmico:
La curva logartmica Y = a + blogX es
tambin una recta, pero en lugar de estar
referida a las variables originales X e Y, est
referida a logX y a Y.
Hemos visto, cmo, a pesar de ser
inicialmente modelos mucho ms complejos
que el de una recta, estos tres ltimos se
reducen al modelo lineal sin ms que
transformar adecuadamente los datos de