Вы находитесь на странице: 1из 41

Universidad Central de Venezuela

Facultad de Ingeniera
Escuela de Ingeniera Mecnica
Departamento de Tecnologa de Produccin
Produccin 1

D. Bermudez 2015 *( aun en correcci[on)


REGRESION LINEAL SIMPLE

Modelos Empricos

En muchos problemas en la ingeniera existe una relacin inherente entre dos o


mas variables, y resulta necesario explorar la naturaleza de esta relacin . El anlisis
de regresin es una herramienta estadstica para el modelado y la investigacin de
la relacin entre dos o ms variables, til para este tipo de problemas.

Por ejemplo, suponga que en un proceso qumico el rendimiento del producto est
relacionado con la temperatura de operacin del proceso. El anlisis de regresin
puede ser utilizado para construir un modelo que permita predecir el rendimiento
para una temperatura dada. Tambin puede utilizarse para la optimizacin del
proceso, para hallar el punto optimo o para fines de control.
REGRESION LINEAL SIMPLE

Modelos Empricos

Tabla 1. Niveles de Oxgeno e


Hidrocarburo

La tabla contiene los parmetros


que representan al nivel de
hidrocarburos presentes en un
proceso de destilacin (X) y la
pureza del oxigeno producido en
la misma (Y).
REGRESION LINEAL SIMPLE
Modelos Empricos

A la grfica expuesta se le da el nombre de Grafica de Dispersin, debido


a que posee las coordenadas de los valores expuestos dispersos en toda
su rea, esto es justificable ya que los datos provienen de procesos de
resultados aleatorios dentro de un intervalo finito.
REGRESION LINEAL SIMPLE
Modelos Empricos

Se puede ver que los puntos que conforman el conjunto de datos tienen la
forma abstracta de una recta, lo cual nos ofrece la capacidad de construir
una de funcin: Y = aX+b,
que se ajusta a la mayora de puntos sobre la distribucin de puntos y
donde a y b son llamados coeficientes de regresin.
REGRESION LINEAL SIMPLE
Modelos Empricos
Supongase que la media y la varianza de son 0 y respectivamente.

Entonces se puede afirmar


que la lnea de regresin es un y
conjunto de valores medios
representados por curvas
gaussianas,
1 ser el cambio de la media
de Y por cada unidad de
cambio de X y adems se
considera que la varianza de Y
en cada valor de X es
determinada por .
x
REGRESION LINEAL SIMPLE
Modelos Empricos Al graficar el nivel de hidrocarburos
presentes en un proceso de destilacin,

Supongase que
el modelo de
regresin es
Y=75+15x
2 = 2.

Se puede observar que se utiliza una Para X= 1.25, Y=75+15(1.25) = 93.75


distribucin normal para describir la y la varianza igual a 2.
variacin aleatoria del error. Es de notar Como este valor del error esta dado por
que cuando el error es pequeo, el valor datos de la vida real, realmente nunca se
de Y tendr un valor cercano al de la sabe el valor con certeza y debe
funcin, contrario con un error grande. calcularse de los datos proporcionados.
REGRESION LINEAL SIMPLE
Modelos Empricos
La nica forma de modelar
un conjunto de datos como
una recta sugiere la
necesidad de agregar a la
formula un termino que
representa el error asociado
a cada valor de Y para un X
en nuestra regresin.

La formula que representa el modelo de regresin


lineal simple queda de la siguiente forma:

Donde es el error aleatorio con media 0 y varianza 2 Tambien se supone que


los errores aleatorios que corresponden a observaciones diferentes son variables
aleatorias no correlacionadas
Regresin Lineal Simple.

Supongase que la grfica anterior corresponde a n pares de observaciones


de forma

Las estimaciones de 0 y 1 deben dar como resultado una lnea que (en
algn sentido) se ajuste mejor a los datos. El Alemn Karl Gauss (1777-
1855) propuso estimar los parmetros de modo que se minimice la suma de
los cuadrados de las desviaciones verticales en cada punto de x
Llamamos a este criterio para estimar los coeficientes de regresin el
Mtodo de los Mnimos Cuadrados, usando la siguiente ecuacin podemos
expresar cada observacin con la letra n como:
Regresin Lineal Simple.

La suma de los cuadrados de las


desviaciones de cada observacin
de la lnea de regresin real es:
Supongase que 0 prima y 1
prima deben satisfacer la
siguiente ecuacin:

Simplificando la ecuacin, llamada


ahora la ecuacin de Los Mnimos
Cuadrados, queda:

La solucin de la ecuacin nos proporciona los estimadores de los


mnimos cuadrados 0 prima y 1 prima.
Regresin Lineal Simple.

El modelo de los estimados


de los mnimos cuadrados
queda definido por

Donde
Regresin Lineal Simple.
El ajuste o la lnea de regresin estimada es

Ntese que ambas observaciones satisfacen la relacin

Donde el y describe el error en el ajuste del


residuo es modelo desde la i- esima observacin yi.
Ocasionalmente es conveniente aplicar smbolos al enumerador y
denominador de la ecuacin. Dados (x1,y1), (x2, y2),, (xn, yn), sean
Regresin Lineal Simple.
Ejemplo. Ajuste de un modelo de regresin lineal simple de datos de
oxigeno puro (Tabla 1)
Regresin Lineal Simple.
Por lo tanto, los mnimos cuadrados
estimados de las pendientes se interceptan:

El ajuste del modelo de


regresin lineal simple
(con 3 decimales ) es:
Regresin Lineal Simple.
ESTIMACION DE 2
Para obtener inferencia con respecto a los coeficientes de regresin 0 y 1, es
necesario estimar la varianza 2 que es la varianza del trmino de error en el
modelo de regresin y refleja la varianza aleatoria alrededor de la verdadera
recta de regresin.
Para el cculo de 2 se emplean los residuos
La suma de los cuadrados de los residuos es
llamado, la suma de los cuadrados de los errores :

Puede demostrarse que el valor esperado de la


suma de los cuadrados de los errores SSE es:

Por lo tanto, un estimador no sesgado de es

Sustituyendo

y simplificando la Ecuacin SSE


Regresin Lineal Simple.
Propiedades de los mnimos cuadrados.
Las propiedades estadsticas de los mnimos cuadrados 0 prima y 1 prima
pueden ser descritos fcilmente, recuerden que el termino del error en el
modelo
Es un valor aleatorio de mediana cero y varianza , esto convierte a Y en
una variable aleatoria con media con media igual a
Por ende los valores de 0 prima y 1 prima dependen de los valores observados
de la Y y los estimadores de los mnimos cuadrados de los coeficientes de la
regresin pueden ser vistas como variables aleatorias tambin.
Investigaremos la parcialidad y las propiedades de la varianza de los
estimadores de los mnimos cuadrados 0 prima y 1 prima.
Se considera primero a 1 prima porque es una combinacin lineal de cada
observacin de Y, podemos mostrar que los valores esperados de 1 prima
son:
Y por similitud
Regresin Lineal Simple.
Propiedades de los mnimos cuadrados.
En una regresin lineal simple, el error estndar estimado de la pendiente y el
error estndar estimado de la intercepcin de la orrdenada en el origen son:

Donde prima sale de la ecuacin:


Regresin Lineal Simple.
Intervalos de confianza.
Intervalos de confianza de la pendiente y la interseccin
Adems de las estimaciones puntuales de la pendiente y la, interseccin
es posible obtener estimaciones de los intervalos de confianza estimado
para estos parmetros. El ancho de estos intervalos de confianza es una
medida de la calidad general de la lnea de regresin. Si los trminos de
error, i, en los modelos de regresin estn distribuidos de forma normal
e independie entonces

Son variables aleatorias con distribucin t variables aleatorias con n-2


grados de libertad. Esto conlleva a la definicin intervalo de confianza
del 100(1-)% de la pendiente y la interseccin.
Regresin Lineal Simple.
Intervalos de confianza.
Bajo la hiptesis de que las observaciones se distribuyen de forma
normal e independiente, el intervalo de confianza de la pendiente
del100(1-)% en una regresin lineal simple es.

De manera similar, el intervalo de confianza de intercepcin 0


del100(1-)% es.
Regresin Lineal Simple.
Intervalos de confianza.
Puede construirse un intervalo de confianza a partir de la respuesta media de un
valor especfico de x por ejemplo x0 .Este intervalo de confianza sobre E(Ylx0)= Ylx0
y que se conoce como intervalo de confianza alrededor de la recta de regresin
Un intervalo de confianza a alredor de la respuesta media del 100(1-)% para el
valor de x = x0 . Ylx0 est dado por

Calculado a partir de un MRL


Regresin Lineal Simple.
Prediccin de nuevas observaciones.
Una aplicacin importante de un modelo de regresin es la predeccin de nuevas o
futuras observaciones de Y correspondientes a un nivel especifico de la variable 1
prima que acompaa a la x. Si x0 es el valor del regresorde inters,

Es el estimador puntual del valor nuevo o futuro de la respuesta Y0

Ahora considerese la obtencin de una estimacin del intervalo para esta observacin
futura Y0. Esta nueva observacin es independiente de las observaciones utilizadas para
desarrollar el modelo de regresin. Por consiguiente el intervalo de confianza para
Ylx0 resulta inapropiado ya que este se basa solo en los datos utilizados para ajustar el
modelo de regresin. El intervalo de confianza alrededor de Ylx0 se refiere a la
verdadera respuesta promedio en x = x0 (esto es un parmetro de la poblacin) y no a
observaciones futuras.
Regresin Lineal Simple.
Prediccin de nuevas observaciones.
Un intervalo de prediccin para una observacin futura del
100(1-)% y0 en el valor de x = x0 . Ylx0 est dado por

Siempre que
Regresin Lineal Simple.
Adecuacin del modelo de regresin
El ajuste de un modelo de regresin requiere varias suposiciones. La
estimacin de parmetros del modelo requiere la suposicin de que los
errores son variables aleatorias no correlacionadas com media 0 y varianza
constante. Las pruebas de hiptesis y la estimacin de intervalos requieren
que los errores etn distribuidos de forma normal. Adems se supone que el
grado de error es correcto; esto es, si se ajusta un modelo de regresi lineal
simple, entonces se supone que el fenmeno en realidad se comporta de una
manera lineal o de primer grado.

Quien realice el anlisis debe considerar siempre la validez de estas


suposiciones como dudosa y realizar anlisis para examinar cuan adecuado es
el modelo que se propone de manera tentativa.
Regresin Lineal Simple.
Adecuacin del modelo de regresin
Anlisis Residual.

Los residuos del modelo de regresin son:

Donde yi es una observacin real de y yi prima es el correspondiente valor


ajustado a partir del modelo de regresin.
Los anlisis de residuos normalmente son tiles para verificar la hiptesis de
que los errores tienen unadistribucin normal con varianza constante, asi como
para determinar la utilidad que tiene la adiccin de mas trminos al modelo.

Una forma de corroborar el comportamiento normal, es construyendo un


histograma de los residuos o una grfica de probabilidad normal de los residuos.
Muchos programas de computadora las pueden construir y como el tamao de
las muestras en regresin son con frecuencia pequeas como para construir un
histograma para ser representativo, el mtodo de grafico de probabilidad
normal es el preferido.
Regresin Lineal Simple.
Adecuacin del modelo de regresin
Anlisis Residual.

Patrones de graficas
residuales

(a) Satisfactorio,
(b) Embudo,
(c) Doble arco,
(d) No lineal.
Regresin Lineal Simple.

Covarianza: En probabilidad y estadstica, la covarianza es un valor que indica el


grado de variacin conjunta de dos variables aleatorias. Es el dato bsico para
determinar si existe una dependencia entre ambas variables y adems es el dato
necesario para estimar otros parmetros bsicos, como el coeficiente de correlacin
lineal o la recta de regresin.

Coeficientes de determinacin (R): En estadstica, el coeficiente de determinacin,


denominado R2 , es un estadstico usado en el contexto de un modelo estadstico
cuyo principal propsito es predecir futuros resultados o testear una hiptesis. El
coeficiente determina la calidad del modelo para replicar los resultados, y la
proporcin de variacin de los resultados que puede explicarse por el modelo.1
En este caso, el R2 es simplemente el cuadrado del coeficiente de correlacin de
Pearson, lo cual es slo cierto para la regresin lineal simple. Si existe varios
resultados para una nica variable, es decir, para una X existe una Y, Z... el
coeficiente de determinacin resulta del cuadrado del coeficiente de determinacin
mltiple. En ambos casos el R2 adquiere valores entre 0 y 1. Existen casos dentro de
la definicin computacional de R2 donde este valor puede tomar valores negativos2 .
Regresin Lineal Simple.
Coeficiente de determinacin (R2)
El llamado el coeficiente de determinacin es
usado normalmente para juzgar que tanto se
adapta la recta de ajuste al conjunto de datos
proporcionados,
Para el modelo de regresin del
ejemplo de la pureza del oxigeno
Esto es, el modelo toma en cuenta el
87.7% del de la variacin presente
en los datos.
Regresin Lineal Simple.
Covarianza
Regresin Lineal Simple.
Covarianza
Regresin Lineal Simple.
Covarianza
Regresin Lineal Simple.
Correlacin
Regresin Lineal Simple.
Coeficiente de determinacin (R2)
Regresin Lineal Simple.
Regresin Lineal Simple.
Regresin Lineal Simple.
Regresin Lineal Simple.
Regresin Lineal Simple.
Regresin Lineal Simple.
Regresin Lineal Simple.
Coeficiente de determinacin (R2)
Regresin Lineal Simple.
Coeficiente de determinacin (R2)