Вы находитесь на странице: 1из 15

MODELO DE REGRESION

El modelo de regresin lineal es una herramienta estadstica muy verstil con la cual podemos relacionar funcionalmente dos variables, una de las variables afecta a la otra segn sea su variacin entonces esta ser la variable independiente o regresor y la otra ser la variable dependiente o regresa ndo. Y = f (x) La regresin nos ayuda a predecir cmo se comportar cierto proceso cuando varan algunas variables inherentes al mismo. Este modelo relaciona las variables segn ecuaciones que son las que determinan los posibles valores a medida que cambie la variable regresora , y es as que tenemos graficas denominadas diagramas de dispersin (figura 1) en la que se visualiza la tendencia de una funcin, en el eje (x) se representar la variable independiente la cual puede ser una causa y en el eje (y) estar la variable dependiente que sera un efecto. Por ejemplo el director de un centro educativo quiere saber cules van a ser los posibles resultados de las calificaciones de los exmenes de sus estudiantes, si estas sern buenas o malas, para ello intentar predecir dichos resultados conociendo el tiempo que los estudiantes aplican para estudiar, por lo tanto las calificaciones va a ser un efecto y el tiempo en estudiar ser una causa, entonces si los alumnos estudiaran ms tiempo tendrn calificaciones altas pero si el tiempo que emplean en estudiar es menor obtendrn menos calificaciones.

Variable independiente = x (causa) Variable dependiente = y (efecto) Bsicamente un modelo de regresin predice las posi bles variantes de cualquier proceso o actividad basndose en una ecuacin como la podemos observar en la figura 2, en esta explicacin nos basaremos en el modelo lineal.

Y = valor estimado b0= intercepto con el eje y b1 = valor con el que cambia y con respecto a la unidad de variante de x (pendiente)

Para la obtencin de una ecuacin que se ajuste a la distribucin de los puntos en el plano, existe un mtodo llamado mnimos cuadrados ordinarios (MCO) el cual producir una recta que se extiende por el centro del diagrama de dispersin aproximndose a todos los puntos de datos ms que cualquier otra.

Modelo de regresin estimada

Frmulas para determinar la ecuacin de ajuste por medio de los mnimos cuadrados ordinarios (MCO).

Suma de los cuadrados de X Suma de los cuadrados de Y Suma de los productos cruzados de X y Y.

    

Pendiente de la recta de regresin

(Coeficiente de regresin) Intercepto de la recta de regresin

Donde

son la media de los valores Y y los valores X.

NOTA: estos clculos son de exactitud por lo tanto se aconseja usar por lo menos cuatro o cinco cifras decimales. Erro estndar de estimacin.

Mide la variacin de los puntos de datos por encima y por debajo de la recta de regresin. Suma de los cuadrados de error

Cuadrado medio del error

Error estndar

Figura 3. Rectas que representan el punto mximo y el mnimo.

El error estndar nos determina los puntos mximo y mnimo entre los cuales pueden estar los valores. Empricamente se dice que el 68.3 % de los datos caern dentro de estas rectas. Ver figura 3.

Coeficiente de correlacin .

El coeficiente de relacin r mide la fuerza de relacin entre las variables, puede asumir cualquier valor entre -1 y 1, estos extremos significan relaciones perfectas si tienden a 0 o se aproximan a este la relacin no existir o ser ms dbil. Figura 4.

Figura 4. Posibles valores del coeficiente de correlacin r.

Coeficiente de correlacin Coeficiente de determinacin El coeficiente de determinacin revela que porcentaje de cambio en y se explica por un cambio en x.

Pruebas de
Determina la relacin de las variables a nivel poblacional . Estadstico t Donde =0 Error estndar del coeficiente de correlacin I.C para

Se compara el estadstico t con 2.16 si no est dentro de ese rango entonces 10


Anlisis de varianza de la regresin

Esta tabla establece la variacin del modelo de muestreo .

Suma de cuadrados de la regresin

Ejercicio: La gerencia de Ho pScothAirlines, la aerolnea transportadora ms pequea del mundo, considera que existe una relacin directa entre los gastos publicitarios y el nmero de pasajeros que escogen viajar por Hop Scotch. Para determinar si esta relacin existe, y si es as cual podra ser la naturaleza exacta, los estadsticos empleados por Hop Scotch decidieron utilizar los procedimientos MCO para determinar el modelo de regresin. Se recolectaron los valores mensuales por gastos de publicidad y nmeros de pasajeros para los n = 15 meses ms recientes. Los datos aparecen en la tabla, junto con otros clculos necesarios para hallar el modelo de regresin. Se observaran que los pasajeros estn representados con la variable Y, ya que se asume que depende de la publicidad.

Se determina el modelo de regresin





.  La suma de los cuadrados y productos cruzados son:

Ahora calculamos el coeficiente de regresin.

 

Debido a que.

Entonces el intercepto es

 
El modelo de regresin entonces es

En donde es el valor individual pronosticado para los pasajeros. As. Si igual a 10, tendremos:

es

Debido a que tanto X como Y estn expresadas en miles, esto significa que si se gasta US$10000 en publicidad, el modelo predice que 15200 personas decidirn volar en Hop ScotchAirlines. El coeficiente de 1.08 que por cada incremento de una unidad en X, Y aumentara en 1.08 unidades. P or tanto, si se incrementan los gastos publicitarios en US$1000, entonces 1.080 pasajeros ms abordaran aviones de Hop Scotch. .

Entonces


Residuos

Solo como aplicacin tomaremos un solo punto (10), pero se debern sacar los residuos u errores de todos los puntos de la muestra.


Calculo del error estndar de estimacin.

Suma de los cuadrados del error

Cuadrado medio del error

Error estndar

 

Entonces decimos que nuestro valor pronosticado va a tener un error de 0.907.

Una regla emprica nos dice que el 68.3 % de los puntos dispersos estarn dentro de este rango.
Calculo del coeficiente de correlacin

  
Este valor indica una relacin fuerte entre la publicidad invertida y el nmero de pasajeros.

Y el coeficiente de determinacin es

t S

l t i l t t

. Ai li t l i i l

i l i

.

l i l

% li i l i

l i l ti

j . l i t

i i i

t l

A ti i t t

Si
E

i t l fi i t

i i .

E t

ti

Se dice que para rechazar.

de 5% no rechazar si esta entre 2.160 por lo contrario

Como 13.995 > 2.160 por lo tanto concluimos que a nivel poblacional si existe correlacin entre las variables.

Clculo del verdadero

Entonces

0.913

1.247

Anlisis de la varianza

Fuente de variacin Regresin Error Total

Suma de cuadrados 161.0441 10.69 171.73

Grados de libertad 1 13 14

Cuadrado medio 161.0441 0.82

Razn F

196.39

Suma de cuadrados de la regresin 

  

Grados de libertad del total = n -1= 15-1=14

La azn dif nt .

anl

a al

tad ti

t,

la azn

la

na tabla

P l tant deci est dentro de .

e con . es . ero con la regla de decisin si se acepta caso contrario se rechaza.

. . entonces se dice e tanto la estra como la poblacin tienen ue nuestro pronstico por medio de la correlacin entre sus ariables, ecuacin de mnimos cuadrados ordinarios es confiable.

Formulas necesarias para el modelo de regresin.

Вам также может понравиться