Академический Документы
Профессиональный Документы
Культура Документы
El modelo de regresin lineal es una herramienta estadstica muy verstil con la cual podemos relacionar funcionalmente dos variables, una de las variables afecta a la otra segn sea su variacin entonces esta ser la variable independiente o regresor y la otra ser la variable dependiente o regresa ndo. Y = f (x) La regresin nos ayuda a predecir cmo se comportar cierto proceso cuando varan algunas variables inherentes al mismo. Este modelo relaciona las variables segn ecuaciones que son las que determinan los posibles valores a medida que cambie la variable regresora , y es as que tenemos graficas denominadas diagramas de dispersin (figura 1) en la que se visualiza la tendencia de una funcin, en el eje (x) se representar la variable independiente la cual puede ser una causa y en el eje (y) estar la variable dependiente que sera un efecto. Por ejemplo el director de un centro educativo quiere saber cules van a ser los posibles resultados de las calificaciones de los exmenes de sus estudiantes, si estas sern buenas o malas, para ello intentar predecir dichos resultados conociendo el tiempo que los estudiantes aplican para estudiar, por lo tanto las calificaciones va a ser un efecto y el tiempo en estudiar ser una causa, entonces si los alumnos estudiaran ms tiempo tendrn calificaciones altas pero si el tiempo que emplean en estudiar es menor obtendrn menos calificaciones.
Variable independiente = x (causa) Variable dependiente = y (efecto) Bsicamente un modelo de regresin predice las posi bles variantes de cualquier proceso o actividad basndose en una ecuacin como la podemos observar en la figura 2, en esta explicacin nos basaremos en el modelo lineal.
Y = valor estimado b0= intercepto con el eje y b1 = valor con el que cambia y con respecto a la unidad de variante de x (pendiente)
Para la obtencin de una ecuacin que se ajuste a la distribucin de los puntos en el plano, existe un mtodo llamado mnimos cuadrados ordinarios (MCO) el cual producir una recta que se extiende por el centro del diagrama de dispersin aproximndose a todos los puntos de datos ms que cualquier otra.
Frmulas para determinar la ecuacin de ajuste por medio de los mnimos cuadrados ordinarios (MCO).
Suma de los cuadrados de X Suma de los cuadrados de Y Suma de los productos cruzados de X y Y.
Donde
NOTA: estos clculos son de exactitud por lo tanto se aconseja usar por lo menos cuatro o cinco cifras decimales. Erro estndar de estimacin.
Mide la variacin de los puntos de datos por encima y por debajo de la recta de regresin. Suma de los cuadrados de error
Error estndar
El error estndar nos determina los puntos mximo y mnimo entre los cuales pueden estar los valores. Empricamente se dice que el 68.3 % de los datos caern dentro de estas rectas. Ver figura 3.
Coeficiente de correlacin .
El coeficiente de relacin r mide la fuerza de relacin entre las variables, puede asumir cualquier valor entre -1 y 1, estos extremos significan relaciones perfectas si tienden a 0 o se aproximan a este la relacin no existir o ser ms dbil. Figura 4.
Coeficiente de correlacin Coeficiente de determinacin El coeficiente de determinacin revela que porcentaje de cambio en y se explica por un cambio en x.
Pruebas de
Determina la relacin de las variables a nivel poblacional . Estadstico t Donde =0 Error estndar del coeficiente de correlacin I.C para
Ejercicio: La gerencia de Ho pScothAirlines, la aerolnea transportadora ms pequea del mundo, considera que existe una relacin directa entre los gastos publicitarios y el nmero de pasajeros que escogen viajar por Hop Scotch. Para determinar si esta relacin existe, y si es as cual podra ser la naturaleza exacta, los estadsticos empleados por Hop Scotch decidieron utilizar los procedimientos MCO para determinar el modelo de regresin. Se recolectaron los valores mensuales por gastos de publicidad y nmeros de pasajeros para los n = 15 meses ms recientes. Los datos aparecen en la tabla, junto con otros clculos necesarios para hallar el modelo de regresin. Se observaran que los pasajeros estn representados con la variable Y, ya que se asume que depende de la publicidad.
. La suma de los cuadrados y productos cruzados son:
Debido a que.
Entonces el intercepto es
El modelo de regresin entonces es
En donde es el valor individual pronosticado para los pasajeros. As. Si igual a 10, tendremos:
es
Debido a que tanto X como Y estn expresadas en miles, esto significa que si se gasta US$10000 en publicidad, el modelo predice que 15200 personas decidirn volar en Hop ScotchAirlines. El coeficiente de 1.08 que por cada incremento de una unidad en X, Y aumentara en 1.08 unidades. P or tanto, si se incrementan los gastos publicitarios en US$1000, entonces 1.080 pasajeros ms abordaran aviones de Hop Scotch. .
Entonces
Residuos
Solo como aplicacin tomaremos un solo punto (10), pero se debern sacar los residuos u errores de todos los puntos de la muestra.
Error estndar
Una regla emprica nos dice que el 68.3 % de los puntos dispersos estarn dentro de este rango.
Calculo del coeficiente de correlacin
Este valor indica una relacin fuerte entre la publicidad invertida y el nmero de pasajeros.
Y el coeficiente de determinacin es
t S
l t i l t t
. Ai li t l i i l
i l i
.
l i l
% li i l i
l i l ti
j . l i t
i i i
t l
A ti i t t
Si
E
i t l fi i t
i i .
E t
ti
Como 13.995 > 2.160 por lo tanto concluimos que a nivel poblacional si existe correlacin entre las variables.
Entonces
0.913
1.247
Anlisis de la varianza
Grados de libertad 1 13 14
Razn F
196.39
La azn dif nt .
anl
a al
tad ti
t,
la azn
la
na tabla
. . entonces se dice e tanto la estra como la poblacin tienen ue nuestro pronstico por medio de la correlacin entre sus ariables, ecuacin de mnimos cuadrados ordinarios es confiable.