Вы находитесь на странице: 1из 7

1) ANÁLISIS DE METODOS UTILIZADOS EN EXCEL.

MÉTODO GRÁFICO POR DIAGRAMA DE DISPERSIÓN Y LINEA DE


REGRESIÓN

Al realizar un diagrama de dispersión este nos ofrece una idea bastante


aproximada sobre el tipo de relación existente entre dos variables, así mismo un
diagrama de dispersión también puede utilizarse como una forma de cuantificar el
grado de relación lineal existente entre dos variables, basta así solo observar el
grado en el que la nube de puntos se ajusta a una línea recta. Pero sabemos que
un diagrama de dispersión permite formarse una primera impresión muy rápida
sobre el tipo de relación existente entre dos variables, utilizarlo como una forma de
cuantificar esa relación tiene un serio inconveniente: ya que la relación entre dos
variables no siempre es perfecta o nula; de hecho, habitualmente no es ni lo uno
ni lo otro.

Supongamos que disponemos de un pequeño conjunto de datos con información


sobre velocidad y densidad vehicular, y que estamos interesados en estudiar la
relación entre la velocidad y densidad vehicular. Un buen punto de partida para
formarnos una primera impresión de esa relación podría ser la representación de
la nube de puntos, tal como se muestra en el siguiente diagrama de dispersión.

Diagrama de dispersión de velocidad (Ve) Vs Densidad Vehicular (K)

100
90
80
70
VELOCIDAD [VE (KM/H)]

60
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80
DENSIDAD [K (VEH/KM/CARRIL)]

El eje vertical muestra la variación o aumento de velocidad (por Kilometro por


hora) y el horizontal la densidad vehicular (por vehículo por kilometro por carril). A
simple vista, parece existir una relación inversa ya que conforme aumenta la
velocidad disminuye la densidad vehicular, podríamos decir que el aumento de la
velocidad va acompañado de una baja o nula densidad vehicular, por consiguiente
se tiende a realizar una línea recta explicada por medio de una explicación
matemática que nos permita describir resumidamente la nube de puntos, del
diagrama de dispersión mostrado anteriormente.

Diagrama de dispersión y recta de regresión de velocidad (Ve) Vs Densidad


Vehicular (K)

100
90
80
70
VELOCIDAD [VE (KM/H)]

y = -1.3489x + 102.32
60 R² = 0.9445

50
40
30
20
10
0
0 10 20 30 40 50 60 70 80
DENSIDAD [K (VEH/KM/CARRIL)]

En este caso, la formula de la recta aparece a la derecha del diagrama. La


pendiente de la recta (𝐵1 ) indica que, en promedio, a cada incremento de una
unidad en la densidad (𝑋1 ) le corresponde una disminución de 1,348 de la
velocidad (𝑌1 ). El origen de la recta (𝐵0 ) sugiere que un automóvil con una
velocidad conocida podría tener –1.348 de disminución en la respectiva densidad
vehicular en el trayecto que dicho vehículo o automóvil recorra.

La ecuación está acompañada por un coeficiente de determinación que nos


permite obtener una interpretación intuitiva que representa el grado de ganancia
que podemos obtener al predecir una variable basándonos en el conocimiento de
otra u otras variables. El valor de 𝑅 2 del diagrama anterior equivale a 0,94, lo que
indica que si conocemos la densidad vehicular de una carretera o carril, podemos
mejorar en un 94% nuestros pronósticos sobre la velocidad en el recorrido que
puede tener en promedio un automóvil que transcurra en dicho trayecto o carril.
MÉTODO DE REGRESIÓN LINEAL SIMPLE

En este caso se realiza un estudio por medio del análisis de regresión lineal
simple al mismo conjunto de datos conocidos sobre velocidad y densidad
vehicular, teniendo a su vez en cuenta que el modelo de regresión lineal simple
corresponde al estudio realizado con respecto a una variable dependiente, en este
caso la variable dependiente es la Velocidad (Ve) que está explicada por la
variable independiente densidad (K),

Resumen del modelo

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,971838856
Coeficiente de determinación R^2 0,944470761
R^2 ajustado 0,939843325
Error típico 5,897581359
Observaciones 14

En este caso R toma un valor muy alto (sabiendo que su máximo es 1); Y 𝑅 2 nos
indica que el 94% de la variación de la velocidad esta explicada por la densidad,
aunque debemos aclara que en este momento el análisis de regresión no nos
permite afirmar que las relaciones detectadas sean de tipo casual, sólo es posible
hablar de grado de relación.

En el caso de 𝑅 2 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 es una corrección a la baja de 𝑅 2 que se basa en el


número de casos y de variables independientes, siendo más bajo su valor con
respecto a 𝑅 2 en nuestro caso, como hay 14 casos y una sola variable
independiente, los valores de 𝑅 2 (el corregido y el no corregido) son prácticamente
iguales.

Con respecto al error típico de la estimación, es la desviación típica de los


residuos, es decir, la desviación típica de las distancias existentes entre las
puntuaciones en la variable dependiente (𝑌1 ) que corresponde a la velocidad, y
los pronósticos efectuados con la recta de regresión (𝑌̂1 ), aunque no exactamente,
pues la suma de las distancias al cuadrado están divididas por n-2.En realidad,
este error típico denotado en la anterior tabla corresponde a la raíz cuadrada de la
media cuadrática residual de la anterior tabla, que representa así una medida de la
parte de variabilidad de la variable dependiente velocidad que no es explicada por
la recta de regresión o por la densidad en este caso que sería la variable
independiente, en general, cuando mejor es el ajuste, más pequeño es este error
típico.
Resumen del ANOVA O ANÁLISIS DE VARIANZA

Grados de Suma de Promedio de los Valor crítico


libertad cuadrados cuadrados F de F
Regresión 1 7098,979552 7098,979552 204,1023681 6,77704E-09
Residuos 12 417,3775906 34,78146589
Total 13 7516,357143

La anterior tabla resumen de ANOVA, nos informa sobre si existe o no relación


significativa entre nuestras variables, en este caso la velocidad y la densidad
vehicular; el estadístico F que equivale a 204,1023 permite contrastar la hipótesis
nula de que el valor poblacional de R es cero, lo cual, en el modelo de regresión
simple, equivale a contrastar la hipótesis de que la pendiente de la recta de la
regresión vale cero. El Valor critico de F que equivale a 6,77704E-09 indica en este
caso que, si suponemos que el valor poblacional de R es cero, improbable
(probabilidad es igual a 0) que R, en este caso toma el valor de 0,97. Lo cual
implica que R es mayor que cero y que, en consecuencia, ambas variables están
linealmente relacionadas.

Resumen de coeficientes de regresión parcial

Error Estadístico Inferior Superior Inferior 95, Superior


Coeficientes típico t Probabilidad 95% 95% 0% 95,0%
Intercepción(Punto
de corte (Bo)) 102,320615 4,129864 24,77577 1,13037E-11 93,322413 111,31881 93,322413 111,318817
Variable X 1 -1,34891981 0,094419 -14,28644 6,77704E-09 -1,554642 -1,143197 -1,5546424 -1,1431971

La anterior tabla muestra los coeficientes de la recta de regresión. Las columnas


que corresponden a coeficientes y error típico contienen los coeficientes de
regresión parcial que definen la ecuación de regresión en puntuaciones directas.

El coeficiente correspondiente a la constante es el origen de la recta de regresión


(𝐵0 ) y el coeficiente correspondiente a la densidad vehicular es la pendiente de la
recta de regresión (𝐵1 ) que indica el cambio medio que corresponde a la variable
dependiente (Velocidad) por cada unidad de cambio de la variable independiente
(Densidad). Según esto, la ecuación de regresión queda de la siguiente manera:

𝑃𝑟𝑜𝑛𝑜𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑉𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 = 102,3206 − 1,348 𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑

A cada valor de densidad le corresponde un pronóstico de velocidad basado en un


incremento constante 102,320 menos 1,348 veces el valor de la densidad.
Finalmente, los estadísticos t y sus niveles críticos nos permiten contrastar las
hipótesis nulas de que los coeficientes de regresión valen cero en la población.
Estos estadísticos t se obtienen dividiendo los coeficientes de regresión (𝐵0 ) y
(𝐵1 ) entre sus correspondientes errores típicos.

Estos estadísticos t se distribuyen según el modelo de probabilidad t Student con


n-2 grados de libertad. Por tanto, pueden ser utilizados para decidir si un
determinado coeficiente de regresión es significativamente distinto de cero, y en
consecuencia, si nuestra variable independiente densidad está significativamente
relacionada con la dependiente (velocidad).

Puesto que la regresión lineal simple empleada en este estudio solo se trabajo una
variable independiente, el resultado del estadístico t es equivalente al del estudio F
de la tabla del ANOVA. A partir de los resultados de la tabla anterior la pendiente
poblacional de la recta de regresión es significativamente distinta de cero, lo cual
nos permite concluir que entre la velocidad y la densidad vehicular existe relación
lineal significativa.

ANÁLISIS COMPLEMENTARIO CON RESPECTO A LOS DOS METODOS.

Con respecto al estudio realizado anteriormente el método que explica mejor la


correlación que hay entre la velocidad y la densidad es el método grafico el
modelo lineal teniendo en cuenta que se realizo el estudio con respecto a los
siguientes modelos:

MODELO LINEAL
100
90
VELOCIDAD [VE (KM/H)]

80 y = -1.3489x + 102.32
R² = 0.9445
70
60
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80
DENSIDAD [K (VEH/KM/CARRIL)]
MODELO EXPONENCIAL
120
y = 157.95e-0.033x
VELOCIDAD [VE (KM/H)]

100
R² = 0.9434

80

60

40

20

0
0 10 20 30 40 50 60 70 80
DENSIDAD [K (VEH/KM/CARRIL)]

MODELO LOGARITMICO
120
VELOCIDAD [VE (KM/H)]

100 y = -47.21ln(x) + 217.72


R² = 0.9237
80

60

40

20

0
0 10 20 30 40 50 60 70 80
DENSIDAD [K (VEH/KM/CARRIL)]

Comparando así la ecuación del método grafico por medio del modelo lineal con
respecto a la regresión lineal simple observamos que estas son relativamente las
mismas y expresan en términos numéricos la correlación lineal entre la velocidad
que fue tomada como variable dependiente y la densidad que por el contrario fue
tomada como variable independiente.

𝐸𝑐𝑢𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑙 𝑠𝑖𝑚𝑝𝑙𝑒

𝑃𝑟𝑜𝑛𝑜𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑉𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 = 102,3206 − 1,348 𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑 ; 𝑅 2 = 0,944


𝐸𝑐𝑢𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑚𝑜𝑑𝑒𝑙𝑜 𝑙𝑖𝑛𝑒𝑎𝑙

𝑃𝑟𝑜𝑛𝑜𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑉𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 = −1,348 𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑 + 102,3 ; 𝑅 2 = 0,944

Teniendo en cuenta lo anterior concluimos que la variable dependiente Velocidad


explica el 94% de los datos con respecto a la variable densidad, que estas dos
variables poseen una correlación lineal fuerte, ya que al aumentar la velocidad
disminuye la densidad e igual en sentido contrario, así también aclaramos que el
método más fácil de utilizar es el método grafico con respecto al modelo lineal el
cual explica la correlación que poseen dichas variables, no siendo en más preciso,
si hablamos de realizar una regresión lineal simple en este caso teniendo una solo
variable independiente es el método más preciso pero así se termina observando
que los dos métodos, el de regresión lineal simple y el método grafico con
respecto al modelo lineal nos llevan a la misma correlación numérica y explican
más acertadamente dicha relación lineal.

Вам также может понравиться