Вы находитесь на странице: 1из 9

UNIVERSIDAD SANTIAGO DE CALI

FACULTAD DE CIENCIAS BÁSICAS


Pág.1/9
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

UNIDAD 4: CORRELACIÓN Y REGRESIÓN


OTROS MODELOS DE REGRESIÓN

3. MODELO POLINÓMICO
Es un modelo de regresión, que se emplea cuando la
dependencia entre las variables 𝑌 (variable dependiente) y 𝑋
(variable independiente) es de forma polinómica, en cuyo caso se
ajusta a la nube de puntos del diagrama de dispersión una
función del tipo:

𝑌 = 𝑎0 + 𝑎1 𝑋 + 𝑎2 𝑋 2 + ⋯ + 𝑎𝑛 𝑋 𝑛 Función polinomial para cualquier grado 𝑛.

Donde 𝑎0 , 𝑎1 , 𝑎2 , …, 𝑎𝑛 , son los parámetros o coeficientes del modelo de regresión


polinómico de grado 𝑛, diferentes expresiones de menor grado se pueden obtener
a partir de la expresión anterior de acuerdo con el grado que tenga el mismo. Por lo
general se prefieren polinomios donde 𝑛 = 2 o 𝑛 = 3, pese a que polinomios de
mayor grado se pueden ajustar mejor a cualquier conjunto de datos (la solución
más simple siempre es preferible).

La función del modelo de regresión polinomial de grado 2 (𝑛 = 2) es el siguiente:

𝑌 = 𝑎 + 𝑏𝑋 + 𝑐𝑋 2

La función del modelo de regresión polinomial de grado 3 (𝑛 = 3) es el siguiente:

𝑌 = 𝑎 + 𝑏𝑋 + 𝑐𝑋 2 + 𝑑𝑋 3

El exponente más alto que acompaña al último término en las expresiones


anteriores es el que determina el grado del modelo de regresión polinómico.

Ejemplo: Se quiere identificar la relación que puede existir entre el tiempo (en
minutos) de la duración de una conferencia y el índice de la capacidad de atención
en la conferencia (1: Poca atención, 10: Mucha atención), para esto se tomó una
muestra aleatoria de los evaluados donde se observaron los siguientes resultados:

Tiempo 20 30 40 50 60 70 90 100 110 120 130 140


Atención 1 3 4 5 6 7 8 7 5 3 2 1
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.2/9
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Regresión lineal Regresión polinómica


9 9

8 8

7 7
Índice de atención

Índice de atención
6 6

5 5

4 4

3 3

2 y = -0.0033x + 4.5971 2 y = -0.0018x2 + 0.2852x - 4.2073


R² = 0.0032 R² = 0.9315
1 1

0 0
0 20 40 60 80 100 120 140 160 0 20 40 60 80 100 120 140 160
Tiempo de duración Tiempo de duración
Figura 1: Diagramas de dispersión entre las variables índice de atención (𝑌) y
tiempo de duración (𝑋), con dos modelos diferentes ajustados.

En la figura 1 se observa que el modelo de regresión polinómico de grado 2,


presenta un mejor ajuste para este conjunto de datos puesto que el valor del
coeficiente de determinación 𝑅 2 es mayor. Las estimaciones de los coeficientes son
las siguientes:

Regresión lineal Regresión polinómica


𝑎 4.5971 -4.2073
𝑏 -0.0033 0.2852
𝑐 -0.0018

A partir de estos resultados se pueden obtener predicciones, por ejemplo: ¿Cuánto


sería el índice de atención si el tiempo de duración de la conferencia es 80 minutos?
• Con el modelo de regresión lineal se tiene que: 𝑌 = 4.5971 − 0.0033𝑋
Por lo tanto, si 𝑋 = 80, entonces: 𝑌 = 4.5971 − 0.0033 ∗ (80) = 4.3331
Es decir, aproximadamente 4.3.
• Con el modelo de regresión polinómico de grado 2 se tiene que:
𝑌 = −4.2073 + 0.2852𝑋 − 0.0018𝑋 2
Por lo tanto, si 𝑋 = 80, entonces:
𝑌 = −4.2073 + 0.2852 ∗ (80) − 0.0018 ∗ (80)2 = 7.0887
Es decir, aproximadamente 7.1.
Como se puede apreciar la información obtenida por el modelo polinómico de grado
2, parece más confiable de acuerdo con lo observado en los gráficos de la figura 1.

Se puede obtener otros modelos polinómicos de mayor grado, pero este modelo se
considera como la mejor opción para ajustar a este conjunto de datos.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.3/9
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

3.1. ¿CÓMO OBTENER EL MODELO DE REGRESIÓN POLINÓMICO?


Las fórmulas para encontrar las estimaciones de los coeficientes y el procedimiento
empleado pueden resultar complejos para realizarlos manualmente, por tal motivo
es recomendable apoyarse en las herramientas computacionales como Excel para
hacer esta labor. Los pasos empleados se explicarán por medio del siguiente
ejemplo.

Ejemplo: La caída del voltaje (en voltios) en la batería del motor de un misil guiado,
se observa durante el tiempo de vuelo del misil (en segundos), tal y como se muestra
a continuación:

Tiempo de vuelo 1 3 5 7 9 11 13 15 17 19
Caída de voltaje 7.23 9.39 11.91 11.30 14.68 14.71 13.79 12.05 10.11 7.62

Se requiere calcular el modelo de regresión polinómico de un grado adecuado para


la caída del voltaje a partir del tiempo de vuelo. Y utilizar ese modelo para predecir
la caída del voltaje si el tiempo de vuelo es de 10 segundos.

Lo primero es ingresar los datos en un archivo de Excel, en una primera columna


se ingresa la información de la variable 𝑋 (Tiempo) y en una segunda columna la
información de la variable 𝑌 (Voltaje), para luego hacer un diagrama de dispersión.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.4/9
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

En el gráfico obtenido el eje horizontal corresponde a los valores de la variable 𝑋 y


el eje vertical corresponde a los valores de la variable 𝑌. Se da clic derecho en
cualquiera de los puntos del gráfico y se da un clic en la ventana emergente en la
opción: Agregar línea de tendencia…

Inmediatamente el Excel traza la línea de regresión (línea punteada) y muestra una


información importante en una ventana al lado derecho de la pantalla.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.5/9
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Se seleccionan algunas de las opciones de la ventana del lado derecho, por


ejemplo: Polinómica, la cual genera el modelo de regresión polinómico de grado 2
en lugar del modelo de regresión lineal, Presentar ecuación en el gráfico, la cual
muestra la ecuación del modelo de regresión. Otra opción es: Presentar el valor R
cuadrado en el gráfico, la cual muestra el valor del coeficiente de determinación.
Para esto se da un clic en las casillas en blanco al lado izquierdo de cada una de
las opciones.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.6/9
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Si la ecuación se sobrepone a los puntos en el gráfico esta se puede seleccionar y


desplazarla a otro lugar dentro del gráfico, además se puede aumentar el tamaño
de la letra para apreciarla mejor.

El grado de los polinomios se puede aumentar o disminuir con tan solo cambiar el
número que se visualiza en la casilla grado de la ventana del lado derecho (para ver
la ventana con la información de la línea de tendencia se selecciona simplemente
la gráfica línea punteada en el gráfico).
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.7/9
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Como se puede apreciar en la ventana del lado derecho de las figuras anteriores,
en las opciones de línea de tendencia se pueden elegir diferentes modelos de
regresión. Y en este caso se pueden aumentar los grados del polinomio en el
modelo de regresión, pese a que un criterio de selección de modelos seria elegir
aquel que tenga el mayor valor de 𝑹𝟐 , pues esto indicaría que se ajusta mejor
a ese conjunto de datos, en el caso de los modelos de regresión polinómicos se
considera el principio estadístico de la parsimonia (el cual indica que se debe usar
el modelo más simple posible que sea consistente con los datos).

Los 𝑅 2 obtenidos para los tres diferentes modelos polinómicos son:

Modelo polinómico 𝑅2
De grado 2 0.9890
De grado 3 0.9893
De grado 4 0.9979

Como se puede observar la diferencia entre el modelo de regresión polinómico de


grado 2 y el de grado 3 es prácticamente nula (0.0003) y frente al modelo de
regresión polinómico de grado 4 esa diferencia es muy pequeña (0.0089). Por lo
cual se puede seleccionar al modelo de regresión polinómico de grado 2, como el
mejor modelo a ajustar para este conjunto de datos. En la práctica solo se
seleccionaría un modelo polinómico de grado superior a 3, cuando la diferencia en
el 𝑅 2 es significativamente grande frente a los modelos polinómicos de grado
inferior.

Finalmente, para predecir la caída del voltaje si el tiempo de vuelo es de 10


segundos, se reemplaza este valor en la variable 𝑋, de la ecuación obtenida en la
figura del modelo de regresión polinómico de grado 2:
• El modelo de regresión polinómico de grado 2 es:
𝑌 = 5.1454 + 1.8259𝑋 − 0.0897𝑋 2
Por lo tanto, si 𝑋 = 10, entonces:
𝑌 = 5.1454 + 1.8259 ∗ (10) − 0.0897 ∗ (10)2 = 14.4344
Es decir, aproximadamente 14.43.

A continuación, se presenta el anterior cálculo por medio de Excel.


UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.8/9
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Para elevar un número a cualquier exponente en Excel se emplea el símbolo del


teclado ^ (para utilizarlo en algunos teclados se presiona primero la tecla alt gr y
luego la tecla que tiene el símbolo ^), por ejemplo: =10^2 debe ser igual a 100.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.9/9
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Anexo: Resultados de la predicción con los polinomios de grado 3 y 4.


• El modelo de regresión polinómico de grado 3 es:
𝑌 = 5.2877 + 1.7430𝑋 − 0.0794𝑋 2 − 0.0003𝑋 3
Por lo tanto, si 𝑋 = 10, entonces:
𝑌 = 5.2877 + 1.7430 ∗ (10) − 0.0794 ∗ (10)2 − 0.0003 ∗ (10)3 = 14.4777
Es decir, aproximadamente 14.47 voltios.
• El modelo de regresión polinómico de grado 4 es:
𝑌 = 6.2543 + 0.8562𝑋 + 0.1153𝑋 2 − 0.0154𝑋 3 + 0.0004𝑋 4
Por lo tanto, si 𝑋 = 10, entonces:
𝑌 = 6.2543 + 0.8562 ∗ (10) + 0.1153 ∗ (10)2 − 0.0154 ∗ (10)3 + 0.0004 ∗ (10)4 = 14.9463
Es decir, aproximadamente 14.95 voltios.
Como se puede observar los resultados obtenidos no varían mucho entre sí.

Вам также может понравиться