Вы находитесь на странице: 1из 17

Regresión

• Cualquier método estadístico que busque establecer una ecuación


que permita estimar el valor desconocido de una variable a partir del
valor conocido de una o más variables, se denomina análisis de
regresión.
• Los análisis de regresión y correlación muestran como determinar la
naturaleza y la fuerza de una relación entre dos variables.
• El análisis de regresión se desarrolla una ecuación de estimación, es
decir, una formula matemática que relaciona las variables conocidas
con las desconocidas.
REGRESIÓN LINEAL SIMPLE

• “Una técnica estadística que establece una ecuación para estimar el


valor desconocido de una variable, a partir del valor conocido de otra
variable, (en vez de valores de muchas otras variables) se denomina
análisis de regresión simple.”
• Por lo tanto el análisis de regresión lineal simple, es el proceso
general de predecir una variable (Y) a partir de otra (X).
• Un modelo de regresión es un modelo que permite describir cómo
influye una variable X sobre otra variable Y .
• X: Variable independiente o explicativa
• Y: Variable dependiente o respuesta
• El objetivo es obtener estimaciones razonables de Y para distintos
valores de X a partir de una muestra de n pares de valores (x1, y1), . . .
, (xn, yn).
Universidad Nacional Autónoma de México
Facultad de Estudios Superiores Cuautitlán

DIAGRAMAS DE DISPERSIÓN
• Un diagrama de dispersión DIAGRAMAS
es unaDEilustración
DISPERSIÓN gráfica que se usa en el
análisis de regresión. Consta de una dispersión
Un diagrama de dispersión es unade puntos
ilustración gráfica quetalse usa
que en elcada
punto representa un valor de la variable independiente (medido a lo
análisis de regresión. Consta de una dispersión de puntos tal que cada punto
representa un valor de la variable independiente (medido a lo largo del eje
largo del eje horizontal), horizontal),
y un valor
y un valor
del eje vertical).
asociado
asociado de de
la variable dependiente la
(medido variable
a lo largo

dependiente (medido a lo largo del eje vertical).


El diagrama de dispersión, también llamado nube de puntos, brinda dos
• El diagrama de dispersión, también
tipos de información,llamado
visualmente se nube de
pueden determinar puntos,
los patrones brinda
indican como las variables están relacionadas (lineal o mediante una curva) y
que

dos tipos de información, porvisualmente se entre


otro lado si existe una relación pueden determinar
ellas visualizando la clase de línea o los
patrones que indican comoecuaciónlas variables están relacionadas (lineal o
de estimación que describe a dicha relación.

mediante una curva) y por otro lado


A continuación
dispersión:
si
se existe una
ilustran algunas relación
relaciones entre
en los diagramas deellas

visualizando la clase de línea o ecuación de estimación que describe a


dicha relación.
METODO DE MINIMOS CUADRADOS

• El método que por lo común se utiliza para ajustar una línea a los
datos muestrales indicados en el diagrama de dispersión, se llama
método de mínimos cuadrados.
• El método de mínimos cuadrados sirve para determinar la recta que
mejor se ajuste a los datos muestrales
• Dicha línea recta es la que mejor se ajusta al conjunto de datos (X, Y)
y es aquella en que la distancia que hay entre los datos y la supuesta
recta es la menor posible, y se calcula mediante la siguiente formula:
Y= ax + b
El modelo de regresión lineal simple
• El modelo de regresión lineal simple supone que: Y= ax + b
donde:
• y representa el valor de la variable respuesta para la observación
• x representa el valor de la variable explicativa para la observación

• a y b son los coeficientes de regresión:


• a: intercepto
• b: pendiente

• El objetivo es obtener estimaciones de a y b para calcular la


• recta de regresión: y = ax + b
• que se ajuste lo mejor posible a los datos.
• Para calcular el valor de a (ordenada al origen), que representa el
punto en que la recta corta al eje de las Y, se emplea la siguiente
formula:
a= 𝑛 Σ𝑋𝑌 − Σ𝑋 (Σ𝑌)
𝑛(Σ𝑋2)−(Σ𝑋)2]
• Para calcular el valor de b (pendiente), que representa el grado de
inclinación que tiene la recta, se emplea la siguiente formula:
b= 𝛴𝑌 − 𝑎 Σ𝑋
𝑛
EJERCICIO
• En un centro dietético se está probando una nueva dieta de
adelgazamiento en un muestra de 12 individuos. Para cada uno de
ellos se ha medido el número de días que lleva con la dieta y el
número de kilos perdidos desde entonces, obteniéndose los
siguientes resultados:
(33, 3.9), (51, 5.9), (30, 3.2), (55, 6.0), (38, 4.9), (62, 6.2)
(35, 4.5), (60, 6.1), (44, 5.6), (69, 6.2), (47, 5.8), (40, 5.3)

Se pide:
a) Dibujar un diagrama de dispersión
b) Obtener el coeficiente de correlación
c) Determinar si la dieta que se esta probando esta dando resultado
(explica en base a la relación entre las dos variables)
y = 0.0691x + 2.0514
Dieta de adelgazamiento R² = 0.7765
8

5
kilogramos perdidos

0
25 30 35 40 45 50 55 60 65 70 75
Dias de dieta
Dias de dieta Kilos perdidos
x y xy x2 y2
1 33 3.9 128.7 1089 15.21
2 35 4.5 157.5 1225 20.25
3 51 5.9 300.9 2601 34.81
4 60 6.1 366 3600 37.21
5 30 3.2 96 900 10.24
6 44 5.6 246.4 1936 31.36
7 55 6 330 3025 36
8 69 6.2 427.8 4761 38.44
9 38 4.9 186.2 1444 24.01
10 47 5.8 272.6 2209 33.64
11 62 6.2 384.4 3844 38.44
12 40 5.3 212 1600 28.09
total 564 63.6 3108.5 28234 347.7
𝑟 =. 𝑛 Σ𝑋𝑌 − Σ𝑋 (Σ𝑌) ________________________ 𝑟 = 12 3108.5 − 564 (63.6) ________________________
𝑛 Σ𝑋2 − Σ𝑋 2 ∗ [𝑛 Σ𝑌2 − Σ𝑌 2] 12 28234 − 564 2 ∗ [12 347.7 − 63.2 2]

𝑟 = 37302 − 35870.4 ________________________


338808 − 318096 ∗ [ 4172.4 − 4044.96 ]

𝑟 = 1431.6_______
20712 ∗ [127.44]

𝑟 = 1431.6_______
1624.66

𝒓 = 𝟎. 𝟖𝟖𝟏𝟏
Kilos
Dias de dieta perdidos a= 𝑛 Σ𝑋𝑌 − Σ𝑋 (Σ𝑌)
x y xy x2 y2 𝑛(Σ𝑋2)−(Σ𝑋)2
1 33 3.9 128.7 1089 15.21
2 35 4.5 157.5 1225 20.25 a= 12 3108.5 − 564 (63.6)
3 51 5.9 300.9 2601 34.81 12(28234)−(564)2
4 60 6.1 366 3600 37.21
5 30 3.2 96 900 10.24
6 44 5.6 246.4 1936 31.36
7 55 6 330 3025 36 a= 37302 − 35870
8 69 6.2 427.8 4761 38.44 (338808)−(318096)
9 38 4.9 186.2 1444 24.01
10 47 5.8 272.6 2209 33.64
11 62 6.2 384.4 3844 38.44
a= 1431.6
12 40 5.3 212 1600 28.09 20712
total 564 63.6 3108.5 28234 347.7
a= 0.06911
Kilos
Dias de dieta perdidos
x y xy x2 y2
1 33 3.9 128.7 1089 15.21 b= 𝛴𝑌 − 𝑎 Σ𝑋
2
3
35
51
4.5
5.9
157.5
300.9
1225
2601
20.25
34.81
𝑛
4 60 6.1 366 3600 37.21
5 30 3.2 96 900 10.24 b= 63.6 − 0.06911 564
6 44 5.6 246.4 1936 31.36
7 55 6 330 3025 36
12
8 69 6.2 427.8 4761 38.44
9 38 4.9 186.2 1444 24.01 b= 63.6 − 38.98
10 47 5.8 272.6 2209 33.64
11 62 6.2 384.4 3844 38.44
12
12 40 5.3 212 1600 28.09
total 564 63.6 3108.5 28234 347.7 b= 24.61
12
b=2.051
• Ecuacion de la recta para el ejercicio: Y= 0.06911X+2.05
Dieta de adelgazamiento
8

5
kilogramos perdidos

0
25 30 35 40 45 50 55 60 65 70 75
Dias de dieta

Вам также может понравиться