Вы находитесь на странице: 1из 25

UNIVERSIDAD ISA

METODOS ESTADÍSTICOS

Regresión lineal simple


Regresión Lineal

Qué es el análisis de
regresión lineal ?

Es una herramienta estadística que podemos usar


para describir el grado de relación lineal entre las
variables.
Regresión Lineal

Variable
Independiente Variable
(X) Dependiente
Tipos de Variables
(Y)
(determinística, es
aleatoria
decir no
aleatoria.)
Ejemplos

X: Número de llamadas telefónicas realizadas por un vendedor promocionando


un producto.
Y: Unidades vendidas por el vendedor.

X: Tiempo que dedica un estudiante a una materia.


Y : Evaluación que obtiene el estudiante en la materia.
Regresión lineal simple

Es un modelo matemático para predecir el efecto de


una variable sobre otra, ambas cuantitativas.
Una variable es la dependiente y otra la
independiente
Se grafica con el diagrama de dispersión.
Dice cómo es la relación entre las dos variables.
El análisis consiste en encontrar la “mejor” línea
recta de esos puntos.
El modelo de regresión lineal

 La relación se puede representar gráficamente


mediante una línea recta.
 El modelo de regresión completo es

y    x  e

Y es el valor de la variable dependiente


A o alfa es el intercepto, donde cruza el eje y
B o beta es la pendiente o inclinación
y
4
E ( y)  ˆ0  ˆ1 x
3

2
̂1  pendiente
1

̂0  ordenada al origen0 1 2 3 4 X


Diagrama de dispersión y recta
Prueba de hipótesis

 Prueba de Ho: beta=0, mediante la estadística F

 Si beta es igual a cero, se concluye que:


 No existe relación entre las variables
 Ha: beta≠0, mediante la estadística F
 Existe relación lineal entre las variables
Cálculo de la línea recta
Yi=a+bX
α= Intercepto
β= pendiente
Ejemplo Regresión Lineal

Un experto en estadística investiga la posible relación


lineal entre la altura de una persona (cm) y su peso en
kg.
X= # Alturas de las personas
Y= # Peso de las personas
Ejemplo Regresión Lineal

A la derecha tenemos una posible manera de recoger


los datos observando dos variables en varios
individuos de una muestra. Altura Peso
en cm. en Kg.
En cada fila tenemos los datos de un individuo 162 61

Cada columna representa los valores que toma una 154 60


variable sobre los mismos. 180 78

Las individuos no se muestran en ningún orden 158 62


particular. 171 66
169 60
Dichas observaciones pueden ser representadas en un
diagrama de dispersión . En ellos, cada individuo es un 166 54
punto cuyas coordenadas son los valores de las 176 84
variables. 163 68

Nuestro objetivo será intentar reconocer a partir del


mismo si hay relación entre las variables, de qué tipo, y
si es posible predecir el valor de una de ellas en función
de la otra.
Diagramas de dispersión o nube de puntos

Tenemos las alturas y los pesos de 30 individuos


representados en un diagrama de dispersión.

100
90
80
70
60
50 Pesa 50 kg. Mide 161 cm.
40
30
140 150 160 170 180 190 200
Cálculos
α= Intercepto
β= pendiente
Altura Peso
en cm. en Kg. ΣX=
162 61
154 60 ΣY=
180 78
158 62 Σ X2 =
171 66
169 60 Σ XY =
166 54
176 84 =
163 68
=
n=
Cálculos
α= Intercepto
β= pendiente
ΣX= 1499
Σ Y = 593
Σ X2 = 250,227
Σ XY =99216 = 0.80
=65.88
= 166.55
= -67.46

Ỹ= -67.46+0.80X

0.80 kg de peso /cm de estatura


Correlación simple
Regresión vs. correlación

la relación entre dos variables


– la magnitud de una variable (dependiente) se
asume que es determinada por una segunda
variable (independiente)
– el término “dependiente” no implica “causa y
efecto”
Correlación simple
Es una extensión de la regresión simple.
Mide la calidad del ajuste de una línea.
Dice cuánto se relacionan las dos variables
r es el coeficiente de correlación
r2 es el coeficiente de determinación

var iación in exp licada


r 
2

var iación total


Prueba de hipótesis

Ho: r=0, mediante la estadística F

 Si r es igual a cero, se concluye que no


existe correlación lineal entre las variables,
pero puede ser no lineal (exponencial,
curva, etc.)
Coeficiente r de Pearson

Puede variar de –1 a +1
 -1 correlación negativa perfecta
 -0.9 correlación negativa muy fuerte
 -0.75 correlación negativa considerable
 -0.5 correlación negativa media
 -0.1 correlación negativa débil
 0.0 no existe correlación entre las variables
Los programas reportan el valor de p del coeficiente para
evaluar la significancia de la correlación
Asociación entre X y Y
Y
Y

Negativa
Positiva

X
X

Zero

X
Coeficiente de Correlación de Pearson
 X  X Yi  Y 
N

S xy i 1
i
rxy  
Sx Sy
 X  X  Y 
N N
2 2
i i  Y
i 1 i 1

 1  rxy   1
rxy = 0
9 12
25
8 rxy = 0.88 10
20 7
6 8
15 5 6
4
10
rxy = 1
4
3
5 2 2
1
0 0
0 0 2 4 6 8 10 12
0 2 4 6 8 10 12 0 2 4 6 8 10

0
0 2 4 6 8 10 12
-5

-10 rxy = -1
rxy = -0.88
rxy = 0
-15

-20
Correlación
Los datos de la siguiente tabla representan los resultados
de la clase de que busca encontrar la correlación entre
horas de estudio mensual y calificación de la materia
Métodos Estadísticos.
(Horas estudio X) (Calificación Y)
10 60
12 65
13 70
14 72
20 80
22 84
25 87
27 90
Cálculos

ΣXY=
ΣY=
Σ X2 =
Σ Y2 =
ΣY=
ΣX=
n=
Cálculos

ΣX= 143
Σ Y = 608
Σ X2 = 2847
Σ Y2 = 47034
r = 0.98
Σ XY =11351

Conclusión: Existe una relación positiva entre las horas de


estudio de Métodos Estadísticos y la calificación de dicho
estudiante.