Вы находитесь на странице: 1из 30

Correlacin y regresin lineal simple.

Csar Gutirrez Villafuerte


Seccin de Epidemiologa
Instituto de Medicina Tropical Daniel A. Carrin - UNMSM
Lima, febrero de 2012

Correlacin y Regresin

Es posible tener inters en analizar la relacin entre


variables como:

presin sangunea y edad


estatura y peso
el ingreso familiar y los gastos mdicos

La naturaleza y la intensidad de la relacin entre dos


variables como las mencionadas son examinadas
por medio del anlisis de CORRELACIN y
REGRESIN.

Correlacin Lineal Simple


Tiene por objetivo medir y evaluar el grado de asociacin lineal
entre dos variables (intensidad de la relacin). Una manera de
visualizar la (posible) correlacin entre dos variables X e Y, es
a travs de un diagrama de dispersin.

Medida de Correlacin Lineal Simple


Se realiza a travs del Coeficiente de Correlacin
Lineal de Pearson (r).
Puede tomar cualquier valor entre -1 y 1
r=1
r = -1
r = 0

Indica correlacin lineal directa perfecta


Indica correlacin lineal inversa perfecta
Indica que las dos variables no estn
asociadas

r = -1

r = -0.5

r=0

r = +0.5

r = +1

r = - 0.067

r = - 0.798

r = 0.955

Coeficiente de correlacin de Pearson

Prueba de hiptesis sobre el


coeficiente de correlacin de Pearson
Hiptesis nula:

Estadstico de prueba:

Regresin Lineal Simple


Estima la forma o naturaleza de la relacin entre dos
variables, siendo su objetivo final el PREDECIR o
ESTIMAR el valor de una variable que corresponde
al valor dado de otra variable.
La funcin entre las variables es una lnea recta
dada por la ecuacin:

Y = 0 + 1X +

El signo nos indica


que la relacin es
inversa

El signo nos indica


que la relacin es
directa

Coeficiente de Determinacin - r2
Mide la proporcin o porcentaje de la variacin total
de Y que es explicada por el modelo de regresin.

0 r2 1
Cuanto ms se aproxime a 1, mejor ser el ajuste
del modelo a los puntos del diagrama de dispersin.

Casos de Neumona = 43.1 + -1.35(Temperatura del


aire)

r = - 0.3 r2 = 0.09

No olvidar
Antes de realizar el anlisis de
regresin lineal, uno debe hacer el
grfico de dispersin para verificar que
la relacin entre las variables se
aproxima a una relacin lineal

IMPORTANTE: VERIFICACIN DE LA RELACIN LINEAL

y = 1.33x - 1.00
r = 0.82

IMPORTANTE: VERIFICACIN DE LA RELACIN LINEAL

y = 1.33x - 0.99
r = 0.82

IMPORTANTE: VERIFICACIN DE LA RELACIN LINEAL

y = 1.33x - 0.99
r = 0.82

IMPORTANTE: VERIFICACIN DE LA RELACIN LINEAL

y = 1.33x - 0.99
r = 0.82

Suposiciones de la Regresin Lineal

Los valores de la variable independiente X son fijos


(no aleatorios), medida si error.
La variable Y es aleatoria.
Para cada valor de X, existe una poblacin de
valores de Y con distribucin normal.
Las varianzas de las poblaciones Y son todas
iguales.
Todas las medias de las poblaciones de Y estn
sobre la recta.
Los valores de Y estn normalmente distribuidos y
son estadsticamente independientes.

Gracias por su atencin


cgutierrezv@epiredperu.net
www.epiredperu.net