Академический Документы
Профессиональный Документы
Культура Документы
lineal
Lourdes Ramos, TM, MSc(c)
Facultad de Medicina Alberto Hurtado
Escuela de Tecnología Médica
Material adaptado de la presentación de Steev Loyola
Contenido de la clase
• Propósitos
• ¿Qué es la regresión lineal?
• Supuestos para la regresión lineal
• Ejemplo práctico
– Trabajo con Stata
– Notación
– Interpretación
¿Qué es un análisis de regresión? (1)
X Y
• Cuando Y es una variable continua, usamos la
regresión lineal
¿Qué es un análisis de regresión? (2)
• Notación:
β0
X
Origen en Y Predictor
(intercepto)
• L = relación lineal
– E(Y|X) es una función lineal de X
• I = observaciones independientes
– (X,Y) en sujetos distintos son independientes
Relación lineal
Este es el tipo de relaciones que se modelan con la RL
Se muestra una relación de aumento o descenso
– En stata:
• regress y x
• predict e, rstu
• sum e, detail / hist e, normal / qnorm e
L = relación lineal (3)
Notas:
2. La recta de regresión no
representa la distribución
como si lo hace la
regresión no paramétrica
• La relación entre
consumo y pr.tbc no es
lineal
• En este curso no
haremos regresión no
paramétrica
N = distribución normal de los
residuos
• Los residuos son usados para examinar normalidad
• Además:
– Evaluar de forma gráfica la homocedasticidad
– Identifica posibles curvaturas
• En Stata:
– quietly regress y x
– predict e, rstudent
– predict yhat
– scatter e yhat
E = igual (equal) de varianza
• En Stata:
Hace el análisis de regresión
regress y x
Luego, correr lo siguiente como comando pos-
estimación
• hettest
• szroeter x
Coeficiente de correlación lineal (CCL)
.05
.04
.015
.03
Density
Density
.01
.02
.005
.01
0
0
0 50 100 150 60 70 80 90 100 110
tejido adiposo circunferencia de la cintura (cm)
Shapiro-Wilk W test for normal data Shapiro-Wilk W test for normal data
tadiposo 50 0.92308 3.617 2.742 0.00305 cintura 50 0.95581 2.078 1.560 0.05936
. tabstat tadiposo, s(mean p50 kur sk) . tabstat cintura, s(mean p50 kur sk)
variable mean p50 kurtosis skewness variable mean p50 kurtosis skewness
tadiposo 62.5566 53.18 2.459683 .6942873 cintura 82.15 80.7 3.471724 .7506796
60 70 80 90 100 110
circunferencia de la cintura (cm)
tadiposo 1.0000
60 70 80 90 100 110
circunferencia de la cintura (cm)
60 70 80 90 100 110
circunferencia de la cintura (cm)
4
predict yhat
scatter e yhat
Studentized residuals
2
0
-2
0 50 100 150
Fitted values
Preguntas:
- ¿Parece que hay distribución aleatoria y no hay patrones?: Sí
Nota: Aquí también se puede evaluar homocedasticidad, con línea imaginaria
Paso 3: Distribución normal de los residuos
qnorm e hist e, normal
4
.5
.4
2
.3
Density
.2
0
.1
-2
0
-2 -1 0 1 2 -2 0 2 4
Inverse Normal Studentized residuals
. swilk e
. hettest
.
end of do-file
Si no hay homocedasticidad,
. do "C:\Users\steev\AppData\Local\Temp\STD00000000.tmp" usar vce(robust)
. szroeter cint
Resolviendo la formula:
tadiposo = -190.9816 + 3.086284(cintura)
tadiposo = -190.9816 + 3.086284(78.3)
tadiposo = 50.6744372
Recordar que:
La regresión siempre debe ser evaluada:
Ho: β1 = 0
Si no rechazo la Ho, este valor no tiene utilidad debido a
que X e Y no tienen una relación lineal
250
200
150
100
50
30 35 40 45 50
Latitud
30 35 40 45 50
Latitud
3
predict yhat
scatter e yhat
2
Studentized residuals
1
0
-1
-2
Preguntas:
- ¿Parece que hay distribución aleatoria y no hay patrones?: Sí
Nota: Aquí también se puede evaluar homocedasticidad, con línea imaginaria
Paso 3: Distribución normal de los residuos
qnorm e
3 hist e, normal
.4
2
.3
1
Density
.2
0
-1
.1
-2
0
-2 -1 0 1 2 -2 -1 0 1 2 3
Inverse Normal Studentized residuals
Preguntas: ¿Hay
homocedasticidad?
¿Ho? ¿Conclusión?
Preguntas: ¿Hay
homocedasticidad?
¿Ho? ¿Conclusión?
Paso 4: Realizando la regresión (1)
regress y x
Paso 4: Realizando la regresión (2)
regress tmortalidad latitud
Test de Wald
Usa la una
prueba T de
student
Ho: Coef. = 0