Вы находитесь на странице: 1из 3

Supuestos regresión

Para comprobar las condiciones teóricas del modelo de regresión se


realiza un estudio de los residuos, es decir, de los valores ui. Con herramientas
gráficas o de Inferencia Estadística (contrastes), hay que verificar que los
residuos:
- provienen de una población normal,
- que la esperanza (media) es 0,
- que cumplen la hipótesis de homocedasticidad y
- que son independientes.

Tras analizar los residuos se puede concluir:

1. Los supuestos anteriores parecen ser incumplidos.


2. Los supuestos parecen no ser incumplidos, lo que significa que en
base a los datos disponibles no hay razón para decir que los
supuestos no se cumplen.

Veamos brevemente a continuación como se pueden comprobar las


condiciones anteriores.

Normalidad

Los residuos son variables aleatorias con media cero y desviación típica
se. i. Por tanto, un residuo estandarizado para la observación i es

y i  yˆ i
S ei
Con el objetivo de verificar que los residuos estandarizados se
distribuyen con media cero y desviación típica 1 se puede obtener el gráfico de
probabilidad normal mediante el uso de software estadístico (Statgraphics,
SPSS, R). Se podrá verificar si los residuos se distribuyen normalmente y
adicionalmente detectar la presencia de observaciones inusuales que podrían
1
requerir especial atención en el análisis. Otra alternativa consiste en plantear la
hipótesis:

H0: Los residuos se distribuyen normalmente


H1: Los residuos no se distribuyen normalmente

Para comprobar la anterior hipótesis los programas estadísticos permiten


realizar los test de Shapiro Wilks, 2 de bondad de ajuste o Kolmogorov
Smirnov.

Homocedasticidad

Para validar el supuesto de que los residuos tienen varianza constante


(homocedasticidad) la técnica más usual es el gráfico de los residuos versus
predichos, es decir, un diagrama de dispersión de los residuos y las respuestas
estimadas con el modelo ŷi . Este gráfico permite detectar una de las formas

más frecuentes de heterogeneidad de varianzas que consiste en que a valores


esperados grandes se corresponden varianzas grandes. En el caso de
observar algún patrón de comportamiento indicará que no se cumple el
supuesto. Observar las dos figuras siguientes.

La primera figura muestra un ejemplo de homocedasticidad. Se observa


que la nube de puntos se distribuye a lo largo de una banda. La variabilidad de
los residuales aparece constante. La segunda figura presenta un ejemplo de

2
heterocedasticidad. En este caso, para valores mayores de las predicciones,
los residuos presentan una mayor variabilidad.

Falta de independencia

Este es el supuesto más difícil de validar ya que la falta de


independencia puede ocurrir de muchas formas. Por lo tanto verificar que una
forma particular de falta de independencia no está ocurriendo, no significa que
hayamos validado el supuesto de independencia. Si los datos provienen de un
diseño experimental, la suposición de independencia pude ser usualmente
sustentada pero si lo datos provienen de estudios observacionales esta
suposición debe probarse. Cuando los datos tienen un ordenamiento temporal
o un ordenamiento que se corresponde con una covariable del modelo o una
variable externa al mismo, los gráficos de Residuos versus criterio de
ordenación son muy útiles.

Вам также может понравиться