Академический Документы
Профессиональный Документы
Культура Документы
1. INTRODUCCIÓN
Coeficiente de determinación
Descomposición de la varianza del criterio
5. EJERCICIOS
__________________
Carmen Ximénez 1
Análisis de Datos I Esquema del Tema 7
1. INTRODUCCIÓN
OBJETIVO: Hacer predicciones o pronósticos en una variable (Y) a partir de otra (X):
Regresión de Y sobre X
Variable predictora: X (o variable independiente, VI) … La que se utiliza para hacer pronósticos
Variable criterio: Y (o variable dependiente, VD) … Sobre la que se pronostica
Para ello, se crea un modelo (la recta de regresión Y’ = A + B · X, donde A es el origen y B la
pendiente) que se aproxime o ajuste lo más posible a los datos observados en X y en Y.
N
X
N ⋅ ∑ X i ⋅ Yi - ∑ X ⋅ ∑Y B yx = rxy
Sy
- Pendiente: B = i i O También:
N ⋅ ∑ X i2 - (∑ X ) Sx
yx 2
i
- Origen: =
A yx Y - B yx ⋅ X
Carmen Ximénez 2
Análisis de Datos I Esquema del Tema 7
Modelo:
Yi = Y i’ + (Yi – Yi’)
Puntuación Puntuación Error en el
empírica pronosticada pronóstico
S y2 = S y2 ' + S y2−−
y ' + 2 ⋅ S y '( y y ')
Donde: S2y' =
∑ (Y '− Y ')
i
2
= 2
S y- y'
∑ (Yi - Yi' ) 2
= S2y⋅x
N
S y’(y-y’) = 0
Sustituyendo:
1) S=
2
y S y2 ' + S y2⋅ x
Donde: S2y (Varianza del criterio) se descompone en:
S2y' : Varianza de los pronósticos (varianza explicada por el modelo)
S2y⋅x : Error cuadrático medio (varianza no explicada por el modelo)
2) 1 = rxy2 + (1 − rxy2 )
S2y'
Donde: r 2
= ............. Proporción de varianza explicada por el modelo
S2y
S2y⋅ x
1 − r =2 ...... Proporción de varianza no explicada por el modelo
2
Sy
S2=
y' S2y ⋅ rxy2
Carmen Ximénez 3
Análisis de Datos I Esquema del Tema 7
Ejemplo 1
Un psicólogo escolar toma una muestra aleatoria de 7 alumnos de un colegio y les pasa una prueba de
Extroversión (X). A continuación, observa cuántos Mensajes SMS (Y) envía cada alumno durante el recreo:
7
6
Xi 4 5 4 3 1 6 1 5 Y’
Yi 5 6 3 3 2 5 1 4
( N ⋅= ∑ X i ⋅ Yi ) − ( ∑ X i ⋅ ∑ Yi )
Y
3
7(104) − (24)(25)
rxy = 0,88 2
2
N ⋅ ∑ X i − ( ∑ X i ) N ⋅ ∑ Yi − ( ∑ Yi )
2
2 2
( 7(104) −−
(24)2 )(
7(109) (25)2 ) 1
0
0 1 2 3 4 5 6 7
Carmen Ximénez 4
Análisis de Datos I Esquema del Tema 7
X e Y están linealmente relacionadas (de forma inversa)
X Y X2 Y2 X·Y 10
5 8 25 64 40 8
7 6 49 36 42
9 7 81 49 63 6
Y
13 5 169 25 65 4
6 9 36 81 54
2
Σ: 40 35 360 255 264
0
Media 8 7 0 2 4 6 8 10 12 14
Varianza 8 2
Desv. típ. 2,83 1,41 X
A=
yx Y - B yx ⋅= = 10, 2
X 7 - (-0, 40)(8)
Y’ Y - Y’ (Y - Y’)2 10
Directas: Yi’ = 10,2 – 0,40 · Xi 8,20 -0,20 0,04 8
Diferenciales yi’ = -0,40 · xi 7,40 -1,40 1,96
6
Típicas zyi’ = -0,80 · zxi 6,60 0,40 0,16
Y
5 0 0 4 Y’
7,80 1,20 1,44 2
Σ: 35 0 3,6
0
Media 7 0 0,72 0 2 4 6 8 10 12 14
Varianza 1,28 0,72
X
2. Valoración del modelo
2
Coeficiente de determinación: rxy = (-0,80)2 = 0,64 Proporción de varianza de Y que queda explicada por X
Descomposición de la varianza del criterio (Y): S= S y2 ' + S y2⋅ x
2
y
Carmen Ximénez 5
Análisis de Datos I Esquema del Tema 7
5. EJERCICIOS
EJERCICIO 1
Xi Yi
4 8 X: Horas de estudio
5 7 Y: Calificación obtenida
2 4
1. Obtenga la ecuación de regresión de Y sobre X (en directas, diferenciales y típicas)
2. ¿Le merece confianza el modelo? (represente gráficamente el ajuste de los puntos a la recta)
3. Descomponga la varianza del criterio
4. Si un sujeto estudia 3 horas, ¿Qué calificación le pronosticaríamos según el modelo?
5. Si un sujeto estudia 2 horas, ¿En cuánto nos equivocaríamos al predecir su calificación
con la ecuación del modelo?
EJERCICIO 2
X Y V
Tras medir en una muestra las variables X 0,85 0,62
X: Extroversión R= Y -0,93
Y: Impulsividad V
V: Control Medias: 15 21 12
Se obtuvieron los estadísticos: Varianzas: 9 14 4
Se desea predecir la impulsividad (Y) a partir de alguna de las restantes variables
1. Obtenga la ecuación de regresión
2. Descomponga la varianza del criterio y valore el modelo anterior
3. Si un sujeto obtuviera una diferencial de 3 en la predictora, ¿Qué puntuación directa le
pronosticaría en impulsividad?
4. ¿Qué valor tiene en la predictora un sujeto al que le pronosticamos 18 puntos con el
modelo?
EJERCICIO 3
Se ha trazado la siguiente recta de regresión de Y sobre X en una muestra de varones
(representados por el signo •) y mujeres (representadas por el signo +):
Según esta gráfica responda a lo siguiente:
1. ¿De cuántos varones se compone la
muestra? ¿y mujeres?
2. ¿Qué grupo es más homogéneo: varones
o mujeres?
3. ¿Cuántos varones reciben en este modelo
pronósticos inferiores a sus puntuaciones
empíricas en Y?
4. ¿Cuántas mujeres reciben pronósticos
superiores a sus puntaciones empíricas?
5. ¿Qué pronóstico en Y tendría un sujeto
con X = 0?
Carmen Ximénez 6