Академический Документы
Профессиональный Документы
Культура Документы
Lorena Kikut
Asociación entre variables
variables
teorías.
Ejemplos
¿Está el abstencionismo electoral relacionado con el nivel
de escolaridad?
Tipo de relación: La
dirección de esa relación
(en nominales no)
Medidas de Asociación
Existen muchos coeficientes y maneras de medir asociación, pero en el curso solamente
veremos tres coeficientes:
Dos variables
Coeficiente
nominales Q
dicotómicas
Coeficiente
Dos variables
r de
ordinales Spearman
Las variables dicotómicas son las que tienen únicamente dos alternativas de respuesta.
Valor del coeficiente de asociación y su
interpretación
El valor absoluto de los coeficientes varía entre 0 y 1.
Una guía para interpretar la fuerza de la asociación es la
siguiente:
Valor Asociación
0 No hay
Más de 0 a 0,20 Muy baja
Más de 0,20 a 0,40 Baja
Más de 0,40 a 0,70 Moderada
Más de 0,70 a 0,90 Alta
Más de 0,90 a menos de 1 Muy alta
1 Perfecta
Valor absoluto del coeficiente
Muy
Muy baja Baja Moderada Alta
alta
No hay Perfecta
Coeficiente Q: para dos variables
dicotómicas
Variable X
X1 X2
Para una
información Y1 a b
organizada de Variable Y
esta manera:
Y2 c d
Entonces: Coeficiente Q = bc – ad
bc + ad
Coeficiente Q
• Su valor puede variar entre 0 y 1
• En ocasiones puede dar negativo, pero el
signo para este coeficiente NO interesa, o sea:
se utiliza su valor absoluto.
• Mide solo magnitud, no mide dirección
Menor asociación Mayor asociación
0 1
Asociación Asociación
nula perfecta
Ejemplos
1. Una casa farmacéutica desarrolló una nueva vacuna contra la
gripe. Para probar su efectividad eligió una muestra de 80
personas y a 50 de ellas les aplicó la vacuna y a las restantes no
se la aplicó. De las personas a las que se no se les puso la vacuna
a 13 de ellas les dio gripe en el siguiente año, mientras que de
las que sí recibieron la vacuna 18 tuvieron gripe.
¿Qué se puede concluir con respecto a la asociación entre la
vacuna y contraer gripe?
Q = 0,152
Q = 0,451
Coeficiente r de Spearman: para dos
variables ordinales
• Las observaciones de cada variable se ordenan
y se les asignan rangos (números de 1 a n)
• Se obtiene la diferencia de los rangos
asignados a X y a Y (Di)
• El coeficiente r de Spearman se calcula así:
-1 Inversa 0 Directa
1
Más o menos
1 Bueno 3 Pésimo 7 3 16 0 16
alto
Más o menos
7 Muy Malo 6 Excelente 1 5 25 1 16
bajo
Total 96 46 62
(n – 1) SxSy
Donde: X = Promedio de la variable X
Y = Promedio de la variable Y
Sx = Desviación Estándar de la variable X
Sy = Desviación Estándar de la variable Y
Coeficiente r de Pearson
• Al igual que el r de Spearman, su valor puede
variar entre -1 y 1
• Mide relaciones lineales entre X y Y
• Mide magnitud y dirección
-1 Inversa 0 Directa
1
Y
12 8; 12
X Y
2 6 10 6; 10
7 7
1 4 8
8 12 4; 7 7; 7
5 5 6 2; 6
4 7 5; 5
6 10 4 1; 4
1 2
2 1; 2
0
0 1 2 3 4 5 6 7 8 9
X
Diagrama de Dispersión
• Nos indica el tipo de relación entre las variables
Tipo de Relación: Dirección
• Positiva: Ascendente
• Negativa: Descendente
• Nula
Magnitud: Fuerza
• Alta: Puntos cercanos
• Baja: Puntos separados
• Nula
Linealidad
• Lineal
• No lineal
Perfecta Alta Débil
r=1
Positiva
r = 0,8
Nula
r = -1
Negativa
r=0
r = -0,9
No lineal
No usar r
de Pearson
Ejemplo
Se tiene información de años de experiencia
laboral de trabajadores de una empresa y su
salario diario en dólares
Años Salario
2 15 Dibuje el diagrama de
3 60
4 77
dispersión correspondiente
4 40 a esas variables y calcule el
5 54
6 98
coeficiente de correlación
7 66 de Pearson.
Promedio 4,43 58,57
Desv. Est. 1,72 26,51
120
100
60
40
20
0
0 2 4 6 8
Años de experiencia laboral
X Y
(X-promX)(Y-
Años Salario X-promX Y-promY promY)
2 15 -2,43 -43,57 105,8751
3 60 -1,43 1,43 -2,0449
4 77 -0,43 18,43 -7,9249
4 40 -0,43 -18,57 7,9851
5 54 0,57 -4,57 -2,6049
6 98 1,57 39,43 61,9051
7 66 2,57 7,43 19,0951
Promedio 4,43 58,57
Desv. Est. 1,72 26,51 Total= 182,2857
182,2857
𝑟= = 0,666
6∗1,72∗26,51
Para este curso, en este semestre,
70 53; 68
85; 70
69; 66
60
II Parcial
50
40
30
20 57; 18 82; 19
80; 13
10
0
50 60 70 80 90 100
I Parcial
Y= a + bX
Interesa:
• Conocer la naturaleza de la relación de Y en función de X
• Predecir Y utilizando valores de X.
Regresión Lineal Simple
Y = Variable X = Variable
dependiente o independiente
explicada o explicativa
Y= a + bX
a = Intersección. Es el b = Pendiente. Se conoce
valor de Y cuando X=0. como coeficiente de
No siempre su regresión. Indica el cambio
interpretación es útil. promedio en Y por cada
unidad de cambio en X.
𝑏 = 𝑟𝑆𝑦 /𝑆𝑥 𝑎 = 𝑌 − 𝑏𝑋
Ejemplo
Se tiene información de años de experiencia
laboral de trabajadores de una empresa y su
salario diario en dólares
120
100
Años Salario Salario en dólares por día
80
2 15
60
3 60
40
4 77
20
4 40 0
5 54 0 2 4 6 8
Años de experiencia laboral
6 98
7 66 ¿Por dónde debe pasar la línea que permita predecir de la
mejor manera posible valores de Y con base en valores de X?
Teníamos que:
X=Experiencia • Promedio X = 4,43
Y=Salario • Promedio Y = 58,57
• Desv. Estándar X = 1,72
• Desv. Estándar Y= 26,51
• r = 0,666
𝑎 = 𝑌 − 𝑏𝑋 = 58,57-10,26*4,43 = 13,12
Entonces, la recta de regresión es:
Y= 13,12 + 10,26X
Y= 13,12 + 10,26X
100
80
Salario en dólares por día
60
40
20
0
0 1 2 3 4 5 6 7 8 9
Años de experiencia laboral
• ¿Cuál será en promedio el salario diario de
una persona que tenga 5 años de experiencia?
• ¿Y de alguien que tanga 9 años de
experiencia?
Interpolación o Extrapolación
Bondad de ajuste
Interpolación y Extrapolación
Interpolación: Se predice Y utilizando un valor
de X que se encuentra dentro del rango de las X
observadas.
R 2 = r2
Muy
Muy Mala Mala Moderada Buena buena
En el ejemplo:
1. Dibuje los diagramas de dispersión y dibuje en cada uno la respectiva recta de regresión.
2. Interprete los coeficientes de correlación. ¿Son significativamente diferentes de cero?
3. Interprete el coeficiente de regresión obtenido.
4. Interprete el coeficiente de determinación de ambas rectas.
5. Si un estudiante estudió 5 horas, ¿qué nota espera obtener? Si un estudiante jugó 26
horas en su celular, ¿qué nota espera obtener?
6. ¿Cuál de las dos estimaciones anteriores es mejor?
Nota obtenida en examen de matemática según horas
de estudio, 2016
120
100
80
Y=50,02 + 4,30X
Nota
60
R2 = 71,85%
40
20
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
Horas estudio
Nota obtenida en examen de matemática según horas
que jugó en el celular, 2016
100
90
80
70
60
Y=102,11 – 1,59X
Nota
50
R2 = 37,99% 40
30
20
10
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Horas celular