Вы находитесь на странице: 1из 62

Anlisis de Correlacin Lineal

En el anlisis de correlacin, el objetivo principal es medir la fuerza o el grado de asociacin lineal estadsticamente
coeficiente de correlacin, mide esta fuerza de asociacin (lineal): por ejemplo, si se desea encontrar la correlacin (coeficien
del pulmn; entre las calificaciones en exmenes de estadstica y en exmenes de matemticas; entre las calificaciones de
sucesivamente. A continuacin se enumeran algunas de las correlaciones implementadas en el SPSS:

* Correlaciones bivariadas: Correlacin de Pearson.


* Correlaciones bivariadas: Correlacin de Spearman.
* Correlaciones bivariadas: Correlaciones Parciales.
* Pruebas de hiptesis del coeficiente de correlacin.
2) Investigaremos
la correlacin por
* Algunas consideraciones importantes:
medio del
diagrama de
1)
Antes de(una
calcular un coeficiente de correlacin, inspeccione los datos para detectar valores atpicos (que pueden gene
dispersin
de una relacin
lineal.
grfica)
y el
coeficiente de
correlacin lineal
(una
de variables cuantitativas simtricas para el coeficiente de correlacin de Pearson y variables cuantitativas o vari
3) Semedida
utilizaran
la
direccin
y
el
rho de Spearman.
poder de la
asociacin
lineal de correlacin pueden estar entre -1 (una relacin negativa perfecta) y +1 (una relacin positiva perfecta
4) Los coeficientes
entre
doslineal. Al interpretar los resultados, se debe evitar extraer conclusiones de causa-efecto a partir de una correlacin sign
relacin
variables).
5) Es simtrico por naturaleza; es decir, el coeficiente de correlacin entre X y Y (rxy) es el mismo que entre Y y X (
6) Es una medida de asociacin lineal o dependencia lineal solamente; su uso en la descripcin de relaciones no lineales no

7) Prueba de significacin. Se pueden seleccionar las probabilidades bilaterales o las unilaterales. Si conoce de antemano l
Unilateral. Si no es as, seleccione Bilateral.

8) Sealar las correlaciones significativas. Los coeficientes de correlacin significativos al nivel 0,05 se identifican p
significativos al nivel 0,01 se identifican con dos asteriscos.

Patrones de Correlacin (adaptado de Henri Theil, Introduction to Econometrics, Prentice-Hall, Englewood Cliffs,

* Las grficas en la figura a, b y c describen un patrn de valores crecientes de y, que corresponde a valores crecientes
patrn de puntos se aproxima a una lnea recta, lo que sugiere que la relacin entre x y y se hace ms fuerte.

* Los diagramas de dispersin en d, e y f describen patrones en los que los valores de y disminuyen mientras los de x aume
(d) a (f), la relacin se hace ms fuerte.

* En contraste con las primeras seis grficas, el diagrama de dispersin de (g) no presenta ningn patrn y sugiere que no h
x y y. Finalmente, el diagrama de dispersin de (h) indica un patrn, pero no de tipo lineal.
Rango Correlacin
r=1
0,8 < r < 1
0,6 < r < 0,8
0,4 < r < 0,6
0,2 < r < 0,4

Significado
Correlacin Perfecta
Correlacin muy Alta
Correlacin Alta
Correlacin Moderada
Correlacin Baja

0 < r < 0,2


r=0

Correlacin muy Baja


Correlacin Nula

in lineal estadsticamente significativa entre dos variables. El


trar la correlacin (coeficiente) entre el hbito de fumar y el cncer
; entre las calificaciones de bachillerato y de la universidad, y as
SS:

atpicos (que pueden generar resultados equvocos) y evidencias

ariables cuantitativas o variables con categoras ordenadas para la

na relacin positiva perfecta). Un valor 0 indica que no existe una


partir de una correlacin significativa.

que entre Y y X (ryx).


relaciones no lineales no tiene significado.

s. Si conoce de antemano la direccin de la asociacin, seleccione

nivel 0,05 se identifican por medio de un solo asterisco y los

tice-Hall, Englewood Cliffs, Nueva Jersey, 1978, p. 86).

onde a valores crecientes de x. Conforme vamos de (a) a (c), el


ms fuerte.

en mientras los de x aumentan. Nuevamente, conforme vamos de

patrn y sugiere que no hay correlacin alguna (o relacin) entre

Correlaciones bivariadas: Correlacin de Pearson.

El coeficiente de correlacin de Pearson es una medida de asociacin lineal. Dos variables pueden estar perfectamente
lineal, el coeficiente de correlacin de Pearson no ser un estadstico adecuado para medir su asociacin. El coeficiente d
como coeficiente de correlacin producto momento de Pearson, en honor de Karl Pearson (1857-1936), quien lo desarroll orig
Supuestos:
1) La muestra de datos apareados (x,y) es una muestra aleatoria de datos cuantitativos.
2) Los pares de datos (x,y) tienen una distribucin normal bivariada.
Para obtener correlaciones bivariadas:
1. Seleccione en los mens: Analizar >> Correlaciones >> Bivariadas
2. Seleccione dos o ms variables numricas.

* Coeficientes de correlacin: Para las variables cuantitativas, normalmente distribuidas, seleccione el coeficiente de correlac

* Prueba de significacin: Se pueden seleccionar las probabilidades bilaterales o las unilaterales. Si conoce de antemano la
Unilateral. Si no es as, seleccione Bilateral.

* Sealar las correlaciones significativas: Los coeficientes de correlacin significativos al nivel 0,05 se identifican p
significativos al nivel 0,01 se identifican con dos asteriscos.
Ejemplo de Aplicacin 1

Objetivo: Determinar si hay una correlacin entre la variable x (nmero de barcos que se registran) y la variable y (nmero de
HIPTESIS DE DOS COLAS:
H0: No existe correlacin entre las variables. ( rxy = 0 )
H1: Existe correlacin entre las variables, ya sea positiva o negativa. [ rxy 0 ( rxy < 0 rxy > 0 ) ]
Exploracin de los datos

* Antes de trabajar con los mtodos ms formales de clculo de esta correlacin, primero debemos explorar el conjunto de d
Con frecuencia encontraremos una relacin entre dos variables al construir una grfica que se denomina diagrama de disper

* Cuando examinamos un diagrama de dispersin como se, es necesario estudiar el patrn general de los puntos gra
sealar su direccin. Es decir, mientras una variable se incrementa, la otra parece aumentar o disminuir? Tenemos que ob
puntos que se ubican muy lejos de todos los dems.

* El diagrama de dispersin que se genera en Excel parece revelar un patrn que indique que un mayor nmero de barcos qu
cantidad de muertes de manates debidas a los barcos.

* En este caso la correlacin es de 0,922. Por lo tanto, concluimos que existe una correlacin lineal significativa muy
registran y la cantidad de muertes de manates a consecuencia de los barcos.

e Pearson.

ueden estar perfectamente relacionadas, pero si la relacin no es


asociacin. El coeficiente de correlacin lineal tambin se conoce
936), quien lo desarroll originalmente.

ne el coeficiente de correlacin de Pearson.

. Si conoce de antemano la direccin de la asociacin, seleccione

nivel 0,05 se identifican por medio de un solo asterisco y los

) y la variable y (nmero de manates que asesinan los barcos).

os explorar el conjunto de datos para ver qu es posible aprender.


omina diagrama de dispersin.

general de los puntos graficados. Si existe un patrn, debemos


disminuir? Tenemos que observar si hay datos distantes, que son

mayor nmero de barcos que se registran se asocie con una mayor

n lineal significativa muy alta entre el nmero de barcos que se

Correlaciones bivariadas: Correlacin de Spearman.

El coeficiente de correlacin rho de Spearman (1904) es el coeficiente de correlacin de Pearson, pero aplicado despus de
en rangos. Toma valores entre -1 y +1, y se interpreta exactamente igual que el coeficiente de correlacin de Pearson.
alternativa al de Pearson cuando las variables estudiadas son ordinales y/o se incumple el supuesto de normalidad.
Supuestos:
1) La muestra de datos apareados (x,y) es una muestra de variables no mtricas (ordinales).

2) En ausencia de empates, la s de Spearman produce una aproximacin ms cercana al coeficiente de correlacin producto
Para obtener correlaciones bivariadas:

1. Seleccione en los mens: Analizar >> Correlaciones >> Bivariadas


2. Seleccione dos o ms variables ordinales.
* Coeficientes de correlacin: Para las variables ordinales, seleccione el coeficiente de correlacin de Spearman
* Prueba de significacin: Se pueden seleccionar las probabilidades bilaterales o las unilaterales. Si conoce de antemano la
Unilateral. Si no es as, seleccione Bilateral.
* Sealar las correlaciones significativas: Los coeficientes de correlacin significativos al nivel 0,05 se identifican p
significativos al nivel 0,01 se identifican con dos asteriscos.
Ejemplo de Aplicacin 2
Objetivo: Determinar si hay una correlacin entre la preferencia por comprar y la calidad de la mercanca.
HIPTESIS DE DOS COLAS:
H0: No existe correlacin entre las variables. ( s = 0 )
H1: Existe correlacin entre las variables, ya sea positiva o negativa. [ s 0 ( s < 0 s > 0 ) ]

Se calificaron 14 tiendas importantes en una gran zona metropolitana en trminos de la preferencia por comprar y la calidad d
se obtuvieron en una escala de 11 puntos, donde los nmeros ms altos indican calificaciones ms positivas.

En el cuadro de dilogo Correlaciones bivariadas, seleccionar las variables preferencia (preferencia por comprar) y calidad (
la lista Variables.
Seleccionar las correlaciones significativas.
Aceptando estas elecciones, el Visor ofrece los resultados que se muestran a continuacin:

* En este caso la correlacin es de 0,945. Por lo tanto, concluimos que existe una correlacin lineal significativa muy alt
calidad de la mercanca.

Spearman.

pero aplicado despus de transformar las puntuaciones originales


e correlacin de Pearson. Spearman puede utilizarse como una
o de normalidad.

nte de correlacin producto-momento de Pearson.

n de Spearman.
. Si conoce de antemano la direccin de la asociacin, seleccione

nivel 0,05 se identifican por medio de un solo asterisco y los

canca.

a por comprar y la calidad de la mercanca. Todas las calificaciones


positivas.

cia por comprar) y calidad (caliad de la mercanca) y trasladarlas a

neal significativa muy alta entre la preferencia por comprar y la

Correlaciones bivariadas: Correlaciones Parciales.

El procedimiento Correlaciones parciales calcula los coeficientes de correlacin parcial, los cuales describen la relacin linea
se controlan los efectos de una o ms variables adicionales. Las correlaciones son medidas de asociacin lineal. Dos
relacionadas, pero si la relacin no es lineal, el coeficiente de correlacin no es un estadstico adecuado para medir su asociac
Hablamos de correlacin de primer orden para indicar que se est controlando el efecto de una variable; de segundo orden,
efecto de dos variables; etc. Lgicamente, cuando no se est controlando ninguna variable, es decir, cuando utilizamos el
hablamos de correlacin de orden cero. Por orden se quiere decir el nmero de subndices secundarios.
Podemos decir en realidad que r12 mide el verdadero grado de asociacin (lineal) entre Y y X2 cuando existe una tercera
ellas?
r12.3 = coeficiente de correlacin parcial entre Y y X2, manteniendo X3 constante.
r13.2 = coeficiente de correlacin parcial entre Y y X3, manteniendo X2 constante.
r23.1 = coeficiente de correlacin parcial entre X2 y X3, manteniendo Y constante.
r12.34 = coeficiente de correlacin entre Y y X2, manteniendo constantes X3 y X4.
r12.345 = coeficiente de correlacin entre Y y X2, manteniendo constantes X3, X4 y X5.
Para obtener correlaciones parciales:

1. Seleccione en los mens: Analizar >> Correlaciones >> Parcial


2. Seleccione dos o ms variables numricas para las que se van a calcular las correlaciones parciales.
3. Elija una o ms variables numricas de control.
* Prueba de significacin: Se pueden seleccionar las probabilidades bilaterales o las unilaterales. Si conoce de antemano la
Unilateral. Si no es as, seleccione Bilateral.

* Mostrar el nivel de significacin real: De forma predeterminada, se muestran la probabilidad y los grados de libertad p
anula la seleccin de este elemento, los coeficientes significativos al nivel 0,05 se identifican con un asterisco, los coe
identifican con un asterisco doble y se eliminan los grados de libertad. Este ajuste afecta a las matrices de correlacin parc
Ejemplo de Aplicacin 3
Objetivo: Estudiar la relacin entre dos variables cuando se controla el efecto de terceras variables.
HIPTESIS DE DOS COLAS:
H0: No existe correlacin entre Y y X2, manteniendo constantes X3, X4 y X5. ( r12.345 = 0 )
H1: Existe correlacin entre Y y X2, manteniendo constantes X3, X4 y X5. [ r12.345 0 ( r12.345 < 0 r12.345 > 0 ) ]

En el cuadro de dilogo Correlaciones parciales, seleccionar las variables salini (salario inicial) y salario (salario actual) y tras

Seleccionar las variables educ (nivel educativo), tiempemp (meses desde el contrato) y expprev (experiencia previa) y traslad

Pulsar el botn Opciones... para acceder al cuadro de dilogo Correlaciones parciales: Opciones y, en el recuadro Estad
desviaciones tpicas y Correlaciones de orden cero.
Aceptando estas elecciones, el Visor ofrece los resultados que se muestran a continuacin:

El primer bloque de informacin ofrece una serie de descriptivos: la media aritmtica, la desviacin tpica insesgada y el n
cada variable individualmente considerada).

A continuacin aparece una matriz con los coeficientes de correlacin de orden cero (sin parcializar efectos) entre todas las

La matriz muestra, para cada par de variables, el coeficiente de correlacin de Pearson, los grados de libertad asociados a
casos vlidos menos dos), y el nivel crtico bilateral (el unilateral se obtiene dividiendo el bilateral por dos). La informacin de
lado, informa sobre el grado de relacin existente entre las dos variables que interesa estudiar (en nuestro ejemplo, salini y sa
variables cuyo efecto se desea controlar (educ, tiempemp y expprev) estn o no relacionas con las dos variables que interesa

As, podemos ver que el coeficiente de correlacin entre salini y salario vale 0,903; con un nivel crtico p = 0,000 que nos
significativamente distinto de cero. Tambin podemos ver que, de las tres variables control utilizadas, educ correlaciona s
0,000) como con salario (p = 0,000), tiempemp no correlaciona ni con salini (p = 0,514) ni con salario (p = 0,722), y expprev
= 0,658) ni con salini (p = 0,358).
El ltimo bloque de informacin ofrece el coeficiente de correlacin parcial entre salini y salario:

El coeficiente de correlacin parcial entre las variables salini y salario (es decir, el coeficiente de correlacin obtenido tras e
las variables educ, tiempemp y expprev) vale 0,769; con un nivel crtico p = 0,000 que nos permite afirmar que es significat
el coeficiente de correlacin parcial permanece significativo y su diferencia con el coeficiente de orden cero es ms bien e
podemos afirmar: 1) que entre las variables salini y salario existe relacin lineal significativa, y 2) que tal relacin se ve sus
efecto de las variables educ, tiempemp y expprev.

Parciales.

describen la relacin lineal existente entre dos variables mientras


de asociacin lineal. Dos variables pueden estar perfectamente
uado para medir su asociacin.

ariable; de segundo orden, para indicar que se est controlando el


decir, cuando utilizamos el coeficiente de correlacin de Pearson,
ndarios.
cuando existe una tercera variable X3 que puede estar asociada a

ales.

. Si conoce de antemano la direccin de la asociacin, seleccione

y los grados de libertad para cada coeficiente de correlacin. Si


con un asterisco, los coeficientes significativos al nivel 0,01 se
matrices de correlacin parcial y de orden cero.

s.

0 r12.345 > 0 ) ]

alario (salario actual) y trasladarlas a la lista Variables.

experiencia previa) y trasladarlas a la lista Controlando para.

s y, en el recuadro Estadsticos, marcar las opciones Medias y

cin tpica insesgada y el nmero de casos vlidos (todo ello, para

izar efectos) entre todas las variables seleccionadas:

dos de libertad asociados al estadstico de contraste T (nmero de


or dos). La informacin de esta matriz es doblemente til: por un
nuestro ejemplo, salini y salario); por otro, permite averiguar si las
dos variables que interesa correlacionar (salini y salario).

el crtico p = 0,000 que nos permite afirmar que el coeficiente es


zadas, educ correlaciona significativamente tanto con salini (p =
ario (p = 0,722), y expprev tambien no correlaciona con salario (p

correlacin obtenido tras eliminar de ambas variables el efecto de


e afirmar que es significativamente distinto de cero. Puesto que
orden cero es ms bien evidente (ha bajado de 0,903 a 0,769),
) que tal relacin se ve sustancialmente alterada tras controlar el

Pruebas de hiptesis del Coeficiente de Correlacin


Presentamos la prueba formal de hiptesis a fin de determinar si existe una correlacin lineal significativa entre dos variables.
A) Pruebas de una cola
En estos casos, las hiptesis sern como las que se muestran a continuacin:

P-valor: Utilice coeficiente del Sig. (unilateral) que se muestra en la tabla del visor de resultados del SPSS.
Conclusin:

* Si el p-valor (Sig.) es menor que 0,05; enontonces rechace la H0 y concluya que existe una correlacin positiva/negativa li

* Si el p-valor (Sig.) es mayor que 0,05; enontonces no rechace la H0 y concluya que no existe una correlacin positiva/neg
B) Pruebas de 2 colas:
En estos caso, la hiptesis ser como se muestran a continuacin.

P-valor: Utilice coeficiente del Sig. (bilateral) que se muestra en la tabla del visor de resultados del SPSS.
Conclusin:
* Si el p-valor (Sig.) es menor que 0,05; enontonces rechace la H0 y concluya que existe una correlacin lineal.
* Si el p-valor (Sig.) es mayor que 0,05; enontonces no rechace la H0 y concluya que no existe una correlacin

Correlacin

cativa entre dos variables.

del SPSS.

lacin positiva/negativa lineal.

a correlacin positiva/negativa lineal.

l SPSS.

lacin lineal.
a correlacin lineal.