You are on page 1of 3

Para otros usos de este trmino, vase Correlacin (desambiguacin).

En probabilidad y estadstica, la correlacin indica la fuerza y la direccin de


una relacin lineal y proporcionalidad entre dos variables estadsticas. Se considera
que dos variables cuantitativas estn correlacionadas cuando los valores de una de
ellas varan sistemticamente con respecto a los valores homnimos de la otra: si
tenemos dos variables (A y B) existe correlacin si al aumentar los valores de A lo
hacen tambin los de B y viceversa. La correlacin entre dos variables no implica, por
s misma, ninguna relacin de causalidad (Vase cum hoc ergo propter hoc).
ndice
[ocultar]

1Fuerza, sentido y forma de la correlacin

2Coeficientes de correlacin
o

2.1Interpretacin geomtrica

2.2Distribucin del coeficiente de correlacin

3Referencias

4Enlaces externos

Fuerza, sentido y forma de la correlacin[editar]


La relacin entre dos variables cuantitativas queda representada mediante la lnea de
mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes
elementales de una lnea de ajuste y, por lo tanto, de una correlacin, son la fuerza, el
sentido y la forma:

La fuerza extrema segn el caso, mide el grado en que la lnea representa a la


nube de puntos: si la nube es estrecha y alargada, se representa por una lnea
recta, lo que indica que la relacin es fuerte; si la nube de puntos tiene una
tendencia elptica o circular, la relacin es dbil.

El sentido mide la variacin de los valores de B con respecto a A: si al crecer


los valores de A lo hacen los de B, la relacin es directa (pendiente positiva); si al
crecer los valores de A disminuyen los de B, la relacin es inversa (pendiente
negativa).

La forma establece el tipo de lnea que define el mejor ajuste: la lnea recta,
la curva monotnica o la curva no monotnica

Coeficientes de correlacin[editar]
Existen diversos coeficientes que miden el grado de correlacin, adaptados a la
naturaleza de los datos. El ms conocido es el coeficiente de correlacin de
Pearson (introducido en realidad por Francis Galton), que se obtiene dividiendo
la covarianza de dos variables entre el producto de sus desviaciones estndar. Otros
coeficientes son:

Coeficiente de correlacin de Spearman

Correlacin cannica

Coeficiente de Correlacin Intraclase

Correlacin de Kendall

Correlacin de Jaspen

Interpretacin geomtrica[editar]
Dados los valores muestrales de dos variables aleatorias e , que pueden ser
consideradas como vectores en un espacio a n dimensiones, pueden construirse los
"vectores centrados" como:
e.
El coseno del ngulo alfa entre estos vectores es dada por la frmula siguiente:
Pues es el coeficiente de correlacin muestral de Pearson. El coeficiente de
correlacin es el coseno entre ambos vectores centrados:

Si r = 1, el ngulo , ambos vectores son colineales (paralelos).

Si r = 0, el ngulo , ambos vectores son ortogonales.

Si r =-1, el ngulo , ambos vectores son colineales de direccin opuesto.

Ms generalmente: .
Por supuesto, desde el punto vista geomtrico, no hablamos de correlacin lineal: el
coeficiente de correlacin tiene siempre un sentido, cualquiera sea su valor entre -1 y
1. Nos informa de modo preciso, no tanto sobre el grado de dependencia entre las
variables, sino sobre su distancia angular en la hiperesfera a n dimensiones.
La Iconografa de las correlaciones es un mtodo de anlisis multidimensional que
reposa en esta idea. La correlacin lineal se da cuando en una nube de puntos se
encuentran o se distribuyen alrededor de una recta.
La frmula de correlacin para dos series distintas con cierto desfase "k", est dada
por la frmula:

Distribucin del coeficiente de correlacin[editar]


El coeficiente de correlacin muestral de una muestra es de hecho una varible
aleatoria, eso significa que si repetimos un experimento o consideramos diferentes
muestras se obtendrn valores diferentes y por tanto el coeficiente de correlacin
muestral calculado a partir de ellas tendr valores ligeramente diferentes. Para
muestras grandes la variacin en dicho coeficiente ser menor que para muestras
pequeas. R. A. Fisher fue el primero en determinar la distribucin de probabilidad
para el coeficiente de correlacin.
Si las dos variables aleatorias que trata de relacionarse proceden de una distribucin
gaussiana bivariante entonces el coeficiente de correlacin r sigue una distribucin de
probabilidad dada por:1 2
donde:
es la distribucin gamma

es la funcin gaussiana hipergeomtrica.


Ntese que el valor esperado del coeficiente de correlacin muestral r es:
por tanto, r es estimador sesgado de . Puede obtenerse un estimador
aproximado no sesgado resolviendo la ecuacin:
para
Aunque, la solucin:
es subptima. Se puede obtener un estimador sesgado con mnima varianza
para grandes valores de n, con sesgo de orden buscando el mximo de la
expresin:
, i.e.
En el caso especial de que , la distribucin original puede ser reescrita como: