Вы находитесь на странице: 1из 7

ESTADSTICA PARA LA INVESTIGACIN

GUA PARA EL PROCESAMIENTO DE DATOS



1. Anlisis de Correlacin ( Coeficiente de Correlacin Lineal de Pearson r )
El coeficiente de correlacin de Pearson, pensado para variables cuantitativas, es un ndice que
mide el grado de relacin lineal (variacin de una variable respecto a la otra) entre distintas variables.
Advirtase que decimos "variables relacionadas linealmente". Esto significa que puede haber
variables fuertemente relacionadas, pero no de forma lineal, en cuyo caso no proceder a aplicarse la
correlacin de Pearson.
Por ejemplo, la relacin entre la ansiedad y el rendimiento tiene forma de U invertida; igualmente, si
relacionamos poblacin y tiempo la relacin ser de forma exponencial. En estos casos (y en otros
muchos) no es conveniente utilizar la correlacin de Pearson. Insistimos en este punto, que parece
olvidarse con cierta frecuencia.
Sus valores absolutos oscilan entre 0 y 1. Esto es, si tenemos dos variables X e Y, y definimos el
coeficiente de correlacin de Pearson entre estas dos variables como r
xy
entonces:



Cuanto ms se acerca a 1, la correlacin es mayor. Caso contrario la correlacin es menor.
El grado de correlacin se mide empleando el coeficiente de correlacin de Pearson, que se
estima mediante:

()()

()

()


Donde, x e yson las variables en estudio y n es el tamao de la muestra.

Tipo de relacin:




ESTADSTICA PARA LA INVESTIGACIN



Ejemplo.
En el estudio Concordancia entre la inteligencia (X) y el rendimiento acadmico (Y) en alumnos del
nivel universitario de una universidad local se hace uso del coeficiente de correlacin de Pearson.
Sean las puntuaciones:
X 105 116 103 124 137 126 112 129 118 105
Y 8 16 4 14 18 18 6 20 14 12

Antes de calcular el coeficiente de correlacin de Pearson hemos de comprobar si existe una
tendencia lineal en la relacin.

Se observa la existencia de una cierta tendencia lineal en la relacin. Podemos, en consecuencia,
proceder a calcular el coeficiente de correlacin de Pearson.

X Y X
2
Y
2
XY
105 8 11025 64 840
116 16 13456 256 1856
103 4 10609 16 412
124 14 15376 196 1736
137 18 18769 324 2466
126 18 15876 324 2268
112 6 12544 36 672
129 20 16641 400 2580
118 14 13924 196 1652
105 12 11025 144 1260
1175 130 139245 1956 15742

ESTADSTICA PARA LA INVESTIGACIN


0
Reemplazando en la frmula, tenemos:

()()
()

()



Interpretacin del coeficiente de correlacin
Sabiendo que el coeficiente de correlacin de Pearson mide el grado de relacin lineal (intensidad)
entre dos variables, puede tomar valores cercanos a cero o a uno. Bsicamente esta informacin
se refiere a dos caractersticas de la relacin lineal: la direccin o sentido y la cercana o fuerza.
Veamos:




Es importante sealar que el uso del coeficiente de correlacin slo tiene sentido si la relacin a
analizar es del tipo lineal. Si sta no fuera lineal, el coeficiente de correlacin slo indicara la
ausencia de una relacin lineal ms no la ausencia de relacin alguna.
Su interpretacin segn M. Reyes es la siguiente:
R INTERPRETACIN
De 0.01 a 0.19 Correlacin Muy Baja
De 0.20 a 0.39 Correlacin Baja
De 0.40 a 0.69 Correlacin Moderada
De 0.70 a 0.89 Correlacin Alta
De 0.90 a 0.99 Correlacin Muy Alta
+ 1 Correlacin Positiva
-1 Correlacin Negativa
0 Correlacin Nula

En nuestro ejemplo, sera una Correlacin Alta. Pero ms inters tiene la interpretacin del
coeficiente de correlacin en trminos de proporcin de variabilidad explicada, donde se ofrece una
idea ms cabal de la magnitud de la relacin. Nos referimos al coeficiente de determinacin (R
2
).
Coeficiente de Determinacin (R
2
)
Se define como el cuadrado del coeficiente de correlacin; esto es, dada dos variable X e Y, hace
referencia a r
2
xy
, y se entiende como la proporcin de la variacin total de la variable dependiente Y
que est explicada por la variacin de la variable independiente X. Su valor est entre 0 y 1.
En nuestro ejemplo:
Si la correlacin entre inteligencia y rendimiento acadmico es de 0.83, significa que 0.83
2
= 0.69 es
la proporcin de varianza compartida entre ambas variables. Puede interpretarse como que un 69%
del rendimiento acadmico es debido a la inteligencia -variabilidad explicada.

Una forma ms fcil de calcular el coeficiente es usando EXCEL, empleando la funcin PEARSON,
y luego indicar las celdas donde se encuentran los datos de cada una de las variables:
=PEARSON (matriz1, matriz2)
La matriz1 lo constituyen las celdas donde se encuentra la variable X y la matriz2 las celdas donde
se encuentra la variable Y. El coeficiente de correlacin de Pearson no cambia si se invierte el orden
de las matrices.
Correlacin nula Correlacin
perfecta
negativa
Correlacin
perfecta
negativa
Fuerte
negativa
Dbil
negativa
Dbil
positiva
Fuerte
positiva
1 -1
ESTADSTICA PARA LA INVESTIGACIN





2. Anlisis de Regresin
En el anlisis de regresin se busca pronosticar el comportamiento de la variable dependiente a
travs de la informacin que proporcionan las variables independientes. La ecuacin de pronstico
est dada por:
Y = a + b*X

La variable independiente se representa por X y la dependiente por Y. Se requiere estimar el punto
de interseccin (A) y el coeficiente de regresin (B), mediante:

x b y a


2 2
) (

x x n
y x xy n
b


Medidas de la calidad de la recta de regresin es obtenida empleando:
Coeficiente de determinacin



n y y
xy b y a y
R
/ ) (
1
2 2
2
2


Error de estimacin
2
2
2


n
xy b y a y
S
e



ESTADSTICA PARA LA INVESTIGACIN


OJO:
El objetivo de la Correlacin es medir el grado de asociacin lineal entre dos variables.
El objetivo de la Regresin es estudiar y predecir el valor promedio de una variable sobre la
base de valores fijos de otra(s) variable(s).

Tomando los datos del ejemplo anterior, tenemos:


()



Para hallar el valor del parmetro a, usamos un par de datos, por ejemplo, X=105 e Y=8.
()

Luego la recta de regresin lineal estimada es:



Como b es positivo, indica que cada unidad de incremento en la inteligencia produce un incremento de
0.3949 puntos en el rendimiento acadmico. Por otro lado, el coeficiente de determinacin R
2
es de 0.69
o equivalentemente a 69%, esto significa que los valores del rendimiento acadmico en un 69% se
explican por el puntaje de la inteligencia de los estudiantes.
Haciendo uso del programa EXCEL podemos generar el diagrama de dispersin para estimar la
ecuacin de regresin, activando los puntos sobre el diagrama de dispersin con el mouse, y haciendo
clic con el lado derecho aparece la ventana mostrada en la Figura a. En la ventana, hacer clic en el
comando Agregar lnea de tendencia. Hay varias lneas, escoger lineal como en la Figura b.

Figura a. Activacin de la recta de regresin en EXCEL.



ESTADSTICA PARA LA INVESTIGACIN



Figura b. Seleccin de la lnea de regresin en EXCEL.


Asimismo, para que aparezca la recta de regresin estimada y el correspondiente coeficiente de
determinacin R
2
, se debe activar ambas opciones.


Todo este anlisis lo podemos realizar y visualizar haciendo las siguientes operaciones en el programa
EXCEL.
Paso 1: Men Datos
Paso 2: Anlisis de datos
Paso 3: Seleccionar Regresin
Paso 4: Ingresar datos
ESTADSTICA PARA LA INVESTIGACIN







1 2
3
4

Вам также может понравиться