Вы находитесь на странице: 1из 19

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

Dpto. de Estadística e Informática

MÉTODOS ESTADÍSTICOS PARA LA


INVESTIGACIÓN
SEMANA 4 – Parte 2
Análisis de Correlación

Profesores del curso


Ciclo Verano 2019
OBJETIVOS
Conocer las condiciones para usar el coeficiente de correlación

Calcular el coeficiente de correlación de Pearson y Spearman

Interpretar y analizar el coeficiente de correlación de Pearson y Spearman

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Coeficiente de Correlación de Pearson

El coeficiente de correlación de Pearson es una medida de la asociación


existente entre dos variables cuantitativas. Este coeficiente toma valores
desde -1 hasta 1. Para interpretar un coeficiente de correlación tenga en
cuenta lo siguiente:

a) El valor de r es independiente de las unidades en que se midan x e y


b) r =1: significa una perfecta correlación positiva, es decir, todos los puntos
caen sobre una línea con pendiente positiva.
c) r = 0: significa no hay correlación. Es decir, las variables son
independientes
c) r = -1: significa una perfecta correlación negativa, es decir, todos los puntos
caen sobre una línea con pendiente negativa.
e) r mide la fuerza de una relación lineal
f) Se usa cuando los datos están medidos en una escala de intervalo o de
razón.

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

El coeficiente de correlación es la raíz cuadrada del coeficiente de


determinación con el signo de b1 (coeficiente de regresión).
Relaciones:

Si r =0 nula
Si r > 0 y r < ± 0.10 Casi nula
Si r ≥ ± 0,10 y r < ± 0,20 Muy baja
Si r ≥ ± 0,20 y r < ± 0,40 Baja
Si r ≥ ± 0,40 y r < ± 0,60 Media
Si r ≥ ± 0,60 y r < ± 0,80 Alta
Si r ≥ ± 0,80 y r < ± 1 Muy alta
Si r =± 1 Perfecta

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

• El coeficiente de correlación está dada por:

Siendo:
SPXY: suma de productos corregidos de X e Y.
SCX : suma de cuadrados corregidos de X.
SCY : suma de cuadrados corregidos de Y.

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Coeficiente de Correlación de Pearson

Ejemplo de Aplicación 3 de regresión.


Se quiere estimar el puntaje subjetivo del sabor (Sabor), obtenido
combinando los puntajes de varios sujetos, en función del logaritmo
natural de la concentración de ácido acético (AA).

Muestra 1 2 3 4 5 6 7 8 9 10
Sabor(Y) 12.3 47.9 37.3 21 0.7 40.9 18 15.2 16.8 0.7
AA (X) 4.543 5.759 5.892 5.242 4.477 6.365 5.247 5.298 5.366 5.328

r= = 0.79, y como b tiene signo positivo, entonces:


r = 0.79 indica una elevada correlación positiva.
Es preciso tener en cuenta que asociación estadística no implica la
existencia de una relación causal.
 Métodos Estadísticos para la Investigación I 2019-V
CORRELACIÓN DE VARIABLES CUANTITATIVAS

• Prueba de hipótesis para el coeficiente de correlación de Pearson

Hipótesis:

H0: ρ = 0 (No existe correlación entre X e Y)


H1: ρ ≠ 0 (Si existe correlación entre X e Y)
r
Estadístico de prueba: tc  ~ t( n 2)
(1  r ) / (n  2)
2

Regla de Decisión:

La hipótesis nula se rechaza con un nivel de significación α si:


tc  t( /2,n2) o tc  t( /2,n2)

Usando p-valor:
Si p-valor ≤ α , entonces se RHo y se acepta la H1.
Por lo tanto si existe correlación lineal (asociación) entre las variables X e Y
 Métodos Estadísticos para la Investigación I 2019-V
CORRELACIÓN DE VARIABLES CUANTITATIVAS

• Utilizando los datos del Ejemplo 3 de Regresión, se pide probar a


un nivel de significación del 5%, si existe correlación lineal entre el
sabor y la concentración de ácido acético.

H0: ρ = 0 (No existe correlación entre puntaje subjetivo del sabor y el


logaritmo natural de la concentración de ácido acético).
H1: ρ ≠ 0 (Si existe correlación entre puntaje subjetivo del sabor y el logaritmo
natural de la concentración de ácido acético)

Estadístico de prueba: tc 
r

0.793
 3.68165
(1  r ) / (n  2)
2
(1  0793 ) / (10  2)
2

Como tc  t(0.025,8)  2.306

Se rechaza la hipótesis nula.


Como p-valor = 0.006 < 0.05, entonces se Rechaza la Ho y se acepta H1
Usando Minitab

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Correlation : Sabor (Y), AA (X)

Pearson correlation of Sabor (Y) and AA (X) = 0.793


P-Value = 0.006

Por lo tanto, a un nível de significación del 5%, si existe correlación


lineal (asociación) entre las variables Sabor y concentración de ácido
acético.

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Coeficiente de Correlación de Spearman


El coeficiente de correlación de Spearman( 1904) es una prueba no
paramétrica cuando se quiere medir la relación entre dos variables y
no cumplen el supuesto de normalidad en la distribución de tales
valores, o cuando una o ambas variables estudiadas son de tipo
ordinal. Toma valores entre -1 y 1, y se interpreta exatamente igual
que el coeficiente de correlación de Pearson.

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Coeficiente de Correlación de Spearman


Suponga que se toma una muestra aleatoria (x1, Y1), ... , (xn' Yn) de n
pares de observaciones. Si las Xi y las Yi se ordenan en sentido
ascendente y se calcula la correlación muestral de estos puestos, el
coeficiente resultante se llama coeficiente de correlación de orden de
Spearman. Si no hay empates, una formula equivalente para calcular
este coeficiente es:
n
6 di2
rs  1  i 1

n  n  1
2

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Coeficiente de Correlación de Spearman

Donde:

di = son las diferencias entre los puestos de los miembros de los


distintos pares n = nº de datos

Prueba de Hipótesis de coeficiente de correlación de Spearman

Hipótesis:

H0: ρ = 0 (No existe correlación entre X e Y)


H1: ρ ≠ 0 (Si existe correlación entre X e Y)
n
6 di2
Cálculo de rs: rs  1  i 1

n  n 2  1

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Regla de Decisión:

Rechazar Ho si rs < - rs,/2 r, o rs > rs,/2

Nota:
Si n > 30, se puede calcular: y utilizar la tabla de la distribución normal

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Ejemplo 1:

Se sospecha que la abundancia de la especie de gramínea Poa bulbosa


en los pastizales depende en gran medida de la humedad que hay en
el suelo. Para comprobar la hipótesis se realiza un muestreo con una
cuadrícula de 20 cm de lado, que se toma una muestra al azar de 12
cuadriculas de pasto. En cada cuadrícula se mide la cobertura de la
especie y la humedad del suelo mediante un TDR. Variables: Cobertura
de la especie y humedad del suelo. Ambas son cuantitativas, y no
siguen una distribución normal.

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Pasos para hallar rs:

1. Clasificar por jerarquìa los valores de X desde 1 hasta n (el número


de parejas de valores de X e Y en la muestra).
2. Clasificar por jerarquía los valores de Y desde 1 hasta n.
3. Calcular di, para cada pareja de observaciones, restando la
jerarquía de Yi de la jerarquía de Xi.
4. Elevar al cuadrado cada di y calcular, la suma de los valores
elevados al cuadrado.
5. Calcula rs

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Obs Cobertura(X) Humedad(Y) Rango (X) Rango (Y) di di2


1 82 42 2 3 -1 1
2 98 46 6 4 2 4
3 87 39 5 2 3 9
4 40 37 1 1 0 0
5 116 65 10 8 2 4
6 113 88 9 11 -2 4
7 111 86 8 10 -2 4
8 83 56 3 6 -3 9
9 85 62 4 7 -3 9
10 126 92 12 12 0 0
11 106 54 7 5 2 4
12 117 81 11 9 2 4
Suma 52

Solución:
H0: ρ = 0 (No existe correlación entre la cobertura de la especie y la
humedad del suelo).
H1: ρ ≠ 0 (Si existe correlación entre la cobertura de la especie y la
humedad del suelo)

 Métodos Estadísticos para la Investigación I 2019-V


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Calculo de rs
6 x52
rs  1   0,818
12 x 12  1
2

rs,/2= 0,5804 ( 2 colas)

Como rs =0,818 es mayor rs,/2= 0,5804 , entonces se rechaza


Ho. Por lo tanto, ,hay correlación positiva entre la cobertura de
Poa bulbosa y la humedad del suelo

si n= 12 y para =0.05, la tabla de Spearman arroja el valor de


rs,/2=0.5804

 Métodos Estadísticos para la Investigación I 2019-V


Ejercicio propuesto 3. Pág. 181

Un zootecnista está interesado en evaluar 12 ejemplares de trucha en


un estudio de índole acuícola, con la finalidad de relacionar la longitud
del cuerpo y su ancho.

Longitud 66 63 64 76 76 60 73 69 67 65 70 72
Ancho 6 7 6 7 4 3 4 5 4 5 9 7

Se comprobó que las variables no cumplen con el supuesto de


normalidad.
Correlación: Longitud; Ancho
Correlación de Pearson de Longitud y Ancho = 0.175
Valor p = 0.587
Rho de Spearman: Longitud; Ancho
Rho de Spearman para Longitud y Ancho = 0.128
Valor p = 0.691

a.Indique el coeficiente correlación adecuado entre longitud y ancho del


cuerpo de la trucha. Interprete.
b.Pruebe de hipótesis para la existencia de correlación entre longitud y
ancho del cuerpo de la trucha. Usar  = 0.05
 Métodos Estadísticos para la Investigación I 2019-V
Fórmulas

 Métodos Estadísticos para la Investigación I 2019-V

Вам также может понравиться