Вы находитесь на странице: 1из 20

16/05/2017

Correlacin es una tcnica estadstica utilizada


para determinar el grado en el que dos variables
estn relacionadas.

1
16/05/2017

Diagrama de dispersin de
puntos
Dos variables cuantitativas
Una variable es llamada independiente (X)
y la otra dependiente (Y)
Los puntos no se unen
No es tabla de frecuencias
Y
* *
*
X

Peso. 67 69 85 83 74 81 97 92 114 85
SBP(m mHg)
TAS (mm HG) (kg)
TAS 120 125 140 160 130 180 150 140 200 130
(mmHg)

220
200
180
160
140
120
100
80 wtPeso
(kg)(Kg)
60 70 80 90 100 110 120

2
16/05/2017

TAS (mm
SBP(m mHg)HG)
220

200

180

160

140

120

100

80 Peso (Kg)
Wt (kg)
60 70 80 90 100 110 120

Diagrama de puntos dispersos de peso y tensin arterial sistlica

El modelo de los datos es indicativo del tipo


de relacin entre las dos variables:
Relacin positiva Directa
Relacin negativa Indirecta Inversa
No hay relacin

3
16/05/2017

18

16

14

12

Height in CM
10

0
0 10 20 30 40 50 60 70 80 90
Age in Weeks

Confiabilidad

Edad del Auto

4
16/05/2017

Peso (libras)

Tasa de pulso (latidos/minuto)

Estadstico que muestra el grado de relacin entre


las dos variables.

Coeficientede Correlacin r de pearson.


Coeficiente de correlacin de Rankings de
Spearman (rs).
Coeficiente de correlacin Tau-b de Kendall

5
16/05/2017

Tambin llamado correlacin r de Pearson


Mide la naturaleza y fuerza entre dos variables
cuantitativas.
El signo de r denota la naturaleza de la asociacin
Mientras que el valor de r denota la fuerza de
asociacin.
Si el signo es positivo, significa que la relacin es
directa (un incremento en una variable est asociado
con el incremento de la otra variable; una disminucin
de una variable est asociado con la disminucin de la
otra variable).
Si el signo es negativo, significa una relacin inversa o
indirecta (significando que el incremento en una
variable est asociado con una disminucin de la otra
variable).

El valor de r est entre ( -1) y ( +1)


El valor de r denota la fuerza de la asociacin
como se ilustra en el siguiente diagrama.

fuerte intermedio dbil dbil intermedio fuerte

-1 -0.75 -0.25 0 0.25 0.75 1


indirecta Directa
Correlacin correlacin
perfecta perfecta
sin relacin

6
16/05/2017

Si r = cero significa que no hay asociacin o


correlacin entre las dos variables.

Si 0 < r < 0.25 = dbil correlacin.

Si 0.25 r < 0.75 = intermedia correlacin.

Si 0.75 r < 1 = fuerte correlacin.

Si r = 1 = perfecta correlacin.

Cmo clacular el coeficiente de correlacin


simple (r)?

xy
x y
r n
( x) 2 ( y) 2
x
2
. y
2

n n

7
16/05/2017

Una muestra de 6 nios fue seleccionada, datos de


su edad en aos y peso en kilogramos fue registrada
como se muestra en la siguiente tabla. Se requiere
encontrar la correlacin entre edad y peso.

N Edad Peso (Kg)


serial (aos)
1 7 12
2 6 8
3 8 12
4 5 10
5 6 11
6 9 13

Las dos variables son de tipo cuantitativo, una


variable (edad) es llamada independiente y la otra
(peso) es llamada dependiente y con notacin de
variable Y, para encontrar la relacin entre edad y
peso, calcule el coeficiente de correlacin simple,
usando la siguiente frmula:

xy
x y
r n
( x) 2 ( y) 2
x
2
. y
2

n n

8
16/05/2017

Edad Peso
N
(aos) (Kg) xy X2 Y2
Serial
(x) (y)
1 7 12 84 49 144
2 6 8 48 36 64
3 8 12 96 64 144
4 5 10 50 25 100
5 6 11 66 36 121
6 9 13 117 81 169
Total x= y= xy= x2= y2=
41 66 461 291 742

41 66
461
r 6
(41)
2
(66)2

6 6
291 . 742

r = 0.759
Fuerte correlacin directa

9
16/05/2017

Ansiedad Puntaje X2 Y2 XY
(X) de
prueba
(Y)
10 2 100 4 20
8 3 64 9 24
2 9 4 81 18
1 7 1 49 7
5 6 25 36 30
6 5 36 25 30
X = 32 Y = 32 X2 = 230 Y2 = 204 XY=129

(6)(129) (32)(32) 774 1024


r .94
6(230) 32 6(204) 32
2 2
(356)(200)

r = - 0.94

Fuerte correlacin indirecta

10
16/05/2017

No es una prueba no paramtrica de


correlacin.
Este procedimiento usa los dos rankings que
puede asignarse a los valores de la muestra en
X y en Y.
Coeficiente de correlacin de rankings de
Spearman puede calcularse en los siguientes
casos:
Ambas variables son cuantitativas.
Ambas variables son cualitativas ordinales.
Una variable es cuantitativa y la otra es cualitativa
ordinal.

1. Ranquee los valores de X de primero a n donde


n es el nmero de pares de valores de X y Y en
la muestra.
2. Ranquee el valor de Y de primero a n.
3. Calcule el valor de di para cada par de
observaciones restando el ranking de yi del
ranking de xi.
4. Eleve al cuadrado cada di y di2 lo cual es la
suma de valores al cuadrado.

11
16/05/2017

5. Aplique la siguiente frmula:

6 (di)2
rs 1
n(n 2 1)
El valor de rs denota la magnitud y
naturaleza de la asociacin dando la
misma interpretacin el r simple.

En un estudio de la relacin entre el nivel de


educacin e ingreso, se obtuvieron los
siguientes datos. Encuentre la relacin entre
ellos y comente.

Nmeros Nivel de educacin Ingreso


de la (X) (Y)
muestra
A Preparatoria 25
B Primaria 10
C Universidad 8
D Secundaria 10
E Secundaria 15
F Analfabeta 50
G Universidad 60

12
16/05/2017

Ranking Ranking di di2


(X) (Y) X Y

A Preparatoria 25 3 3 0 0

B Primaria 10 6 5.5 0.5 0.25

C Universidad 8 1.5 7 -5.5 30.25

D Secundaria 10 4.5 5.5 -1 1

E Secundaria 15 4.5 4 0.5 0.25

F Analfabeta 50 7 2 5 25

G Universidad 60 1.5 1 0.5 0.25

di2=57

6 57
rs 1 0.02
7(48)
Comentario:
Hay una correlacin dbil indirecta entre el nivel de
educacin y el ingreso.

13
16/05/2017

Regresin: tcnica enfocada a la prediccin de


algunas variables conociendo a otras.
El proceso de predecir la variable Y usando la
variable X.
Nos dice cuanto es el valor de cambio de y en
funcin del cambio en los valores de x.

Calcule la lnea que de el mejor trazo para un grupo de


datos.
La lnea de regresin hace la suma de cuadrados de los
residuales, menores a cualquier otra lnea.
Regresin minimiza los residuales
SBP(mm Hg)
TAS(mmHg)
220

200

180

160

140

120

100
Peso
80 Kg
Wt (kg)
60 70 80 90 100 110 120

14
16/05/2017

Usando el mtodo de los cuadrados mnimos (un


procedimiento que minimiza las desviaciones
verticales de puntos trazados alrededor de la lnea
recta) somos capaces de construir el mejor trazado
de la lnea recta en la grfica de puntos dispersos y
luego formular la ecuacin de regresin en la forma
de:
Y a bX

a y bx
x y
xy n
bb1
( x) 2
x n
2

SBP(mmHg)
TAS (mmHg)
220
La ecuacin de
regresin describe la 200

lnea de regresin 180

matemticamente 160

Interseccin 140

Pendiente 120

100

80 WtPeso
(kg)
60 70 80 90 100 110 120 (Kg)

15
16/05/2017

Y
y a bX
Y = bX + a
Change b=
Cambio
b = Slope
Change in X
in Y pendiente en Y
a = Y-intercept
Cambio
X en X
a = interseccin

16
16/05/2017


Regresin lineal ion
Linear Regress

Calificacin final en el curso= 59.95 + 3.17 * horas de estudio

9 0.0 0 Final grade in course = 59.95 + 3.17 * study
el curso

R2=0.88
R-Square = 0.88
course


finalinen


Final grade

8 0.0 0
Calificacin

7 0.0 0

2 .0 0 4 .0 0 6 .0 0 8 .0 0 1 0.0 0

Number
Nmero deof hours
horas spenten
empleadas studying
estudio

Calificacin final predicha en clase =


59.95 + 3.17*(nmero de horas de estudio por semana)

En una muestra de 6 personas fue seleccionada el valor de su edad


(variable x) y su peso, mostrados en la siguiente tabla. Encuentre la
ecuacin de regresin y que se predice del peso cuando la edad es 8.5
aos.

Nmero serial Edad (x) Peso (y)


1 7 12
2 6 8
3 8 12
4 5 10
5 6 11
6 9 13

17
16/05/2017

Nmero Edad Peso (y) xy X2 Y2


serial (x)
1 7 12 84 49 144
2 6 8 48 36 64
3 8 12 96 64 144
4 5 10 50 25 100
5 6 11 66 36 121
6 9 13 117 81 169

Total 41 66 461 291 742

41 66
x 6.83 y 11
6 6

41 66
461
b 6 0.92
(41) 2
291
6
Ecuacin de regresin

y (x) 11 0.9(x 6.83)

18
16/05/2017

y (x) 4.675 0.92x

y (8.5) 4.675 0.92 * 8.5 12.50Kg

y (7.5) 4.675 0.92 * 7.5 11.58Kg

12.6
(in Kg)

12.4
12.2
Peso (en

12
Weight

11.8
11.6
11.4
7 7.5 8 8.5 9
Age (in(en
Edad years)
aos)

Creamos una lnea de regresin trazando dos valores estimados para y contra su
componente de x, y luego extendiendo la lnea a la derecha y a la izquierda.

19
16/05/2017

20

Вам также может понравиться