You are on page 1of 42

CORRELACIN

Correlacin

Muchas veces en Estadstica necesitamos saber si existe una relacin entre datos apareados y tratamos de buscar una posible relacin entre variables. Podemos decir que hay una correlacin entre dos variables si cuando una de ellas se relaciona con la otra de alguna manera

Conceptos

Anlisis de correlacin

Conjunto de tcnicas estadsticas empleado para medir la intensidad de la asociacin entre dos variables Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razn (variables cuantitativas)

Diagrama de dispersin

Es una grfica que representa la relacin entre dos variables. Los datos muestrales apareados (x,y) se grafican en un eje horizontal (x) y un eje vertical (y). Cada par individual (x, y) se grafica como un solo punto. Podemos encontrar tres tipos de relacin entre las variables
Positiva Negativa Sin relacin

Coeficiente de correlacin

El coeficiente de correlacin r mide la fuerza de la relacin lineal entre los valores cuantitativos apareados x y y. El coeficiente de correlacin expresa de manera cuantitativa la magnitud y direccin de una relacin

Condiciones La muestra de datos apareados (x, y) es una muestra aleatoria de datos cuantitativos Los pares de datos ( x, y) tienen una distribucin normal bivariada

Conceptos Correlacin

Coeficiente de correlacin

Este coeficiente expresa de manera cuantitativa la magnitud y direccin de una relacin lineal La direccin se refiere a si la relacin es positiva o negativa El grado de la relacin se refiere a la magnitud Una correlacin puede variar de +1 a -1 Hay que considerar que la grfica de dispersin est formada por parejas de valores de x y Si se desea conocer la relacin simple entre una variable x y , podemos emplear

La r de Pearson r2 Nos mide la proporcin de la variacin de por relacin lineal de x

y , que se explica

X Es la suma de todos los valores de x


X2 indica que cada valor de x debe elevarse al cuadrado y despus dichos cuadrados se suman (X)2 indica que los valores de x deben sumarse y el total elevarse al cuadrado XY indica que cada valor de x debe multiplicarse por su correspondiente de y despus hacer la suma de todos los productos.

Criterios de decisin
Consideremos
H0 como = 0 Ha como 0

El rechazo de la hiptesis nula significa que existe suficiente evidencia para aseverar que hay una correlacin lineal entre las dos variables

Si no rechazamos la hiptesis nula significa que no existe suficiente evidencia para aseverar que hay una correlacin lineal entre las dos variables

Ello significa que estamos aceptando la hiptesis alternativa

Criterios de decisin

t=
Ho

r____

si es mayor que t critico Rechazo

1- r2
n- 2

Si rechazo Ho significa que hay suficiente evidencia para considerar que hay una correlacin lineal y que los resultados no se deben al azar.

si

es mayor que r critico rechazo Ho

Ejercicios

Considere los siguiente valores para la variable x y para la variable y.


Calcule el valor de la r de Pearson Calcule el valor de r2 Cul es la hiptesis nula Cul es la hiptesis alternativa Establezca criterio de decisin de acuerdo a t Rechace Ho de acuerdo a los criterios anteriores Cules son sus conclusiones

x y

1 3

2 5

3 8

4 13

x 1 2

y 3 5

xy 3 10 24 52 xy=89

x2 1 4 9 16 x2= 30

y2 9 25 64 169 y2 =267

3
4

8
13

SUMATORIAS x =10 y=29

Grafico de dispersin

14

12

10

8 Series1 6

0 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5

x 1 2 3 4 10

y 3 5 8 13 29

xy 3 10 24 52 89

x2 1 4 9 16 30

y2 9 25 64 169 267

0.97952609

Ejercicios

En un curso de psicologa, un profesor administra dos exmenes. El profesor quiere determinar si las calificaciones obtenidas en el segundo examen estn correlacionas con las calificaciones del primero ( Use este examen como variable X). Para facilitar el calculo se elige una muestra de 8 estudiantes. Si considera un alfa de 0.05, y los datos presentados en la tabla siguiente.

Elabore un diagrama de dispersin de los datos, empleando el primer examen como variable X. Calcule el valor de la r de Pearson Calcule el valor de r2 Cul es la hiptesis nula Cul es la hiptesis alternativa Establezca criterio de decisin de acuerdo a t Establezca criterio de decisin de acuerdo a r Rechace Ho de acuerdo a los criterios anteriores Cules son sus conclusiones

estudiante 1 2 3 4 5 6 7 8

Examen 1 60 75 70 72 54 83 80 65

Examen 2 60 100 80 68 73 97 85 90

Diagrama de dispersin

120

100

80

60

40

20

10

20

30

40

50

60

70

80

90

XY

X2

Y2

60 75 70 72 54 83 80 65 559

60 100 80 68 73 97 85 90 653

3600 7500 5600 4896 3942 8051 6800 5850 46239

3600 5625 4900 5184 2916 6889 6400 4225 39739

3600 10000 6400 4624 5329 9409 7225 8100 54687

0.62953176

Una estudiante del posgrado en psicologa del desarrollo tiene la impresin de que puede existir una relacin entre el peso de los individuos al nacer y su futuro CI. Para ello toma una muestra de siete estudiantes de la universidad y los somete a una prueba de CI. A continuacin investiga cul fue el peso de los siete estudiantes al nacer. Si considera un alfa de 0.01, conteste las siguientes preguntas

Elabore un diagrama de dispersin de los datos, empleando el peso al nacer como la variable independiente (X) Calcule el valor de la r de Pearson Cul es la hiptesis nula Cul es la hiptesis alternativa Establezca criterio de decisin de acuerdo a t Rechace Ho de acuerdo a los criterios anteriores Cules son sus conclusiones

CUAL ES X ? CUAL ES Y ?

estudiante

2 3 4 5 6 7

Peso al nacer (libras) 5.8 6.5 8.0 5.9 8.5 7.2 9.0

CI

122

120 129 112 127 116 130

Coeficiente de correlacin

132 130 128 126 124 122

120
118 116 114 112 110 0 1 2 3 4 5 6 7 8 9 10

Series1

x 5.8 6.5 8 5.9 8.5 7.2 9

y 122 120 129 112 127 116 130

xy 707.6 780 1032 660.8 1079.5 835.2 1170

x2 33.64 42.25 64 34.81 72.25 51.84 81

y2 14884 14400 16641 12544 16129 13456 16900

50.9

856

6265.1

379.79

104954

0.78671727

Ejercicio 2

La cadena de cafeteras Cafjujo est realizando un estudio de factibilidad para establecer una sucursal ms en una poblacin con 25000 habitantes, para lo cual recopila informacin de 9 cafeteras que tiene distribuidas en varias poblaciones del pas. Los resultados de la recopilacin se muestran en el siguiente cuadro.
CAFETERIA
Poblacin ( en miles)

1
2

2
6

3
8

4
8

5
12

6
16

7
20

8
20

9
22

Ventas ( miles de pesos por semana)

64

105

94

124 117

137

157

164

160

y 2 6 8 8 12 16 20 20 22

XY 64 105 94 124 117 137 157 164 160

X2 128 630 752 992 1404 2192 3140 3280 3520

Y2 4 36 64 64 144 256 400 400 484 4096 11025 8836 15376 13689 18769 24649 26896 25600

114 1122

16038

1852 148936

Ejercicio 2

Empleando un alfa de 0.05 Elabore un diagrama de dispersin Establezca su hiptesis nula y alternativa. Determine el Coeficiente de Correlacin que se presenta entre las dos variables. Rechace o acepte la hiptesis nula empleando los criterios de t y r. Cules son sus conclusiones?

Ejercicio de correlacin

Los siguientes son los datos obtenidos en los ltimos aos en la regin desrtica del estado de Mxico. Muestran una relacin entre la cantidad de lluvia y los incendios no provocados en la misma zona. Empleando un alfa de 0.05 determine Realice un diagrama de dispersin Calcule el coeficiente de correlacin ( r) Calcule el valor de r2 Cul es la hiptesis nula Cul es la hiptesis alternativa Establezca criterio de decisin de acuerdo a t Establezca criterio de decisin de acuerdo a r Rechace Ho de acuerdo a los criterios anteriores Cules son sus conclusiones

AO 1998 1999 2000 2001 2002 2003 2004 2005

ml de lluvia 68 68 67 70 71 73 76 81

incendios 53 38 35 49 42 60 54 67

2006 2007

83 84

82 78

ao

ml lluvia

Incendios

X 1998 1999 2001 2002 2003 2004 2005 2006 2007 2008 SUMATORIA 0.92152292 68 68 67 70 71 73 76 81 83 84 741 74.1

y 53 38 35 49 42 60 54 67 82 78 558 55.8

x2 4624 4624 4489 4900 5041 5329 5776 6561 6889 7056 55289

y2 2809 1444 1225 2401 1764 3600 2916 4489 6724 6084 33456

xy 3604 2584 2345 3430 2982 4380 4104 5427 6806 6552 42214

Diagrama de Dispersin

600

500

400

300

Series1

200

100

0 0 100 200 300 400 500 600 700 800

Ejercicio

Catorce estudiantes del segundo ao de medicina, tomaron mediciones de la presin sangunea del mismo paciente. Existe una correlacin entre los valores sistlicos y diastlicos? . Considere un alfa de 0.05 Realice un diagrama de dispersin Calcule el coeficiente de correlacin ( r) Calcule el valor de r2 Cul es la hiptesis nula Cul es la hiptesis alternativa Establezca criterio de decisin de acuerdo a t Establezca criterio de decisin de acuerdo a r Rechace Ho de acuerdo a los criterios anteriores Cules son sus conclusiones

SISTOLICA 138 130

DIASTOLICA 82 91

135
140 120 125 120 130 130

100
100 80 90 80 80 80

144
143 140 130 150

98
105 85 70 100

sistlica

Diastlica x 138 130 135 140 120 125 120 130 130 144 143 140 130 150 1875 Y 82 91 100 100 80 90 80 80 80 98 105 85 70 100 1241 x2 19044 16900 18225 19600 14400 15625 14400 16900 16900 20736 20449 19600 16900 22500 252179 y2 6724 8281 10000 10000 6400 8100 6400 6400 6400 9604 11025 7225 4900 10000 111459 xy 11316 11830 13500 14000 9600 11250 9600 10400 10400 14112 15015 11900 9100 15000 167023

SUMATORIA

CORR.

0.65788014

Ejercicios de tarea

Calcule el
Un investigador realiza un estudio de la relacin entre el consumo de cigarros y las enfermedades. Se determina la cantidad de cigarros fumados diariamente y de das de ausencia en el trabajo durante el ltimo ao debido a una enfermedad. Para ello se toma una muestra de doce individuos . Utilice un alfa coeficiente de correlacin ( r) Calcule el valor de r2 Cul es la hiptesis nula Cul es la hiptesis alternativa Establezca criterio de decisin de acuerdo a t Establezca criterio de decisin de acuerdo a r Rechace Ho de acuerdo a los criterios anteriores Cules son sus conclusiones
CIGARROS CONSUMIDO S

DIAS DE AUSENCIA

0 0 0 10 13 20 27

1 3 8 10 4 14 5

35
35 44 53 60

6
12 16 10 16

R= 0.675

Sujeto

Cigarros Das de consumidos ausencia X Y XY 1 0 1 2 0 3 3 0 8 4 10 10 5 13 4 6 20 14 7 27 5 8 35 6 9 35 12 10 44 16 11 53 10 12 60 16 sumatorias 297 105

X2 0 0 0 100 52 280 135 210 420 704 530 960 3391

Y2 0 0 0 100 169 400 729 1225 1225 1936 2809 3600 12193

1 9 64 100 16 196 25 36 144 256 100 256 1203

Diagrama de dispersin

18 16

Das de ausenc ia

14 12 10 8 6

Series1

4
2 0 0 10 20 30 40 50 60 70

Cigarros consumidos

Calcule el
Un educador ha construido un examen para la aptitudes mecnicas y desea determinar si ste es confiable, mediante dos administraciones con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10 estudiantes reciben dos administraciones del examen, donde la segunda administracin ocurre un mes despus que la primera. Los datos aparecen en la coeficiente de correlacin ( r) Calcule el valor de r2 Cul es la hiptesis nula? Cul es la hiptesis alternativa? Establezca criterio de decisin de acuerdo a t Establezca criterio de decisin de acuerdo a r Rechace Ho de acuerdo a los criterios anteriores Cules son sus conclusione s Ensayo de prueba uno Ensayo de prueba dos

10 12 20 25 27 35 43

10 15 17 25 32 37 40

40
32 47

38
30 49

sujeto 1 2 3 4 5 6 7 8 9 10

ad 1 X 10 12 20 25 27 35 43 40 32 47 291

ad2 Y 10 15 17 25 32 37 40 38 30 49 293

XY 100 144 400 625 729 1225 1849 1600 1024 2209 9905

X2 100 144 400 625 729 1225 1849 1600 1024 2209 9905

Y2 100 225 289 625 1024 1369 1600 1444 900 2401 9977

0.97622705

DIAGRAMA DE DISPERSIN

60

50

40

30

Series1

20

10

10

15

20

25

30

35

40

45

50

Un profesor de psicologa se interesa en la relacin entre las horas de estudio y los puntos totales obtenidos en su curso. En la tabla siguiente se muestran los datos siguientes Empleando un alfa de 0.05 resuelva las siguientes preguntas

Calcule el
coeficiente de correlacin ( r) Calcule el valor de r2 Cul es la hiptesis nula? Cul es la hiptesis alternativa? Establezca criterio de decisin de acuerdo a t y a r Rechace Ho de acuerdo a los criterios anteriores Cules son sus conclusiones ? Horas de estudio 45 Total de puntos obtenidos 40

30 90 60
105 65 90 80 55 75

35 75 65
90 50 90 80 45 65

Se seleccion una muestra de 12 casas vendidas la semana pasada en una zona aledaa a la ciudad de Puebla . Puede concluirse que a medida que aumenta el extensin del inmueble , el precio de venta , tambin? Use un alfa de 0.05 para sus conclusiones?

EXTENSIN EN MILES DE m2 1.4 1.3

PRECIO DE VENTA EN miles de PESOS 100 110

1.2
1.1 1.4 1.0 1.3 0.8 1.2 0.9 1.1 1.1

105
120 80 105 110 85 105 75 70 95

Una compaa de comida rpida quiere establecer una sucursal en la zona norte de la ciudad y para ello hace un pequeo estudio de mercado en la zona para verificar cul es el consumo de las familias que habitan la zona.

Tamao de la familia 3 6 5 6

Cantidad gastada 99 104 151 129

142 111
74 91 119 91

Empleando una alfa de 0.05 podra concluir que conforme el tamao de la familia aumenta, la cantidad gastada en alimentos tambin aumenta?

3
4 4 5 3

Calcule la ecuacin de regresin usando el precio de venta basado en le dividendo real Interprete el valor de la pendiente determine el coeficiente de correlacin y empleando un nivel de alfa de 0.05 puede concluir que el dividendo depende del precio de la accin ?

Precio por accin 20

dividendo 3.14

Precio por accin 57.06

dividendo 9.53

22.01 31.39
33.57 35.86 36.12 36.16 37.99 38.85 39.65 43.44 49.08 53.73 54.41

3.36 0.46
7.99 0.77 8.46 7.62 8.03 6.33 7.96 8.95 9.61 11.11 13.28

57.4 58.3
59.51 60.6 64. 64.6 64.7 64.9 66.4 68.2 69.6 75 77.9

12.6 10.4
7.97 9.2 16.5 16.1 13.7 10.5 21.1 14.3 24.4 11.5 17.6

55.1

10.22

80

17.3