You are on page 1of 12

CORRELACIN Y REGRESIN EMPLEANDO EXCEL Y GRAPH

1) ANLISIS DE CORRELACIN
Dado dos variables, la correlacin permite hacer estimaciones del valor de una de ellas conociendo el
valor de la otra variable.
1.1) DIAGRAMA DE DISPERSIN
Los diagramas de dispersin son planos cartesianos en los que se marcan los puntos correspondientes a
los pares ordenados (X,Y) de los valores de las variables.
1.2) CLASIFICACIN DE LA CORRELACIN
1.2.1) Segn la relacin entre variables
- Correlacin lineal: Se representa mediante una lnea recta.
- Correlacin no lineal: Se representa con una lnea curva.
1.2.2) Segn el nmero de variables
- Correlacin simple: La variable dependiente acta sobre la variable independiente.
- Correlacin mltiple: Cuando la variable dependiente acta sobre varias variables independientes.
- Correlacin parcial: Cuando la relacin que existe entre una variable dependiente y una
independiente es de tal forma que los dems factores permanezcan constantes.
1.2.3) Segn el valor cuantitativo
- Correlacin perfecta: El valor del coeficiente de correlacin es 1
- Correlacin imperfecta: El coeficiente de correlacin es menor a 1 sea en sentido positivo o
negativo.
- Correlacin nula: El coeficiente de correlacin es 0. No existe correlacin entre las variables.
Ejemplo: Nmero de calzado de una persona y su cociente intelectual.

1.2.4) Segn el signo


- Correlacin positiva.- Dos variables tiene correlacin positiva cuando al aumentar o disminuir el
valor de una de ellas entonces el valor correspondiente a la otra aumentar o disminuir
respectivamente, es decir, cuando las dos variables aumentan en el mismo sentido. Ejemplo: Peso de
una persona y su talla.
- Correlacin negativa.- Dos variables tiene correlacin negativa cuando al aumentar o disminuir el
valor de una de ellas entonces el valor de la otra disminuir o aumentar respectivamente, es decir, una
variable aumenta y otra disminuye o viceversa. Ejemplo: Nmero de partidos ganados por un equipo en
una temporada y su posicin final en la tabla.

UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.

1.3) COEFICIENTES DE CORRELACIN


Los coeficientes de correlacin son medidas que indican la situacin relativa de los mismos sucesos
respecto a las dos variables, es decir, son la expresin numrica que nos indica el grado de relacin
existente entre las 2 variables y en qu medida se relacionan. Son nmeros que varan entre los lmites
+1 y -1. Su magnitud indica el grado de asociacin entre las variables; el valor r = 0 indica que no
existe relacin entre las variables; los valores 1 son indicadores de una correlacin perfecta positiva
(al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).

No hay correlacin

Correlacin Positiva

Correlacin Negativa

Para interpretar el coeficiente de correlacin utilizamos la siguiente escala:

Valor
-1
-0,9 a -0,99
-0,7 a -0,89
-0,4 a -0,69
-0,2 a -0,39
-0,01 a -0,19
0
0,01 a 0,19
0,2 a 0,39
0,4 a 0,69
0,7 a 0,89
0,9 a 0,99
1

Significado
Correlacin negativa grande y perfecta
Correlacin negativa muy alta
Correlacin negativa alta
Correlacin negativa moderada
Correlacin negativa baja
Correlacin negativa muy baja
Correlacin nula
Correlacin positiva muy baja
Correlacin positiva baja
Correlacin positiva moderada
Correlacin positiva alta
Correlacin positiva muy alta
Correlacin positiva grande y perfecta

1.3.1) COEFICIENTE DE CORRELACIN DE KARL PEARSON


Llamando tambin coeficiente de correlacin producto-momento.
Se calcula aplicando la siguiente ecuacin:

)(

r = Coeficiente producto-momento de correlacin lineal


x X X ; y Y Y
Ejemplo ilustrativo:
Con los datos sobre las temperaturas en dos das diferentes en una ciudad, determinar el tipo de
correlacin que existe entre ellas mediante el coeficiente de PEARSON.
X 18 17 15 16 14 12 9 15 16 14 16 18 X =180
Y 13 15 14 13 9 10 8 13 12 13 10 8 Y= 138
Solucin:
Se calcula la media aritmtica

Para X:

Para Y:

UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.

Se llena la siguiente tabla:


X
18
17
15
16
14
12
9
15
16
14
16
18
=180

Y
13
15
14
13
9
10
8
13
12
13
10
8
= 138

x = X-
3
2
0
1
-1
-3
-6
0
1
-1
1
3

y = Y-
1,5
3,5
2,5
1,5
-2,5
-1,5
-3,5
1,5
0,5
1,5
-1,5
-3,5

x2
9
4
0
1
1
9
36
0
1
1
1
9
72

xy
4,5
7
0
1,5
2,5
4,5
21
0
0,5
-1,5
-1,5
-10,5
28

y2
2,25
12,25
6,25
2,25
6,25
2,25
12,25
2,25
0,25
2,25
2,25
12,25
63

Se aplica la frmula:

)(

)(

Existe una correlacin moderada


En Excel se calcula de la siguiente manera:

UMG sede Chiquimula, Estadistica Aplicada a la Investigacin de Mercados, Lic. Alex Martnez

El diagrama de dispersin en Excel:

El diagrama de dispersin en el programa Graph:

UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.

TAREA DE INTERAPRENDIZAJE
1) Elabore un organizador grfico de los tipos de correlacin.
2) Con los datos de la siguiente tabla sobre las temperaturas del da X y del da Y en determinadas
horas en una ciudad
X 9 10 12 14 16 18 20 22 24 26 28 30
Y 12 14 15 16 17 20 22 23 26 28 31 32
2.1) Calcule el coeficiente de correlacin de Pearson empleando la frmula y mediante Excel.
0,99
2.2) Elabore el diagrama de dispersin de manera manual.
2.3) Elabore el diagrama de dispersin empleando Excel.
2.4) Elabore el diagrama de dispersin empleando el programa Graph.
3) Cree y resuelva un ejercicio similar al anterior.
4) Consulte y presente un ejemplo resuelto del coeficiente de correlacin de Pearson para datos
agrupados en intervalos en http://www.monografias.com/trabajos85/coeficiente-correlacion-karlpearson/coeficiente-correlacion-karl-pearson.shtml
1.3.2) COEFICIENTE DE CORRELACIN POR RANGOS DE SPEARMAN
Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es
decir, cuando una o ambas escalas de medida son posiciones. Ejemplo: Orden de llegada en una carrera
y peso de los atletas.
Se calcula aplicando la siguiente ecuacin:

(
)
rs = Coeficiente de correlacin por rangos de Spearman
d = Diferencia entre los rangos ( X menos Y)
n = Nmero de datos
Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes ms elevados le asignamos
el rango 1 al siguiente el rango 2 y as sucesivamente. Si se repiten dos puntajes o ms se calculan las
medias aritmticas.
Ejemplo ilustrativo: La siguiente tabla muestra el rango u orden obtenido en la primera evaluacin
(X) y el rango o puesto obtenido en la segunda evaluacin (Y) de 8 estudiantes universitarios en la
asignatura de Estadstica. Realizar el diagrama de dispersin y calcular el coeficiente de correlacin por
rangos de Spearman.
Estudiante
Dyana
Elizabeth
Mario
Orlando
Mathas
Josu
Anita
Luca

X
1
2
3
4
5
6
7
8

Y
3
4
1
5
6
2
8
7

UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.

Solucin:
El diagrama de dispersin hecho en Excel se muestra en la siguiente figura:

Para calcular el coeficiente de correlacin por rangos de Spearman de se llena la siguiente tabla:
Estudiante
Dyana
Elizabeth
Mario
Orlando
Mathas
Josu
Anita
Luca

X
1
2
3
4
5
6
7
8

Y
3
4
1
5
6
2
8
7

d= X-Y
-2
-2
2
-1
-1
4
-1
1

d2=(X-Y)2
4
4
4
1
1
16
1
1
2
d = 32

Se aplica la frmula:

Por lo tanto existe una correlacin positiva moderada entre la primera y segunda evaluacin de los 8
estudiantes.

UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.

En Excel se calcula de la siguiente manera:

TAREA DE INTERAPRENDIZAJE
1) Consulte sobre la biografa de Spearman y realice un organizador grfico de la misma.
2) La siguiente tabla muestra el rango u orden obtenido en la primera evaluacin (X) y el rango o
puesto obtenido en la segunda evaluacin (Y) de 8 estudiantes universitarios en la asignatura de
Matemtica.
X
1
2
3
4
5
6
7
8

Y
4
5
6
8
3
2
1
7

2.1) Realice el diagrama de dispersin en forma manual.


2.2) Realice el diagrama de dispersin empleando Excel.
2.3) Realice el diagrama de dispersin empleando el programa Graph.
2.4) Calcule el coeficiente de correlacin por rangos de Spearman empleando la ecuacin.
-0,19
2.5) Calcule el coeficiente de correlacin empleando Excel.
-0,1905
3) Cree y resuelva un ejercicio similar al anterior.

UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.

4) La siguiente tabla muestra las calificaciones de 8 estudiantes universitarios en las asignaturas de


Matemtica y Estadstica. Calcular el coeficiente de correlacin por rangos de Spearman y realizar el
diagrama de dispersin.
N Estudiante Matemtica Estadstica
1 Dyana
10
8
Elizabeth
2
9
6
Mario
3
8
10
Orlando
4
7
9
Mathas
5
7
8
Josu
6
6
7
Anita
7
6
6
8 Luca
4
9

Consulte la solucin de este ejercicio en http://www.monografias.com/trabajos85/coeficientecorrelacion-rangos-spearman/coeficiente-correlacion-rangos-spearman.shtml


5) Cree y resuelva un ejercicio similar al anterior.

1.4) COEFICIENTE DE DETERMINACIN


Revela qu porcentaje del cambio en Y se explica por un cambio en X. Se calcula elevando al cuadrado
el coeficiente de correlacin.

)(

xX X
y Y Y
r = Coeficiente de correlacin de Pearson
Coeficiente de determinacin

La ecuacin del coeficiente producto-momento (Coeficiente de Pearson)


escribirse en la forma equivalente:

De donde coeficiente de determinacin =

)(

puede

( )( )
( ) ][

( ) ]

Ejemplo ilustrativo
Con los datos de la siguiente tabla sobre las temperaturas, calcular el coeficiente de determinacin
empleando la ecuacin obtenida de la forma equivalente del coeficiente de Pearson.
X 18 17 15 16 14 12 9 15 16 14 16 18
Y 13 15 14 13 9 10 8 13 12 13 10 8

UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.

Solucin:
Se calcula el coeficiente de Pearson llenando la siguiente tabla:
X
18
17
15
16
14
12
9
15
16
14
16
18
X=180

Y
13
15
14
13
9
10
8
13
12
13
10
8
Y =138

XY
234
255
210
208
126
120
72
195
192
182
160
144
XY=2098

X2
Y2
324
169
289
225
225
196
256
169
196
81
144
100
81
64
225
169
256
144
196
169
256
100
324
64
2
2
X = 2772 X =1650

Se aplica la ecuacin para calcular el coeficiente de Pearson.

( )( )
( ) ][

( ) ]

][

][

) ][

) ]

Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinacin.


Coeficiente de determinacin =

Esto establece que 17,28% del cambio en Y se explica mediante un cambio en X.

Nota:
El r2 tiene significado slo para las relaciones lineales. Dos variables pueden tener r2 =0 y sin embargo
estar relacionadas en sentido curvilneo. El valor de r2 no se interpreta como si la variable Y fuera
causado por un cambio de la variable X, ya que la correlacin no significa causa.

UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.

10

En Excel se calcula elevando al cuadrado el coeficiente de correlacin o insertando la funcin


=COEFICIENTE.R2 como muestra la siguiente figura:

TAREA DE INTERAPRENDIZAJE
1) La siguiente tabla muestra el dinero en miles de dlares gastado en publicidad por una empresa (X)
para vender sus productos, y el nmero en miles de clientes (Y) que compran los productos de la
empresa.
X 15 17 14 13 18 20 17 18 16 14 20 18
Y 30 34 28 26 32 40 34 36 32 25 40 36

1.1) Realice el diagrama de dispersin en forma manual.


1.2) Realice el diagrama de dispersin empleando Excel.
1.3) Realice el diagrama de dispersin empleando el programa Graph.
1.4) Calcule el coeficiente de Pearson empleando las dos frmulas.
0,96015
1.5) Calcule el coeficiente de determinacin empleando las dos frmulas y mediante Excel.
0,9219

UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.

11

2) La siguiente tabla muestra el tiempo en minutos dedicado al estudio y la calificacin sobre 10


obtenida.
X 140 150 130 120 170 190 180 160 200 110 100 90
Y 7
8
7
6
8
10 9
8
10 6
5
4
2.1) Realice el diagrama de dispersin en forma manual.
2.2) Realice el diagrama de dispersin empleando Excel.
2.3) Realice el diagrama de dispersin empleando el programa Graph.
2.4) Calcule el coeficiente de Pearson empleando las dos frmulas.
0,9817
2.5) Calcule el coeficiente de determinacin empleando las dos frmulas y mediante Excel.
0,9638
3) Cree y resuelva un ejercicio similar a los anteriores.

2) ANLISIS DE REGRESIN
Los primeros y ms importantes estudios al respecto se deben a los cientficos Francis Galton (18221911) y Karl Pearson (1857-1936). Fue Galton quien utiliz por primera vez el trmino regresin para
indicar que, aunque influida por la estatura de sus padres, la estatura de los hijos regresaba a la media
general.
La regresin examina la relacin entre dos variables, pero restringiendo una de ellas con el objeto de
estudiar las variaciones de una variable cuando la otra permanece constante. En otras palabras, la
regresin es un mtodo que se emplea para predecir el valor de una variable en funcin de valores
dados a la otra variable. En estadstica la palabra predecir no se utiliza en el sentido empleado por los
astrlogos, futurlogos y mentalistas, sino mas bien en un sentido lgico como es el de utilizar el
conocimiento del comportamiento de una variable para obtener informacin sobre otra variable. Por
ejemplo, puede predecirse el resultado que obtendr un estudiante en su examen final, basados en el
conocimiento de las calificaciones promedio de sus exmenes parciales, o predecir la preferencia de los
estudiantes por profesiones cientficas, conociendo los promedios de sus calificaciones en los estudios
escolares.
En todos los casos de regresin existe una dependencia funcional entre las variables. En el caso de dos
variables, siendo una de ellas (X) variable independiente y la otra (Y) la dependiente, se habla de
regresin de Y sobre X; Por ejemplo, los ingenieros forestales utilizan la regresin de la altura de los
rboles sobre su dimetro, lo cual significa que midiendo el dimetro (variable independiente) y
reemplazando su valor en una relacin definida segn la clase de rbol se obtiene la altura, y aun sin
necesidad de clculos aprecian la altura utilizando grficas de la funcin de dependencia, altura =
funcin del dimetro.
2.1) PRINCIPIO DE LOS MNIMOS CUADRADOS
2.1.1) LA RECTA DE LOS MNIMOS CUADRADOS
Se llama lnea de mejor ajuste y se define como la lnea que hace mnima la suma de los cuadrados de
las desviaciones respecto a ella de todos los puntos que corresponden a la informacin recogida.

UMG sede Chiquimula, Estadistica aplicada a la Investigacin de Mercados, Lic. Alex Martnez G.

12