Вы находитесь на странице: 1из 13

1

3. Correlacin
Introduccin
En los negocios, no todo es el producto, pueden existir factores relacionados o externos que
modifiquen cmo se distribuye un producto.
De igual manera, la estadstica no todo est supeditado al uso de una variable, tambin existen
tcnicas para analizar ms de una variable de forma simultnea e interrelacionada.
Existen varias tcnicas para hacer anlisis de la relacin entre dos variables, algunas de ellas pueden
ser tan simples como el diagrama de dispersin; universalmente aceptada en todo tipo de empresas,
hasta la regresin lineal simple o mltiple.

Diagrama de dispersin
Es la presentacin grfica que muestra la relacin de dos variables. Al estar involucradas dos variables,
una de ellas se considera la independiente y la otra la dependiente. Al igual que en Matemticas, la
independiente corresponde a la variable X y la dependiente corresponde a la variable Y.
Ver la tendencia que muestra el diagrama puede dar una idea al usuario de cul es la correlacin que
se puede esperar en la muestra y dependiendo del caso proyectarlo hacia la poblacin.

Ejemplo 3.1
1. La Empresa MOTORSI se da mantenimiento preventivo a vehculos turismo. Se tom u na
muestra para evaluar si el valor del pago tiene alguna relacin con la antigedad de los
clientes. Se tom una muestra de 9 clientes que visitaron MOTORSI la semana pasada y a
travs de un diagrama de dispersin evaluar su comportamiento. El resultado de la
muestra es el siguiente:

AOS FACTURACIN
1
3,000
2
4,000
5
8,000
4
8,000
2
5,000
3
5,500
4
7,000
2
6,000
5
10,000

Desarrollo

En un plano cartesiano se grafica en el eje X la antigedad del cliente y en el eje Y el


valor facturado en la ltima visita. Utilizando Excel, se muestra la siguiente grfica.

Se puede observar que mientras ms


antigedad tienen los clientes, es mayor el
valor de la facturacin.

Lo ms usado para el trazo de las grficas son los paquetes estadstico; el ms comn es Microsoft
Excel.
COMANDO EN EXCEL
Para para elaborar un Diagrama de dispersin en Excel:
1) Insertar

Grfico de dispersin (x,y)

Anlisis de correlacin
El anlisis de correlacin es el estudio de la relacin entre variables numricas. Es lo mismo que se
observ en el diagrama de dispersin con base numrica.
ANLISIS DE CORRELACIN: Grupo de tcnicas para medir la asociacin entre dos
variables. (Lind |Marchal |Wathen, 2008, p.459).

El primer paso para hacer el anlisis de correlacin es el clculo del coeficiente de correlacin, tcnica
descubierta por Carl Pearson, que estandariza la medida de las variables hasta crear un intervalo que
oscila entre -1 y 1.

Coeficiente de correlacin
Es la tcnica para probar la fuerza de la relacin entre dos variables continuas, en la cual una es
independiente y la otra es dependiente.
El coeficiente de correlacin es conocido como r-Pearson o simplemente r, que puede adoptar un

valor entre -1 y 1. Las caractersticas de un coeficiente de correlacin son:


a. = 1 = 1
b. = 0
c. > 0
d. < 0

Correlacin perfecta.
No hay relacin lineal
Correlacin positiva
Correlacin negativa

Al generar un diagrama de dispersin, con variables continuas, se puede visualizar la tendencia que
tendra una recta que haya sido creada a travs del anlisis de todos los puntos del diagrama. Si la
correlacin es positiva, la tendencia orienta el diagrama con una recta positiva y creciente y en la
relacin negativa, la tendencia la orienta hacia una recta negativa o decreciente.

COEFICIENTE DE CORRELACIN: Medida de la fuerza de la relacin lineal entre dos


variables. (Lind |Marchal |Wathen, 2008, p.462).
La frmula del coeficiente de correlacin es una combinacin de Media aritmtica, desviacin estndar
y el tamao de la muestra.

( )( )
( 1)

Donde:

: Cada una de las observaciones de la variable independiente.


: Cada una de las observaciones de la variable dependiente
: Media aritmtica muestral de la variable independiente
: Media aritmtica muestral de la variable dependiente
: Desviacin estndar de la variable independiente
: Desviacin estndar de la variable dependiente
: Tamao de la muestra

A manera de repaso, las frmulas de la media aritmtica y la desviacin estndar son:


=

( )2
( 1)

Ejemplo 3.2
1. En la empresa Sara se venden unidades de aire acondicionado; se ha observado que a
mayor cantidad de llamadas de los vendedores durante el mes, mayor cantidad de
compra de unidades de aire acondicionado.
Se tom una muestra de las ventas realizadas por 6 de los vendedores de planta y se
quiere comparar la cantidad de llamadas realizadas durante el mes y las ventas
facturadas.
Los resultados de la muestra fueron los siguientes:
AGENTE

UNIDADES
LLAMADAS VENDIDAS

Toms Garca

20

30

Jos Girn

40

60

Gregorio Figueroa

30

60

Carlos Ramrez

10

40

Miguel Godoy

20

50

Marcos Reyes

20

30

Calcular el coeficiente de correlacin


a. Diagrama de dispersin:
El diagrama de dispersin en Excel se visualiza de la siguiente manera:

b. Media aritmtica de ambas muestras


+ + + + +
=

=
= .

+ + + + +
=
= .

c. Variacin y Desviacin estndar de ambas muestras

UNIDADES
LLAMADAS VENDIDAS

AGENTE
Toms Garca

20

30 (20 - 23) 2 =


-3 (20 - 45) 2 = -15

45

225

Jos Girn

40

60 (40 - 23) =

17 (60 - 45) 2 =

15

255

289

225

Gregorio Figueroa

30

60 (30 - 23) 2 =

7 (60 - 45) 2 =

15

105

49

225

-5

65

169

25

-15

25

-3 (30 - 45) 2 = -15

45
500

9
534

225
950

Carlos Ramrez

10

40 (10 - 23) = -13 (40 - 45) =

Miguel Godoy

20

50 (20 - 23) 2 =

Marcos Reyes

20
140

30 (20 - 23) 2 =
270

-3 (50 - 45) 2 =

534
=
= 106.7 = 10.3
61

950
= 190.0 = 13.8
61

d. Coeficiente de correlacin

( )( )
( 1)

500
(6 1)(10.3)(13.8)

500
= 0.702
712.25

La correlacin entre ambas variables es positiva y fuerte.


El hacer llamadas telefnicas a los posibles clientes nos llev a un incremento en las
ventas.

Coeficiente de determinacin
El obtener una respuesta como moderada, fuerte o perfecta no dice mucho en trminos numricos, ya
que se puede interpretar con una respuesta ambigua. Para apoyar la respuesta, se utiliza el Coeficiente
de determinacin que proporciona un resultado en porcentaje, el cual es ms fcil de interpretar. Se
calcula elevando al cuadrado el coeficiente de correlacin.

COEFICIENTE DE DETERMINACIN: Proporcin de la variacin total en la variable


dependiente Y que se explica, o contabiliza, por la variacin en la variable independiente
X. (Lind |Marchal |Wathen, 2008, p.465).

Ejemplo 3.3
1. Calcular el coeficiente de determinacin de una muestra de dos variables, cuyos
coeficiente de correlacin es 0.702

Desarrollo

= (. )
= .
Existe una correlacin de 49% entre ambas variables.
2. En una muestra de 5 elementos, los datos de la variable independiente y la
dependiente se obtuvieron de la siguiente forma:

X
Y

6
4

5
6

3
6

6
7

Calcular el coeficiente de determinacin.

Desarrollo

a) Diagrama de dispersin

b) Media aritmtica de X y de Y
+ + + +
=

=
=

+ + + +
=
=

c) Variacin y varianza de X y Y

10
7

8
3
7
11
35

5
7
7


( 6 - 7 )2 =

-1 ( 4 - 6 ) 2 =

( - 7) =
( 3- 7) =
( 7- 7) =

7 ( 11 - 7 ) =
30

-2

-1

-1

-4

16

-4 ( 7 - 6 ) =

1 ( 5- 6) =

( 7- 6) =
4 ( 7- 6) =

4
1

1
16
34

1
8

=
= . = .

=
d) Coeficiente de correlacin
=

= = .

=
= .
( )(. )(. )

Existe relacin positiva dbil entre ambas variables.


e) Coeficiente de determinacin
= (. ) = .
Solo se puede suponer un 0.4% de correlacin, lo que indica que la variable X no influye
en el resultado de la variable Y.

Prueba de la importancia del coeficiente de correlacin


Aunque un coeficiente de determinacin sea alto, el resultado hace referencia a una muestra; para
inferir sobre los resultados de la poblacin, se recurre a la prueba de hiptesis; es decir, se somete el
coeficiente de correlacin a una prueba con el estadstico t.
El fin de la prueba es llegar a concluir que el coeficiente de correlacin de la poblacin es 0; es decir,
que las variables no se relacionan. La hiptesis adecuada para este tipo de es:
0 : = 0
: 0

Es de hacer notar que la hiptesis nula es una igualdad, por lo tanto, la prueba se debe realizar para 2
colas. La frmula del estadstico de prueba es:
=

( 2)
1 2

Si bien es cierto, la prueba se realiza con una sola muestra;


pero, el anlisis es con 2 variables, as que se hace para n-2
grados de libertad (1 grado de libertad por cada variable).

Para probar la importancia del coeficiente de correlacin en la poblacin, se prueba la hiptesis


utilizando el mtodo de los 5 pasos.

Ejemplo 3.4
1. En la empresa Sara se venden unidades de aire acondicionado; se ha observado que a mayor
cantidad de llamadas de los vendedores durante el mes, mayor cantidad de compra de
unidades de aire acondicionado.
Se tom una muestra de las ventas realizadas por 6 de los vendedores de planta y se quiere
comparar la cantidad de llamadas realizadas durante el mes y las ventas facturadas; el
coeficiente de correlacin obtenido fue de 0.702. Se va a probar si existe relacin entre las
variables con un nivel de confianza del 95%.
AGENTE

UNIDADES
LLAMADAS VENDIDAS

Toms Garca

20

30

Jos Girn

40

60

Gregorio Figueroa

30

60

Carlos Ramrez

10

40

Miguel Godoy

20

50

Marcos Reyes

20

30

Desarrollo

PASO 1: Hiptesis nula y alternativa


: =
:
PASO 2: Nivel de significancia
= .
PASO 3: Estadstico de prueba
=
PASO 4: Regla de decisin
: =
( )
= .
=
= =

( )

= 2.776

PASO 5: Toma de decisin


= .
=
=
=

( )

. ( )

(. )
.
=
.
= .

La hiptesis nula se rechaza


La correlacin de la poblacin no es 0
Existe relacin entre las variables

2. El departamento de produccin de Celltronics International desea explorar la relacin entre el


nmero de empleados que trabajan en una lnea de ensamble parcial y el nmero de
unidades producido. Como experimento, se asign a dos empleados al ensamble parcial. Su
desempeo fue de 15 productos durante un periodo de una hora. Despus, cuatro empleados
hicieron los ensambles y su nmero fue de 25 durante un periodo de una hora. El conjunto
completo de observaciones pareadas se muestra a continuacin.

10

a) Trace un diagrama de dispersin.


b) Con base en el diagrama de dispersin, parece
haber alguna relacin entre el nmero de
ensambladores y la produccin?
c) Calcular el coeficiente de correlacin
d) Calcular el coeficiente determinacin
e) Probar la importancia del coeficiente de
correlacin con un nivel de confianza del 95%.

Nmero de
ensambladores
2
4
1
5
3

Produccin
en una hora
(unidades)
15
25
10
40
30

Desarrollo

a) Diagrama de dispersin

b)
c)

Con base en el diagrama de dispersin, parece que a mayor cantidad de ensambladores,


mayor produccin.
Coeficiente de correlacin
- Media aritmtica de cada muestra
++++
=

+ + + +
=

- Variacin y desviacin estndar de ambas muestras


Nmero de
ensambladores
(X)
2
4
1
5
3
3

Produccin
en una hora
(Y)
15
25
10
40
30
24

-1
1
-2
2
0

-9
1
-14
16
6

9
1
28
32
0
70

1
1
4
4
0
10

10
=
= 2.5 = 1.58
51


81
1
196
256
36
570

11

=
= .
( )(. )(. ) .

Correlacin negativa
Perfecta

Correlacin positiva
Moderada

Correlacin negativa
Moderada
Correlacin
negativa fuerte
-1

Correlacin positiva
Perfecta

No hay relacin
entre las variables

Correlacin
negativa Dbil
-0.5

Correlacin
positiva Dbil
0

Correlacin
positiva Fuerte
0.5

1
0.93

Existe una correlacin positiva fuerte.


d) Coeficiente de determinacin
= (. ) = .
Se puede suponer que hay una correlacin del 86% entre ambas variables; lo que indica
que la variable X influye en la variable Y.
e) Prueba de la importancia del coeficiente de correlacin
PASO 1: Hiptesis nula y alternativa
: =
:
PASO 2: Nivel de significancia
= .
PASO 3: Estadstico de prueba
=
PASO 4: Regla de decisin
: =
( )
= .
=
= =

= 2.776

( )

12

PASO 5: Toma de decisin


= .
=
=
=

( )

. ( )

(. )
.
=
.
= .

La hiptesis nula se rechaza


Existe relacin entre el nmero de ensambladores y la produccin por hora

Ejercicio
1. Se dan las siguientes hiptesis
0 : 0
: > 0
Una muestra aleatoria de 12 observaciones pareadas indic una correlacin de 0.32. Se puede
concluir que la correlacin en la poblacin es mayor que cero? Utilice 0.05 como nivel de
significancia.
2. Se dan las siguientes hiptesis
0 : 0
: > 0
Una muestra aleatoria de 15 observaciones pareadas tiene una correlacin de -0.46. Se puede
concluir que la correlacin en la poblacin es menor que cero? Con un nivel de significancia de
0.05.

13

3. La Refinera de Puesto Corts estudia la relacin entre el precio de la gasolina y el nmero de


galones vendidos. Para una muestra de 20 gasolineras el martes pasado, la correlacin fue de 0.78.
con un nivel de significancia de 0.01, Ser mayor que cero la correlacin en la poblacin?
4. Un estudio de 20 instituciones financieras en todo el mundo revelo que la correlacin entre sus

activos y las utilidades antes del pago de impuestos es 0.86. Con un nivel de significancia de 0.05,
se puede concluir que hay una correlacin positiva en la poblacin?
5. El departamento de Servicios Estudiantiles de una Universidad local desea demostrar la relacn
entre al nmero de cervezas que consume un estudiante y su contenido de alcohol en la sangre.
Una muestra de 9 estudiantes particip en un estudio en el cual a cada uno se le asign, al azar, un
nmero de latas de cerveza de 12 onzas que deba beber. 30 minutos despus de consumir su
nmero asignado de cervezas, un miembro del equipo evaluador midi su contenido de alcohol en
la sangre. La informacin muestral fue la siguiente:

Estudiante

a.
b.
c.
d.

Cervezas

Contenido
de alcohol
en la sangre

1
6
0.10
2
7
0.09
3
7
0.09
4
4
0.10
5
5
0.10
6
3
0.07
7
3
0.10
8
6
0.12
9
6
0.09
Elaborar el diagrama de dispersin
Determinar el coeficiente de correlacin
Establecer el coeficiente de determinacin
Con un nivel de significancia de 0.01, Es razonable concluir que hay una relacin positiva en la
poblacin entre el nmero de cervezas consumidas y el contenido de alcohol en la sangre?

BIBLIOGRAFA
o

Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadstica Aplicada a los Negocios y la
Economa. Mxico: McGraw-Hill

David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadstica para Administracin. (4
edicin). Naucalpan de Jurez, Mxico.: Pearson Prentice Hall

Вам также может понравиться