Академический Документы
Профессиональный Документы
Культура Документы
3. Correlacin
Introduccin
En los negocios, no todo es el producto, pueden existir factores relacionados o externos que
modifiquen cmo se distribuye un producto.
De igual manera, la estadstica no todo est supeditado al uso de una variable, tambin existen
tcnicas para analizar ms de una variable de forma simultnea e interrelacionada.
Existen varias tcnicas para hacer anlisis de la relacin entre dos variables, algunas de ellas pueden
ser tan simples como el diagrama de dispersin; universalmente aceptada en todo tipo de empresas,
hasta la regresin lineal simple o mltiple.
Diagrama de dispersin
Es la presentacin grfica que muestra la relacin de dos variables. Al estar involucradas dos variables,
una de ellas se considera la independiente y la otra la dependiente. Al igual que en Matemticas, la
independiente corresponde a la variable X y la dependiente corresponde a la variable Y.
Ver la tendencia que muestra el diagrama puede dar una idea al usuario de cul es la correlacin que
se puede esperar en la muestra y dependiendo del caso proyectarlo hacia la poblacin.
Ejemplo 3.1
1. La Empresa MOTORSI se da mantenimiento preventivo a vehculos turismo. Se tom u na
muestra para evaluar si el valor del pago tiene alguna relacin con la antigedad de los
clientes. Se tom una muestra de 9 clientes que visitaron MOTORSI la semana pasada y a
travs de un diagrama de dispersin evaluar su comportamiento. El resultado de la
muestra es el siguiente:
AOS FACTURACIN
1
3,000
2
4,000
5
8,000
4
8,000
2
5,000
3
5,500
4
7,000
2
6,000
5
10,000
Desarrollo
Lo ms usado para el trazo de las grficas son los paquetes estadstico; el ms comn es Microsoft
Excel.
COMANDO EN EXCEL
Para para elaborar un Diagrama de dispersin en Excel:
1) Insertar
Anlisis de correlacin
El anlisis de correlacin es el estudio de la relacin entre variables numricas. Es lo mismo que se
observ en el diagrama de dispersin con base numrica.
ANLISIS DE CORRELACIN: Grupo de tcnicas para medir la asociacin entre dos
variables. (Lind |Marchal |Wathen, 2008, p.459).
El primer paso para hacer el anlisis de correlacin es el clculo del coeficiente de correlacin, tcnica
descubierta por Carl Pearson, que estandariza la medida de las variables hasta crear un intervalo que
oscila entre -1 y 1.
Coeficiente de correlacin
Es la tcnica para probar la fuerza de la relacin entre dos variables continuas, en la cual una es
independiente y la otra es dependiente.
El coeficiente de correlacin es conocido como r-Pearson o simplemente r, que puede adoptar un
Correlacin perfecta.
No hay relacin lineal
Correlacin positiva
Correlacin negativa
Al generar un diagrama de dispersin, con variables continuas, se puede visualizar la tendencia que
tendra una recta que haya sido creada a travs del anlisis de todos los puntos del diagrama. Si la
correlacin es positiva, la tendencia orienta el diagrama con una recta positiva y creciente y en la
relacin negativa, la tendencia la orienta hacia una recta negativa o decreciente.
( )( )
( 1)
Donde:
( )2
( 1)
Ejemplo 3.2
1. En la empresa Sara se venden unidades de aire acondicionado; se ha observado que a
mayor cantidad de llamadas de los vendedores durante el mes, mayor cantidad de
compra de unidades de aire acondicionado.
Se tom una muestra de las ventas realizadas por 6 de los vendedores de planta y se
quiere comparar la cantidad de llamadas realizadas durante el mes y las ventas
facturadas.
Los resultados de la muestra fueron los siguientes:
AGENTE
UNIDADES
LLAMADAS VENDIDAS
Toms Garca
20
30
Jos Girn
40
60
Gregorio Figueroa
30
60
Carlos Ramrez
10
40
Miguel Godoy
20
50
Marcos Reyes
20
30
=
= .
+ + + + +
=
= .
UNIDADES
LLAMADAS VENDIDAS
AGENTE
Toms Garca
20
30 (20 - 23) 2 =
-3 (20 - 45) 2 = -15
45
225
Jos Girn
40
60 (40 - 23) =
17 (60 - 45) 2 =
15
255
289
225
Gregorio Figueroa
30
60 (30 - 23) 2 =
7 (60 - 45) 2 =
15
105
49
225
-5
65
169
25
-15
25
45
500
9
534
225
950
Carlos Ramrez
10
Miguel Godoy
20
50 (20 - 23) 2 =
Marcos Reyes
20
140
30 (20 - 23) 2 =
270
-3 (50 - 45) 2 =
534
=
= 106.7 = 10.3
61
950
= 190.0 = 13.8
61
d. Coeficiente de correlacin
( )( )
( 1)
500
(6 1)(10.3)(13.8)
500
= 0.702
712.25
Coeficiente de determinacin
El obtener una respuesta como moderada, fuerte o perfecta no dice mucho en trminos numricos, ya
que se puede interpretar con una respuesta ambigua. Para apoyar la respuesta, se utiliza el Coeficiente
de determinacin que proporciona un resultado en porcentaje, el cual es ms fcil de interpretar. Se
calcula elevando al cuadrado el coeficiente de correlacin.
Ejemplo 3.3
1. Calcular el coeficiente de determinacin de una muestra de dos variables, cuyos
coeficiente de correlacin es 0.702
Desarrollo
= (. )
= .
Existe una correlacin de 49% entre ambas variables.
2. En una muestra de 5 elementos, los datos de la variable independiente y la
dependiente se obtuvieron de la siguiente forma:
X
Y
6
4
5
6
3
6
6
7
Desarrollo
a) Diagrama de dispersin
b) Media aritmtica de X y de Y
+ + + +
=
=
=
+ + + +
=
=
c) Variacin y varianza de X y Y
10
7
8
3
7
11
35
5
7
7
( 6 - 7 )2 =
-1 ( 4 - 6 ) 2 =
( - 7) =
( 3- 7) =
( 7- 7) =
7 ( 11 - 7 ) =
30
-2
-1
-1
-4
16
-4 ( 7 - 6 ) =
1 ( 5- 6) =
( 7- 6) =
4 ( 7- 6) =
4
1
1
16
34
1
8
=
= . = .
=
d) Coeficiente de correlacin
=
= = .
=
= .
( )(. )(. )
Es de hacer notar que la hiptesis nula es una igualdad, por lo tanto, la prueba se debe realizar para 2
colas. La frmula del estadstico de prueba es:
=
( 2)
1 2
Ejemplo 3.4
1. En la empresa Sara se venden unidades de aire acondicionado; se ha observado que a mayor
cantidad de llamadas de los vendedores durante el mes, mayor cantidad de compra de
unidades de aire acondicionado.
Se tom una muestra de las ventas realizadas por 6 de los vendedores de planta y se quiere
comparar la cantidad de llamadas realizadas durante el mes y las ventas facturadas; el
coeficiente de correlacin obtenido fue de 0.702. Se va a probar si existe relacin entre las
variables con un nivel de confianza del 95%.
AGENTE
UNIDADES
LLAMADAS VENDIDAS
Toms Garca
20
30
Jos Girn
40
60
Gregorio Figueroa
30
60
Carlos Ramrez
10
40
Miguel Godoy
20
50
Marcos Reyes
20
30
Desarrollo
( )
= 2.776
( )
. ( )
(. )
.
=
.
= .
10
Nmero de
ensambladores
2
4
1
5
3
Produccin
en una hora
(unidades)
15
25
10
40
30
Desarrollo
a) Diagrama de dispersin
b)
c)
+ + + +
=
Produccin
en una hora
(Y)
15
25
10
40
30
24
-1
1
-2
2
0
-9
1
-14
16
6
9
1
28
32
0
70
1
1
4
4
0
10
10
=
= 2.5 = 1.58
51
81
1
196
256
36
570
11
=
= .
( )(. )(. ) .
Correlacin negativa
Perfecta
Correlacin positiva
Moderada
Correlacin negativa
Moderada
Correlacin
negativa fuerte
-1
Correlacin positiva
Perfecta
No hay relacin
entre las variables
Correlacin
negativa Dbil
-0.5
Correlacin
positiva Dbil
0
Correlacin
positiva Fuerte
0.5
1
0.93
= 2.776
( )
12
( )
. ( )
(. )
.
=
.
= .
Ejercicio
1. Se dan las siguientes hiptesis
0 : 0
: > 0
Una muestra aleatoria de 12 observaciones pareadas indic una correlacin de 0.32. Se puede
concluir que la correlacin en la poblacin es mayor que cero? Utilice 0.05 como nivel de
significancia.
2. Se dan las siguientes hiptesis
0 : 0
: > 0
Una muestra aleatoria de 15 observaciones pareadas tiene una correlacin de -0.46. Se puede
concluir que la correlacin en la poblacin es menor que cero? Con un nivel de significancia de
0.05.
13
activos y las utilidades antes del pago de impuestos es 0.86. Con un nivel de significancia de 0.05,
se puede concluir que hay una correlacin positiva en la poblacin?
5. El departamento de Servicios Estudiantiles de una Universidad local desea demostrar la relacn
entre al nmero de cervezas que consume un estudiante y su contenido de alcohol en la sangre.
Una muestra de 9 estudiantes particip en un estudio en el cual a cada uno se le asign, al azar, un
nmero de latas de cerveza de 12 onzas que deba beber. 30 minutos despus de consumir su
nmero asignado de cervezas, un miembro del equipo evaluador midi su contenido de alcohol en
la sangre. La informacin muestral fue la siguiente:
Estudiante
a.
b.
c.
d.
Cervezas
Contenido
de alcohol
en la sangre
1
6
0.10
2
7
0.09
3
7
0.09
4
4
0.10
5
5
0.10
6
3
0.07
7
3
0.10
8
6
0.12
9
6
0.09
Elaborar el diagrama de dispersin
Determinar el coeficiente de correlacin
Establecer el coeficiente de determinacin
Con un nivel de significancia de 0.01, Es razonable concluir que hay una relacin positiva en la
poblacin entre el nmero de cervezas consumidas y el contenido de alcohol en la sangre?
BIBLIOGRAFA
o
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadstica Aplicada a los Negocios y la
Economa. Mxico: McGraw-Hill
David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadstica para Administracin. (4
edicin). Naucalpan de Jurez, Mxico.: Pearson Prentice Hall