Вы находитесь на странице: 1из 6

CAPTULO IV

ANLISIS DESCRIPTIVO DE LA RELACIN ENTRE


VARIABLES

Covarianza
Correlacin
Regresin lineal
Regresin no lineal

4.1 COVARIANZA

La covarianza es una medida de asociacin lineal entre dos variables que resume la
informacin existente en un grfico de dispersin. Si la tendencia es lineal sea positiva o
negativa la covarianza ser grande, en caso de que tienda a cero el valor de la covarianza
indicar la independencia o una relacin no lineal entre dichas variables.
La frmula para calcular la covarianza de datos no agrupados es:
( x x )( y y )
cov( x, y )
n
Desventaja
La covarianza depende de las unidades de las variables, por lo que nos permite
comparar la relacin entre distintos pares de variables medidas en diferentes unidades. Para
evitar esta dificultad se usa el coeficiente de correlacin.
4.2 CORRELACIN

El diccionario de trminos estadsticos dice: "En su sentido general, correlacin denota la


interdependencia entre datos cuantitativos o cualitativos". En este sentido, incluira la
asociacin de atributos clasificados conforme a mltiples caractersticas. El concepto es
bastante y puede ser extendido a ms de dos variables aleatorias.
Podemos decir tambin que la correlacin estudia el grado de asociacin de las variables
X, Y, permite relacionar la causa y efecto que existe entre estas variables.
Anlisis bivariado
El anlisis bivariado, es un anlisis estadstico cuyo objetivo principal es el hallazgo de una
relacin posible entre dos variables, para lo cual se usa dos tcnicas: la regresin lineal
para efectos de la prediccin, y el anlisis de la correlacin para medir la fortaleza de la
asociacin entre dos variables.
Diagrama de dispersin.
Es una grfica en dos dimensiones, en la cual es posible el registro simultneo de los
valores de dos variables que estn asociados a un hecho o evento. Una utilidad prctica es
que permite visualizar rpidamente si existe relacin entre las variables, cada una de las
cuales se registran en sendas coordenadas cartesianas

CLASES DE CORRELACIN.
Positiva
Negativa

Por el signo

Por el Valor o Signo

Perfecta
Muy Alta
Alta
Moderada
Baja
Muy Baja
Nula

Por el nmero
de variables

Simple (dos variables)


Mltiple (varias variables)

Existen otras clasificaciones de acuerdo a criterios como sn: por su direccin, tipo de
variables, etc.
Coeficiente de correlacin lineal ( r )
Se denomina coeficiente de correlacin o coeficiente de asociacin a los ndices numricos
obtenidos que se logran haciendo operaciones estadsticas que expresan con exactitud el
grado de correlacin que existe entre dos variables. Los valores del coeficiente de
correlacin se encuentran comprendidos entre +1 y -1.
ESCALA DE r DE ACUERDO A SU VALOR

Valor
de
a

0,00
0.01 0,19
0,20 0,39
0,40 0,69
0,70 0,89
0,90 0,99
1,00

Interpretacin
Correlacinnula
Correlacinm
uybaja
Correlacinbaja
Correlacinm
oderada
Correlacinalta
Correlacinm
uyalta
CorrelacinPerfecta

++++++-

TIPOS DE CORRELACIN POR SU SIGNO


Correlacin positiva.
Cuando aumenta el valor de la variable X tambin aumenta el valor de la variable Y,
entonces la correlacin es positiva como vemos en el grfico del cuadro siguiente.
4

Mario Jos Tania Delcy Jeni Sonia

Horas deestudio
(X)

Problemas
resueltos (Y)

Algunas variables que presentan esta relacin positiva


son:
C.I. con rendimiento acadmico
A mayor velocidad, mayor distancia recorrida
A mayor ingreso, mayor ganancia

Nmerodepreguntasresueltos

ALUMNOS

3
2
1
0
0

Horasdeestudio(h)

Pruebadeconcentracin

Correlacin negativa
Si la medida de la variable "X" aumenta y al mismo tiempo la medida de la variable "Y"
disminuye, decimos que la correlacin en la variable X e Y es inversa o negativa (-),
porque mientras una aumenta la otra disminuye.
100
90
ALUMNOS Mario Jos Tania Delcy Jeni Sonia 80
70
Pruebade
60
habilidadmanual 20 17 14 11 5 2
50
(X)
40
Pruebade
30
concentracin(Y) 15 20 34 62 70 87
20
10
0
0

10

15

20

25

Pruebadehabilidadmanual

Algunas variables que presentan estas caractersticas son:


A mayor altura, menor presin.
A mayor velocidad, menor tiempo.
A mayor educacin, menor analfabetismo.
A mayor alimentacin, menor desnutricin.
A mayor inasistencias menor rendimiento.

ALUMNOS
Nmerode
hermanos (X)

Mario Jos Tania Delcy Jeni Sonia

Pruebade
concentracin(Y) 15

20 34 62 70 87

Mencionaremos algunas de las variables, que es


muy probable, no tengan relacin significativa
entre ellas.

Pruebadeconcentracin

Correlacin nula
Cuando r = 0, la correlacin es nula, es decir las variables no tienen relacin entre s, los
siguientes son ejemplos de relacin nula.

100
90
80
70
60
50
40
30
20
10
0

Nmerodehermanos

Grado de instruccin y talla


Nmero de hijos, peso del padre
Edad de la madre, grado de analfabetismo
Tasa de mortalidad infantil, grado de instruccin del padre
Rendimiento acadmico, color preferido
Horas de prctica del ftbol y el rendimiento en estadstica
El nmero de veces que se asiste a la iglesia al ao y el rendimiento acadmico.
La cantidad de llamadas que se hace diariamente por telfono y el nmero de libros
que se posee.

La conclusin de que no existe una relacin lineal significativa no implica que las variables

X , Y no estn relacionados, sino que pueda ser que presenten una relacin no lineal.
El coeficiente de correlacin del momento del producto de Galton-Pearson (r)

Con esta operacin se consigue una medida adimensional, en contraste a la dificultad que
se tena con la covarianza.
cov( x, y )
r r ( x, y )
sx s y

sx es la desviacin estndar de X
sy es la desviacin estndar de Y

donde:

Ejemplo
Presentamos los resultados obtenidos, luego de haber evaluado la habilidad manual (X) y la
concentracin (Y) de un grupo de alumnos de bachillerato. Determine la correlacin e
interprtelo.
ALUMNOS Mario Jos Tania Delcy Jeni Sonia

Pruebade
habilidadmanual
(X)
Pruebade
concentracin(Y)

20

17

14

11

15

20

34

62

70

87

Solucin
Podemos obtener los siguientes estadgrafos necesarios para aplicar la frmula del
coeficiente de correlacin.
x =11,5
y = 48 sx = 6,34 sy = 26,68
y la covarianza
X

X- x

20
17
14
11
5
2
69

15
20
34
62
70
87
288

8,5
5,5
2,5
-0,5
-6,5
-9,5

cov( x, y )
cov( x, y )

Y- y (X- x )(Y- y )
-33
-28
-14
14
22
39

( x x )( y y )

- 280,5
- 154,0
- 35,0
- 7,0
- 143,0
- 370,5
- 990,0

990
165
6

reemplazando todos estadgrafos anteriores tendremos:


cov( x, y )
r r ( x, y )
sx s y
165
r r ( x, y )
(6,34)(26,68)
r 0,98
Podemos indicar que cuanto ms puntaje obtengan en habilidad mental menos puntaje
obtendrn en una prueba de concentracin, debido a que existe una correlacin negativa
muy alta.
El coeficiente de correlacin de Pearson (r)
XY nxy
r
Para datos no agrupados, se hace uso de la frmula:
( X 2 nx 2 )( Y 2 ny 2 )

Donde:
n = nmero de sujetos.
X = valores de la variable X.
Y = valores de la variable Y.
X2 = valores al cuadrado de la variable X.
Y2 = Valores al cuadrado de la variable Y.
XY = producto de los valores de la variable X, Y
x = media aritmtica de la variable X.
y = media aritmtica de la variable Y.
Para poder calcular el valor del coeficiente de correlacin por la frmula de Pearson,
previamente debemos construir una tabla en la que deben estar los valores individuales de
las variables que se analizan.
X
Y
X2
Y2
XY
20
17
14
11
5
2
69

15
400
225
20
289
400
34
196 1156
62
121 3844
70
25
4900
87
4
7569
288 1035 18094

300
340
476
682
350
174
2322

de donde se obtienen
x = 11,5
y = 48
XY nxy
r
( X 2 nx 2 )( Y 2 ny 2 )

2322 6(11,5)(48)
(1035 6(11,5) 2 )(18094 6(48) 2 )

r 0,97
de acuerdo al valor, la correlacin que presentan estas variables es muy alta y negativa.

Tambin podemos calcular r con el siguiente proceso.

Вам также может понравиться