Вы находитесь на странице: 1из 23

ANLISIS ESTADSTICO DE DOS VARIABLES CUANTITATIVAS

Nivel de Medicin: Intervalo, Razn

La asociacin entre variables presenta dos aspectos distintos pero


estrechamente relacionados:

ANLISIS DE REGRESIN ANLISIS DE CORRELACIN


SIMPLE SIMPLE

Establece la naturaleza de la Determina el grado o la


relacin entre variables, fuerza de la relacin o
estudia la relacin entre las asociacin entre las
variables y por tanto variables
proporciona un mecanismo
de prediccin o pronstico
Variable
Variable
Independiente
Tipos de Variables Dependiente
(X)
(Y)
(determinstica, es
aleatoria
decir no
aleatoria.)
Ejemplos

X: Nmero de llamadas telefnicas realizadas por un vendedor


promocionando un producto.
Y: Unidades vendidas por el vendedor.

X: Tiempo que dedica un estudiante a una materia.


Y : Evaluacin que obtiene el estudiante en la materia.
GRFICOS DE DISPERSIN
Dadas dos variables X y Y tomadas sobre el mismo elemento de la
poblacin, el diagrama de dispersin es simplemente un grfico
de dos dimensiones, donde en un eje (la abscisa) se grafica una
variable (independiente), y en el otro eje (la ordenada) se grafica
la otra variable (dependiente). Si las variables estn
correlacionadas, el grfico mostrara algn nivel de correlacin
(tendencia) entre las dos variables. Si no hay ninguna correlacin,
el grfico presentara una figura sin forma, una nube de puntos
dispersos en el grfico.
FORMAS TPICAS DE LOS DIAGRAMAS DE
DISPERSIN ESTADSTICA
CORRELACIN ENTRE VARIABLES
CUANTITATIVAS

Los componentes fundamentales de una


relacin entre dos variables cuantitativas son:

La Fuerza El Sentido La Forma


CORRELACIN ENTRE VARIABLES CUANTITATIVAS
La fuerza mide el grado en que los pares de
observaciones quedan representados en una
lnea. Si la nube de observaciones es estrecha y
alargada, una lnea recta representar
adecuadamente a la nube de puntos y a la
relacin y por tanto sta ser fuerte.

El sentido de la relacin se refiere a cmo varan


los valores de B con respecto a A. Si al crecer los
valores de la variable A lo hacen los de B, ser
una relacin positiva o directa. Si al aumentar A,
disminuye B, ser una relacin negativa o
inversa.

La forma establece el tipo de lnea a emplear


para definir el mejor ajuste. Se pueden emplear
Si la nube de puntos parece ajustarse en torno a
alguna curva (es
decir, si hay correlacin), la forma de dicha curva nos
indica el tipo
de correlacin. Si la nube de puntos parece
agruparse en torno a
una recta, diremos que hay correlacin lineal, o que
las variables
estn linealmente
120 correlacionadas.
100
80
60
40
20
0
0 100 200 300 400
_____________________Relacin entre variables
cuantitativas

Objetivo del Anlisis de


Regresin
El anlisis de regresin se utiliza con el propsito de hacer predicciones, y su
objetivo es el desarrollo de un modelo estadstico que pueda ser utilizado para
predecir los valores de una variable de respuesta o dependiente basados en los
valores de una variable independiente o explicativa.

En regresin los datos provienen de observaciones efectuadas en dos variables,


las distribuciones formadas para tales conjuntos de datos se denominan
bivariantes o bivariadas.
Representacin Grfica de una Distribucin Bidimensional.

Sean las siguientes Observaciones: X1 , X2 Xn


Y1 , Y2 Yn

Diagrama de Dispersin
Y

NUBE DE PUNTOS

Y1 (X1 , Y1)

X1 X
En el caso de que el Diagrama de Dispersin indique una relacin de tipo lineal
muchas son las rectas que se pueden ajustar a la nube de puntos.

Dado un conjunto de datos bivariados El Mtemtico


(x,y) Francs Adrian
Cmo se obtiene la recta de mejor Legendre (s.XIX)
ajuste? Defini el mtodo
que implica
Cmo elegir una recta de tal modo que encontrar la Lnea
los errores o diferencias que se generan Recta que mejor se
entre el valor real y el valor obtenido a ajuste a los datos
travs de la recta ajustada sean
mnimos?

MTODO DE LOS MNIMOS CUADRADOS Simblicament


e: 2
n
Posee la propiedad de que la suma de los
cuadrados de las desviaciones de los
y
i 1
i y
valores reales de Y o las distancias y i Valor Observado de y
verticales de los puntos a la lnea recta
sea mnima . y Valor Calculado de y
(MMC con el valor correspondie nte de x para y )
REGRESION LINEAL SIMPLE
Finalidad
Modelo
Estimar los valores de y (variable
dependiente o de respuesta) a y x
partir de los valores de x (variable
independiente o predictora o
explicativa) y
y


Ordenada en
el origen
=tg
(pendiente)
a

x
Y
+bx
a
=
Y2 (X2 , Y2)

e2+
(X2 , 2)

(X1 , 1)

e1-
Y1
(X1 , Y1)

X1 X2 X

Supongase que =a+bx es la ecuacin de una recta, donde


() representa el valor predicho (Y) que corresponde a un
valor particular de (X). El criterio de los MINIMOS
CUADRADOS requiere que se encuentren constantes a y b
tales que la suma sea tan pequea como
2
sea
n
posible.
y y i
i 1
Correlacin negativa
X
0 Y
10 = 0.134
20 X + 2.122
30 40 50 60 70 80 90
8X
0
0 2 Y =4 X 6 10 12 14 16
0

2
2

4 4

6 6
Y

Y
8

10 10

12 12

14 14

-1 r 0
16
r=-1
16

Correlacin positiva
16 Y = 0.134 X + 2.122 16 Y=X

0 r +1 r=+1
14 14

12 12

10 10

Y
8
Y

6 6

4 4

2 2

0 0
0 10 20 30 40 50 60 70 80 90 0 2 4 6 8 10 12 14 16
X X
16 Y = 0.093 X + 4.335 8 Y=4
14
7

12
6

10 5
Y

Y
4

6 3

4 2

2 1

0 0
20 25 30 35 40 45 50 55 60 20 25 30 35 40 45 50 55 60
X X

16

14
#DIV/0!
r=0
12

10

Ausencia de correlacin
Y

0
0 1 2 3 4 5 6
X
EL COEFICIENTE DE CORRELACIN
LINEAL DE PEARSON

El Coeficiente de Correlacin Lineal de Pearson es


un ndice estadstico que permite medir la fuerza
de la relacin lineal entre dos variables. Su
resultado es un valor que flucta entre 1
(correlacin perfecta de sentido negativo) y +1
(correlacin perfecta de sentido positivo). Cuanto
ms cercanos al 0 sean los valores, indican una
mayor debilidad de la relacin o incluso ausencia
de correlacin entre las dos variables.
Ejemplo
Una compaa de seguros considera que el nmero
de vehculos (y) que circulan por una determinada
autopista a ms de 120 km/h , puede ponerse en
funcin del nmero de accidentes (x) que ocurren
en ella. Durante 5 das obtuvo los siguientes
resultados:

a) Calcula la recta de regresin lineal de y sobre x


b) El coeficiente de correlacin lineal y de determinacin
Es buena la prediccin?
c) Si se produjeron 6 accidentes, cuntos vehculos
podemos suponer que circulaban por la autopista a ms de
120 km/h?
d) Si circulaban 12 vehculos por la autopista a ms de 120
km/h estimar el nmero de accidentes.
x: nmero
de
accidentes
Y: nmero
de vehculos
que circulan
a mas de
120 km/h
USO DE LA CALCULADORA

SHIF 1
Resumiendo r como el grado de
correlacin o asociacin entre las
variables

Вам также может понравиться