Вы находитесь на странице: 1из 6

09/11/2016

UNIVERSIDAD PRIVADA ANTONIO GUILLERMO


URRELO
LA UNIVERSIDAD DE CAJAMARCA

Introduccin
Muchas veces las decisiones se basan en la relacin entre
dos o ms variables. Ejemplos
Dosis de fertilizantes aplicadas y rendimiento del cultivo.

ESTADSTICA GENERAL
Anlisis de Regresin y Correlacin

La relacin entre la radiacin que reciben los sensores con


la que se predicen los rendimientos por parcelas con los
rendimientos reales observados en dichas parcelas.
Relacin entre tamao de un lote de produccin y horas
hombres utilizadas para realizarlo.
Distinguiremos entre relaciones funcionales y relaciones
estadsticas

Relacin funcional entre dos variables

Figura 1

Se expresa mediante una funcin matemtica.

Relacin funcional perfecta entre dosis y


rendimientos

Se da al existir una relacin exacta entre X y Y, es decir, a


cada valor de X le corresponde un nico valor Y.

Y=f(X)

Ejemplo 1

300

250

Rendimiento

Si X es la variable independiente e Y es la variable


dependiente, una relacin funcional tiene la forma:

200

Rend.

150

100

50

0
0

20

40

60

80

100

120

140

Parcela

Dosis

Rend.(kg/h)

Dosis

1
2
3

75
25
130

150
50
260

Nota: Las observaciones caen exactamente sobre la lnea de


relacin funcional

Figura 2

Relacin estadstica entre dos


variables

Ejemplo 2

Relacin estadstica entre tamao del lote y


horas hombre
1 80

1 60

Horas hombre

A diferencia de la relacin funcional, no es una


relacin perfecta, las observaciones no caen
exactamente sobre la curva de relacin entre
las variables.

1 40

1 20

1 00

80

Horas hombre

60

40

20

Lote de prod.
1
2
3
4
5

Tamao del lote


30
20
60
80
40

Horas hombre
73
50
128
170
87

10

20

30

40

50

60

70

80

90

Tamao del lote

Nota: La mayor parte de los punto no caen directamente sobre


la lnea de relacin estadstica.
Esta dispersin de punto alrededor de la lnea representa la
variacin aleatoria

09/11/2016

Conceptos bsicos
Anlisis de Regresin: Es un procedimiento
estadstico que estudia la relacin funcional
entre variables. Con el objeto de predecir una
en funcin de la/s otra/s.

Variables
independientes
(predictoras,
explicativas exgenas). Son las variables que
proveen las bases para estimar.
Regresin simple: interviene una sola variable
independiente.

Anlisis de Correlacin: Un grupo de tcnicas


estadsticas usadas para medir la intensidad de
la relacin entre dos variables.

Regresin mltiple: intervienen dos o ms


variables independientes..

Diagrama de Dispersin: Es un grfico que


muestra la intensidad y el sentido de la relacin
entre dos variables de inters.

Regresin lineal: la funcin es una combinacin


lineal de los parmetros.

Variable dependiente (respuesta, predicha,


endgena): es la variable que se desea predecir
o estimar.

Regresin no lineal: la funcin que relaciona los


parmetros no es una combinacin lineal.

Coeficiente de correlacin
lineal

Grfico de dispersin
Los diagramas de dispersin no slo muestran la
relacin existente entre variables, sino tambin resaltan
las observaciones individuales que se desvan de la
relacin general. Estas observaciones son conocidas
como outliers o valores inusitados, que son puntos de
los datos que aparecen separados del resto.

El Coeficiente de Correlacin (r) requiere


variables medidas en escala de intervalos o de
proporciones
Vara entre -1 y 1.
Valores de -1 1 indican correlacin perfecta.
Valor igual a 0 indica ausencia de correlacin.
Valores negativos indican una relacin lineal
inversa y valores positivos indican una relacin
lineal directa

Correlacin Positiva Perfecta

Correlacin Negativa Perfecta

10
9
8
7
6
5
4
3
2
1
0

10

10
9
8
7
6
5
4
3
2
1
0
0

10

09/11/2016

Ausencia de Correlacin

10
9
8
7
6
5
4
3
2
1
0

Correlacin Fuerte y Positiva


10
9
8
7
6
Y 5
4
3
2
1
0

10

10

Frmula para el coeficente de


correlacin (r) Pearson

Modelos de Regresin
Un modelo de regresin, es una manera
de expresar dos ingredientes esenciales
de una relacin estadstica:
Una tendencia de la variable dependiente
Y a variar conjuntamente con la variacin
de la o las X de una manera sistemtica.
Una dispersin de las observaciones
alrededor de la curva de relacin
estadstica.

n(X

n(XY ) (X )(Y )
2

) (X ) 2 n Y 2 Y

Modelos de Regresin
Estas dos caractersticas estn implcitas en un
modelo de regresin, postulando que:
En la poblacin de observaciones asociadas
con el proceso que fue muestreado, hay una
distribucin de probabilidades de Y para cada
nivel de X.

Las medias de estas distribuciones varan de


manera sistemtica al variar X.

09/11/2016

Proceso de estimacin de la regresin lineal simple

Anlisis de Regresin

Modelo de regresin

Datos de la muestra

y= 0+ 1x+

Objetivo: determinar la ecuacin de regresin


para predecir los valores de la variable
dependiente (Y) en base a la o las variables
independientes (X).

E(y)= 0+ 1x

Parmetros desconocidos

0. 1

Procedimiento: seleccionar una muestra a


partir de la poblacin, listar pares de datos
para cada observacin; dibujar un diagrama de
puntos para dar una imagen visual de la
relacin; determinar la ecuacin de regresin.

Seccin B
Relacin lineal negativa
Ey

Ey
Lnea de regresin

b0.b1

(Es el valor estimado de la variable Y cuando la variable X = 0)

La pendiente 1
es 0

y=b0+b1x

Y es el valor estimado de Y para distintos X.


a es la interseccin o el valor estimado de Y cuando X=0

Ey

Lnea de regresin

Estadsticos de la muestra

Y= a + bX, donde:

b es

Y
X (b es el coeficiente de
regresin poblacional (pendiente de la lnea recta)) .
el principio de mnimos cuadrados es usado para obtener a
y b:
la pendiente de la lnea, o el cambio promedio de

para cada cambio en una unidad de

La pendiente 1
es positiva

proporcionan estimados

Lnea de regresin

* Ordenada al origen 0

Ejemplo:
La relacin entre el nmero
de aos (x) laborando para
la empresa y el nmero de
ventas logradas (y) por cada
vendedor es la mostrada en
la siguiente tabla.
a) Cuntas ventas pueden
esperarse
en
un
trabajador con 16 aos
de servicio?;
b) b)
Cuntos
aos,
aproximadamente,
se
requieren para lograr 14
ventas?

Solucin:
Lo primero que debe encontrarse es la ecuacin de regresin, es
decir, la ecuacin de la recta que con mayor fidelidad une a
todos los puntos de la tabla anterior.
Para darse una idea visual del trabajo que se va a realizar,
conviene graficar los puntos con un diagrama de dispersin:

Nmero de ventas

Ecuacin estimada de
regresin

Estimacin de la ecuacin de
Regresin Simple

Seccin C
No hay relacin

La pendiente 1
es negativa

y
y1
y2
.
.
.
yn

b0 y b1
0 y 1

Lneas posibles de regresin en la


regresin lineal simple
Seccin A
Relacin lineal positiva

x
x1
x2
.
.
.
xn

Ecuacin de regresin

Nmero de aos

09/11/2016

Puede apreciarse en este


diagrama de dispersin que
los puntos insinan una recta,
de la cual se va a calcular su
ecuacin.
Para eso, se requiere elaborar
una
tabla
con
cuatro
columnas, de la siguiente
forma:
* La 1 columna encabezada
con x;
* la 2 columna encabezada
con y;
* la 3 columna encabezada
con xy
* y la 4 columna encabezada
con x2.

Como en la ecuacin anterior x representa los aos laborando e y las


ventas, entonces: x = 16, de manera que sustituyndolo en la ecuacin de
la recta, se obtiene:

De manera que utilizando la frmula:

Obsrvese que como el denominador es el mismo para b como para a, no


se hizo ya ninguna sustitucin y solamente se copio el valor de m obtenido
antes para ponerlo en este denominador.
La ecuacin de la recta buscada es: Y= a + bX

Y = 0.430 + 0.698 X

Esta ecuacin sirve para poder contestar las dos preguntas formuladas en
el enunciado del problema: Cuntas ventas pueden esperarse en un
trabajador con 16 aos de servicio? Cuntos aos, aproximadamente, se
requieren para lograr 14 ventas?

Graficamos los resultados:

y = a + bx
y = 0.430 + 0.698 (16) = 11.59

Es decir, se pueden esperar aproximadamente entre once y doce


ventas de un trabajador con 16 aos laborando.
Para la segunda pregunta, se tiene como dato que y = 14, o sea 14 ventas,
de manera que sustituyendo en la ecuacin de la recta, se obtiene:
y = a + bx
14 = 0.430 + 0.698 x
14 0.430 = 0.698 x
x = 13.57 / 0.698
x = 19.44
Significa que se requieren aproximadamente de diecinueve a veinte
aos de servicio para alcanzar 14 ventas.

Coeficiente de Regresin o
Determinacin
Coeficiente de Regresin, R2 - es la
proporcin de la variacin total en la
variable dependiente Y que es explicada o
contabilizada por la variacin en la variable
independiente X.

Clculo del R2 a travs de la


siguiente frmula

( y y )
R
( y y)
2

El coeficiente de determinacin es el
cuadrado del coeficiente de correlacin, y
varia entre 0 y 1.

09/11/2016

Se desean comparar los rendimientos predichos a partir de la


informacin obtenida por 3 sensores sobre los rendimientos
reales por parcelas de lotes de maz. Los rendimientos (Y) y el
los rindes predichos de 4 sensores se presentan a continuacin
Sensor 1
0,0754
0,0754
0,0742
0,0766
0,0766
0,0730
0,0754
0,0766
0,0754
0,0754
0,0766
0,0766
0,0766
0,0766
0,0754
0,0766
0,0754
0,0742

Sensor 4
0,3083
0,3083
0,3327
0,3327
0,3297
0,3205
0,3114
0,2901
0,3449
0,3480
0,3480
0,3419
0,2840
0,3053
0,3266
0,2840
0,3358
0,3419

Sensor 5
0,1212
0,1212
0,1328
0,1251
0,1251
0,1193
0,1193
0,1193
0,1328
0,1193
0,1193
0,1135
0,1135
0,1193
0,1232
0,1135
0,1232
0,1251

Descripcin Grfica y cuantitativa de la relacin entre


cada sensor y el rendimiento
Ttulo
45,95

PRED_Rendimiento

Ejemplo

Rendimiento
42,5846
43,8576
44,0082
43,4989
41,3327
41,0313
40,4802
36,6735
43,3535
43,3180
43,3143
41,0042
36,4908
37,5931
40,4556
35,5595
41,6400
43,5951

38,41
30,87
23,33
15,79
0,078

0,092

0,107

0,121

0,135

B5
Rendimiento
PRED_Rendimiento

Qu sensor refleja mejor el rendimiento de esa zona?

Y = 338.71*X - 4.87
R2 = 0.32

Ttulo
Ttulo
45,95

38,41

PRED_Rendimiento

PRED_Rendimiento

45,95

30,87
23,33
15,79
0,22

0,26

0,30

0,34

0,37

B4

38,41
30,87
23,33
15,79
0,071

0,076

0,081

0,087

0,092

B1

Rendimiento
PRED_Rendimiento

Rendimiento
PRED_Rendimiento

Y = -1004.34*X +112.24

Y = 155.37*X 13.25
R2 = 0.57

R2 = 0.44

Diferencias entre Coeficiente de Correlacin


y Coeficiente de Regresin
Correlacin:
Medida en la cual se relacionan dos variables diferentes.
Ejm.: cmo se relaciona la cantidad de fumadores con la
cantidad de enfermos de cncer del pulmn o la relacin
que tienen las notas de cursos de estudiantes con sus
universidades o su nivel econmico.

Regresin:
Ecuacin matemtica que describe el comportamiento de
dos medidas.
Es decir, con la regresin podemos construir una formula
que nos d el nmero de enfermos de cncer de pulmn en
funcin de los fumadores o el numero de cursos aprobados
en funcin de la universidad o del estatus social del
estudiante.

Вам также может понравиться