Вы находитесь на странице: 1из 81

LA IMPORTANCIA DE LAS FUNCIONES DE DENSIDAD Y LOS MODELOS DE

REGRESIÓN

Las funciones de densidad miden el comportamiento de los polígonos de frecuencias;


es decir el comportamiento matemático de una variable sin intervención de ninguna
otra.

Interpretando
fenómenos

Los modelos de regresión modelan el comportamiento de una variable en función de


otra de la cual depende la primera
USANDO LAS FUNCIONES DE DENSIDAD
Ejemplo-4
Suponga que el error en la temperatura de reacción, en grados centígrados, para un experimento controlado de
laboratorio es una variable aleatoria continua X que tiene la siguiente función de densidad:


 x 2
, para  1  x  2
f ( x)   3

 0, otro lugar

a) Verifique que:
2

f ( x ).dx  1.0   x 3.dx 


 2 x3 8 1
    1.0
2
 1 9 9 9
1

b) Encuentre
1

p(0  x  1.0)   x 3.dx 


1 x3 1
2

0 9 0 9

c) Encuentre la función de distribución F(x)

 





x  1 1 1 x  2 2 x 2
Ejemplo-4
Suponga que el error en la temperatura de reacción, en grados centígrados, para un
experimento controlado de laboratorio es una variable aleatoria continua X que tiene la
siguiente función de densidad:

c) Encuentre la función de distribución F(x)

 





x  1 1 1 x  2 2 x 2

i) x  1  F ( x )  0 0, x  1
3 x  3
  x 1
ii )  1  x  2  F ( x )   t 2 3.dt 
3
x t x 1
  F ( x)   , 1  x  2
1 9 1 9 9

iii ) x  2  F ( x )  1 1, x2
Ejemplo-4
Suponga que el error en la temperatura de reacción, en grados centígrados, para un
experimento controlado de laboratorio es una variable aleatoria continua X que tiene la
siguiente función de densidad:

d) Verifique la probabilidad encontrada en el punto b)

p(0  x  1.0)   x 3.dx 


1 x3 1
2

0 9 0 9

0, x  1
 3
 x 1 2 1 1
F ( x)   , 1  x  2  p (0  x  1)  F (1)  F (0)   
 9 9 9 9
1, x2

e) Dibuje la función de distribución F(x)


Ejemplo-4
Suponga que el error en la temperatura de reacción, en grados centígrados, para un
experimento controlado de laboratorio es una variable aleatoria continua X que tiene la
siguiente función de densidad:

e) Dibuje la función de distribución F(x)

F (x )
1.0

0, x  1 0.8
 3
 x 1
F ( x)   , 1  x  2 0.6
 9
1, x2 0.4

0.2

1 0 1 2 X
Ejemplo-7
Suponga que el número de automóviles X, que llegan a un establecimiento de lavado
de autos entre las 16:00 y las 17:00 horas de cualquier viernes de una semana tiene la
siguiente distribución de probabilidad:

X=x 4 5 6 7 8 9
P(x) 1/12 1/12 1/4 1/4 1/6 1/6

Si G(x) representa la cantidad de dinero en dólares, que el gerente del establecimiento


de lavado de autos recibe cualquier viernes entre las 16:00 y las 17:00, encuentre el
ingreso esperado y la varianza.
G( x )  2 x  1

a) Valor esperado:

EG ( x )   G ( x ). p( x )   ( 2 x  1). p( x )
1 1 1 1 1 1
 7.  9.  11.  13.  15.  17.  $12.67
12 12 4 4 6 6
b) Varianza
Ejemplo-7
Suponga que el número de automóviles X, que llegan a un establecimiento de lavado
de autos entre las 16:00 y las 17:00 horas de cualquier viernes de una semana tiene la
siguiente distribución de probabilidad:

X=x 4 5 6 7 8 9
P(x) 1/12 1/12 1/4 1/4 1/6 1/6

Si G(x) representa la cantidad de dinero en dólares, que el gerente del establecimiento


de lavado de autos recibe cualquier viernes entre las 16:00 y las 17:00, encuentre el
ingreso esperado y la varianza:

b)Varianza
G( x )  2 x  1

V G ( x )   G ( x )  E ( x ) . p( x )   (2 x  1)  12.67  p( x )
2
2

 
  2 x  13.67  p( x )   4 x 2  2(13.67 ). x  (13.67 ) 2 . p( x )
2

1 1 1
 141 .5089 .  150 .1689 .  ......  264 .8089 .  195 .3789
12 12 6
 X  V ( X )  $13.9778003
Ejemplo-8
Para la variable aleatoria X con función de densidad f(x) dada encuentre la esperanza
matemática y la varianza.

 x2
 , 1  x  2
f ( x)   3
0, otro lugar

4 2
2 2x  2
x 2 x3
15 5
E ( X )   x. f ( x ).dx   x. .dx   dx   
1 1 
 3 1 3 12 1 12 4
5 2
2 x
2
2
 x
2 x4
11
E ( X )   x . f ( x ).dx   x .
2 2 2
.dx   dx  
1 1 1 3
 3  15 1 5
2
11  5 
V ( X )  E ( X 2 )  E ( X )     
2 51
5  4  80
Ejemplo-9
Para la variable aleatoria X con función de densidad f(x) dada encuentre la esperanza
matemática y la varianza de la función G(x)=4x+3

 x2
 , 1  x  2
f ( x)   3
0, otro lugar

2 2  x2 
E (G ( x ))   G ( x ). f ( x ).dx   ( 4 x  3). .dx
1 1
 3
2 x3 2  x2 
  4 x. dx   3. .dx  8
1 1
3  3
 x2 
V ( X )   G ( x )  EG ( x ) . f ( x ).dx   4 x  3 8  .dx 
2 2 2 2
1 1
 3

 x2  2 x 
2
V ( X )   4 x  3 8  .dx   4 x  5  .dx
2 2 2

1 1
 3   3 
Ejemplo-9
Para la variable aleatoria X con función de densidad f(x) dada encuentre la esperanza
matemática y la varianza de la función G(x)=4x+3

 x2
 , 1  x  2
f ( x)   3
0, otro lugar

 x2 
V ( X )   16 x  40 x  25 dx
2
2
1
 3 
2  x4  2  x3  2  x2 
  16. dx   40. .dx   25. .dx
1 1 1
 3   3  3 
2 2 2
16 x 5 40 x 4 25 x 3
 .  .  . 
16
32  ( 1)   40 16  1  25 8  ( 1) 
3 5 1
3 4 1
3 3 1
15 12 9
16 40 25 51
 (33)  (15)  (9) 
15 12 9 5
Ejemplo-10
La variable X e Y tienen funciones de probabilidad respectivamente iguales a:

X 1 2 3
P(x) 0.3 0.4 0.3

Y 0 1 2 3 4
P(y) 0.2 0.1 0.3 0.3 0.1

Muestre que la variable Y tiene más varianza que la variable X.

E ( X )   x. p( x ) 2.0

V ( X )   ( x  2.0)2 p( x )  (1  2)2 (0.3)  (2  2)2 (0.4)  (( 3  2)2 (0.3)  0.6

E (Y )   y. p ( y )  2.0

V (Y )   ( y  2.0) 2 p ( y )
 (0  2) 2 (0.2)  (1  2) 2 (0.1)  ( 2  2) 2 (0.3)  (3  2) 2 (0.3)  ( 4  2) 2 (0.1)  1.6
Ejemplo-11
La distribución de la variable X se presenta mediante la siguiente tabla. X, representa
el número de proyectiles defectuosos cuando 3 de ellos son disparados.

X 0 1 2 3
p(x) 0.51 0.38 0.10 0.01

Encuentre la varianza de X.

E ( X )   X   xi . p( xi ) 0.(0.51)  1.(0.38)  2.(0.10)  3.(0.01)  0.61

E ( X 2 )   xi2 . p( xi ) 02.(0.51)  12.(0.38)  22.(0.10)  32.(0.01)  0.87

V ( X )   X2  E ( X 2 )  E ( X )  0.87  (0.61)2  0.4979


2
Ejemplo-12
La demanda semanal de cierto refresco, en miles de litros, en una cadena local de
tiendas, es una variable aleatoria continua X, definida mediante:

2 x  2 1  x  2
f ( x)  
0, otro lugar

Obtenga la varianza de X.
2 2 5
E ( X )   X   x. f ( x )dx   x.(2 x  2)dx 
1 1 3
2 2 17
E ( X 2 )   x 2 . f ( x )dx   x 2 .(2 x  2)dx 
1 1 6

2
17  5 
V ( X )   X2  E ( X 2 )  E ( X )     
2 1
6  3  18
Ejemplo-13
La siguiente distribución para la variable X, discreta es:

X 0 1 2 3
p(x) 1/4 1/8 1/2 1/8

De acuerdo con la tabla se tiene que: E(X)=3/2 y V(X)=1.0.


Encuentre: E(2X+3)= y V(2X+3)=

 3
E (2 X  3)  E (2 X )  E (3)  2 E ( X )  3  2.   3  6
2
V ( X )  V (2 X  3)  V (2 X )  V (3)  4V ( X )  0  4.(1.0)  4
Ejemplo-14
La siguiente distribución para la variable X, continua es:

 x2
 , 1  x  2
f ( x)   3
0, otro lugar

Tiene E(X)=5/4 y V(X)=51/80. Encuentre: E(4x+3)= y V(4x+3)=

 5
E (4 X  3)  E (4 X )  E (3)  4 E ( X )  3  4.   3  8
4
 51  51
V ( X )  V (4 X  3)  V (4 X )  V (3)  16.V ( X )  0  16.  
 80  5
Ejemplo-15 -Para resolver

El siguiente gráfico muestra el polígono de distribución de la variable aleatoria X

Pi
0.5
0.4
0.3
0.2
0.1

1 2 3 4 5 6 7 8 9 xi
Encuentre el valor esperado y la varianza de la variable aleatoria X
Ejemplo-18 -Para resolver

Una variable aleatoria X tiene función de distribución dada por:

0; x  1
3
 x  3 ; 1  x  1
4 4 3
F ( x)  
1; 1
x
 3


Hallar la probabilidad de que X tome un valor comprendido en el intervalo
(0, 1/3)
S//
 1 1
P(a  x  b)  F (b)  F (a)  P 0  x    F    F 0 
1
 3  3 4

Encuentre la función de densidad f (x) asociada a la función F (x) y


su gráfica. (Derive)
Ejemplo-19 -Para resolver
Para la función:
0; x  1
3
 x  3 ; 1  x  1
4 4 3
F ( x)  
1; 1
x
 3


a) Hallar la función de densidad f (x). Dibuje si gráfica.
b) Encuentre el valor esperado y la varianza de la variable aleatoria X
c) ¿Cómo encontraríamos percentiles utilizando la función de a)
S//
Ejemplo-20 -Para resolver

La variable aleatoria X está dada por la función de probabilidad:

X 3 4 7 10

p 0.2 0.1 0.4 0.3

a) Hallar la función de distribución F (x) .


b) Dibuje la función F (x)
c) Encuentre el valor esperado y la varianza de la variable aleatoria X
S//
0; x3 E ( X )   xi p( xi )  ??
0.2; 3  x  4

F ( x)  0.3 4  x  7 V ( X )   ( xi  E ( X )) 2 p ( xi )
0.7; 7  x  10  E ( X 2 )  E ( X )   ??
2


1; x  10
Ejemplo-20 -Para resolver

S//

F (x)
1.0

0.7

0.3
0.2

3 4 7 10 X
Ejercicio- 1

y2  y1
y  y1  ( x  x1 )
x2  x1

Ecuación de la recta que pasa


por dos puntos (𝑥1 , 𝑦1 ) y
(𝑥2 , 𝑦2 )
Ejercicio-2
Función de densidad
Ejemplo:
Una firma comercializadora compra 3 transformadores c/u a $10.000.000 para venderlos a $12.000.000
c/u en el entendido de que al terminar un período de 6 meses, cualquier transformador no vendido se
remata por $6.000.000. Si X es el número de transformadores vendidos, calcule la Expresión para la
utilidad neta.

h( x)  12.000 .000 .x  6.000 .000 .(3  x)  30 .000 .000


   
Ingreso Costo

Suponga la siguiente función de densidad


0.4.........si....... x  0
0.3.........si....... x  1

f ( x)  
*

0.2.........si....... x  2
0.1.........si....... x  3

El valor esperado de la ganancia “Ganancia esperada”

E h( x )    h( x ). f * ( x )
Ejemplo
Considérese la influencia de los precios del petróleo sobre el costo de fabricar un producto como las fibras sintéticas.
Suponga que, para un precio dado x del petróleo (en dólares por barril). La función 𝐶 𝑥 = 300 + 54𝑥 modela los
costos diarios de producción de una fibra sintética. Sin embargo, el precio x varia entre $25 y $34 por barril de tal
manera que la función:
 ( x  25)
 25  x  34
f ( x)   k
0 otro lugar

Puede concebirse como la probabilidad (o posibilidad/porcentaje de veces) de que el precio sea x. Determine el costo
esperado de las fibras sintéticas.
S//
-Hallamos el valor de la constante k

( x  25)
34 34
34 1 81
25 k dx  1.0  k 25 ( x  25)dx  1 25 ( x  25)dx  k  2  k
Se procede a calcular el costo esperado de la siguiente manera:

Función de costos ___________𝐶 𝑥 = 300 + 54𝑥  ( x  25)


Función del precio del barril de petróleo_______________  25  x  34
f ( x )   81 / 2
0 otro lugar

El costo esperado será:


34 34 ( x  25)
E (C ( x ))   C ( x ) f ( x )dx   (300  54 x ). dx
25 25 81 / 2
600 34 108 34
81 25
( x  25)dx 
81 25
x ( x  25)dx
200 / 27 4/3

34 34
200  x2
 4  x 25 x 
3 2

  25 x       300  1674  1974


27  2  25 3  3 2  25
AJUSTE DE MODELOS LINEALES
LA IMPORTANCIA DE UN MODELO RE REGRESIÓN AL MODELAR UN FENÓMENO DEL CUAL SOLO SE PUEDEN
TENER ALGUNOS VALORES PARA LAS VARIABLES QUE LO CONFORMAN
EL MODELO DE REGRESIÓN SIMPLE
EL MODELO DE REGRESIÓN SIMPLE

 ¿Cómo expresar la relación entre dos variables estudiadas?


 ¿La relación entre las dos variables es fuerte o débil?
 ¿La relación es directa o inversa?
 ¿Cómo conocer el valor de una variable Y dado el valor de una
variable X, sin medir ninguna de las dos en un problema específico?
 ¿Cómo representar gráficamente la relación entre dos variables?

¿Existe alguna relación entre la cantidad de café que ingiere una persona
diariamente y la hipertensión que el padece?
¿El costo de la calefacción de una vivienda depende del número de metros
cuadrados del área de la casa?
¿Cómo está relacionado el peso de una persona con su estatura?
¿Hay alguna correlación entre el número de horas de estudio de una materia
dedicadas por los estudiantes y sus calificaciones finales?
¿ Cómo se relaciona el número de estudiantes y el número de profesores por
institución?, ¿Será lo mismo en públicas que en privadas?
PIENSE EN OTRAS RELACIONES PARECIDAS A LAS ANTERIORES
EL MODELO DE REGRESIÓN LINEAL SIMPLE
El análisis de regresión es una técnica estadística que permite apreciar la relación
funcional entre dos o más variables, ajustando algún modelo matemático. En el modelo
de regresión lineal simple, se tiene un conjunto de n parejas de datos (xi, yi) y se busca
encontrar una recta que describa de la mejor manera posible los pares de datos
observados.

y   0  1 x 1 Pendiente

0 Intersecto
Y
Notación
1
y
 Y X
Variable Variable
dependiente independiente

0 Variable Explicada Variable explicatoria

Variable predicha Variable predictor


x X Variable regresada Variable regresora

Variable respuesta Variable de control


31
EL MODELO DE REGRESIÓN LINEAL SIMPLE

y3
y3  ŷ3
ŷ3 yˆ  ˆ0  ˆ1 x

y2  ŷ2

ŷ1 y2  ŷ2
y1  ŷ1
y1
x1 x2 x3

32
EL MODELO DE REGRESIÓN SIMPLE

Supóngase que la siguiente información corresponde a las variables X: Costo de un


producto (miles de pesos) y Y: Precio de venta (miles de pesos) para una muestra de
20 establecimientos comerciales en donde se expende dicho producto.

X 1,2 2 2,1 3 3,2 4 4,1 1,3 5,1 3,3


Y 4 4 6 9,5 7 12 12,2 3 10 12

X 4,2 2,3 2,6 4,2 3,3 3,5 5 6,1 7 3,9


Y 13 7,7 8 10 10,2 9 14,5 18 19 11,6
EL MODELO DE REGRESIÓN SIMPLE

A) Grafique las parejas de puntos (x, y) en un plano cartesiano.


EL MODELO DE REGRESIÓN SIMPLE

A) Grafique las parejas de puntos (x, y) en un plano cartesiano.

Diagrama de dispersion de Y vs X
20
18

Y: Precio de venta
16
14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7 8

X: Costo del producto


EL MODELO DE REGRESIÓN SIMPLE

B) Grafique la recta que mejor se ajusta a los datos (la que contiene o que pasa más
cerca del mayor número de puntos)
EL MODELO DE REGRESIÓN SIMPLE

B) Grafique la recta que mejor se ajusta a los datos (la que contiene o que pasa más
cerca del mayor número de puntos)

Diagrama de dispersion de Y vs X
20
18

Y: Precio de venta
16
14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7 8

X: Costo del producto


EL MODELO DE REGRESIÓN SIMPLE

C) Encuentre la siguiente tabla:


EL MODELO DE REGRESIÓN SIMPLE

C) Encuentre la siguiente tabla: Y X x2 xy


4 1,2 1,44 4,8
4 2 4 8
6 2,1 4,41 12,6
9,5 3 9 28,5
7 3,2 10,24 22,4
12 4 16 48
12,2 4,1 16,81 50,02
3 1,3 1,69 3,9
10 5,1 26,01 51
12 3,3 10,89 39,6
13 4,2 17,64 54,6
7,7 2,3 5,29 17,71
8 2,6 6,76 20,8
10 4,2 17,64 42
10,2 3,3 10,89 33,66
9 3,5 12,25 31,5
14,5 5 25 72,5
18 6,1 37,21 109,8
19 7 49 133
11,6 3,9 15,21 45,24
Total 200,7 71,4 297,38 829,63
EL MODELO DE REGRESIÓN SIMPLE

D) Encuentre las ecuaciones normales del modelo de regresión lineal simple


definido por:

Y  B0  B1 X
 yi  nB0  B1  xi

 xi yi  B0  xi  B1  xi
2
EL MODELO DE REGRESIÓN SIMPLE

D) Encuentre las ecuaciones normales del modelo de regresión lineal simple


definido por:

Y  B0  B1 X
200,7  20 B0  71,4 B1

829,63  71,4 B0  297,38 B1
EL MODELO DE REGRESIÓN SIMPLE

E) Resuelva el sistema de ecuaciones y encuentre B0 y B1


EL MODELO DE REGRESIÓN SIMPLE

E) Resuelva el sistema de ecuaciones y encuentre B0 y B1

B1 2,66303376
Bo 0,52796949
EL MODELO DE REGRESIÓN SIMPLE

F) Verifique que los coeficientes B0 y B1 pueden hallarse de la siguiente manera:

 x  y 
x y 
i i
n
i i

B1  
 
 xi2  n i
2
x

B0 
 y i
 B1
x i

n n

B1 2,66303376
Bo 0,52796949
EL MODELO DE REGRESIÓN SIMPLE

F) Verifique que los coeficientes B0 y B1 pueden hallarse de la siguiente manera

 x  y  (71,4).(200,7)
x y i
n
i
i i
829,63 
20
B1    2,66303376
 
 xi2  n i
2 2
x (71,4)
297,38 
20

B0 
 y i
 B1
x i

200,7
 (2,66303376).
(71,4)
 0,52796949
n n 20 20

B1 2,66303376
Bo 0,52796949
EL MODELO DE REGRESIÓN SIMPLE

G) Trace la recta de regresión hallada en un gráfico.


EL MODELO DE REGRESIÓN SIMPLE

G) Trace la recta de regresión hallada en un gráfico.

Recta de regresión de Y Vs X
25

20

Y: Precio de venta
y = 2,663x + 0,528
15

10

0
0 1 2 3 4 5 6 7 8

X: Costo del producto


EL MODELO DE REGRESIÓN SIMPLE

H) Usando la recta de regresión hallada, estime los siguientes valores de Y (precios


de venta) para los valores de X (precio de compra) dados y encuentre el error
cometido al usar el modelo de regresión hallado.

X real (dado) Y real (dado) Y estimado Error (desviación)

xi yi ŷi yi  yˆ i
3 9,5
3,9 11,6
2,3 7,7
EL MODELO DE REGRESIÓN SIMPLE

H) Usando la recta de regresión hallada, estime los siguientes valores de Y (precios


de venta) para los valores de X (precio de compra) dados y encuentre el error
cometido al usar el modelo de regresión hallado.

X real (dado) Y real (dado) Y estimado Error (desviación)

xi yi ŷi yi  yˆ i
3 9,5 17,4891013 -7,98910127
3,9 11,6 10,9138011 0,68619886
2,3 7,7 6,65294713 1,04705287
EL MODELO DE REGRESIÓN SIMPLE

I) ¿Qué tan bueno es el modelo de regresión ajustado?


Calcule el Coeficiente de determinación?

R 
2  i
( ˆ
y  Y ) 2


Variación explicada
 ( yi  Y ) 2
Variación total
EL MODELO DE REGRESIÓN SIMPLE

I) ¿Qué tan bueno es el modelo de regresión ajustado?


Calcule el Coeficiente de determinación?

R2 
 ( yˆ i  Y )2

Variación explicada 301,271672
  0,87021053
(y i  Y ) 2
Variación total 346,2055
¿Y QUÉ TAN BUENO ES EL MODELO AJUSTADO?

( X t , Yt )

Yt Yt  yˆ t
Yt  Y Variación No explicada
Modelo ajustado Variación Total
yˆ  ˆ0  ˆ1 x yˆ t  Y
Variación explicada

Xt

El modelo ajustado explica el 87,02% de la


variación que existe en la variable Y
Y: Precio de venta de un producto (precio de venta del producto) en función
X: Costo del producto del costo del mismo 52
EL MODELO DE REGRESIÓN SIMPLE

J) ¿Qué tan bueno es el ajuste por línea recta entre las variables X e Y?
Calcule el Coeficiente de correlación lineal?

x y i i
 XY
COV ( X , Y ) n
r  
S X SY x 2
i
X 2 y 2
i
Y 2
n n

Mide que tan buena es la correlación lineal entre X e Y (línea recta)


EL MODELO DE REGRESIÓN SIMPLE

J) ¿Qué tan bueno es el modelo de regresión ajustado?


Calcule el Coeficiente de determinación?

COV ( X , Y )
r 
S X SY
x y i i
 XY
829,63
 (3,57)(10,035)
r n  20 
x 2
i
X2
y 2
i
Y 2
297,38
 (3,57) 2
2360,23
 (10,035) 2
n n 20 20

r  0,93285075
EL MODELO DE REGRESIÓN SIMPLE

K) Verifique que

r R
2 2

Coeficiente de Coeficiente de
correlación lineal determinación

r  0,93285075 R 2  0,87021053
EL MODELO DE REGRESIÓN SIMPLE

K) Verifique que

r R
2 2

Coeficiente de Coeficiente de
correlación lineal determinación

r  0,93285075 R 2  0,87021053

r 2  r.r  (0,93285075)(0,93285075)  0,87021053  R 2


EL MODELO DE REGRESIÓN SIMPLE

L) ¿Cuál de las siguientes posibilidades se está verificando con respecto al valor de


r?
EL MODELO DE REGRESIÓN SIMPLE

M) ¿Cómo son las expresiones matriciales del modelo de regresión simple?

Y  X

 y1  1 x1 
 y  1 x2 
 2 
 y3  1 x3 
     0 
 .   . .  
1 
 .  . .  
   
 .  . . 
 y  1 xn 
 n 
EL MODELO DE REGRESIÓN SIMPLE
M) ¿Cómo son las expresiones matriciales del modelo de regresión simple?
Y  Xβ

4 1 1,2
4 1 2
6 1 2,1
9,5 1 3
7 1 3,2
12 1 4
12,2 1 4,1
3 1 1,3
10
12 =
1
1
5,1
3,3 . 
1
0 


13 1 4,2
7,7 1 2,3
8 1 2,6
10 1 4,2
10,2 1 3,3
9 1 3,5
14,5 1 5
18 1 6,1
19 1 7
11,6 1 3,9
EL MODELO DE REGRESIÓN SIMPLE
N) Hallar el valor de la traspuesta de X por X (multiplicación de matrices)
X/X

1 x1 
1 x2 
 
1 x3 
1 1 1 ......1   
x x ...... xn  .  
 1 2 x3  . 
 
. 
1 xn 
 
EL MODELO DE REGRESIÓN SIMPLE
Ñ) Hallar el valor de la traspuesta de X por el vector Y (multiplicación de una matriz
por un vector) X/ Y
EL MODELO DE REGRESIÓN SIMPLE
O) Hallar la inversa de la matriz X/ X

X X 
/ 1

1
/
Adjunta 
X /
X 
XX

Ejemplo:
a c   d  b
A   Adjunata A   c a 
b d   

Determinante de A:

a c 
A   A  ad  bc
b d 
EL MODELO DE REGRESIÓN SIMPLE
P) Matricialmente las ecuaciones del modelo de regresión simple.

X X   X Y
/ /

n

x i    0  n 0  1  xi   xi 
   
2  
 xi x   1   xi  1  xi   xi yi 
i 
2

De tal manera que:

  X / X  X / Y 
1
EL MODELO DE REGRESIÓN SIMPLE

Ejercicio:
Una agencia desea estimar lo gastos en alimentación de una familia con base
en el ingreso y su tamaño. Los datos de la tabla siguiente representan los
gastos de alimentación por mes Y( miles de dólares) , contra el ingreso mensual
X y el tamaño de la familia Z
Y X Z
0,43 2,1 3
0,31 11 4
0,32 0,9 5
0,46 1,6 4
1,25 6,2 4
0,44 2,3 3
0,52 1,8 6
0,29 1 5
1,29 8,9 3
0,35 2,4 2
0,35 1,2 4
0,78 4,7 3
0,43 3,5 2
0,47 2,9 3
0,38 1,4 4
EL MODELO DE REGRESIÓN SIMPLE

a) Hallar los coeficientes de correlación lineales:

ryx ; ryz
b) Realice un diagrama de puntos por separado para (y, x) y (y, z). Trace a ojo la
recta que usted cree explica la nube de puntos en cada caso.

c) Escriba las ecuaciones normales del modelo Y=B0 +B1 x y Y=B0 +B1z. Escriba
la ecuación de la recta resultante en cada caso.

d) Calcule los coeficiente de determinación para cada modelo en el punto anterior


(opine).

e) Realice las gráficas de los modelos hallados.

f) Ajustar el modelo multinomial siguiente:

Y   0  1 X   2 Z

¿Qué tan bueno es el ajuste que da este modelo a los datos de la tabla? Opine.
EL MODELO DE REGRESIÓN SIMPLE

Ecuaciones normales del modelo:

Y   0  1 X   2 Z

n

 x  z  
i i    yi 
 xy
0

 xi     i i 
2
x i x z . i i 1
     zy
 zi     2  i i 
2
x z
i iz i
18) .
Ejemplo de ajuste para un modelo no lineal. La empresa TELEINTEL, dedicada a la venta de servicio de Internet,
tiene centros de ventas de ese servicio en 10 municipios cierta región española. Durante el pasado año la
empresa repartió folletos sobre la prestación de su servicio en buzones y puerta a puerta. Sean las variables 𝑋 :
Número de folletos repartidos (miles); 𝑌: Ingresos por ventas del servicio, en miles de euros. (ver tabla).
N° de folletos Ingresos
1 6 Comportamiento del ingreso Vs N° de folletos
1.5 8 300

250
2 12
200
2.5 17

Ingresos
150
3 25 100
4 45 50

4.5 70 0
0 1 2 3 4 5 6 7
5 96 N° de folletos

6 190 y   0 1x
6.5 250
18) .
Ejemplo de ajuste para un modelo no lineal. La empresa TELEINTEL, dedicada a la venta de servicio de Internet,
tiene centros de ventas de ese servicio en 10 municipios cierta región española. Durante el pasado año la
empresa repartió folletos sobre la prestación de su servicio en buzones y puerta a puerta. Sean las variables 𝑋 :
Número de folletos repartidos (miles); 𝑌: Ingresos por ventas del servicio, en miles de euros. (ver tabla).
R//
• Escriba la ecuación linealizada después de sacar logaritmos naturales.
• Haga los cambios respectivos de variables y encuentre las ecuaciones normales del modelo.
• Encuentre los parámetros del modelo linealizado y los respectivos parámetros del modelo ajustado.
• Escriba el modelo resultante.
• Mida la bondad del modelo (que tan bueno es el ajuste) mediante la siguiente expresión:

R2 
Variación explicada

 ( y  y)
*
i
2

Variación Total  ( y  y)
i
2
Entre más cerca de 1 este
este valor, mejor es el
𝑦𝑖 : Valor real observado para la variable ingresos modelo ajustado
𝑦:
ത Media de los datos originales de la variable ingresos
𝑦𝑖∗ : Valor entregado por el modelo ajustado después de estimar los parámetros 𝛽0 y 𝛽1

0 0 .5 1
Mala Excelente

Ajuste Nulo Ajuste Perfecto


MODELOS NO LINEALES EN SUS PARÁMETROS
Ejemplo
Supongamos que mediante un experimento de laboratorio se ha encontrado la siguiente información para las
variables X e Y
X Y X: Variable independiente
0,5 0,3
1 2 Y: Variable respuesta
2 2,9
3 4
4 4,7
5 4 a) Realice un diagrama de puntos para visualizar el comportamiento de la variable Y (respuesta
6 5
7 5,7 Comportamiento de Y Vs X
8 4,8 9
9 5 8
11 7
7

Y: Variable dependiente
11 7
12 6,5 6
13 6,4 5
14 6,7
4
15 7
16 7 3
17 6 2
18 8 1
19 7,5
0
20 7,5
0 5 10 15 20 25 30
0,4 1
X: Variable independiente
22 6
22 7
24 6
MODELOS NO LINEALES EN SUS PARÁMETROS
Ejemplo
Supongamos que mediante un experimento de laboratorio se ha encontrado la siguiente información para las
variables X e Y
X Y X: Variable independiente
0,5 0,3
1 2 Y: Variable respuesta
2 2,9
3 4
4 4,7 b) Ajuste un modelo de la forma 𝑌 = 𝛽0 + 𝛽1 𝑥
5 4
6 5 Comportamiento de Y Vs X
7 5,7 9
8 4,8
9 5 8

11 7 7
11 7
Y: Variable dependiente
12 6,5 6
13 6,4 5
14 6,7
15 7 4
16 7 3
17 6
18 8 2
19 7,5 1
20 7,5
0,4 1 0
0 5 10 15 20 25 30
22 6
22 7 X: Variable independiente
24 6
Cálculos adicionales para hallar las ecuaciones normales y los coeficientes 𝛽0 y 𝛽1

X Y Yˆ   0  1 X
Varianza =𝑆 2 52,065984 4,0688
Desviación estándar= 𝑆 =

y  n 0  1  xi
7,21567627 2,01712667
+ 𝑆2
Media 11,196 5,4 i

x y   0  xi  1  x
n 25 2
Covarianza=𝑆𝑥𝑦 11,8196 i i i
Coeficiente de correlación
0,81206832
lineal=𝜌𝑥𝑦
Coeficiente de determinación
=𝑅2 = 𝜌𝑥𝑦2 0,65945495
S xy 
 xy i i
xy
Coeficiente 𝛽1 0,22701194 n
Coeficiente 𝛽0 2,85837433
S xy
1  2
;  0  y  1 x
S x
MODELOS NO LINEALES EN SUS PARÁMETROS
Ejemplo
Supongamos que mediante un experimento de laboratorio se ha encontrado la siguiente información para las
variables X e Y
Yˆ  2.8584  0.227 X
X Y X: Variable independiente
0,5
1
0,3
2 Y: Variable respuesta  xy  0.81206832
2 2,9
3 4
c) ¿Qué tan bueno es el modelo ajustado? Es la mejor línea recta
4 4,7
5 4 que se puede trazar
6 5 para interpretar a Y en
Comportamiento de Y Vs X
7 5,7 función de X
9
8 4,8
9 5 8
11 7
11 7 7 Entre más cerca de 1 o -1 esta
Y: Variable dependiente

12 6,5 6 el coeficiente de correlación


13 6,4 lineal 𝜌𝑥𝑦 se dice que el
5
14 6,7 modelo es mucho mejor
15 7 4
16 7
3
17 6
18 8 2 Se ve que los puntos 8nube
19 7,5
20 7,5 1 de puntos) no siguen una
0,4 1 0
línea recta. Luego será bueno
22 6 0 5 10 15 20 25 30 ajustar otro modelo
22 7 X: Variable independiente
24 6
MODELOS NO LINEALES EN SUS PARÁMETROS
Ejemplo
Supongamos que mediante un experimento de laboratorio se ha encontrado la siguiente información para las
variables X e Y
X Y X: Variable independiente
0,5 0,3
1 2 Y: Variable respuesta
2 2,9
3 4
4 4,7 d) Ajuste a los datos el siguiente modelo logarítmico: 𝑌 = 𝛽0 + 𝛽1 ln(𝑥)
5 4
6 5
Y
7 5,7
8 4,8 9
9 5
8
11 7
11 7 7
12 6,5 6
13 6,4
14 6,7 5
15 7
16 7
4
A simple vista este modelo
17 6 3 interpreta mejor la
18 8 2 variable Y en función de X
19 7,5
20 7,5 1
0,4 1 0
22 6 0 5 10 15 20 25 30
22 7
24 6
Se realizan los siguientes cálculos
Yˆ   0  1 ln( X )
X
0,5
Y
0,3
𝑥∗ = ln(𝑥)
-0,69314718
𝑥∗ . 𝑦
-0,20794415

1 2 0 0
x*
2 2,9 0,69314718 2,01012682
3 4 1,09861229 4,39444915

 yi  n 0  1  x*i
4 4,7 1,38629436 6,5155835
5 4 1,60943791 6,43775165
6 5 1,79175947 8,95879735

 x*i yi   0  x*i  1  x*i
7 5,7 1,94591015 11,0916878 2
8 4,8 2,07944154 9,9813194
9 5 2,19722458 10,9861229


11 7 2,39789527 16,7852669
11 7 2,39789527 16,7852669
x yi
 *i
 x* y
12 6,5 2,48490665 16,1518932
13 6,4 2,56494936 16,4156759 S x* y
14
15
6,7
7
2,63905733
2,7080502
17,6816841
18,9563514
n
16 7 2,77258872 19,4081211
17 6 2,83321334 16,9992801
S x* y
18
19
8
7,5
2,89037176
2,94443898
23,1229741
22,0832923 1  2
;  0  y  1 x*
20
0,4
7,5
1
2,99573227
-0,91629073
22,4679921
-0,91629073
S x*
22 6 3,09104245 18,5462547
22 7 3,09104245 21,6372972
24 6 3,17805383 19,068323
Otros cálculos:
Yˆ   0  1 ln( X )

x*

σ 𝑥∗𝑖 = ෍ 𝑥∗𝑖 𝑦𝑖 = Yˆ  2.03245018  1.67768065 ln( x )


෍ 𝑦𝑖 = 135
50,1816275
325,361277
𝑆𝑦2 =4,0688 𝑆𝑥2∗𝑖 =1,29656352 Comportamiento de Y Vs X
9
𝑆𝑦 =2,01712667 𝑆𝑥∗𝑖 =1,13866743
8
𝑦ത =5,4 𝑥ҧ ∗𝑖 =2,0072651
7
𝑛 = 25

Y: variable analizada
6
෍ 𝑥∗𝑖 𝑦𝑖 = σ 𝑦𝑖 − 𝑦ො𝑖 2 =
5
10,4869071
4
325,361277
σ 𝑦𝑖 − 𝑦ത 2 = 3 y = 1,6777ln(x) + 2,0325
𝛽1 =1,67768065 101,72 2 R² = 0,8969
1

𝛽0 =2,03245018 0
0 5 10 15 20 25 30
X: Variable independiente

Entre más cerca


R2  1 
 ei2  1
 ( yi  yˆi )2 este 𝑅 2 de 1, el
( y i  y) 2
( y i  y )2 ajuste será mejor
d) Ajuste un modelo cuadrático de la forma:𝑌 = 𝛽0 + 𝛽2 𝑥𝑖 + 𝛽3 𝑥𝑖2
X Y
0,5 0,3
1 2
2 2,9
3 4
4 4,7
5 4 Comportamiento de la variable Y vs X
6 5 9
7 5,7 8
8 4,8
7
9 5

Y: Variable analizada
11 7 6

11 7 5
12 6,5 4
13 6,4
3
14 6,7
15 7 2
16 7 1
17 6
0
18 8 0 5 10 15 20 25 30
19 7,5 X: Variable independiente
20 7,5
0,4 1
22 6
22 7
24 6
d) Ajuste un modelo cuadrático de la forma:𝑌 = 𝛽0 + 𝛽2 𝑥𝑖 + 𝛽3 𝑥𝑖2
X Y 𝑋2 𝑋3 𝑋4 𝑋𝑌 𝑋2𝑌 𝑌2
0,5 0,3 0,25 0,125 0,0625 0,15 0,075 0,09
1 2 1 1 1 2 2 4
2 2,9 4 8 16 5,8 11,6 8,41
3 4 9 27 81 12 36 16
4 4,7 16 64 256 18,8 75,2 22,09
5 4 25 125 625 20 100 16
6 5 36 216 1296 30 180 25
7 5,7 49 343 2401 39,9 279,3 32,49
8 4,8 64 512 4096 38,4 307,2 23,04
9 5 81 729 6561 45 405 25
11 7 121 1331 14641 77 847 49
11 7 121 1331 14641 77 847 49
12 6,5 144 1728 20736 78 936 42,25
13 6,4 169 2197 28561 83,2 1081,6 40,96
14 6,7 196 2744 38416 93,8 1313,2 44,89
15 7 225 3375 50625 105 1575 49
16 7 256 4096 65536 112 1792 49
17 6 289 4913 83521 102 1734 36
18 8 324 5832 104976 144 2592 64
19 7,5 361 6859 130321 142,5 2707,5 56,25
20 7,5 400 8000 160000 150 3000 56,25
0,4 1 0,16 0,064 0,0256 0,4 0,16 1
22 6 484 10648 234256 132 2904 36
22 7 484 10648 234256 154 3388 49
24 6 576 13824 331776 144 3456 36
Suma 279,9 135 4435,41 79551,189 1527595,09 1806,95 29569,835 830,72
Cálculos adicionales

  x . y     x 
2 2
  x 2
. y    x 2
. x 
 xy    x     x y    x 
4 2 3

 n  n 
 
n  n 
1   0.72156755

 x 2  x 
2

  x  4  x   
2 2

   x 
3  x . x 
2 2


 n   n   n 


 x 
 x 2

  x y 
 x2  y    x2  x   x. y 
 
    
2 2 3
x xy 
 n   n   n  n 
2    0.02153522

 x  2  x 
2

  x  4  x   
2 2

   x 3  x . x 
2 2


 n   n   n 

0 
 y  x  x
1 2
2

 1.14203105
n
Modelo ajustado

Y   0  1 x   2 x 2
Y  1.14203105  0.72156755. x  0.02153522 x 2
Y   0  1 x   2 x 2 Comportamiento de la variable Y vs X
9

 y  n0  1  x   2  x 2
7

Y: Variable analizada
6

 yx    x    x    x
0 1
2
3
3 5

 yx    x    x    x
2
0
2
1
3
3
4
3
y = -0,0215x2 + 0,7216x + 1,142
R² = 0,9066
2

1
Coeficiente de
0
0 5 10 15 20 25 30 Determinación 𝑅 2
SISTEMA DE ECUACIONES X: Variable independiente bastante bueno
e) Compare los tres modelos y decida cuál de ellos será el mejor (da las mejores estimaciones de Y en función
de X)

Yˆ  2.8584  0.227 X Yˆ  2.03245018  1.67768065 ln( x ) Yˆ  1.14203105  0.72156755. x  0.02153522 x 2

Modelo Lineal Modelo logarítmico Modelo parabólico


𝑅2 0.6595 0.8969 0.9066

Mejor Modelo
LA IMPORTANCIA DE UN BUEN MODELO DE REGRESIÓN

Cuando un modelo ajustado es bueno, las


predicciones hechas con él estarán cercanas a la
realidad. Es decir, que se puede conocer el valor
de Y sin medir la variable X; esto es simplemente
suponemos un valor de X en su rango para
obtener el respectivo Y, haciendo operaciones
matemáticas

Вам также может понравиться