Вы находитесь на странице: 1из 10

TRABAJO PRACTICO DE ESTADISTICA APLICADA

Apellidos y Nombres : Flores Padilla Luis Fernando


Curso : 1° “A”
Fecha : 04/10/2018

1. En la producción de herramientas, el método para deformar acero a temperatura normal mantiene una
relación inversa con la dureza del mismo ya que, a medida que la deformación crece, se ve afectada la dureza
del acero. Para investigar esta relación se ha tomado la siguiente muestra:
x: deformación (mm) 6 8 11 13 22 29 28 33 35
y: dureza (Kg/mm2) 68 67 65 53 44 40 37 34 36

a. Construya un diagrama de dispersión

Nº x y xy x^2 y^2 80

dureza(Kg/mm2)
1 6 68 408 36 4624 60
2 8 67 536 64 4489 40

y
3 11 65 715 121 4225
20
4 13 53 689 169 2809
0
5 22 44 968 484 1936
0 10 20 30 40
6 29 40 1160 841 1600
x
7 28 37 1036 784 1369 deformación (mm)
8 33 34 1122 1089 1156
9 35 36 1260 1225 1296
TOTALES: 185 444 7894 4813 23504

b. Efectúe la estimación del modelo lineal

𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑦𝑖 𝑥𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
(9 ∗ 7894) − (185 ∗ 444)
𝑏1 = 𝑏1 =
𝑁 ∑𝑁 2 𝑁
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 )
2 (9 ∗ 4813) − 1852 𝒃𝟏 = −𝟏. 𝟐𝟐𝟎𝟏𝟗𝟑𝟓𝟕𝟕

∑𝑁 𝑁
𝑖=1 𝑦𝑖 − 𝑏1 ∑𝑖=1 𝑥𝑖 444 − (−1.220193577 ∗ 185)
𝑏0 = 𝑏0 = 𝒃𝟎 = 𝟕𝟒. 𝟒𝟏𝟓𝟎𝟗𝟎𝟏𝟗
𝑁 9

𝑦̂ = 𝑏0 + 𝑏1 𝑥 ̂ = 𝟕𝟒. 𝟒𝟏𝟓𝟎𝟗𝟎𝟏𝟗 − 𝟏. 𝟐𝟐𝟎𝟏𝟗𝟑𝟓𝟕𝟕𝒙


𝒚
x ̂
𝒚
Regresión Lineal
6 67.094
80
8 64.654 70
60

Dureza (Kg/mm2)
11 60.993
50
13 58.553
40

𝑦̂
22 47.571 30
29 39.029 20
10
28 40.25
0
33 34.149 0 5 10 15 20 25 30 35 40

35 31.708 x
Deformación (mm)

c. Determine el coeficiente de correlación de Pearson


𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑥𝑦 − (∑𝑖=1 𝑥 )(∑𝑖=1 𝑦)
𝑟=
√[𝑁 ∑𝑁 2 𝑁 2 𝑁 2 𝑁
𝑖=1 𝑥 − (∑𝑖=1 𝑥 ) ][𝑁 ∑𝑖=1 𝑦 − (∑𝑖=1 𝑦) ]
2

(9 ∗ 7894) − (185 ∗ 444)


𝑟=
√[(9 ∗ 4813) − 1852 ][(9 ∗ 23504) − 4442 ]

𝒓 = −𝟎. 𝟗𝟔𝟗𝟓𝟔𝟓𝟔𝟎𝟕𝟗

2. A partir de las siguientes observaciones para 5 años de las variables x e y, ajústese el modelo de regresión de
y en función de x más idóneo (regresión lineal, potencial y exponencial). Donde:
y: producción nacional en un subsector industrial, en millones de toneladas.
x: tiempo.
Año x y
1995 1 1.2
1996 2 5.1
1997 3 11.3
1998 4 19.5
1999 5 30.7
a. Construya un diagrama de dispersión:
Nº x y xy x^2 y^2 X=log(x) Y=log(y) XY X^2 Y^2 Y=ln(y) xY Y^2
1 1 1.2 1.2 1 1.44 0.00000 0.07918 0.00000 0.00000 0.00627 0.18232 0.18232 0.03324
2 2 5.1 10.2 4 26.01 0.30103 0.70757 0.21300 0.09062 0.50066 1.62924 3.25848 2.65442
3 3 11.3 33.9 9 127.69 0.47712 1.05308 0.50245 0.22764 1.10897 2.42480 7.27441 5.87967
4 4 19.5 78.0 16 380.25 0.60206 1.29003 0.77668 0.36248 1.66419 2.97041 11.88166 8.82336
5 5 30.7 153.5 25 942.49 0.69897 1.48714 1.03947 0.48856 2.21158 3.42426 17.12131 11.72557
Totales: 15 67.8 276.8 55 1477.88 2.07918 4.61700 2.53159 1.16930 5.49167 10.63104 39.71818 29.11627
40.0

en millones de toneladas
un subsector industrial,
producción nacional en
30.0
20.0
10.0
y

0.0
0 1 2 3 4 5 6
x
tiempo

b. Efectué la estimación de los modelos y sus coeficientes de correlación lineal de Pearson de las funciones:
lineal, potencial y exponencial y sus respectivas graficas:
Regresión Lineal:
𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑦𝑖 𝑥𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
(5 ∗ 276.8) − (15 ∗ 67.8)
𝑏1 = 𝑏1 =
𝑁 ∑𝑁 2 𝑁
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 )
2 (5 ∗ 55) − 152 𝒃𝟏 = 𝟕. 𝟑𝟒

∑𝑁 𝑁
𝑖=1 𝑦𝑖 − 𝑏1 ∑𝑖=1 𝑥𝑖 67.8 − (7.34 ∗ 15)
𝑏0 = 𝑏0 = 𝒃𝟎 = −𝟖. 𝟒𝟔
𝑁 5

𝑦̂ = 𝑏0 + 𝑏1 𝑥 ̂ = −𝟖. 𝟒𝟔 + 𝟕. 𝟑𝟒𝒙
𝒚

𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑥𝑦 − (∑𝑖=1 𝑥 )(∑𝑖=1 𝑦)
𝑟=
√[𝑁 ∑𝑁 2 𝑁 2 𝑁 2 𝑁 2
𝑖=1 𝑥 − (∑𝑖=1 𝑥 ) ][𝑁 ∑𝑖=1 𝑦 − (∑𝑖=1 𝑦) ]

(5 ∗ 276.8) − (15 ∗ 67.8)


𝑟=
√[(5 ∗ 55) − 152 ][(5 ∗ 1477.88) − 67.82 ]

𝒓 = 𝟎. 𝟗𝟖𝟐𝟏𝟓𝟒𝟒𝟖𝟖𝟐

x ̂
𝒚
Regresion Lineal
1 -1.1
30.0
2 6.2
producción nacional en un subsector
industrial, en millones de toneladas

3 13.6 25.0

4 20.9 20.0
5 28.2
15.0
̂ 𝒚

10.0

5.0

0.0
0 1 2 3 4 5 6
-5.0
x
tiempo
Regresión Potencial:
𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑦𝑖 𝑥𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
(5 ∗ 2.532) − (2.079 ∗ 4.617)
𝑏1 = 𝑏1 =
𝑁 ∑𝑁 2 𝑁
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 )
2 (5 ∗ 1.169) − 2.0792 𝒃𝟏 = 𝟐. 𝟎𝟎𝟕𝟒𝟓𝟔𝟐𝟐𝟏

∑𝑁 𝑁
𝑖=1 𝑦𝑖 − 𝑏1 ∑𝑖=1 𝑥𝑖 4.617 − (2.007 ∗ 2.079)
𝑏0 = 𝑏0 = 𝒃𝟎 = 𝟎. 𝟎𝟖𝟖𝟔𝟐𝟕𝟓𝟎𝟓
𝑁 5

𝑦̂ = 𝑏0 + 𝑏1 𝑥 ̂ = 𝟎. 𝟎𝟖𝟖𝟔𝟐𝟕𝟓𝟎𝟓 + 𝟐. 𝟎𝟎𝟕𝟒𝟓𝟔𝟐𝟐𝟏𝒙
𝒚

𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑥𝑦 − (∑𝑖=1 𝑥 )(∑𝑖=1 𝑦)
𝑟=
√[𝑁 ∑𝑁 2 𝑁 2 𝑁 2 𝑁 2
𝑖=1 𝑥 − (∑𝑖=1 𝑥 ) ][𝑁 ∑𝑖=1 𝑦 − (∑𝑖=1 𝑦) ]

(5 ∗ 2.532) − (2.079 ∗ 4.617)


𝑟=
√[(5 ∗ 1.169) − 2.0792 ][(5 ∗ 5.492) − 4.6172 ]

𝒓 = 𝟎. 𝟗𝟗𝟗𝟖𝟐𝟖𝟓𝟓𝟒

𝑦 = 10𝑏0 𝑥 𝑏1

𝒚 = 𝟏𝟎𝟎.𝟎𝟖𝟖𝟔𝟐𝟕𝟓𝟎𝟓 𝒙𝟐.𝟎𝟎𝟕𝟒𝟓𝟔𝟐𝟐𝟏

x y
Regresion Potencial
1 1.2
35.0
2 4.9
producción nacional en un subsector
industrial, en millones de toneladas

3 11.1 30.0

4 19.8 25.0
5 31.0 20.0
15.0
y

10.0
5.0
0.0
0 1 2 3 4 5 6
x
Tiempo

Regresión Exponencial

𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑦𝑖 𝑥𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
(5 ∗ 39.718) − (15 ∗ 10.631)
𝑏1 = 𝑏1 =
𝑁 ∑𝑁 2 𝑁
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 )
2 (5 ∗ 55) − 152 𝒃𝟏 = 𝟎. 𝟕𝟖𝟐𝟓𝟎𝟓𝟔𝟏𝟐
∑𝑁 𝑁
𝑖=1 𝑦𝑖 − 𝑏1 ∑𝑖=1 𝑥𝑖 10.631 − (0.782 ∗ 15)
𝑏0 = 𝑏0 = 𝒃𝟎 = −𝟎. 𝟐𝟐𝟏𝟑𝟎𝟖𝟒𝟒𝟖
𝑁 5

𝑦̂ = 𝑏0 + 𝑏1 𝑥 ̂ = −𝟎. 𝟐𝟐𝟏𝟑𝟎𝟖𝟒𝟒𝟖 + 𝟎. 𝟕𝟖𝟐𝟓𝟎𝟓𝟔𝟏𝟐𝒙


𝒚

𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑥𝑦 − (∑𝑖=1 𝑥 )(∑𝑖=1 𝑦)
𝑟=
√[𝑁 ∑𝑁 2 𝑁 2 𝑁 2 𝑁 2
𝑖=1 𝑥 − (∑𝑖=1 𝑥 ) ][𝑁 ∑𝑖=1 𝑦 − (∑𝑖=1 𝑦) ]

(5 ∗ 39.718) − (15 ∗ 10.631)


𝑟=
√[(5 ∗ 55) − 152 ][(5 ∗ 29.116) − 10.6312 ]

𝒓 = 𝟎. 𝟗𝟔𝟗𝟔𝟒𝟗𝟖𝟎𝟏

𝑦 = 𝑒 𝑏0 ∗ 𝑒 𝑏1 𝑥

𝒚 = 𝒆−𝟎.𝟐𝟐𝟏𝟑𝟎𝟖𝟒𝟒𝟖 ∗ 𝒆𝟎.𝟕𝟖𝟐𝟓𝟎𝟓𝟔𝟏𝟐𝒙

x y
Regresión Exponencial
1 1.8
2 3.8 45.0
producción nacional en un subsector
industrial, en millones de toneladas

40.0
3 8.4
35.0
4 18.3
30.0
5 40.1 25.0
20.0
y

15.0
10.0
5.0
0.0
0 1 2 3 4 5 6
x
Tiempo

c. ¿A cuál de los tres modelos se ajusta mejor y diga por qué?


El modelo que se ajusta mas es el Potencial porque está más cerca de 1
3. La esperanza de vida femenina parece ser el factor principal en la mortalidad infantil en los países de
Latinoamérica, el informe proporcionado por la OMS en 1990, muestra lo siguiente:
Mortalidad Esperanza de
País
infantil vida femenina
Bolivia 75 64
Chile 15 79
Colombia 28 76
Perú 54 73
Ecuador 40 75
Paraguay 26 77
Uruguay 18 78
Brasil 66 67
Venezuela 30 75

a. Construya un diagrama de dispersión:

N° x y xy x^2 y^2 X=log(x) Y=log(y) XY X^2 Y^2 Y=ln(y) xY Y^2


1 75 64 4800 5625 4096 1.87506 1.80618 3.38670 3.51585 3.26229 4.15888 311.91623 17.29631
2 15 79 1185 225 6241 1.17609 1.89763 2.23178 1.38319 3.60099 4.36945 65.54172 19.09207
3 28 76 2128 784 5776 1.44716 1.88081 2.72183 2.09427 3.53746 4.33073 121.26053 18.75525
4 54 73 3942 2916 5329 1.73239 1.86332 3.22801 3.00119 3.47197 4.29046 231.68481 18.40804
5 40 75 3000 1600 5625 1.60206 1.87506 3.00396 2.56660 3.51585 4.31749 172.69952 18.64070
6 26 77 2002 676 5929 1.41497 1.88649 2.66933 2.00215 3.55885 4.34381 112.93894 18.86865
7 18 78 1404 324 6084 1.25527 1.89209 2.37509 1.57571 3.58002 4.35671 78.42076 18.98091
8 66 67 4422 4356 4489 1.81954 1.82607 3.32262 3.31074 3.33455 4.20469 277.50971 17.67944
9 30 75 2250 900 5625 1.47712 1.87506 2.76969 2.18189 3.51585 4.31749 129.52464 18.64070
Totales: 352 664 25133 17406 49194 13.79968 16.80273 25.70903 21.63158 31.37783 38.68971 1501.49687 166.36208

90
80
esperanza de vida femenina

70
60
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80
x
mortalidad infantil
b. Efectué la estimación de los modelos y sus coeficientes de correlación lineal de Pearson de las funciones:
lineal, potencial y exponencial y sus respectivas graficas:
Regresión Lineal:
𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑦𝑖 𝑥𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
(9 ∗ 25133) − (352 ∗ 664)
𝑏1 = 𝑏1 =
𝑁 ∑𝑁 2 𝑁
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 )
2 (9 ∗ 17406) − 3522 𝒃𝟏 = −𝟎. 𝟐𝟑

∑𝑁 𝑁
𝑖=1 𝑦𝑖 − 𝑏1 ∑𝑖=1 𝑥𝑖 664 − (−0.23 ∗ 352)
𝑏0 = 𝑏0 = 𝒃𝟎 = 𝟖𝟐. 𝟕𝟕
𝑁 9

𝑦̂ = 𝑏0 + 𝑏1 𝑥 ̂ = 𝟖𝟐. 𝟕𝟕 − 𝟎. 𝟐𝟑𝒙
𝒚

𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑥𝑦 − (∑𝑖=1 𝑥 )(∑𝑖=1 𝑦)
𝑟=
√[𝑁 ∑𝑁 2 𝑁 2 𝑁 2 𝑁 2
𝑖=1 𝑥 − (∑𝑖=1 𝑥 ) ][𝑁 ∑𝑖=1 𝑦 − (∑𝑖=1 𝑦) ]

(9 ∗ 25133) − (352 ∗ 664)


𝑟=
√[(9 ∗ 17406) − 3522 ][(9 ∗ 49194) − 6642 ]

𝒓 = −𝟎. 𝟗𝟕

x y
Regresion Lineal
75 65.52
90
15 79.32
esperanza de vida femenina

80
28 76.33
70
54 70.35
60
40 73.57 50
y

26 76.79 40
18 78.63 30
66 67.59 20
10
30 75.87
0
0 10 20 30 40 50 60 70 80
x
mortalidad infantil

Regresión Potencial:
𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑦𝑖 𝑥𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
(9 ∗ 25709) − (13.8 ∗ 16.803)
𝑏1 = 𝑏1 =
𝑁 ∑𝑁 2 𝑁
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 )
2 (9 ∗ 21.632) − 13.82 𝒃𝟏 = −𝟎. 𝟏𝟐

∑𝑁 𝑁
𝑖=1 𝑦𝑖 − 𝑏1 ∑𝑖=1 𝑥𝑖 16.803 − (−0.12 ∗ 13.8)
𝑏0 = 𝑏0 = 𝒃𝟎 = 𝟐. 𝟎𝟒𝟒
𝑁 9

𝑦̂ = 𝑏0 + 𝑏1 𝑥 ̂ = 𝟐. 𝟎𝟒𝟒 − 𝟎. 𝟏𝟐𝒙
𝒚
𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑥𝑦 − (∑𝑖=1 𝑥 )(∑𝑖=1 𝑦)
𝑟=
√[𝑁 ∑𝑁 2 𝑁 2 𝑁 2 𝑁 2
𝑖=1 𝑥 − (∑𝑖=1 𝑥 ) ][𝑁 ∑𝑖=1 𝑦 − (∑𝑖=1 𝑦) ]

(9 ∗ 25.709) − (13.8 ∗ 16.803)


𝑟=
√[(9 ∗ 21.632) − 13.82 ][(9 ∗ 31.378) − 16.8032 ]

𝒓 = −𝟎. 𝟗𝟏

𝑦 = 10𝑏0 𝑥 𝑏1

𝒚 = 𝟏𝟎𝟐.𝟎𝟒𝟒 𝒙−𝟎.𝟏𝟐

x y
Regresion Potencial
75 65.9163
90
15 79.9593
esperanza de vida femenina

80
28 74.1893
70
54 68.5666
60
40 71.0809 50
y

26 74.852 40
18 78.2289 30
66 66.9352 20
10
30 73.5776
0
0 10 20 30 40 50 60 70 80
x
mortalidad infantil

Regresión Exponencial

𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑦𝑖 𝑥𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
(9 ∗ 1501.497) − (352 ∗ 38.69)
𝑏1 = 𝑏1 =
𝑁 ∑𝑁 2 𝑁
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 )
2 (9 ∗ 17406) − 3522 𝒃𝟏 = −𝟎. 𝟎𝟎𝟑𝟐𝟏

∑𝑁 𝑁
𝑖=1 𝑦𝑖 − 𝑏1 ∑𝑖=1 𝑥𝑖 38.69 − (−0.0032 ∗ 352)
𝑏0 = 𝑏0 = 𝒃𝟎 = 𝟒. 𝟒𝟐𝟒𝟔𝟏
𝑁 9

𝑦̂ = 𝑏0 + 𝑏1 𝑥 ̂ = 𝟒. 𝟒𝟐𝟒𝟔𝟏 − 𝟎. 𝟎𝟎𝟑𝟐𝟏𝒙
𝒚

𝑁 ∑𝑁 𝑁 𝑁
𝑖=1 𝑥𝑦 − (∑𝑖=1 𝑥 )(∑𝑖=1 𝑦)
𝑟=
√[𝑁 ∑𝑁 2 𝑁 2 𝑁 2 𝑁 2
𝑖=1 𝑥 − (∑𝑖=1 𝑥 ) ][𝑁 ∑𝑖=1 𝑦 − (∑𝑖=1 𝑦) ]
(9 ∗ 1501.497) − (352 ∗ 38.69)
𝑟=
√[(9 ∗ 17406) − 3522 ][(9 ∗ 166.362) − 38.692 ]

𝒓 = −𝟎. 𝟗𝟔𝟐𝟕𝟑𝟖𝟒𝟒𝟑

𝑦 = 𝑒 𝑏0 ∗ 𝑒 𝑏1 𝑥

𝒚 = 𝒆𝟒.𝟒𝟐𝟒𝟔𝟏 ∗ 𝒆−𝟎.𝟎𝟎𝟑𝟐𝟏𝒙

x y
Regresion Exponencial
75 65.5923
90
15 79.5498
esperanza de vida femenina

80
28 76.2932
70
54 70.1743
60
40 73.4054 50
y

26 76.7854 40
18 78.7862 30
66 67.5182 20
10
30 75.8041
0
0 10 20 30 40 50 60 70 80
x
mortalidad infantil

c. ¿A cuál de los tres modelos se ajusta mejor y diga por qué?


El modelo que se ajusta más es el lineal porque está más cerca de 1

Вам также может понравиться