Вы находитесь на странице: 1из 17

PONTIFCIA UNIVERSIDADE CATLICA DO PARAN

ESCOLA POLITCNICA
CURSO DE ENGENHARIA DE PRODUO

CLAUDIO ROBERTO FERRETO JUNIOR


LUIS HENRIQUE DE SOUZA
MARCOS VINICIUS TAKAHARA BERNARDI

TDE II - ESTATSTICA

CURITIBA
2015

1. Descrio das variveis e do processo estudado


A anlise da base de dados desenvolvida tem como objetivo exercitar o
contedo ministrado no semestre atravs das ferramentas estatsticas tais como
identificao das variveis dependente e independentes, testar a normalidade dos
dados, calcular o coeficiente de correo e o grfico de disperso das variveis,
elaborar teste de hipteses e estabelecer a equao de regresso e alm disto,
definir se possvel predizer valores do modelo.
A base de dados utilizada refere-se a diversos modelos de veculos que esto
para venda em uma revenda, que tem a funo de controlar o preo de venda do
veculo, o uso do mesmo e anos, qual a quantidade de quilmetros rodados e qual
era o preo do veculo quando novo. As variveis a serem analisadas so:
Modelo (M): Refere-se ao modelo do veculo a ser vendido.
Preo de Venda (PV): Representa o valor do veculo que est a venda. O
valor varia conforme o tempo de uso do mesmo e a quantidade de quilmetros
rodados.
Tempo de Uso (em anos) (TU): Refere-se a quanto tempo o veculo foi
utilizado.
KM (1000*1) (KM): Expressa quantos quilmetros o veculo rodou antes de
chegar para venda.
Preo Novo (PN): Refere-se ao preo de fbrica do veculo.

2. Identificao das variveis


Considerando os dados amostrados da prpria natureza das variveis,
verificou-se que a varivel com maior dependncia das demais o Preo de Venda,
sendo assim classificada como varivel dependente. As demais variveis foram
classificadas como independentes pois seus valores so dados diretos do veculo.
A escolha da varivel dependente se deve ao fato de Preo de Venda ser
calculado em funo, da relao entre tempo de uso e quilometragem rodada.

3. Teste de normalidade (Anderson Darling)


O teste de normalidade foi realizado para as variveis independentes
consideradas na regresso linear mltipla, alm da varivel dependente.

Normalidade Preo de Venda


Normal
99,9

Mdia
11869
DesvPad 3772
N
127
AD
5,669
Valor-P <0,005

99
95
90

Percentual

80
70
60
50
40
30
20
10
5
1
0,1

5000

10000

15000

20000

25000

Preo de Venda

Figura 1 - Comparao da normalidade do Preo de Venda

A Figura 1 apresenta a normalidade do preo de venda dos carros da lista,


como o valor-p do teste Anderson Darling foi menor que 0,005, conclui que a
varivel no segue a distribuio normal. Na Figura 2 mostrada o teste Anderson
Darling para os dados da varivel KM, de forma que possui uma distribuio normal,
Valor-P 0,45. Ainda so mostrados os grficos da normalidade da varivel Preo
Novo, e Anos de uso do automvel, mostrando que os dados esto agrupados, por
conta no caso do Preo novo, mostrado na Figura 3, mostra 8 grupos indicando
cada tipo de carro e o mesmo valor pelo carro novo. E a figura 4 os dados esto
agrupados por ano, no caso variando de 1 at 5, no seguindo uma distribuio
normal.

Normalidade KM
Normal
99,9

Mdia
DesvPad
N
AD
Valor-P

99
95

50,24
20,61
127
0,355
0,455

Percentual

90
80
70
60
50
40
30
20
10
5
1
0,1

25

50

75

100

125

KM(*1000)

Figura 2 - Normalidade Quilometragem

Normalidade Preo Novo


Normal
99,9

Mdia
19354
DesvPad
7136
N
127
AD
12,916
Valor-P <0,005

99
95

Percentual

90
80
70
60
50
40
30
20
10
5
1
0,1

10000

20000

30000

Pnovo

Figura 3 - Normalidade Preo Novo

40000

Normalidade Anos
Normal
99,9

Mdia
3,055
DesvPad 1,347
N
127
AD
4,134
Valor-P <0,005

99
95
90

Percentual

80
70
60
50
40
30
20
10
5
1
0,1

-1

Uso(Anos)

Figura 4 - Normalidade Anos

Observa-se que somente no grfico da figura 2 apresenta Valor-P superior a


0,005, o que significa que essa varivel segue uma distribuio normal.

4. Anlise de correlao e grfico de disperso


O grau de correlao entre todas as caractersticas da base de dados est
apresentado na Tabela 2
PV

TU

KM

PV

100,00%

TU

-36,52%

100,00%

KM

-34,87%

87,03%

100,00%

PN

87,75%

1,68%

4,37%

PN

CORRELAO
Bem Fraca
Fraca

100,00%

Tabela 1 - Correlao entre as variveis

Forte

Preo de Venda e Tempo de Uso tem uma correlao negativa fraca, pois a
medido que o tempo de uso do veculo aumenta o seu preo de venda tende

a diminuir, por conta do desgaste do mesmo.


Preo de Venda e Quilometragem tambm tem uma correlao negativa e
fraca, pois assim como o tempo de uso, quanto mais um veculo rodou o seu

preo vai diminuir.


Preo de Venda e Preo Novo possuem uma correlao forte, pois o preo
de um veculo novo torna-se a base mais alta, como o veculo a ser vendido
usado, obviamente este preo tem de ser mais baixo que o novo, mas no

to distante.
Tempo de Uso e Quilometragem estabelecem uma correlao forte e positiva,
conforme o tempo de uso do veculo o mesmo rodou bastante, aumentando a

fora desta relao.


Tempo de Uso e Preo Novo possuem uma correlao bem fraca, pois uma

varivel no possui influncia sobre a outra.


Quilometragem e Preo Novo tambm possui uma correlao bem fraca, pois
assim como a anterior as variveis no sofrem influncia uma sobre a outra
demasiadamente.

TU x PV
6
5
4
3
2
1
0
4000 6000 8000 10000 12000 14000 16000 18000 20000 22000 24000

Grfico 1 - Tempo de Uso x Preo de Venda

KM x PV
120
100
80
60
40
20
0
4000 6000 8000 1000012000140001600018000200002200024000

Grfico 2 - Quilometragem x Preo de Venda

PN x PV
35000
30000
25000
20000
15000
10000
5000
0
0

5000

10000

15000

20000

Grfico 3 - Preo Novo x Preo de Venda

25000

KM x TU
120
100
80
60
40
20
0
0.5

1.5

2.5

3.5

4.5

5.5

5.5

Grfico 4 - Quilometragem x Tempo de Uso

PN x TU
35000
30000
25000
20000
15000
10000
5000
0
0.5

1.5

2.5

3.5

Grfico 5 - Preo Novo x Tempo de Uso

4.5

PN x KM
35000
30000
25000
20000
15000
10000
5000
0
0

20

40

60

80

100

120

Grfico 6 - Preo Novo x Quilometragem

Com relao aos grficos de disperso procurou-se apresentar neste projeto


as relaes entre as caractersticas utilizadas na composio da anlise de
regresso. Observando os grficos, pode-se concluir que a relao quilometragem x
preo de venda apresenta uma correlao negativa, conforme j evidenciado nas
anlises anteriores. Isso explica a varivel dependente que mostra o preo do
veculo mais baixo conforme sua maior quilometragem rodada.
Os demais grficos apresentados possuem uma correlao menor pois so
dependentes de outras variveis, o que explica o aspecto distinto dos pontos nos
grficos.

5. Teste de hipteses
O teste de hipteses representa uma situao em que o conjunto das
variveis escolhidas (tempo de uso, quilometragem rodada e preo novo) podem ou
no explicar a varivel dependente.
Para a interpretao do teste de hipteses utilizou-se o valor de p obtido na
regresso apresentada acima. Se o valor de p for extremamente pequeno, o teste
estatstico rejeita H0, nesse caso indicando que as variveis escolhidas explicam a
varivel dependente.

H0: As variveis de tempo de uso, quilometragem rodada e preo do carro


novo no explicam o preo de revenda.
H1: As variveis de tempo de uso, quilometragem rodada e preo do carro
novo explicam o preo de revenda.
O valor de p obtido com a regresso foi de 5,79106x10-70.
Como esse valor extremamente pequeno, deve-se rejeitar H0, ou seja, as
variveis selecionadas explicam o preo de revenda.

6. Regresso
A partir da identificao das variveis, foi possvel obter uma equao para
explicar o modelo a partir da regresso linear mltipla. Para tanto, foram
consideradas trs variveis independentes (Tempo de uso em anos (TU),
Quilmetros rodados (KM), Preo do carro novo (PN)). A equao obtida foi:
PV = 6418,797946 - 494,1681736 TU - 42,84787688 KM + 0,470848451 PN, onde
PV = Preo de venda
TU = Tempo de uso em anos
KM = Quilmetros rodados
PN = Preo do carro novo

Tabela 2 - Estatsticas de Regresso

Tabela 3 Estatsticas de Regresso

Tabela 4 - Regresso Mltipla

7. Interpretao do modelo de regresso


Na anlise desses dados o modelo de regresso explica em 96,31% a
variao da varivel dependente, sendo possvel considerar adequado o modelo
de regresso obtido.
Esse modelo sustentado pelas variveis de tempo de uso, quilmetros
rodados e preo novo. A relao baseada fortemente nas trs variveis, as trs
explicam o preo de revenda em mais de 99%.
Para mostrar que o modelo de regresso adequado, foi realizada a
predio de cinco valores para as variveis, de modo a obter os resultados de
custo operacional dentro da faixa observada nos dados coletados.

Tabela 5 - Predio de valores

Base de dados:
Preo de Venda

Model
o
Mille

4890

Uso
(Anos)
5

KM
(*1000)
98

Mille

5064

88

Mille

7820

73

Preo
novo
1208
1
1208
1
1208
1

Mille

7320

65

Mille

8100

62

Mille

7590

59

Mille

8950

61

Mille

8590

42

Mille

8530

38

10

Mille

9040

50

11

Mille

8790

41

12

Mille

9200

38

13

Mille

10240

19

14

Mille

10560

12

15

Fiesta

5500

90

16

Fiesta

7780

75

17

Fiesta

7850

64

18

Fiesta

7900

60

19

Fiesta

7980

60

20

Fiesta

8970

45

21

Fiesta

9990

48

22

Fiesta

10150

44

23

Fiesta

9150

36

24

Fiesta

10200

33

25

Fiesta

10530

52

26

Fiesta

10900

47

27

Fiesta

11200

45

1208
1
1208
1
1208
1
1208
1
1208
1
1208
1
1208
1
1208
1
1208
1
1208
1
1208
1
1305
0
1305
0
1305
0
1305
0
1305
0
1305
0
1305
0
1305
0
1305
0
1305
0
1305
0
1305
0
1305
0

28

Fiesta

9680

23

29

Fiesta

10200

15

30

Fiesta

9580

27

31

Fiesta

9980

16

32

Fiesta

10050

12

33

Corsa

8450

75

34

Corsa

8120

69

35

Corsa

8680

65

36

Corsa

9350

62

37

Corsa

9180

59

38

Corsa

9260

59

39

Corsa

9250

56

40

Corsa

9680

75

41

Corsa

10100

60

42

Corsa

9950

59

43

Corsa

9580

57

44

Corsa

9460

48

45

Corsa

10900

49

46

Corsa

11200

36

47

Corsa

10750

36

48

Corsa

12050

33

49

Corsa

12350

40

50

Corsa

11640

23

51

Corsa

11400

22

1305
0
1305
0
1305
0
1305
0
1305
0
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7
1533
7

52

Gol

9200

75

53

Gol

9340

75

54

Gol

9000

68

55

Gol

9340

45

56

Gol

9450

78

57

Gol

9680

69

58

Gol

9920

62

59

Gol

9320

59

60

Gol

9950

58

61

Gol

9680

55

62

Gol

10500

63

63

Gol

10860

50

64

Gol

10780

50

65

Gol

10560

43

66

Gol

10340

39

67

Gol

9680

39

68

Gol

11640

39

69

Gol

11350

36

70

Gol

11380

36

71

Gol

12050

32

72

Gol

11430

18

73

Gol

12570

38

74

Gol

12040

20

75

Gol

12580

11

1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5
1594
5

76

Fiorino

7270

92

77

Fiorino

8790

72

78

Fiorino

9510

75

79

Fiorino

8659

69

80

Fiorino

9660

66

81

Fiorino

9870

57

82

Fiorino

11230

46

83

Fiorino

9970

42

84

Fiorino

10900

37

85

Fiorino

10589

30

86

Fiorino

12910

22

87

Fiorino

12830

17

88

Parati

12000

99

89

Parati

11880

85

90

Parati

10590

82

91

Parati

12280

67

92

Parati

14410

60

93

Parati

14580

54

94

Parati

15750

48

95

Parati

14960

53

96

Parati

18340

48

97

Parati

14580

46

98

Parati

17020

39

99

Parati

16800

37

1671
1
1671
1
1671
1
1671
1
1671
1
1671
1
1671
1
1671
1
1671
1
1671
1
1671
1
1671
1
2813
7
2813
7
2813
7
2813
7
2813
7
2813
7
2813
7
2813
7
2813
7
2813
7
2813
7
2813
7

10
0
10
1
10
2
10
3
10
4
10
5
10
6
10
7
10
8
10
9
11
0
111

Parati

15680

29

Parati

18360

32

Parati

18960

18

Parati

17090

18

Escort

11050

94

Escort

10480

82

Escort

13650

68

Escort

12800

85

Escort

16570

72

Escort

16400

55

Escort

16950

60

Escort

16860

47

11
2
11
3
11
4
11
5
11
6
11
7
11
8
11
9
12
0
12
1
12
2
12
3

Escort

17050

47

Escort

18120

44

Escort

18900

37

Escort

18280

26

Escort

17400

25

Vectra

18830

75

Vectra

18120

68

Vectra

15490

80

Vectra

17600

54

Vectra

17050

47

Vectra

19880

43

Vectra

21050

40

2813
7
2813
7
2813
7
2813
7
2816
8
2816
8
2816
8
2816
8
2816
8
2816
8
2816
8
2816
8
2816
8
2816
8
2816
8
2816
8
2816
8
3299
5
3299
5
3299
5
3299
5
3299
5
3299
5
3299
5

12
4
12
5
12
6
12
7

Vectra

20810

36

Vectra

19400

29

Vectra

21500

28

Vectra

21440

19

3299
5
3299
5
3299
5
3299
5

Вам также может понравиться