Вы находитесь на странице: 1из 9

Departamento de Cincias e Engenharia de Biossistemas

Agrupamento de Matemtica
Matemtica II
Estatstica Descritiva
2012/2013
(F. Valente e M. Mesquita) (F. Valente e M. Mesquita)
2
Revises de Estatstica
Estatstica - cincia que se ocupa da recolha,
organizao e anlise de informao, com a
finalidade de inferir de um conjunto limitado de
informao para o todo e eventualmente prever a
evoluo futura de um fenmeno.
Subreas da Estatstica:
Obteno dos
dados
Amostragem
Planeamento de
Experincias
Anlise dos dados
Estatstica
descritiva
Anlise
Exploratria
Modelao
Teoria da
Probabilidade
Induo
Inferncia
Estatstica
Prescrutao
do futuro
Previso
3
Conceitos bsicos
Dados conjunto de informao que constitui o
objecto de estudo da Estatstica.
Populao (ou universo) conjunto de todos os
elementos/valores que se pretendem estudar.
Unidade estatstica (ou amostral) elemento da
populao que objecto de observao.
Varivel caracterstica comum aos elementos da
populao (cujo valor pode ser diferente de elemento
para elemento).
Amostra subconjunto de elementos extrados de
uma populao (conjunto de todas as observaes da
caracterstica em estudo efectivamente recolhidas).
4
Dados estatsticos
Os dados (e respectiva varivel) podem ser de
natureza
qualitativa
nominal (a ordem das categorias no tem significado)
ordinal (h uma ordenao natural das categorias)
quantitativa
discreta (provm de contagens)
contnua (provm de medies)
Exemplos:
Sexo
0-500 50 0 4 A 10 F 30
500-1000 20 1 6 B 20 M 20
1000-2000 20 2 5 C 15
+ 2000 10 3 3 D 5
Classes de
rendimento
Nmero de
familias
Nmero
de filhos
Nmero
de casais
Nveis de
classificao
Nmero
de alunos
Nmero
de alunos
5
Exemplo 1
Para avaliar a taxa de sucesso no primeiro semestre
de um curso universitrio com cinco disciplinas,
foram inquiridos 50 alunos inscritos na totalidade
dessas disciplinas. As respostas quanto ao nmero
de disciplinas realizadas com aproveitamento por
aluno foram as seguintes:
1 5 1 4 1 3 2 5 5 1 4 5 2 4 5
4 4 1 2 5 3 5 3 0 2 1 3 4 5 4
5 2 5 3 0 4 5 1 4 0 4 4 1 2 1
5 5 5 2 3
6
Exemplo 2
Um dos principais indicadores da poluio
atmosfrica nas grandes cidades a concentrao
de ozono na atmosfera. Num dado Vero, e numa
dada cidade, registaram-se 78 valores dessa
concentrao, tendo-se obtido os seguintes valores:
3.5 6.2 3.0 3.1 5.1 6.0 7.6 7.4 3.7 2.8 3.4 3.5
1.4 5.7 1.7 4.4 6.2 4.4 3.8 5.5 4.4 2.5 11.7 4.1
6.8 9.4 1.1 6.6 3.1 4.7 4.5 5.8 4.7 3.7 6.6 6.7
2.4 6.8 7.5 5.4 5.8 5.6 4.2 5.9 3.0 3.3 4.1 3.9
6.8 6.6 5.8 5.6 4.7 6.0 5.4 1.6 6.0 9.4 6.6 6.1
5.5 2.5 3.4 5.3 5.7 5.8 6.5 1.4 1.4 5.3 3.7 8.1
2.0 6.2 5.6 4.0 7.6 4.7
7
Revises de Estatstica
A anlise inicial dos dados tem como principais
objectivos:
a explorao dos dados para descobrir/identificar
aspectos ou padres de maior interesse;
a representao dos dados de modo a destacar esses
aspectos ou padres:
condensar os dados observados sob a forma de
quadros;
representar graficamente os dados;
calcular indicadores numricos de localizao e de
disperso.
8
Agrupamento dos dados
Tabela de frequncias
caso de dados de natureza discreta, com um nmero
pequeno de valores distintos
0 3 0,06 0,06
1 9 0,18 0,24
2 7 0,14 0,38
3 6 0,12 0,50
4 11 0,22 0,72
5 14 0,28 1,00
x
i
n
i
F
i
f
i
valores da
varivel (nmero
de disciplinas
realizadas com
aproveitamento)
frequncia
relativa
acumulada
frequncia
absoluta
frequncia
relativa
9
Frequncia
Frequncia absoluta (ni) nmero de observaes
iguais a

Frequncia relativa ( f
i

) fraco do nmero total
de observaes iguais a

Frequncia relativa acumulada ( F


i

) fraco do
nmero total de observaes menores ou iguais a x
i

( f
i
=n
i
/

n
i
)
( F
i
=

k=1
i
f
k
)
x
i
x
i
10
Agrupamento dos dados (cont.)
Tabela de frequncias
dados de natureza contnua ou dados de natureza discreta
com um nmero elevado de valores distintos
neste caso h que agrupar os dados em classes seguindo, por
exemplo, o procedimento seguinte:
1) determinar o mximo e o mnimo do conjunto dos dados
(avaliando a amplitude total = max - min);
2) escolher o nmero de classes;
3) definir os vrios intervalos de classe fixando os seus limites:
os intervalos tm de ser disjuntos e o domnio da varivel
tem de estar contido na unio de todos os intervalos;
4) contar os valores pertencentes a cada classe, determinando a
frequncia absoluta e relativa de cada classe.
11
Nmero de classes
A escolha do nmero de classes, alm de se basear
na experincia e nos objectivos do investigador,
depende de dois factores: a dimenso (n) e a
amplitude total da amostra.
Exemplo de uma regra para escolha do nmero de
classes com amplitude constante:
Regra de Sturges toma-se como nmero de
classes o inteiro (m) mais prximo de
1+(log
2
n)=1+
log n
log 2
12
Exemplo 2 (cont.)
1) min = 1.1 e max = 11.7
2) Pela regra de Sturges m = 7
3) Amplitude das classes h = 1.5 (max-min)/7 =1.51
Tabela de frequncias
1+(log
2
n)=7.285
1 ]0.0, 1.5] 0,75 4 0,05 0,05
2 ]1.5, 3.0] 2,25 9 0,12 0,17
3 ]3.0, 4.5] 3,75 20 0,26 0,42
4 ]4.5, 6.0] 5,25 24 0,31 0,73
5 ]6.0, 7.5] 6,75 15 0,19 0,92
6 ]7.5, 9.0] 8,25 3 0,04 0,96
7 ]9.0,10.5] 9,75 2 0,03 0,99
8 ]10.5,12.0] 11,25 1 0,01 1,00
Classe
i
Intervalo de
classe
Ponto
mdio
n
i
F
i
f
i
13
Representao grfica
Diagrama de barras num referencial
ortonormado marcam-se no eixo das abcissas todos
os valores que a varivel pode tomar e, em cada um,
traam-se barras verticais de ordenada igual
frequncia absoluta/relativa observada
utiliza-se quando o conjunto de dados discreto com um
nmero moderado de valores possveis (exemplo 1).
Histograma diagrama de reas formado por uma
sucesso de rectngulos adjacentes, cuja base a
amplitude de cada classe e cuja rea representa a
frequncia relativa na classe
utiliza-se com dados agrupados em classes (exemplo 2).
14
Indicadores numricos
Em geral, importante resumir os dados de
natureza quantitava, calculando algumas
caractersticas numricas da amostra de modo a ter
informao sobre a sua
localizao
mdia, mediana, quantis e moda
disperso
amplitude total, amplitude inter-quartil, varincia,
desvio padro e coeficiente de variao
15
Indicadores de localizao: mdia
Seja uma amostra com n observaes .
Define-se mdia aritmtica, ou simplesmente mdia, como

Nota: sempre que possvel deve-se calcular a mdia a partir de
dados no classificados; no entanto, quando apenas se dispe de
dados classificados pode-se calcular a
mdia agrupada =
em que c o nmero de classes, a frequncia absoluta da classe
i e o ponto mdio da classe i.
x
1
, x
2
, ... , x
n

x=
x
1
+x
2
++x
n
n
=

i=1
n
x
i
n

x ' =

i=1
c
n
i
x'
i
n
n
i
x '
i
16
Algumas propriedades da mdia
A mdia o ponto de equilbrio (centro de
gravidade) das observaes.
A mdia de uma transformao linear dos dados a
transformao linear da mdia dos dados originais,
i.e.,
A mdia muito sensvel a valores extremos
(outliers)
y
i
=a+b x
i

y=a+b

x.
17
Indicadores de localizao: mediana
Seja uma amostra com n observaes,
e sejam as observaes ordenadas
. Define-se mediana como
A mediana o valor que separa as 50% das
observaes inferiores das 50% superiores.
Ao contrrio da mdia, a mediana uma medida de
localizao resistente a erros grosseiros e outliers.
x
1
, x
2
, ... , x
n

( x
( 1)
x
(2)
...x
( n)
)
x
( 1)
, x
( 2)
,... , x
( n)

x=

x
(
n+1
2 )
se n mpar
x
(
n
2 )
+x
(
n
2
+1
)
2
se n par
18
Indicadores de localizao: quantil
Define-se quantil de ordem p (0 < p < 1) como
em que [np] designa o maior inteiro contido em np.
Q
p
=

x
( np|+1)
se np no inteiro
x
( np)
+x
( np+1)
2
se np inteiro
19
Indicadores de localizao: quantil (cont.)
Para dados agrupados, o clculo do quantil de ordem
p (Qp) pode ser feito de diversas maneiras. A mais
usual corresponde a localizar a primeira classe (k)
cuja frequncia relativa acumulada superior ou
igual a p ( ) e considerar o seu extremo inferior
( ) como uma aproximao inicial a que preciso
adicionar uma correco. Essa correco
proporcional amplitude da classe (h) e ao nmero
de observaes que faltam para atingir os
de observaes inferiores Qp
F
k
p
x
k
min
p100%
Q'
p
=x
k
min
+h
p-F
k-1
f
k
20
Indicadores de localizao: moda
Para dados qualitativos ou dados discretos no
agrupados, a moda define-se como o valor mais
frequente.
Para dados agrupados, a moda um valor da classe
com frequncia mais elevada (classe modal)
calculado por regras empricas, por exemplo
em que o limite inferior da classe modal, e
so as frequncias, respectivamente, da classe
anterior e da classe posterior classe modal.
mod=x
k
min
+h
f
k+1
f
k-1
+f
k+1
,
x
k
min
f
k-1
f
k+1
21
Indicadores de disperso
Amplitude total: A
tot
= max min
Amplitude inter-quartil: AIQ = Q
0.75
Q
0.25

Varincia:
Desvio padro:
s
2
=

i =1
n
( x
i
-

x)
2
n-1
=
n

i =1
n
x
i
2
-
(
i=1
n
x
i)
2
n(n-1)
s=
.
( s
2
)
22
Indicadores de disperso
Para dados agrupados em c classes:
Amplitude total:
Varincia:
s'
2
=

i=1
c
( x '
i
-x ' )
2
n
i
n
=

i=1
c
n
i
x'
i
2
n
-

x'
2
=

i=1
c
x '
i
2
f
i
-

x '
2
A
tot
x
c
max
-x
1
min
em que o limite superior da ltima classe, o limite inferior
da primeira classe, a frequncia absoluta da classe i, a mdia
agrupada, o ponto mdio da classe i e a frequncia relativa da
classe i.
x
c
max
x
1
min
n
i

x '
f
i
x '
i
23
Algumas propriedades dos ind. de disperso
A amplitude total, a varincia e o desvio padro so
medidas de disperso muito influnciadas por
valores extremos.
A amplitude inter-quartil uma medida mais
resistente a erros grosseiros e outliers.

Seja uma amostra com n observaes


com varincia e
A varincia das novas observaes
e o desvio padro
s
2
0 e s0
x
1
, x
2
, ... , x
n

s
x
2
y
i
=a+bx
i
, i =1,., n.
s
y
2
=b
2
s
x
2
s
y
=bs
x
.
24
Disperso absoluta e relativa
As medidas de disperso anteriores so chamadas
de absolutas pois dependem da unidade da varivel
a que se referem.
Medidas de disperso relativa so independentes
da unidade da varivel, permitindo comparar dados
cujas unidades so diferentes ou que diferem
consideravelmente em grandeza.
De um modo geral, as medidas de disperso relativa
so definidas como

disperso relativa=
disperso absoluta
localizao
25
Coeficiente de variao
A medida de disperso relativa mais usada o
coeficiente de variao,
Nota: CV s pode ser ser usado quando a varivel toma
valores de um mesmo sinal, i.e., s positivos ou s
negativos.
O CV pode ser interpretado como a fraco da disperso
pela qual a localizao responsvel
em muitas situaes, quanto maior a localizao maior
tende a ser a disperso.
CV=
s

x
100%.
26
Assimetria
As distribuies podem classificar-se em:
simtricas
mdia = mediana = moda
enviesadas esquerda ou assimtricas positivas
mdia > mediana > moda
enviesadas direita ou assimtricas negativas
mdia < mediana < moda
A assimetria (afastamento da simetria) tanto maior
quanto mais afastadas estiverem mdia, mediana e
moda.
27
Assimetria (exemplos)
Distribuio simtrica
Distribuio assimtrica positiva
Distribuio assimtrica negativa
28
Outliers
Outlier um elemento que se afasta do padro geral dos
dados e a que se deve dar ateno especial.
Regra prtica para identificao de (candidatos) a outliers:
Um valor xi considerado um outlier quando
em que Q
1
= Q
0.25
e Q
3
= Q
0.75
so o 1 e o 3 quartil,
respectivamente;
x
i
Q
1
-1.5(Q
3
-Q
1
) ou x
i
>Q
3
+1.5(Q
3
-Q
1
) ,
Nota: os valores Q
1
-1.5(Q
3
-Q
1
) e Q
3
+1.5(Q
3
-Q
1
) so as chamadas
barreiras inferior e superior, respectivamente;
29
Outliers (cont.)
A identificao e interpretao de outliers uma
tarefa complexa e altamente subjectiva.
Este tipo de observaes pode resultar:
de erros humanos cometidos ao medir ou ao registar os dados,
da prpria natureza do fenmeno em estudo.
A eliminao de potenciais outliers deve fazer-se
com prudncia.
aconselhvel proceder anlise estatstica com e sem
eles e avaliar a sua influncia na anlise e interpretao
dos resultados. Se as diferenas forem apreciveis h que
relatar este facto e, eventualmente, recolher mais dados
e recomear a anlise.
30
Diagrama de extremos-e-quartis
O diagrama de extremos-e-quartis (ou caixa-de-
bigodes , box-and-whiskers plot) um grfico que
permite representar em simultneo medidas de
localizao e disperso de uma amostra:
transmite de modo
imediato uma ideia da
localizao, disperso e
forma da populao de que
foi extrada a amostra;
um instrumento
adequado para comparar
vrias amostras.
0 1 2 3 4 5
m

nQ1 Q3
m

x
x
31
Caixa-de-bigodes com outliers
A presena de outliers leva a modificar a caixa-de-
bigodes. Os bigodes vo somente at aos
elementos do conjunto de dados mais extremos que
no so outliers. Os outliers so marcados com
pontos.
0 200 400 600 800
32
Estatstica descritiva a duas dimenses
Quando se consideram coleces de pares de
variveis (x
i
, y
i
), i = 1,...,n, deixamos de estar
interessados em explorar isoladamente cada uma
das variveis. O objectivo passa a ser o estudo da
variao conjunta dessas variveis, procurando
pr em evidncia relaes eventualmente
existentes entre elas.
Em Estatstica, no so relaes determinsticas
(relaes funcionais) que interessam, mas sim a
variao em mdia das duas variveis (relao
estatstica).
33
Correlao
Entre duas variveis quantitativas ligadas por uma
relao estatstica diz-se que existe correlao.
Quando existe correlao, os fenmenos observados no
esto indissoluvelmente ligados, mas a intensidade de
um acompanhada tendencialmente pela intensidade do
outro, no mesmo sentido (correlao positiva) ou em
sentido inverso (correlao negativa).
Exemplos:
a) Relao entre o preo do vinho e o montante da colheita
em cada ano;
b) Relao entre o peso e a altura de um ser humano adulto.
34
Diagrama de disperso
Diagrama de disperso (ou nuvem de pontos) a
representao grfica de um conjunto de pares de
observaes (x
i
, y
i
), i = 1,...,n, num sistema de
eixos cartesianos.
O ponto o centro de gravidade da nuvem de
pontos.
Atravs da anlise grfica obtm-se uma ideia
inicial da associao estatstica entre as duas
variveis:
linear ou no;
crescente ou decrescente.
(x , y)
35
Indicadores para dados bidimensionais:
covarincia
Para alm dos indicadores numricos que
caracterizam individualmente cada uma das
amostras , podem-se definir novos
parmetros para descrever as relaes existentes
numa amostra bivariada.
Define-se covarincia de x e y como
(

x ,

y , s
x
2
, s
y
2
, ...)
cov( x , y)=

i=1
n
( x
i
-x)( y
i
-y)
n-1
=
n

i =1
n
x
i
y
i
-

i=1
n
x
i
i=1
n
y
i
n(n-1)
36
Algumas propriedades da covarincia
Seja uma amosta bivariada e sejam
e transformaes lineares dos dados.
Ento
A covarincia um indicador da associao (linear)
entre duas variveis:
quando cov(x , y) > 0 h correlao positiva;
quando cov(x , y) < 0 h correlao negativa;
A covarincia tem, no entanto, um forte
inconveniente: depende da unidade de medida
usada, sendo fortemente afectada por mudanas de
escala nas observaes.

( x
i
, y
i
)

i =1
n
x
i
*
=a+bx
i
y
i
*
=c+dy
i
cov( x
*
, y
*
)=bd cov( x , y).
37
Indicadores para dados bidimensionais:
coeficiente de correlao
Define-se coeficiente de correlao de uma
amostra bivariada como
O coeficiente de correlao tambm um indicador
numrico que permite avaliar o grau de associao
linear entre duas variveis. , no entanto, uma
indicao meramente ordinal:
podemos ordenar diferentes valores de r e com isso ter
uma ideia sobre quais as variveis que tm um grau de
associao(linear) mais forte; no faz, no entanto, sentido
dizer que r = 0.90 representa uma correlao duas vezes
mais forte do que a dada por r = 0.45.
r=r
xy
=
cov( x , y)
s
x
s
y
coms
x
0 e s
y
0.
38
Propriedades do coeficiente de correlao
r tem sempre o mesmo sinal da covarincia.

O valor de r no afectado, em valor absoluto, por


transformaes lineares das variveis, i.e., se rxy o
coeficiente de correlao da amostra bivariada
e so
transformaes lineares das variveis, ento
ou
| rxy | = 1 se todos os valores observados se
encontram sobre uma recta.
-1r1.
x
i
*
=a+bx
i
e y
i
*
=c+dy
i
( x
i
, y
i
)

i=1
n
r
x
*
y
*=r
xy
se bd>0
r
x
*
y
*=-r
xy
se bd 0.
39
Interpretao do valor de r
r = 1 se todos os pontos observados se encontram
sobre uma recta de declive positivo.
r 1 se todos os pontos observados se encontram
prximos de uma recta de declive positivo.
r 0 se a nuvem apresenta um aspecto arredondado
ou alongado segundo um dos eixos.
r 1 se todos os pontos observados se encontram
prximos de uma recta de declive negativo.
r = 1 se todos os pontos observados se encontram
sobre uma recta de declive negativo.
40
Exemplos
5 10 15
5
1
0
1
5
x
y
5 10 15
5
1
0
1
5
2
0
x
y
5 10 15
0
5
1
0
1
5
x
y
5 10 15
5
1
0
1
5
2
0
x
y
5 10 15
0
5
1
0
1
5
x
y
5 10 15
-
1
0
-
5
0
5
1
0
1
5
x
y
r = 1 r = -0.978 r = 0.898
r = 0.702 r = -0.163 r = -0.519
41
Interpretao do valor de r (cont.)
Um valor de r elevado no significa,
necessariamente, uma associao linear forte.
Pode ser uma consequncia da estrutura da nuvem de
pontos ou da existncia de pontos afastados.
r 0 no significa mais do que a ausncia de
qualquer relao ou tendncia linear entre as
variveis.
Uma das variveis pode ser completamente determinada
pela outra e a correlao ser nula.
No confundir associao estatstica com
causalidade:
um valor elevado de r no significa que x seja causa de y
ou que y seja causa de x.
42
Dados de Anscombe


> anscombe
x1 x2 x3 x4 y1 y2 y3 y4
1 10 10 10 8 8.04 9.14 7.46 6.58
2 8 8 8 8 6.95 8.14 6.77 5.76
3 13 13 13 8 7.58 8.74 12.74 7.71
4 9 9 9 8 8.81 8.77 7.11 8.84
5 11 11 11 8 8.33 9.26 7.81 8.47
6 14 14 14 8 9.96 8.10 8.84 7.04
7 6 6 6 8 7.24 6.13 6.08 5.25
8 4 4 4 19 4.26 3.10 5.39 12.50
9 12 12 12 8 10.84 9.13 8.15 5.56
10 7 7 7 8 4.82 7.26 6.42 7.91
11 5 5 5 8 5.68 4.74 5.73 6.89
mdia
x1 x2 x3 x4 y1 y2 y3 y4
9.00 9.00 9.00 9.00 7.50 7.50 7.50 7.50
varincia
x1 x2 x3 x4 y1 y2 y3 y4
11.00 11.00 11.00 11.00 4.13 4.13 4.12 4.12
43
Dados de Anscombe
4 6 8 10 12 14
4
5
6
7
8
9
1
1
x1
y
1
4 6 8 10 12 14
3
4
5
6
7
8
9
x2
y
2
4 6 8 10 12 14
6
8
1
0
1
2
x3
y
3
8 10 12 14 16 18
6
8
1
0
1
2
x4
y
4
y2 = 3.0+0.5x2
y4 = 3.0+0.5x4
y3 = 3.0+0.5x3
y1 = 3.0+0.5x1
r = 0.82
r = 0.82
r = 0.82
r = 0.82
44
Exemplos: r = 0
Situaes determinsticas: y = f(x)
45
Quadro de correlao
Quando a amostra bivariada muito grande, pode
ser til condensar os dados numa distribuio
(agrupada ou no) de frequncias bivariadas,
formando um quadro de correlao ou quadro de
dupla entrada.
A presena de frequncias mais elevadas sobre ou
na vizinhana de uma das diagonais do quadro de
correlao evidncia a existncia de correlao
(positiva ou negativa) entre as duas variveis em
questo.
Quando s se tem acesso a dados agrupados possvel
calcular valores (aproximados) de covarincia e do
coeficiente de correlao.
46
Regresso linear simples contexto descritivo
A regresso linear estima a relao linear entre duas
variveis:
x varivel preditora (independente)
y varivel resposta (dependente)
Por vezes no claro qual das variveis a resposta e
qual a varivel independente (altura, peso). Neste
caso deve usar-se uma anlise de correlao.
A regresso linear simples estima relaes da forma
y = b
0
+ b
1
x
47
Regresso linear simples - exemplo
x dimetro
altura do peito
(DAP)
y - volume tronco
n = 31 pares de
observaes em
cerejeiras
R package
trees(datasets)
48

Regresso linear simples contexto descritivo
y
i
=b
0
+b
1
x
i
e
i
=y
i
- y
i
=y
i
-(b
0
+b
1
x
i
)
Considerem-se n pares de observaes (x
i
, y
i
), i = 1 ,..., n.
Pretende-se determinar a recta y = b
0
+ b
1
x que melhor se
ajusta s n observaes de acordo com o critrio dos
mnimos quadrados.
Sejam os y
i
ajustados pela recta.
O erro ou resduo dado por .
Pretende-se determinar b
0
e b
1
que minimizem a soma dos
quadrados dos resduos.
49
Regresso linear simples exemplo
20 25 30 35 40 45 50
0
.
0
1
0
.
0
2
0
.
0
3
0
.
0
4
0
.
0
5
0
.
0
6
DAP (cm)
V
o
l
u
m
e

(
m
^
3
)
50
Seja
Determinar b
0
e b
1
que minimizem SQRE

Nota: b
1
tem o sinal de cov(x, y) e r.
Regresso linear simples contexto descritivo
SQRE=

i=1
n
e
i
2
=

i =1
n
( y
i
-b
0
-b
1
x
i
)
2

b
1
=
cov( x , y)
s
x
2
= r
s
y
s
x
b
0
=

y-b
1

x
51
Regresso linear simples exemplo
y = -1.04624 + 0.05648 x
52
(

x ,

y)
Regresso linear simples contexto descritivo
r
2
=0.9353199
A recta de regresso passa no ponto

O declive da recta b
1
:
chama-se coeficiente de regresso de y sobre x,
representa a variao esperada para y quando x
aumenta 1 unidade.
Preciso da recta:
Uma medida da preciso da recta de regresso
dada pelo coeficiente de determinao que
mede a percentagem de variabilidade de y que
explicada pela regresso.
Exemplo:
r
2
53
Bibliografia
Murteira, B.J.F. (1993) Anlise Exploratria de
Dados: Estatstica Descritiva, McGraw-Hill, Lisboa.
Murteira, B., Ribeiro, C.S., Silva, J.A. e Pimenta C.
(2010). Introduo Estatstica. Escolar Editora.
Neves, M. (2009) Introduo Estatstica e
Probabilidade. Apontamentos de apoio s aulas.
Estatstica Descritiva: www.isa.utl.pt/dm/estat/estat/seb1.pdf
Pestana, D.D. e Velosa, S.F. (2002) Introduo
Probabilidade e Estatstica, vol.I, Fundao
Caloustre Gulbenkian, Lisboa.

Вам также может понравиться