Вы находитесь на странице: 1из 11

!

" Joaquim Costa, DMA-FCUP 37


DIAGRAMA CAIXA-DOS-BIGODES

A diferena entre este diagrama e o anterior que os bigodes, em vez
de terminarem na 1 e ltima observao, terminam, eventualmente,
antes.


O 1 bigode termina na menor observao que maior ou igual a
) ( 5 . 1
1 3 1
Q Q Q .


O 2 bigode termina na maior observao que menor ou igual a
) ( 5 . 1
1 3 3
Q Q Q + .

Assim podemos representar as observaes aberrantes (outliers) com
um asterisco, por exemplo.
!$ Joaquim Costa, DMA-FCUP 38
MEDIDAS DE DISPERSO
Varincia Amostral:
) (
1
1
1
2 2
!
=

=
n
i
i
X X
n
S
varincia em distribuies no agrupadas



1
1
2
1
2 2
"
#
$
%
&
'

(
(
)
*
+
+
,
-

=
!
=
X n X
n
S
n
i
i

Para clculo ( mais prtico )


( )
"
#
$
%
&
'

(
(
)
*
+
+
,
-

=
!
=
2
1
2 2
1
1
X n X f
n
S
K
i
i
i

varincia em distribuies agrupadas em classes

%&
Joaquim Costa, DMA-FCUP 39
fi freq. de cada classe,
K n. de classes e
i
X

centro da classe.



NOTA: por vezes divide-se por n em vez de n-1 no clculo da
varincia amostral; h ainda outros valores que so mais
raramente usados.



A mdia nas distribuies agrupadas em classes dada por:

!
=
=
K
i
i
i
X f
n
X
1

1

%!
Joaquim Costa, DMA-FCUP 40
No caso das distribuies agrupadas, comete-se um certo erro no clculo
da varincia, devido a utilizar o centro da classe para o clculo, o que
faz aumentar o valor da varincia.


Desde que a amplitude de cada classe, x, seja constante, a varincia,


!
"
#
$
%
&

=
'
=
K
i
i
X n X fi
n
S
1
2
2 2
1
1
,
pode ser corrigida subtraindo a correco de Sheppard :
12
2
x


12 1
1
S
2
1
2 2
x
X n X fi
n
K
i
i

!
"
#
$
%
&

=
'
=

varincia para dados agrupados em classes, e com correco de Sheppard
%%
Joaquim Costa, DMA-FCUP 41
Desvio Padro Amostral:


a raiz quadrada positiva da varincia amostral. Representa-se por S.


S S o a Padr Desvio = =
2
~


desvio padro

Uma pergunta que pode surgir : o desvio padro calculado grande ou
pequeno? Por exemplo, s=2.3 cm grande ?


Um desvio padro pode ser considerado grande ou pequeno dependendo
da ordem de grandeza da varivel. S=2.3cm pode ser pequeno se por
exemplo a mdia for 236cm; se a mdia for 0.5cm, s=2.3cm grande.
%'
Joaquim Costa, DMA-FCUP 42
COEFICIENTES DE VARIAO E DESVIO PADRO RELATIVO

Uma maneira de medir a variabilidade dos dados tirando a influncia da
ordem de grandeza da varivel atravs do coeficiente de variao,
definido por:



X
S
o a Varia de e Coeficient

~
=




S definido para variveis com mdia no nula e sobretudo til para
variveis sempre positivas.

%(
Joaquim Costa, DMA-FCUP 43
frequentemente expresso em percentagem (%) multiplicando o valor
acima por 100.

O valor absoluto ento designado por desvio padro relativo:


% 100
| |

=
X
S
relativo padro Desvio




Suponhamos, por exemplo, que 5 e 2 cm x cm s = = . Ento,

40 % 100
cm 5
2
. . . = =
cm
r p d %

%)
Joaquim Costa, DMA-FCUP 44
O coeficiente de variao e o d.p.r. so totalmente independente das
unidades de medida utilizadas.


O mesmo no acontece em relao varincia e ao desvio padro.



Um desvio padro relativo por vezes considerado baixo se for inferior
a 25%, mas isto varia de acordo com a aplicao.



Por exemplo, em medidas vitais, tais como temperatura corporal,
espera-se um d.p.r. muito menor do que 25% para que os dados sejam
considerados homogneos.

%*
Joaquim Costa, DMA-FCUP 45
O desvio padro til para medir a variao num grupo de dados.


No entanto, quando se quer comparar a variao em dois grupos de
dados diferentes, o desvio padro pode no ser apropriado.


Pode ser que, por exemplo, as variveis a comparar sejam medidas em
unidades diferentes, como por exemplo o peso em kg e a altura em cm.


Para isso usa-se o coeficiente de variao ou o desvio padro relativo.


Mesmo quando as unidades de medida so as mesmas, o coeficiente de
variao ou d.p.r. podem ser mais apropriados para comparaes do que
o desvio padro.
%+
Joaquim Costa, DMA-FCUP 46
O coeficiente de variao pois um nmero puro, independente das
unidades de medida utilizadas.


! !! !"!#$%& "!#$%& "!#$%& "!#$%&' '' ' num grupo de pacientes foram medidas as pulsaes
(batidas por minuto) e as taxas de cido rico (mg/100ml).


As mdias e os desvios padro foram respectivamente:

68.7 e 8.7 para a pulsao e 5.46 e 1.03 para o cido rico.


Apesar do d.p. da pulsao ser maior, nitidamente o coeficiente de
variao da pulsao (0.127) menor do que no cido rico (0.232), o
que evidencia que a pulsao mais estvel do que o cido rico.

%"
Joaquim Costa, DMA-FCUP 47
OUTRA MEDIDA DE DISPERSO: R=Max(Xi) Min (Xi)
designa-se por amplitude amostral

! !! !"!#$%$&' "!#$%$&' "!#$%$&' "!#$%$&'( (( ( O ph de uma soluo medido 8 vezes por uma dada
tcnica, tendo-se obtido os seguintes valores: 7.15, 7.20, 7.18, 7.19,
7.21, 7.20, 7.16, 7.18;

47 . 57
8
1
=
!
= i
i
x e 8531 . 412
8
1
2
=
!
= i
i
x .

Calcule a mdia, varincia, coeficiente de variao, mediana e
amplitude amostral dos dados.

Para alm das medidas de localizao e de disperso, as outras
caractersticas mais populares para caracterizar um conjunto de dados
tm a ver com a simetria e o achatamento:

Вам также может понравиться