Вы находитесь на странице: 1из 40

HEP 57800 – Bioestatística

DATA Aula CONTEÚDO PROGRAMÁTICO


05/03 Terça 1 Níveis de mensuração, variáveis, organização de dados, apresentação tabular

07/03 Quinta 2 Apresentação tabular e gráfica

12/03 Terça 3 Apresentação gráfica; medidas de tendência central e de posição

14/03 Quinta 4 Medidas de tendência central e de posição; medidas de dispersão ou de variabilidade

19/03 Terça 5 Medidas de correlação, noções de regressão linear simples, estimando a equação da reta

21/03 Quinta 6 Medidas de associação

26/03 Terça 7 Consolidação de conteúdo - Exercícios

28/03 Quinta 8 Avaliação 1

09/04 Terça 9 Noções de probabilidade; noções de amostragem; distribuição binomial


11/04 Quinta 10 Distribuição normal, distribuição amostral da média
16/04 Terça 11 Teste de hipóteses de parâmetros populacionais – conceitos; teste de hipóteses de uma
proporção populacional
18/04 Quinta 12 Teste de hipóteses de associação
23/04 Terça 13 Teste de hipóteses de uma média populacional
25/04 Quinta 14 Teste de hipóteses de duas médias com amostras independentes e dependentes
30/04 Terça 15 Consolidação de conteúdo – Exercícios
02/06 Quinta 16 Estimação de parâmetros por intervalo de confiança: média e proporção
07/05 Terça 17 Exercícios
09/05 Quinta 18 Exercícios

14/05 Terça 19 Avaliação 2

Aulas 3 e 4 - Medidas de 1
tendência central e de dispersão
Medidas de tendência central e de dispersão

•Média aritmética
•Mediana
Valores mínimo e máximo
•Amplitude de variação
•Variância
•Desvio
Desvio padrão
•Coeficiente de variação de Pearson
•Quartis
•Percentis
•Box plot
•Exercícios

Aulas 3 e 4 - Medidas de 2
tendência central e de dispersão
Medidas de tendência central e de dispersão

•Média aritmética

Valores individuais
Valores em distribuição de freqüência
Valores em intervalos de classe

Aulas 3 e 4 - Medidas de 3
tendência central e de dispersão
Medidas de tendência central e de dispersão

Notação:
X → variável
N → tamanho da população
n → tamanho da amostra
µ → média populacional (parâmetro, geralmente desconhecido)
X → Estatística (fórmula)
x → média amostral (estimativa, valor calculado na amostra)

Aulas 3 e 4 - Medidas de 4
tendência central e de dispersão
Medidas de tendência central e de dispersão

•Média aritmética

Definição: Média aritmética é o valor que indica o centro de equilíbrio de


uma distribuição de freqüências de uma variável quantitativa.

Média aritmética - é a soma dos valores de uma variável, dividida pelo


número de valores.

Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12

3 + 5 + 8 + 12 = 12
Média = = 8 anos
5
3 – 8 =-5 anos
Desvios em torno da média: 5 – 8 =-3 anos
8 – 8 = 0 anos
2 – 8 = 4 anos
12 – 8 = 4 anos
soma = 0 anos

Aulas 3 e 4 - Medidas de 5
tendência central e de dispersão
Medidas de tendência central e de dispersão

•Média aritmética
• só existe para variáveis quantitativas e seu valor é único;

• é da mesma natureza da variável considerada (média = 8 anos); e

• sofre influência dos valores aberrantes (3, 5, 8, 12, 42; média = 14 anos)

Valores individuais

X: idade (anos) 3, 5, 8, 12, 12

x1 = 3; x2 = 5; x3=8; x4=12; x5= 12


n

x 1 + x 2 + ...+ x n ∑x
i =1
i
x= =
n n

Aulas 3 e 4 - Medidas de 6
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética
Os dados a seguir são provenientes do grupo Western Collaborative
Group Study, Califórnia (1960-61). Foram estudados 3154 homens de
meia idade para investigar a relação entre padrões de comportamento e
risco de doença coronariana.

Os dados apresentados são de 40 homens para os quais foram medidos


os níveis de colesterol (mg por 100ml) e realizada uma categorização
segundo comportamento.

O comportamento de tipo A é caracterizado pela urgência, agressividade


e ambição. O de tipo B é relaxado, não competitivo e menos preocupado.

Tipo A: nível de colesterol


233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

233 + 291 + ... + 212 + 325


xA = = 245,05 mg / 100 ml
20

Aulas 3 e 4 - Medidas de 7
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética

Tipo B: nível de colesterol


344 185 263 246 224 212 188 250 148 169
226 175 242 252 153 183 137 202 194 213

344 + 226 + ... + 169 + 213


xB = = 210,3mg / 100ml
20

Aulas 3 e 4 - Medidas de 8
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética - Valores em distribuição de freqüências

grupo A
Colesterol (X) fi xifi
181 1 181 4901
197 1 197 x= = 245,05 mg/100ml
202 1 202 20
212 1 212
218 1 218
224 1 224 k
233 1 233
234
239
246
248
1
2
1
1
234
478
246
248
∑ i =1
xi f i
250
252
1
1
250
252
x=
254 1 254 n
268 1 268
276 1 276 i representa o i-ésimo valor da variável
291 1 291
312 1 312
325 1 325
soma 20 4901

Aulas 3 e 4 - Medidas de 9
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética - valores em intervalos de classe
concentração fi ponto médio (xipm) xipmfi
180,0|--200,0 2 190 380
200,0|--220,0 3 210 630
220,0|--240,0 5 230 1150
240,0|--260,0 5 250 1250
260,0|--280,0 2 270 540
280,0|--300,0 1 290 290
300,0|--320,0 1 310 310
320,0|--340,0 1 330 330
total 20 4880

4880
x= = 244,0mg / 100ml
20
k i representa o i-ésimo intervalo

X=
∑ i=1
xipm fi x ipm representa o ponto médio do intervalo,
fi é a freqüência de indivíduos no intervalo i,
k é o número de intervalos e
n n o número de observações

Aulas 3 e 4 - Medidas de 10
tendência central e de dispersão
Medidas de tendência central e de dispersão

Mediana (Med)
É o valor que ocupa a posição central de uma série de n observações, quando estas
estão ordenadas de forma crescente ou decrescente.

a) valores individuais
Quando número de observações (n) for ímpar:
n+1
a mediana é o valor da variável que ocupa o posto
2

Quando o número de observações (n) for par:


a mediana é a média aritmética dos valores da variável que ocupam os
n n+2
postos e
2 2

Aulas 3 e 4 - Medidas de 11
tendência central e de dispersão
Medidas de tendência central e de dispersão
Mediana (Med)

Exemplo:
Tipo A: nível de colesterol
233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

Ordenando-se os valores:
181 202 218 233 239 246 250 254 276 312
197 212 224 234 239 248 252 268 291 325

239 + 246
Mediana = = 242,5mg / 100ml
2

Aulas 3 e 4 - Medidas de 12
tendência central e de dispersão
Medidas de tendência central e de dispersão
Mediana (Med)
Valores em distribuição de freqüência pontual
Colesterol (X) fi facumulada
181 1 1
197 1 2
202 1 3
212 1 4
218 1 5
224 1 6
233 1 7
234 1 8
239 2 10
246 1 11
248 1
250 1
252 1
254 1
268 1
276 1 239 + 246
291 1
Mediana = = 242,5mg / 100ml
312 1
2
325 1
Total 20

Aulas 3 e 4 - Medidas de 13
tendência central e de dispersão
Medidas de tendência central e de dispersão
Mediana (Med)
Valores em intervalos de classe

Nível de Colesterol (mg/100ml) (xi) fi facumulada


180|--200 2 2
200|--250 10 12
250|--300 6
300|--350 2
Total 20
Como são 20 observações, a mediana estará na posição 10 (20/2), a mediana
está na classe de 200|-- 250 mg/100ml

Descobrindo o valor da variável que está na posição 10:


8 x50
10 observações -------50 mg/100ml x= = 40
8 observações ------- x 10
Mediana = valor inicial do intervalo + 40 = 240 mg/100ml

Aulas 3 e 4 - Medidas de 14
tendência central e de dispersão
Medidas de tendência central e de dispersão

Mediana (Med) Valores em intervalos de classe

n
− f acumanterior
Med = Li + a 2
f classemediana
Li é o limite inferior da classe que contém a mediana

a é a amplitude da classe que contém a mediana

f acumanterior é a freqüência acumulada até a classe anterior à classe que


contém a mediana

f classemediana é a freqüência da classe que contém a mediana


20
−2
Med = 200 + 50 2 = 200 + 40 = 240mg / 100ml
10

Aulas 3 e 4 - Medidas de 15
tendência central e de dispersão
Medidas de tendência central e de dispersão

Mediana (Med)
OBS:
• existe para variável quantitativa e qualitativa ordinal;

• é da mesma natureza da variável considerada;

• torna-se inadequada quando há muitos valores repetidos;

• não sofre influência de valores aberrantes;


EX: 4,3 4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 17,8
Média aritmética: 8,43 pmol/l; Mediana: 7,2 pmol/l

4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 37,8
Média aritmética: 10,25 pmol/l; Mediana: 7,2 pmol/l

• pode ser calculada mesmo quando os dados estão agrupados em intervalos


de classe e os extremos de algum intervalo não esteja definido (a não ser
que a mediana caia neste intervalo).

Aulas 3 e 4 - Medidas de 16
tendência central e de dispersão
Medidas de tendência central e de dispersão

Medidas de dispersão

Valores mínimo e máximo: valores extremos da distribuição

Amplitude de variação: é a diferença entre os 2 valores extremos da


distribuição

Idade (grupo 1): 2, 4, 3, 5, 6, 4, 17 amplitude de variação = 17-2 = 15

Idade (grupo 2): 2, 2, 2, 2, 2, 2, 17 amplitude de variação = 15

Aulas 3 e 4 - Medidas de 17
tendência central e de dispersão
Medidas de tendência central e de dispersão

Variância e desvio padrão


Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12

3 + 5 + 8 + 12 = 12
Média = = 8 anos
5

Desvios em torno da média:


3 – 8 =-5 anos
5 – 8 =-3 anos
8 – 8 = 0 anos
12 – 8 = 4 anos
12 – 8 = 4 anos
soma = 0 anos
Desvios quadráticos em torno da média:
(3 – 8)2 =(-5 anos)2 = 25 anos2
(5 – 8)2 =(-3 anos)2 = 9 anos2
(8 – 8)2 = (0 anos)2= 0 anos2
(12 – 8)2= (4 anos)2= 16 anos2
(12 – 8)2= (4 anos)2 = 16anos2
soma dos desvios quadráticos em torno da média = 66 anos2

Aulas 3 e 4 - Medidas de 18
tendência central e de dispersão
Medidas de tendência central e de dispersão

Variância e desvio padrão

Variância = soma dos desvios quadráticos em torno da média/número de


observações

66
Variância = = 13,2 anos 2
5

σ = σ2
Desvio padrão: é a raiz quadrada da variância , ou seja
S = S2
Desvio padrão = 13,2anos 2 = 3,63 anos

Aulas 3 e 4 - Medidas de 19
tendência central e de dispersão
Medidas de tendência central e de dispersão

Valores individuais:
N
2
(
∑ iX − X )
Variância populacional: σ2 = i =1

N
n
2
(
∑ ix − x )
2 i =1
Variância amostral: S =
n −1

Aulas 3 e 4 - Medidas de 20
tendência central e de dispersão
Medidas de tendência central e de dispersão
Exemplo:
Tipo A: nível de colesterol
233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

2 (233 − 245,05) 2 + ... + (325 − 245,05) 2


Variância: s = = 1342,37(mg / 100ml ) 2
19

Desvio padrão s = 1342,37 = 36,64mg / 100ml

Tipo B: nível de colesterol


344 185 263 246 224 212 188 250 148
226 175 242 252 153 183 137 202 194
2 (344 − 210,3) 2 + ... + (213 − 210,3) 2
Variância: s = = 2336,747(mg / 100ml ) 2
19
Desvio padrão s = 2336,747 = 48,34mg / 100ml

Aulas 3 e 4 - Medidas de 21
tendência central e de dispersão
Medidas de tendência central e de dispersão
Valores em distribuição de freqüências
n

∑ (x i − x)2 fi
Variância amostral: S2 = i =1

n −1
Tipo A:
Nível de Colesterol
(mg/100ml)
fi xifi
( xi − x ) 2 ( xi − x ) 2 f i
(xi)
181 1 181 4102,40 4102,40
197 1 197 2308,80 2308,80
202 1 202 1853,30 1853,30
212 1 212 1092,30 1092,30
218 1 218 731,70 731,70
224 1 224 443,10 443,10
233 1 233 145,20 145,20
234 1 234 122,10 122,10
239 2 478 36,60 73,21
246 1 246 0,90 0,90
248 1 248 8,70 8,70
250 1 250 24,50 24,50
252 1 252 48,30 48,30
254 1 254 80,10 80,10
268 1 268 526,70 526,70
276 1 276 957,90 957,90
291 1 291 2111,40 2111,40
312 1 312 4482,30 4482,30
325 1 325 6392,00 6392,00
Total 20 4901 25504,95

25504,95
s A2 = = 1342,37(mg / 100ml ) 2 ; s A = 1342,37 = 36,64mg / 100ml
19

Aulas 3 e 4 - Medidas de 22
tendência central e de dispersão
Medidas de tendência central e de dispersão
Tipo B:
Nível de Colesterol (mg/100ml) (xi) fi xifi
( xi − x ) 2 ( x i − x ) 2 xf i
137 1 137 5372,89 5372,89
148 1 148 3881,29 3881,29
153 1 153 3283,29 3283,29
169 1 169 1705,69 1705,69
175 1 175 1246,09 1246,09
183 1 183 745,29 745,29
185 1 185 640,09 640,09
188 1 188 497,29 497,29
194 1 194 265,69 265,69
202 1 202 68,89 68,89
212 1 212 2,89 2,89
213 1 213 7,29 7,29
224 1 224 187,69 187,69
226 1 226 246,49 246,49
242 1 242 1004,89 1004,89
246 1 246 1274,49 1274,49
250 1 250 1576,09 1576,09
252 1 252 1738,89 1738,89
263 1 263 2777,29 2777,29
344 1 344 17875,69 17875,69
Total 20 4206 44398,2
44398,2
s B2 = = 2336,747(mg / 100ml ) 2 ; s B = 2336,747 = 48,34mg / 100ml
19

Aulas 3 e 4 - Medidas de 23
tendência central e de dispersão
Medidas de tendência central e de dispersão

Valores em intervalos de classe


n

∑( x ipm − x )2 fi
Variância amostral: S2 = i =1
n −1

Nível de Colesterol fi xi ponto xipmfi ( x ipm − x ) 2 ( x ipm − x ) 2 f i


(mg/100ml) (xi) médio (xipm)
180|--200 2 190 380 3192,25 6384,5
200|--250 10 225 2250 462,25 4622,5
250|--300 6 275 1650 812,25 4873,5
300|--350 2 325 650 6162,25 12324,5
Total 20 4930 28205,0

155 x0 + ... + 325 x 2 4930


xA = = = 246,5mg / 100ml
20 20
28205,0
s A2 = = 1484,47(mg / 100ml ) 2 ; s A = 1484,47 = 38,53mg / 100ml
19

Aulas 3 e 4 - Medidas de 24
tendência central e de dispersão
Medidas de tendência central e de dispersão

Tipo B
Nível de fi xi ponto xipmfi ( x ipm − x ) 2 ( x ipm − x ) 2 f i
Colesterol médio (xipm)
(mg/100ml) (xi)
130|--180 5 155 775 3364 16820
180|--200 4 190 760 529 2116
200|--250 7 225 1575 144 1008
250|--300 3 275 825 3844 11532
300|--350 1 325 325 12544 12544
Total 20 4260 44020

155 x5 + ... + 325 x1 4260


xB = = = 213,0mg / 100ml
20 20

44020
s A2 = = 2316,84(mg / 100ml ) 2 ; s A = 2316,84 = 48,13mg / 100ml
19

Aulas 3 e 4 - Medidas de 25
tendência central e de dispersão
Medidas de tendência central e de dispersão

Coeficiente de Variação de Pearson (CV):


S
é o quociente entre o desvio padrão e a média, ou seja CV = x100
x

36,64 48,34
CVtipo A: x100 = 15,0% ; CVtipoB: x100 = 23,0% ;
245,05 210,3

Questão 13
São fornecidos valores de nível de triglicérides (mg/dL) de 9 pessoas
166 158 202 166 135 86 150 86 121
Calcule, apresentando o desenvolvimento da fórmula:

a) o nível médio de triglicérides;


b) o nível mediano de triglicérides;
c) o desvio padrão do nível de triglicérides e
d) o coeficiente de variação do nível de triglicérides.

Aulas 3 e 4 - Medidas de 26
tendência central e de dispersão
Medidas de tendência central e de dispersão

Questão 14
A tabela abaixo foi extraída do artigo: Diagnóstico de sobrepeso em
adolescentes: estudo do desempenho de diferentes critérios para o Índice de
Massa Corporal de MONTEIRO POA et al. (Rev. Saúde Pública, 2000;.34(5):506-
13).
Discuta os resultados obtidos ignorando a coluna do valor de p (este tópico será abordado na
disciplina Bioestatística II).

Aulas 3 e 4 - Medidas de 27
tendência central e de dispersão
Medidas de tendência central e de dispersão
A tabela abaixo foi extraída do artigo: Avaliação da capacidade preditiva da
circunferência da cintura para obesidade global e hipertensão arterial em
mulheres residentes na Região Metropolitana de Belo Horizonte, Brasil de
VELASQUEZ-MELENDEZ G et al. (Cad. Saúde Pública, 2002; 18(3): 765-771).
Calcule e interprete os coeficientes de variação de Pearson para cada uma das
variáveis apresentadas.

Aulas 3 e 4 - Medidas de 28
tendência central e de dispersão
Medidas de tendência central e de dispersão

Quartil
Valores da variável que dividem a distribuição em quatro partes iguais.
¼ ½ ¾
25% 25% 25% 25%

Q1: deixa abaixo 25% das observações


25% 75%

Q2: deixa abaixo 50% das observações


50% 50%

Q3: deixa abaixo 75% das


observações
75% 25%
Primeiro quartil: Q1 = x 1 ; Terceiro quartil: Q3 = x 3
( ( n +1)) ( ( n +1))
4 4
1 3
onde x é o valor da variável e ( ( n + 1)) e ( ( n + 1)) são índices que
4 4
representam as posições ocupadas por x.

Aulas 3 e 4 - Medidas de 29
tendência central e de dispersão
Medidas de tendência central e de dispersão
1.030* 1.310* 2.200* 1.680 2.550
1.050* 1.500* 2.270* 1.715 2.570
1.100* 1.550* 2.275* 1.720 2.600
1.175* 1.600* 2.440* 1.760 2.700
1.185* 1.720* 2.500* 1.930 2.830
1.225* 1.750* 2.560* 2.015 2.950
1.230* 1.770* 2.730* 2.040 3.005
1.262* 1.820* 1.130 2.090 3.160
1.295* 1.890* 1.410 2.200 3.400
1.300* 1.940* 1.575 2.400 3.640

Entre os recém-nascidos que sobreviveram:


Q1 = x 1 = x 6 = 1720 g
( ( 23+1))
4

Q3 = x 3 = x18 = 2830 g
( ( 23+1))
4

Observe que Q2 = x 1 = x12 = 2200g


( ( 23+1))
2

Entre os recém-nascidos que foram a óbito


Q1 = x 1 = x 7 = 1230 g
( ( 27 +1))
4

Q3 = x 3 = x21 = 2200g e Q 2 = x 1 = x14 = 1600 g


( ( 27 +1)) ( ( 27 +1))
4 2

Aulas 3 e 4 - Medidas de 30
tendência central e de dispersão
Medidas de tendência central e de dispersão

Supor o exemplo com 22 observações:


n=22
Q1 = x 1 =x 23 =x 3
( ( 22+1)) ( ) (5 )
4 4 4

que é ¾ do caminho entre x5=1715 e x6=1720


3
Q1 = 1715 + (1720 − 1715) = 1718,8 g
4
Q3 = x 3 =x 1
( ( 22 +1)) (17 )
4 4

que é ¼ do caminho entre x17=2700 e x18=2830


1
Q3 = 2700 + (2830 − 2700) = 2732,5 g
4

Aulas 3 e 4 - Medidas de 31
tendência central e de dispersão
Medidas de tendência central e de dispersão
Percentil
Valores da variável que dividem a distribuição em cem partes iguais.

Entre os recém-nascidos que sobreviveram

Percentil 5:
P5 = x 5 = x 120 = x 1
( ( 23+1)) ( ) (1 )
100 100 5
1
P5 = 1130 + (1410 − 1130) = 1186 g
5
que é 1/5 do caminho entre x1=1130 e x2=1410

Percentil 10:
P10 = x = x 240 = x 2
(
10
( 23+1)) ( )
2 ;
(2 )
P10 = 1410 + (1575 − 1410 ) = 1476 g
100 100 5 5

Percentil 50:
P50 = x 50 = x 1200 = x(12) ; P50 = 2200 g
( ( 23+1)) ( )
100 100
Percentil 75:
P75 = x 75 = x 1800 = x(18) ; P75 = 2830g
( ( 23+1)) ( )
100 100
Percentil 90:
P90 = x = x 2160 = x 3
(
90
( 23+1)) ( )
3
( 21 )
; P90 = 3160 + (3400 − 3160 ) = 3304 g
100 100 5 5

Aulas 3 e 4 - Medidas de 32
tendência central e de dispersão
Medidas de tendência central e de dispersão
Box plot e identificação de valores aberrantes (outliers)

O Box plot representa graficamente dados de forma resumida em um retângulo onde as linhas
da base e do topo são o primeiro e o terceiro quartis, respectivamente. A linha entre estas é a
mediana. Linhas verticais que iniciam no meio da base e do topo do retângulo, terminam em
valores denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60).

O valor adjacente superior é o maior valor das observações que é menor ou igual a Q3+1,5(Q3-
Q1) e o valor adjacente inferior é definido como o menor valor que é maior ou igual a Q1-
1,5(Q3-Q1), sendo a diferença Q3-Q1 denominada intervalo inter-quartil (IIQ).

Valores outliers (discrepantes ou aberrantes) são valores que “fogem” da distribuição dos
dados. O box plot além de apresentar a dispersão dos dados torna-se útil também para
identificar a ocorrência destes valores como sendo os que caem fora dos limites estabelecidos
pelos valores adjacentes superior e inferior.
colesterol
380
360
340
320

300
280

260
240
220
200

180
160

140
120
A B

Aulas 3 e 4 - Medidas de 33
tendência central e de dispersão
Box plot
Tipo A: nível de colesterol
181 202 218 233 239 246 250 254 276 312
197 212 224 234 239 248 252 268 291 325

Tipo A:
n=20;
1
Q1 = x 1 = x 21 = x 1 = 218 + (224 − 218) = 218 + 1,5 = 219,5
4
( n +1)
4
5
4
4
3
Q3 = x 3 = x3 =x 3 = 254 + (268 − 254) = 254 + 10,5 = 264,5
4
( n +1)
4
( 21) 15
4
4

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45

325 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 332,
onde 332 é dado por: 264,5 + 1,5 x 45 = 332 .

181 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 152, onde
152 é dado por: 219,5 − 1,5 x 45 = 152 .

Aulas 3 e 4 - Medidas de 34
tendência central e de dispersão
Box plot

Tipo B
n=20
1
Q1 = x 1 = x 21 = x 1 = 175 + (183 − 175) = 175 + 2 = 177
4
( n +1)
4
5
4
4
3
Q3 = x 3 = x3 =x 3 = 242 + (246 − 242) = 242 + 3 = 245
4
( n +1)
4
( 21) 15
4
4

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68

344 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 347,
onde 347 é dado por: 245 + 1,5 x 68 = 347 .

137 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 75, onde 75
é dado por: 177 − 1,5 x68 = 75 .

Aulas 3 e 4 - Medidas de 35
tendência central e de dispersão
Box plot
Tipo A:
n=20;
1
Q1 = x 1 = x 21 = x 1 = 218 + (224 − 218) = 218 + 1,5 = 219,5
4
( n+1)
4
5
4
4
3
Q3 = x 3 = x3 =x 3 = 254 + (268 − 254) = 254 + 10,5 = 264,5
4
( n+1)
4
( 21) 15
4
4

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45

325 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 332,
onde 332 é dado por: 264,5 + 1,5x45 = 332 .

181 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 152, onde
152 é dado por: 219,5 − 1,5x45 = 152.

Tipo B
n=20
1
Q1 = x 1 = x 21 = x 1 = 175 + (183 − 175) = 175 + 2 = 177
4
( n +1)
4
5
4
4
3
Q3 = x 3 = x3 =x 3 = 242 + (246 − 242) = 242 + 3 = 245
4
( n+1)
4
( 21) 15
4
4

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68

344 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 347,
onde 347 é dado por: 245 + 1,5x68 = 347.

137 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 75, onde 75
é dado por: 177 − 1,5x68 = 75 .

Aulas 3 e 4 - Medidas de 36
tendência central e de dispersão
Validade de Curso de capacitação em medida da Altura uterina para enfermeiros e graduandos de
Enfermagem. Camila C A Paiva; Djacyr MC Freire. Ver Bras Enferm, Brasilia 2012, set-out;65(5):775-9

Aulas 3 e 4 - Medidas de 37
tendência central e de dispersão
Box plot
Questão 16
Os dados a seguir são de uma pesquisa que investigou as concentrações de
minerais no leite materno, no período de 1984 a 1985. Foram coletadas
amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital
Maternidade Odete Valadares, em Belo Horizonte. As mães foram divididas em
período de lactação: colostro e leite maduro.
cálcio (µg/mL de leite) – grupo colostro
113 181 254 311 334 145 221 256 312 344
163 225 275 313 372 163 231 296 323 375
167 241 303 325 375 437
cálcio (µg/mL de leite) – grupo maduro
159 175 181 188 200 206 213 214 217 231
238 238 242 244 256 259 260 263 264 275
277 279 281 293 302 303 314 344 394
a) Calcule a quantidade média de cálcio (µg/mL de leite) em cada grupo.
b) Calcule a quantidade mediana de cálcio (µg/mL de leite) em cada grupo.
c) Desenhe o box plot da concentração de cálcio (µg/mL de leite) representando os dois grupos
em um só gráfico.
d) Comente o gráfico box plot quanto a dispersão dos dados, existência de valores aberrantes e
igualdade de medianas.

Aulas 3 e 4 - Medidas de 38
tendência central e de dispersão
Questão 16

26

∑x i =1
i
7055
Grupo colostro: x = = = 271,35µg / mL
n 26
26

∑x
i =1
i
7310
Grupo maduro: x = = = 252,07µg / mL
n 29

Grupo colostro: n=26 (par) Mediana é a media dos valores que ocupam os postos 13 e
275 + 296
14. Med = = 285,5µg / mL
2

Grupo maduro: n=29 (ímpar); a mediana é o valor da variável que ocupa o posto 15.
Med= 256 µg/mL

Aulas 3 e 4 - Medidas de 39
tendência central e de dispersão
Questão 16
Medida Grupo colostro Grupo maduro
Q1 211 213,5
Q2 285,5 256
Q3 327,25 280
Valor adjacente inferior 113 159
Valor adjacente superior 437 344
valor adjacente superior: maior valor abaixo de Q3+1,5x(IIQ)
Valor adjacente inferior: Menor valor acima de Q1-1,5x(IIQ)
var1
500

450

400

350

300

250

200

150

100
grupo colostro grupo maduro

“Box plot” da variável concentração de cálcio (µg/mL) segundo grupo de leite (colostro e
maduro)

Aulas 3 e 4 - Medidas de 40
tendência central e de dispersão

Вам также может понравиться