Академический Документы
Профессиональный Документы
Культура Документы
19/03 Terça 5 Medidas de correlação, noções de regressão linear simples, estimando a equação da reta
Aulas 3 e 4 - Medidas de 1
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética
•Mediana
Valores mínimo e máximo
•Amplitude de variação
•Variância
•Desvio
Desvio padrão
•Coeficiente de variação de Pearson
•Quartis
•Percentis
•Box plot
•Exercícios
Aulas 3 e 4 - Medidas de 2
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética
Valores individuais
Valores em distribuição de freqüência
Valores em intervalos de classe
Aulas 3 e 4 - Medidas de 3
tendência central e de dispersão
Medidas de tendência central e de dispersão
Notação:
X → variável
N → tamanho da população
n → tamanho da amostra
µ → média populacional (parâmetro, geralmente desconhecido)
X → Estatística (fórmula)
x → média amostral (estimativa, valor calculado na amostra)
Aulas 3 e 4 - Medidas de 4
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética
3 + 5 + 8 + 12 = 12
Média = = 8 anos
5
3 – 8 =-5 anos
Desvios em torno da média: 5 – 8 =-3 anos
8 – 8 = 0 anos
2 – 8 = 4 anos
12 – 8 = 4 anos
soma = 0 anos
Aulas 3 e 4 - Medidas de 5
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética
• só existe para variáveis quantitativas e seu valor é único;
• sofre influência dos valores aberrantes (3, 5, 8, 12, 42; média = 14 anos)
Valores individuais
x 1 + x 2 + ...+ x n ∑x
i =1
i
x= =
n n
Aulas 3 e 4 - Medidas de 6
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética
Os dados a seguir são provenientes do grupo Western Collaborative
Group Study, Califórnia (1960-61). Foram estudados 3154 homens de
meia idade para investigar a relação entre padrões de comportamento e
risco de doença coronariana.
Aulas 3 e 4 - Medidas de 7
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética
Aulas 3 e 4 - Medidas de 8
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética - Valores em distribuição de freqüências
grupo A
Colesterol (X) fi xifi
181 1 181 4901
197 1 197 x= = 245,05 mg/100ml
202 1 202 20
212 1 212
218 1 218
224 1 224 k
233 1 233
234
239
246
248
1
2
1
1
234
478
246
248
∑ i =1
xi f i
250
252
1
1
250
252
x=
254 1 254 n
268 1 268
276 1 276 i representa o i-ésimo valor da variável
291 1 291
312 1 312
325 1 325
soma 20 4901
Aulas 3 e 4 - Medidas de 9
tendência central e de dispersão
Medidas de tendência central e de dispersão
•Média aritmética - valores em intervalos de classe
concentração fi ponto médio (xipm) xipmfi
180,0|--200,0 2 190 380
200,0|--220,0 3 210 630
220,0|--240,0 5 230 1150
240,0|--260,0 5 250 1250
260,0|--280,0 2 270 540
280,0|--300,0 1 290 290
300,0|--320,0 1 310 310
320,0|--340,0 1 330 330
total 20 4880
4880
x= = 244,0mg / 100ml
20
k i representa o i-ésimo intervalo
X=
∑ i=1
xipm fi x ipm representa o ponto médio do intervalo,
fi é a freqüência de indivíduos no intervalo i,
k é o número de intervalos e
n n o número de observações
Aulas 3 e 4 - Medidas de 10
tendência central e de dispersão
Medidas de tendência central e de dispersão
Mediana (Med)
É o valor que ocupa a posição central de uma série de n observações, quando estas
estão ordenadas de forma crescente ou decrescente.
a) valores individuais
Quando número de observações (n) for ímpar:
n+1
a mediana é o valor da variável que ocupa o posto
2
Aulas 3 e 4 - Medidas de 11
tendência central e de dispersão
Medidas de tendência central e de dispersão
Mediana (Med)
Exemplo:
Tipo A: nível de colesterol
233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325
Ordenando-se os valores:
181 202 218 233 239 246 250 254 276 312
197 212 224 234 239 248 252 268 291 325
239 + 246
Mediana = = 242,5mg / 100ml
2
Aulas 3 e 4 - Medidas de 12
tendência central e de dispersão
Medidas de tendência central e de dispersão
Mediana (Med)
Valores em distribuição de freqüência pontual
Colesterol (X) fi facumulada
181 1 1
197 1 2
202 1 3
212 1 4
218 1 5
224 1 6
233 1 7
234 1 8
239 2 10
246 1 11
248 1
250 1
252 1
254 1
268 1
276 1 239 + 246
291 1
Mediana = = 242,5mg / 100ml
312 1
2
325 1
Total 20
Aulas 3 e 4 - Medidas de 13
tendência central e de dispersão
Medidas de tendência central e de dispersão
Mediana (Med)
Valores em intervalos de classe
Aulas 3 e 4 - Medidas de 14
tendência central e de dispersão
Medidas de tendência central e de dispersão
n
− f acumanterior
Med = Li + a 2
f classemediana
Li é o limite inferior da classe que contém a mediana
Aulas 3 e 4 - Medidas de 15
tendência central e de dispersão
Medidas de tendência central e de dispersão
Mediana (Med)
OBS:
• existe para variável quantitativa e qualitativa ordinal;
4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 37,8
Média aritmética: 10,25 pmol/l; Mediana: 7,2 pmol/l
Aulas 3 e 4 - Medidas de 16
tendência central e de dispersão
Medidas de tendência central e de dispersão
Medidas de dispersão
Aulas 3 e 4 - Medidas de 17
tendência central e de dispersão
Medidas de tendência central e de dispersão
3 + 5 + 8 + 12 = 12
Média = = 8 anos
5
Aulas 3 e 4 - Medidas de 18
tendência central e de dispersão
Medidas de tendência central e de dispersão
66
Variância = = 13,2 anos 2
5
σ = σ2
Desvio padrão: é a raiz quadrada da variância , ou seja
S = S2
Desvio padrão = 13,2anos 2 = 3,63 anos
Aulas 3 e 4 - Medidas de 19
tendência central e de dispersão
Medidas de tendência central e de dispersão
Valores individuais:
N
2
(
∑ iX − X )
Variância populacional: σ2 = i =1
N
n
2
(
∑ ix − x )
2 i =1
Variância amostral: S =
n −1
Aulas 3 e 4 - Medidas de 20
tendência central e de dispersão
Medidas de tendência central e de dispersão
Exemplo:
Tipo A: nível de colesterol
233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325
Aulas 3 e 4 - Medidas de 21
tendência central e de dispersão
Medidas de tendência central e de dispersão
Valores em distribuição de freqüências
n
∑ (x i − x)2 fi
Variância amostral: S2 = i =1
n −1
Tipo A:
Nível de Colesterol
(mg/100ml)
fi xifi
( xi − x ) 2 ( xi − x ) 2 f i
(xi)
181 1 181 4102,40 4102,40
197 1 197 2308,80 2308,80
202 1 202 1853,30 1853,30
212 1 212 1092,30 1092,30
218 1 218 731,70 731,70
224 1 224 443,10 443,10
233 1 233 145,20 145,20
234 1 234 122,10 122,10
239 2 478 36,60 73,21
246 1 246 0,90 0,90
248 1 248 8,70 8,70
250 1 250 24,50 24,50
252 1 252 48,30 48,30
254 1 254 80,10 80,10
268 1 268 526,70 526,70
276 1 276 957,90 957,90
291 1 291 2111,40 2111,40
312 1 312 4482,30 4482,30
325 1 325 6392,00 6392,00
Total 20 4901 25504,95
25504,95
s A2 = = 1342,37(mg / 100ml ) 2 ; s A = 1342,37 = 36,64mg / 100ml
19
Aulas 3 e 4 - Medidas de 22
tendência central e de dispersão
Medidas de tendência central e de dispersão
Tipo B:
Nível de Colesterol (mg/100ml) (xi) fi xifi
( xi − x ) 2 ( x i − x ) 2 xf i
137 1 137 5372,89 5372,89
148 1 148 3881,29 3881,29
153 1 153 3283,29 3283,29
169 1 169 1705,69 1705,69
175 1 175 1246,09 1246,09
183 1 183 745,29 745,29
185 1 185 640,09 640,09
188 1 188 497,29 497,29
194 1 194 265,69 265,69
202 1 202 68,89 68,89
212 1 212 2,89 2,89
213 1 213 7,29 7,29
224 1 224 187,69 187,69
226 1 226 246,49 246,49
242 1 242 1004,89 1004,89
246 1 246 1274,49 1274,49
250 1 250 1576,09 1576,09
252 1 252 1738,89 1738,89
263 1 263 2777,29 2777,29
344 1 344 17875,69 17875,69
Total 20 4206 44398,2
44398,2
s B2 = = 2336,747(mg / 100ml ) 2 ; s B = 2336,747 = 48,34mg / 100ml
19
Aulas 3 e 4 - Medidas de 23
tendência central e de dispersão
Medidas de tendência central e de dispersão
∑( x ipm − x )2 fi
Variância amostral: S2 = i =1
n −1
Aulas 3 e 4 - Medidas de 24
tendência central e de dispersão
Medidas de tendência central e de dispersão
Tipo B
Nível de fi xi ponto xipmfi ( x ipm − x ) 2 ( x ipm − x ) 2 f i
Colesterol médio (xipm)
(mg/100ml) (xi)
130|--180 5 155 775 3364 16820
180|--200 4 190 760 529 2116
200|--250 7 225 1575 144 1008
250|--300 3 275 825 3844 11532
300|--350 1 325 325 12544 12544
Total 20 4260 44020
44020
s A2 = = 2316,84(mg / 100ml ) 2 ; s A = 2316,84 = 48,13mg / 100ml
19
Aulas 3 e 4 - Medidas de 25
tendência central e de dispersão
Medidas de tendência central e de dispersão
36,64 48,34
CVtipo A: x100 = 15,0% ; CVtipoB: x100 = 23,0% ;
245,05 210,3
Questão 13
São fornecidos valores de nível de triglicérides (mg/dL) de 9 pessoas
166 158 202 166 135 86 150 86 121
Calcule, apresentando o desenvolvimento da fórmula:
Aulas 3 e 4 - Medidas de 26
tendência central e de dispersão
Medidas de tendência central e de dispersão
Questão 14
A tabela abaixo foi extraída do artigo: Diagnóstico de sobrepeso em
adolescentes: estudo do desempenho de diferentes critérios para o Índice de
Massa Corporal de MONTEIRO POA et al. (Rev. Saúde Pública, 2000;.34(5):506-
13).
Discuta os resultados obtidos ignorando a coluna do valor de p (este tópico será abordado na
disciplina Bioestatística II).
Aulas 3 e 4 - Medidas de 27
tendência central e de dispersão
Medidas de tendência central e de dispersão
A tabela abaixo foi extraída do artigo: Avaliação da capacidade preditiva da
circunferência da cintura para obesidade global e hipertensão arterial em
mulheres residentes na Região Metropolitana de Belo Horizonte, Brasil de
VELASQUEZ-MELENDEZ G et al. (Cad. Saúde Pública, 2002; 18(3): 765-771).
Calcule e interprete os coeficientes de variação de Pearson para cada uma das
variáveis apresentadas.
Aulas 3 e 4 - Medidas de 28
tendência central e de dispersão
Medidas de tendência central e de dispersão
Quartil
Valores da variável que dividem a distribuição em quatro partes iguais.
¼ ½ ¾
25% 25% 25% 25%
Aulas 3 e 4 - Medidas de 29
tendência central e de dispersão
Medidas de tendência central e de dispersão
1.030* 1.310* 2.200* 1.680 2.550
1.050* 1.500* 2.270* 1.715 2.570
1.100* 1.550* 2.275* 1.720 2.600
1.175* 1.600* 2.440* 1.760 2.700
1.185* 1.720* 2.500* 1.930 2.830
1.225* 1.750* 2.560* 2.015 2.950
1.230* 1.770* 2.730* 2.040 3.005
1.262* 1.820* 1.130 2.090 3.160
1.295* 1.890* 1.410 2.200 3.400
1.300* 1.940* 1.575 2.400 3.640
Q3 = x 3 = x18 = 2830 g
( ( 23+1))
4
Aulas 3 e 4 - Medidas de 30
tendência central e de dispersão
Medidas de tendência central e de dispersão
Aulas 3 e 4 - Medidas de 31
tendência central e de dispersão
Medidas de tendência central e de dispersão
Percentil
Valores da variável que dividem a distribuição em cem partes iguais.
Percentil 5:
P5 = x 5 = x 120 = x 1
( ( 23+1)) ( ) (1 )
100 100 5
1
P5 = 1130 + (1410 − 1130) = 1186 g
5
que é 1/5 do caminho entre x1=1130 e x2=1410
Percentil 10:
P10 = x = x 240 = x 2
(
10
( 23+1)) ( )
2 ;
(2 )
P10 = 1410 + (1575 − 1410 ) = 1476 g
100 100 5 5
Percentil 50:
P50 = x 50 = x 1200 = x(12) ; P50 = 2200 g
( ( 23+1)) ( )
100 100
Percentil 75:
P75 = x 75 = x 1800 = x(18) ; P75 = 2830g
( ( 23+1)) ( )
100 100
Percentil 90:
P90 = x = x 2160 = x 3
(
90
( 23+1)) ( )
3
( 21 )
; P90 = 3160 + (3400 − 3160 ) = 3304 g
100 100 5 5
Aulas 3 e 4 - Medidas de 32
tendência central e de dispersão
Medidas de tendência central e de dispersão
Box plot e identificação de valores aberrantes (outliers)
O Box plot representa graficamente dados de forma resumida em um retângulo onde as linhas
da base e do topo são o primeiro e o terceiro quartis, respectivamente. A linha entre estas é a
mediana. Linhas verticais que iniciam no meio da base e do topo do retângulo, terminam em
valores denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60).
O valor adjacente superior é o maior valor das observações que é menor ou igual a Q3+1,5(Q3-
Q1) e o valor adjacente inferior é definido como o menor valor que é maior ou igual a Q1-
1,5(Q3-Q1), sendo a diferença Q3-Q1 denominada intervalo inter-quartil (IIQ).
Valores outliers (discrepantes ou aberrantes) são valores que “fogem” da distribuição dos
dados. O box plot além de apresentar a dispersão dos dados torna-se útil também para
identificar a ocorrência destes valores como sendo os que caem fora dos limites estabelecidos
pelos valores adjacentes superior e inferior.
colesterol
380
360
340
320
300
280
260
240
220
200
180
160
140
120
A B
Aulas 3 e 4 - Medidas de 33
tendência central e de dispersão
Box plot
Tipo A: nível de colesterol
181 202 218 233 239 246 250 254 276 312
197 212 224 234 239 248 252 268 291 325
Tipo A:
n=20;
1
Q1 = x 1 = x 21 = x 1 = 218 + (224 − 218) = 218 + 1,5 = 219,5
4
( n +1)
4
5
4
4
3
Q3 = x 3 = x3 =x 3 = 254 + (268 − 254) = 254 + 10,5 = 264,5
4
( n +1)
4
( 21) 15
4
4
325 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 332,
onde 332 é dado por: 264,5 + 1,5 x 45 = 332 .
181 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 152, onde
152 é dado por: 219,5 − 1,5 x 45 = 152 .
Aulas 3 e 4 - Medidas de 34
tendência central e de dispersão
Box plot
Tipo B
n=20
1
Q1 = x 1 = x 21 = x 1 = 175 + (183 − 175) = 175 + 2 = 177
4
( n +1)
4
5
4
4
3
Q3 = x 3 = x3 =x 3 = 242 + (246 − 242) = 242 + 3 = 245
4
( n +1)
4
( 21) 15
4
4
344 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 347,
onde 347 é dado por: 245 + 1,5 x 68 = 347 .
137 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 75, onde 75
é dado por: 177 − 1,5 x68 = 75 .
Aulas 3 e 4 - Medidas de 35
tendência central e de dispersão
Box plot
Tipo A:
n=20;
1
Q1 = x 1 = x 21 = x 1 = 218 + (224 − 218) = 218 + 1,5 = 219,5
4
( n+1)
4
5
4
4
3
Q3 = x 3 = x3 =x 3 = 254 + (268 − 254) = 254 + 10,5 = 264,5
4
( n+1)
4
( 21) 15
4
4
325 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 332,
onde 332 é dado por: 264,5 + 1,5x45 = 332 .
181 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 152, onde
152 é dado por: 219,5 − 1,5x45 = 152.
Tipo B
n=20
1
Q1 = x 1 = x 21 = x 1 = 175 + (183 − 175) = 175 + 2 = 177
4
( n +1)
4
5
4
4
3
Q3 = x 3 = x3 =x 3 = 242 + (246 − 242) = 242 + 3 = 245
4
( n+1)
4
( 21) 15
4
4
344 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 347,
onde 347 é dado por: 245 + 1,5x68 = 347.
137 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 75, onde 75
é dado por: 177 − 1,5x68 = 75 .
Aulas 3 e 4 - Medidas de 36
tendência central e de dispersão
Validade de Curso de capacitação em medida da Altura uterina para enfermeiros e graduandos de
Enfermagem. Camila C A Paiva; Djacyr MC Freire. Ver Bras Enferm, Brasilia 2012, set-out;65(5):775-9
Aulas 3 e 4 - Medidas de 37
tendência central e de dispersão
Box plot
Questão 16
Os dados a seguir são de uma pesquisa que investigou as concentrações de
minerais no leite materno, no período de 1984 a 1985. Foram coletadas
amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital
Maternidade Odete Valadares, em Belo Horizonte. As mães foram divididas em
período de lactação: colostro e leite maduro.
cálcio (µg/mL de leite) – grupo colostro
113 181 254 311 334 145 221 256 312 344
163 225 275 313 372 163 231 296 323 375
167 241 303 325 375 437
cálcio (µg/mL de leite) – grupo maduro
159 175 181 188 200 206 213 214 217 231
238 238 242 244 256 259 260 263 264 275
277 279 281 293 302 303 314 344 394
a) Calcule a quantidade média de cálcio (µg/mL de leite) em cada grupo.
b) Calcule a quantidade mediana de cálcio (µg/mL de leite) em cada grupo.
c) Desenhe o box plot da concentração de cálcio (µg/mL de leite) representando os dois grupos
em um só gráfico.
d) Comente o gráfico box plot quanto a dispersão dos dados, existência de valores aberrantes e
igualdade de medianas.
Aulas 3 e 4 - Medidas de 38
tendência central e de dispersão
Questão 16
26
∑x i =1
i
7055
Grupo colostro: x = = = 271,35µg / mL
n 26
26
∑x
i =1
i
7310
Grupo maduro: x = = = 252,07µg / mL
n 29
Grupo colostro: n=26 (par) Mediana é a media dos valores que ocupam os postos 13 e
275 + 296
14. Med = = 285,5µg / mL
2
Grupo maduro: n=29 (ímpar); a mediana é o valor da variável que ocupa o posto 15.
Med= 256 µg/mL
Aulas 3 e 4 - Medidas de 39
tendência central e de dispersão
Questão 16
Medida Grupo colostro Grupo maduro
Q1 211 213,5
Q2 285,5 256
Q3 327,25 280
Valor adjacente inferior 113 159
Valor adjacente superior 437 344
valor adjacente superior: maior valor abaixo de Q3+1,5x(IIQ)
Valor adjacente inferior: Menor valor acima de Q1-1,5x(IIQ)
var1
500
450
400
350
300
250
200
150
100
grupo colostro grupo maduro
“Box plot” da variável concentração de cálcio (µg/mL) segundo grupo de leite (colostro e
maduro)
Aulas 3 e 4 - Medidas de 40
tendência central e de dispersão