Вы находитесь на странице: 1из 42

Estatística Descritiva

(II)
Arquivo PULSE do Minitab

Experimento envolvendo alunos. Cada


um tem altura, peso, sexo, hábito de
fumar e nível de atividade física
anotados. Todos jogam moedas: se
“CARA”, é realizada uma corrida
estacionária por 1 minuto. As pulsações
antes e após a corrida são registradas. Os
demais registram a pulsação em dois
instantes (intervalo de 1 minuto), sem a
corrida estacionária.
Informações do arquivo PULSE
MTB > INFO
Information of the worksheet
Column Count Name
C1 92 Pulse1
C2 92 Pulse2
C3 92 Ran 1- fez corrida 2- não fez corrida
C4 92 Smokes 1- fuma 2- não fuma
C5 92 Sex 1- masculino 2- feminino
C6 92 Height
C7 92 Weight
C8 92 Activity 0- não tem 1- leve
2- moderada 3- intensa
Planilha (parcial)

Row Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity

1 64 88 1 2 1 66,00 140 2
2 58 70 1 2 1 72,00 145 2
3 62 76 1 1 1 73,50 160 3
4 66 78 1 1 1 73,00 190 1
5 64 80 1 2 1 69,00 155 2
6 74 84 1 2 1 73,00 165 1
7 84 84 1 2 1 72,00 150 3
8 68 72 1 2 1 74,00 190 2



Ran
Smokes Nominal
Variáveis qualitativas
Sex
Ordinal
Activity

Pulse 1
Variáveis quantitativas Discreta
Pulse 2
Height Contínua

Weight
Variáveis Quantitativas
Medidas de posição
-
Média (x)
Mediana (md)
Quartis (Q1, Q3)
Máximo (máx)
Mínimo (min)
Medidas de dispersão
Variância (s2)
Desvio padrão (s)
Intervalo-interquartil (Q3 – Q1)
Coeficiente de variação (CV)
MTB > describe c1 c6 c7

Descriptive Statistics

Variable N Mean Median Tr Mean StDev SE Mean


Pulse1 92 72,87 71 72,61 11,01 1,15
Height 92 68,72 69 68,784 3,659 0,382
Weight 92 145,15 145 144,52 23,74 2,48
CV
Variable Min Max Q1 Q3
Pulse1 48 100 64 80 11,01/72,87=0,15
Height 61 75 66 72 3,66/68,72=0,05
Weight 95 215 125 156,5 23,74/145,15=0,16
Alguns comentários:
•50% dos indivíduos tem pulsação menor ou igual a
71 batimentos por minuto;
•25% dos indivíduos tem altura igual ou menor a 66
pés;
•75% dos indivíduos tem peso igual ou menor a 156,5
libras;
•a variável com menor dispersão em relação à média
é a altura;
•Pulsação e peso apresentam dispersão em relação à
média praticamente iguais e o triplo da dispersão da
altura.
MTB > describe c1;
SUBC > by c3.
Variable Ran N Mean Median Tr Mean StDev SE Mean
Pulse1 1 35 73,60 70 72,97 11,44 1,93
2 57 72,42 72 72,47 10,82 1,43
Variable Ran Min Max Q1 Q3
Pulse1 1 58 100 64 80
2 48 94 64 81

MTB > describe c2;


SUBC > by c3.
Variable Ran N Mean Median Tr Mean StDev SE Mean
Pulse2 1 35 92,51 88 91,68 18,94 3,20
2 57 72,32 70 72,24 9,95 1,32
Variable Ran Min Max Q1 Q3
Pulse2 1 58 140 76 106
2 50 94 66 79
Alguns comentários:
• Com relação às medidas de posição, os dois grupos
“antes de correr” têm praticamente os mesmos
valores;
• O grupo que correu (Ran=1) tem média de Pulse2
maior que o grupo que não correu (Ran=2).
• Com relação às medidas de dispersão, os dois
grupos antes da corrida apresentam valores
semelhantes;
• O grupo que correu apresenta um desvio padrão
aproximadamente igual ao dobro do que o grupo que
não correu.
Descrevendo a pulsação em repouso segundo o sexo

MTB > DESCRIBE C1;


SUBC> BY C5.
Variable Sex N Mean Median TrMean StDev SE Mean
Pulse1 1 57 70,42 70 70,27 9,95 1,32
2 35 76,86 78 76,65 11,62 1,96

Variable Sex Min Max Q1 Q3


Pulse1 1 48 92 63 75
2 58 100 66 86
Os dados também podem ser resumidos
construindo-se uma tabela de distribuição
de freqüências .

Distribuição de freqüências de uma variável


é uma lista dos valores individuais ou dos
intervalos de valores que a variável pode
assumir, com as respectivas freqüências de
ocorrência.
No arquivo PULSE Summary Statistics for Discrete Variables
Pulse1 Count Percent
48 1 1,09
54 2 2,17
58 3 3,26
60 4 4,35
MTB > tally c1 61
62
1
9
1,09
9,78
64 4 4,35
66 5 5,43
68 11 11,96
70 6 6,52
72 6 6,52
74 5 5,43
76 5 5,43
78 5 5,43
Não há perda 80
82
3
3
3,26
3,26
de informação 84
86
4
1
4,35
1,09
87 1 1,09
88 3 3,26
90 4 4,35
92 2 2,17
94 1 1,09
96 2 2,17
100 1 1,09
N= 92
Alternativa: construir intervalos de classe
Classe de pulsação frequência
48 |- 54 1
Informações mais
54 |- 60 5
resumidas
60 |- 66 18
66 |- 72 22
72 |- 78 16
78 |- 84 11
84 |- 90 9
90 |- 96 Perda de informação
7
96 |- 102
3
Exemplo 2:
Construir
Variável: altura ( height) contínua
intervalos
Distribuição de freqüência para altura de classe
( arquivo PULSE)
Classes de altura f fr
60,25 |- 61,75 1 0,011
61,75 |- 63,25 10 0,109
63,25 |- 64,75 2 0,022
64,75 |- 66,25 13 0,141
66,25 |- 67,75 7 0,076
67,75 |- 69,25 20 0,217
69,25 |- 70,75 7 0,076
70,75 |- 72,25 15 0,163
72,25 |- 73,75 9 0,098
73,75 |- 75,25 8 0,087
Total 92 1
Variáveis Quantitativas
Gráficos

•“Dotplot ”
•“Boxplot ”
• Histograma
DOTPLOT
Arquivo PULSE – Dotplot da pulsação em
repouso (PULSE1)

MTB > DOTPLOT C1


.
. :
: :
: . : : : . . .
. : : : : : : : : : : . . : . :
. : : :.: : : : : : : : : : : : ..: : : . : .
---+---------+---------+---------+---------+---------+-
50 60 70 80 90 100
Pulse1
Arquivo PULSE – Dotplot da pulsação em repouso
(PULSE1) segundo Sexo (SEX)

MTB > DotPlot 'Pulse1' ;


SUBC> Same;
SUBC> By 'Sex'.
:
Sex 1 : : : .
. : . . : : : : . .
. : : : : : : : : : : : . . . : . : :
--+---------+---------+---------+---------+---------+-

Sex 2 . . :
. ..: . : : : : : : : : ..: . . : .
--+---------+---------+---------+---------+---------+-
50 60 70 80 90 100
Pulse1
Boxplot

Representa os dados através de um


retângulo construído com os quartis e
fornece informações sobre os valores
extremos.
Construção
LS=Q3+1,5(Q3-Q1)
“Máximo”

Q3
75%
Mediana
50%

Q1
25%

“Mínimo”
LI=Q1-1,5(Q3-Q1)
“Máximo” é o maior valor menor que LS;
“Mínimo” é o menor valor maior que LI.
Exemplo: Tempo de sobrevivência (dias)
Dados ordenados (n=36)
md = 41,5 Q1 = 30,25 Q3 = 49,5
18 21 21 23 23
25 120

27 29 30 31 32 *
32 100
*
32 34 35 36 38
41 80

42 42 43 44 45
46 60

46 47 48 50 54
56 Observações discrepantes? 40

57 58 60 61 98
116 20
LI = Q1 - 1,5(Q3 - Q1) =1,38
LS = Q3 + 1,5(Q3 - Q1) =78,38
Arquivo PULSE –Boxplot da pulsação em repouso
(PULSE1)
MTB > BOXPLOT C1

Alguns Comentários:
• não há observações discrepantes;
• a distribuição dos valores é aproximadamente simétrica .
Arquivo PULSE – Boxplots da pulsação em repouso
(PULSE1)
PULSE1 por sexo (SEX)
SEX
MTB > BOXPLOT C1*C5

Alguns Comentários:
• não há observações discrepantes;

• medidas de posição tendem a ser maior para o sexo feminino;


• não há fortes evidências de assimetria nos dois grupos.
Histograma
Agrupar os dados em intervalos de classes
(distribuição de freqüências)
Bases iguais
Construir um retângulo para cada classe, com base
igual ao tamanho da classe e
altura proporcional à freqüência da classe (f).
Bases diferentes
Construir um retângulo para cada classe, com base igual
ao tamanho da classe e
área do retângulo igual a freqüência relativa da classe(f
r).
A altura será dada por
Arquivo PULSE – Histograma da altura (Height)
Distribuição de freqüência MTB > HIST C6
para altura (arquivo PULSE)
Classe de altura f fr
60,25 ⊢ 61,75 1 0,011 20

61,75 ⊢ 63,25 10 0,109


63,25 ⊢ 64,75 2 0,022

Frequency
64,75 ⊢ 66,25 13 0,141 10

66,25 ⊢ 67,75 7 0,076


67,75 ⊢ 69,25 20 0,217
69,25 ⊢ 70,75 7 0,076
0
70,75 ⊢ 72,25 15 0,163
61,0 62,5 64,0 65,5 67,0 68,5 70,0 71,5 73,0 74,5
72,25 ⊢ 73,75 9 0,098 Height
73,75 ⊢ 75,25 8 0,087
Total 92 1

Exemplo:
Exemplo Classes desiguais
h
0,10
Vacinação Infantil
0,08

Classes (meses) f fr h 0,06

0 |- 3 140 0,28 0,093 0,04

3 |- 12 100 0,20 0,022 0,02

12 |-24 80 0,16 0,013


0 3 12 24 60
24 |-60 180 0,36 0,010
Total 500 1,00 f

0 3 12 24 60
Forma da Distribuição
Variáveis Qualitativas
Os dados podem ser resumidos construindo-
se uma tabela de distribuição de freqüências,
que quantifica a freqüência das distintas
categorias.
Variáveis qualitativas no arquivo PULSE
Ran
Smokes
Sex
Activity
Variáveis qualitativas no arquivo PULSE
MTB > Tally 'Sex' 'Smokes' 'Activity';
SUBC> Counts;
SUBC> Percents.
Summary Statistics for Discrete Variables
Sex Count Percent Smokes Count Percent
1 57 61,96 1 28 30,43
2 35 38,04 2 64 69,57
N= 92 N= 92

Activity Count Percent


0 1 1,09
1 9 9,78
2 61 66,30
3 21 22,83
Podemos também construir tabelas de freqüências
conjuntas (tabelas de contingência), relacionando
duas variáveis qualitativas.
Exemplo 1:1 Há indícios de associação entre Sexo e
Hábito de fumar?
Hábito de Fumar
Sexo Fuma Não Fuma Total
Masculino 20 37 57
Feminino 8 27 35
Total 28 64 92

Qual o significado dos valores desta tabela?


Como concluir?
MTB > Table 'Sex' 'Smokes';
SUBC> Counts.

Rows: Sex Columns: Smokes

1 2 All

1 20 37 57
2 8 27 35
All 28 64 92
Verificar associação através da:
- porcentagem segundo as colunas, ou
- porcentagem segundo as linhas.

Hábito de Fumar
Sexo Fuma Não Fuma Total
Masculino 71,43% 57,81% 61,96%
Feminino 28,57% 42,19% 38,04%
Total 100% 100% 100%

Qual o significado dos valores desta tabela?


Como concluir?
MTB > Table 'Sex' 'Smokes';
SUBC> ColPercents.
(RowPercents/TotPercents)

Rows: Sex Columns: Smokes

1 2 All

1 71,43 57,81 61,96


2 28,57 42,19 38,04
All 100,00 100,00 100,00
MTB > Table 'Sex' 'Smokes';
SUBC> Counts;
SUBC> RowPercents.

Rows: Sex Columns: Smokes


1 2 All
1 20 37 57
35,09 64,91 100,00
2 8 27 35
22,86 77,14 100,00
All 28 64 92
30,43 69,57 100,00
Cell Contents – Count - % of Row
Exemplo 2: Dentre os que correram, qual a
porcentagem de mulheres?
MTB > Table 'Ran' 'Sex';
SUBC> Counts;
SUBC> RowPercents.
Rows: Ran Columns: Sex
1 2 All
1 24 11 35
68,57 31,43 100,00
2 33 24 57
57,89 42,11 100,00
All 57 35 92
61,96 38,04 100,00

Resposta: 31,43%
Variáveis Qualitativas
Gráficos

•Gráfico de setores
•Gráfico de barras
Gráfico de setores

Um círculo é dividido em tantos setores


quantas forem as categorias da variável.
A área de cada setor é proporcional à
freqüência da categoria
Arquivo PULSE — Gráfico de setores para
a variável Ran
MTB > %Pie c3.
Pie Chart of Ran

1 (35; 38,0%)

2 (57; 62,0%)
Arquivo PULSE — Gráfico de setores para
a variável Activity
Gráfico de barras

Sobre um eixo, são representados


retângulos, um para cada categoria da
variável. A altura do retângulo é
proporcional à freqüência da categoria
Arquivo PULSE — Gráfico de barras para a
variável RAN
MTB > Chart C3

60

50
Count of Ran

40

30

20

10

1 2
Ran
Arquivo PULSE — Gráfico de barras para a
variável Activity
MTB > Chart C8

60

50
Count of Activity

40

30

20

10

0 1 2 3
Activity

Вам также может понравиться