Академический Документы
Профессиональный Документы
Культура Документы
Experimentos
Professores
Miguel Antonio Sovierzoski, Dr.
miguelaso@utfpr.edu.br;
Tamanho da Amostra
Uma das questes principais a serem respondidas em um projeto
de experimentos : Quantas amostras ou observaes devo usar?
Infelizmente no existe uma resposta definitiva para esta questo.
Contudo, com algumas informaes adicional e fazendo-se
algumas suposies possvel estimar o nmero mnimo de
observaes.
Tem-se que pensar que quando fala-se em tamanho da amostra
supe-se a obteno de dados nas mesmas condies.
Se os dados forem obtidos em diferentes condies, mesmo que
muitos, isto no significa replicata.
Tambm tem-se que tomar cuidado com uma grande quantidade de
dados
obtidos na mesma condio de experimentao, os
experimentos tem que explorar as diversas variveis presentes no
processo.
Tamanho da Amostra
O objetivo de se fazer replicatas testar a variabilidade dos
resultados.
Uma replicata para ser vlida deve ser feita tudo da condio
zero como se fosse um novo experimento.
Um grave erro de muitos experimentos no se fazer
replicatas. Assim muito experimentos que do um enorme
trabalho so invalidados pela falta das replicatas.
Tamanho da Amostra
Nmero de amostras para uma largura de Intervalo de Confiana
Algumas vezes o objetivo um particular intervalo de confiana. O
intervalo de confiana da mdia calculado como:
Tamanho da Amostra
Nmero de amostras para uma largura de Intervalo de Confiana
Para pequenos valores de n e grandes C, a equao subestima o
nmero de observaes.
Estimativas alternativas, para estes casos so:
1) Usar valores tabulados para pequenos valores de n. Para usar a
tabela, calcula-se C/s para a largura de intervalo desejada e o
desvio padro esperado s. Encontre na tabela o valor
imediatamente acima e determine o correspondente valor de n.
2) Usar um mtodo interativo, isto , faa um chute inicial para n e
ajuste at que o desejado intervalo de confiana seja encontrado.
Tamanho da Amostra
Nmero de amostras para uma largura de Intervalo de Confiana
Exemplo
No desenvolvimento de um protocolo de validao, para medio de
Oxido Etileno em amostras, um analista deseja assegurar que o
intervalo de confiana de 95% no seja maior do que C= 45 ppm.
Sabe-se de ensaios prvios que o desvio padro igual a 45 ppm.
Quantas observaes so requeridas?
1) Usando-se a tabela. Para C= intervalo de confiana = 45ppm e s =
45 ppm. Observa-se na coluna de 95% de confiana que o valor
imediatamente abaixo de C/s =1 0,925 que corresponde a n=7.
Assim a validao do protocolo requer um mnimo de 7 replicatas.
Tamanho da Amostra
Nmero de amostras para uma largura de Intervalo de Confiana
Exemplo
Tamanho da Amostra
Nmero de amostras para uma largura de Intervalo de Confiana
Exemplo
No desenvolvimento de um protocolo de validao, para medio de
Oxido Etileno em amostras, um analista deseja assegurar que o
intervalo de confiana de 95% no seja maior do que 45 ppm.
Sabe-se de ensaios prvios que o desvio padro igual a 45 ppm.
Quantas observaes so requeridas?
2) Resolvendo
de
maneira
iterativa
utilizando o Excel,
temos a figura abaixo,
extrada do Excel, que
comprova
que
o
nmero de amostras
fica entre 6 e 7:
Tamanho da Amostra
Nmero de amostras no software Minitab
Stat > Power and Sample Size > Sample Size for Estimation
Tendo-se uma margem de erro para um intervalo de confiana da mdia pode-se
determinar o tamanho da amostra.
Inversamente conhecendo-se o tamanho da amostra pode-se determinar a margem
de erro para um intervalo de confiana.
Tamanho da Amostra
Nmero de amostras no software Minitab
Tamanho da Amostra
Nmero de amostras no software Minitab
Planning Value The necessary
planning value depends on the
chosen parameter.
Statistical analysis
you plan to conduct
1-Sample z
1-Sample t
Paired t
Estimated
parameter
Mean from a
normal
distribution
Planning value
Standard deviation
To estimate samples size or margins of error , you need information about the
data you expect to collect. You can obtain planning values from:
Design specifications
Expert opinions
Prior studies or small pilot studies
The planning value you need depends on the parameter you want to estimate.
Tamanho da Amostra
Nmero de amostras no software Minitab
An electronics company wants to estimate the voltage of a new line of
resistors used in circuit boards. They want to know what sample size they
need to obtain a margin of error of 5. Based on prior studies, the standard
deviation is 22.5.
1 Choose Stat > Power and Sample Size > Sample Size for Estimation.
2 In Parameter, choose Mean (Normal).
3 Under Planning Value, enter 22.5 in Standard deviation.
4 Choose Estimate sample sizes.
5 In Margins of error for confidence intervals, 5.
6 Click OK.
Session window output
Interpreting the results
To achieve a margin of error of 5 when estimating the mean voltage of resistors, the
electronics company needs to collect 81 samples.
Tamanho da Amostra
Nmero de amostras no software Minitab
No software Minitab - Exemplo
Sample Size for Estimation
Method
Parameter
Mean
Distribution
Normal
Standard deviation 22.5 (estimate)
Confidence level 95%
Confidence interval Two-sided
Results
Margin Sample
of Error Size
5 81
Tamanho da Amostra
Nmero de amostras no software Minitab
Exemplo - Resolvendo o mesmo exerccio anterior com o Minitab
No desenvolvimento de um protocolo de validao, para medio de Oxido
Etileno em amostras, um analista deseja assegurar que o intervalo de
confiana de 95% no seja maior do que 45 ppm. Sabe-se de ensaios prvios
que o desvio padro igual a 45 ppm. Quantas observaes so requeridas?
Testes de hipteses
O teste de hipteses um procedimento estatstico em que se
busca verificar uma hiptese a respeito da populao, no sentido
de aceit-la ou rejeita-la, a partir de dados amostrais, tendo por
base a teoria das probabilidades.
Em geral, um problema cientfico (expresso na forma de pergunta)
conduz a uma hiptese cientfica (resposta provisria a esta
pergunta) que requer uma pesquisa cientfica para a sua
verificao. O teste de hiptese um dos procedimentos mais
utilizados na pesquisa cientfica, sobretudo na pesquisa
experimental.
Testes de hipteses
No uso de um teste de hipteses fazemos algumas suposies tais
como: a) Ambas as amostras foram extradas de populaes
independentes que podem ser descritas por distribuies normais; b)
Que o desvio padro ou varincia das populaes so iguais; c) E que
os dados so variveis aleatrias independentes.
A suposio de independncia crtica, mas se as rodadas de
experimentao forem sorteadas e demais variveis forem
selecionadas aleatoriamente, normalmente, satisfaz-se a suposio de
independncia.
As suposies de varincia igual e normalidade so facilmente
verificadas usando-se grficos de verificao da normalidade.
Normalmente softwares incorporam opes de verificao da
normalidade, ou mesmo o procedimento pode ser executado
manualmente, colocando os dados em ordem crescente e seguindo
procedimento especfico.
Testes de hipteses
O grfico mostra a verificao da normalidade de medies de glicose
em amostras de materiais de referncia.
Testes de hipteses
De modo geral, podemos definir cinco passos para construo de um
teste de hipteses:
Devemos escolher a
mais apropriada
Devemos escolher a
mais apropriada
Populao 1 a formulao
1
da
argamassa,
a
Populao 2 a formulao
2 da argamassa.
Nestas populaes vamos
estudar a varivel contnua
X=
resistncia
da
argamassa, supondo que
~ , 2 e que 1 2 = 2 2 .
bastante
razovel esperar que a
mdia do grupo tratado (que
expressa este efeito) seja
maior (e nunca menor do que
a mdia do grupo controle.
Deciso
Verdadeira
Falsa
No rejeitar
Acerto
Erro Tipo II -
Rejeitar
Erro Tipo I -
Acerto
Deciso
Verdadeira
Falsa
No rejeitar
Acerto
Erro Tipo II -
Rejeitar
Erro Tipo I -
Acerto
Deciso
Verdadeira
Falsa
No rejeitar
Acerto
Erro Tipo II -
Rejeitar
Erro Tipo I -
Acerto
()
com o valor
crtico:
Rejeitamos , ao nvel , se o valor da estatstica, em mdulo,
for maior que o valor crtico: > valor crtico
t.
1 2 2
1 2 2 2
1 2 2 2
+
1 2 1 2 + 2
+
1
2
1
2
Testes de
hipteses
mdias
varincia
desconhecida
< < + 2
1 1 1 2 + 2 1 2 2
=
1 + 2 2
1
1
1
1
1 2 2;1+22
+
1 2 1 2 + 2;1+22
+
1 2
1 2
1 2 2;
1 2 2 2
1 2 2 2
+
1 2 1 2 + 2;
+
1
2
1
2
1 2
2 2
12,21,11
1 2 1 2
2 2 2,21,11
2
2
1,2,1 =
1
,2,1
Podemos
testar
ainda 0
de
igualdade contra a
hiptese que a
mdia seja igual a
150 psi, diminuindo
a significncia para
60%. Pelo software
Minitab
obtemos
os valores abaixo.
(with Ho and 60% Z-confidence interval for the Mean, and StDev = 3)
_
X
Ho
144
145
146
147
148
149
150
Resistncia Freios
Variable
N Mean StDev SE Mean
60% CI
Z P
Resistncia Freios 4 148,75 3,50 1,50 (147,49; 150,01) -0,83 0,405
151
152
153
(with Ho and 60% Z-confidence interval for the Mean, and StDev = 3)
_
X
Ho
144
145
146
147
148
149
150
Resistncia Freios
Variable
N Mean StDev SE Mean
60% CI
Z
P
Resistncia Freios 4 148,75 3,50 1,50 (147,49; 150,01) -0,83 0,405
151
152
153
Boxplot of C1
(with Ho and 95% Z-confidence interval for the Mean, and StDev = 3)
_
X
Ho
144
145
146
147
148
149
C1
150
95% Lower
Variable N Mean StDev SE Mean Bound
Z
P
C1
4 148,75 3,50 1,50
146,28
-0,83 0,798
151
152
153
Mquina 1
Mquina 2
16,03
16,01
16,02
16,03
16,04
15,96
15,97
16,04
16,05
15,98
15,96
16,02
16,05
16,02
16,01
16,01
16,02
15,99
15,99
16,00
1 2
1 2 2 2
1 + 2
1 = 16,0150 2 = 16,0050
0 =
16,0150 16,0050
0,015 0,018
10 + 10
= 0,17407765
1 2 + 2
1 2 2 2
1 2 2 2
+
> > 1 2 2
+
1
2
1
2
0,0152 0,0182
16,015 16,005 1,96
+
10
10
0,01 0,014522 0,004522 < 0,01 < 0,024522
159
280 101
212
224
379 179
264
222
362 168
250
149
260 485
170
T
P
0,67 0,514
_
X
Ho
100
200
300
Tempo de reparo
400
500
98,7
; 1 : 2 241,52,131 16 241,5 52,58 188,92
294,08
Tipo 2
65
82
64
56
81
67
71
69
57
59
83
74
66
75
59
82
82
70
65
79
Alpha = 0,05
Statistics
Variable N StDev Variance
Tipo 1 10 9,264 85,822
Tipo 2 10 9,367 87,733
Ratio of standard deviations = 0,989
Ratio of variances = 0,978
Variance
Ratio
(0,243; 3,938)
(0,258; 3,735)
Tests
Test
Method
DF1 DF2 Statistic P-Value
F Test (normal)
9 9
0,98
0,974
Levene's Test (any continuous) 1 18
0,00
1,000
Teste estatstico 0 =
1 2
2 2
85,822
= 87,732 = 0,97823
9,3147
10 10
1 1 1 2 + 2 1 2 2
10 1 85,74 + 10 1 87,79
=
=
1 + 2 2
10 + 10 2
= 9,3147
Critrio de deciso: 0 > 2; = 1 + 2 2 = 18 2; = 0,025;18 =
2,101
Pelo Excel =INV.T(0,975;18) = 2,100922
Como: 0 > 2; 0,048< 2,101 no podemos descartar 0 de igualdade.
Encontre o P valor do teste;
Pelo Excel =DIST.T.BC(0,048011;18)= 0,962236
Como o valor de P maior do que 0,025 o critrio de deciso para uma
hiptese bilateral com =0,05, no podemos rejeitar 0 .
99
Mean
StDev
N
AD
P-Value
95
90
Percent
80
70
60
50
40
30
20
10
5
50
60
70
Tipo 1
80
90
70,4
9,264
10
0,344
0,409
99
Mean
StDev
N
AD
P-Value
95
90
Percent
80
70
60
50
40
30
20
10
5
50
60
70
Tipo 2
80
90
70,2
9,367
10
0,186
0,876
Variable
Tipo 1
Tipo 2
0,04
Mean StDev N
70,4 9,264 10
70,2 9,367 10
0,03
Density
0,02
0,01
0,00
50
60
70
Data
80
90
14,4 14,1
= 2,44825
0,274 5
Pela tabela 2;1 = 0,025;4 = 2,776
Bound T
P
14,661 2,45 0,965
14,4 14,1
= 2,44825
0,274 5
Pela tabela ;1 = 0,05;4 = 2,132
T P
2,45 0,035
14,4 14,1
= 2,44825
0,274 5
Pela tabela ;1 = 0,05;4 = 2,132
_
X
Ho
1,6
1,7
1,8
OE
1,9
2,0
_
X
Ho
1,6
1,7
1,8
1,9
OE
2,0
2,1
_
X
Ho
1,6
1,7
1,8
OE
1,9
2,0
_
X
Ho
1,6
1,7
1,8
OE
1,9
2,0
1
O teste estatstico para esta hiptese : 0 =
onde = =1
=1( )
=1 2
1
(=1 )2
12
=
1
o desvio padro da diferena .
0 : = 0 ser rejeitada se 0 > 2;1
Este planejamento usualmente chamado de teste t pareado.
1
1
= =
1 = 0,10
10
=1
12
1
=1 2 (=1 )2
=
1
12
1
13
12
10
=
= 1,20
10 1
Supondo =0,05
Amos
tra
Pontei
ra 1
Pontei Difere
ra 2
na
-2
-2
10
-1
-2
10
-1
0,10
1,20 10
= 0,26
Como
0 = 0,26 0,025;9 = 2,262 , no
podemos rejeitar a hiptese 0 : = 0. Ou
seja no evidncias que as duas ponteiras
produzam diferentes leituras de dureza.
-2
-2
10
-1
1
1
+
= 4,80 4,90 2,101 2,32
1 2
1
1
+
10 10
= 0,10 2,18
O intervalo de confiana bem mais estreito da comparao pareada,
ilustra a reduo do rudo prprio da blocagem.
Teste 1.
_
X
Ho
100
200
300
Cateter OE
400
500
Boxplot of Cateter OE
_
X
Ho
100
200
300
Cateter OE
400
500
Boxplot of Cateter OE
_
X
Ho
100
200
300
Cateter OE
400
500
Exerccio:
No teste realizado com 200 detonadores,
adequadamente, resoluo pelo Minitab.
174
funcionaram
Exerccio:
No teste realizado com 200 detonadores,
adequadamente, resoluo pelo Minitab.
174
funcionaram
Exerccio:
Um estudo mostra que 16 de 200 bebes recm natos apresentam
complicaes em um hospital A. Um hospital B tem uma taxa de 14
complicaes para 400. Para um nvel de confiana de 99%, podemos
afirmar que o hospital B melhor que o hospital A para os recm
natos?
Hiptese nula
=
Hiptese alternativa >
Exerccio:
Hiptese nula
=
Hiptese alternativa >
16/200 = 14/400
Exerccio:
Hiptese nula
=
Hiptese alternativa >
16/200 = 14/400
No
exerccio
houve
coincidncia de duas das
trs avaliaes feitas,
para os dois avaliadores,
Jim e Vanessa, ou seja
66,67%
IC95%
(9,43;
99,16).
Date of study :
Reported by :
Name of product:
Misc:
Assessment Agreement
Within Appraisers
100
Appraiser vs Standard
100
95,0% C I
P ercent
80
80
60
60
Percent
Percent
No
caso
do
avaliador Jim ele
acertou 1 de 3
avaliaes
feitos,
ou seja 33,33% IC95% (0,84; 90,57).
No
caso
do
avaliador Vanessa
esta acertou 2 de 3
avaliaes, ou seja
66,67% IC95% (9,43;
99,16).
40
20
95,0% C I
P ercent
40
20
0
Jim
Vanessa
Appraiser
Jim
Vanessa
Appraiser
Assessment Agreement
Within Appraisers
100
Appraiser vs Standard
100
95,0% C I
P ercent
80
80
60
60
Percent
Percent
O
crculo
azul
indica o porcentual
de acerto atual;
A linha vermelha
mostra o intervalo
de confiana do
acerto;
E os Xs indicam os
limites inferior e
superior
do
intervalo
de
confiana.
40
20
95,0% C I
P ercent
40
20
0
Jim
Vanessa
Appraiser
Jim
Vanessa
Appraiser