Академический Документы
Профессиональный Документы
Культура Документы
INTRODUO
- IDEIA BSICA: reamostrar de um conjunto de dados,
diretamente ou via um modelo ajustado, a fim de criar
replicas dos dados, a partir das quais podemos avaliar a
variabilidade de quantidades de interesse, sem usar
clculos analticos.
- APLICAO DO MB:
podem ser aplicados quando
existe, ou no, um modelo probabilstico bem definido para
os dados.
- METODO: COMPUTER-INTENSIVE
- CONCEITOS BASICOS
DADOS: y1, y2, ..., yn ~Y com fdp f e fda F
: caracterstica populacional
T: estatstica; t: valor de T na amostra
- INTERESSE: obter a distribuio de probabilidade de T;
vis de T, dp(T); quatis, intervalo de confiana para ,
testes.
- SITUAES: PARAMETRICA E NO-PARAMETRICA
# { y j y}
n
- FUNO ESTATSTICA
Estatstica de interesse: t=f(y(1), ..., y(n))
t = t (F ) : funo estatstica
= t (F )
F F
T = t ( F ) = t ( F ) em probabilidade(consistncia)
xi
Erro padro de x =
s
n
, s
(x
=
x)2
n 1
s( x) : estatstica de
interesse
Amostra
bootstrap:
x = ( x1 , L, x n ) ,
reposio, n vezes de x
amostramos,
com
- ALGORITMO BOOTSTRAP:
gera um grande nmero
independentes: x 1 , x 2 ,L , x B
de
amostras
bootstrap
ep boot
2
B
2
b
= s ( x ) s () /( B 1)
b =1
Com
s() =
b =1
s( x )
(2)
x = xi ,L, xi
1
1 B
2
ep B =
( (b) ()) 2 ,
B 1 b =1
estimador
bootstrap
no
paramtrico, onde
() =
1 B
(b)
B b=1
lim B ep B = ep F = ep F ( ) :
BOOTSTRAP PARAMTRICA
til em problemas para os quais dispomos de alguns
conhecimentos sobre a forma da populao e para
comparar com anlises no paramtricas.
X F,
F: FDA
par
: estimador do parmetro .
ep F ( )
par
y
= , = 2y
zy
simtrica
yz
2
V =
14
norm
epF
( y y )( z z )
( z z )
i
( ,V ) : estimador paramtrico de F
= corr( y, Z ) .
par
norm
( x ,L, x )
norm
e calculamos o
ep
( s ( x)) t ( F )
vis
Exemplo:
a) t(F) = , s( x) = x ,
b) s( x) =
( xi x ) 2
n
vis
=0
1
; vis[s ( x)] = 2 ; neste caso,
n
vis
1
n2
(x
x)2
(b) = s ( x b ), b = 1,L, B.
() =
b =1
~
(b)
B
b =1
{s ( x)} pela
s( x b )
9243
9671
11792
13357
9055
6290
12412
18806
E (novo) E (antigo)
E (antigo) E ( placebo)
Parmetro: =
0,20 critrio
E (novo) E (antigo)
E (antigo) E ( placebo)
New-old
y
-1200
2601
-2705
1982
-1290
351
-638
-2719
-4520,3
E F ( y)
EF ( z)
y
= t ( F ) = =
Z
i =1
8
yi / 8
= 0,0713
z /8
i =1 i
Nota: Z e Y so dependentes.
<< 0,20 , portanto aparentemente a condio do FDA est
y
z
vies400 0,0043
=
= 0,041 , portanto vis sob controle.
ep 400
0,105
vies F
RMSE = E F ( ) 2 = ep F2 () + vies F2 (, ) = ep F () 1 +
ep F
2
1 vies
F
ep F () 1 +
2 ep F
CORREO DE VIS
V : estimador do vies F (, ) = V : estimador corrigido para
o vis.
Tomando
V = vies B = () , obtemos = 2 ()
Exemplo(hormnio):
V400 = 0,0043 e = 0,0713 = 0,0713 0,0043 = 0,0756
Observaes:
1) a correo do vis pode ser perigosa na prtica.
Mesmo que seja menos viesado do que , ele pode
ter erro padro substancialmente maior.
2) O vis mais difcil de estimar do que o ep, B maior
para estimar o vis.
3) Se V << ep, melhor usar do que .
INTERVALO DE CONFIANA
Dado o estimador de , seu ep estimado, ep () , o
intervalo de confiana(IC) usual, com coeficiente de
confiana(C.C.) 90%, para
1.645 ep ()
x = ( x1 ,L , x n ) ~ F
()
e = t ( F )
Ou
ep ()
(8)
N (0,1)
ep
~ t n 1
(9)
E o IC fica
[ t
(1 )
n 1
(1 )
ep , + t n 1
ep
PROCEDIMENTO:
[1] geramos B amostras bootstrap x 1 , L, x B
[2] para cada amostra construmos
Z (b) =
(b)
ep (b)
[ t
( )
ep , + t (1 ) ep
Intervalo percentil
x : dados bootstrap
= s( x ) : rplicas bootstrap
G : FDA de
inf
] [
, sup = G 1 ( ), G 1 (1 )
OBSERVAES:
1) B no inteiro, 0,05. Considere k=[(B+1) ]. Os
quantis e 1- so dados pela k-sima maior. E
(B+1-k) maior observao, respectivamente.
Ex.: B=50, =0,05, B =2,5, k=[51*0,05]=[2,55]=2,
portanto -percentil a 2. Observao e o (1- )percentil a 49. Observao.
2) em amostras grandes, a cobertura do IC bootstrap-t
tende a ser mais prxima do CC desejado do que o IC
padro e t.
Ex. Ratos:
16 ratos(7: tratamento; 9: controle)
Dados: tempo
tratamento
de
sobrevivncia
(em
dias)
aps
Tabela 1: dados
Group
Data
Sample
Size
mean
Estimated
standar
error
86,86
25,24
56,22
14,14
difference
30,63
28,93
x y = 30,63 e
100
23,63
36,35
250
22,32
34,46
500
23,76
36,72
1000
23,02
36,48
23,36
37,83
xy
30,63
=
= 1,05 (no)
dp ( x y ) 28,93
48
= 1,26
38,14
IC:
Media dos ratos tratados: = 86,86 e ep = 25,24
IC padro(=0,90):
[86,86-1,65*25,24; 86,86+1,65*25,24] =
[45; 128,4]
B=1000 rplicas: =?
Tabela 3: percentiles of based on 1000 bootstrap
replications, where equais the mean of the treated
mice.
2,5% 5% 10% 16% 50% 84% 90% 95% 97,5%
45,9 49,7 56,4 62,7 86,9 112,3 118,7 126,7 135,4
Percentile 5% = 49,7
Percentile 95% = 126,7
Intervalo percentil com C.C. 90% = [49,7; 126,7]
Utilizar os percentis do histograma para definir limites de
confiana.
PROCEDIMENTO:
[1] geramos B amostras bootstrap x 1 , L, x B (b) = s ( x b )
[2] B( ) : -percentil dos valores (b) = s ( x b )
[3] IC percentil aproximado com 1-2 :
%,inf
] [
; %,sup = B( ) ; B(1 )
populacional = e 0 = 1
Tabela 4: percentiles of
size 10.
2,5% 5%
0,75 0,82
10%
0,90
16%
0,98
= e x
50%
1,25
84%
1,61
90%
1,75
95%
1,93
97,5%
2,07