Академический Документы
Профессиональный Документы
Культура Документы
Tabela 1
Aleatoreamente, iremos estud-la com amostras de dimenso 10. A partir destas amostras, iremos estimar uma mdia e uma varincia. E no de esperar que essas estimativas concidam exactamente com os parmetros da populao. Vamos utilizar 10 sub-conjuntos (amostras) e verificar os respectivos parmetros. Se aumentssemos a dimenso, era de esperar que a mdia e a varincia dessa amostra se aproximasse mais das da populao. Este procedimento foi seguido para vrias dimenses da populao, desde 10 at 100 (ver resultados na tabela 2). Note-se que o valor calculado para a mdia da amostra se aproxima cada vez mais medida que a dimenso da amostra cresce, o que tambm acontece para a varincia.
Aula 3 - Intervalos de Confiana e Testes Estatsticos 1 / 16
Uma vez que a mdia e a varincia so calculadas a partir de varaiveis aleatrias, ento elas prprias so tambm variveis aleatrias. Isto quer dizer que, mesmo mantendo a dimenso da amostra, teremos valores diferentes para amostras diferentes. Experincia (10 amostrasde n=10)
Am Am Am Am Am Am Am Am Am Am 1: 2: 3: 4: 5: 6: 7: 8: 9: 10: 24,2 33,9 28,0 32,2 25,4 32,2 22,0 30,3 21,3 21,3 24,4 21,3 21,2 30,0 25,2 28,9 25,3 20,3 25,6 32,0 28,5 21,3 18,9 24,2 21,3 27,0 26,5 20,9 25,8 21,3 25,3 25,2 33,2 18,9 32,2 20,8 32,2 22,8 24,7 23,1 32,2 18,9 30,2 17,2 22,6 20,3 25,4 19,1 28,9 30,0 19,6 19,6 26,5 22,4 21,3 18,4 28,5 23,1 30,2 24,0 32,9 28,5 25,2 21,3 25,7 31,5 22,7 25,3 21,3 26,8 21,3 36,0 29,0 21,3 22,4 26,8 24,2 30,9 25,2 29,0 24,0 27,1 21,8 26,4 23,1 33,2 25,5 19,4 27,9 30,6 26,5 30,6 26,3 24,5 25,3 27,3 27,3 28,0 25,7 26,8
Tabela 2
2 2 2 2 2 2 2 2 2 2
= = = = = = = = = =
18,42 36,29 19,39 22,05 10,35 27,27 8,65 19,52 8,37 15,29
Portanto, os valores calculados a partir duma amostra tambm contm erros. Para ilustrar melhor, escolheram-se aleatoreamente quatro amostras de dimenso 10. Na tabela 3 vemos as amostras e respectivas mdias e varincias.
2 / 16
Tabela 3
Am 6 : = 23,86 2 = 11,90 Am 7 : = 23,78 2 = 15,61 Am 8 : = 25,57 2 = 18,56 Am 9 : = 23,95 2 = 19,40 Am 10: = 26,67 2 = 18,02
Seguidamente,
veremos
as
alteraes
dos
parmetros
x
S
2
26,9 28,1
25,9 21,9
25,9 20,0
26,5 18,6
26,6 20,0
26,4 17,6
26,3 17,1
26,3 18,4
26,3 17,8
Tabela 4
3 / 16
Estas flutuaes dos parmetros estimados, levanta a questo da confiana nestas estimativas. Por exemplo, h mais confiana numa amostra com varincia pequena que numa com varincia grande. Assim, olhando para a Tabela 4, temos mais confiana na mdia estimada pela amostra 2 (n=20) que na da amostra 1 (n=10). A dimenso da amostra est directamente relaccionada com a mdia e a varincia calculadas (e.g., temos mais confiana na mdia calculada a partir de uma amostra de n=30 que na de uma de n=5, mesmo que tenham varincias semelhantes) Em Estatstica, a relao entre amostras, respectivas dimenses e parmetros (mdia e varincia) calculados parte da Teoria da Distribuio de Amostras, onde se verifica que as estimativas para a mdia e varincia variam de uma amostra para outra. As funes para calcular estas estimativas so os estimadores. Como exemplo de estimadores temos:
n 1 y = yi i =1 n
n 2 1 S = i i =1 n 1
2
que so utilizados para calcular, respectivamente, a mdia e a varincia. Estas estimativas variam entre si e tm as suas prprias confiana distribuies. Seguidamente, vamos definir as distribuies que descrevem e quantificam (ou qualificam...) a nos estimadores. Aplicando estas distribuies, podemos afirmar a verdade destes estimadores para um determinado nvel de confiana, ou seja, podemos definir um intervalo ou intervalo de confiana, para uma determinada probabilidade (e.g., 95%).
Aula 3 - Intervalos de Confiana e Testes Estatsticos 4 / 16
DISTRIBUIES USADAS NA TEORIA DE AMOSTRAS Distribuio Qui-quadrado A distribuio do qui-quadrado, simbolizada como 2, compara a relaco entre a varincia de uma populao e a de uma amostra, baseada na redundncia dessa amostra. Se uma amostra aleatrea com n observaes x1, x2, ..., xn, fr extrada de uma populao com distribuio normal, com mdia varincia 2, ento, por definio a distribuio 2 da amostra : onde o nmero de graus de liberdade na amostra e os outros termos so j conhecidos. Como se v no grfico seguinte, a redundncia (graus de liberdade) para as estatsticas da amostra (mdia e varincia) igual a = n-1. Deve-se ver a respectiva tabela (2) para vrios graus de liberdade de 1 a 120. Para achar a rea a sombreado, a partir de um ponto 2 at infinito, basta interceptar a linha dos respectivos graus de liberdade (), com a coluna da rea (probabilidade) desejada. Por exemplo, para achar o valor especfico 2 relativo a 1% (= 0,010) da rea com 10 g.l., intersecta-se a linha 10 com a coluna 0,010 e achamos um 2 = 23,21. Isto quer dizer que 1% da rea sob a curva estr entre 23,21 e +. e
S 2 = 2
2
5 / 16
Devido natureza assimtrica desta distribuio, os pontos percentuais () da cauda esquerda tm que ser calculados a partir dos da cauda direita (que esto tabelados). Uma dada rea direita, comeando em zero, at um determinado 2 calcula-se subtraindo de 1 o valor tabelado (rea direita). Isto devido s tabelas listarem os (reas) desde um 2 at , sendo a rea total da curva (desde zero) igual a um. Por exemplo, para 10 g.l. se quizermos o valor de 2 relativo a 1%, da rea na cauda esquerda, a linha correspondente a igual a 10 intersectada pela coluna = 0,990 (=1-0,001) e o valor 2,56 obtido. Isto quer dizer que 1% da rea sob a curva ocorre no intervalo [ 0 ; 2,56 ]. Assim, a distribuio 2 tem as seguintes caractersticas:
Distribuio de varincia de amostras P/ construir intervalos de confiana para a varincia de uma populao Varia em [ 0 ; + ]. Distribuio NO simtrica Baseada em graus de liberdade, , por amostra Tabela d valores crticos da rea da cauda direita
6 / 16
Distribuio t (Student) A distribuio t, compara a mdia de uma populao com a mdia de uma amostra baseada no nmero de redundncias () nessa amostra. similar distribuio normal, s que esta (a normal) se aplica a uma populao (ao todo) enquanto a t se aplica a uma amostra. Esta (a t ) prefervel normal quando a dimenso das amostras inferior a 30. Portanto, esta muito importante na anlise de dados de Topografia e Geodesia. Se z fr uma v.a. com distribuio normal standard e 2 uma v.a. qui-quadrado com g.l., e z e so independentes, ento, por definio:
t=
t=
7 / 16
Distribuio F A distribuio F, utilizada para comparar as varincias de duas amostras. Se 21 e 22 so duas v.a. qui-quadrado com 1 e 2 g.l. respectivamente e ambas as v.a. so independentes, ento, por definio:
12 1 F= 2 2 2
F( ,1 , 2 ) =
1
F(1 ,1 , 2 )
S12 F = 2 S 2
12 2 2
8 / 16
INTERVALO DE CONFIANA PARA A MDIA (t ) Para chegar a um intervalo de confiana, a mdia duma amostra normalmente distribuida, com mdia e varincia 2/n. Ento, seja
z = y
y
)(
2
n
S 2 = 2
2
t=
(y ) (
(S
2
2)
) = (y ) (
S
)= y
S
S = y t ( , ) 2 n
ou
y t (
, )
S S y + t ( , ) 2 n n
9 / 16
EXEMPLO: Foram feitas 20 leituras num limbo horizontal, com uma mdia de 34,5" e desvio padro de 2,1", indique: a) O intervalo de confiana a 95% da mdia da populao. b) O intervalo de confiana a 99% da mdia da populao. c) Uma leitura de 35,7 seria aceitvel para estes dados? a) Passo 1: = 0,05 (1 0,95) ento /2 = 0,025 = 20 - 1 = 19 Na tabela, o valor crtico para t(0.025,19) = 2,093 Passo 2:
b) Passo 1: = 0,01 (1 0,99) ento /2 = 0,005 = 20 - 1 = 19 Na tabela, o valor crtico para t(0.005,19) = 2,861 Passo 2:
Note-se que o intervalo a 99% obviamente mais largo que o de 95%. Isto indica que 99% das vezes a mdia da populao est entre 33,2 e 35,8. c) Sim, pelo menos a 99% de confiana.
10 / 16
SELECO DA DIMENSO DA AMOSTRA Exemplo: Num determinado projecto, as especificaes impe que 95% dos ngulos sejam medidos dentro de um erro de 2,1. Quantas medies devero ser feitas se uma nica tem um erro padro de 4 ? Nota: Recorremos distribuio normal.
t n= 2 I
Deveremos fazer 14 medies, pois 14 um nmero inteiro e par (num teodolito ou estao total, as visadas devero ser sempre em igual nmero para as directas e as inversas). Poder o intervalo ser to pequeno quanto possvel?
Repeties Amplitude do intervalo 1
1244
2
311
3
138
4
77,8
5
49,8
6
34,6
7
25,4
8
19,4
9
15,4
10
12,4
11
10,3
12
8,6
13
7,4
14
6,4
15
5,5
11 / 16
INTERVALO DE CONFIANA PARA A VARINCIA (2 ) USANDO A VARINCIA DA AMOSTRA Ao contrrio da distribuio normal e da de t, esta no simtrica em torno de zero, portanto temos que calcular os valores crticos mximos e mnimos.
S 2 S 2 < 2 < 2 2 2, 1 2,
EXEMPLO: Foram feitas 20 leituras num limbo horizontal, com um desvio padro de 2,1". Indique: a) O intervalo de confiana a 95% da varincia da populao. b) O intervalo de confiana a 99% da varincia da populao. a) Temos: = 0,05 (1 0,95) ento /2 = 0,025, = 20 - 1 = 19 Ver na tabela, o valor crtico para 2(0.025,19) e para 2(0.975,19) Ento:
12 / 16
b) Intervalo de confiana de 99% Temos: = 0,01 (1 0,99) ento /2 = 0,005, = 20 - 1 = 19 Ver na tabela, o valor crtico para 2(0.005,19) e para 2(0.995,19) Ento:
Note-se que o intervalo a 99% obviamente mais largo que o de 95%. Isto indica que 99% das vezes a varincia da populao est entre 2,17 e 12,25.
INTERVALO DE CONFIANA PARA A RAZO DE DUAS VARINCIAS DUMA POPULAO(F ) Para determinar o intervalo de confiana para a razo, temos que encontrar o mximo e mnimo valores da distribuio. Note-se que os valores mnimos no esto tabelados, nem necessrio pois: com Fmin o valor mnimo.
Fmin = F1 ,1 , 2 =
1 F ,1 , 2
P(Fmin
13 / 16
2 S12 2 P Fmin < 2 2 < Fmax = 1 S2 1 2 S12 2 < 2 2 < F 2,1 , 2 S2 1 2 S12 2 < 2 2 < F 2,1 , 2 S2 1
F1 2,1 , 2 1 F 2, 2 ,1
14 / 16
EXEMPLO: Ontem, uma srie de 10 medies de distncia obteve uma varincia de 52 mm2. Hoje, 21 medies adicionais da mesma distncia obteve uma varincia de 61 mm2. Qual o intervalo de confiana a 95% para a razo das varincias dessa grandeza? Note-se que em iguais circunstncias a razo esperada das varincias 1, i.e., intervalo? Soluo: Temos: /2 = 0,025 Na tabela, o valor crtico F(0.025,9,20) = 2,84 e F (0.025,20,9) = 3,67 Ento constroi-se o intervalo:
2 12 = 2
15 / 16
TESTES DE HIPTESES Os testes de hipteses so um processo similar ao de enquadrar uma estatstica (e.g., mdia) numintervalo de confiana. So os processos de validar estatsticas. No necessrio calcular fronteiras do mximo e mnimo.
Um teste de hipteses consiste em quatro partes: HIPTESE NULA H0: onde se compara a estatstica de uma populao com a de uma amostra. HIPTESE Alternativa Ha: onde
16 / 16