Вы находитесь на странице: 1из 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

Intervalos de Confiana e Testes Estatsticos


Estes conceitos iro ser revistos partindo de exemplos. Partimos de uma populao (TODOS os dados) de 100 elementos,com = 26,1 e 2 = 17,5 (ver tabela 1).
18,2 26,7 22,9 29,0 38,2 31,5 24,5 22,0 28,5 25,5 26,4 30,6 30,7 25,0 22,6 28,0 23,8 18,4 30,9 30,2 20,1 22,6 32,2 29,9 28,0 22,4 28,2 26,4 19,1 18,9 29,9 22,3 22,2 25,2 24,0 23,4 26,8 24,2 28,1 28,9 29,8 30,0 29,2 20,8 19,4 21,2 27,7 29,9 30,3 27,6 26,6 26,5 26,1 29,0 27,0 27,7 39,8 21,8 26,5 19,6 26,2 28,1 26,8 21,9 32,0 27,1 19,8 36,0 26,9 27,9 25,7 25,6 25,3 25,4 27,3 27,0 29,3 21,3 26,6 24,9 25,2 20,3 24,3 27,3 15,3 25,2 28,5 28,8 28,2 21,3 26,3 35,5 24,4 23,4 26,5 24,0 24,7 22,8 24,2 26,7

Tabela 1

Aleatoreamente, iremos estud-la com amostras de dimenso 10. A partir destas amostras, iremos estimar uma mdia e uma varincia. E no de esperar que essas estimativas concidam exactamente com os parmetros da populao. Vamos utilizar 10 sub-conjuntos (amostras) e verificar os respectivos parmetros. Se aumentssemos a dimenso, era de esperar que a mdia e a varincia dessa amostra se aproximasse mais das da populao. Este procedimento foi seguido para vrias dimenses da populao, desde 10 at 100 (ver resultados na tabela 2). Note-se que o valor calculado para a mdia da amostra se aproxima cada vez mais medida que a dimenso da amostra cresce, o que tambm acontece para a varincia.
Aula 3 - Intervalos de Confiana e Testes Estatsticos 1 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

Uma vez que a mdia e a varincia so calculadas a partir de varaiveis aleatrias, ento elas prprias so tambm variveis aleatrias. Isto quer dizer que, mesmo mantendo a dimenso da amostra, teremos valores diferentes para amostras diferentes. Experincia (10 amostrasde n=10)
Am Am Am Am Am Am Am Am Am Am 1: 2: 3: 4: 5: 6: 7: 8: 9: 10: 24,2 33,9 28,0 32,2 25,4 32,2 22,0 30,3 21,3 21,3 24,4 21,3 21,2 30,0 25,2 28,9 25,3 20,3 25,6 32,0 28,5 21,3 18,9 24,2 21,3 27,0 26,5 20,9 25,8 21,3 25,3 25,2 33,2 18,9 32,2 20,8 32,2 22,8 24,7 23,1 32,2 18,9 30,2 17,2 22,6 20,3 25,4 19,1 28,9 30,0 19,6 19,6 26,5 22,4 21,3 18,4 28,5 23,1 30,2 24,0 32,9 28,5 25,2 21,3 25,7 31,5 22,7 25,3 21,3 26,8 21,3 36,0 29,0 21,3 22,4 26,8 24,2 30,9 25,2 29,0 24,0 27,1 21,8 26,4 23,1 33,2 25,5 19,4 27,9 30,6 26,5 30,6 26,3 24,5 25,3 27,3 27,3 28,0 25,7 26,8

Tabela 2

Os resultados a partir da Tabela 2 so:


Am Am Am Am Am Am Am Am Am Am 1: 2: 3: 4: 5: 6: 7: 8: 9: 10: = = = = = = = = = = 25,89 26,24 26,03 23,84 24,45 26,64 25,96 24,01 25,66 26,49

2 2 2 2 2 2 2 2 2 2

= = = = = = = = = =

18,42 36,29 19,39 22,05 10,35 27,27 8,65 19,52 8,37 15,29

Portanto, os valores calculados a partir duma amostra tambm contm erros. Para ilustrar melhor, escolheram-se aleatoreamente quatro amostras de dimenso 10. Na tabela 3 vemos as amostras e respectivas mdias e varincias.

Aula 3 - Intervalos de Confiana e Testes Estatsticos

2 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

Experincia (10 amostras de n=20)


Am 1: Am 2: Am 3: Am 4: Am 5: Am 6: Am 7: Am 8: Am 9: Am 10: 32,9 32,0 35,5 15,6 27,3 25,2 18,9 21,9 20,1 25,7 19,8 24,0 29,2 28,8 27,1 25,5 25,3 22,4 26,1 22,7 18,4 25,2 24,2 28,2 23,4 22,0 21,5 26,8 26,4 25,5 35,5 27,3 20,1 29,3 28,9 29,8 27,1 20,3 31,5 18,2 23,3 22,3 28,0 21,8 25,3 24,2 30,9 27,0 22,4 20,9 32,9 25,4 26,2 21,3 24,2 22,9 29,0 26,8 23,8 31,5 26,8 22,4 22,0 30,3 25,6 21,9 25,2 21,8 24,4 17,2 33,2 30,0 22,6 24,1 24,0 29,8 20,3 26,1 19,1 26,4 13,3 29,9 21,5 29,3 25,2 22,4 21,2 21,9 25,4 30,2 28,5 32,2 38,2 27,6 24,9 21,3 25,3 20,8 16,8 36,0 23,1 25,4 22,2 18,9 18,4 24,4 21,8 21,3 26,3 26,8 26,1 25,2 23,8 27,1 28,5 30,2 24,0 22,6 24,2 16,8 22,2 25,3 18,4 24,0 27,0 26,4 18,9 27,3 25,2 28,8 20,3 22,9 29,2 22,6 29,9 20,9 17,2 21,5 28,5 19,1 24,5 30,9 21,2 33,9 26,7 25,2 28,5 22,8 24,0 28,2 26,5 19,6 30,0 30,3 16,2 29,3 22,3 23,8 21,9 25,7 20,8 29,3 25,5 24,5 26,7 29,2 22,4 17,2 16,2 26,2 26,4 19,4 28,5 23,1 26,8 32,0 21,5 19,8 18,2 25,3 28,5 30,9 22,4 36,0 24,0 25,4 26,1 30,0 32,2 22,9 26,8 27,1 25,5 22,6 18,9 30,7 27,6 30,2 20,3 25,2

Tabela 3

Os resultados a partir da Tabela 3 so:


Am 1: = 25,30 2 = 24,37 Am 2: = 25,48 = 20,55 Am 3: = 25,50 2 = 12,27 Am 4: = 25,60 = 37,23 Am 5: = 24,53 2 = 69,54
2 2

Am 6 : = 23,86 2 = 11,90 Am 7 : = 23,78 2 = 15,61 Am 8 : = 25,57 2 = 18,56 Am 9 : = 23,95 2 = 19,40 Am 10: = 26,67 2 = 18,02

Seguidamente,

veremos

as

alteraes

dos

parmetros

estimados, em funo da dimenso n da amostra:


# (n) 10 20 30 40 50 60 70 80 90

x
S
2

26,9 28,1

25,9 21,9

25,9 20,0

26,5 18,6

26,6 20,0

26,4 17,6

26,3 17,1

26,3 18,4

26,3 17,8

Tabela 4

Note-se que para esta populao = 26,1 e 2 = 17,5

Aula 3 - Intervalos de Confiana e Testes Estatsticos

3 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

Estas flutuaes dos parmetros estimados, levanta a questo da confiana nestas estimativas. Por exemplo, h mais confiana numa amostra com varincia pequena que numa com varincia grande. Assim, olhando para a Tabela 4, temos mais confiana na mdia estimada pela amostra 2 (n=20) que na da amostra 1 (n=10). A dimenso da amostra est directamente relaccionada com a mdia e a varincia calculadas (e.g., temos mais confiana na mdia calculada a partir de uma amostra de n=30 que na de uma de n=5, mesmo que tenham varincias semelhantes) Em Estatstica, a relao entre amostras, respectivas dimenses e parmetros (mdia e varincia) calculados parte da Teoria da Distribuio de Amostras, onde se verifica que as estimativas para a mdia e varincia variam de uma amostra para outra. As funes para calcular estas estimativas so os estimadores. Como exemplo de estimadores temos:

n 1 y = yi i =1 n

n 2 1 S = i i =1 n 1
2

que so utilizados para calcular, respectivamente, a mdia e a varincia. Estas estimativas variam entre si e tm as suas prprias confiana distribuies. Seguidamente, vamos definir as distribuies que descrevem e quantificam (ou qualificam...) a nos estimadores. Aplicando estas distribuies, podemos afirmar a verdade destes estimadores para um determinado nvel de confiana, ou seja, podemos definir um intervalo ou intervalo de confiana, para uma determinada probabilidade (e.g., 95%).
Aula 3 - Intervalos de Confiana e Testes Estatsticos 4 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

DISTRIBUIES USADAS NA TEORIA DE AMOSTRAS Distribuio Qui-quadrado A distribuio do qui-quadrado, simbolizada como 2, compara a relaco entre a varincia de uma populao e a de uma amostra, baseada na redundncia dessa amostra. Se uma amostra aleatrea com n observaes x1, x2, ..., xn, fr extrada de uma populao com distribuio normal, com mdia varincia 2, ento, por definio a distribuio 2 da amostra : onde o nmero de graus de liberdade na amostra e os outros termos so j conhecidos. Como se v no grfico seguinte, a redundncia (graus de liberdade) para as estatsticas da amostra (mdia e varincia) igual a = n-1. Deve-se ver a respectiva tabela (2) para vrios graus de liberdade de 1 a 120. Para achar a rea a sombreado, a partir de um ponto 2 at infinito, basta interceptar a linha dos respectivos graus de liberdade (), com a coluna da rea (probabilidade) desejada. Por exemplo, para achar o valor especfico 2 relativo a 1% (= 0,010) da rea com 10 g.l., intersecta-se a linha 10 com a coluna 0,010 e achamos um 2 = 23,21. Isto quer dizer que 1% da rea sob a curva estr entre 23,21 e +. e

S 2 = 2
2

Aula 3 - Intervalos de Confiana e Testes Estatsticos

5 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

Devido natureza assimtrica desta distribuio, os pontos percentuais () da cauda esquerda tm que ser calculados a partir dos da cauda direita (que esto tabelados). Uma dada rea direita, comeando em zero, at um determinado 2 calcula-se subtraindo de 1 o valor tabelado (rea direita). Isto devido s tabelas listarem os (reas) desde um 2 at , sendo a rea total da curva (desde zero) igual a um. Por exemplo, para 10 g.l. se quizermos o valor de 2 relativo a 1%, da rea na cauda esquerda, a linha correspondente a igual a 10 intersectada pela coluna = 0,990 (=1-0,001) e o valor 2,56 obtido. Isto quer dizer que 1% da rea sob a curva ocorre no intervalo [ 0 ; 2,56 ]. Assim, a distribuio 2 tem as seguintes caractersticas:
Distribuio de varincia de amostras P/ construir intervalos de confiana para a varincia de uma populao Varia em [ 0 ; + ]. Distribuio NO simtrica Baseada em graus de liberdade, , por amostra Tabela d valores crticos da rea da cauda direita

Verifique estas propriedades junto do respectivo grfico e tabela.

Aula 3 - Intervalos de Confiana e Testes Estatsticos

6 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

Distribuio t (Student) A distribuio t, compara a mdia de uma populao com a mdia de uma amostra baseada no nmero de redundncias () nessa amostra. similar distribuio normal, s que esta (a normal) se aplica a uma populao (ao todo) enquanto a t se aplica a uma amostra. Esta (a t ) prefervel normal quando a dimenso das amostras inferior a 30. Portanto, esta muito importante na anlise de dados de Topografia e Geodesia. Se z fr uma v.a. com distribuio normal standard e 2 uma v.a. qui-quadrado com g.l., e z e so independentes, ento, por definio:

t=

As propriedades da distribuio t so:


Distribuio de mdias de amostras P/ construir intervalos de confiana para a mdia duma populao (n<30) Varia em [ - ; + ]. Distribuio simtrica (como a normal) Baseada em graus de liberdade, , por amostra Tabela d valores crticos t da rea da cauda direita

Verifique estas propriedades junto do respectivo grfico e tabela.

t=

Aula 3 - Intervalos de Confiana e Testes Estatsticos

7 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

Distribuio F A distribuio F, utilizada para comparar as varincias de duas amostras. Se 21 e 22 so duas v.a. qui-quadrado com 1 e 2 g.l. respectivamente e ambas as v.a. so independentes, ento, por definio:

12 1 F= 2 2 2

As propriedades da distribuio t so:


Distribuio da razo de duas varincias de amostras P/ construir intervalos de confiana para a razo de duas varincias duma populao Varia em [ 0 ; + ]. Baseada em g.l., 1 e 2, das amostras Tabela d valores crticos F da rea da cauda direita Distribuio no simtrica, todavia verifica-se:

F( ,1 , 2 ) =

1
F(1 ,1 , 2 )

Verifique estas propriedades junto do respectivo grfico e tabela.

S12 F = 2 S 2

12 2 2

Aula 3 - Intervalos de Confiana e Testes Estatsticos

8 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

INTERVALO DE CONFIANA PARA A MDIA (t ) Para chegar a um intervalo de confiana, a mdia duma amostra normalmente distribuida, com mdia e varincia 2/n. Ento, seja
z = y
y

)(

) uma v.a. normal, ento:


t= z

a partir destas relaes vem:

2
n

S 2 = 2
2

t=

(y ) (
(S
2

2)

) = (y ) (
S

)= y
S

S = y t ( , ) 2 n
ou

y t (

, )

S S y + t ( , ) 2 n n

Aula 3 - Intervalos de Confiana e Testes Estatsticos

9 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

EXEMPLO: Foram feitas 20 leituras num limbo horizontal, com uma mdia de 34,5" e desvio padro de 2,1", indique: a) O intervalo de confiana a 95% da mdia da populao. b) O intervalo de confiana a 99% da mdia da populao. c) Uma leitura de 35,7 seria aceitvel para estes dados? a) Passo 1: = 0,05 (1 0,95) ento /2 = 0,025 = 20 - 1 = 19 Na tabela, o valor crtico para t(0.025,19) = 2,093 Passo 2:

33,5 = 34,5 2,093

2,1 2,1 34,5 + 2,093 = 35,5 20 20

b) Passo 1: = 0,01 (1 0,99) ento /2 = 0,005 = 20 - 1 = 19 Na tabela, o valor crtico para t(0.005,19) = 2,861 Passo 2:

33,2 = 34,5 2,861

2,1 2,1 34,5 + 2,861 = 35,8 20 20

Note-se que o intervalo a 99% obviamente mais largo que o de 95%. Isto indica que 99% das vezes a mdia da populao est entre 33,2 e 35,8. c) Sim, pelo menos a 99% de confiana.

Aula 3 - Intervalos de Confiana e Testes Estatsticos

10 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

SELECO DA DIMENSO DA AMOSTRA Exemplo: Num determinado projecto, as especificaes impe que 95% dos ngulos sejam medidos dentro de um erro de 2,1. Quantas medies devero ser feitas se uma nica tem um erro padro de 4 ? Nota: Recorremos distribuio normal.

t n= 2 I

1,96 4 n= = 13,9 = 14 2,1

Deveremos fazer 14 medies, pois 14 um nmero inteiro e par (num teodolito ou estao total, as visadas devero ser sempre em igual nmero para as directas e as inversas). Poder o intervalo ser to pequeno quanto possvel?
Repeties Amplitude do intervalo 1
1244

2
311

3
138

4
77,8

5
49,8

6
34,6

7
25,4

8
19,4

9
15,4

10
12,4

11
10,3

12
8,6

13
7,4

14
6,4

15
5,5

1400 1200 1000 800 600 400 200 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Intervalo vs Repeties

Os ganhos de preciso estabilizam a partir de n=8

Aula 3 - Intervalos de Confiana e Testes Estatsticos

11 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

INTERVALO DE CONFIANA PARA A VARINCIA (2 ) USANDO A VARINCIA DA AMOSTRA Ao contrrio da distribuio normal e da de t, esta no simtrica em torno de zero, portanto temos que calcular os valores crticos mximos e mnimos.

S 2 S 2 < 2 < 2 2 2, 1 2,

EXEMPLO: Foram feitas 20 leituras num limbo horizontal, com um desvio padro de 2,1". Indique: a) O intervalo de confiana a 95% da varincia da populao. b) O intervalo de confiana a 99% da varincia da populao. a) Temos: = 0,05 (1 0,95) ento /2 = 0,025, = 20 - 1 = 19 Ver na tabela, o valor crtico para 2(0.025,19) e para 2(0.975,19) Ento:

19 (2,1) 19 (2,1) 2,55 = 2 = 9,40 32,85 8,91


2 2

Aula 3 - Intervalos de Confiana e Testes Estatsticos

12 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

b) Intervalo de confiana de 99% Temos: = 0,01 (1 0,99) ento /2 = 0,005, = 20 - 1 = 19 Ver na tabela, o valor crtico para 2(0.005,19) e para 2(0.995,19) Ento:

19 (2,1) 19 (2,1) 2,17 = 2 = 12,25 38,58 6,84


2 2

Note-se que o intervalo a 99% obviamente mais largo que o de 95%. Isto indica que 99% das vezes a varincia da populao est entre 2,17 e 12,25.

INTERVALO DE CONFIANA PARA A RAZO DE DUAS VARINCIAS DUMA POPULAO(F ) Para determinar o intervalo de confiana para a razo, temos que encontrar o mximo e mnimo valores da distribuio. Note-se que os valores mnimos no esto tabelados, nem necessrio pois: com Fmin o valor mnimo.

Fmin = F1 ,1 , 2 =

1 F ,1 , 2

A probabilidade para encontrar o intervalo de confiana para a razo :

P F1 2,1 , 2 < F < F1 2,1 , 2 = 1


2 S12 2 Fmin < 2 2 < Fmax < F < Fmax ) = P S2 1

P(Fmin

Aula 3 - Intervalos de Confiana e Testes Estatsticos

13 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

2 S12 2 P Fmin < 2 2 < Fmax = 1 S2 1 2 S12 2 < 2 2 < F 2,1 , 2 S2 1 2 S12 2 < 2 2 < F 2,1 , 2 S2 1

F1 2,1 , 2 1 F 2, 2 ,1

2 2 S2 1 2 S 22 2 < 2 < 2 F 2,1 , 2 S F 1 S1 1 2, 2 ,1

S12 S12 1 12 2 < 2 < F 2, 2 ,1 2 S S F 2 2 2 2,1 , 2

Aula 3 - Intervalos de Confiana e Testes Estatsticos

14 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

EXEMPLO: Ontem, uma srie de 10 medies de distncia obteve uma varincia de 52 mm2. Hoje, 21 medies adicionais da mesma distncia obteve uma varincia de 61 mm2. Qual o intervalo de confiana a 95% para a razo das varincias dessa grandeza? Note-se que em iguais circunstncias a razo esperada das varincias 1, i.e., intervalo? Soluo: Temos: /2 = 0,025 Na tabela, o valor crtico F(0.025,9,20) = 2,84 e F (0.025,20,9) = 3,67 Ento constroi-se o intervalo:
2 12 = 2

. Ser verdade, tendo em conta o

12 52 52 1 0,30 = 2 3,67 = 3,13 61 2,84 2 61


Como 1 est contido no intervalo, no h razo para acreditar que
2 12 2

a um nvel de confiana de 95%.

Aula 3 - Intervalos de Confiana e Testes Estatsticos

15 / 16

ESTIG IPBeja Engenharia Topogrfica Tratamento Matemtico de Observaes

TESTES DE HIPTESES Os testes de hipteses so um processo similar ao de enquadrar uma estatstica (e.g., mdia) numintervalo de confiana. So os processos de validar estatsticas. No necessrio calcular fronteiras do mximo e mnimo.

Um teste de hipteses consiste em quatro partes: HIPTESE NULA H0: onde se compara a estatstica de uma populao com a de uma amostra. HIPTESE Alternativa Ha: onde

Aula 3 - Intervalos de Confiana e Testes Estatsticos

16 / 16

Вам также может понравиться