Вы находитесь на странице: 1из 42

MESTRADO PROFISSIONAL EM

ECOLOGIA APLICADA A GESTO


AMBIENTAL

Bases Conceituais da Anlise


Estatstica

Gilson Correia de Carvalho


Programa de Ps-Graduao em Ecologia Aplicada Gesto Ambiental IBIO UFB
Departamento de Biointerao ICS UFBA
Contedo

Definio
Principais objetivos
Diferentes escolas de estatstica
Exemplo de estimativa de parmetro e inferncia (erro padro,
IC95%)
Testes de Hipteses
Exemplo de teste de hipteses e inferncia via mtodos de re-
amostragem
Exemplo de teste de hipteses via estatstica paramtrica
clssica
Exemplo de teste de hiptese via estatstica no-paramtrica
Seleo de testes
Pressupostos
Tamanho Amostral
Alguns detalhamentos
Definio

Antigamente: palavra latina STATUS (Estado)

Hoje: Estatstica = Cincia + Tecnologia + Arte


(Cordeiro, G. M.)

Cincia: tem identidade prpria com um


grande nmero de tcnicas deduzidas de
princpios bsicos

Tecnologia: sua metodologia pode ser


implantada num sistema operacional para
manter um nvel desejado de performance

Arte: depende da razo indutiva e no est


livre de controvrsias
Principais objetivos

Existe uma diversidade enorme de questes


cientficas !!!!!!

Estimar um parmetro
atravs de uma
estatstica

? Testar hipteses sobre


os parmetros
?
1. Limites 2. O que medir ? 3. Amostragem
da populao ?

5. Relevncia 4. Inferncia estatstica


estatstica =
Relevncia
Tipos de Variveis
Diferentes Escolas de Estatstica

Paramtricos
No-paramtricos
Frequentistas Mtodos de Monte-Carlo
Mtodos de Randomizao P(dados|
hiptese)
Bootstrap
Jackknife

Verossimilhantistas P(dados|hiptese) - sem


informao prvia
Bayesianos P(hiptese|dados) - com
informao prvia
Exemplo de Estimativa de parmetro
?
1. Limites 2. O que medir ? 3. Amostragem
da populao ?

5. Relevncia 4. Inferncia estatstica


estatstica =
Relevncia
Suponha que queremos estimar o parmetro do nvel
do hormnio X na populao de interesse.

Frequentistas tem como premissa que fixo !!!

Precisamos ter como premissa que os valores do


hormnio na populao se distribuem normalmente
com mdia e desvio padro
Tomamos uma amostra aleatria e independente da
populao de interesse.

Por exemplo: 1, 2, 3, 4, 5 n = 5

Usamos a estimativa de mxima verossimilhana de

1 + 2 + 3 + 4 + 5 = 15/5 = 3, ento a melhor


estimativa de 3
X
xi
n
Podemos estar errados e a amostragem introduziu erro
na estimativa!

Precisamos de uma medida da incerteza desta


estimativa

Antes, precisamos de uma estimativa da variabilidade


da populao. Como fazemos isso?
Amplitude = maior menor
Problemas:

S leva em considerao 2 valore


da distribuio
Como fazemos para saber a variao
mdia das diferenas em relao a mdia ?
X5 Mdia = 2

X4 Mdia = 1

X3 Mdia = 0

X2 Mdia = - 1

X1 Mdia = - 2
Mdia dos desvios em relao a mdia !!!!

X5 Mdia = 2

X4 Mdia = 1

X3 Mdia = 0

X2 Mdia = - 1

X1 Mdia = - 2

2 + 1 + 0 + (-1) + (-2) = 0 !!!!!!!!!! Sempre !


Uma Sada !!!! Mdulo (Desvio mdio)
l2l + l1l + l0l + l(-1)l + l(-2)l = 6/5-1 = 1,5 mg/
X5 Mdia = 2

X4 Mdia = 1

X3 Mdia = 0

Vantagens/Desvantagens
X2 Mdia = - 1
Mesma escala da varivel

Os estatsticos no gostam X1 Mdia = - 2


Outra !!!! Quadrado (Varincia)
(2) 2 + (1)2 + (0)2 + (-1)2 + (-2)2 = 10/5 - 1 = 2,5 (mg/l) 2
X5 Mdia = 2

X4 Mdia = 1

X3 Mdia = 0

Vantagens/Desvantagens
X2 Mdia = - 1
Escala quadrtica ????????

Os estatsticos gostam X1 Mdia = - 2


Mais Outra !!!! Raiz quadrada do Quadrado
Raiz((2) 2 + (1)2 + (0)2 + (-1)2 + (-2)2/n-1) = 10/5 - 1 = 1,58
X5 Mdia = 2

X4 Mdia = 1

X3 Mdia = 0

Vantagens/Desvantagens
X2 Mdia = - 1
Escala quadrtica ????????

Os estatsticos gostam X1 Mdia = - 2


Portanto, a estimativa da variabilidade da populao
o desvio padro s que estima o parmetro da
populao.

Raiz((2) 2 + (1)2 + (0)2 + (-1)2 + (-2)2/n-1) =


10/5 - 1 = 1,58 mg/l
s
ep
Usamos o s para calcular o erro padro da mdia
n
atravs de

logo = 1,58/raiz(5) = 0,71


s
IC X Z *o erro padro da mdia para calcular o
Usamos
n
intervalo de confiana da estimativa uma
probabilidade desejada.

logo, 1,96*0,71 = 1,39


Ou seja, temos 95% de confiana de que o parmetro
real da populao da qual esta amostra foi retirada
est:

Entre, 1,61 e 4,39. Entretanto, perceba que isso mede a


preciso da estimativa com uma confiana
determinada pelo pesquisador.

Se calculssemos 100 IC95%, cerca de 5 deles no


conteriam
E se eu ativesse
mdia real da populao
interessado em uma proporo
populacional?

Faramos o mesmo processo calculando:


p (1 p) p (1 p)
ep IC p Z *
n n
Por que este procedimento funciona?

Isto est associado ao conceito de distribuio amostral


da mdia
Suponha uma populao...
B C

A varivel aleatria, X,
a idade dos indivduos

Os valores de X: 18, 20, 22, 24


medidos em anos.
D
TODOS os indivduos apresentam alguma
destas idades

A
Caractersticas da Populao
Medidas descritivas Distribuio da populao
N

X i
i 1
P(X)
N
.3
18 20 22 24
21 .2
4
.1

N
0 X
X A B C D
2
i
i 1
2.236 (18) (20) (22) (24)
N

Distribuio Uniforme
Amostras possveis de tamanho
n=2
16 mdias amostrais

16 amostras
Amostras tomadas com
reposio
Distribuio Amostral de
todas as mdias Amostrais
16 mdias amostrais Distribuio das
mdias amostrais
P(X)
.3

.2

.1
_
0 X
18 19 20 21 22 23 24

n na amostra = 2, n na distribuio amostral = 16


Medidas importantes para
distribuio amostral
N

X i
18 19 19 24
x i 1
21
N 16

X x
N
2
i
x i 1
N


18 21 2
19 21 24 21
2 2
1.58
16
Comparando a distribuio populacional
com a distribuio amostral
Populao Distribuio amostral da mdia
n=2
= 21, = 2.236 x 21 x 1.58
P(X) P(X)
.3 .3

.2 .2

.1 .1

0 0 _
A B C D X 18 19 20 21 22 23 24 X
(18) (20) (22) (24)
Resultados para outros tamanhos
amostrais
Esquema lgico Observaes
Padres no espao ou tempo
dos componentes
de um programa Modelos
de pesquisa: Explicaes ou teorias
(Underwood 1997)

Hiptese

Previses baseadas no modelo

Hiptese nula
Logicamente oposta a hiptese

No Rejeita Teste/experimento
H0 Teste crtico da hiptese nula
Rejeita H0
Refutar Interpretao
hiptese e Apoia
modelo hiptese e
modelo
Suponha que tivssemos
interesse em testar as
hipteses

H0 = =
Ha =
Ho verdadeiro Ho falso
Aceitar Ho Concluso correta Erro Tipo II - Beta

Rejeitar Ho Erro Tipo I - Alfa Concluso correta


1 Beta = Poder
99,73%
Probabilidade de Erro Tipo I = 0,05 ou 5
95,44%
68,26%

2 7 .6 2 7 .8 28 2 8 .2 2 8 .4 2 8 .6 2 8 .8 29 2 9 .2
-1 +1
-2 +2
-3 +3
Amostramos a populao organizadas em dois grupos
(homem e mulher) e obtivemos os resultados as
seguintes estimativas para os parmetros e :

X H (1.70, 1.68, 1.72, 1.78, 1.82)/5 1.74 x i


X
X M (1.64, 1.58, 1.70, 1.68, 1.68)/5 1.656 n

Se no queremos pressupor nenhuma distribuio


especfica para os dados podemos seguir a escola de
mtodos de re-amostragem

Como comparar as mdias?

Diff obs X H X M 0.084


De que jeito podemos saber como seriam os valores de
Diff caso a hiptese nula fosse verdadeira?
Homem 1,70 Homem 1,70
Homem 1,68 Mulher 1,68
Homem 1,72 Homem 1,72
Homem 1,78 Mulher 1,78
Homem 1,82 Homem 1,82
Mulher 1,64 Homem 1,64
Mulher 1,58 Mulher 1,58
Mulher 1,70 Mulher 1,70
Mulher 1,68 Mulher 1,68
Mulher 1,68 Homem 1,68
X H (1.70, 1.72, 1.82, 1.64, 1.68)/5 1.712
X M (1.68, 1.78, 1.58, 1.70, 1.68)/5 1.684

Diff sim1 X H X M 0.028


Qual a probabilidade de obter um valor de Diff igual a
0.084 ou maior caso a hiptese nula fosse verdadeira, ou
seja, P(>=0.084|H0)= 0.058, segundo nosso critrio 0.05
uma probabilidade alta !!!

0.084
Ou seja, existe uma probabilidade maior do que o limite
que consideramos baixo de obter um Diff to alto ou
maior do que obtemos simplesmente por acaso. Portanto,
no temos evidncia suficiente para dizer que H0 deve
ser rejeitada. Logo, no rejeitamos H0.

H0 = H =
M
E se pudssemos pressupor uma distribuio para os
dados?

Poderamos usar a distribuio t de Student:

Para isso:

1. Amostras independentes e aleatrias


2. Normalidade dos dados
3. Homogeneidade nas varincias
Interpretao
t calculado = 2.4922
t crtico = 2,306004
Rejeita-se H0 = H = M
Outra opo para o caso de no podermos pressupor
normalidade e homocedasticidade nos dados.

Testes No-paramtricos