Вы находитесь на странице: 1из 26

Universidade Federal da Bahia

Instituto de Matemtica
Departamento de Estatstica
Estatstica IV (MAT027) e Introduo Estatstica (MAT050)
NOTAS DE AULA

UNIDADE III

INFERNCIA ESTATSTICA

1
1 INTRODUO
At o presente momento, ns aprendemos a descrever uma amostra atravs das medidas de tendncia central
e de disperso, que so parte da chamada estatstica descritiva. Com a utilizao da inferncia estats-
tica, desejamos inferir indutivamente propriedades de uma populao (ou universo) com base nos resultados
obtidos com a amostra (ou subconjunto do inverso ) o que constitui uma ferramenta muito importante no
desenvolvimento de uma disciplina cientca. Toda a inferncia na Estatstica est baseada na teoria das
probabilidades, que ns acabamos de ver.
Freqentemente, devemos tomar decises sobre populaes com base em informaes obtidas em amostras
das mesmas. Tais decises chamam-se decises estatsticas. Por exemplo, com base em resultados amostrais,
podemos querer decidir se determinada droga eciente na cura de determinada doena, se um processo
educacional melhor do que outro, se um determinado nmero de caixas de um banco suciente para um
atendimento rpido ao cliente, etc. Para a tomada de tais decises utilizaremos a inferncia estatstica.
Nesta etapa do nosso curso, iniciaremos a discusso falando sobre aspectos fundamentais da amostragem,
aps a qual introduziremos as noes sobre distribuio amostral da mdia e da proporo, intervalos de
conana e testes de hipteses para mdias e propores, nalizando com um mtodo para avaliao de
relaes entre variveis qualitativas, que o teste qui-quadrado de independncia.
2 AMOSTRAGEM
Amostragem o ato de obter uma amostra de uma populao, podendo-se denir populao como um conjunto
de elementos, cada um deles apresentando uma ou mais caractersticas em comum. Amostra , simplesmente,
uma parte da populao.
O levantamento por amostragem, quando comparado com o levantamento total, apresenta certas vanta-
gens:
custo menor;
resultado em menor tempo;
objetivos mais amplos;
dados mais dedignos.
H situaes em que a amostragem se impe. Assim, pode-se ter o caso de a populao de estudo ser
muito grande, sendo impraticvel o levantamento total. Em casos em que o processo de investigao das
caractersticas de cada elemento for destrutivo (teste de resistncia de materiais, por exemplo), s tem sentido
trabalhar-se com amostras. H tambm os problemas de ordem tica: novas drogas, vacinas, tcnicas cirrgicas
devem ser testadas inicialmente em amostras, antes de seu uso amplo na populao.
2.1 ETAPAS DE UM LEVANTAMENTO POR AMOSTRAGEM
Quer a amostragem seja feita dentro de um laboratrio (por exemplo, para selecionar ratos que sero usados
em um experimento sobre agentes cancergenos), quer a amostragem seja feita sobre a populao geral (por
exemplo, para obter informaes sobre aspectos de fertilidade de mulheres moradoras em uma grande cidade,
como So Paulo), existem etapas que devem ser seguidas, intimamente ligadas aos princpios de metodologia
de pesquisa cientca. Tais itens sero comentados com linguagem mais dirigida a levantamentos objetivando
estimar parmetros de populaes reais de seres humanos. Tais comentrios, todavia, so aplicveis a qualquer
situao em que se requeira amostragem, bastando para isso pequenos ajustes, basicamente de forma e no
de contedo.
As principais etapas de um levantamento por amostragem so:
2
1. Explicitao dos objetivos com bastante clareza, a m de evitar dvidas posteriores ou mesmo esquec-
imentos, devendo car bem denida qual a unidade elementar (elemento) ou unidade de anlise a ser
trabalhada.
2. Denio da populao a ser amostrada.
(a) Em certas situaes isto pode ser relativamente fcil, como no caso de se desejar tomar uma amostra
de uma populao de crianas que estejam matriculadas e freqentando certo grupo escolar. Ter-
se-ia uma situao mais complexa para se estudar gestantes que procuram centros de sade para
fazer pr-natal.
3. Escolha das variveis a serem observadas em cada unidade de anlise.
(a) Deve ser vericado se todos os dados que vo ser levantados so relevantes para a pesquisa e se
nenhum dado relevante foi omitido. Existe uma tendncia, particularmente ao se trabalhar com
populaes humanas, usando questionrio, de se fazer muitas perguntas, um grande nmero das
quais nunca so analisadas. Questionrios longos, em geral, levam a diminuir a qualidade da
resposta.
4. Especicao do grau de preciso desejado.Os resultados de levantamento por amostragem so sujeitos
a incerteza, devido a erros de medida e ao fato de apenas parte da populao ser examinada. O grau
de incerteza pode ser diminudo tomando-se amostras maiores e empregando-se melhores tcnicas ou
aparelhos de medida.
5. Escolha dos instrumentos de medida e da forma de abordagem.
(a) Em caso de inquritos sobre nutrio, por exemplo, poder haver escolha entre observao nica
ou observao durante sete dias; em estudos antropomtricos ser decidido o tipo de balana,
calibrador e outros aparelhos a serem usados. Questionrios podem ser preenchidos pelo prprio
indivduo ou serem aplicados a cada indivduo por um entrevistador treinado.
6. Escolha da unidade amostral, que denida como a menor parte distinta e identicvel da populao,
para ns de enumerao e sorteio da amostra.
(a) Uma unidade amostral pode ser o prprio elemento de estudo (criana, cobaia, cidade, trecho da
estrada) ou um conjunto de elementos (classe de escola, ninhada, Estado, conjunto de trechos
continuados de estrada). As unidades amostrais devem cobrir toda a populao e no podem
apresentar transvariao, ou seja, um elemento de estudo no pode pertencer ao mesmo tempo a
mais de uma unidade amostral. relao, lista ou mapa contendo todas as unidades amostrais
d-se o nome de sistema de referncia ou fundamentos da pesquisa.
7. Execuo de prova experimental, prova-piloto ou pr-teste.
(a) Nesta etapa feito um verdadeiro ensaio do trabalho a ser desenvolvido, sendo testados os instru-
mentos de medida, questionrio, pessoal de campo, a sistemtica proposta, a reao da populao.
Orienta os reajustes necessrios e pode dar informaes valiosas sobre possvel durao e custo da
pesquisa e indicaes sobre a variabilidade do fenmeno pesquisado, o que permite calcular melhor
o tamanho da amostra.
8. Seleo da amostra aps decidido qual deve ser o respectivo tamanho.
Esta seleo deve ser feita, de preferncia, por meio de sorteio do tipo lotrico.
3
2.2 TIPOS DE AMOSTRAGEM
A amostragem probabilstica quando cada unidade amostral na populao tem uma probabilidade conhecida
e diferente de zero de pertencer amostra. De outra forma, a amostragem dita no-probabilstica.
Admita-se, por exemplo, que seja denida uma populao de dez grupos escolares, cada qual com certo
nmero de alunos, desejando-se uma amostra de tamanho igual a cinco grupos escolares. Se o pesquisador
decidiu simplesmente escolher os grupos escolares A, B, C, I, J, ter-se-ia uma amostragem no-probabilstica.
possvel, no entanto (e mesmo desejvel), que o investigador obtenha o nmero de alunos de cada grupo
escolar e faa um sorteio para obteno das cinco escolas, cada escola tendo uma probabilidade de ser sorteada
proporcionalmente ao seu nmero de alunos; ser uma amostragem probabilstica.
A amostragem no-probabilstica pode prejudicar sensivelmente a validade externa de um estudo, pois
muitos fatores podem inuir na escolha de uma unidade amostral para pertencer amostra, prejudicando
sua representatividade em relao populao. Mesmo assim, existem situaes em que ela usada, havendo
ento interesse em se conhecer algumas formas de amostragem no-probabilstica:
por voluntrios, que bastante usada em ensaios clnicos para teste de novos medicamentos;
intencional, quando as unidades que compe a amostra so escolhidas pelo pesquisador; usada na
vericao de poluio de praias;
por acesso mais fcil, em que as unidades so escolhidas por estarem em melhores condies de acessi-
bilidade. Veja-se, por exemplo, o caso em que se dena para estudo todo o conjunto de habitantes de
uma rea rural, tendo o domiclio como unidade amostral; se o entrevistador escolheu os dez primeiros
domiclios do seu caminho, teremos este tipo de amostragem, tendo sido desconsideradas as outras
unidades amostrais que tambm pertencem populao.
2.3 AMOSTRAGEM PROBABILSTICA
2.3.1 AMOSTRAGEM CASUAL SIMPLES
Tambm conhecida por amostragem ocasional, acidental, casual, randmica, etc. A amostragem simples
ao acaso destaca-se por ser um processo de seleo bastante fcil e muito usado. Neste processo, todos os
elementos da populao tem igual probabilidade de serem escolhidos, no s antes de ser iniciado, como
tambm at completar-se o processo de coleta. Eis o procedimento para seu uso:
1. Devemos numerar todos os elementos da populao. Se, por exemplo, nossa populao tem 5.000elementos,
devemos numer-los de 0000 a 4999 ou, como acontece geralmente, usamos um nmero que j identica
o elemento.
2. Devemos efetuar sucessivos sorteios com reposio (ou no) at completar o tamanho da amostra (n).
Para realizar este sorteio, podemos usar as tbuas de nmeros aleatrios ou ainda preferencialmente, o
uso de programas computacionais prprios para estes ns.
Se, durante o sorteio, unidades amostrais j sorteadas poderem ser novamente sorteadas, sendo represen-
tadas uma, duas ou mais vezes na amostra, ter-se- a chamada amostragem casual simples com reposio.
Em geral, dar-se preferncia ao tipo de amostragem casual simples sem reposio, principalmente quando
se trata de populaes com reduzido nmero de unidades amostrais.
2.3.2 AMOSTRAGEM SISTEMTICA
Trata-se de uma variao da amostragem simples ao acaso, muito conveniente quando a populao est
naturalmente ordenada, como chas em um chrio, listas telefnicas, etc.
Procedimento:
4
Seja N o tamanho da populao e n o tamanho da amostra. Ento, calcula-se o intervalo de amostragem
N
n
ou o inteiro mais prximo que chamaremos de a. Sorteia-se um nmero entre 1 e a e seja x esse nmero.
Formamos, assim, a amostra dos elementos correspondentes aos nmeros: x; (x+a); (x+2a); ...; [x+(n1)a].
Exemplos:
1. Seja N = 500 e n = 50. Ento,
500
50
= 10, ou a = 10.
Sorteia-se um nmero de 1 a 10. Seja 3 (x = 3) o nmero sorteado. Logo, os elementos numerados por
3; 13; 23; 33; ... sero os componentes da amostra.
2. Para uma populao de tamanho N = 32, numerada seqencialmente de 1 a 32, e amostra de tamanho
n = 8, tem-se a = 4.
O incio casual x deve ser sorteado entre 1, 2, 3 e 4; admita-se que tenha sido x = 3.
A amostra ca constituda das unidades amostrais de nmero (ou ordem):
3; 7; 11; 15; 19; 23; 27; 31.
Pode ser visto que o resultado obtido somando-se sucessivamente o intervalo de amostragem a = 4 a
cada nmero obtido imediatamente antes.
2.3.3 AMOSTRAGEM ESTRATIFICADA
No caso de populao heterognea, na qual podemos distinguir subpopulaes mais ou menos homogneas
denominadas estratos, podemos usar a amostragem estraticada.
Estraticar uma populao dividi-la em L subpopulaes denominadas estratos, tais que n
1
+n
2
+...
+
n
L
=
n, onde os estratos so mutuamente exclusivos.
Aps a determinao dos estratos, seleciona-se uma amostra aleatria de cada subpopulao.
Muitas vezes uma populao composta de subpopulaes (ou estratos) bem denidos, havendo maior
homogeneidade entre as unidades amostrais dentro de cada estrato do que entre as unidades amostrais de es-
tratos diferentes. Sexo, idade, condio scio-econmica, so exemplos tpicos. Nestas condies, tais estratos
devem ser levados em considerao e o sorteio da amostra deve ser feito em cada um deles independentemente;
da o nome de amostragem estraticada.
Um caso muito importante da amostragem estraticada aquele em que o pesquisador deseja que as
subpopulaes sejam representadas na amostra com a mesma proporcionalidade com que compe a populao
total. Trata-se da situao denominada amostragem casual simples estraticada com partilha proporcional
ou simplesmente amostragem estraticada proporcional.
3 COMPARAO ENTRE ESTATSTICAS E PARMETROS
Quando estamos trabalhando com dados provenientes de uma amostra, poderemos calcular algumas estatsti-
cas, que 5 so caracterizaes da amostra. Por exemplo, pode-se calcular a mdia ou a varincia desses dados.
Logo, estatstica uma funo dos dados da amostra X
1
, X
2
, ...., X
n
:
T = f(X
1
, X
2
, ...., X
n
)
Temos ento que:
X =
n
P
i=1
x
i
n
= a mdia da amostra
S
2
=
P
n
i=1
(x
i
x)
2
n 1
= a varincia da amostra
5
que so funes de X
1
, X
2
, ...., X
n
.
X e S
2
so as estatsticas mais comuns.
Por sua vez, os parmetros caracterizam a populao.
Os smbolos mais comuns utilizados para distinguir se estamos trabalhando com amostra ou populao
so dados na tabela a seguir:
Discriminao Estatstica Parmetros
Mdia X
Varincia S
2

2
Nmero de elementos n N
Proporo b p p
4 DISTRIBUIES AMOSTRAIS
O problema da Inferncia Estatstica fazer uma armao sobre parmetros da populao atravs da amostra.
4.1 DISTRIBUIO AMOSTRAL DA MDIA
Suponha uma populao identicada pela v.a. X, cujos parmetros mdia populacional = E(X) e varincia
populacional
2
= V ar(X) so supostamente conhecidos. Vamos retirar todas as possveis amostras ao acaso
simples, de tamanho n dessa populao, e para cada uma calcular a mdia X.
Vamos supor a seguinte populao:
A populao {2, 3, 4, 5} tem mdia = 3, 5 e varincia
2
= 1, 25.
Vamos relacionar todas as amostras possveis de tamanho 2 dessa populao:
(2, 2) (2, 3) (2, 4) (2, 5)
(3, 2) (3, 3) (3, 4) (3, 5)
(4, 2) (4, 3) (4, 4) (4, 5)
(5, 2) (5, 3) (5, 4) (5, 5)
Agora vamos calcular a mdia de cada amostra acima relacionada. Ento teremos:
2, 0 2, 5 3, 0 3, 5
2, 5 3, 0 3, 5 4, 0
3, 0 3, 5 4, 0 4, 5
3, 5 4, 0 4, 5 5, 0
Por m, vamos calcular a mdia das mdias, ou seja,
E(X) =
2, 0 + 2, 5 + 3, 0 + 3, 5 +.......... + 4, 5 + 5, 0
16
= 3, 5
De modo anlogo, vamos calcular a varincia da mdia X por:
V ar(X) =
1
n
n
X
i=1
(x
i
x)
2
| {z }
A
Para o clculo da parte denotada por A, teremos que:
P
n
i=1
(x
i
x)
2
= (x
1
x)
2
+ (x
2
x)
2
+ (x
3
x)
2
+.... + (x
n
x)
2
= (2, 0 3, 5)
2
+ (2, 5 3, 5)
2
+... + (5, 0 3, 5)
2
= 10
Substituindo na frmula da varincia, teremos:
V ar(X) =
1
16
(10) = 0, 625 =
V ar(X)
n
=
1, 25
2
6
Teorema: Para amostras casuais simples (X
1
, X
2
, ...., X
n
), retiradas de uma populao com mdia e
varincia
2
, a distribuio amostral da mdia =
(X
1
+X
2
+.... +X
n
)
n
aproxima-se de uma Distribuio
Normal com mdia e varincia

2
n
, quando n tende ao innito.
Desta forma:
E(X) =
V ar(X) =

2
n
Se X N(,
2
) =X N(,

2
n
), n > 1
Para padronizarmos a v.a.X vamos usar a mesma transformao em que subtrai-se a mdia e divide-se
pelo desvio-padro: Z =
X

n
=Z N(0, 1)
Exemplo: Uma varivel aleatria X tem distribuio normal, com mdia 100 e desvio-padro 10.
Se X a mdia de uma amostra de 16 elementos retirados desta populao, calcule?
1. P(90 < X < 110);
2. Que deveria ser o tamanho da amostra de modo a garantir a que P(90 < X < 110) = 95%?
Resoluo:
X N(100, 100) =X N(100; 6, 25)
P(90 < X < 110) = P

90

n
< Z <
110

= P

10
2, 5
< Z <
10
2, 5

= P(4 < Z < 4) = 1, 0


-4 -3 -2 -1 0 1 2 3 4
Calculando o valor de n para a condio dada:
P(90 < X < 110) = P

10
10

n
< Z <
10
10

= 95%
Como o n xo, ento teremos Z entre dois pontos simtricos e queremos saber que pontos so estes que
deixam uma rea de 95% entre eles.
7
Zo
0
- -Zo
95 %
Olhando a tabela da distribuio normal, teremos que z
0
= 1, 96. Ento,
P

10
10

n
< Z <
10
10

= 95% =P(z
0
< Z < z
0
) = 95% =P(1, 96 < Z < 1, 96) = 95%
Logo,
10
10

n
= 1, 96 10

n = 19, 6

n = 1, 96 n = 4, 0
4.2 DISTRIBUIO AMOSTRAL DA PROPORO
Consideremos que numa populao a proporo de elementos que possui determinada caracterstica p.
Sabemos ento que a proporo de indivduos que no possuem esta caracterstica ser (1 p).
Seja X a v.a. que conta o nmero de pessoas que possuem a caracterstica de interesse. J vimos que esta
v.a.tem Distribuio Binomial, com mdia E(X) = np e varincia V ar(X) = npq; onde p a proporo de
indivduos na populao que tm a caracterstica.
Denindo como b p a proporo de indivduos portadores da caracterstica na amostra, teremos que, para
n sucientemente grande, a distribuio amostral da proporo b p ser:
b p N(p;
p(1 p)
n
)
Exemplo: Sabe-se que 20% das peas de um lote so defeituosas. Sorteiam-se 8 peas, com reposio, e
calcula-se a proporo b p de peas defeituosas na amostra. Qual ser a distribuio de b p ?
Resoluo: Como foi visto b p N(p;
p(1 p)
n
), onde p = 20% = 0, 2 e n = 8.
Ento, E(b p) = 0, 20 e V ar(b p) =
(0, 20).(0, 80)
8
= 0, 02. Logo, b p N(0, 20; 0, 02).
5 INTERVALOS DE CONFIANA
At o momento, ns calculamos uma estimativa do parmetro desconhecido atravs de estimadores pontuais (as
estatsticas), que especicam um nico valor para o estimador. Por exemplo, quando calculamos a estatstica
X para uma determinada amostra, o valor que estima nico e o chamaremos de estimativa da mdia
populacional.
Este procedimento, porm, no nos permite julgar qual a possvel magnitude do erro que estamos come-
tendo. Pode haver o interesse em se obter um indicador de preciso dessa estimativa. Da surge a idia de ser
feita uma estimativa por intervalo, que consiste em estabelecer um intervalo de conana para , por exemplo.
Vamos voltar ao exemplo do item 4.1.
De uma populao de tamanho 4 foram retiradas todas as amostras possveis de tamanho 2. Sabemos
que a mdia populacional 3, 5 e para cada valor calculamos o erro entre a mdia da amostra e a mdia
populacional.
8
Amostra Elementos amostrais Mdia da amostraX Erro = (X )
1 (2, 2) 2, 0 1, 5
2 (2, 3) 2, 5 1, 0
3 (2, 4) 3, 0 0, 5
4 (2, 5) 3, 5 0, 0
5 (3, 2) 2, 5 1, 0
6 (3, 3) 3, 0 0, 5
7 (3, 4) 3, 5 0, 0
8 (3, 5) 4, 0 0, 5
9 (4, 2) 3, 0 0, 5
10 (4, 3) 3, 5 0, 0
11 (4, 4) 4, 0 0, 5
12 (4, 5) 4, 5 1, 0
13 (5, 2) 3, 5 0, 0
14 (5, 3) 4, 0 0, 5
15 (5, 4) 4, 5 1, 0
16 (5, 5) 5, 0 1, 5
Vericamos na ltima coluna que, para algumas amostras, o erro entre X e foi igual a zero. Entretanto,
outras amostras apresentaram erros grandes de 1, 5 para mais ou para menos em relao mdia populacional.
Porm, quando vamos elaborar uma estimativa para um parmetro populacional, utilizamos apenas uma
dessas possveis amostras. Interessa-nos construir um intervalo de conana que garanta que essa nica
amostra escolhida seja uma dentre as amostras que admitimos que o erro cometido no seja signicativo
para o estudo. No exemplo dado, admitindo que o erro amostral mximo desejvel seja 0, 5, as amostras
1, 2, 5, 12, 15 e 16 nos levariam a estimativas com erro muito grande. Existe portanto uma probalidade de
6
16
(ou 37, 5%) de sortearmos uma amostra no desejvel.
Nosso objetivo construir um intervalo de conana de tal maneira que tenhamos uma probabilidade
pequena de sortearmos amostras com erros no desejveis. Ou seja, admitindo que essa probabilidade seja
10%, teremos apenas 10% de amostras que geraro estimativas cujo o erro amostral superar o valor que
estamos admitindo como mximo. Existiro, portanto, 90% de amostras cujas estimativas sero consideradas
boas, isto , cujos intervalos gerados a partir dessas estimativas pontuais esperamos que contenham o
verdadeiro parmetro populacional. Chamamos a essa ltima probabilidade de nvel de conana da estimativa
e simbolizamos por (1 ).
Observem que (1 ) pode ser igual a 99%, 95%, 90%, 80%, etc. Se estabelecermos que desejamos um
intervalo de conana (1 ) = 95%, ser igual a 0, 05; o que signica que, ao estimarmos o parmetro,
poderemos estar utilizando uma daquelas amostras dentre as 5% que geram estimativas intervalares cujos
erros amostrais encontram-se acima do desejvel.
Resumindo, desejamos construir um intervalo, por exemplo para a mdia, de tal maneira que
P (|mdia amostral - mdia populacional| < erro amostral) = 95% = 1
5.1 INTERVALO DE CONFIANA para a MDIA POPULACIONAL ()
Quando a VARINCIA POPULACIONAL (
2
) conhecida.
Seja X N(,
2
). Como j vimos, X N(,

2
n
). Padronizando a varivel X, teremos que:
Z =
X

n
tem distribuio N(0, 1)
Vamos ento considerar o intervalo de valores de Z, simtrico em torno da mdia, tal que a probabilidade
de Z assumir valor neste intervalo seja igual a (1 ), isto :
9
P(z
0
< Z < z
0
) = 1
Conforme o grco da distribuio de Z, verica-se:
-Zo Zo 0
1- alfa
alfa/2
alfa/2
Se o intervalo de conana denido pelo intervalo (z
0
; z
0
), a rea em branco a que fornece a proba-
bilidade acima requerida. Logo, a rea restante ser igual a a. Como temos duas reas iguais, cada uma delas
ser igual a

2
.
Vamos chamar os pontos z
0
de z

2
e z

2
, pois eles nos fornecero os pontos que deixam nas caudas da
distribuio uma rea de

2
.
Ento, rescrevendo a probabilidade, teramos que: P(z

2
< Z < z

2
) = 1
Vamos substituir: Z =
X

n
. Logo, P(z

2
< Z =
X

n
< z

2
) = 1
Rearranjando a expresso entre parnteses, obtemos:
P(X z

2
.

n
< < X +z

2
.

n
) = 1
Por denio, a expresso X z

2
.

n
< < X +z

2
.

n
o intervalo de conana para o parmetro ,
ao nvel de conana 1 , quando conhecido e o erro amostral denido por z

2
.

n
que chamaremos
de .
Exemplo: Seja X a v.a. que representa a taxa de colesterol no plasma sangneo humano. Vamos supor
que essa varivel tem distribuio aproximadamente normal com mdia e desvio padro = 20mg/100ml
de plasma.
Vejamos como se obtm o intervalo de conana para o parmetro . Vamos estabelecer o nvel de
conana (1 ) = 0, 95; isto , um nvel de 95% de conana.
Observe a seguinte gura:
1,96 -1,9 6 0
2,5%
2,5% 47,5% 4 7, 5%
10
Atravs de uma tabela da Distribuio Normal Zero-Um ou X N(0, 1), obtemos a probabilidade corre-
spondente a rea 0, 475, o valor z = 1, 96. Portanto, os valores de z = 1, 96 delimitam a rea de probabilidade
igual a 0, 95 (0, 475 + 0, 475).
Para encontrarmos o intervalo de conana para , supondo amostras de tamanho n = 25, podemos
escrever:
P(X 1, 96.
20
25
< < X + 1, 96.
20
25
) = 0, 95 = P(X 7, 84 < X + 7, 84) = 0, 95.
Portanto, a expresso:
X 7, 84 < < X + 7, 84
o intervalo de conana ao nvel de 95% para a taxa mdia de colesterol no plasma sangneo humano,
obtido com base em uma amostra qualquer de tamanho 25. Portanto, o erro amostral nesse exemplo de 7,84
mg/100ml de plasma.
Para o clculo dos valores entre os quais se encontra o verdadeiro valor do parmetro, teramos que calcular
X e substituir na expresso anterior. Vamos supor que a mdia da amostra X = 198mg/100ml de plasma.
Ento, o intervalo de 95% de conana, determinado com base nessa amostra
190, 16 < < 205, 84
Na prtica, esperamos que a verdadeira mdia populacional esteja contida neste intervalo com 95% de
conana, ou seja, que a amostra utilizada para a estimativa seja uma das 95% das amostras possveis da
populao cujo erro amostral seja menor ou igual a erro mximo admitido (7,84 mg/100ml de plasma).
importante frisar que o intervalo de conana para um indicador da preciso da estimativa de X .
5.2 INTERVALO DE CONFIANA para a MDIA POPULACIONAL ()
Quando a VARINCIA POPULACIONAL (
2
) desconhecida.
Neste caso, como no conhecemos
2
, precisaremos calcular a estimativa S
2
a partir de uma amostra.
Devemos lembrar que:
S
2
=
P
n
i=1
(x
i
x)
2
n 1
Sabemos que X N(,
2
) =X N(,

2
n
) e Z =
X

n
tem distribuio N(0, 1)
Agora, vamos considerar a varivel aleatria T =
X
S

n
.
Esta v.a. T tem uma distribuio conhecida como t de Student com (n1) graus de liberdade. O grco
da distribuio t de Student simtrico e tem forma similar curva da Normal, s que menos achatada.
Os graus de liberdade de uma distribuio correspondem ao nmero de variveis independentes que esto
sendo somadas.
Sua representao grca seria a seguinte:
11
0 t
As probabilidades para uma v.a. T com distribuio t de Student tambm encontram-se tabeladas.
Vejamos agora como pode ser obtido um intervalo de conana para quando o valor de desconhecido.
Dispomos de uma estimativa de obtida com base em uma amostra casual simples de tamanho n e sabendo-se
que T tem distribuio t de Student com (n 1) graus de liberdade, associados a S. O procedimento a ser
adotado parecido com o adotado para o uso da distribuio Normal.
Dada uma amostra de tamanho n, imediatamente obtemos o valor (n1) dos graus de liberdade associados
estimativa S de . Ento, denido o intervalo de conana (1 ), iremos procurar na tabela a seguinte
probabilidade:
P(t
c
< T < t
c
) = 1
Os pontos t
c
e t
c
vo ser encontrados da mesma forma vericada para a Distribuio Normal.
J vimos que T =
X
S

n
. Ento, podemos escrever P(t
c
< T =
X
S

n
< t
c
) = 1 .
Rearranjando a expresso entre parnteses, obtemos:
P(X t
c
.
S

n
< < X +t
c
.
S

n
) = 1 .
Por denio, a expresso X t
c
.
S

n
< < X +t
c
.
S

n
o intervalo de conana para o parmetro ,
ao nvel de conana 1 , quando desconhecido.
Exemplo: Seja X a varivel aleatria, que representa a taxa normal de colesterol no plasma sangneo hu-
mano. Suponhamos que, com base em uma amostra casual simples de 25 indivduos normais, um pesquisador
obteve a mdia X = 198mg/100ml de plasma e o desvio-padro S = 30mg/100ml de plasma.
Vamos obter, com base nessa amostra, o intervalo de 90% de conana para . Na tabela t de Student
procuraremos o valor t
c
para (n 1) = 24 graus de liberdade e = 10%. Este valor t
c
= 1, 71. Ento,
escrevemos:
198 1, 71.
30
25
< < 198 + 1, 71.
30
25
= 187, 74 < < 208, 26
o intervalo de 90% de conana para , obtido com base na amostra. Ento, espera-se que o intervalo
calculado seja um dos 90% dos intervalos, para amostras casuais simples de 25, contero o parmetro . Ou
seja, a mdia da populao se encontra entre 187,74 mg/100ml de plasma e 208,26 mg/100ml de plasma com
90% de conana.
12
5.3 INTERVALO DE CONFIANA para PROPORO
J vericamos que p N ( p,
p (1 p)
n
).
Padronizando a varivel p obteremos Z =
p p
r
p (1 p)
n
, onde Z N(0, 1)
De maneira anloga ao intervalo de conana encontrado para a mdia populacional () quando a varincia
(
2
) populacional conhecida, teremos que:
P(z

2
< Z < z

2
) = 1
Logo, P

2
<
p p
r
p (1 p)
n
< z

= 1 .
Rearranjando a expresso entre parnteses teremos:
P

p z

2
.
r
p (1 p)
n
< p < p +z

2
.
r
p (1 p)
n
!
= 1
Como no conhecemos o valor p (proporo populacional) na expresso acima, para denirmos o intervalo
de conana devemos substitu-lo por seu estimador p , temos:
p z

2
.
r
p (1 p)
n
< p < p +z

2
.
r
p (1 p)
n
que dene o intervalo de conana para o parmetro p, ao nvel de conana 1 .
Exemplo: Entre 500 pessoas inquiridas a respeito de suas preferncias eleitorais, 260 mostraram-se fa-
vorveis ao candidato Y. Calcular um intervalo de conana ao nvel de 90% para a porcentagem dos eleitores
favorveis a Y.
Resoluo: Temos n = 500; x = 260 ; 1 = 90%
p =
x
n
=
260
500
= 0, 52
P

0, 52 1, 64.
r
0, 52 (1 0, 52)
500
< p < 0, 521 + 1, 64.
r
0, 52 (1 0, 52)
500
!
= 90%
P

p z

2
.
r
p (1 p)
n
< p < z

2
.
r
p (1 p)
n
!
= 1
P(0, 488 < p < 0, 552) = 90%
6 TESTES DE HIPTESES
Um dos problemas a serem resolvidos pela Inferncia Estatstica o de testar uma hiptese. Isto , feito
uma determinada armao sobre uma populao, usualmente sobre um parmetro desta, desejamos saber
se os resultados de uma amostra contrariam ou no tal armao. Muitas vezes esta armao sobre a
populao derivada de teorias desenvolvidas no campo substantivo do conhecimento. A adequao ou no
dessa teoria ao universo real pode ser vericada ou refutada pela amostra. O objetivo do teste estatstico
fornecer ferramentas que nos permitam validar ou refutar uma hiptese (estatstica) atravs dos resultados
da amostra.
Por exemplo, de acordo com determinada literatura consultada pelos pesquisadores, a probabilidade de
um indivduo do sexo feminino contrair rubola 9%. Quer-se saber se esta mesma proporo vericada
entre as mulheres de Salvador. Para chegar a alguma concluso seria necessrio fazer um teste de hipteses
cujo procedimento veremos a seguir.
13
6.1 HIPTESES ESTATSTICAS
Na tomada de decises til formular hipteses ou suposies sobre a populao em estudo. Tais hipteses,
que podem ou no ser verdadeiras, chamam-se hipteses estatsticas e, em geral, consistem em armaes
sobre o valor de um parmetro populacional.
So exemplos de hipteses estatsticas:
1. A proporo de crianas do sexo masculino nascidas em determinada localidade nos ltimos 5 anos
0,5, isto , p = 0, 5.
2. A altura mdia dos brasileiros 1, 68 m, isto , = 1, 68 m.
Vamos designar por H
0
(hiptese nula) a hiptese estatstica principal, ou seja aquela que primeiro tentare-
mos validar no teste, e por H
1
(hiptese alternativa) a hiptese que contrara a hiptese nula.
Assim teremos;
1. H
0
: = 1, 75 = hiptese nula
H
1
: 6= 1, 75 = hiptese alternativa
2. H
0
: p = 0, 10 = hiptese nula
H
1
: p 6= 0, 10 = hiptese alternativa
3. H
0
: = 210 = hiptese nula
H
1
: 6= 210 = hiptese alternativa
Atravs dos testes de hipteses poderemos aceitar ou rejeitar a hiptese nula. A rejeio de H
0
implicar
na aceitao de H
1
.
Usando a terminologia prpria, diremos que o pesquisador pretende testar, por exemplo, H
0
: p = 0, 7
contra H
1
: p 6= 0, 7, com base em uma amostra de tamanho n.
6.2 ERROS
Qualquer que seja a deciso a ser tomada estamos sujeitos a cometer erros. Para facilitar a linguagem
necessitamos das seguintes denies:
6.2.1 ERRO do TIPO I
Esse erro ocorre quando rejeitamos H
0
(hiptese nula) quando esta verdadeira. Chamamos de a proba-
bilidade de cometer este erro, isto :
= P(erro do tipoI) = P(rejeitar Ho / Ho verdadeira)
denominado nvel de signicncia do teste. claro que esperamos um valor pequeno de . Na prtica,
costuma-se adotar um nvel de signicncia de 0,05 ou de 0,01, embora outros valores possam ser usados. Se,
por exemplo, ao delinearmos um teste, escolhermos um nvel de signicncia de 0,05 (ou 5%), isto signica
que rejeitaramos a hiptese nula em 5 chances dentre 100 quando ela deveria ser aceita, ou seja, haveria 95%
de conana que teramos tomado a deciso correta. Em tal caso dizemos que a hiptese foi rejeitada ao nvel
de 5% de signicncia, o que signica que podemos ter errado com uma probabilidade de 5%.
14
6.2.2 ERRO do TIPO II
Denimos esse erro quando aceitamos H
0
(hiptese nula) quando esta falsa. A probabilidade de cometer
este erro indicada por , Logo,
= P(erro do tipoII) = P(no rejeitar Ho / Ho falsa).
A determinao do valor de j mais difcil, pois usualmente no se especicam valores xos para o
parmetro na situao alternativa. Este procedimento no ser visto no momento e estar relacionado com o
poder do teste.
A tabela a seguir resume as situaes em que cometermos os erros do tipo I e tipo II:
Realidade Deciso
Aceitar H
0
Rejeitar H
0
H
0
verdadeira Deciso correta Erro tipo I
H
0
falsa Erro tipo II Deciso correta
6.3 TESTE DE HIPTESE para uma MDIA
Este teste feito baseando-se nas distribuies da mdia amostral X. Veremos dois testes para a mdia, que
dependero do conhecimento ou no do verdadeiro valor da varincia.
6.3.1 Teste para a Mdia quando
2
Conhecida (e quando a amostra grande)
O procedimento para a realizao desse teste de hipteses pode ser resumido nos seguintes passos:
Assim teremos;
1. Enumerar as hipteses:
H
0
: =
0
H
1
: 6=
0
2. Determinar a distribuio de X. e, por conseguinte, a estatstica de teste.
J vimos que X N(,

2
n
) = Z =
X

n
N(0, 1)
A estatstica de teste uma estatstica amostral, usada para tomar uma deciso em relao hiptese
nula.
3. Fixar o nvel de signicncia .
4. Determinar a Regio de Aceitao e a Regio de Rejeio (crtica) que sero denidas de acordo com o
xado:
0
Dis tribuio Norma l (0,1)
1 -
z/ 2

2

2
-z/ 2
15
A regio crtica o conjunto de todos os valores da estatstica de teste que levam rejeio da hiptese
nula. Com base no grco acima, iremos formular a seguinte regra de deciso ou teste de hiptese ou de
signicncia:
Rejeitar a hiptese nula ao nvel de signicncia a se o valor de Z for maior que o valor de + z

2
ou
menor que o valor z

2
.
Em caso contrrio, no rejeitar a hiptese nula.
Reg. Rejeio H
0
Reg. Aceitao de H
0
Reg. Rejeio H
0
-z
/2 0 z
/2 Z

N(0, 1)
O valor z

2
chamado valor crtico, separando a regio crtica dos valores da estatstica de teste que
no levam rejeio da hiptese nula.
Exemplo:
Em indivduos sadios, a taxa de fsforo no sangue tem distribuio aproximadamente normal com mdia
= 3mg/100cc e desvio-padro = 0, 6mg/100cc. Com o objetivo de saber se no artritismo essa taxa mdia
era alterada, um pesquisador tomou uma amostra de 36 doentes e testou sua hiptese ao nvel de 5% de
signicncia; observou-se na amostra a mdia X = 3, 12mg/100cc.
Resoluo:
Os hipteses sero as seguintes:
H
0
: = 3, 0
1. H
1
: 6= 3, 0
Usaremos = 0, 05
X N(3; (0, 6)
2
/36) = X N(3; 0, 01)
A estatstica a ser utilizada ser:
Z =
X

n
=
3, 12 3, 0
0, 1
= 1, 2
As regies de aceitao e de rejeio sero as seguintes: Para = 0, 05
0
Distribuio Normal (0,1)
9 5%
2

-z
2

2

2
0,025
z
/2=1,96
Os pontos z
a
2
e z
a
2
sero fornecidos pela tabela da faixa central de maneira idntica qual foi observado
para construo de intervalos de conana. Logo z
0,025
= 1, 96 e z
0,025
= 1, 96. Estes pontos sero
chamados de pontos crticos. A rea hachurada corresponde regio de rejeio da hiptese nula.
16
Se a estatstica Z > z
a
2
ou Z < z
a
2
, ento rejeitaremos a hiptese nula. Caso contrrio, aceitaremos-a.
Como Z = 1, 2 < z
0,025
= 1, 96 = no rejeitamos a hiptese de que a taxa de fsforo no sangue de
pessoas com artritismo seja igual a 3, 0mg/100cc.
Ento no h evidncia amostral suciente para rejeitamos a hiptese ao nvel de signicncia de 5%.
6.3.2 Teste para Mdia quando
2
Desconhecida (e para pequenas amostras)
Neste caso, como no conhecemos
2
, precisamos calcular a estimativa S
2
a partir de uma amostra.
Seguindo os mesmos passos do teste anterior para a construo das hipteses a serem analisadas; teremos
como nica diferena o fato de agora a estatstica a ser utilizada ser:
T =
X
S

n
t
n1
T tem distribuiao tde Student com n 1 graus de liberdade.
1. De forma similar ao teste com base da distribuio Normal, agora teremos que:
(a) Se t

2
< t < t

2
, aceita-se H
0
(b) Se t > t

2
, rejeita-se H
0
(c) Se t < t

2
, rejeita-se H
0
.
Exemplo: Os registros dos ltimos anos de um colgio atestam para os calouros admitidos a nota mdia
115 (teste vocacional). Para testar a hiptese de que a mdia de uma nova turma a mesma, tirou-se, ao
acaso, uma amostra de vinte notas, obtendo-se mdia de 118 e desvio-padro 20. Admitir que = 0, 05 para
efetuar o teste.
Resoluo:
H
0
: = 115
H
1
: 6= 115
= 0, 05; n = 20
Os graus de liberdade (g.l.) para o teste t de Student ser obtido da seguinte forma
g.l. = n 1 = 20 1 = 19.
Vericando-se na tabela da t de Student com 19 graus de libedade e = 0, 05, obteremos os seguintes
pontos t

2
= t
0,025
= 2, 093 e t

2
= t
0,025
= 2, 093; que iro nos fornecer as seguintes reas:
0
Regi o de
Acei tao
Regio de
Rejeio
2

-
t = -2,093
2

t
= 2,093
Regio de
Rejeio
A estatstica T =
X
S

n
=
118 115
20

20
=
3
1, 4721
= 0, 6708
Como 2, 093 < t < 2, 093 no rejeita-se a hiptese nula ao nvel de signicncia de 5%.
17
6.4 TESTE DE HIPTESE para a PROPORO
Este tipo de teste ser realizado quando temos uma populao e uma hiptese sobre a proporo de indivduos
portadores de uma certa caracterstica. Esta hiptese arma que essa proporo igual a um certo nmero
p
0
. Ento, nossas hipteses podero ser descritas como:
H
0
: p = p
0
H
1
: p 6= p
0
Como j vimos, a estatstica p, proporo da amostra, tem uma distribuio normal, isto : p N (
p,
p (1 p)
n
).
Fixado um valor , devemos construir a regio crtica para p na suposio de que os parmetros denidos
em H
0
sejam verdadeiros.
A estatstica a ser usada neste teste ser:
Z =
p p
r
p (1 p)
n
, onde p ser a proporo na populao e p a proporo na amostra.
As nossas regies de aceitao (RA) e rejeio (RR) sero dadas de maneira similar s denidas para a
mdia.
1. Da, poderemos concluir mais uma vez que:
(a) Se z

2
< Z < z

2
, aceita-se H
0
(b) Se Z < z

2
, rejeita-se H
0
.
(c) Se Z > z

2
, rejeita-se H
0
Exemplo: As condies de mortalidade de uma regio so tais que a proporo de nascidos que sobrevivem
at 60 anos de 0,6. Testar essa hiptese ao nvel de 5% se em 1000 nascimentos amostrados aleatoriamente,
vericou-se 530 sobriventes at 60 anos.
Resoluo:
Queremos testar:
H
0
: p = 0, 6
H
1
: p 6= 0, 6
= 0, 05 ser nosso nvel de signicncia.
n = 1000; p =
530
1000
= 0, 53
Como sabemos, p N ( p,
p (1 p)
n
) = p N(0, 6; 0, 00024)
Se = 0, 05, os pontos crticos z

2
e z

2
sero os pontos 1, 96.
Calculando a estatstica do teste, teremos:
Z =
p p
r
p (1 p)
n
=
0, 53 0, 60
0, 00024
= 4, 52
ComoZ < 1, 96, rejeita-se H
0
ao nvel de 5% de signicncia. Ento, poderemos concluir que h evidn-
cias de que a proporo de nascidos vivos que sobrevivem at os 60 anos de idade diferente de 0,60.
6.5 Teste de Hiptese para Comparao entre Mdias de duas Populaes.
um dos testes mais utilizados por pesquisadores da rea biomdica.
So bastante comuns as ocasies em que se tm duas populaes e se deseja comparar suas mdias.
Este tipo de teste aplicado para vericao de existncia de diferena signicativa entre as duas mdias
populacionais. E nestas circunstncias iremos utilizar os testes descritos a seguir.
18
6.5.1 Comparao entre Mdias de duas Populaes
Quando as varincias populacionais
2
1
e
2
2
so Conhecidas.
Vamos supor que temos uma amostra X
1
, X
2
, ..., X
n
1
da populao N(
1
,
2
1
) e uma amostra Y
1
, Y
2
, ..., Y
n
2
da populao N(
2
,
2
2
), independentes. Queremos saber se suas mdias diferem signicativamente. Neste
caso, as hipteses estatisticas so:
H
0
:
1
=
2
H
1
:
1
6=
2
Como
2
1
e
2
2
so conhecidos, tm-se que a distribuio amostral de (X Y ) dada por:
(X Y ) N(
1

2
;

2
1
n
1
+

2
2
n
2
);
Se xarmos como o nvel de signicncia do teste, ento poderemos obter os pontos crticos z

2
e z

2
,
respectivamente; denindo desta forma as reas de aceitao e rejeio da hipotese nula.
Para procedermos com o teste, devemos padronizar a variavel aleatoria (XY ), que resultar na seguinte
estatstica:
Z =
(X Y ) (
1

2
)
s

2
1
n
1
+

2
2
n
2
N(0, 1)
Sob a hiptese nula
1
=
2
, logo:
Z
H
0
=
(X Y )
s

2
1
n
1
+

2
2
n
2
ir nos fornecer o valor que nos permitir aceitar ou rejeitar a hiptese nula de forma similar aos testes
anteriores.
Exemplo: Um estudo comparativo do tempo de vida mdio de um doente aps ter sido detectado o vrus
Y no organismo humano foi realizado entre homens e mulheres, para os quais temos as seguintes distribuies,
N(3, 2; 0, 64) e N(3, 7; 0, 81). Deseja-se saber se o tempo de vida mdio de pacientes com este tipo de doena
o mesmo entre homens e mulheres. Para isto, estudou-se uma amostra de 50 homens e 50 mulheres, obtendo-se
um tempo mdio 3,0 e 3,5 anos, respectivamente.
Resoluo: Queremos testar:
H
0
:
1
=
2
= 0
H
1
:
1
6=
2
6= 0
Vamos xar = 0, 05, logo os pontos crticos sero 1, 96 e 1, 96, respectivamente.
Temos a seguinte distribuio amostral para (X
1
X
2
):
(X
1
X
2
) N(0, 5; 0, 034)
Calculando o valor da estatstica sob H
0
, tem-se: Z =
0, 5
0, 034
= 2, 7116
1,9 6 -1,9 6 0
2,5%
2,5% 47,5% 47, 5%
- 2,71
19
Como Z
calculado
= 2, 71 < 1, 96 = Z
tabelado
, conforme gura acima, ento rejeitamos H
0
, ao nvel de
5% de signicncia. Logo, poderemos armar que existem indcios que o tempo de vida mdio entre homens e
mulheres que contraram o vrus Y no igual. Ou seja, os tempos mdios de vida diferem signicativamente
entre sexo, ao nvel de 5%.
6.5.2 Comparao entre Mdias de duas Populaes
Quando as varincias populacionais
2
1
e
2
2
Desconhecidas.
Este teste de hipteses conhecido como teste t de Student para diferena de mdias.
Quando as varincias das populaes no so conhecidas, caso muito comum na prtica, h necessidade
de estim-las a partir dos dados amostrais. Neste caso, devemos substituir
2
1
e
2
2
pelos seus estimadores S
2
1
e S
2
2
, obtendo a seguinte estatstica:
T =
(X Y ) (
1

2
)
S
c
r
n
1
+n
2
n
1
.n
2
onde S
c
=
s
(n
1
1)S
2
1
+ (n
2
1)S
2
2
n
1
+n
2
2
Dizemos que T tem distribuio t de Student com n
1
+n
2
2 graus de liberdade.
O teste de hipteses deve ser conduzido de maneira anloga, lembrando-se da modicao dos valores
crticos de t, que vo ter outro nmero de graus de liberdade.
Exemplo: Desejamos testar se dois tipos de ensino prossional so igualmente ecazes. Para isso, sortearam-
se duas amostras de operrios; a cada uma, deu-se um dos tipos de treinamento e, no nal, submeteram-se os
dois grupos a um mesmo teste. Que tipo de concluso voc poderia tirar, baseando-se nos resultados abaixo.
Amostra N. de elementos Mdia Desvio-Padro
Tipo I 12 75 5
Tipo II 10 74 10
Resoluo:
As hipteses sero:
H
0
:
1
=
2
H
1
:
1
6=
2
Vamos xar = 0, 05.
Calcularemos a estatstica:
T =
(X Y ) (
1

2
)
S
c
r
n
1
+n
2
n
1
.n
2
onde S
c
=
s
(n
1
1)S
2
1
+ (n
2
1)S
2
2
n
1
+n
2
2
Sob H
0
=>
1
=
2
Ento:
S
c
= 7, 88954 e T =
(75 74)
7, 88954 . 0, 026846
=
1
1, 2927
T = 0, 7735
Iremos denir os pontos crticos t
a
2
e t
a
2
, que sero, respectivamente, 2, 20 e 2, 20.
Como 2, 20 < T < 2, 20, aceitamos a hiptese nula. Com base no teste acima, pode-se concluir que
os dois tipos de testes no diferem signicativamente, ao nvel de 5%. Logo, qualquer um dos dois tipos de
ensino prossional so igualmente ecazes.
20
6.6 TESTES BILATERAIS e UNILATERAIS.
As caudas de uma distribuio so as regies extremas delimitadas por valores crticos. Nos exemplos desen-
volvidos nesta apostila os testes de hiptese envolveram testes bilaterais no sentido de que a regio crtica est
situada nas duas regies extremas (caudas) sob a curva. Rejeitamos a hiptese nula se nossa estatstica de
teste est na regio crtica porque isto indica uma discrepncia signicativa entre a hiptese nula e os dados
amostrais.
Alguns testes so unilaterais, podendo ser unilaterais esquerdos ou direitos. Os testes unilaterais esquerdo
tm a regio crtica localizada na regio extrema esquerda sob a curva, enquanto que os unilaterais direitos
tm a regio crtica localizada na regio extrema direita sob a curva.
Nos testes bilaterais, o nvel de signicncia dividido igualmente entre as duas caudas que constituem a
regio crtica. Em testes unilaterais, a rea crtica igual a . A gura a seguir esquematiza estas informaes.
Sina l de H1 : >
Tes te Unilatera l Dire ita
Sina l de H1: <
Tes te Unilatera l Es querda
Sinal de H1:
Tes te Bilateral
Exemplo: Determinao de valores crticos:
Muitos passageiros de navios de cruzeiro utilizam adesivos que fornecem dramamina ao corpo a m de
evitar o enjo. Testa-se a informao sobre a quantidade da dosagem mdia, ao nvel de signicncia de 0,05.
As condies so tais que permitem a utilizao da distribuio normal.
1. Determine o(s) valore(s) crtico(s) de z se o teste :
(a) bilateral;
(b) unilateral esquerdo;
(c) unilateral direito.
Resoluo:
(a) Em um teste bilateral, o nvel de signicncia dividido igualmente entre as duas caudas, o que
determina uma rea de 0,025 em cada cauda. Podemos encontrar os valores crticos pelo uso da
tabela da normal padro atravs dos valores que correspondem a reas de 0,475 direita ou
esquerda de mdia. Assim, obteremos os valores crticos z = 1, 96 e z = 1, 96.
21
(b) Em um teste unilateral esquerdo, o nvel de signicncia 0,05 a rea da regio crtica esquerda,
de forma que o valor crtico corresponde a uma rea de 0,45 esquerda da mdia. Recorrendo
tabela da normal padro, obtemos o valor crtico z = 1, 645.
(c) Em um teste unilateral direita, o nvel de signicncia 0,05 a rea da regio crtica direita, de
forma que o valor crtico corresponde a uma rea de 0,45 direita da mdia. Com o uso da tabela
normal padro, obtm-se o valor crtico z = 1, 645.
6.7 NVEL DESCRITO (p-valor).
O procedimento descrito at o momento conhecido como procedimento clssico de testes de hipteses. Um
outro procedimento que vem sendo muito adotado consiste em apresentar o nvel descritivo (ou p-valor)
do teste. A diferena bsica entre esses dois procedimentos que, neste ltimo, no necessrio construir a
regio crtica. Em lugar disto, indica-se a probabilidade de ocorrerem valores da estatstica mais extremos
que o observado, supondo a hiptese H0 verdadeira.
Regra de deciso
p-valor > = aceitar H
0
p-valor = rejeitar H
0
Ento, o p-valor a probabilidade, sob a hiptese nula, de se observar um valor igual ou maior que o
obtido. Ou seja, um p-valor (ou valor de probabilidade) a probabilidade de obter um valor da estatstica
amostral de teste no mnimo to extremo como o que resulta dos dados amostrais, na suposio de a hiptese
nula ser verdadeira.
Este tipo de procedimento usualmente o adotado quando se trabalha com softwares estatsticos para
anlise de dados, pois a informao a respeito do p-valor est disponvel dentre os resultados apresentados
pelo computador.
Com o objetivo de realizar o teste de hipteses atravs desse procedimento, iremos apresentar dois ex-
emplos. Para auxiliar nessa anlise usaremos alguns resultados apresentados por um pacote estatstico para
anlise de dados denominado Minitab.
Exemplo 1: Uma companhia de cigarros anuncia que o ndice mdio de nicotina dos cigarros que fab-
rica, apresenta-se abaixo de 23 mg por cigarro. Um laboratrio realiza 10 anlises desse ndice, obtendo:
27, 24, 21, 25, 26, 22, 23, 25, 27, 22. Sabe-se que o ndice de nicotina se distribui normalmente. Pode-se aceitar,
ao nvel de 10%, a armao do fabricante?
H
0
: = 23mg vs H
1
: 6= 23mg (suponha um teste bilateral)
A Estatstica do teste T =
X
0
S

n
=
24, 2 23
2, 1429

10
= 1, 77
O Valor da tabela que servir de base para comparar com a estatstica do teste t

(n 1) = t
0.10,9
=
1, 383, logo no podemos rejeitar H
0
ao nvel de signicncia de 10%.
O Minitab utiliza como critrio o nvel descritivo do teste:
Test of = 23.000 vs 23.000
Variable N Mean StDev SE Mean T P-Value
C1 10 24.200 2.150 0.680 1.77 0.94
Observa-se que o p-valor > 0, 10 e, portanto, aceitamos a hiptese nula. Logo, os dados amostrais no
possuem evidncia suciente para aceitarmos a armao do fabricante.
Exemplo 2: Uma rede de pizzarias deseja testar se o teor mdio de gordura em peas de salame produzidas
por determinada indstria de alimentos igual a 15%. De um grande lote que adquiriu retirou uma amostra
de 50 peas de salame e os resultados esto a seguir:
22
19.8 23.4 13.6 6.6 13.7 5.2 14.3
13.3 12.2 14.3 8.5 15.8 16.0 18.3
28.7 11.6 16.4 14.4 26.2 17.0 6.5
10.0 24.5 34.9 19.1 6.9 19.5 11.0
8.9 10.6 9.5 14.0 6.0 18.0 10.8
16.7 18.4 10.1 12.3 6.5 25.4 15.3
12.1 13.1 7.7 17.4 10.7 24.1 14.0
21.4
As hiptese a serem testadas so
H
0
: = 15 versus H
1
: 6= 15
Test
of = 15.000 vs
15.000
Variable N Mean StDev SE Mean T P-Value
C2 50 14.984 6.387 0.903 -0.12
0.91
Como p-valor > 0, 05 ento aceita-se H
0
, ou seja, no existe evidncia de que o teor de gordura nas peas
de salame produzidas pela indstria seja diferente de 15%
7 TESTE QUI-QUADRADO
At o momento ns testamos hipteses referentes a um parmetro populacional ou mesmo comparao
de dois parmetros. Vamos estudar agora um teste no-paramtrico, assim chamado por no depender dos
parmetros populacionais nem de suas respectivas estimativas.
Para a realizao desses testes no-paramtricos ns utilizaremos uma nova distribuio estatstica chamada
Qui-quadrado, cuja medida baseia-se no grau de concordncia entre as freqncias observadas e as freqncias
esperadas de acordo com as regras de probabilidade.
Suponha um experimento realizado n vezes, onde se observou um conjunto A
1
, A
2
, ..., A
k
com as respectivas
freqncias O
1
, O
2
, .., O
k
. No entanto, de acordo com as regras de probabilidade deveriam apresentar as
seguintes freqncias tericas ou esperadas e
1
, e
2
, ..., e
k
.
Como ilustrao, considere o seguinte experimento: Lanamento de um dado 60 vezes. Neste tipo de
experimento temos 6 possveis eventos (as faces do dado). E sabemos que se o dado honesto a probabilidade
de cada face ser sorteada
1
6
em cada jogada.
Os resultados deste experimento aparecem no quadro a seguir.
Eventos 1 2 3 4 5 6
Freq. Observada 15 7 4 11 6 17
Freq. esperada 10 10 10 10 10 10
O modelo que serve para determinar as discrepncias existentes entre as freqncias observadas e esperadas
dado pela estatstica:

2
=
P(O
j
e
j
)
2
e
j
=
(O
1
e
1
)
2
e
1
+
(O
2
e
2
)
2
e
2
+.... +
(O
k
e
k
)
2
e
k
onde O
j
a freqncia observada e e
j
a freqncia esperada, sob a hiptese em estudo.
A distribuio amostral da distribuio Qui-quadrado
2
ter a seguinte forma aproximada:
23
0
Qui-quadrado
A
2
,assim como a t de Student, ter graus de liberdade associados sua distribuio, que sero
denidos de acordo com o procedimento a ser adotado.
7.1 TESTE DE INDEPENDNCIA
Uma importante aplicao do teste
2
ocorre quando queremos estudar a relao entre duas ou mais variveis
de classicao. A representao das freqncias observadas, neste caso, pode ser feita por meio de uma
tabela de contingncia. Considerando-se dois critrios de classicao, teremos tabelas de dupla entrada de
classicao h x k, em que as freqncias observadas ocupam h linhas e k colunas.
Tabela de contingncia (2 x 2)
Resultados observados
Classicao I II TOTAL
A A
1
A
2
N
a
B B
1
B
2
N
b
TOTAL N
1
N
2
N
Na tabela acima consideramos duas variveis. A primeira varivel (varivel 1) admitimos que seja classi-
cada em duas categorias A e B; a varivel tambm em duas categoria I e II.
Uma tabela de contingncia usualmente construda com o propsito de estudar a relao entre as duas
variveis de classicao. Por meio do teste
2
possvel testar a hiptese de que as duas variveis so
independentes.
No caso do teste de independncia, em particular, o valor da estatstica
2
ser maior quanto mais
afastado o valor observado for do valor esperado e maior ser a dependncia. Em relao ao nmero de graus
de liberdade, este ser denido por (h 1)(k 1), onde h representa o nmero de modalidades da varivel 1
e k o nmero de modalidades da varivel 2.
Como o pesquisador est preocupado em testar a associao entre as variveis, as hipteses sero formu-
ladas da seguinte maneira:
H
0
: as variveis so independentes
H
1
: as variveis no so independentes, ou seja, elas apresentam algum grau de associao entre si.
Exemplo: Deseja-se vericar a relao entre a classicao dada ao ajustamento matrimonial e ao nvel
de escolaridade do casal. Os dados encontram-se na tabela a seguir:
Ajustamento Matrimonial
Educao Muito baixo Baixo Alto Muito alto TOTAL
3
o
grau 18 (27) 29 (39) 70 (64) 115 (102) 232
2
o
grau 17 (13) 28 (19) 30 (32) 41 (51) 116
1
o
grau 11 (6) 10 (9) 11 (14) 20 (23) 52
TOTAL 46 67 111 176 400
24
Neste caso queremos testar a hiptese de no haver relao entre o nvel educacional do indivduo e o xito
no seu casamento.
Para podermos calcular as freqncias esperadas para as diversas caselas, sob a suposio de independncia,
estaremos esperando que no haja diferena entre as modalidades, logo poderemos usar os totais marginais:
232, 116 e 52. Assim, encontraremos a distribuio de escolaridade sem levar em considerao o ajustamento
matrimonial, de forma que:
232
400
= 0, 58 ;
116
400
= 0, 29 ;
52
400
= 0, 13
Aplicaremos estas taxas em todas as caselas da tabela anterior, obtendo as freqncias esperadas, que
esto representadas dentro dos parnteses da tabela anterior.
Nosso teste proceder do seguinte modo:
H
0
: O ajustamento matrimonial independente da educao
H
1
:O ajustamento matrimonial no independente da educao
= 5%
= nmero de graus de liberdade = (h 1)(k 1) = (3 1)(4 1) = 2 x 3 = 6 =
2
= 12, 6
A estatstica do teste, sob H
0
, ser:

2
=
P(O
j
e
j
)
2
e
j
=
(18 27)
2
27
+
(17 13)
2
13
+.... +
(20 23)
2
23
= 20, 7
Como
2
calculado
> 12, 6, rejeita-se a hiptese de independncia.
Por inspeo da tabela parece que os indivduos com alguma educao colegial parecem ajustar-se melhor
ao casamento do que aqueles que no a possuem.
8 EXERCCIOS DE FIXAO
1) Um antroplogo mediu as alturas (em polegadas) de uma amostra aleatria de 100 homens de determinada
populao, encontrando a mdia amostral de 71,3. Se a varincia da populao for
2
= 9, determine um
intervalo de 99% de conana para a altura mdia de toda a populao.
2) Para os tempos de reao de 30 motoristas selecionados aleatoriamente, encontrou-se uma mdia de
0,83 segundos e um desvio-padro de 0,20 segundos. Determinar um intervalo de 95% de conana para o
tempo mdio de reao de toda a populao de motoristas.
3) Uma amostra aleatria de 400 domiclios mostra que 25% deles so casas de aluguel. Qual o intervalo
de conana que podemos razoavelmente supor que seja o da proporo de casas de aluguel, com um nvel de
signicncia de 2%?
4) Certo tipo de semente cresce, em mdia, at a altura de 8,5 polegadas, com desvio-padro de uma pole-
gada. Semeiam-se 100 delas em um solo enriquecido, a m de testar qual a mdia na melhora de crescimento.
Se nesta amostra, encontrarmos uma altura mdia de 8,8 polegadas de altura, qual ser nossa concluso?
5) Estamos desconados de que a mdia das receitas municipais per capita das cidades pequenas (at
20.000 habitantes) maior do que a das receitas do estado, que de 1.229 unidades. Para comprovar ou no
esta hiptese, sorteamos dez cidades pequenas e obtivemos os seguintes resultados: 1.230; 582; 576; 2.093;
2.621; 1.045; 1.439; 717; 1.838; 1.359. O relatrio do software Minitab encontra-se a seguir.
Test
of = 1229 vs
> 1229
Variable N Mean StDev SE Mean T P-Value
Renda 10 1350 676 214 0.57 0.29
25
Com base nestas informaes, que concluses podem ser feitas. Construa as regies crticas para este teste
de hipteses e compare este procedimento com o do uso do p-valor.
6) Duas mquinas, A e B, so usadas para empacotar p de caf. A experincia passada garante que
o desvio adro de ambas de 10g. Porm, suspeita-se de que elas tm mdias diferentes. Para vericar,
sortearam-se duas amostras: uma com 25 pacotes da mquina A e outra com 16 pacotes da mquina B. As
mdias foram, respectivamente, X
A
= 502, 74g e X
B
= 490, 60g. Com estes nmeros, e ao nvel de 5%, qual
seria a concluso do teste H
0
:
A
=
B
?
7)Suponha que est sendo realizada uma pesquisa para avaliar diversas caractersticas fsicas e compor-
tamentais dos ursos polares. Alguns pesquisadores acreditam que o peso nesse grupo de animais no difere
segundo o sexo. Com o objetivo de se vericar se esta armao verdadeira, 99 ursos do sexo masculino e 44
do sexo feminino foram pesados. Os resultados obtidos encontram-se a seguir. Com base nesses resultados,
que concluses voc pode obter?
Twosample T for Weight
Sex N Mean StDev SE Mean
1 99 214 120 12
2 44 143.0 64.5 9.7
95% C.I. for 1 - 2: ( 40, 101.5)
T - Test 1 = 2 (vs not =): T = 4.59 P = 0.0000 DF = 135
8) Fez-se um estudo de 531 pessoas feridas em acidentes de bicicleta; os resultados de uma amostra aleatria
constam da tabela abaixo. Com o nvel de 0,05 de signicncia, teste a armao de que o uso do capacete
no reduz a possibilidade de ferimentos no rosto. Com base nos resultados, acha que o uso do capacete ajuda
a reduzir o risco de ferimentos no rosto?
Resultados Com capacete Sem capacete
Com ferimentos faciais 30 182
Todos os ferimentos no faciais 83 236
Fonte: A Case-control study of the Eectiveness of bicycle safety
helmets in preventing facial injury, de Thompson, Thompson,
Rivara e Wolf, American Journal of Public Health, vo. 80, no. 12.
9) Um estudo feito para determinar a taxa de fumantes entre pessoas de diferentes grupos etrios originou
os dados amostrais aleatrios resumidos na tabela a seguir. Com o nvel de 0,05 de signicncia, teste a
armao de que o fumo independente do grupo etrio. Com base nesses dados, tem sentido dirigir a
propaganda de cigarros a grupos etrios especcos?
Hbito de fumar 20-24 anos 25-34 anos 35-44 anos 45-64 anos
Fumante 18 15 17 15
No fumante 32 35 33 35
TOTAL 50 50 50 50
Fonte: Baseado em dados do Centro Nacional de Estatsticas em Sade (E.U.A)
26

Вам также может понравиться