Вы находитесь на странице: 1из 43

UNIVERSIDADE FEDERAL DE PERNAMBUCO

CENTRO ACADÊMICO DO AGRESTE


Programa de Pós-Graduação em Engenharia Civil e Ambiental
ECA925 – Estatística Aplicada

Aula 12 – Estimação de parâmetros

Prof. Anderson Paiva


Estimação de Parâmetros
 Estimação (Pontual) de Parâmetros

 Iremos estudar as propriedades de um estimador e a estimação


intervalar.
 Não iremos abordar os métodos de estimação pontual, mas
justificaremos porque e são bons estimadores para a média e a
proporção, respectivamente. Nosso objetivo será construir intervalos
de confiança para a média e para a proporção populacional a partir
das distribuições de e , respectivamente.

Slide 2 Prof. Anderson Paiva


Estimação de Parâmetros
 Estimação de Parâmetros

 Considere uma amostra aleatória X1;X2; ...;Xn de uma V.A. que


descreve alguma característica de interesse da população. Seja q um
parâmetro desta população e um estimador para q, ou seja q =
T(X1;X2; ...;Xn). Algumas definições são necessárias:

 Estimativa: é o valor assumido pelo estimador em uma particular


amostra.
 Vício de um Estimador: O vício de um estimador é dado por

 Estimador não Viciado: Um estimador ^ é dito ser não viciado


para o parâmetro q se . Ou seja, se
Slide 3 Prof. Anderson Paiva
Estimação de Parâmetros
 Estimação de Parâmetros

 Justifique porque e são não viciados para e ,


respectivamente, onde e é a proporção populacional.

Slide 4 Prof. Anderson Paiva


Estimação de Parâmetros
 Estimação de Parâmetros
 Observações:
 Considere uma população com N elementos. Assim, a variância
populacional é definida como:

onde, é a média populacional.


 Um possível estimador para , baseado numa amostra aleatória de
tamanho n extraída dessa população, é

 Pode-se mostrar que este estimador é viciado para e


. Portanto, seu vício . Logo, através de
um simples ajuste em podemos obter um estimador não viciado
para . Este estimador é
Slide 5 Prof. Anderson Paiva
Estimação de Parâmetros
 Estimação Consistente
 Um estimador é consistente se, à medida que o tamanho da
amostra aumenta, seu valor esperado converge para o parâmetro de
interesse e sua variância converge para zero. Ou seja, é consistente
se as duas propriedades abaixo são satisfeitas:

 Observação: Se o estimador é não viciado para e deseja-se


verificar sua consistência, basta observar a segunda condição da
definição acima. Ou seja, um estimador não viciado é consistente
para se .

Slide 6 Prof. Anderson Paiva


Estimação de Parâmetros
 Eficiência de um Estimador
 Dados dois estimadores e , não viciados para o parâmetro ,
dizemos que é mais eficiente que se .

 Ex.: Considere X1;X2; ...;Xn uma amostra aleatória de uma


distribuição . Considere os estimadores e
. Sendo e , quem
é mais eficiente para ?
 Ex.: Considerando a mesma situação do exemplo anterior e os
estimadores e para , sendo e ,
qual dos dois estimadores você escolheria para estimar analisando
apenas a variância do estimador?

Slide 7 Prof. Anderson Paiva


Estimação de Parâmetros
 Estimação Intervalar
 Até aqui discutimos apenas sobre estimadores pontuais, àqueles que
fornecem como estimativa um único valor numérico para o parâmetro
de interesse. Para amostras diferentes de uma mesma população
podemos encontrar valores diferentes para a estimativa de um
parâmetro levando-se em consideração o mesmo estimador, isto
porque o estimador é uma variável aleatória.
 Assim, em muitas situações gostaríamos de construir uma
estimativa mais informativa para o parâmetro de interesse que inclua
uma medida de precisão do valor obtido. Esse método de estimação,
denominado intervalo de confiança, incorpora à estimativa pontual
do parâmetro informações a respeito de sua variabilidade. Intervalos
de confiança são obtidos através da distribuição amostral de seus
estimadores.
Slide 8 Prof. Anderson Paiva
Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Conhecida
 Considere uma amostra aleatória X1;X2; ...;Xn de uma população X,
que tem média m desconhecida e variância s² conhecida. Daqui por
diante faremos as seguintes considerações: 0 < g < 1 e zg/2 é um
número tal que P(0 < Z < zg/2) = g/2 onde Z ~ N(0; 1).
 Pelo Teorema Central do Limite, a média amostral .
Assim, o erro que cometemos ao estimarmos a média m por X será
uma variável aleatória definida por e terá distribuição
aproximadamente . Logo, . Portanto, a
probabilidade de cometermos erros de determinadas magnitudes,
pode ser calculada por , ou seja

Slide 9 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Conhecida
desenvolvendo o módulo, obtemos

 Daí,

 Portanto, o intervalo de confiança para m, com coeficiente de


confiança g, é dado por

Slide 10 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Conhecida

 Observe que a expressão envolve a quantidade X que é


uma variável aleatória e, portanto, o intervalo obtido também é
aleatório. Desta forma, podemos interpretar o intervalo acima da
seguinte maneira: se obtivermos várias amostras de mesmo tamanho e
para cada uma calcularmos os correspondentes intervalos de
confiança com coeficiente de confiança g, esperamos que a proporção
de intervalos que contenham o valor de m seja igual a g.

Slide 11 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Conhecida

 Ex.: Suponha que os comprimentos de jacarés adultos de uma certa


raça siga o modelo normal com média m desconhecida e variância
igual a 0,01 m². Uma amostra de dez animais foi sorteada e forneceu
média 1,69 m. Calcule um intervalo de confiança para o parâmetro
desconhecido m.

Slide 12 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Conhecida
 Observação: A amplitude do intervalo de confiança é dada pela
diferença entre o extremo superior e o extremo inferior, isto é, .
O erro envolvido na estimação é dado pela semi-amplitude, ou seja,

 Ex.: A vida média de baterias automotivas de uma certa marca está


sendo estudada. Baseado em estudos similares, com outras marcas, é
possível admitir que a vida útil dessas baterias segue uma distribuição
normal com desvio padrão de 4,5 meses. De qual tamanho deverá ser
a amostra, para que a amplitude do intervalo de 90% de confiança
para a vida média seja de 3 meses?
Slide 13 Prof. Anderson Paiva
Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Conhecida
 Exercício: Foi realizada uma pesquisa de opinião em uma grande
empresa visando, entre outras coisas, determinar o nível médio de
satisfação dos empregados com as condições de trabalho a eles
oferecidas (instalações, equipamentos, etc.). O índice de satisfação de
cada empregado pode ser medido em uma escala de zero a cem
pontos, e sua variabilidade é tal que o desvio padrão populacional é
da ordem de 30 pontos. Se nessa pesquisa foram sorteados 324
empregados ao acaso para uma entrevista, qual a probabilidade de que
o índice de satisfação médio seja estimado com erro absoluto menor
que três pontos? Erro absotulo = |estimativa – valor correto|
 Solução: P(|Xmed – m| < 3) = 92,81%

Slide 14 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Proporção
Populacional
 De maneira análoga ao caso da média, podemos construir um
intervalo de confiança para a proporção populacional.
 Pelo Teorema Central do Limite, sabemos que

 Assim, um intervalo de confiança para p com nível de confiança é


dado por

 Como p é desconhecido, o intervalo ainda não pode ser calculado


diretamente. Uma possível solução é substituirmos por
. . Portanto, o intervalo será:

Slide 15 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Proporção
Populacional

 Outra solução possível, é baseada no fato que a expressão


tem valor máximo igual a 1/4, quando . Nesse caso,
podemos obter um intervalo de confiança substituindo por
1/4:

Slide 16 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Proporção
Populacional

 Observação: Ao aceitarmos IC1, estamos levando em consideração


que a variância de p é bem aproximada por . Se preferirmos
IC2, estaremos substituindo a variância por um valor seguramente
maior do que o real. Assim, estamos nos assegurando que o
coeficiente de confiança será de, no mínimo, g. Ao utilizarmos IC2,
estamos aceitando uma menor precisão para , o que se reflete numa
maior amplitude do intervalo de confiança, quando comparado ao
intervalo IC1.

Slide 17 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Proporção
Populacional

 Ex.: Numa pesquisa de mercado, 400 pessoas foram entrevistadas


sobre determinado produto, e 60% delas preferiram a marca A.
Construa um intervalo de confiança para p com coeficiente de
confiança = 0,95.

Slide 18 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Desconhecida

 Até aqui consideramos a média de uma população desconhecida e a


variância conhecida. Esta situação não é muito realista, pois se não
conhecemos a média, como podemos conhecer a variância de uma
população? Desta forma, uma situação mais próxima da realidade
seria o caso em que, tanto a média como a variância, são
desconhecidas. Iremos considerar a situação em que
com m e s desconhecidos.

Slide 19 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Desconhecida

 Para isso, iremos utilizar a distribuição t de Student, que é definida


como:
 Uma V.A. T é dita ter distribuição t de Student com n graus de
liberdade, se sua f.d.p. é da forma

Onde , p > 0, é conhecida como a função gama.

Slide 20 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Desconhecida
 Observações:
(i) Notação: ;

(ii) Essa distribuição leva este nome em homenagem ao estatístico


inglês W.S. Gosset, que publicou sua pesquisa sob o pseudônimo de
“Student”;

(iii) O gráfico de fn(t) é simétrico em torno de 0. Ele se assemelha ao


gráfico da distribuição normal padrão, em verdade, mostra-se que

Slide 21 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Desconhecida
 Observações:
(iv) Em virtude da importância desta distribuição, ela se encontra
tabulada. A tabela fornece o valor de tc, tal que ,
para alguns valores de 0 < a < 1, onde Tn tem distribuição t de
Student com n graus de liberdade.

 Nosso objetivo agora é estudar a situação em que com


m e s desconhecidos. Assim, considerando uma amostra aleatória X1;
X2; ...; Xn de X, pode-se mostrar que

Slide 22 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Desconhecida
 Nosso objetivo agora é estudar a situação em que com
m e s desconhecidos. Assim, considerando uma amostra aleatória
X1;X2; ...;Xn de X, pode-se mostrar que

onde
 Assim, dado 0 < g < 1, teremos
onde g = 1 - a , e ta é um número tal que .
 Logo, o intervalo de confiança para m com nível de confiança 1 - a,
é dado por

Slide 23 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Desconhecida
 Ex.: Numa grande empresa uma amostra aleatória de 20
empregados forneceu a idade média igual a 32,8 e desvio padrão 5,3.
Estimar a idade média de toda a empresa com uma confiança de 99%.
Que suposição devemos fazer para estimar a idade média?

 Ex.: Por analogia a produtos similares, o tempo de reação de um


novo medicamento pode ser considerado como tendo distribuição
normal. Vinte pacientes foram sorteados, receberam o medicamento e
tiveram seu tempo de reação anotado. Os dados foram os seguintes
(em minutos): 2,9; 3,4; 3,5; 4,1; 4,6; 4,7; 4,5; 3,8; 5,3; 4,9; 4,8; 5,7;
5,8; 5,0; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2. Obtenha um intervalo de
confiança para o tempo médio de reação. Use g = 0,95.
Slide 24 Prof. Anderson Paiva
Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Desconhecida
 Exercício: Um engenheiro metalúrgico está interessado em analisar
a porcentagem de carbono em uma liga de ferro produzida por sua
empresa. Des unidades amostrais de ferro apresentam as seguintes
quantidades de carbono (em gramas) para cada cem gramas da liga:
4.37; 3.63; 2.78; 5.46; 2.18; 6.07; 3.24; 5.89; 4.86; 4.64. Suponha que
o objetivo é determinar, com base nessa amostra, um intervalo de
confiança de 90% para o verdadeiro conteúdo médio de carbono na
liga de ferro produzida pela empresa.
 Solução: IC(m; 0,90) = [3,54g/100g; 5,08g/100g]

Slide 25 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Média de uma
População com Variância Desconhecida
 Exercício:
 Solução: IC(m; 0,90) = [3,54g/100g; 5,08g/100g]
 Para o resultado anterior ter validade devemos ter boas razões para supor que o
conteúdo de carbono segue uma distribuição normal, ou muito próxima da normal.
Caso contrário, o uso da distribuição t de Student pode conduzir a resultados
imprecisos. Assim, diante de uma tal situação, é recomendável que se verifique a
plausibilidade da premissa de normalidade da variável em questão. Uma forma de
verifica a normalidade por meio da amostra é o uso do gráfico de probabilidade
normal.
 Caso seja evidente a falta de normalidade da distribuição de X, uma solução seria
aplicar uma transformação que conduza a uma normalidade aproximada (algumas
possibilidades seriam: log X, raiz(X), 1/X, etc.) SE isso não der resultado, a solução
é recorrer a métodos não paramétricos.
Slide 26 Prof. Anderson Paiva
Estimação de Parâmetros
 Intervalo de Confiança para Médias de Populações
normais com Variância Conhecida

Slide 27 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para Médias de Populações
normais com Variância Conhecida

Slide 28 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para Médias de Populações
normais com Variância Conhecida
Exercício: Um engenheiro químico responsável por um processo produtivo
é informado de que existe no mercado um novo catalisador cujo rendimento
de produto é superior ao do catalisador atualmente em uso. A fim de testar a
veracidade da informação ele realiza oito ensaios com o catalisador atual
(A) obtendo um rendimento médio de 80,5%, e dez ensaios com o novo
catalisador (B), com o qual o rendimento médio é de 81,3%. Supondo que
os desvios padrões populacionais são conhecidos e iguais a 1,5% e 3,8%,
respectivamente, construa um intervalo de confiança de 95% para a
verdadeira diferença das médias dos rendimentos obtidos com os dois
catalisadores. Suponha que as distribuições dos rendimentos de cada
catalisador são normais.
 Solução: IC(m1-m2; 0,95) = [-3,4; 1,8]

Slide 29 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para Médias de Populações
normais com Variância Desconhecida

Slide 30 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para Médias de Populações
normais com Variância Desconhecida

Slide 31 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para Médias de Populações
normais com Variância Desconhecida
Exercício: Uma siderúrgica recebe carvão mineral de duas mineradoras
como matéria-prima para fabricação de aço. São obtidas aleatoriamente 50
unidades amostrais do produto fornecido pela mineradora A, para as quais
se mede o conteúdo de enxofre. Com base nessas 50 medições calculam-se
para essa variável uma média amostral de 0,61% e um desvio padrão
amostral de 0,058%. Enquanto isso, outras 60 análises do carvão
proveniente da mineradora B nos levam a uma média amostral de 0,68% de
enxofre e um desvio padrão amostral de 0,065%. Construa um intervalo de
confiança de 95% para a verdadeira diferença entre os conteúdos médios de
enxofre no carvão para as duas mineradoras.
 Solução: IC(m1-m2; 0,95) = [-0,093; -0,047]. Como os dois limites são negativos,
concluímos que existem evidências, ao nível de 95%, para afirmar que o verdadeiro contéudo
médio de enxofre é maior no carvão proveniente da mineradora B.
Slide 32 Prof. Anderson Paiva
Estimação de Parâmetros
 Intervalo de Confiança para Médias de Populações
normais com Dados Emparelhados

 Nos casos anteriores considerou-se as duas populações


independentes entre si. Entretanto, existem exemplos típicos em que a
independência não é verificada, tais como:
- Comparações do tipo ‘antes’ e ‘depois’, em que são feitas
medições sobre uma mesma unidade amostral antes e depois de ser
aplicado um tratamento e comparação é feita caso a caso, para
avaliar o efeito desse tratamento;

Slide 33 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para Médias de Populações
normais com Dados Emparelhados

- Nos estudos de reprodutibilidade de um instrumento de medição,


duas mensurações de uma mesma peça realizadas com o mesmo
instrumento são feitas por dois operários diferentes. A finalidade é
determinar a capacidade do instrumento em ‘reproduzir a mesma
mensuração quando usado por pessoas diferentes;
- Nos estudos de calibração, quando a mesma peça é submetida a
duas mensurações com instrumentos diferentes.

Slide 34 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para Médias de Populações
normais com Dados Emparelhados

Slide 35 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para Médias de Populações
normais com Dados Emparelhados
• Exercício: O gerente de uma loja de conveniências loja está considerando colocar
novas caixas registradoras visando aumentar a precisão e diminuir o tempo de saída.
Reuniu-se uma amostra aleatória de sete compras típicas de itens da loja. Cada
sacola de compras dos itens foi totalizada por um operador de caixa usando a
máquina antiga e, depois, pelo mesmo operador usando a máquina nova. Os tempos
(em segundos) são apresentados na tabela que segue. Há alguma evidência que
sugira que a nova máquina registradora mude o tempo médio de saída? Admita que
as populações subjacentes sejam normais, use a = 0,01, e encontre um intervalo de
confiança.

• Solução: IC(m1-m2; 0,99) = [-6,52; 30,52]

Slide 36 Prof. Anderson Paiva


Estimação de Parâmetros
 Intervalo de Confiança para a Variância de uma
População

 Distribuição de Qui-Quadrado: Consideremos Z1; Z2; ...; Zn,


variáveis aleatórias INDEPENDENTES com distribuição normal
N(0,1) e seja Q =Z1² + Z2² + ... + Zk² . Dizemos que Q tem
distribuição de qui-quadrado com k graus de liberdade.

 Notação: . Fato: Se X1; X2; ...; Xn forem V.A.


independentes com distribuição normal , então:

Slide 37 Prof. Anderson Paiva


Estimação de Parâmetros
 IC para a Variância de uma População

 Se a média populacional, m, for conhecida:

 Se a média populacional, m, for desconhecida:

 Usando este fato, vamos obter um intervalo de confiança para s²


com nível de confiança (1 - a).

Slide 38 Prof. Anderson Paiva


Estimação de Parâmetros
 IC para a Variância de uma População
 1º CASO: m Conhecido
 Para n graus de liberdade, podemos obter (tabela da distribuição
qui-quadrado) q1 e q2 tais que:

Slide 39 Prof. Anderson Paiva


Estimação de Parâmetros
 IC para a Variância de uma População
 1º CASO: m Conhecido
 Portanto, o intervalo de confiança para s², com coeficiente de
confiança (1 - a), é dado por

Distribuição qui-dradrado com probabilidade a/2 e n-1 graus de


liberdade

 Ex.: Se o valor observado numa amostra de tamanho 20 de uma


população N(10, s²) for , obter um I.C. para s²
com 95% de confiança.

Slide 40 Prof. Anderson Paiva


Estimação de Parâmetros
 IC para a Variância de uma População
 2º CASO: m Desconhecido
 Para (n - 1) graus de liberdade, podemos obter (tabela da distribui-
ção qui-quadrado) q1 e q2 tais que:

Slide 41 Prof. Anderson Paiva


Estimação de Parâmetros
 IC para a Variância de uma População
 2º CASO: m Desconhecido
 Portanto, o intervalo de confiança para s², com coeficiente de
confiança (1 - a), é dado por

 Observação: Como , podemos escrever


. . Dessa forma, uma expressão alternativa
para o intervalo de confiança para s², com coeficiente de confiança
(1 - a), é dado por

Slide 42 Prof. Anderson Paiva


Estimação de Parâmetros
 IC para a Variância de uma População
 2º CASO: m Desconhecido

 Ex.: Uma máquina automática de refrigerante é regulada para suprir


uma quantidade em cada copo com distribuição aproximadamente
normal. Sabendo-se que uma amostra de 4 copos forneceu:

X1 = 360mL, X2 = 340mL, X3 = 375mL e X4 = 355mL,

obtenha um I.C. para s² com 98% de confiança.

Exercícios da Lista Inferência: 19, 20 e 21

Slide 43 Prof. Anderson Paiva

Вам также может понравиться