Вы находитесь на странице: 1из 48

Mtodos Estatsticos para Engenharia Tenham coragem j dizia o mestre!!!

Captulo 02:
Dados estatsticos obtidos de observaes, experimentos e algumas sries de medidas
so muitas vezes to numerosos que se tornam inteis a menos que possam ser condensandos,
ou reduzidos para uma forma mais adequada. Comearemos com o uso de grficos simples,
depois na seo 2.2 e 2.3 trataremos com problemas relacionados a agrupamento de dados e a
apresentao grfica de como estes dados agruparam-se; na seo 2.4 ns discutiremos uma
forma relativamente nova de apresentar agrupamento de dados.
Algumas vezes o grfico pode ser satisfatrios exatamente para aquela apresentao de
dados como eles so, ou seja, eles falam por si mesmos e em outras ocasies torna-se necessrio
pegar um conjunto de dados e tabular os resultados ou apresentar de forma grfica. Contudo,
muitas vezes os dados tem de ser resumidos e nas sees 2.5 a 2.7 ns introduziremos algumas
das melhores descries estatsticas usadas.
2.1 Diagrama de Pareto e Diagrama de Pontos:
Dados precisam ser coletados para fornecerem informaes vitais para se resolver
problemas de Engenharia. Uma vez reunidos estes dados, eles podem ser descritos e analisados
para produzir informaes resumidas. Representaes grficas podem muitas vezes ser o meio
mais efetivo para transmitir esta informao. Para ilustrar a potncia de um grfico tcnico, ns
primeiro descreveremos um diagrama de Pareto. Esta exposio que ordena cada tipo de falha
ou defeito de acordo com sua frequncia, podendo socorrer Engenheiros a identificar
importantes defeitos e sua causa. Quando uma companhia identifica um processo como
candidato a uma melhoria, o primeiro passo coletar dados da frequncia de cada tipo de erro.
Por exemplo, para um controle por computador onde a performance estava bem abaixo da
esperada trabalhadores registraram as seguintes causas e suas frequncias: flutuao da energia
(06), controlador no estvel (22), erro do operador (13) ferramentas usadas e no trocadas (02)
e outras causas (05). Estes dados so apresentados como um diagrama de Pareto na figura 2.1
Este diagrama descreve graficamente a lei empirica de Pareto: qualquer quantidade de
enventos consiste em alguns maiores e outros menores. Tipicamente, dois ou trs elementos
sero considerados para mais do que a metade da frequncia total. Assim, 22 ou 100*(22/48) =
46% so erros devido a instabilidade do controlador e 22+13 = 35 ou 100*(35/48) = 73% so
erros devido ou a instabilidade do controlador ou a erros do operador. A porcentagem
acumulada pode ser mostrada na fig. 2.1 como um grfico de linha cuja escala fica no lado
direito do grfico como na figura 14.2.
No contexto da melhoria da qualidade, queremos selecionar poucas das maiores
oportunidades dentre as muitas oportunidades menores de melhorias. Este grafico evidencia a
importncia de reduzir a frequncia do mal comportamento do controlador, uma meta inicial
que pode cortar as causas quase pela metade e como um segundo passo em direo a melhoria
do processo, dados so coletados do desvio da velocidade de corte de um conjunto de valores
alvo a serem controlados. Os sete valores observados esto demonstrados no grfico de pontos
da figura 2.2. O diagrama de ponto resume a informao de como a situao se encontra,
geralmente, sendo organizado rapidamente. Nos captulos 13 e 14 ns desenvolveremos
projetos de experimentos eficientes e mtodos para identificar fatores das causas primrias que
contribuem na variabilidade da resposta como a velocidade de corte. Quando o nmero de
observaes pequeno difcil para identificar qualquer padro de variao. Ainda uma boa
soluo para demonstrar os dados e analisar-mos caractersticas incomuns.
2.2 Distribuio de Frequncia
Trata-se de uma tabela que divide um conjunto de dados de acordo com o nmero
adequado de classes ( categorias) mostrando tambm o nmero de tens pertencente a cada
classe. Uma tabela sacrifica algumas das informaes que esto contidas nos seus elementos, ao
invs de sabermos o valor de cada tem, somente sabemos se ele est contido numa classe. De
outro modo o tipo de agrupamento dos representantes, muitas vezes, reala caractersticas
importantes dos dados e o ganho em legibilidade mais que compensa a perda de informaes.
Ns devemos considerar principalmente as distribuies numricas onde os dados so
agrupados conforme o tamanho, se os dados so agrupados conforme alguma qualidade ou
atributo nos referimos tal distribuio como, distribuio categrica. O primeiro passo para se
construir uma distribuio numrica consiste em estabelecer quantas classes sero usadas e
escolher o limite para cada classe, ou seja, de onde at onde cada classe deve ir. Geralmente, o
nmero de classe proporcional ao nmero de observaes, mas raramente proveitosos
definir um nmero menor do que 5 e maior do que 15. O nmero de dados depende tambm
da gama de dados, a saber, a diferena entre a maior e a menor observao, ento ns contamos
as observaes e desta maneira determinamos a frequncia das classes, ou seja, o nmero de
observaes em cada classe.
Para ilustrar a DF, consideramos 80 observaes da emisso diria de xido sulfurico
(toneladas) de uma planta industrial pg 09 A partir de que a maior obs. 31,8 e a menor 6,2,
a extenso 25,6. Ns poderamos escolher seis, sete ou nove classes, onde em cada caso as
classes no se sobrepem, acomodam todos os dados e so todas do mesmo tamanho.
Decidindo por sete classes, ns somamos as oitenta obs. e mostramos os resultados na tabela da
pg 09. Note que os limites so dados para tantas casas decimais quanto tenham os dados
originais. Se os dados fossem dados com duas casas decimais teramos de manter os limites
com duas casas decimais; se eles fossem arredondados para perto das toneladas teramos de usar
nmeros inteiros. No exemplo anterior, os dados podem ser analisados como uma varivel
aleatria contnua, mas se ns usassemos 5,0-9,0; 9,0-13,0... existe a possibilidade de
ambiguidade no 9,0, podendo ir para primeira ou segunda classe, assim como no 13,0 e
consequentemente. Para evitar este problema, ns podemos fazer a primeira classe ir de 4,95-
8,95; 8,95-12,95... Ns referimos estes limites como fronteiras das classes e no havero
ambiguidades, mesmo que as fronteiras sejam ultrapassadas. Estas fronteiras de classe so
valores impossveis, uma vez que os dados foram dados com uma casa decimal. Na prtica ns
usamos os limites de classe em vez dos limites de classe original, sobretudo, quando queremos
acentuar o fato de que queremos trabalhar com tipos de medidas contnuas. Uma alternativa
mais popular quando usamos DF grfica usar o conceito de ponto final. Pegaramos 5,0-9,0;
9,0-13,0-... o ponto final da esquerda seria atendido e o da direita no, para outro conjunto ns
podemos escolher o contrrio da conveno do ponto final, desde que, quando adotado ponto
final, aparea na descrio da distribuio de frequncia.
Como ns decidimos pela maneira mais fcil, uma vez que os dados tem de ser
agrupados, cada observao tem perdido sua identidade, no sentido de no sabermos mais seu
valor exato. Esta dificuldade pode ser notada quando queiramos maiores descries dos dados,
mas ns podemos evita-la pela representao de cada observao na classe pelo ponto mdio,
chamado marco de classe. Em geral, os marcos de classe de uma DF so obtidos pela mdia
sucessiva das fronteiras de classe. Se as classes de uma distribuio so todas do mesmo
tamanho, como no exemplo anterior, nos referimos a um intervalo comum a sucessivos pontos
mdios, como o intervalo de classe de uma distribuio. Note que o intervalo de classes pode
ser obtido da diferena entre as fronteiras da classe, mas no da diferena entre os limites da
classe.
2.3 Grficos de Distribuio de Frequncia
Propriedades da DF relacionadas a sua forma so melhor exibidas pelo significado do
grfico e nesta seo sero demonstradas algumas das mais difundidas formas de apresentao
de grficos de DF, distribuio de percentual e distribuio acumulativa.
A forma mais comum de grfico de distribuio de frequncia o histograma. O
histograma de uma DF construdo a partir de retngulos adjacentes e a altura dos retngulos
representa a frequncia das classes e sua base prolonga-se por entre as sucessivas fronteiras das
classes. Um histograma dos dados de emisso de xido sulfrico est mostrado na figura 2.5.
Em histogramas, algumas vezes melhor olhar sua rea do que sua altura como representante
da frequncia das classes, isto se aplica, em particular para situaes onde se quer aproximar
histogramas com curvas suaves ou onde existe classes de comprimento desiguais.
Similar a histogramas so grficos em barras, como mostrado na figura 2.1. A altura
do retngulo ou barras, novamente representa a frequncia das classes, mas no existe a
pretenso de ter uma escala horizontal contnua. Outra forma alternativa de apresentar
frequncia em forma de grficos atravs do polgono de frequncia. Agora a frequncia das
classes demonstrada atravs de pontos mdios, ou seja, ns desenhamos os pontos (xi,fi) onde
xi o ponto mdio e fi a frequncia correspondente e os ponto sucessivos so conectados por
meio de linha retas, depois sendo adicionados classe com fi = 0 em ambos fins de distribuio.
Inspees de grficos de DF muitas vezes realam caractersticas que no so
imediatamente aparente nos dados. Partindo do fato de que o grfico apresenta um bom desing
dos dados de forma global, eles podem tambm infatizar caractersticas irregulares ou
incomuns. Por exemplo, observaes fora do contexto, que de alguma forma no fazem parte do
conjunto demosntrado pelo grfico, que podem acontecer devido a erros de medida, falhas no
equipamento ou causas similares. Tambm o fato de que um histograma fornece dois ou mais
modelos (mximo) pode fornecer informaes pertinentes, ou seja, o aparecimento de dois
modelos, por exemplo, pode significar uma mudana no processo que est sendo medido ou
pode implicar que os dados venham de fontes diversas. Com algumas experincias aprendemos
a encontrar tais irregulariedades ou anomalias, e um eEngenheiro experiente ficaria to surpreso
em encontra-la como se o histograma de distribuio do tempo de falhas em circuitos integrados
fosse simtrico, ou se a distribuio de tamanho dos homens da Amrica fosse bi-modal.
Algumas vezes pode ser suficiente desenhar um histograma para resolver um problema de
Engenharia.

2.5 Medidas Descritivas
Dados um conjunto de nmeros n ou observaes x
1
,x
2
,x
3
...x
n
existem muitas forma
em que podemos descrever seu centro (meio ou localizao central), sendo que as mais popular
entre elas so a Mdia e a Mediana, embora outros tipos de mdias algumas vezes so usadas
para propsitos especiais. A mdia definida pela frmula:
Para enfatizar que est baseado em um conjunto de observaes ns muitas vezes nos
referimos a mdia como mdia da amostra.
Algumas veze prefervel usar a mediana como medida descritiva, do que centro ou
localizao de um conjunto de dados, isto verdade, particularmente, se desejamos minimizar
os clculos ou se desejvel eliminar os extremos ( valores muito grande ou muito pequenos).
A mediana de n observaes x
1
,x
2
,x
3
...x
n
pode ser definida como o valor mais no meio, uma
vez que os dados so organizados de acordo com o tamanho. Mais precisamente, as observaes
( ) 01
1
1

Equao xi
n
x
n
i
esto arrumadas por tamanho e se n um nmero mpar, a mediana dada por: (n + 1)/2 e se
a mediana um nmero par dada pela mdia dos elementos encontrados por: n/2 e (n + 2)/2.
Varincia da Amostra: Uma das mais importantes caractersticas de quase todos
conjuntos de dados que os valores no so todos parecidos. Certamente, a extenso do quanto
eles so desiguais de fundamental importncia na Estatstica. Medidas como mediana e a
mdia descrevem uma importante caracterstica de um conjunto de dados, sua localizao, mas
no falam nada de outras caractersticas bsica. Ns observamos que a disperso de um
conjunto de dados pequena se seus valores esto intensamente agrupados em torno de sua
mdia e e que ela grande se seus valores esto espalhados em relao a sua mdia, pareceria
razovel, portante, a medida da quantidade que os valores desviam de suas mdias. Se um
conjunto de dados x
1
,x
2
,x
3
...x
n
tem mdia da amostra, as diferenas entre os dados e a mdia, so
chamados de desvio da mdia, ela sugere que ns poderamos usar sua mdia como uma
medida de variao num conjunto de dados. Infelizmente, isto no ser possvel, como o livro
pedir para ser demonstrados no exerccio 2.42 pg-34, a soma de todos os desvios sempre
zero. Por causa disto, uma alternativa apropriada elevar o desvio da mdia ao quadrado. A
varincia da Amostra, S
2
, essencialmente a mdia do quadrado do desvio das mdias e
definida pela frmula:
Se muitos dos desvios so grandes em magnitude, sendo positivos ou negativos, seu
quadrado ser grande e S
2
ser grande, quandos todos os valores forem pequenos, S
2
ser
pequena.
Desvio Padro (S): Note que na varincia todas unidades esto erradas. Se os dados de tempo
so dados em (min), ento na varincia a unidade ser (min)
2
. Consequentemente ns definimos
o desvio padro de n observaes x
1
,x
2
,x
3
...x
n
como a raz quadrada de S
2
.
O desvio padro uma das medidas mais usadas na variao. Ela tem como vantagem
sobre a varina estar na mesma unidade das observaes.
Coeficiente de Variao: O desvio padro e a varina so medidas de variao absoluta, ou
seja, elas medem a quantidade de variao atual presente em um cojunto de dados e elas
dependem da escala de medida. Para comparar a variao em vrios conjuntos de dados ,
geralmente, desejvel o uso de medidas de variao relativas. Por exemplo, o coeficiente de
variao relativa do S como percentagem da mdia. V = (S/mdia da amostra)*100
Varincia ( Frmula para Clculo): O clculo da mdia da amostra para dados desagrupados
no traz problemas, ns temos somente que adicionar o valor das observaes e dividir pelo
nmero de amostras. Por outro lado, o clculo da varincia normalmente tedioso e incmodo
se usar-mos a frmula definida acima. Portanto devemos utilizar a frmula algbrica
equivalente, que requer menos trabalho para se avaliar com uma calculadora :

,
_

n
i
i
n
x x
S
1
2
~
2
1
( ) 03
1
1
2

,
_

Equao
n
x xi
S
n
i
No exerccio 2.43 pg-34 do livro, o livro pede que se demonstre que as frmulas so
anlogas.
Mdia e Varincia: Para calcular mdia e desvio padro de um conjunto de dados ns temos
que fazer algumas suposies sobre a distribuio de valores de cada classe. Se ns
representamos todos os valores dentro de uma classe pelo ponto mdio correspondente,
podemos agora calcular a mdia e a varincia pelo ponto mdio, onde x
ci
o ponto mdio, f
i
a
frequncia correspondente da classe e k o nmero de classes de distribuio. Assim
obteremos as seguintes frmulas:

( )
( ) 04
1
2
1 1
2

,
_



Equao
n n
xi xi n
S
n
i
n
i
( )


k
i
Equao fi xci
n
x
1
02 .
1
( )
( ) 05
1
. .
1
2
1
2

,
_



Equao
n n
fi xi fi xi n
S
k
i
k
i
Captulo 03:
No estudo da probabilidade exise basicamente trs tipos de questes: 01 O que nos
entendemos quando falamos que a probabilidade de um evento , digamos, 0.50, 0.02, ou 0,81?
2 Como so os nmeros que ns chamamos de probabilidade determinada e 3 - Quais so as
regras matemticas que a probabilidade obedece? Depois de algumas consideraes
preliminares nas sees 3.1 e 3.2, ns estudaremos as duas primeiras perguntas na seo 3.3 e a
terceira questo da seo 3.4 a 3.7. Os conceitos matemticos exigidos esto na seo 3.8.
3.1 Espao amostral e Eventos
Probabilidade permite-nos quantificar a variabilidade de um resultado de qualquer
experimento cujo resultado exato no possa ser definido com certeza. Contudo, antes de
introduzirmos probabilidade necessrio especificar o espao de resultados e eventos em que
ela ser definida.
Em estatstica, o conjunto de todos resultados possveis de um experimento chamado
de espao amostral, normalmente representado pela letra S. Para evitarmos mal entendidos
sobre as palavras experimentos e resultados, como ns usamos elas aqui, ser demonstrado o
uso estatstico deste termos num sentido bem mais amplo: um experimento pode consistir em
um processo simples de observar se um interruptor est ligado ou no, no tempo que um carro
leva para acelerar a 30 milhas/h ou pode consistir em um experimento complicado de por
exemplo encontrar a massa de um eltron. Assim, o resultado de um experimento pode ser uma
simples escolha entre duas alternativas, resultados de uma medida direta ou contagem, ou
extensivas medies e clculos. Quando ns estudamos os resultados de um experimento ns
usualmente identificamos as vrias possibilidades com nmeros, ponto ou alguns outros tipos
de smbolos. Por exemplo, se quatro construturas se inscrevem na licitao para construir uma
rodovia e ns usamos a, b, c e d para representar o Sr. Adam, Brown, Clarck e Dean, ento o
espao amostral para este experimento o conjunto: S = {a,b,c,d}.
Tambm se uma agncia do governo tem que decidir onde vo ficar duas estaes de
pesquisa e que (para um curto propsito) de interesse especificar quantas ficariam no Texas
ou na California, podemos escrever o espao amostral como S = { (0,0) (1,0) (0,1) (1,1) (2,0)
(0,2)} onde o primeiro nmero significa as estaes de pesquisa instaladas no Texas, e o
segundo nmero as instaladas na California. Geomtricamente o espao amostral est
representado na figura 3.1 onde fica evidente, por exemplo, que em duas das alternativas os
estados podero ter o mesmo nmero de estaes de pesquisa. De certo modo pontos em vez de
nmeros ou letras tornam mais fcil vizualizar vrias probabilidades e permitem descobrir-mos
alguma caracterstica em especial que muitos dos resultados podem ter em comum. Geralmente,
espaos amostrais so classificados conforme o nmero de elementos que contm, nos dois
exemplos anteriores o espao amostral era de quatro e seis elementos e ambos so referenciados
como finitos. Outro exemplo de esoao amostral finito so as vrias maneiras que um
Presidente ou Vice-Presidente tem de escolher entre 25 membros de um entidade local e uma
das vrias formas que um estudante tem para responder (V ou F) para um questionrio de doze
questes, ou ainda como podemos ver na pg-49 o primeiro exerccio tem S = 600 elementos e o
segundo tem S = 4096 elementos.
Os exemplos seguintes so referentes a espaos amostrais infinitos: se pessoas
checando a emisso de xido de de nitrognio dos carros, esto interessadas no nmero de
carros que elas tem de inspecionar at encontrar o primeiro irregular, o que pode acontecer na
primeira inspeo, Segunda, Quinta e pelo que sabemos pode-se checar milhares de carros antes
de encontrar um que no esteja regular, no se sabendo at onde se tem de ir. Este um
exemplo apropriado de como o S contm todo conjunto de nmeros naturais, ou seja, uma
infinidade contvel. Para dar um passo a mais, se estivermos interessados na emisso de xido
de nitrognio de um carro dado em gramas/milha, o espao amostral terial de consistir de todos
os pontos de uma escala contnua ( um certo intervalo na linha dos nmeros reais) de que h
uma continuidade.
Em geral um elemento considerado discreto se tem muitos elementos finitos ou
contveis elementos infinitos. Se os elementos constituem-se contnuos (infinitos), por exemplo
todos os pontos em uma linha ou segmento de linha ou todos os pontos em um plano S dito
contnuo. No restante deste captulo consideraremos somente nmeros discretos e S finitos.
Em estatstica qualquer subconjunto do espao amostral chamado evento, por sub-
conjunto se entende uma parte do conjunto, incluindo o conjunto todo e trivialmente o conjunto
chamado vazio, que no tem elementos do todo. Por ex: com referncia a figura 3.1 C =
{(1,0)(0,1)} este um evento onde cada um dos estados ter uma estao. C e E so eventos
mutuamente excludentes, ou seja, um no possui elementos do outro, em muitos problemas de
probabilidade estamos interessados em eventos que possam ser expressos em forma de dois ou
mais eventos atravs da sua Unio, Interseco e Complemento. Se A e B so qualquer dois
conjuntos no espao amostral, sua unio AUB o subconjunto que contm todos os elementos
de A e B; Interseo entre A eB o subconjunto que contem todos os elementos que pertencem
ao mesmo tempo a A e B e Complemento de A o subcojunto que contem todos elementos do
espao amostral, menos os contidos em A.
Diagrama de Venn: so muito usados para verificar a relao entre conjuntos, assim tornando
desnecessria a compravao baseada na algebra dos conjuntos. O livro para demonstrar usou o
exemplo que o complemento da unio de dois conjuntos igual a interseo de seus
complementos. O primeiro diagrama da figura 3.3 representa na rea sombreada o
complemento da unio dos conjuntos A e B, compare o diagrama com o terceiro diagrama da
figura 3.2 e a regio onde se cruzam as hachura do segundo DV da figura 3.3 foi obtido pelo
sombreamento da regio que representa A com linhas traadas em uma direo e a regio que
representa o B com linhas em outra direo e representa a interseo entre A e B e pode ser
vista como idntica a reigo sombreada no primeiro DV da mesma figura. Quando ns tratamos
com trs eventos, ns desenhamos os crculos como na figura 3.4, nesta figura os crculos
dividem o espao amostral em 08 regies numeradas de 01 a 08 e fcil para determinar se os
eventos correspondentes so partes de A ou A, B ou B e C ou C.
3.2 Contagem
Em partes ela pode ser difcil ou no mnimo tedioso, para determinar o nmero de
elementos de um espao amostral finito pela enumerao direta. Para ilustrar, imagine que um
consumidor est avaliando um cortador de grama como sendo: fcil, mdio ou difcil de operar;
como sendo caro ou barato e como sendo caro, mdio ou barato para manuteno. Em quantas
formas este cortador pode ter seus servios testados ? Claramente, existem muitas
possibilidades: um cortador pode ser avaliado em fcil de operar, barato, mas de cara
manuteno; pode ser avaliado em mdio de operar, barato e com mdio custo de manuteno,
e ... Continuando seremos capazes de contar 18 possibilidades, mas existem grandes chances de
que omitamos ao menos uma ou duas das possibilidades. Para lidar com este tipo de problema
sistematicamente, resolveu-se desenhar um diagrama de rvore como na figura 3.5, onde as
trs alternativas para cada caso so representadas pelas letras E1, E2 e E3 para as condies de
operao, P1 e P2 para o preo e C1, C2 e C3 para o custo de manuteno. A seguir, dada
uma trajetria da esquerda para direitaa ao longo dos braos da rvore, ns obtemos uma
avaliao particular chamada, um elemento particular de um espao amostral e pode ser
visto que existem no total 18 possibilidades. Este resultado pode ser facilmente obtido se
observarmos que existem 3 galhos para modo de operar, que bifurcam em dois galhos de custo
e que por sua vez saem em 3 galhos de custo de manuteno, ento se multiplicarmos 3*2*3=18
combinaes de galhos ou braos. Este resultado um caso especial do teorema:
Multiplicao de Escolhas: Se conjuntos A
1
, A
2
,..., A
k
, contm respectivamente n
1
,n
2
,...,n
k
elementos, h n
1
*n
2
*....*n
k
formas de escolhendo primeiro um elemento de A
1
, ento um
elemento de A
2
e finalmente um elemento de A
k
encontrar um resultado.
Nmero de permutaes de nobjetos pegando x de uma vez, ou seja, respeitando a
ordem: como no primeiro destes trs exemplos, as regras para multiplicao de escolhas
muito usada quando muitas escolhas so feitas de um conjunto e no importa a ordem que elas
so feitas. Em geral se r objetos so escolhidos de um conjunto de n objetos distintos
qualquer arranjo ou ordenao destes objetos chamada permutao. Por ex. 4 1 2 3 uma
permutao dos quatro primeiros nmeros inteiros, e mais, Rio Grande do Sul e Santa Catarina
so uma permutao, um arranjo particular da ordem, de 2 dos estados do pas. Para encontrar a
frmula para o nmero total de permutaes de r objetos selecionado de um conjunto de
nobjetos distintos, temos de observar que a primeira seleo feita de todo conjunto n, a
Segunda feita de n-1 objetos que restaram e assim por diante at n-(r-1) = n - r + 1. Portanto
pela regra da multiplicao de escolhas, o nmero total de permutao de r objetos selecionados
de um conjunto de nmeros distintos n dado por: nPr = n(n-1)*(n-2)*...*(n-r+1) para r =
1,2,3,4,...,n.
Desde que o produto dos inteiros consecutivos surgem em muitos problemas relativos a
permutao ou outros tipos de seleo especial, deve ser introduzida a notao fatorial, onde: 1!
= 1; 2! = 2*1; 3! = 3*2*1 ... e em geral n! = n*(n-1)*(n-2)*... Ento para montar-mos algumas
frmulas mais genricamente aplicveis, ns dizemos que 0! = 1 por definio. Tudo isto para
poder expressar nPr em forma de notao: nPr= n!/(n-r)!
Teorema: O nmero de permutaes de r objetos em n nmeros distintos, nPr = n(n-
1)*(n-2)*...*(n-r+1) n ou = n!/(n-r)!
Combinaes: A primeira frmula para nPr geralmente mais fcil de usar a menos que ns
possamos nos referenciar uma tabela de fatoriais ou use uma calculadora que faa clculo de
fatoriais ou de relaes de fatoriais.
Existem muitos problemas em que ns podemos encontrar o nmero de formas em que
r objetos podem ser selecionados de n objetos distintos, mas ns no nos preocupamos com a
ordem em que a seleo feita. Por exemplo, ns podemos querer saber de quantas formas 03
de 20 assistentes de laboratrios podem ser escolhidos para auxiliar em um experimento. Em
geral, h r! permutaes de quaisquer r observaes selecionadas de um conjunto de n objetos
distintos. Ento nPr de r objetos selecionado de um conjunto de n objetos contm cada conjunto
de r objetos r! vezes. Portanto, para encontrar o nmero de formas em que r objetos podem ser
selecionados de n objetos distintos, tambm chamado o nmero de combinaes de n objetos
pegos r de cada vez e denotado por nCr ou (n)
r
Teorema: a permutao dividida por r!, ou seja, no iteressa a ordem.
nPr = n(n-1)*(n-2)*...*(n-r+1) n ou = n!
r! r!*(n-r)!
DIGERINDO: Se tu tens cinco frutas e queres fazer suco com duas =
Multiplicao de escolhas no serve, pois fornece o nmero de resultados possveis entre
conjuntos.
Permutao 5!/(5-2)!= 5*4=20 formas de fazer o suco, respeitando a ordem que os elementos
so misturados.
Combinao 5!/(2*(5-2)!) =10 formas de fazer o suco, no interessando a ordem que os
elementos so misturados.
3.3 Probabilidade
Assim, muitos tem estudado, somente o que probabilidade em uma dada situao. Ns
daremos um passo a mais e analisaremos o que probabilidade e improbabilidade.
Historicamente, a mais antiga forma de medir incertezas a probabilidade pelo conceito
clssico, que foi desenvolvido originalmente em combinao com jogos de azar, aplicado
quando todas possibilidades so igualmente provveis, neste caso dizemos que: Se existem n
possibilidades igualmente provveis de que uma tem de ocorrer e o espao amostral
considerado como favorvel ou como um sucesso, ento a probabilidade de um sucesso dada
por: S/n. Na aplicao desta regra os termos favorveis e sucesso so usadas flexivelmente at
certo ponto, favorvel pode ser que canais de televiso no peguem e sucesso que algum pegou
um resfriado.
A interpretao da probabilidade pela frequncia : o maior defeito do conceito de
probabilidade clssica a limitada aplicabilidade, para isto existem muitos casos onde a
probabilidade pode no ser considerada igualmente provvel. Este seria o caso, por exemplo, se
nos estivermos interessados na probabilidade de chover amanh, se um mssil ser lanado com
sucesso, se um novo motor desenvolvido funcionar ao menos 1000 horas ou se um certo
candidato ganhar as eleies. Entre os vrios conceitos de probabilidade, o mais amplamente
realizado a interpretao de frequncia, de acordo com que: A probabilidade de um evento ou
resultado a proporo de vezes que ele ocorre ao longo do desenvolvimento de repetitivos
experimentos.
Se ns falarmos que a probabilidade 0,78, que um jato de Panambi a Cruz Alta chegue
no tempo, significa que tal vo chegara no tempo em 78% das vezes. Assim, se o servio
meteorolgico prev que existe 40% de chance de chover ( que a probabilidade 0,40) isto
significa que sobre as mesmas condies ir chover em 40% das vezes. Mais geralmente, se ns
falamos que um evento tem uma probabilidade de 0,90, no mesmo sentido que com tempo frio
seu carro dever dar partida em 90% das vezes. Ns no podemos garantir que isto ocorrer em
qualquer situao em particular o carro pode no partir, mas se pegssemos registros de um
longo perodo de tempo, ns encontraramos uma proporo de sucesso bem perto de 0,90. De
acordo com a interpretao de probabilidade pela frequncia ns estipulamos a probabilidade de
um evento observando a frao de tempo que eventos similares tem ocorrido no passado.
3.4 - Os axiomas da probabilidade:
Nesta seo ns definiremos probabilidade matemtica como os valores de um
conjunto de funes aditivas. Uma vez que o livro est tratando elementos de domnio e
extenso como nmeros, vamos primeiro analisar um exemplo onde os elem. de domnio e
extenso so inteiros, no negativos, chamados de conjunto funo que designa para cada sub-
conjunto de A de um espao amostral finito o nmero de elemento em A, descrito por N(A).
Suponha que 500 peas de mquinas so inspecionadas antes delas serem transportadas e I
percebe que uma pea est mal montada e D percebe que existem um ou mais componentes
defeituosos e a distribuio das 500 peas dada no Diagrama de Venn figura 3.7, os nmeros
para figura so: Peas mal montadas = 20, Peas mal montadas e defeituosas = 10, Peas
defeituosas = 5 e peas boas = 465. Usando estes valores e o fato de que o conjunto funo
aditivo ( significa que o nmero que destinado para unio de dois sub-conjuntos que no tem
elementos em comum a soma dos nmeros dos dois sub-conjuntos individuais) permitem a
partir disto calcular qualquer outro sub-conjunto de A de S. Por exemplo, Todas peas, menos
as mal montadas = 470, Peas mal montadas + Defeituosas = 35, todas as peas menos as mal
montadas, inclusive as mal montadas e defeituosas = 480.
Usando os conceitos de um conjunto de funes aditivas ns explicamos o que ns
entendemos pela probabilidade de um evento. Dado um espao amostral finito e um evento A,
ns definimos P(A), a probabilidade de A, como sendo o valor de uma funo aditiva que
satisfaz as trs seguintes condies:
O primeiro axioma afirma que probabilidade so nmeros reais no intervalo de 0 a 1. O
segundo axioma afirma que para o espao amostral como um todo a probabilidade estimada
como 1 e expressa a idia de que a probabilidade de um evento que deve acontecer s pode ser
1. O terceiro axioma afirma que as funes da probabilidade devem ser aditivas. Axiomas para
teoria matemtica no requerem provas, mas devem ser aplicveis ao mundo fsico, nos termos
que mostrar que de alguma maneira os axiomas demonstram a realidade. Assim, vamos
demonstrar que os trs postulados so condizentes com os conceitos de probabilidade clssico e
pela frequncia, a situao se complica quando se trata de probabilidade subjetiva como no
exerccio 3.54. Assim, o primeiro axioma s fala o que j sabamos que a probabilidade no
pode ser negativa, nem passar de 100%; o segundo axioma s demonstra que a probabilidade de
um evento acontecer se ele tem de acontecer 100%, ou seja P(S)=n/n=1, se ficarmos
indefinidamente jogando um dado,com certeza o nmero dois (por ex.) vai ter que acabar
aparecendo e o terceiro axioma diz que se temos dois evento mutuamente excludente, um no
tem elemento do outro, a probabilidade para que aparea um elemento que consta na unio dos
dois eventos a soma das probabilidades dos dois eventos. Portanto se um evento ocorrer em
proporo 0,36 ou 36% das vezes e outro evento ocorrer 41% das vezes e ainda os dois eventos
forem mutuamente excludentes, ento um ou outro ocorrero em 0,41+0,36=0,77, 77% das
vezes. Antes de irmos adiante bom lembrar-mos que os axiomas da probabilidade no
estabelecem probabilidades, mas restringem a forma que pode ser feito. Na atualidade,
probabilidade estabelecida com base na experincia passada, com base na anlise cuidadosa
das condies de contorno do experimento e com base nas evolues subjetivas.
( )
( )
( ) ( ) ( ) B P A P B A P ax
S P ax
a P ax
+


U 03 .
1 02 .
1 0 01 .
3.5 Alguns teoremas elementares
Com o uso da induo matemtica, o terceiro axioma de probabilidade pode ser
estendido para incluir qualquer nmero de eventos mutuamente excludentes em outras palavras
o seguinte pode ser mostrado:
Teorema: Se A
1
,A
2
,...,A
n
so eventos mutuamente excludentes em um espao amostral
P(A
1
UA
2
U...UA
n
)=P(A
1
)+P(A
2
)+...+P(A
n
)
Regra para calcular a probabilidade de um evento: como pode ser mostrado que um
espao amostral de n pontos (resultados) tem 2
n
sub-conjuntos, mostra-se que o problema de
especificar uma funo probabilidade (chamada uma probabilidade para cada sub-conjunto do
evento) pode facilmente ser entediante. Certamente para um n = 20 existe milhares de possveis
eventos. Felizmente esta tarefa pode ser simplificada muito com o uso do seguinte teorema:
Teorema: Se A um evento de um espao amostral S finito, ento P(A) igual a soma das
probabilidades do resultado individual de cada elemento de A. Para provar, pegamos E
1
, E
2
...E
n
sendo os resultados do evento A. uma vez que so resultados individuais so por consequncia
mutuamente excludentes e pelo teorema: P(A)=P(E
1
)+P(E
2
)+...+P(E
n
) que completa a prova.
No primeiro teorema ns vimos que o terceiro axioma pode ser extendido para incluir
mais do que dois eventos mutuamente excludentes. Outro til e importante extenso deste
axioma nos permite encontrar a probabilidade da uniso de dois eventos em S, apesar de serem
mutuamente excludentes. Para motivar o teorema seguinte ns consideraremos o Diagrama de
Venn da figura 3.9 que demonstra os ramos de trabalho que recem graduandos de uma escola
de Engenharia escolheram para seguir. As letras I e G escolheram pegar um trabalho,
respectivamente, na Indstria e no governo e do diagrama de Venn: P(I) = 0,18+0,12 = 0,30 e
P(G) = 0,12+0,24 = 0,36 e P(IUG) = 0,18+0,12+0,24 = 0,54, se ns tivssemos utilizado o
terceiro axioma, erroneamente, ns teramos somado as probabilidades e obtido 0,66, que
excede o valor em 0,12. Este valor resulta da soma de duas vezes a interseo, eles no so
mutuamente excludentes, para resolver poderamos somar P(I)+P(G) e retirar uma vez a
interseo = 0,54 e este valor combina com o resultado obtido antes.
Uma linha com esta motivao nos levaria a firmar e provar o seguinte teorema: Se A e
B so qualquer eventos em S, ento P(AUB) = P(A)+P(B)- P(Interseo entre A e B) Regra
geral da Adio.
Note que se A e B so mutuamente excludentes assim a interseo entre eles zero,
teorema anterior reduzido pelo terceiro axioma, por isto que s vezes nos referimos ao terceiro
axioma como regra especial de adio de probabilidade.
Probabilidade de Complemento: Usando axiomas de probabilidade ns podemos derivar
muitos outros teoremas que podem ser importantes em algumas aplicaes. Por exemplo,
pequemos a seguinte aplicao, Teorema:
Se A qualquer evento em S ento P(A) = 1 P(A). Para provar este teorema ns
fizemos uso do fato que A e A so mutuamente excludentes por definio e que AUA= S, ou
seja, entre A e A esto contidos todos os elementos de S. Assim ns podemos escrever que
P(A)+P(A) = P(AUA) = P(S) = 1 P(A) = 1 P(A) e ainda P(0)=1-P(S)=0 Conj. vazio.
3.7 Probabilidade Condicional
Como ns temos definida probabilidade significativo perguntar pela possibilidade de
um evento somente se ele se referir a um espao amostral. Para perguntar pela probabilidade
que um Engenheiro ganhe U$40.000 ao ano sem sentido a menos que se especifique se nos
estamos referindo a todos os Engenheiros do hemisfrio Sul, todos Eng. do Brasil ou aqueles de
uma indstria em particular, afiliados a uma Universidade e da por diante. Assim quando ns
usamos o smbolo P(A) para probabilidade de A, realmente significa a probabilidade de A dado
um espao amostral S, uma vez que a escolha de S no pelo significado sempre evidente e
uma vez que algumas vezes estaremos interessados na P(A) relativa a mais de um espao
amostral S. A notao P(A/S) usada para ficar claro que estamos nos referindo a um espao
amostral S em particular. Ns lemos P(A/S) como a probabilidade condicional de A relativo a S
e todas probabilidades so consequentemente uma probabilidade condicional. Naturalmente ns
usamos P(A) para simplificar a notao quando a escolha do espao amostral esteja
prviamente definida. Por exemplo, de 500 peas de mquinas onde algumas esto
impropriamente montadas e outras so defeituosas como na figura 3.7, a chance de uma pea
dar errada em S = 15/500 = 3%, se reduzirmos o espao amostral para as peas mal montadas,
figura 3.13, a chance de ocorrer uma pea defeituosa 10/30 = 33%... tudo isto para explicar que
quando se tem probabilidade condicional tem-se de fazer a interseo do evento com relao ao
espao amostral e dividir pela probabilidade do espao amostral.
Regra Geral da Multiplicao:
P(A B) = P(A)*P(B\A) se P(A) 0
= P(B)*P(A\B) se P(B) 0
Regra da Multiplicao Especial: somente se A e B so independentes. Se A e B so
quaisquer dois eventos de S, ns podemos dizer que A independente de B, se e somente se,
P(A/B) = P(A) e por consequncia se A for independente de B, B ser independente de A.
P(A B) = P(A)*P(B)
Captulo 04:
Distribuio da probabilidade : A maioria dos problemas estatsticos est associada a
um nmero, ou poucos nmeros que so associados a resultados de experimentos. Na inspeo
de produtos manufaturados ns podemos nos interessar somente pelos defeitos; na anlise de
um teste rodovirio, podemos nos interessar somente pela velocidade mdia e pela mdia do
consumo de combustvel e ainda no estudo de um interruptor rotativo ns podemos estar
interessados na lubrificao, na corrente eltrica e na umidade. Todas estes nmeros esto
associados a situaes envolvendo elementos de chance, em outras palavras, eles so valores
aleatrios variveis. No estudo de valores aleatrios variveis ns geralmente nos interessamos
pela sua distribuio de probabilidade, isto , na probabilidade em que pego um valor de uma
certa extenso. Na seo 4.1 ser introduzido VA- variveis aleatrias e DP- Distribuio de
Probabilidade, na seo 4.2 sero discutidas vrias distribuies de probabilidade especiais,
bem como no 4.3, 4.7, 4.8 e 4.9 e nos tens 4.4 e 4.5 ser descrito algumas das caractersticas
mais importantes de probabilidade.
4.1 Variveis Aleatrias
Para ser mais explicito no conceito de VA vamos nos referir novamente ao exemplo das
avaliaes preferidas de um cortador de grama, exemplo da pg.48 e a probabilidade
correspondente mostrada na figura 3.8. Agora vamos supor que ns referenciamos E
1
como
fcil de operar, P
2
como barato e C
3
como baixo custo de manuteno como as avaliaes
preferidas e que ns estamos interessados somente no nmero de avaliaes preferidas que o
cortador ter. Para encontrar a probabilidade que o cortador levar 0, 1, 2 ou 3 das avaliaes
preferidas vamos nos referenciar na figura 4.1 que como a figura 3.8 exceto que tem um
indicador de resultados de avaliaes preferidas. Ou seja, para 0 nenhuma das trs condies foi
atendida, para 01 uma das condies foi atendida ... at 03 onde todas as avaliaes preferidas
foram atendidas. Somando as diversas probabilidades de nenhuma condio ser atendida,
encontramos 26%; somando as probabilidades de 01 condio ser atendida, encontramos 50%;
somando as probabilidades de 02 condies serem atendidas encontramos 22% e somando as
probabilidades para que todas condies fossem atendidas encontramos 2%. Estas informaes
podem ser resumidas na tabela da pg 93 do livro onde x representa o nmero de avaliaes
preferidas.
Os nmeros 0, 1, 2 e 3 desta tabela so valores de uma VA que o nmero de
avaliaes preferidas. Correspondente a cada resultado no espao amostral existe um e somente
um valor de x desta VA, assim vale a definio geral de variveis aleatrias: so funes
definidas sobre os elementos de um espao amostral. VA so representadas pelas letras
maisculas X e Y e assim pode-se destingui-los dos seus possveis valores, dados em casos
abaixo.
Para encontrar a probabilidade de que a VA levar qualquer valor dentre a extenso ns
procederemos como no exemplo acima. Certamente a tabela que ns obtemos mostra outra
funo chamada de distribuio da probabilidade de uma VA. Para representar os valores da
distribuio de probabilidade ns usaremos smbolos como: f(x), g(x), (y) e h(z). Estritamente
falando da funo de f(x) = P(X=x) que estabelece probabilidade para cada possvel resultado x
que chamado distribuio da probabilidade. Entretanto ns seguiremos a prtica comum de
tambm chamar de DP, com entendimento que nos referimos a funo e que a escala dos
x 0 1 2 3
Prob. 0,26 0,50 0,22 0,02
valores de x faz parte da definio. VA so normalmente classificadas pelo nmero de valores
que elas podem assumir, neste captulo, ns limitaremos sua discusso a variveis aleatrias
discretas que podem levar somente um nmero finito ou contvel nmero infinito de valores.
VAC so vistas no captulo 05. Quando possvel ns tentaremos expressar a DP pelo meio de
equaes, de outra maneira teremos de usar tabelas que realmente exibam a correspondncia
entre VA e as probabilidades associadas. Por exemplo, f(x)= 1/6 para x = 1, 2, 3, 4, 5 e 6. D a
DP quando rolamos um dado balanceado. Naturalmente nem todas as funes definidas para os
valores de uma VA podem servir como DP uma vez que os valores de uma DP so
probabilidades e os valores de uma VA devem sempre ocorrer. Se f(x) a DP: f(x) 0 para
todos os x e f(x) = 1.
Obs: Distribuio de frequncia cumulativa F(x): no caderno P(2 x 4) = F(4) F(2),
houve um exerccio que tinha-se de limitar do 5 ao 8 inclusive = F(8) F(4).
4.4 A Mdia e a Varincia de um Distribuio de Probabilidade
Alm da distribuio bi-nomial e hipergeomtrica, existem muitas outras DP que tem
aplicao na Engenharia, entretanto antes de ns irmos alm discutiremos algumas
caractersticas gerais da distribuio de probabilidade. Uma caracterstica semelhante, que da
simetria ou angularidade est ilustrada pelas figuras 4.3 e 4.4, duas outras sero apresentadas
aqui com referncia na figura 4.5 que mostra o histograma de 2 distribuies bi-nomiais. Uma
destas DB tem como parmetros n = 4 / p = e a outra n = 8 / p = . Essencialmente estas
duas DP diferem em dois aspectos: a primeira DP est centrada sobre x = 2 ao passo que a outra
est centrada em x = 8 e ns podemos dizer que as duas distribuies diferem em sua
localizao; outra distino que o segundo diagrama dispersa-se bem mais, e ns podemos
dizer que as duas distribuies variam quanto a sua variao. Para fazer tais comparaes mais
especificamente, ns introduziremos duas das mais importantes medidas estatsticas
descrevendo respectivamente a localizao e a variao da DP: a mdia e a varincia. A mdia
de uma DP simplesmente a suposio matematica de uma VA correspondente. Se a VA, X
pega os valores x
1
, x
2
, ..., x
k
com a probabilidade f(x
1
), f(x
2
), ..., f(x
k
) a suposio matematica do
valor esperado x
1
*f(x
1
)+x
2
*f(x
2
)+ ... +x
k
*f(x
k
) = (valor * probabilidade)
Mdia da Distribuio deProbabilidade Discreta: = x * f(x)
Onde a mdia representada pela letra grega (mi). A medida da mdia o centro da
distribuio de probabilidade como se fosse um centro de gravidade. Se estabelece a origem de
um sistema de massa discreto organizado sobre uma linha reta distante x da origem. Quando se
calculava CG multiplicava-se o somatrio da rea pelo x e dividia-se pelo somatrio do x, na
mdia da distribuio de probabilidade discreta a situao anloga, multiplica-se o
somatrio dos valores pela distribuio de probabilidade e s no se divide pelo somatrio da
distribuio da probabilidade porque ele igual a 1.
Para estudar a segunda das duas propriedades da DP mencionada na pg 105, sua
varincia, vamos nos referenciar de novo as duas distribuio de frequncia da figura 4.5 onde n
= 4 existe grandes probabilidades de pegar-mos valores perto da mdia, para o outro grfico
onde n = 16 existe uma grande possibilidade de pegar-mos valores consideravelmente
espalhados muito longe da mdia. Usando esta propriedade pode ser considerado razovel a
medida da variao da distribuio de probabilidade com a quantidad,. (x - ) * f(x), a saber a
quantidade mdia pelo que os valores da VA desviam da mdia. Infelizmente, o somatrio do
desvio da mdia igual a zero, assim a expresso acima sempre zero. Uma vez que ns
estamos interessados na magnitude do desvio da mdia sugere-se que calculemos valores
absolutos do desvio da mdia, isto forneceria uma medida de variao, mas no campo
puramente terico, ns preferimos ao invs disto trabalhar com o quadrado do desvio da mdia.
Estas quantidades so alm disso, no negativos e sua mdia indicativo de espalhamento da
disperso da distribuio da DP. Ns ento definimos a varincia de uma DP f(x) ou X que tem
DP, como:
Onde a letra minscula grega para S. Esta medida no est na mesma unidade ou dimenses
da VA, mas ns podemos ajustala tirando sua raz quadrada. O desvio padro definido como:
Quando ns definimos a varincia da DP, pode ter ocorrido para o leitor que a frmula
semelhante a uma da fsica que vimos para calcular segundos momentos, ou momentos de
inrcia. Certamente, costume na estatstica se definir o k-simo momento em torno da origem
como:
E o k-simo momento em torno da mdia, como:
Frmula para clculo da varincia: Ento a mdia o primeiro momento em torno da
origem, a varincia o segundo momento em torno da mdia. Momentos superiores so muitas
vezes usados na estatstica para dar mais caractersticas da DP. Por exemplo: um terceiro
momento em torno da mdia, dividido por
3
para tornar esta medida independente da escala de
medidas, usado para medir simetria ou angularidade da distribuio e um quarto momento
sobre a mdia, dividido por
4
, similarmente usado para medir o efeito sharp. Para
determinar momentos sobre a mdia usualmente mais fcil se expressar em momentos sobre a
origem e ento calcular o momento necessrio sobre a origem. Para o segundo momento sobre a
mdia ns temos a importante frmula:
que o leitor pode comprovar no exerccio 4.47 pg 117 parte b.
4.5 Teorema de Chebyshevs
( )


x
x f x ) ( .
2

( )


x
x f x ) ( .
2
2

) ( .
'
x f x
k
k

( )

) ( . x f x
k
k

2 '
2
2

Anteriormente nos mostramos que o desvio padro pode ser medido da variao da DP,
que como se controla a concentrao de probabilidade na vizinhana da mdia. Se o desvio
padro pequeno, existe uma alta probabilidade de pegar valores prximos a mdia, se o desvio
padro grande existe correspondente probabilidade de pegar valores afastados da mdia.
Formalmente esta idia expressa pelo teorema que segue: se a DP tem mdia e desvio
padro a probabilidade de pegar um valor que desvie da pelo menos k. que no mximo
igual a 1/k
2
. Simbolicamente,
Onde o primeiro termo a probabilidade associada com o conjunto de resultados para que x, o
valor da VA tenha dada DP. Assim, a probabilidade de um VA pegue um valor que desvie da
mdia pelo menos dois desvios padres e menor ou igual a , a probabilidade que f(x) desvie
da mdia pelo menos cinco desvios padres menor ou igual a 1/25 e a probabilidade que
desvie da mdia 10 desvios padres menor ou igual a 1/100. Depois feita toda uma deduo
matematica para comprovar esta frmula, o que interessa a idia, quanto mais longe o valor
estiver da mdia, menor a probabilidade que ele ocorra.
DIGERINDO:
Dos exerccios propostos at esta parte:
1- Da distribuio de frequncia e do histograma: s gerar os 50 nmeros aleatrios, dividir 5
classes entre 06 e 30 de 5 elementos e calcular a mdia pelos somatrio dos dados; a mdia
pelos pontos mdios e a frequncia das classes; o desvio padro pelo quadrado do desvio da
mdia; o desvio padro pela frmula simplificada e o desvio padro pelos pontos mdios e
frequncias de classe.
3.13 Somente demontrao das afirmaes pelo diagrama de Venn.
3.25 Escolha das diversas maneiras que se pode encontrar r em n, esperando um resultado,
nada mais do que combinao. Por exemplo, tu tens doze baterias boas e uma ruim e queres
encontrar trs baterias onde uma seja defeituosa, o n se divide em dois espaos amostrais e o r
o que tu espera de cada um deles, ou seja, de uma bateria defeituosa queremos encontrar uma e
de onze baterias defeituosas queremos encontrar duas, executamos o clculo de combinap e
multiplicamos os resultados.
3.26 Idem.
2
1
) . (
k
k x P

,
_

,
_

,
_

2
11
.
1
1
r
n
3.34 Conjunto Funo: s somar os elementos do DV para encontrar N(A), N(B),
N(C)...parte do princpio que usando estes valores e o fato de que o conjunto funo aditivo
( significa que o nmero que destinado para unio de dois sub-conjuntos que no tem
elementos em comum a soma dos nmeros dos dois sub-conjuntos individuais) permitem a
partir disto calcular qualquer outro evento de S.
3.41 Probabilidade para nmeros mutuamente excludentes: quando eventos so mutuamente
excludentes a unio de suas probabilidades a soma da probabilidade de cada um deles, o
complemento de um evento pode ser achado por 1 a probabilidade e a interseo neste caso
pode ser definida pelo diagrama de Venn.
3.45 - Probabilidade Clssica: Mesma probabilidade para todos os eventos, s dividir a
amostra pelo espao amostral, ou seja, S/n.
3.58 Probabilidade Condicional: s aplicar a frmula da probabilidade condicional, uma vez
que, os eventos so dados em funo de espaos amostrais reduzidos, por ex. a probabilidade de
A em funo de B. P(A/B)
2 Neste exerccio pede a distribuio de probabilidade e a DP acumulada no jogo de dois
dados, considerao que se joga um dado depois o outro, ou seja, 36 possibilidades e pede-se a
probabilidade dos valores somados dos dados ficarem entre 5 e 8. Moleza, primeiro traa-se os
dois grficos, depois para DP soma-se f(5)+f(6)+f(7)+f(8) e para DPA subtrai-se a F(4) da F(8)
visto que o 5 est incluido.
Captulo 05:
Densidade da Probabilidade:
Espaos amostrais contnuos e variavis aleatrias contnuas aparecem quando ns
tratamos com quantidades que so medidas numa escala contnua, por ex. quando ns medimos
a velocidade de um carro (nas VAD a gente media a velocidade mdia), o quanto de alcol
uma pessoa tem no sangue, a eficincia de um coletor solar ou a resistncia a tenso de uma
nova liga. Neste captulo aprenderemos como determinar e trabalhar com probabilidade relativa
a um espao amostral contnuo e VAC. Na seo 5.1 se introduz densidade de probabilidade,
na seo 5.2 e 5.3 se discute distribuio normal e da seo 5.4 at 5.9 vrias outras
densidades especiais de probabilidade. Problemas envolvendo mais do que 1 VAC so
discutidos na seo 5.10 e um mtodo para conferir se um conjunto de dados apresentados foi
gerado por uma distribuio normal introduzido na seo 5.11.
5.1 Variveis Aleatrias Contnuas
Quando introduzimos o conceito de varivel aleatria no cap. 4, ns a definimos como
uma funo de valores reais definido sobre um espao amostral de um experimento e a
ilustramos com a idia de que uma VA, dados os nmeros de avaliaes preferidas de uma
mquina de cortar grama ela pode ser designada por 0, 1, 2, e 3 (qualquer que se pegue ser
apropriado) para os 18 possveis resultados de um experimento. Para o caso contnuo, onde
variveis contnuas podem assumir valores na escala contnua, o procedimento muitssimo o
mesmo. Os resultados de um experimento so representados pelos pontos em um segmento de
linha ou linha e o valor da VA o nmero fixado para cada ponto atravs de regras e equaes.
Quando o valor da varivel aleatria dado diretamente pela observao, ns no nos
preocupamos em diferenciar entre o valor da VA, a medida que ns obtemos e o resultado do
experimento, todos levam ao ponto correspondente na escala real. Portanto se um experimento
consiste na fora que necessria para romper uma amostra em um teste de tenso, o resultado
fala por si mesmo, 138.4 libras o valor da varivel aletoria X com que ns estamos
preocupados. No existe necessidade, no caso, em adicionar que o espao amostral consiste em
todos positivos da escala dos reais. Em geral, ns usamos escrever P(a x b) para
probabilidade associada com os pontos no espao amostral, e para que os valores fiquem ente a
e b.
O problema em definir probabilidade em conexo com um espao amostral contnuo e
VA contnuas, que envolve algumas complicaes. Para ilustrar a natureza destas
complicaes, vamos considerar a seguinte situao: suponha que ns queiramos saber a
probabilidade que um acidente acontea em uma auto-estrada com comprimento de 200 milhas,
em alguns dados locais ou talvez em algum trecho em especial. Os resultados do experimento
podem ser melhor observados como pontos contnuos, isto , aqueles que se encontram em um
intervalo contnuo entre 0 e 200. Suponha que a probabilidade que o acidente ocorra em
qualquer intervalo do comprimento L L/200, com L medido em milhas. Note que a
designao da probabilidade est coincidindo com os axiomas da probabilidade 01 e 02, uma
vez que a probabilidade positiva e menor do que 1 e P(S) = 200/200 = 1. Naturalmente que
estamos considerando somente eventos representados pelo intervalo que toma parte do
segmento de linha entre 0 e 200. Usando o terceiro axioma ns podemos ainda obter
probabilidades de eventos que sejam representados pela unio de muitos finitos ou contveis
intervalos. Portanto, para dois intervalos de comprimento L
1
e L
2
ns temos uma probabilidade
de (L
1
+ L
2
)/200 e para infinitas sequncias de intervalos de comprimento L
1
, L
2
, L
3
... ns
temos a probabilidade de : (L
1
+L
2
+L
3
+...)/200. Note que a probabilidade que o acidente ocorra
em qualquer ponto dado zero, porque ns podemos considerar um ponto como um
intervalo de comprimento zero. Entretanto a probabilidade que um acidente acontea em um
intervalo muito curto positiva, por exemplo, para um intervalo de comprimento de 1 p a
probabilidade de 9,5x10
-07
, portanto extendendo o conceito de probabilidade para os casos
contnuos, ns podemos usar os axiomas 1, 2 e 3, mas ns temos que restringir o significado do
termo evento . Assim como algumas consideraes prticas so tomadas, a restrio no
consequncia, ns apenas no definimos probabilidades para conjuntos de pontos meio
confusos, que no possam ser expresso como unio ou interseo de muitos finitos ou contveis
intervalos.
A maneira como ns estimamos probabilidade no exemplo anterior naturalmente
muito especial e similar em sua natureza como a forma em que fixamos probabilidade iguais
para as seis faces de um dado ou para as 52 cartas de um baralho padro e assim por diante.
Para tratar o problema de probabilidade associado com VAC, geralmente, considera-se que ns
estamos interessados numa VA que levar um valor de um intervalo entre a e b, onde a e b
so constantes e a b. Supondo ainda que dividamos o intervalo entre a e b em n sub-
intervalos iguais, de largura x contendo respectivamente os pontos x
1
, x
2
, ..., x
n
e que a
probabilidade que a VA leve um valor do sub-intervalo contendo x dada por f(x
i
).x. Ento a
probabilidade que a VA com a qual estamos preocupados leve um valor do intervalo de a at b
dada por:
Agora, se f(x) uma funo integral definida para todos o valores de uma VA com que
estamos preocupados, ns podemos definir a probabilidade que o valor da VA fique entre a e b,
estimando que x 0, como:
A definio de probabilidade, no caso contnuo, pressupem a existncia de uma funo
apropriada f que, integrada de uma constante a para uma constante b corresponda a uma VA
pegar um valor entre um intervalo a e b. Note que o valor f(x) no d a probabilidade que a VA
correspondente pegue um valor de x, no caso contnuo as possibilidades so dadas pelas
integrais, no pelos valores f(x).
Para obter a probabilidade que a VA realmente pegue um dado valor x, ns podemos
primeiro deteminar a probabilidade que ela levar um valor do intervalo de x - x, x + x e
ento pegamos x0. Ou seja, quanto menor a largura (x) tendendo a zero, mais perto do
valor estar dentro do subconjunto delimitado por a e b. Se o resultado fosse sempre zero, tal que
a VAC peque qualquer valor x, no deveriam haver problemas. Certamente, esta definio de
probabilidade para caso contnuo fornece um modelo extraordinriamente bom para lidar com
medidas e observaes, devido aos limites da habilidade para medir dados experimentais nunca
vistos, vindo de um espao amostral contnuo. Portanto medidas de temperatura so
proveitosamente pensadas como pontos de uma escala contnua, qualquer medida de
temperatura realmente representa um intervalo nesta escala e se ns apresentamos uma medida
( )


n
i
x xi f b x a P
1
). (
( )


b
a
dx x f b x a P ) (
de temperatura de 74,8C, na verdade significa que ela se encontra em um intervalo de 74,75 a
74,85 C e no que est exatamente a 74,800000C. importante adicionar que quando
falamos que existe zero de probabilidade que uma VA pegue um determinado valor, no
quer dizer que impossvel, mas que por ser uma gama muito ampla de valores entre os
intervalos ns no nos interessamos por pontos isolados e sim pelo intervalo em si. Como
consequncia direta este fato podemos dizer que casos de probabilidade contnua associados
com pontos individuais so sempre zero. Podemos dizer ainda que se falamos de
probabilidade associada a um intervalo entre a e b, no quer dizer que um ou outro est includo
no intervalo: P(a x b) = P(a < x b) = P(a x < b) = P(a < x < b).
Fazendo uma analogia com o conceito funo densidade na fsica, ns chamaremos a
funes f, cuja existncia ns estipulamos extendendo a definio de probabilidade para o
caso contnuo, funo densidade da probabilidade ou simplesmente funo densidade. Uma
vez que a funo densidade integrada para fornecer o peso, funes densidade da
probabilidade so integradas para se obter densidade. Ns seguiremos a prtica comum de
chamar f(x) de funo densidade da probabilidade entendendo que nos referimos a funo f que
estabelece o valor f(x) para x,. que o valor possvel da VA X. Uma vez que a densidade da
probabilidade integrada entre qualquer duas constantes a e b, dada a probabilidade que VA
assuma um valor entre estes limites, f tem de satisfazer algumas condies: f(x) 0 para todos
os x e (ningum conseguiu resolver, da criaram tabelas) Prof.Armando
que condizem com os axiomas da probabilidade da pg 139. Note a similariedade entre estas
condies e as definidas para distribuio nas pg. 93 e 94. Como no caso discreto, nos
escrevemos como F(x) a probabilidade que uma VA com uma densidade da probabilidade f(x)
leve um valor menor ou igual a x e ns ainda referenciamos para a funo correspondente F
como a funo distribuio de uma varivel aleatria. Portanto, para qualquer valor x, F(x)
= P(X x) a rea debaixo da funo densidade da probabilidade para um intervalo de
menos infinito at x..
As medidas estatsticas que so usadas para descrever densidade da probabilidade so
muito similares as que n usamos para descrever distribuio de probabilidade. Substituindo
soma por integrais, ns definimos o k-simo momento sobre a origem como:
Difinio anloga a que ns temos na pg 111. O primeiro momento em torno da
origem novamente referenciado como mdia e representado por ; como antes ela o valor
experado da VA tendo a densidade da probabilidade f(x).

+

1 ) ( dx x f


dx x f x
k
k
) ( .
'


dx x f x ) ( .
Em particular, o segundo momento em torno da mdia novamente referenciado como
varincia e escrito como
2
, como antes, ela mede o espalhamento da densidade da
probabilidade, no sentido de dar o valor esperado do desvio da mdia ao quadrado.
Alm disso, novamente referenciado como o desvio padro.
5.2 Distribuio Normal (Assinttica = s chega a 0 quando atingir o )
Entre as densidades da probabilidade especiais, ns estudaremos neste captulo a
densidade da probabilidade normal, usualmente denominada simplesmente distribuio
normal, que a mais importante. Ela foi estudada primeiramene no sculo XVIII quando os
cientistas descobriram um surpreendente grau de regulariedade entre os erros de medio. Eles
observaram que os modelos de distribuio estavam muito prximos de uma distribuio
contnua que eles referenciavam como curva normal de erros e atribuam as leis da chance. A
equao da curva da densidade da probabilidade normal, cujo grfico (em forma da seo
transversal de um sino) mostrado na figura 5.2 :
E nos exerccios 5.42 e 5.43 da pg 153 o leitor poder verificar que os parmetros e
so, de fato, a mdia e o desvio padro.
Uma vez que a densidade da probabilidade normal no pode ser integrada de uma forma
definida entre pares de limite a e b, probabilidades relativas a distribuio normal so
usualmente obtidas de tabelas especiais, como a tabela 03 no final do livro. Esta tabela diz
respeito a distribuio normal padro, isto , a distribuio normal com = 0 e = 1, e seus
valores vem de:
Para z = 0.00, 0.01, 0.02, ..., 3.49 e tambm z = 4.00, z = 5.00 e z = 6.00 ( a variao do x na
tabela vai de 0,00 at 6,00). Para encontrar a probabilidade que uma VA tenha uma distribuio
normal, ns teremos de pegar um valor entre a e b, e usarmos a equao P(a < Z < b) =
F(b) F(a) e se a ou b so negativos, ns tambm faremos uso da identificao F(-z) = 1 F(z),
que o leitor poder verificar no exerccio 5.41 na pg. 153.
( )



2 2
2
2
) ( ) ( dx x f x dx x f x
( )
( ) ( )
2 2
2 / 2
2
1
, ;

x
e x f
2 /
2
.
2
1
) (
z
e z F

5.5 Distribuio Uniforme


A distribuio uniforme, com os parmetro e , tem a funo densidade da
probabilidade:
Cujo grfico est mostrado na figura 5.4. Note que todos os valores de x, de para so
igualmente provveis no sentido que a probabilidae de x encontrar-se em um intervalo de
largura x inteiramente contido no intervalo de para igual a x/(-), sem considerar a
localizao exata do intervalo.
Para ilustrar como uma situao fsica pode ocasionar uma distribuio uniforme,
suponha que a roda de uma locomotiva tenha raio r e que x a localizao de um ponto na
circunferncia medida ao longo da circunferncia de um ponto de origem 0. Quando o freio for
acionado, alguns pontos deslizaro em contato com o trilho, e o pior desgaste ocorrer nestes
pontos. Para repetidas aplicaes dos freios, seria razovel admitir que x o valor de uma VA
tendo distribuio uniforme com = 0 e = 2r. Se esta suposio for incorreta, ou seja, se um
conjunto de pontos na roda fizerem contato com mais frequncia que outros,a roda
eventualmente exibir lugares achatados ou o lado de fora da roda desgastado.
Para determinar a mdia e a varincia de uma distribuio uniforme, ns primeiro
avaliaremos as duas integrais:
e

'

< <

) (
1
/ 0
) (


x
ies outrascond p
x f
2
1
.

dx x
3
1
.
2 2
2 '
2

+ +

dx x
Portanto,
Algumas consideraes: (DIGERINDO)
P(X=x) = 0, quer dizer que quando se considera pontos em VAC, o valor da
probabilidade to pequeno que pode ser considerado igual a zerto.
No caso contnuo as possibilidades so dadas por integrais, no por valores f(x).
P(a x b) no quer dizer que a ou b estejam includos no intervalo, podem
estar como no estar. = P(a < x b) = P(a x < b) = P(a < x < b).
Em um grafico normalisado f(x) de a at b, a rea debaixo do grfico at a
representa a probabilidade de f(a), depois a rea debaixo do grfico at b representa
a probabilidade de f(b).
Em um grfico F(x) = P(X<x), quanto maior for o valor x, maior a probabilidade
que a VA seja menor do que este valor, por isto a funo probabilidade acumulada.
Quando tu quiseres que a probabilidade fique dentro de um intervalo em uma
curva normalisada (4,00 < x < 5,00), determina o maior valor como b e o menor
como a e calcule z para os dois, do z entra-se na tabela 03 e acha-se o valor
correspondente a distribuio da probabilidade F(x) e s subtrair um do outro. Se
der valores negativos em z , tem que fazer 1 F(z).
Quando tu queres a probabilidade de um nmero ser maior ou igual a x, s
lembrar que tu queres o que falta de 1 (100%) e achar F(z) e subtrair de 1.
No exerccio do caf, no tem como encontrar z para F(z)=0,02, ento tu subtrai
F(z) de 1 e atribui ao valor encontrado de z sinal negativo. Depois s substituir na
frmula de z e encontrar a mdia.
5.10 Distribuio Conjunta (Probabilidade Conjunta)
Muitas vezes experimentos so conduzidos onde duas VA so analisadas
simultanemente, de maneira a determinar no somente o comportamento individual delas, mas
tambm o grau de relacionamento entre elas.
Para duas VAD X
1
e X
2
, ns escrevemos a probabilidade que X
1
levar o valor x
1
e que
X
2
levar o valor de x
2
como P(X
1
=x
1
, X
2
=x
2
). Consequentemente a probabilidade da
interseo dos eventos. Se tiver que ocorrer um, na verdade deve ocorrer o outro, visto que,
numa interseo ambos devem estar contidos. A distribuio de probabilidade especificada
listando as possibilidades associadas com todos pares de valores possveis de x
1
e x
2
, ou pela
frmula ou na tabela. Nos referenciamos para funo F(x
1
,x
2
) = P(X
1
=x
1
, X
2
=x
2
) e os valores
possveis correspondentes (x
1
e x
2
) como a distribuio da probabilidade conjunta de X
1
e X
2
.
2

( )
2
2
12
1

Probabilidade Marginal: As probabilidades conjuntas so as intersees entre os
valores de probabilidade de x
1
e x
2
das variveis X
1
e X
2
e a probabilidade marginal
somatrio em x
1
e x
2
das probabilidades conjuntas. Notamos que a distribuio de
probabilidade de f
1
(x
1
) de X
1
, dada pelo somatrio das interseces de x
1
com cada x
2
.
Probabilidade Condicional: f(x
1
,x
2
)/f
2
(x
2
) se f
2
(x
2
) for diferente de zero (Divide-se a
probabilidade conjunta da interseo (x
1
,x
2
), pela probabilidade marginal de x
2
). Se
f
12
(x
1
/x
2
)=f
1
(x
1
) para todos x
1
e x
2
, a distribuio de probabilidade condicional livre de x
2
(se a
probabilidade condicional for igual a probabilidade marginal f
1
(x
1
), x
2
no interfere no
resultado), que igual a f(x
1
,x
2
) = f
1
(x
1
).f
2
(x
2
) e as duas variveis aleatrias so independentes.
Que igual a comparar o valor da probabilidade conjunta, com a multiplicao das
probabilidades marginais, se forem iguais as variveis so independentes, onde se entende que
uma no influi no comportamento da outra . Ler somente a parte em itlico.

Variveis Contnuas:
Existem muitas situaes em que ns descrevemos resultados pelos valores dados de
muitas VAC. Por exemplo, ns podemos medir o peso e a dureza de uma pedra, o volume,
presso e temperatura de um gs, ou a espessura, cor, compressibilidade e contedo de potssio
de um vidro. Se X
1
, X
2
, ..., X
k
so k VA, ns nos referimos para f(x
1
,x
2
,..., x
k
) como a
densidade de probabilidade conjunta destas VA, se a probabilidade que a
1
X
1
b
1
, a
2
X
2
b
2
, ... a
k
X
k
b
k
, como dado na integral de multiplicao: (continuamos nos referindo a
uma interseo, mas agora em vez de cruzar-mos os valores de uma tabela, encontra-mos a
probabilidade integrando a partir de um intervalo definido e como trata-se de valores
contnuos a probabilidade conjunta passa a ser denominada densidade de probabilidade
conjunta).
Portanto, nem todas funes f(x
1
, ..., x
k
) podem ser consideradas densidade da
probabilidade conjunta, mas se, f(x
1
, x
2
, ..., x
k
) 0 e a integral acima de infinito at + infinito
de resultado igual a um, os axiomas da probabilidade foram satisfeitos. Para extender o
conceito para funo distribuio acumulada para o caso k-varivel, ns escrevemos como F(x
1
,
x
2
, ..., x
k
) a probabilidade que a primeira VA pegue um valor menor ou igual a x
1
, que a
Segunda VA pegue um valor menor ou igual a x
2
... e que a k-sima VA pegue um valor menor
ou igual a x
k
, e nos referimos a funo correspondente F como a funo ditribuio conjunta
de k variveis aleatrias. Neste delimitamos intervalos e integramos no mesmo sentido das
intersees x
1
e x
2
. (agora em vez de acharmos a probabilidade que X
1
leve um valor x
1
, X
2
leve um valor x
2
, ..., X
k
leve um valor x
k
, estamos encontrando a probabilidade que X
1
pegue um
valor menor ou igual a x
1
e da por diante e chamando esta propriedade de funo
distribuio conjunta). Para duas variveis contnuas no faz sentido estimar uma sem levar
em conta a outra.


2
...
2 1 1 1 1 1
) , ( ) (
x todos
x x f x f x X P

k
k
b
a
k k
b
a
b
a
dx dx dx x x x f ... ) ,..., , ( ...
2 1 2 1
1
1
2
2
Densidade de probabilidade marginal: Dados a densidade da probabilidade conjunta
de k-simo VA, a densidade probabilidade de i-nsimos VA pode ser obtida da integrao de
outras variveis

k i i k
dx dx dx x x x f xi fi ... ... ) ,..., , ( ... ) (
1 1 2 1
e neste contexto, a funo fi, chamada de densidade marginal de i-nsima VA.
Integrando somente algumas de k VA, ns podemos similarmente definir Densidade marginal
conjunta de qualquer duas, trs, ou mais de k VA. Para uma varivel marginal estabelece-se a
probabilidade para uma das VA aleatrias sem interessar a outra visto que se est integrando
todo intervalo de menos infinito at mais infinito desta varivel. Tirando isto s lembrar as
formlas. Quando tem-se uma varivel contnua e dois limites, a probabilidade uma rea
embaixo de uma curva, e quando tem-se duas variveis contnuas delimitada por dois limites,
tem-se um volume embaixo de uma curva.
Variveis Aleatrias Independentes: Para explicar o que significa independncia de
VAC, ns podemos proceder como na seo 3.6 e definir densidade condicional primeiro;
entretanto, ser mais fcil falar que: k variveis aleatria so independentes se e somente se
F(x
1
, x
2
, ..., x
k
)=F
1
(x
1
).F
2
(x
2
).F
k
(x
K
) para todos os valores desta VA para que as funes
esto definidas. (ou seja, a varivel contnua s independente se a sua funo distribuio
conjunta for igual a multiplicao das funes distribuio individuais) Na notao, F(x
1
,
x
2
, ..., x
k
) , como antes, um valor da funo distribuio conjunta de k variveis aleatria, ao
mesmo tempo que, Fi(xi), para i= 1,2,3, ...,k so os correspondentes valores da funo
distribuio individual da respectiva varivel alatria. As mesmas condies se aplicam para
VAD.
Densidade da probabilidade condicional: Dados duas variveis contnuas X
1
e X
2
,
ns podemos definir a densidade da probabilidade condicional do primeiro dado, sendo que o
segundo assuma um valor x
2
como:
Onde f(x
1
,x
2
) e f
2
(x
2
) so, como antes, a densidade conjunta de duas VA e a densidade da
Segunda. Note que esta definio paralela a feita para probabilidade condicional na pg. 71.
( )
( )
) (
,
/
2 2
2 1
2 1 1
x f
x x f
x x f
Propriedades de Esperana: (Valor esperado, esperana ou valor mdio!!! + ou o valor do
meio, central)
Considerando uma funo g(X) de uma VA nica X. Por exemplo, se X a temperatura
de um forno em graus centgrados, ento g(X) = 9/5 X + 32, a mesma temperatura em graus
Farenheit. Se X tem funo densidade da probabilidade f, ento significa que o valor esperado
de g(x) dado por: (valor esperado de uma funo de uma varivel aleatria dado por:)
(onde E o valor esperado) No caso discreto, onde X tem distribuio de probabilidade f.
Onde xi o valor possvel para X.
a) g(x)=x. assim o valor esperado o somatrio de x.f(x) que corresponde a mdia de x
E(x) =
x
.
b) Ento se assumirmos que g(x) = (x - )
2
, teremos o somatrio de (x - )
2
.f(x) que representa

2
x
que a varincia de X.
Para qualquer VA Y, peguemos E(Y) representando um valor experado, que tambm
y
.
Sua varincia Var(Y) que tambm escrita como
2
Y
. Quando g(x) = ax + b, para dadas
constantes a e b, a varivel aleatria g(X) tem valor esperado resumido pelas frmulas:
E(aX+b) = aE(X)+b e Var(aX+b) = a
2
Var(X)
Dadas qualquer coleo de k variveis aleatrias, a funo Y = g(X
1
, X
2
, ..., X
k
) tambm
uma VA. Exemplos, Y = X
1
-X
2
, quando g(x
1
,x
2
)=x
1
-x
2
, e Y=2X
1
+3X
2
quando g(x
1
, x
2
)=2x
1
+3x
2
.
A VA g(X
1
, X
2
, ..., X
k
) tem valor esperado ou mdia dada:

Ou em casos discretos:
pelo somatrio de cada valor de g(x) multiplicado pela sua distribuio no caso
discreto ou pela integral de cada valor g(x) multiplicado pela sua densidade de distribuio no
caso contnuo.
Vrias importantes propriedades de valor esperado podem ser deduzidas desta
definio. Pegando g(x
1
,x
2
) = (x
1
-
1
).(x
2
-
2
), veremos que o produto ser positivo se ambos os


dx x f x g X g E ) ( ) ( )] ( [
) ( ). ( )] ( [
i
x
i
x f x g X g E
i


k k k
dx dx x x x f x x x g ... ) ,..., , ( ) ..., , (
1 2 1 , 2 1

1 2
) ,..., , ( ) ,..., , ( ...
2 1 2 1
x x x
k k
k
x x x f x x x g
valores estiverem acima ou abaixo de sua mdia. De outra maneira ele ser negativo. O valor
esperado E[(x
1
-
1
).(x
2
-
2
)] tender a ser positivo quando, grandes X
1
e X
2
tenderem a ocorrer
juntos e pequenos X
1
e X
2
tenderem a ocorrer juntos, com alta probabilidade. Esta medida de
variao conjunta da populao chamada covarincia de X
1
e X
2
. Se X
1
e X
2
so
independentes ento f(x
1
,x
2
) = f
1
(x
1
).f
2
(x
2
), como antes, se ambas variveis so independentes,
s multiplicar sua distribuio individual, o que resulta numa covarincia zero que pode ser
afirmada por: Quando X
1
e X
2
so independentes sua covarincia
E[(x
1
-
1
).(x
2
-
2
)] = 0. At aqui o livro fala em qualquer varivel aleatria!!!!
Alm disso a esperana de uma combinao linear, combinar duas funes e achar uma
terceira garantindo a superposio entre as duas, de duas variveis aleatrias Y=a
1
X
1
+a
2
X
2
:
= a
1
E(x
1
)+a
2
E(x
2
) Este resultado contm um par de VA no independentes. Tambm Var(Y):
= a
1
2
Var(X
1
)+a
2
2
Var(X
2
) Estas propriedades contm qualquer nmero de VA sejam elas
discretas ou contnuas.
Peguemos X, tendo mdia e varincia
i
2
para i=1, 2, ..., k, a combinao linear
Y=a
1
X
1
+a
2
X
2
+...+a
k
X
k
tem E(a
1
X
1
+a
2
X
2
+...+a
k
X
k
)= a
1
+E(X
1
)+a
2
E(X
2
)+...+a
k
E(X
k
) e,
Quando as VA so independentes.
Var(a
1
X
1
+a
2
X
2
+...+a
k
X
k
)=a
1
2
Var(X
1
)+a
2
2
Var(X
2
)+...+a
k
2
Var(X
k
) e,
Nesta parte o livro fala que a frmula da mdia serve para os dois tipos de variveis e
que a frmula da varincia serve para variveis independentes!!!!
AGORA FOI DADA UMA MATRIA QUE NO TEM NA APOSTILA E DEPOIS VOLTOU-SE
PARA A SEQUNCIA NORMAL ( HOUVE UMA FUGA DA NORMALIDADE)!!!
Z = X
1
+X
2
Y = X
1
-X
2
Mdia: Para qualquer tipo de variveis

Z
=
x1
+
x2

Y
=
x1
-
x2
Varincia : Para variveis independentes

z
2
=
x1
2
+
x2
2

Y
2
=
x1
2
+
x2
2
Obs: No problema de gerao de 30 nmeros aleatrios, no primeiro caso os nmeros
variavam de 10 a 30 e no segundo caso de 17 a +17, por consequncia o deve ser maior
visto que houve um espalhamento do primeiro para o segundo caso, ou seja, aumentou a
distncia entre os extremos. Isto aconteceu porque os dados eram independentes.
Caso Particular:

k
i
i i y
a
1

k
i
i i
a
Y
1
2 2 2

2
2
2
1 x x z
+
2
2
2
1 x x Y
+
X
1
, X
2
, ..., X
k
so variveis independentes. Todos com
x1
=
x2
=...=
xk
= e
x1
2
=
x2
2
=...=
xk
2
=
2
.
Seja a nova VA:
Onde :
a mdia da mdia, ou seja, a mdia da populao.
Conseguimos reduzir o desvio padro da mdia pagando o preo de ter mais dados.
Exemplo:
Medir a massa de um mesmo objeto vrias vezes numa balana. Teremos vrias
medidas, devido ao erro da balana. Suponhamos 16 medies:
Mdia das 16 medies
Desvio Padro da mdia = Desvio padro/(raz de 16) =
x
/4, quer dizer que a curva da
distribuio normal vai afinar bastante utilizando a mdia das mdias e o desvio da mdia.
Temos 16 medies, cada um dos conjuntos de medies tem uma mdia, logo teremos 16



+ + +
+ + +
+ + +
+ + +
+ + +
k
k
k k k
X E
k
X E
k
X E
k
X
k
X
k
X
k
E x E
X
k
X
k
X
k
x
X X X
k
x
k
k
k
K
)
1
...
1 1
(
) (
1
... ) (
1
) (
1
)
1
...
1 1
( ) (
1
...
1 1
) ... (
1
2 1
2 1
~
2 1
~
2 1
~

~
x
k k
k k
k
k k k
X Var
k
X Var
k
X Var
k
X
k
X
k
X
k
Var x Var
x
k
k




+ + +
+ + +
+ + +
2
2
2
2
2
2
2
2
2
2
2 2 2 1 2
2 1
~
~
1
...
1 1
) (
1
... ) (
1
) (
1
)
1
...
1 1
( ) (
mdias. Sabe-se ainda que a mdia das mdias (logo a mdia das 16 mdias) varia menos do
que a mdia ( no caso de um conjunto s de medies, sua mdia varia menos do que os
valores) na proporo:
O desvio padro da mdia varia menos que o desvio padro de cada elemento.
Outro Exemplo:
Se utilizarmos sete dados a mdia destes valores ter um desvio padro menor do que
dois.
Covarincia e Correlao:
Covarincia de uma funo de duas variveis aleatrias:
Caso Particular: Covarincia entre X
1
e X
2
Cov(X
1
,X
2
) = E[(X
1
-
x1
).(X
2
-
x2
)]
= E(X
1
.X
2
)-(
x1
.
x2
)
=
x1
,
x2
Uma folha cortada ao meio: la(comp. da primeira folha) + lb (comp. da Segunda folha
resultante) = ctes = equao de uma reta inclinada. Cov(X
a
,X
b
)<0 Se uma aumenta a outra
diminui, inversamente proporcionais.
Duas folhas cortadas de uma vez e defasadas: cov(X
a
, X
b
)>0 Se uma aumenta a outra
tambm aumenta, diretamente proporcionais.
Independentes: no assumem a equao de uma reta, nem decrescente, nem crescente
(respectivamente) so representados por um amontoados de pontos sem conexo.
Coeficiente de Correlao:
k
x


~
7 7 , 6 5 , 2
5 , 2 20 / 50
50
20
20 , 50
2


n
n
k
x

{

'


R
R
VAC dx dx x x f x x h X X h E
VAD x x f x x h X X h E
2 1 2 1 12 2 1 2 1
2 1 12 2 1 2 1
) , ( ) , ( )] , ( [
) , ( ) , ( )] , ( [
2 1
2 1
2 1
2 1
2 1
.
,
) ( ). (
) , cov(
,
x x
x x
X Var X Var
x x
x x


Em outras palavras a medida da variao conjunta da populao dada pela
covarincia dividida pela multiplicao entre os desvios padres.
VA Independentes:
x1
,
x2
=0 No existe relao entre a coordenada e a abcissa.

x1
,
x2
=1 A relao entre os dois eixos uma reta linear.

x1
,
x2
=0,6 A relao entre os dois eixos um feixe tendendo a uma reta
linear.
Antes tnhamos uma frmula para mdia atravs dos valores esperados para VA
dependente e independentes e uma frmula da varincia somente para valores independentes,
agora calculada a covarincia podemos calcular a frmula da varincia para VA
dependentes:
Exemplo: Var(X
1
+X
2
)
Var(X
1
)+Var(X
2
)+2.1.1.cov(X
1
,X
2
)
Var(X
1
)+Var(X
2
)+2.
x1
,
x2

x1
,
x2
=
x1
.
x2
.
x1
,
x2

x1+x2
2
=
x1
2
+
x2
2
+2
x1
.
x2
.
x1,x2

Casos Particulares:
(a)
x1
,
x2
=0

x1, x2
2
=
x1
2
+
x2
2
(Traduzindo quer dizer que como no tem co-relao nenhuma, podemos
considera-los independentes e soma-los.)
(b)
x1,x2
=1

x1, x2
2
=
x1
2
+
x2
2
+2
x1
.
x2

x1+x2
2
=(
x1
+
x2
)
2
(Significa que a co-relao a de uma reta linear perfeita, ento tem-se
de aplicar a frmula da varincia e considerar a covarincia.)
5.11 Verificando a normalidade dos dados
Em muitos instantes de um experimento precisa-se verificar se um conjunto de dados
teve origem de uma VA distribuda normalmente. Como indicado anteriormente na figura 2.8 a
distribuio normal pode servir de modelo de variao em algumas quantidades. Alm disso,
usualmente, so utilizados procedimentos estatsticos, que ns descreveremos em captulos
posteriores, que requerem que a distribuio da probabilidade seja quase normal.
Embora eles envolvam um elemento de julgamento subjetivo, procedimentos grficos
so os mais prestativos para detectar srios desvios da normalidade. Histogramas podem ser
verificados atravs da falta de simetria. Uma longa cauda certamente contradiz a suposio de
uma distribuio normal. Entretanto outro grfico especial, chamado Escores Normais,
mesmo mais efetiva em detectar desvios da normalidade. Para introduzir tal configurao, ns
consideraremos uma amostra de tamanho igual a 4. Na prtica, seriam preciso de 15 20
observaes para avaliar se o comportamento est de acordo com a normalidade.
O termo escores normais refere-se a uma amostra idealizada de uma distribuio
normal. Ela consiste de valores de z que dividem o eixo em intervalos de probabilidades iguais.
Para uma amostra de tamanho igual a 4, os escores normais so: (conjunto de n valores que

<
+ + + +
+ + +
j i
k
j
i i j i k k
k k
j x a a X Var a X Var a X Var a
X a X a X a Var
2
2
2
2
2 1
2
1
2 2 1 1
) . cov( . . 2 ) ( ... ) ( . ) ( .
) ... (
dividem a distribuio normal, idealizado em n+1 fatias com igual probabilidade e
organizados em ordem crescente)
m
1
= -z
0,20
= -0,84
m
2
= -z
0,40
= -0,25
m
3
= z
0,40
= 0,25
m
4
= z
0,20
= 0,84
e isto est ilustrado na figura 5.11.
Para construir um escore-normal :
1. Ordena-se os dados do menor ao maior.(De forma crescente)
2. Obtem-se os escores normais. (Obtem-se os escores normais sendo n o nmeros de dados
experimentais)
3. Represente o i-simo valor experimental versus o i-simo escore normal.
4. Se o grfico se aproximar de uma reta possui distribuio prxima da normal.
Exemplo:
67,48,76,81
1- 48,67,76,81
2- n = 4
3- 0,20 0,40 0,60 0,80
-0,84/ -0,25 / 0,25 / 0,84
4- x y
-0,84 48
-0,25 67
+0,25 76
+0,84 81 Na escala d quase uma reta!!!
Quem nunca volta atrs na vida, ama mais a si mesmo do que a verdade...
Exerccios: 5.89 5.90 5.91 Quando se opera com valor esperado s substituir o valor
esperado da varivel aleatria pela sua mdia e pode-se fazer qualquer tipo de operao.
Quando se lida com varincia esperada, s substituir pela varincia, mas somente pode-se
somar e constantes isoladas no entram no clculo.
0 rnd 1, distribuio uniforme.

Usando o excell verificar se a funo acima gera dados segundo uma distribuio
normal. = massa em kg e =1/10 da idade.
6. Distribuio da Amostra
Na maioria, os mtodos estatsticos que veremos neste livro, estaro assumindo que
estamos tratando com um tipo especial de amostra, chamada de amostra aleatria. Esta ateno
para variveis aleatrias, que ns discutiremos no captulo 6.1, se d devido a sua validade
( ) rnd rnd NORM . 2 cos ). ln( . 2 ) , ( +
permanente ou lgica, generalizada da amostra dos dados. Ento , do captulo 6.2 ao 6.4 ns
veremos como certas estatsticas (ou seja, certas quantidades determinada da amostra) podem
ser esperadas de amostra para amostra. O conceito de distribuio amostral, a distribuio
estatstica calculada com base na VA bsica para toda inferncia estatstica.
6.1 Populao x Amostra
O uso do termo populao em estatstica vem dos dias em que ela era utilizada somente
para fenmenos sociolgicos e econmicos. Hoje, ela aplicada para conjuntos ou colees de
objetos, reais ou conceituais, e principalmente para conjunto de nmeros, medidas ou
observaes. Por exemplo, se estamos interessados em determinar o nmero mdio de
televises em casas de famlia no Brasil, a totalidade destas figuras, uma por casa de famlia,
constitui a populao para este estudo. Similarmente, a populao de que inspetores tiraram
uma amostra para determinar algumas caractersticas de qualidade de um produto manufaturado
pode ser a medida correspondente para todas unidades do lote pego; dependendo dos objetivos
da inspeo, ela tambm pode corresponder a medida para todas unidades que podem ser
concebidas de uma manufatura.
Em alguns casos, como no caso acima onde se determinava o nmero de televises em
casas de famlia, a populao finita; e em outros casos, tal como a determinao de algumas
caractersticas de todas unidades do passado, presente e futuro, que podem ser concebidas pela
manufatura atravs de um dado processo, conveniente pensar na populao como infinita.
Similarmente, ns olhamos os resultados obtidos como uma srie de cara-ou-coroa com uma
moeda, que hipotticamente tem populao finita consistindo em todas possveis faces da
moeda.
Populao muitas vezes discrita pela distribuio de seus valores, e prtica comum
referenciar populao em termos de distribuio. (Para populaes finitas, ns estamos nos
referindo aqui a distribuio real dos valores; para uma populao infinita ns estamos nos
referindo a correspondente probabilidade de distribuio da densidade da probabilidade) Por
exemplo: ns podemos nos referir ao nmero de cara-ou-coroa de uma moeda como uma
populao binomial ou para certas medidas como uma populao normal. Daqui por diante,
quando nos referimos a populao f(x) ns estaremos falanda de uma populao descrita pela
distribuio de frequncia, a distribuio da probabilidade ou como densidade f(x).
Se a populao infinita impossvel observarmos todos seus valores e mesmo que ela
seja finita pode ser impraticvel ou anti-econmico observar sua totalidade. Assim necessrio,
usualmente, utilizarmos uma amostra, parte da populao e deduzir destes resultados para
totalidade da populao. Estes resultados somente podero ser utilizados se de alguma forma
eles forem representativos da populao. Se forem absurdos, por exemplo, estabelecer
resultados generalizados sobre as famlias que moravam no Brasil em 1994, a partir de dados
pertinentes a quem morava somente szinho. Similarmente, ns podemos fazer apenas
razoveis generalizaes sobre a performance de um pneu se ele foi testado somente em
rodovias lisas. Para asegurar que a amostra representativa da populao onde foi obtida e
fornecer uma estrutura para aplicao da teoria da probabilidade para problemas de amostras,
ns limitaremos sua discusso a VA. Para amostra de uma populao finita define-se que:
Amostra aleatria ( Populao Finita)
Um conjunto de observaes x
1
, x
2
, ..., x
n
constituem uma amostra aleatria de tamanho
N de uma populao finita, se elas so escolhidas de maneira que cada subconjunto de n de N
elementos da populao tem a mesma probabilidade de ser selecionado.
Note que esta definio de aleatoriedade pertence essencialmente para a maneira em que
as amostras aleatrias so selecionadas. Isto vale tambm para seguinte definio de uma
amostra aleatria de uma populao infinita:
Amostra aleatria ( Populao Infinita)
Um conjunto de observaes x
1
, x
2
, ..., x
n
constituem uma amostra aleatria de tamanho
n de uma populao infinita f(x)se:
1. Cada x, o valor de uma varivel aleatria cuja distribuio dada por f(x)
2. Estas n variveis aleatrias so independentes.
Ns tambm aplicamos o termo amostra aleatria para as variveis aleatrias X
1
, X
2
, ,X
n
.
6.2 Distribuio da Mdia das amostras ( Conhecido)
Suponha que uma amostra aleatria de n observaes, tenha sido pega de alguma
populao e que a mdia tenha sido calculada, digamos, para estimar a mdia da populao.
Isto ficaria mais claro se pegssemos uma segunda amostra de tamanho n desta populao, seria
absurdo esperar um valor idntico para mdia da amostra, e se nos pegssemos vrias outras
amostras, provavelmente no encontraramos duas mdias exatamente iguais. Estas diferenas
so geralmente atribudas ao acaso. Para demonstrar esta questo experimentalmente, suponha
que 50 amostras aleatrias de tamanho n = 10 so pegas da populao tendo uma distribuio
discreta uniforme. f(x) = 1/10 para x = 0, 1, 2, ..., 9 e f(x)=0 de outra forma. Retirando amostras
de uma populao infinita. Uma forma conveniente de obter estas amostras atravs de uma
tabela de digitos aleatrios, como a tabela 07, pegando cada amostra consistindo de 10
consecutivos digitos arbitrariamente escolhidos das linhas ou colunas. Procedendo desta forma,
ns retiramos 50 amostras cuja as mdias so:
4,4 3,2 5,0 3,5 4,1 4,4 3,6 6,5 5,3 4,4
3,1 5,3 3,8 4,3 3,3 5,0 4,9 4,8 3,1 5,3
3,0 3,0 4,6 5,8 4,6 4,0 3,7 5,2 3,7 3,8
5,3 5,5 4,8 6,4 4,9 6,5 3,5 4,5 4,9 5,3
3,6 2,7 4,0 5,0 2,6 4,2 4,4 5,6 4,7 4,3
Agrupando estas mdias em classes 2,0-3,9 / 30,-3,9 / ... / 6,0-6.9 ns teremos:
Mdia Frequncia
2.0-2.9 2
3.0-3.9 14
4.0-4.9 19
5.0-5.9 12
6.0-6.9 3
50
E fica aparente que a distribuio fica bem como mostrado no histograma da figura 6.1, que a
distribuio das mdias com justia em forma de sino, e at mesmo que a populao tem
uma distribuio uniforme. Esta melhora na variabilidade tpica do que podemos esperar: ou
seja, se pegarmos distribuies similares e se repetirmos o experimento consecutivamente?
Para perguntar este tipo de questo, nos devemos investigar a mdia da distribuio
terica das amostras que para dado exemplo, forneceu-nos a probabilidade da mdia estar entre
2.0-2.9, 3.0-3.9...6.0-6.9, e talvez ser menor do que 2.0 ou maior do que 6.9. Embora ns
possamos avaliar estas probabilidade para o exemplo em particular, usualmente suficiente nos
referirmos a alguns teoremas gerais determinando distribuies amostrais. O primeiro destes
dado para mdia das mdias e para varincia das mdias da distribuio amostral da mdia.
Teorema 6.1: Se uma amostra aleatria de tamanho n pega de uma populao tendo a mdia
e a varincia
2
, ento:
Onde X~ a VA cuja distribuio tem mdia ; a primeira frmula para varincia definida
para amostras de populaes infinitas e a segunda frmula da varincia definida para
amostras de populao finita de tamanho N.
O resultado para populaes infinitas foi estabelecido no ex. pgina 179, usando as
propriedades de expanso. No livro, Johnson, existe uma deduo matemtica para provar que a
mdia das mdias igual a mdia da distribuio , para o caso contnuo atravs de integrais,
mas se quisermos adequar para o caso discreto s trocar as integrais por somatrios. Depois o
livro demonstra que a varincia da mdia igual a varincia da distribuio dividida pelo
tamanho da amostra e o caso de amostras de populao finita no comprovado, mas
acrescido um fator bem prximo de 1, chamado de fator de correo da populao finita, que
em muitos casos prticos pode ser omitido, a menos que a amostra represente uma poro
substancial da populao.
O teorema 6.1 fornece somente uma informao parcial sobre a distribuio terica da
mdia da amostra. Em geral, impossvel de se determinar exatamente a distribuio sem
conhecer a forma real da populao, mas possvel encontrar os limites da distribuio com
n de uma varivel aleatria cujos valores so intimamente relacionados com a mdia da
amostra, assumindo somente que a populao tem varincia finita. A VA que nos referimos
aqui a mdia da amostra padronizada (Z) cujo os valores so encontrados pegando a
diferena entre a mdia da amostra e da populao e dividindo-a pelo desvio padro da mdia.
Com referencia a esta VA podemos agora determinar o seguinte teorema, chamado de teorema
do limite central:
Teorema 6.2: Se X~ a mdia de uma amostra aleatria de tamanho n pega de uma populao
com mdia e varincia finita
2
, ento:
1
.
2
2
2
2
~
~
~

N
n N
n
n
X
X
X


n
X
Z
/
~

a VA (Mdia da amostra padronizada) cuja funo distribuio aproxima-se da


distribuio normal padro com n. Existe uma figura chamada figura 6.2 que ilustra a
tendncia a normalidade de uma curva de uma VA ~X, conforme o nmero de dados que so
usados na amostra. Com um dado o comportamento de uma curva ou uma reta, com dois
dados j esboa uma curva ou um tringulo, com seis dados o comportamento da curva bem
semelhante ao de uma curva normal padronizada e com 25 dados, a curva uma curva
normal.
O teorema do limite central fornece uma distribuio normal que nos permite fixar
probabilidades para intervalos de valores para mdia da amostra. Sem levar em considerao a
forma da distribuio da populao, a distribuio das mdias das amostras aproximadamente
normal com mdia e varincia
2
/n sempre que n grande. Esta tendncia em direo a
normalidade demonstrada na figura 6.2 para uma distribuio da populao uniforme e uma
distribuio da populao exponencial.
Embora demonstrar o teorema do limite central seja o principal objetivo deste texto, ns
podemos obter verificas experimentais da construo de escores normais representando 50
mdias da amostra na pgina 199, que foram obtidos da amostragem com recolocao de uma
populao discreta uniforme (Figura 6.3). Como pode ser visto, os pontos alinham-se prximos
a uma linha e v-se que mesmo para n = 10 a distribuio da amostragem da mdia para este
exemplo seguinte segue completamente o modelo de uma distribuio normal.
Na prtica, a distribuio normal fornece uma excelente aproximao para distribuio
de amostras da mdia para n to pequeno quanto 25 a 30, dificilmente com alguma restrio a
forma da populao. Como ns vimos em seu exemplo, a distribuio da amostragem da mdia
tem como forma geral a de uma distribuio normal at mesmo para amostras de tamanho n =
10 de uma distribuio discreta uniforme. Se as amostras aleatrias vem de uma populao
normal, a distribuio das amostras da mdia normal sem levar em considerao o tamanho
da amostra.
DIGERINDO: Io creio que quando falamos de z, o mesmo z que vimos na distribuio
normal, que vai resultar em um F(z) que significa a rea em baixo da curva, s que: l atras
tinhamos uma VA, e e agora temos uma VA, e o desvio padro da mdia o que nos levar
a uma distribuio normalizada mais fechada.
7 - Inferncia Relativas a Mdia
Estatstica: Uma estatstica denominada de estimador no tendencioso, ou seu valor
de uma estimativa no tendenciosa se e somente se, a mdia da distribuio amostral do
estimador for igual ao parmetro de interesse.
Estatstica = ^
Parmetro de interesse = , ento ^ = (A mdia da distribuio amostral igual ao
parmetro de interesse, no caso a mdia da populao)
DIGERINDO: O quanto a mdia da amostra diferente da mdia da populao? s isolar a
diferena entre as mdias e encontraremos a mdia da amostra padronizada (z) multiplicada
pelo desvio padro das mdias. Como a curva simtrica est condio vale para os dois
lados, sendo que o z tem de ser dividido por dois ( lado direito e esquerdo da cauda, fora dos
limites superior e inferior)e no lado esquerdo negativo.
Um exemplo chama a diferena entre as mdias das amostras e da populao de
ERRO, para calcula-lo para um determinado nvel de significncia temos que encontrar Z
/2
e
depois de ter o valor de z, aplicar a frmula isolando novamente o Erro.
Outra forma de usar o teorema do limite central propor o erro e perguntar quantas
medidas tem-se de fazer para assegurar o mesmo nvel de confiana e agora s isolamos o n.
Quando falamos em intervalo de confiana com desvio padro conhecido, fica claro
que se est isolando a mdia da populao e o que se encontra a mdia da amostra mais ou
menos a rea debaixo da cauda multiplicada pelo desvio padro da mdia.
Para calcular o intervalo de confiana se tu j tens a mdia da amostra e o desvio
padro s encontra o z para determinado nvel de significncia. A curva normal ficar bem
mais estreita quando aplicarmos o intervalo de confiana o que quer dizer que a mdia varia
menos quanto maior for o nmero de amostras.
Quando no conhecemos , calculamos atravs de S. Quando fazemos isto trocamos a
mdia da amostra padro de z para T e passamos a nos referir a distribuio de student.
Nunca esquecer que o grau de liberdade n-1 e que quanto maior o grau de liberdade mais a
curva se aproxima da normal.
A seguir apresentado um problema com nove medies e se quer saber a faixa que se
encontra a mdia da populao, tem-se de calcular S e resolver todo resto do problema atravs
da distribuio de Student.
6.3 Distribuio da Mdia das amostras ( Desconhecido)
Aplicao da teoria da seo anterior requeria o conhecimento do desvio padro da
populao . Se n grande, este no impem algum problema mesmo quando
desconhecido, visto que possvel, no caso, substitu-lo pelo desvio padro da amostra S.
Entretanto, quando vem de uma VA cujo os valores so dados por:
muito pouco conhecido sobre distribuies amostrais exatas para pequenos valores de n, a
menos que ns faamos a suposio que a amostra veio de uma populao normal. Debaixo
desta suposio ns podemos determinar o seguinte:
Uma varivel aleatria tem a distribuio t : Teorema 6.3 = Se a mdia das amostras de
uma populao de tamanho n pega de uma populao normal tendo mdia e varincia
2
, e
Ento,
n S
X
T
/
~

,
_

n
i
i
n
X X
S
1
~
2
1
n S
X
t
/
~

a VA auume distribuio t com o parmetro = n-1 para graus de liberdade.


A notao para menores nmeros de amostra t diferencia esta importante estatstica das
outras. Este teorema mais genrico que o teorema 6.2 no sentido que no requer o
conhecimento de , por outro lado ele menos genrico que o teorema 6.2 no sentido que
requer a suposio de uma populao normal.
Como pode ser visto na figura 6.4, geralmente a forma da distribuio t similar a da
distribuio normal => ambas tem forma de sino e so simtricas mdia. Como a distribuio
normal padro, a distribuio t tem mdia 0, mas sua variao depende do parmetro (ni),
chamado o nmero de graus de liberdade. A variao da distribuio t excede 1, mas
aproxima-se de 1 quando n. De fato ela pode ser mostrada como a distribuio t com
graus de liberdade aproximando-se a distribuio normal quando .
A tabela 04 do final do livro contm valores selecionados de t

para vrios valores de ,


onde t

tal que rea embaixo da distribuio t para direita igual a . Nesta tabela a coluna
do lado esquerdo contm os valores de , as colunas do cabealho so valores do lado direito
da cauda da distribuio t e as entradas so valores de t

(Veja tambm a figura 6.5). No
preciso tabular os valores de t

para >0,50, visto que a distribuio de t simtrica e t
1-
=- t

,
ou seja, o valor de t que corresponde rea do lado esquerdo da cauda de - t

.
Note que na parte inferior da tabela 04 as entradas correspondem aos valores de z que
isolam a rea da cauda direita da curva normal padro. Usando a notao z

para determinado
valor de z, pode ser visto por exemplo, que Z
0,025
=1,96=t
0,025
para . Este resultado era
esperado uma vez que a distribuio t se aproxima da distribuio normal na medida que .
De fato observando os valores para t

para 29 ou mais graus de liberdade so intimamente


prximos de z

, ns conclumos que a distribuio normal padro fornece uma boa


aproximao para distribuio t para amostras de tamanho 30 ou mais.
DIGERINDO: Intervalo de confiana para desconhecido, a mdia da populao a mdia
da amostra mais ou menos a mdia da amostra padronizada t multiplicada pelo desvio padro
da mdia dado por S.
Por exemplo para uma amostra de tamanho n=16 foi dado a mdia da amostra, o
desvio padro S e o nvel de significncia de 95% e quer se saber o intervalo de confiana:
s calcular a mdia da amostra padro t e substituir os valors na frmula. Se quisermos uma
faixa melhor s aumentar o nmero de n.
6.4 Distribuio Amostral da Varincia (chi-quadrado)
At aqui, ns discutimos somente a distribuio amostral da mdia, mas se ns
tivssemos pego a mediana ou o desvio padro das 50 amostras mencionadas no exemplo da pg
199, ns similarmente teramos obtido distribuies experimentais da amostra destas
estatsticas. Nesta seo, ns determinaremos com a distribuio terica das amostras, a
variao de amostra para amostra aleatria de uma populao normal. Uma vez que a varincia
no pode ser negativa, ns suporemos que a distribuio no uma curva normal. De fato ela
relacionada com a distribuio gama (ver pgina 158) com =/2 e =2, chamada de
distribuio chi-quadrado . Especificamente ns temos o seguinte teorema:
Uma varivel aleatria tendo distribuio chi-quadrado
Teorema 6.4: Se S
2
a varincia de uma amostra aleatria de tamanho n pega de uma
populao normal tendo a varincia
2
, ento:
2
1
~
1
2
2
2
) (
). 1 (

n
i
X X
S n
a VA tendo distribuio chi-quadrado com o parmetro = n-1.
A tabela 05 do final do livro, contm valores selecionados de

2
para vrios valores de
, novamente chamado de graus de liberdade, onde

2
tal que a rea debaixo da distribuio
chi-quadrado na direita igual a . O lado esquerdo da tabela contm valores de , as colunas
do cabealho so reas do lado direito da cauda da distribuio chi-quadrado e as entradas so
valores de

2
(Ver figura 6.6). Diferente da distribuio t, necessrio tabular valores para

2
>0,50, porque a distribuio chi-quadrado no simtrica.
Um problema intimamente relacionado com a determinao da distribuio da
varinia da amostra a determinao da distribuio da relao de varincias de duas
amostra aleatrias independentes. Este problema importante porque ele levantado em testes
em que queremos determinar se duas amostras vem de populaes com varinias iguais. Se
elas so, as duas varinia das amostras devem ser prximas a mesma; ou seja, sua relao
deve ser perto de 1. Para determinar se a relao de duas amostras de varincia muito pequena
ou muito grande, ns usamos a teoria dado no teorema seguinte:
Uma varivel aleatria tendo distribuio F
Teorema 6.5: Se S
1
2
e S
2
2
so varincias de amostras aleatrias independentes de tamanho n
1
e
n
2
, respectivamente, pegas de duas populaes normais, tendo a mesma varincia, ento:
F = S
1
2
/S
2
2
a varivel aleatria tendo a distribuio F com os parmetros
1
=n
1
-1 e
2
=n
2
-1.
A distribuio F est relacionada com a distribuio (pgina 162) e os dois
parmetros
1
e

2
so chamados de numerador e denominador dos graus de liberdade. Seria
necessrio uma tabela muito grande para valores de F

correspondente as muitas diferentes


probabilidades para o lado direito da cauda e foram adotados = 0,05 e =0,01, uma vez que
so as mais comumente usadas na prtica. Tabela 06 contm somente valores F
0,05
e F
0,01
para
vrias combinaes de valores de
1
e

2
( Ver na figura 6.7) Dependendo se se quer uma
comfiabilidade de 95% ou 99%.
Note que no teorema 6.4 e 6.5 necessrio supor que ns estamos retirando amostras
da populao normal. Diferente da situao com a distribuio t, desvios da distribuio
normal, como uma longa cauda podem causar srios efeitos na distribuio desta amostra.
Consequentemente esta a melhor distribuio para transformar para perto da normalidade
usando as aproximaes da seo 5.12.
DIGERINDO: Esta distribuio, chi-quadrada, muito pouco utilizada na primeira parte da
matria. Anlise de varincias, mistura-se os processos, se a varincia aumentar os processos
no tem muito a haver um com o outro. Quando se calcula F, se este valor for maior do que o
valor tabelado as varincias so diferentes.
7.4 Teste de Hipteses
Existem muitos problemas em que, mesmo que estimemos o valor de um parmetro, ns
devemos decidir se a expresso que determina o parmetro verdadeira ou falsa; ou seja, ns
devemos testar as hipteses sobre o parmetro. Por exemplo, em trabalhos com controle da
qualidade uma amostra aleatria deve servir para determinar se a mdia do processo ( para um
dado tipo de medida) tem ficado imutvel ou se ela tem mudado de medida de tal forma que o
processo tenha ficado fora de controle e ajustes tenham de ser feito.
Exemplo: Referente ao exemplo da pgina 198 de monitoramento da qualidade da
gua que deixa uma planta industrial. Porque quando avaliamos uma amostra da espcie, ela
no nos conduz sempre para concluses corretas considerando a qualidade da gua?
Soluo: Os valores observados sobre o aspecto da qualidade da gua dependero da
espcies particulares na amostra. Porque estes valores podem variar de amostra para amostra,
amostras particulares podem fornecer valores errneos e portanto decises incorretas. A
possibilidade de cometer um engano sobre a qualidade da gua, com base na espcie de teste,
no pode ser eliminada a menos que a confirmao seja feita reportada a um perodo. Isto ,
naturalmente, tecnologicamente e economicamente imprticavel.
Para ilustrar o conceito geral envolvendo este tipo de deciso do problema, suponha que
uma agncia de proteo ao consumidor quer testar a afirmao de uma fbrica de tintas
(Renner) que a mdia do tempo de secagem de uma nova tinta seca-rpido de 20 minutos.
Assim ela instruu um membro da equipe de investigao a pegar 36 tbuas e pinta-las com tinta
de 36 diferentes gales, com a inteno de rejeitar a afirmao se a mdia ultrapassasse 20,75
min; de outra forma ele aceitaria a afirmao e em qualquer um dos dois casos ele tomar
qualquer ao para chamada planta indstrial.
Isto fornece um critrio bem definido para aceitar ou rejeitar a afirmao, mas
infelizmente ela no infalvel. Uma vez que a deciso est baseada em uma amostra, existe a
possibilidade da mdia da amostra exceder a 20,75 min mesmo que a mdia verdadeira do
tempo de secagem seja = 20 minutos, e existe tambm a possibilidade que a mdia da amostra
do tempo de secagem seja de 20,75 min, mesmo que a mdia verdadeira seja = 21 min.
Assim, antes de adotar o critrio, veremos uma maneira de investigar as chances que um critrio
possa conduzir a uma deciso errada.
Assumindo que conhecemos da experncia passada o desvio padro do tempo de
secagem esperado, que igual a = 2,4 min, vamos primeiro investigar a possibilidade que a
mdia da amostra exceda 20,75 min mesmo que a mdia verdadeira do tempo de secagem seja
de 20 minutos. A probabilidade que isto acontea devido a chance dada pela rea da regio
hachurada da figura 7.3 e ela pode ser fcilmente determinada pela aproximao da distribuio
amostral da mdia com a curva normal. Assumindo que a populao grande o suficiente para
ser considerada infinita, ns teremos o desvio da mdia das 36 amostras = 0.4, e a linha que
divide o critrio, em unidades padres : z = (20,75-20)/0,4 = 1,875 1 - 0,9693 = 0,0307
correspondente a rea que ficar de fora da curva normal. E portanto a probabilidade de
rejeitar erroneamente a hiptese = 20 minutos de aproximadamente 0,03 ou 3%.(Como ele
tem o valor que deveria ser, o valor afirmado, o desvio da mdia e o nmero de medies,
podemos calcular a mdia amostral padro e encontrar a probabilidade de rejeitar
erroneamente a hiptese, ou seja, existe 3% de chance do valor passar de 20,75 mas mesmo
assim pertencer a uma populao com mdia 20 minutos)
Vamos considerar agora a outra possibilidade, onde o procedimento falhe no
detectando 20. Suponha de novo, para o propsito de argumentao, que a mdia
verdadeira para o tempo de secagem seja mesmo de 21 minutos, assim a possibilidade de pegar
uma mdia da amostra menor ou igual a 20,75 minutos ( e portanto, aceitar erroneamente a
mdia de 20 minutos) dada pela rea hachurada na figura 7.4. Como antes o desvio da mdia
da amostra 0,4, ento agora a linha z que demarcar a linha de diviso da curva : z = (20,75-
21)/0,4 = -0,625 A rea por consequncia = 1- 0,7340 = 0,2660 e portanto a probabilidade de
aceitar erroneamente a hiptese de cerca de 27%. (novamente foi diminudo o valor limite do
valor real e dividido pelo desvio padro da amostra, a rea relativa a probabilidade de no
detectar o erro)
A situao descrita no exemplo tpica de teste de hipteses estatsticas, e ela pode se
resumida na tabela seguinte, onde ns referenciamos as hipteses testadas por H:
Aceite H Rejeite H
H verdadeiro Deciso Correta Erro tipo I
H falso Erro tipo II Deciso Correta
Se a hiptese H verdadeira e aceita ou falsa e rejeitada, a deciso em um dos dois
casos correta. Se a hiptese H verdadeira mas rejeitada ou se a hiptese falsa, mas
aceita cometemos um erro. O primeiro destes erros chamado de erro tipo I e o segundo erro
tipo II e a probabilidade de comete-los representada respectivamente pelas letras gregas e .
Portanto no exemplo mostramos que = 0,03 e = 0,27.
Calculando a probabilidade de um erro tipo II em outro exemplo, ns arbitrariamente
escolhemos a alternativa valor = 21 minutos. Entretanto, neste problema como em muitos
outros, existem infinitas outras alternativas, e para cada uma delas h uma probabilidade de
aceitar erroneamente a hiptese. O que fazer sobre isto ser mais discutido na seo 7.8.
Do caderno: Normalmente uma hiptese estatstica uma afirmao sobre uma das
populaes. Normalmente se formula uma hiptese nula (H0) ou principal e uma hiptese
alternativa (H1) que ser aceita ou no se for possvel demonstrar que H0 verdadeira.
Sugesto de passos:
1. Formule H0 e a hiptese H1 que ser aceita se H0 for rejeitada.
2. Estabelea a probabilidade do erro tipo I e se possvel estabelea a probabilidade do erro
tipo II para alternativas particulares.
3. Defina as estatsticas de teste apropriadas e os critrios para testar H0 contra H1.
4. Calcule a estatstica definida a partir da amostra.
5. Decida se aceita H0, rejeita H0 ou ainda se nada pode afirmar.
DIGERINDO: No caso da resistncia a trao de um material, foi afirmado que a mdia da
populao 50 Mpa, o quanto a mdia da amostra tem de estar longe disto para ser rejeita
esta afirmao ou hiptese nula???Qual seria o erro mximo permitido??? Erro tipo I rejeita
Ho mesmo quando este verdadeiro, Erro tipo II, aceita Ho quando este falso. Se
conhecemos e o erro mximo de 1,5, Qual a probabilidade que acontea um erro tipo I:
s calcular z e determinar a rea fora dos limites para os dois lados da curva, soma-los e
obtem-se a probabilidade de rejeitar uma hiptese verdadeira.
Para diminuir o nvel de significncia, ou se aumenta os limites inferior e superior com
relao a mdia pegando uma rea maior e por consequncia errando menos, ou se aumenta o
nmero de medidas n. S para lembrar hipteses so afirmaes sobre uma populao e
amostras so da onde tiramos evidncias para validar ou no a hiptese nula. = erro tipo I e
= erro tipo II.
Risco de aceitar uma hiptese falsa: foi afirmada uma mdia por exemplo e eu quero
determinar se a mdia fosse outra qual a probabilidade de erro, s pode ser feita se este valor
for definido. Calcula-se a diferena entre as duas mdias da populao e divide-se por um
desvio mdio achando uma mdia da amostra padronizada que fornecer a rea debaixo da
curva que representa a probabilidade da hiptese nula ser falsa e a aceitarmos.
Ainda constatamos que a nica maneira de diminuir sem prejudicar almentando o
nmero de amostras, esta seria nossa soluo de compromisso.
7.6 Hipteses relativas a uma mdia
Tendo usado testes para determinar a mdia como ilustrao para os princpios bsicos
do teste de hipteses, vamos agora ver como devemos proceder na prtica real. Suponha, por
exemplo, que ns queremos testar com base em 35 determinaes e que o nvel de significncia
seja igual a 0,05, se a condutividade trmica de um certo tipo de cimento para tijolos de 0,340,
como foi afirmado a partir da informao recolhida em estudos similares, ns podemos esperar
que a variabilidade destas determinaes seja dada por =0,010. Segundo a esquema da seo
anterior, ns comeamos com o passo 01 e 02 escrevendo:
1. Hiptese nula: = 0,340.
Hiptese alternativa: 0,340.
2. Nvel de Significncia: = 0,05
A hiptese alternativa bi-lateral, pois ns queremos rejeitar a hiptese nula se a mdia das
determinaes significativamente menor ou maior do que 0,340.
Prximo, passo 03, nos despedimos do exemplo usado na seo anterior e baseamos o teste
na estatstica:
Estatstica para testes determinando hipteses relativas a mdia
Em vez da mdia da populao . A razo para trabalhar com unidades padres ou
valores Z, que eles permite-nos formular critrios que so usado em uma grande variedade de
problemas, no em apenas um tipo.
Se Z
/2
, como antes, igual a rea debaixo da parte direita da curva normal padro, as
regies crticas, em outras palavras, o conjunto de valores de z para que ns rejeitemos a
hiptese nula =
0
, pode ser expressa como na tabela seguinte:
Regies crticas para testar =
0
(Populao Normal e conhecido, ou grande nmero de
amostras)
Hipteses Alternativas Rejeita Hiptese nula se:
<
0
Z<-z

>
0
Z> z

0
Z<-z
/2
ou Z> z
/2
DIGERINDO: O teste quer conferir se a mdia da amostra mesmo a que foi afirmada, se
acontecer a primeira condio entramos no lado esquerdo da curva, fora dos limites e
rejeitamos a hiptese nula porque a mdia da amostra menor do que a afirmada; se
acontecer a segunda condio entramos no lado direito da curva, fora dos limites e rejeitamos
a hiptese nula porque a mdia da amostra maior do que a afirmada e ainda se ocorrer a
terceira condio, rejeitamos a hiptese nula porque a mdia das amostras diferente da
afirmada e z pode se encontrar de qualquer lado da curva,desde que fora dos limites
estabelecidos para o nvel de significncia.
Se = 0,05, a linha que divide a curva, ou valores crticos so 1,645 e 1,645 para as
alternativas uni-laterais e, 1,96 e 1,96 para a alternativa bi-lateral. Se = 0,01, a linha que
divide o critrio 2,33 e 2,33 para as alternativas uni-laterais e 2,575 e 2,575 para as
alternativas bi-laterais.
Retornando agora ao exemplo relacionado com a condutividade trmica do cimento para
tijolos supondo que a mdia das 35 determinaes 0,343. Assim ns continuamos escrevendo:
3. Critrios: Rejeite a hiptese nula se Z<-1,96 ou Z>1,96, onde:
n
X
Z

0
~

4. Clculos:
Z = (0,343-0,340)/(0,010/Raz de 35) = 1,77
5. Deciso:
Uma vez que Z = 1,77 cau num intervalo entre 1,96 e 1,96, a hiptese nula no pode ser
rejeitada; para colocar de outra forma, a diferena entre X~=0,343 e
o
= 0,340 pode ser
atribuda ao acaso.
Em problemas como este, alguns pesquisadores acompanham o valor calculado de z com a
correspondente cauda de probabilidade, ou valor P, pegando a probabilidade da maior
diferena entre a mdia da populao e a mdia afirmada ou ainda a probabilidade igual a
observada realmente. Por exemplo, no exemplo acima, ele dado pela rea total da esquerda da
curva normal padro de 1.77 e para a direita de 1.77, e igual a 2.(1-0,9616) = 0,0768. Este
valor excede 0,05, mas no invalida a hiptese nula por que pela quantidade excedente
conclui-se que este valor foi realmente obra do acaso.
DIGERINDO: No esquecer de usar a estatstica t de student se a amostra for menor do que
30. Depois no exemplo do barbante com resistncia a ruptura de 180N, se seguiu os passos
normais. Primeiro se estabeleceu a hiptese nula onde a mdia igual a 180N e a hiptese
alternativa onde a mdia menor a 180N devido ao valor encontrado na amostra ser de
169,5N; o nvel de significncia de 0,01; encontrou-se a rea embaixo do grfico para esta
significancia e este grau de liberdade = 4; atravs da estatstica de studente se encontrou a
rea embaixo do grfico da diferena das mdias e era menor do que a encontrada
anteriormente, rejeitou-se a hiptese nula visto que as condies da tabela no foram
satisfeitas.
7.9 Inferncias envolvendo duas mdias (Inferncia sinnimo de deduo)
Existem muitos problemas estatsticos que nos so mostrados com decises sobre o
tamanho relativo da mdia de duas ou mais populaes. Partindo do problema geral at o cap.
12, ns dedicaremos esta seo para teste que determinem a diferena entre duas mdias. Por
exemplo, se dois mtodos de soldagem esto sendo considerados para uso com suportes de
trilhos de trem, ns podemos pegar amostras e decidir qual melhor pela comparao de suas
mdias de resistncia; tambm se um exame do MEC aplicado em graduandos de Engenharia
de duas escolas diferentes, ns podemos querer decidir se a diferena entre as mdias dos
estudantes das diferentes escolas significativa ou se podem ser atribudas ao acaso.
Formulando o problema mais genricamente, ns consideraremos duas populaes
tendo mdia
1
e
2
e varincia de
1
2
e
2
2
, e ns queremos testar a hiptese nula
1
-
2 =
,
onde uma constante especfica, com base em amostras aleatria independentes n
1
e n
2
.
Anlogo a testes para determinao de uma mdia, ns consideraremos testes desta hiptese
nula contra cada uma das alternativas
1
-
2
<,
1
-
2
>, e
1
-
2
. O teste, por ele mesmo,
depender da diferena das mdias das amostras
~
X
1
- X
2
~
e se ambas amostra vem de uma
populao normal com varincias conhecidas, pode ser baseada na estatstica:
n
X
Z

0
~

~
~
2 1
~
2 1
~
) (
X X
X X
Z

que uma varivel aleatria com distribuio normal. Uma vez que denominador o
desvio padro da distribuio amostral da diferena das mdias das amostras e os valores para
variveis aleatrias de populao infinitas podem ser obtidos com o uso do seguinte teorema.
(Ver exemplo na pgina 178.)
Mdia e Varincia da soma (ou diferena) de duas variveis aleatrias
Teorema 7.1: Se a distribuio de duas VA independentes tem mdia
1
e
2
e varincia de
1
2
e
2
2
, ento a distribuio de sua soma (ou diferena) tem a mdia
1
+
2
(ou
1
-
2
) e a
varincia
1
2
+
2
2
.
Para encontrar a varincia entre as mdias de duas VA independentes de tamanho n
1
e n
2
de populaes infinitas, note primeiro que a varincia das mdias, por elas mesmas, so:

Onde Z a estatstica para testes determinando a diferena entre duas mdias, que
uma VA tendo distribuio normal padro. Derivado deste resultado podemos assumir que ns
estamos tirando amostras de uma populaao normal. Entretanto, a estatstica acima pode ser
usada tambm quando suas amostras so grandes o suficiente para que possamos aplicar o
teorema do limite central e aproximar
1
e
2
de S
1
e S
2
, ou seja, quando n
1
e n
2
so ambos
maiores ou iguais a 30.
Anloga a tabela da pg 240, as regies criticas para testar a hiptese nula
1
-
2 =
so
as seguintes:
Regies crticas para testar
1
-
2 =
(Populao Normal e
1
e
2
conhecidos, ou grande
nmero de amostras)
Hipteses Alternativas Rejeita Hiptese nula se:

1
-
2
< Z<-z

1
-
2
> Z> z

1
-
2
Z<-z
/2
ou Z> z
/2
Ainda que, possa ser qualquer constante, ela merecido registrar que na maioria dos
problemas seu valor zero e ns testamos a hiptese nula da no diferena, quer dizer, a H
0

1
=
2.
2
2
2
1
2
1
2
~
1
~
2
2
2
1
2
1
2 2
2
2
2
2
1
2
1
2
~
2
~
1
~
2
~
1
1 . 7
... ...
n n
X X
Z
ento
n n
Teor
n
e
n
X X
X X

,
_

+
+

DIGERINDO: O teste quer conferir se a diferena entre as mdias mesmo a constante, se
acontecer a primeira condio entramos no lado esquerdo da curva, fora dos limites e
rejeitamos a hiptese nula porque a diferena das mdias menor do que a afirmada; se
acontecer a segunda condio entramos no lado direito da curva, fora dos limites e rejeitamos
a hiptese nula porque a diferena das mdias maior do que a afirmada e ainda se ocorrer a
terceira condio, rejeitamos a hiptese nula porque a diferena das mdias diferente da
afirmada e z pode se encontrar de qualquer lado da curva,desde que fora dos limites
estabelecidos para o nvel de significncia.
Quando n
1
, n
2
ou ambas amostras so pequenas e a varincia da populao
desconhecida, ns podemos basear nossos testes da hiptese nula
1
-
2 =
, sobre um uma
estatstica t adequada, desde que ns possamos assumir que ambas as populaes so normais
com
1
=
2
=. Existe no livro toda uma explicao matematica de como encontrar a estatstica t,
o importante saber que a estatstica para testar pequenas amostras e determinar a
diferena entre duas mdias dada por:
Os critrios para o teste de duas amostras t baseados na estatstica so como aqueles
dados na tabela da pgina 253 com Z trocado por t e z

e z
/2
trocados por t

e t
/2
. Na aplicao
deste teste n
1
e n
2
podem ser pequenas, mas n
1
+n
2
-2 tambm podem ser de 30 ou mais
elementos; neste caso ns usamos os valores crticos dados na linha de fundo da tabela 04.
No exemplo anterior nos fomos adiante e apresentamos o teste t para duas amostras,
assumindo que a varincia da populao era igual. Felizmente, o teste no excessivamente
sensitivo para pequenas diferenas entre as varincias da populao e o procedimento utilizado
neste exemplo justificado. Como uma regra de manuseio, se uma varincia quatro vezes a
outra, ns devemos determina-la. Uma transformao muitas vezes aperfeioar a situao.
Como outra alternativa existe o teste smith-satterwait mencionado no exerccio 7.70.
Intervalos de Confiana levam diretamente a uma regio de aceitao para testes. Para
duas populaes normais com varincias iguais, Intervalo de confiana para pequenas
amostras determinando diferenas entre duas mdias:
O intervalo de confiana 100(1-) para =
1
-
2

onde t
/2
est baseado em =n
1
+n
2
-2 graus de liberdade.
Na aplicao de um teste t para duas amostras ns devemos tambm ter o cuidado que as
amostras sejam independentes. Por exemplo, o teste no pode ser usado quando ns tratamos
com tipos de dados antes e depois, os I.Q.s de maridos e esposas, e numerosos outros tipos
de situao onde os dados so naturalmente pares. No caso em que trabalhamos com a
diferena entre pares de dados e testamos se estas diferenas podem ser olhadas como uma
amostra aleatria de uma populao para que = , usualmente = 0. Se a amostra pequena,
( ) ( )
( )
2 1
2 1 2 1
2
2 2
2
1 1
2
~
1
~
2 . .
.
1 1
n n
n n n n
S n S n
X X
t
+
+
+

,
_

2 1
2 1
2 1
2
2 2
2
1 1
2
2
~
1
~
.
.
2
) 1 ( ) 1 (
n n
n n
n n
S n S n
t X X
+
+
+
t

ns usamos o teste para uma amostra t da pgina 243. De outa forma, n usamos o teste
correspondente para grandes amostras da pgina 240.
DIGERINDO: Para resumir se dois carros fazem respectivamente mdias de consumo de
combustvel 14,8 e 15,1 km/l ser que o consumo realmente diferente???
Para o exemplo de dois condutores, dada certa significancia, e: a mdia da amostra, o
desvio padro e o nmero de elementos de cada uma das duas amostras. Calcule a diferena
entre suas resistncias eltricas:
1. Definiu-se Ho como a resistncia que as duas empresas afirmavam e H1, como maior do
que resistncia afirmada devido as mostras terem a mdia maior.
2. Definiu-se o nvel de significncia.
3. Estabeleceu-se o critrio conforme tabela de critrios onde se calcula o z da curva e se o z
encontrado for maior que o padro, ele rejeita a hiptese nula.
4. Calcula-se o z para este caso.
5. Faz-se a comparao entre os valores e rejeita-se Ho.
Depois o caderno cita a frmula do intervalo de confiana da diferena; do T para
amostras pequenas onde no possa ser usado Z e do intervalo de confiana quando a
amostra pequena.
Intervalo de Tolerncia: caso o processo de medio envolva erros sistemticos.
Diferena entre a mdia e o valor verdadeiro. Na verdade aquela rea de um lado da cauda
fora dos limites multiplicado pelo desvio padro mdio.
8 - Inferncias relativas a varincia
No captulo 07 ns estudamos como julgar o tamanho do erro em estimativas de mdias
de populaes, como construir intervalos de confina para mdias e como executar testes de
hipteses sobre as mdias de uma ou duas populaes. Como veremos neste e nos captulos
seguintes, muitos mtodos similares so aplicados para inferncia (Deduo) sobre outros
parmetros da populao.
Neste captulo ns nos concentraremos em varincia da populao, ou desvio padro,
que no so somente importantes em um ajustes particulares, mas que muitas vezes sero
estimadas antes de deduzirmos outros parmetros. A seo 8.1 destinada a estimao da
varincia e desvio padro e as sees 8.2 e 8.3 tratam com testes de hipteses sobre estes
parmetros.
8.1 Estimativa de Varincia
No captulo anterior, haviam muitos exemplos onde ns estimamos o desvio padro da
populao atravs do desvio padro mdio de uma amostra considerando grandes amostras,
ns substitumos S por em intervalo de confiana da mdia na pgina 222, no teste de muitas
amostras determinando na pgina 240 e no teste determinando a diferena entre duas mdias
na pgina 253. Existem muitos procedimentos estatsticos onde S substitudo por , ou S
2
por

2
. Existem situaes tambm onde o primeiro parmetro de interesse.
Estimativa Imparcial da varinia da populao
Ainda que a varincia da amostra seja uma estimativa imparcial de
2
,no quer dizer que
o desvio padro da amostra seja tambm uma estimativa imparcial de , de fato, ele no .
Entretanto, para muitas amostras a influncia pequena e prtica comum estimar como S.
Alm de S, desvio padro da populao so algumas vezes estimados em termos da
faixa da amostra R, que ns definimos na seo 2.6, como o maior menos o menor valor de uma
amostra. Dada uma amostra aleatria de tamanho n de uma populao normal, ela pode ser
mostrada como a faixa de distribuio amostral de mdia d
2
e o desvio padro d
3
, onde d
2
e
d
3
so constantes que dependem do tamanho desta amostra. Para n = 1, 2 ... e 10, seus valores
so mostrados na tabela seguinte:
n 2 3 4 5 6 7 8 9 10
d
2
1.128 1.693 2.059 2.326 2.534 2.704 2.847 2.970 3.078
d
3
0.853 0.888 0.880 0.864 0.848 0.833 0.820 0.808 0.797
Dessa forma, R/d
2
uma estimativa imparcial de para muitas amostras pequenas n 5,
ela fornece uma boa estimativa de como S; como o tamanho da amostra aumenta, torna-se
mais eficiente se usar S em lugar de R/d
2
. Hoje em dia, a faixa usada para estimar em
problemas de controle de qualidade na industria, onde os tamanhos das amostras so
usualmente pequenas e facilidade de calcular o primeiro interesse. Esta aplicao ser
discutida no captulo 14, onde ns precisaremos dos valores tabelados acima.
1
) (
1
2
~
2

n
X X
S
n
i
i
DIGERINDO: No caderno ainda se define Intervalo de confina para varincia: vlido
somente para populaes normais, s substituir o S
2
e encontrar o chi-quadrado para dada
significncia. No exemplo do ndice de refrao de pea de vidro foi dado o tamanho da
amostra e a varincia, como sabamos o percentual do nvel de significncia foi s procurar na
tabela do chi-quadrado e montar o intervalo de confina.
8.2 Hipteses envolvendo uma varincia
Nesta seo ns consideraremos o problema de testar a hiptese nula que a varincia
da populao igual a uma constante especfica contra uma alternativa adequada uni ou bi-
lateral; ou seja, ns testaremos a hiptese nula
2
=
0
2
contra uma das alternativas
2
<
0
2
,

2
>
0
2
ou
2

0
2
. Testes como estes so importantes toda hora que desejado controlar uma
uniformidade do produto ou uma operao, por exemplo, suponha que um disco de silicone, ou
bolachas tem de ser cortado em pequenos quadrados, ou cubos, para serem usados na
manufatura de dispositivos semi-condutores. Uma vez que certas caractersticas finais eltricas
do dispositivo podem depender da espessura do cubo, importante que todas as bolachas a
serem cortadas tenham a mesma espessura. Assim no somente a mdia da espessura das
bolachas tem de ficar dentro das especificaes, mas tambm a variao da espessua de ponto a
ponto da bolacha.
Usando a mesma teoria de amostras da pg 270, ns baseamos este teste no fato que as
amostras aleatrias vem de populao normal com varincia
0
2
.
Estatstica para teste de determinao da varincia

a VA que tem uma distribuio chi-quadrada com n-1 graus de liberdade. A regio crtica
para cada teste mostrada na tabela seguinte:
Regies Crticas para testar
2
=
0
2
(Populao Normal)
Hiptese Alternativa Rejeite Hiptese Nula se:

2
<
0
2

2
<
1-
2

2
>
0
2

2
>

2

0
2

2
<
1-/2
2
e
2
>
/2
2
Esta tabela como a definida na pg. 211. Note que caudas iguais so usadas para alternativas
bi-laterais, e este no atualmente o melhor procedimento uma vez que a distribuio chi-
quadrada no simtrica.
DIGERINDO: o teste para determinao da varincia funciona como qualquer outro, s
resolver a estatstica adequada (chi-quadrado) e estabelecer a hiptese alternativa adequada,
quando resolvermos a estatstica para as variveis dadas se no atender as condies
rejeitamos a hiptese nula. Exemplo de um processo com desvio padro menor ou igual a 0,50
e nvel de significncia, nmero de elementos e S dados.
1. Determinou-se Ho = 0,50 e H1>0,50
2. Nvel de significncia de 0,05 ou 95%
3. Calculou-se a estatstica para este nvel de significncia e o devido grau de liberdade
4. Conforme Tabela das regies crticas se determinou as condies a serem satisfeitas
5. Calculou-se apartir do S dado a estatstica.
6. No se rejeitou a hiptese nula.
2
0
2
2
) 1 (

S n

8.3 Hipteses envolvendo duas varincias


O teste t para duas amostras, descrito na seo 7.9, requer que a varincia de duas
populaes amostrais sejam iguais. Nesta seo ns descreveremos um teste de hiptese nula

1
2
=
2
2
, a qual aplicado para amostras aleatrias independentes de duas populaes normais;
muito usado com algum cuidado visto que ele muito perceptivo para fugas desta suposio.
Se amostras aleatrias de tamanho independente n
1
e n
2
so pegas de uma populao
normal tendo a mesma varincia, segue do teorema 6.5 que:
Estatstica para testes da igualdade de duas varincias
F = S
1
2
/S
2
2
a VA tendo distribuio F com n
1
-1 e n
2
-1 graus de liberdade. Assim, se a hiptese
nula verdadeira, a relao das varinas das amostras S
1
2
e S
2
2
fornecem uma estatstica que
pode ser usada em testes de hipteses nulas.
A regio crtica para testar a hiptese nula
1
2
=
2
2
contra a hiptese alternativa
1
2
>
2
2
F>F

, onde F

est definido na pgina 212. Similarmente a regio crtica para testar a hiptese
nula contra a hiptese alternativa
1
2
>
2
2
F>F

e isto causa algumas dificuldades uma vez


que a tabela 06 somente contm valores correspondentes para o lado direito da cauda de =
0,05 e = 0,01. Como um resultado ns usamos a mesma da estatstica de teste original e
fazemos uso desta relao:
dada primeiro na pg 213. Assim, ns baseamos o testa na estatstica F = S
1
2
/S
2
2
e na regio
crtica para testes da a hiptese nula
1
2
=
2
2
contra a hiptese alternativa
1
2
>
2
2
que vem de
F>F

onde F

o valor crtico apropriado de F para n


2
-1 e n
1
-1 graus de liberdade.
Para a alternativa bi-lateral
1
2

2
2
a regio crtica F<F
1-/2
ou F>
F/2
, onde F=S
1
2
/S
2
2
e
os graus de liberdade so n
1
-1 e n
2
-1. Na prtica, ns modificamos este teste como no pargrafo
anterior, assim ns novamente usamos a tabela que contm valores correspondentes para o lado
direito da cauda de = 0,05 e = 0,01. Para este fim ns pegamos S
2
M
representado a maior das
duas varincias da amostra, S
m
2
a menor, e ns escrevemos os correspondentes tamanhos da
amostra n
M
e n
m
. Assim a estatstica torna-se F=S
M
2
/S
m
2
e a regio crtica dada na seguinte
tabela:
Regio crtica para teste de
1
2
=
2
2
(Populao Normal)
Hiptese Alternativa Teste Estatstico Rejeite Hiptese nula se:

1
2
<
2
2
F=S
1
2
/S
2
2
F>F

(n
2
-1, n
1
-1)

1
2
>
2
2
F=S
1
2
/S
2
2
F<F

(n
1
-1, n
2
-1)

1
2

2
2
F=S
M
2
/S
m
2
F>
F/2
(n
M
-1, n
m
-1)
O nvel de significncia destes testes e as figuras indicadas entre parnteses so
graus de liberdade. Note que, em um teste chi-quadrado. Caudas iguais so usadas no teste de
duas caudas como um mtodo matemtico conveniente, mesmo a distribuio F no sendo
simtrica.
DIGERINDO: Agora queremos comparar se as varincias so iguais atravs da estatstica F, a
hiptese nula vai ser sempre a varincia 1 = varincia 2, e a hiptese alternativa vem da tabela
da regio crtica. Usamos a tabela 06 para pegar o valor padro da distribuio F e depois
calculamos a estatstica, conforme a condio escolhida decidimos se rejeitamos Ho ou no.
Alexandre Dors Hoffmeister e Valdeon Sozo.
) , (
1
) , (
2 1
2 1 1

F
F

Вам также может понравиться