Академический Документы
Профессиональный Документы
Культура Документы
UNIVERSIDADE DO ALGARVE
Área Departamental de Engenharia Alimentar
Apontamentos de Estatística
Texto de apoio para a disciplina de Métodos
Estatísticos do Curso de Engenharia Alimentar.
Eduardo Esteves
Área Departamental de Engenharia Alimentar
Escola Superior de Tecnologia
ÍNDICE
PREFÁCIO .......................................................................................................... 4
1. INTRODUÇÃO ............................................................................................... 4
2. CONCEITOS BÁSICOS ................................................................................ 4
3. POPULAÇÃO.................................................................................................. 5
4. AMOSTRA ...................................................................................................... 7
Distribuição de frequências .................................................................................................... 8
Cálculo do número de classes............................................................................................. 8
Cálculo dos limites implícitos ............................................................................................ 9
Frequência absoluta, relativa e relativa acumulada .......................................................... 10
Representação gráfica de distribuições de frequências ........................................................ 10
Medidas de tendência central e de dispersão........................................................................ 12
Medidas de tendência central ........................................................................................... 12
Medidas de dispersão ....................................................................................................... 16
5. CONCEITOS BÁSICOS DA TEORIA DA PROBABILIDADES........... 19
Provas aleatórias, Acontecimentos possíveis, Espaço amostral e Evento............................ 20
Conceito de Probabilidade.................................................................................................... 21
Definição clássica de probabilidade ................................................................................. 21
Definição de probabilidade como frequência relativa...................................................... 22
Definição de probabilidade relacionada com a Teoria dos conjuntos .............................. 22
Postulados das probabilidades .............................................................................................. 22
Teoremas das probabilidades ............................................................................................... 23
Teorema da adição............................................................................................................ 23
Teorema da multiplicação ................................................................................................ 24
Teorema da complementaridade....................................................................................... 24
6. DISTRIBUIÇÃO DE PROBABILIDADES ............................................... 24
Variável aleatória.............................................................................................................. 24
Distribuições de probabilidades de variáveis discretas ........................................................ 26
Propriedades da função densidade.................................................................................... 26
Propriedades da função distribuição................................................................................. 27
Caraterísticas da distribuição de probabilidades .............................................................. 27
Distribuição Binomial .......................................................................................................... 28
Distribuição de Poisson ........................................................................................................ 31
Distribuições de probabilidades de variáveis contínuas ....................................................... 32
Distribuição normal .............................................................................................................. 36
Distribuição normal reduzida ............................................................................................... 38
Distribuição t de Student ...................................................................................................... 39
7. INFERÊNCIA ESTATÍSTICA ................................................................... 41
Amostragem aleatória........................................................................................................... 41
Populações finitas ............................................................................................................. 41
Populações infinitas.......................................................................................................... 42
Distribuição da média na amostragem ................................................................................. 42
Teoria sobre a distribuição de probabilidades da média na amostragem ............................. 43
Teorema do limite central................................................................................................. 44
Estimação da média da população........................................................................................ 44
Estimação pontual ............................................................................................................ 44
Estimação por intervalos de confiança ............................................................................. 45
Teste (ou Prova) de hipóteses............................................................................................... 47
PREFÁCIO
Neste texto que, em boa parte, deriva dos textos de apoio e apontamentos preparados pela
Professora Lilia Brinca ao longo de anos de docência, vamos abordar alguns dos tópicos
introdutórios mais relevantes em Estatística. Assim, com o objectivo de conhecer a população
em estudo (Secção 3), falaremos, primeiro, acerca de amostras e da sua representação sumária
e dos parâmetros que mais se utilizam para as descrever (Secção 4). Providenciaremos alguns
conceitos básicos de probabilidades (Secção 5), assim como conhecimentos de algumas
distribuições de probabilidades teóricas importantes (secção 6) que permitem obter
criteriosamente as amostras (amostragem aleatória, Secção 7) e testar e eventualmente validar,
hipóteses acerca dos resultados obtidos (inferência estatística, Secção 7). No final do texto,
serão abordados conceitos e técnicas relacionadas com a regressão linear simples e correlação
(Secção 8), uma vez que permitem estudar relações estatísticas entre (duas) variáveis. Ao
longo do texto incluem-se exemplos dos assuntos em estudo (identificados por um traço
vertical junto à margem esquerda do texto) para auxiliar a compreensão das matérias.
Complementarmente, providenciam-se exercícios, e respectivas soluções.
1. INTRODUÇÃO
A palavra “Estatística” deriva do latim “Estate”, ou Estado, e foi usada pela primeira vez em
meados do século XVIII por um professor alemão, Gottfried Achenwall. A sua utilização
estava inicialmente relacionada com a otenção de “informação vital”, como por exemplo
dados demográficos, “vitais” para a governação, para o recrutamento militar ou para a
cobrança de impostos. Muitas vezes é usada como sinónimo de “dados”: ouvimos falar em
número de candidatos ao ensino superior, percentagem do PIB aplicado na Educação, etc.
No entanto, a ESTATÍSTICA é mais do que isso. Refere-se à análise e interpretação de dados
com vista à avaliação objectiva da validade das conclusões que se obtiveram. Por MÉTODOS
ESTATÍSTICOS entendem-se os métodos científicos para colher, organizar, resumir, apresentar
e analisar dados de modo a obter conclusões válidas.
O OBJECTIVO GERAL desta disciplina é providenciar, aos alunos do curso de engenharia
alimentar, conhecimentos básicos de estatística, teóricos e práticos, que lhes permitam
analisar estatisticamente problemas relacionados com o desempenho da actividade.
2. CONCEITOS BÁSICOS
Antes de mais, devem apresentar-se alguns conceitos importantes e que serão necessários ao
longo deste texto.
O primeiro dos conceitos de que falaremos é o de população. Simplisticamente, o que se
pretende com a análise estatística é elaborar conclusões sobre um grupo de medições ou
observações da variável em estudo. Ora, o conjunto de medições ou observações realizadas
sobre diferentes elementos de conjuntos bem definidos e rigorosamente condicionados
designa-se por POPULAÇÃO.
3. POPULAÇÃO
O objectivo final dos métodos estatísticos é concluir, com validade, sobre determinado(s)
aspecto(s) da população, isto é, caracterizar todos os elementos do universo em estudo em
termos desse(s) aspecto(s).
Já vimos que, o conjunto de medições ou observações realizadas sobre diferentes elementos
de conjuntos bem definidos e rigorosamente condicionados se denomina população. A
dimensão da população designa-se por N.
População
Inferência Selecção
Amostragem
Amostra #1, Amostra #2,
Amostra #3, …, Amostra #k
n
f =
N
em que n é o número de elementos da amostra ou tamanho da amostra e N o número total de
elementos da população. Pelo contrário, as segundas são constituidas por um número infinito
de elementos. Assim sendo, a fracção de amostragem é praticamente igual a zero, uma vez
que N tende para ∞.
As populações podem ser definidas por determinados PARÂMETROS que resumem certas
características (que veremos a seguir). A esses parâmetros da população são usualmente
atribuidas letras gregas (µ, σ, etc.) ou letras maiúsculas (N, X, etc.), para os distinguir dos
parâmetros correspondentes nas amostras (designados por letras minúsculas: n, x , s, etc).
Contudo, são raras as possibilidades de os calcular directamente, em virtude da dimensão das
populações, pelo que na maíoria das vezes temos de recorrer às características das amostras
(que alguns autores designam por ESTATÍSTICAS) para estudar estatisticamente essas
populações. Na próxima secção, dedicada aos modos apresentação de amostras, serão
incluídas referências aos parâmetros da população sempre que necessário.
4. AMOSTRA
Na maioria dos casos, em virtude da dimensão da população em estudo, é necessário recorrer
a sub-conjuntos, a amostras, para estudar uma (ou várias) característica(s) particular(es) de
uma população. Uma AMOSTRA é composta por um número determinado de observações
individuais, geralmente referidas por xi em que i=1, 2, …, n. Estas observações individuais
podem ser QUALITATIVAS, como por exemplo a cor, o sexo ou o comportamento, etc, ou
QUANTITATIVAS como por exemplo o peso, a densidade, a taxa de crescimento, etc. O número
de elementos que compoêm uma amostra designa-se por TAMANHO DA AMOSTRA e
representa-se por n. De modo similar, o número total de elementos que constituem a
população (ou o Universo, segundo alguns autores) é representado por N. Como já vimos, o
conjunto das amostras obtidas de determinada população é designado por amostragem.
Os elementos da amostra medem ou descrevem determinada característica da população (por
exemplo, o peso, o sexo ou o comportamento). Essa característica, que é descrita ou medida
pelas observações individuais designa-se por VARIÁVEL (mais adiante elaboraremos sobre
outras definições de variável).
Como para as populações, e aliás como acontece em muitos casos, existem vários “tipos” de
variáveis organizados segundo diferentes critérios. Por vezes, a variável em estudo descreve
determinada qualidade ou atributo em vez de medir certa quantidade: a cor, por exemplo.
Alguns autores referem-se a ATRIBUTOS para designar este “tipo” de variáveis. Contudo,
podemos, para facilitar a análise e a representação, substituir esses atributos por números, isto
é em vez de olhos azuis atribuir o valor 1, ou em vez de olhos castanhos considerar o valor 2,
etc.
Em muitos casos, no entanto, as variáveis são mensuráveis, isto é, podem medir-se ou
quantificar-se de alguma forma e, portanto, podem representar-se numericamente. Nestes
casos, podemos considerar dois “tipos”: VARIÁVEIS DISCRETAS (e.g. contagens); e VARIÁVEIS
CONTÍNUAS (e.g. medições). Nas primeiras, as observações individuais só podem assumir
determinados valores. Por exemplo, o número de folhas no ramo de uma árvore só pode
assumir determinados valores. No segundo caso, a variável pode assumir um qualquer valor
entre quaisquer limites observados, ou seja, é possível existir um valor entre quaisquer outros
dois valores observados.
DISTRIBUIÇÃO DE FREQUÊNCIAS
Independentemente de estarmos a lidar com populações ou com amostras, desde que os dados
sejam numerosos, torna-se incómodo apresentá-los todos de cada vez que isso seja necessário.
À apresentação total das observações individuais (ou dos “dados”), dispostos por ordem
crescente ou decrescente de grandeza, alguns autores (mais antigos) designam por lista ou rol.
Os dados podem, no entanto, ser tratados de forma a simplificar a sua apresentação e
“manuseamento”. Um processo consiste no seu AGRUPAMENTO, isto é na apresentação em
conjunto de todos aqueles cuja grandeza é igual. Um dos modos de apresentar os dados é
através de TABELAS DE FREQUÊNCIAS (Tab. 1).
Uma tabela de frequências inclui, geralmente, a seguinte informação: as classes consideradas
(coluna da esquerda na Tab. 1); e as frequências propriamente ditas (nas colunas mais à
direita). Opcionalmente apresentam-se os pontos médios das classes pj. Vamos abordar a
seguir como obter e dispôr essa informação.
teríamos que:
Para n = 12, k = log2 12 + 1 = 4 + 1 = 5
neste caso, 23 = 8 ou 24 = 16, e decidiu-se trabalhar com maior número de
classes.
Pode-se obter o número de classes k através de outra equação, talvez mais simples:
log n
k= +1
log 2
implícitos pelo número de classes (k) calculado anteriormente obtêm-se as classes para
elaboração da tabela de frequências (observe-se o exemplo seguinte).
Consideremos que uma variável pode assumir quaisquer valores entre 0 e 10. Os
dados brutos obtidos são: 7, 6, 5, 7, 8, 9, 6, 7, 4, 6, 7, 10.
Se o valor máximo = 10, então limite (superior) implícito da última classe = 10,5.
Se o valor mínimo = 4, então limite (inferior) implícito da primeira classe = 3,5.
A amplitude (total) destes limites = 10,5 – 3,5 = 7.
Uma vez que o número de classes proposto é 5, então a amplitude de cada classe
será igual a 7/5 = 1,4.
Ficam assim definidas as 5 classes: de 3,5 a 4,9; de 4,9 a 6,3; de 6,3 a 7,7; de 7,7
a 9,1; e de 9,1 a 10,5.
Se os valores, mínimo e máximo, das observações originais fossem, por exemplo, 4,5 e 10,5,
então os limites implícitos da primeira e da última classe seriam 4,45 e 10,55 respectivamente.
Fj
fj =
n
em que Fj é a frequência absoluta na classe j (j=1,2, …,k) e n é número total de observações
individuais (tamanho da amostra). As frequências relativas permitem comparar duas
distribuições com n diferente, ou seja, a partir de um segundo conjunto de dados (com n igual,
inferior ou superior) poderíamos preparar uma tabela de frequências relativas e desse modo
comparar grosso modo (a “forma”, a distribuição dos resultados) com a que acabámos de
elaborar.
Mas, e se quiséssemos saber quantas observações individuais com valores entre 4,9 e 9,1
ocorreram na amostra do exemplo anterior? Ou quantas observações são maiores ou iguais a
7,7? Neste caso, podemos recorrer às FREQUÊNCIAS RELATIVAS ACUMULADAS (facum) que se
pode obter da soma da frequência relativa de determinada classe com a(s) frequência(s)
relativa(s) das classe anteriores. Complementarmente, as frequências relativas acumuladas
também são úteis para o cálculo de medidas de localização e dispersão da amostra (das quais
falaremos mais adiante). Com esta informação podemos completar a tabela de frequências
apresentada no início desta secção (Tab. 2).
A partir de uma tabela de frequências, que apesar de muito informativa pode ser “maçadora”,
é possível elaborar representações gráficas, HISTOGRAMAS (Fig. 2 e Fig. 3, para variáveis
5
Frequência absoluta (F)
0
4,2 5,6 7 8,4 9,8
Ponto médio de classe
0,4
Frequência relativa (f)
0,3
0,2
0,1
0
0a4 5a9 10 a 13 14 a 17 18 a 20
Classes
0,4
Frequência relativa
0,3
0,2
0,1
0,0
4,2 5,6 7 8,4 9,8
Ponto médio de classe
Fig. 4 – Polígono de frequências (“gráfico de pontos e linhas”) de variável contínua (da Tab. 2).
Para além das tabelas de frequências e das suas representações gráficas (histogramas e
polígonos de frequência), podemos descrever “resumidamente” a amostra (ou a população) de
outra forma. Recorrendo a alguns parâmetros ou medidas de referência comum, é possível
caracterizar uma amostra (ou a população) em termos de localização (ou tendência central) e
de dispersão. As medidas devem: ser objectivas; conter todas as observações; ser precisas
quanto à sua interpretação; ser fáceis de calcular; e variar pouco relativamente às variações
amostrais.
Por exemplo, quando medimos determinada característica (ou variável) da amostra,
geralmente parece ocorrer uma preponderância de valores “médios” ou “centrais”
relativamente à amplitude observada. Assim, uma indicação da “média” da amostra (ou da
população) seria expressiva e útil para a sua descrição. Existem vários PARÂMETROS ou
MEDIDAS DE TENDÊNCIA CENTRAL, possíveis de obter empriricamente a partir da amostra ou
da população, sendo que as mais comuns são a média, a mediana e a moda.
Também é importante quantificar a variabilidade, a variação, dos valores observados em torno
dessa medida de tendência central. Esta informação, resumida em PARÂMETROS ou MEDIDAS
DE DISPERSÃO, pode ser quantificada de diversos modos, como por exemplo através da
amplitude, do intervalo inter-quartil, da variância, do desvio-padrão ou do coeficiente de
variação.
As medidas que a seguir se apresentam, aplicam-se tanto a amostras como a populações. No
entanto, a notação utilizada é relativamente diferente. Por exemplo, para a média e a variância
populacionais usam-se as letras gregas minúsculas µ e σ2, respectivamente. No caso de
médias e variâncias amostrais utilizam-se x e s2 respectivamente. Outras diferenças pontuais
serão assinaladas no texto.
n
sendo que Σ (lê-se “sigma”) indica o somatório dos elementos xi. Quando se pretende calcular
a média a partir de dados agrupados, em tabelas de frequências com k classes, a média obtém-
se com:
k
∑F
j =1
j ⋅ pj
x=
n
em que Fj é a frequência absoluta e pj o ponto-médio da classe j. No caso de populações, a
média aritmética µ (lê-se “miú”) pode calcular-se de modo similar por:
N
∑x i
µ= i =1
em que Π (lê-se “pi”) designa o produto dos elementos. No caso das observações estarem
organizadas numa tabela de frequências poderemos calcular G através de:
k
G = n p1F1 ⋅ p 2F2 ⋅...⋅ p kFk = n ∏pj
Fj
j =1
j =1 j
∑x 2
i
R= i =1
n
A MEDIANA é uma medida menos usada apesar de, em alguns casos, ser mais apropriada do
que a média. Tipicamente, a mediana é definida como o valor, ou a observação, ou a medição,
ou o caso, intermédio numa amostra arranjada por ordem de grandeza. Dito de outro modo, a
mediana de um conjunto de números, ordenados por ordem de grandeza, é o valor para o qual
metade dos elementos do conjunto são menores do que esse valor e outra metade são maiores
do que esse valor. Podemos expressar este conceito da seguinte forma: num conjunto de
valores ordenados por ordem crescente (ou decrescente, é irrelevante!), xi′ em que i=1, 2, …,
n, a mediana M (muitos autores utilizam a notação ~ x ) corresponde a
x(′n +1) / 2
~ se n é impar
x ≡ 1
2 ( x n′ / 2 + x1′+ n / 2 ) se n é par
em que x’(n+1)/2 é a observação individual de ordem (n+1)/2. Quando n é par, então ~x é dado
pela média aritmética dos valores de ordem (n/2) e (1+n/2). No caso de dados agrupados em
tabelas de frequências a mediana é dada por:
n
−∑F
M =~ x = L+2 ⋅a
Fmediana
em que L é o límite inferior da classe que contém a mediana, n é o tamanho da amostra, ΣF é
o somatório das frequências das classes anteriores à classe que contém a mediana, Fmediana é a
frequência da classe que contém a mediana e a é a amplitude dos intervalos de classe (ver
exemplo seguinte). Para saber qual a classe que contém a mediana (essencial para “resolver” a
equação anterior) deve “cruzar-se” a informação dada por x(′n +1) / 2 (independentemente da
tamanho da amostra) com as frequências acumuladas FA.
Na prática, obtêm-se os quantis a partir dos polígonos de frequência relativas acumuladas (ou
utilizando uma aplicação informática adequada, e.g. Microsoft® Excel ou OpenOffice Calc).
Após localizar no eixo das ordenadas (yy) a ordem do quantil pretendido, pode-se procurar a
correspondência horizontal no polígono de frequências e, depois, desenhar uma linha vertical
até ao eixo das abcissas (xx). O ponto em que esta perpendicular intersecta o eixo dos xx
indica o resultado – o quantil pretendido. Procedendo de modo inverso, pode obter-se a ordem
do quantil correspondente a determinado valor observado (xi). Assim, se o quantil de ordem
66% de uma amostra é 27,1 cm, por exemplo, isso significa que 66% das observações, ou
medições, são iguais ou inferiores a 27,1 cm.
Uma terceira medida de tendência central é a MODA. A palavra moda é vulgarmente usada
noutro contexto embora o seu significado estatístico não seja muito diferente daquele. A moda
(ou normal segundo autores mais antigos), m, designa o valor (ou valores) que mais vezes
ocorre(m) num conjunto de valores xi em que i=1,2,...n. Acontece que, por vezes, não é
possível calcular m, pois em algumas séries de valores não existe nenhum repetido. Pelo
contrário, noutros casos é possível que a série possua mais do que uma moda. No caso dos
dados se encontrarem agrupados, não é possível identificar directamente a moda, mas
simplesmente saber qual é a CLASSE MODAL, isto é, a classe que contém a moda.
Os seguintes dados brutos não têm moda: 3, 5, 8, 10, 12, 15, 16.
Se, no entanto, observarmos os seguintes casos, é possível determinar a moda: 2,
2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 (conjunto unimodal). Neste caso, m=9.
Noutro caso aínda, é possível observar duas modas: 2, 3, 4, 4, 4, 4, 5, 5, 7, 7, 7, 7,
9, 11 (conjunto polimodal). Neste caso, m1=4 e m2=7.
Medidas de dispersão
A AMPLITUDE A (ou h) é a diferença entre o maior e o menor valor observados numa série de
dados:
A = xmax − xmin
Na Fig. 5 é possível observar que as amplitudes de a e b são A (a) = 1,5-(-1,5) = 3 e A(b) = 4-
(-4) = 8, respectivamente. A amplitude é fácil de obter e é expressa na mesma unidade da
variável que estamos a estudar.
O INTERVALO INTER-QUARTIL, IQ, obtém-se da diferença entre o 3º e 1º quartis,
IQ = Q3 − Q1
No entanto, são medidas “relativamente rudes” da dispersão dos dados, pois apenas
consideram o valor máximo e o valor mínimo (A) ou o 1º e 3º quartis (IQ).
Outra medida de dispersão, bastante mais comum em estatística e frequentemente utilizada
em análise estatística, é a VARIÂNCIA s2 da amostra (ou a variância da população σ2 – em que
σ lê-se “sigma”). Será necessário, entretanto, introduzir alguns conceitos que facilitam a
compreensão do seu significado, nomeadamente os conceitos de desvio, de soma dos
quadrados e de mínimos quadrados.
a
f(x)
-5 -4 -3 -2 -1 0 1 2 3 4 5
15
10
-5
D
-10
-15
-20
-25
Elem ento i da am ostra
Fig. 6 – Representação esquemática dos desvios (D) de cada elemento i da amostra relativamente à
média, numa amostra de n=12 observações com média é igual a 26.
Infelizmente verifica-se que D = 0, pois teoricamente existem tantos valores menores do que
média assim como ocorrem valores maiores do que a média. Um modo de ultrapassar esta
“dificuldade” é elevar ao quadrado os desvios di e desse modo obter a soma dos quadrados
j =1 j =1
s2 =
n(n − 1)
em que j=1, 2, …, k e desde que n≥30. Segundo alguns autores, o desvio-padrão é a medida
de dispersão mais importante em estatística paramétrica pois permite expressar a variabilidade
das observações nas unidades da variável em estudo, ao contrário da variância. O DESVIO-
PADRÃO da amostra, s, é a raíz-quadrada positiva da variância, ou seja:
s = s2
Por analogia com os parâmetros anteriores, o desvio-padrão populacional designa-se σ e
obtém-se através de σ = σ 2 . Esta medida de dispersão é expressa nas unidades dos valores
observados, e antes da definição actual (de 1893) que se deve a Karl Pearson [1857-1936],
designava-se por erro-médio.
As medidas de dispersão de que falámos até agora são por vezes classificadas como medidas
de dispersão absolutas pois referem-se à variabilidade numa amostra em termos concretos.
Contudo, a comparação entre amostras com valores (e médias) substancialmente diferentes ou
com unidades de medida diferentes, “dificulta” a sua utilização. As medidas de dispersão
relativa, que resultam em números abstractos, relacionam numa mesma amostra uma medida
de dispersão com uma medida de tendência central. A mais comum destas medidas é o
COEFICIENTE DE VARIAÇÃO c.v. que é o quociente, em percentagem, entre o desvio-padrão e
a média de uma amostra, isto é:
s
c.v. = ⋅100%
x
Para resumir ou descrever a informação duma amostra (ou população) deve-se apresentar uma
medida de localização e uma medida de dispersão, a média e o desvio-padrão por exemplo.
Até aqui, têm-se abordado tópicos geralmente classificados como pertencentes ao âmbito da
ESTATÍSTICA DESCRITIVA, de definição óbvia: amostra, tabelas de frequências e respectivas
representações gráficas (histogramas e polígonos de frequências), e medidas de tendência
central e de dispersão.
[Resolver Exercícios – Capítulo I]
Exemplo 1. Quando se lança um dado, diz-se que se realiza uma prova aleatória.
Nesta prova existem seis acontecimentos possíveis: “sair” a face com 1, ou 2, ou
3, ou 4, ou 5 ou 6 pontos.
Exemplo 2. Quando um técnico de controlo da qualidade selecciona uma lata de
sardinha (com o objectivo de verificar se a lata é defeituosa), diz-se que está a
realizar uma prova aleatória, em que existem dois acontecimentos possíveis: a
lata tem defeito, ou não.
Exemplo 3. Lançamento simultâneo de dois dados. Nesta prova aleatória existem
36 acontecimentos possíveis.
CONCEITO DE PROBABILIDADE
1
Entede-se por postulado, ou axioma, qualquer proposição aceite sem demonstração (Eric Weisstein. “Axiom”
Mathworld – A Wolfram Web Resource. http://mathworld.wolfram.com, consultado em 10/03/2005).
Acontecimento possível
a1 a2 a3 a4 a5
Evento A
a6 a7 a8 ... an
Espaço amostral S
Fig. 7 – Representação esquemática dum espaço amostral S associado a uma prova aleatória. Dos
vários acontecimentos possíveis ai, apenas alguns pertencem ao evento A.
Teorema da adição
2
Teoremas são proposições (ou afirmações) que se podem provar como verdadeiras, usando operações e
argumentos matemáticos, numa deterinada estrutura lógica (ou sistema axiomático) (idem, ibidem).
Teorema da multiplicação
Teorema da complementaridade
6. DISTRIBUIÇÃO DE PROBABILIDADES
VARIÁVEL ALEATÓRIA
como método necessário para a análise estatísticamente válida dos assuntos. Assim sendo, é
importante definir o que é uma variável aleatória e as suas principais características (ou
propriedades), ou seja: X é uma VARIÁVEL ALEATÓRIA quando o seu valor (numérico) é
determinado pelo acontecimento possível de uma prova aleatória.
A definição que se encontra nos manuais de estatística é, mais ou menos, a seguinte: Sejam ε
(lê-se “épsilon”) uma prova aleatória (ou experiência) e S um espaço amostral associado a
essa prova aleatória. Uma função X que associe a cada acontecimento possível (elemento) ai
desse espaço amostral um número real X(ai), ou mais simplesmente xi, é denominada
VARIÁVEL ALEATÓRIA.
A terminologia usada é um tanto infeliz mas é universalmente aceite. Torna-se claro que X é
uma função, contudo denominamo-la variável (aleatória)! É evidente que nem todas as
funções imaginárias se podem considerar variáveis aleatórias. Um requisito importante é que
as probabilidades dos acontecimentos e respectivos resultados (da função variável) sejam bem
definidos e consistentes com os axiomas básicos (ver tópico anterior).
Na maior parte das utilizações não se indica a natureza funcional da variável aleatória X (neste
texto, usaremos v.a. para referir uma variável aleatória). Geralmente, interessam mais os
valores possíveis da v.a. X do que “a sua origem” (Fig. 9).
x1 x2 x3 x4 x5
Função variável aleatória, v.a.
a1 a2 a3 a4 a5
Evento A
a6 a7 a8 ... an
Espaço amostral S
Fig. 9 – Representação esquemática do conceito de função variável aleatória, v.a. (linhas contínuas no
topo da figura). S – espaço amostral duma prova aleatória, A – evento, ai – acontecimento possível, e xi
– resultado possível.
As probabilidades dos resultados possíveis duma v.a. X, xi, também se podem estudar. Para
esse fim podem utilizar-se as distribuições (ou leis) de probabilidades.
No caso das VARIÁVEIS DISCRETAS, a variável aleatória X pode tomar valores xi com i=1,
2,..., n. À função que estabelece uma correspondência entre o resultado da variável aleatória
X(ai), ou xi, e a respectiva probabilidade denomina-se FUNÇÃO DENSIDADE DE
PROBABILIDADE, e representa-se por P(X=xi) ou p(xi).
Como anteriormente, podemos representar graficamente esta função, agora por um polígono
(de frequências), por exemplo (Fig. 10b).
a) Para cada resultado de um acontecimento possível xi, com i=1, 2, ..., n, a sua probabilidade
pode variar entre zero e um:
0 ≤ P(X=xi) ≤ 1, i=1, 2, ..., n
b) O somatório de todas as probabilidades correspondentes a cada resultado dum
acontecimento é igual a um:
n
∑ P( X = x ) = 1
i =1
i
0,7 1
0,6
0,8
0,5
0,6
P(X=xi)
P(X<xi)
0,4
0,3 0,4
0,2
0,2
0,1
0 0
0 1 2 0 0,5 1 1,5 2
X X
(a) (b)
Fig. 10 – (a) Função densidade de probabilidade P(X=xi) e (b) função distribuição de probabilidade
P(X≤xi) duma v.a. discreta.
DISTRIBUIÇÃO BINOMIAL
Considere-se uma prova (experiência) aleatória que tem apenas dois acontecimentos
possíveis: um que se designa por “sucesso” (a1) e o seu complementar designado por
“insucesso” (a0). Em cada p.a. a probabilidade de ocorrer a1 é p e q=(1–p) é a probabilidadade
do “insucesso”, ambas constantes – prova aleatória de Bernoulli. A distribuição binomial é o
modelo probabilístico adequado para os casos em que se consideram repetidas provas
aleatórias independentes como a descrita. Nestes casos, o conjunto de resultados nas
sucessivas provas constitui uma variável aleatória discreta que segue a distribuição binomial.
De facto, as probabilidades de observar a v.a. X igual a 0, 1, 2,..., n são dados por (1-p)n,
n(p)(1-p)n-1, n!/2!(n-2)!(p2)(1-p)n-2, ... pn, em que p é a probabilidade de realização do
acontecimento em cada prova. Aquelas quantidades correspondem ao desenvolvimento do
binómio [(1-p)+p]n=1, daí a designação distribuição binomial.
Na DISTRIBUIÇÃO BINOMIAL, devida a Jakob Bernoulli [1654-1705], numa sequência de n
provas aleatórias, com reposição, a FUNÇÃO DENSIDADE DE PROBABILIDADE da v.a. discreta X
– número de “sucessos” – que pode tomar os valores xi = 0, 1, 2,..., n é dada por:
P ( X = xi ) = Cxn ⋅ p x ⋅ (1 − p ) n − x
em que p é a probabilidade de ocorrer o resultado favorável (ou sucesso) em cada prova e se
mantém constante de experiência para experiência, n é o número máximo de tentativas (ou
provas aleatórias) independentes e C xn é dado pela expressão de cálculo combinatório:
n n!
C xn = =
x x!(n − x)!
i.e. em n p.a. independentes existem C xn maneiras diferentes de se obterem x “sucessos”.
Também se pode “ler” C xn como o nº de combinações de ordem x de um conjunto de cardinal
igual a n (com x≤n). A função densidade de probabilidades da distribuição binomial depende
dos parâmetros p e n, e é usada quando cada prova aleatória tem apenas dois acontecimentos
possíveis e de natureza qualitativa: a1 – sucesso ou 1; e a0 – insucesso ou 0. Uma v.a. X que
segue esta distribuição representa-se por X ∩ Binomial(n, p) ou X ~ Binomial(n, p).
Tab. 5 – Casos possíveis no exemplo anterior (cf. Fig. 11). Probabilidades calculadas por aproximação
e recorrendo à função densidade de probabilidades da distribuição binomial P(X=xi).
xi Casos (acontecimentos) possíveis Por aproximação P(X=xi)
0 000 1(5/6)(5/6)(5/6) 0,5787
1 100 010 001 3(1/6)(5/6)(5/6) 0,3472
2 110 101 011 3(1/6)(1/6)(5/6) 0,0694
3 111 1(1/6)(1/6)(1/6) 0,0046
0,2
Fig. 12 – Modificação da
0,15
forma da função de densidade
0,1
de probabilidades da
0,05 distribuição binomial com a
0 alteração de p.Variável
0 1 2 3 4 5 6 aleatória X com resultados
xi possíveis xi=1,2, …, 6.
DISTRIBUIÇÃO DE POISSON
P ( X = xi ) = ⋅ e −λ
xi !
em que λ = n ⋅ p (λ lê-se “lambda”), λ > 0 e xi=0, 1, ..., n (Fig. 13). Alguns autores referem-
se a λ como valor médio da v.a. X, que é representada por X ∩ Poisson(λ). Como no caso da
distribuição binomial, a função distribuição de probabilidades (PX≤xi) obtém-se por adição
das probabilidades dos resultados de X ≤ xi.
O VALOR MÉDIO e a VARIÂNCIA da distribuição de Poisson têm valor igual, ou seja,
E{ X } = λ = n ⋅ p = V { X }
Note-se que o valor médio e a variância são iguais. Esta é uma propriedade muito interessante
da distribuição de Poisson, se se atender às condições iniciais, n→∞ e p→0. Para um dado
valore de λ, é possível consultar tabelas de probabilidades para a função densidade de
probabilidades da distribuição de Poisson (tabelas com x linhas e λ colunas) e obter a
probabilidade pretendida.
0,25 0,7
0,6
0,2
0,5
0,15
P(X=xi)
P(Y=yi)
0,4
0,1
0,3
0,2
0,05
0,1
0 0
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9
X Y
(a) (b)
Fig. 13 – Funções densidade de probabilidade de v.a. X e Y com distribuição de Poisson com (a) λ=3
(ver exemplo anterior) ou (b) λ=0,5, em que xi=0, 1, 2, …, 9 e yi=0, 1, 2, …, 9.
3
Alguns autores referem n>20 e np<7, ou então n>50 e np<5, como condições adequadas para a utilização da
distribuição de Poisson.
No caso das v.a. contínuas, a densidade de probabilidades está continuamente dispersa pelo
espaço amostral S ao invés de se concentrar num conjunto discreto de resultados como
acontece com as v.a. discretas (Fig. 14). Enquanto no caso de v.a. discretas a probabilidade do
espaço amostral é “dividida” pelos resultados possíveis, nas v.a. contínuas aquela
probabilidade “está amassada” e distribuida pelos (não-enumeráveis) resultados possíveis xi.
Por esse motivo, a probabilidade da v.a. contínua X tomar um valor particular xi é nula.
Contudo, um determinado acontecimento possível (ou resultado) xi é quase-impossível mas
não é impossível pois em cada realização da prova aleatória (ou experiência) obtém-se sempre
um resultado e, por conseguinte, é possível obter xi. Por outras palavras, dizer que “a
probabilidade pontual é sempre nula” quer somente traduzir que é nula a probabilidade de
“acertar” exactamente no resultado xi. Logo, no caso das v.a. contínuas, as probabilidades
estudam-se para intervalos de valores de X e não para valores “exactos” de X.
Se se dividir a probabilidade de X tomar um valor do intervalo [x; x+∆x] pela amplitude desse
intervalo ∆x, obtém-se de forma aproximada a densidade de probabilidade da v.a. X tomar um
valor qualquer do intervalo [x;x+∆x], ou seja,
v.a. discreta
P(X=xi)
v.a. contínua
f(x)
(note-se que o limite superior de integração é x, pelo que há que considerar uma variável de
integração distinta de x, no caso a variável u).
Enquanto no caso discreto, a função distribuição de probabilidades era obtida somando
P(X=xi), em domínios contínuos aquela função é calculada por integração da função
densidade de probabilidades (Fig. 15).
4
O integral ∫ é um objecto matemático que se pode interpretar como uma área, ou uma generalização de uma
área. Juntamente com as derivadas são os objectos fundamentais do Cálculo.
0 Se t < 0
F (t ) t
[ ]
t
−0, 5t − 0 , 5t
∫0 0,5e du = 0,5e = 1− e Se t ≥ 0
-0,5t
0
Probabilidade = Área
f(x)
(a)
x x+dx
X
F(x+dx)
F(x)
Probabilidade
F(x)
(b)
x x+dx
X
Fig. 15 – Representação gráfica (a) duma função densidade de probabilidades f(x). A área assinalada
sob curva y = 12x(1 – x)2, acima dos eixo das abcissas e entre as semi-rectas verticais Y=x e Y=x+dx
corresponde à probabilidade da v.a. contínua X assumir um valor do intervalo e (b) da respectiva
função distribuição de probabilidades F(x)=6x2 –8x3 +3x4.
e a VARIÂNCIA por
+∞
V { X } = ∫ ( x − E{ X }) 2 ⋅ f ( x)dx
−∞
Do ponto de vista formal, a passagem do caso discreto para o caso contínuo (ou vice-versa)
faz-se por “dualidade”, substituindo-se os somatórios ∑ por integrais ∫ e as probabilidades
P(x) por densidades f(x). Atente-se que no caso contínuo P(X=xi)=0 para todo o real xi e,
portanto, o que se calcula recorrendo a f(x) é a área correspondente ao intervalo [x, x+∆x] – a
“probabilidade média” – nessa porção do continuum.
É importante, como se fez no caso das probabilidades de v.a. discretas, estudar algumas
distribuições de probabilidades teóricas de utilização muito generalizada.
DISTRIBUIÇÃO NORMAL
f ( x) =
1
e
[
− ( x − µ ) 2σ ]2
σ 2π
com os parâmetros µ e σ e em que -∞<x<+∞, -∞<µ<+∞, σ>0, π = 3,141659... e e a função
exponencial. Para indicar que a v.a. contínua X tem distribuição normal usa-se X ∩ N (µ,σ).
Dado que a função densidade de probabilidades f(x) da distribuição normal tem dois
parâmetros, média µ e desvio-padrão σ, cada par de valores de µ e σ origina uma curva com
“forma diferente”. Contudo, f(x) da distribuição normal é sempre simétrica, em forma de sino,
centrada em µ (que determina a posição da distribuição no eixo das abcissas que corresponde
ao “universo” de valores de X), e dispersa relativamente a µ de acordo com o desvio-padrão σ
(Fig. 17).
No caso da distribuição normal, também se pode resumir a informação acerca das
probabilidades recorrendo a “medidas de localização e dispersão”, já referidas anteriormente
– VALOR MÉDIO E{X} e VARIÂNCIA V{X} da distribuição de probabilidades:
+∞
E{ X } = ∫ x ⋅ f ( x)dx = µ
−∞
+∞
V { X } = ∫ ( x − E{ X }) 2 ⋅ f ( x)dx = σ 2
−∞
σ
f(x)
µ X
µ=12, σ=3
(a)
µ=15, σ=3
(b)
f(x)
µ=15, σ=6
(c)
0 10 20 30 40 50
Fig. 17 – Comparação entre a forma de três curvas normais (funções densidade de probabilidades)
com diferentes parâmetros µ e σ. As “curvas” (a) e (b) com média µ diferente mas com desvio-padrão
σ igual. Pelo contrário, as “curvas (b) e (c) possuem igual média µ mas diferente desvio-padrão σ.
O cálculo da área sob a curva normal para determinado intervalo da variável aleatória
contínua, que se efectua por integração da função densidade para os valores de µ e de σ
pretendidos, seria um trabalho um “pouco fastidioso” e, infelizmente, não é possível tabelar
todas as combinações possíveis de µ e σ. Como resolver este “problema”?
Um modo de padronizar os resultados é recorrer à transformação da variável aleatória X numa
nova variável Z com média igual a 0 e desvio-padrão igual a 1, ou seja, Z ∩ N (0,1). Deste
modo, se define a DISTRIBUIÇÃO NORMAL REDUZIDA Z transformando a v.a. X ∩ N (µ,σ), da
seguinte forma:
X −µ
Z=
σ
Esta transformação permite “reduzir” (ou sintetizar ou padronizar) qualquer distribuição
normal desde que se conheçam µ e σ daquelas distribuições (Fig. 19). A tabulação da
distribuição de probabilidades de Z, comum em qualquer manual de estatística, permite obter
com facilidade P(X≤xi) para qualquer v.a. X ∩ N (µ,σ). Basta calcular zi e, posteriormente,
consultar a tabela de Z (que geralmente apresenta a função distribuição de probabilidades ou
“probabilidades acumuladas”) para o valor obtido (ver Tabela A). Por outro lado, a maíoria
das “calculadoras científicas” e do software (folhas de cálculo) permite obter com facilidade a
probabilidade de Z ≤ zi.
µ=20, σ=3
f(x)
0 4 8 12 16 20 24 28 32 36 40
-2 0 +2 Z
Fig. 19 – Ilustração da relação entre a distribuição dos resultados possíveis xi da v.a. contínua X e os
valores de Z correspondentes. Tente determinar os valores xi correspondentes a zi= –2 e +2.
DISTRIBUIÇÃO T DE STUDENT
g.l.=80
f(x)
g.l.=4
Fig. 20 – Representação de duas distribuições t de Student para diferentes graus de liberdade (g.l.).
Uma vez que P(t<t0)=90% logo da tabela vem que t0=1,363. Como
t = ( X − x ) s ⇔ 1,363 = ( xi − 107) 23 ⇔ xi = 138,4 min .
[Resolver Exercícios – Capítulo IV]
7. INFERÊNCIA ESTATÍSTICA
Um dos objectivos principais da análise estatística é derivar (ou inferir) conclusões válidas
acerca de uma população através do exame de amostra(s) dessa população. A inferência
estatística pretende responder a dois tipos de questões:
1) Qual é o valor de um certo parâmetro da população? (ESTIMAÇÃO DE PARÂMETROS, ver a
seguir)
2) Pode considerar-se que um dado parâmetro da população tem determinado valor? (PROVA,
OU TESTE, DE HIPÓTESES, ver mais adiante).
AMOSTRAGEM ALEATÓRIA
Populações finitas
Quando se pretendem estudar populações finitas, a amostragem aleatória simples pode ser
feita:
a) COM REPOSIÇÃO – se cada elemento da população pode ser escolhido mais de uma vez,
isto é, após recolher informação (medir ou categorizar a variável em estudo) numa
amostra, o elemento é devolvido à população. Na amostragem a.s. com reposição, cada
elemento de uma população com N elementos tem sempre uma probabilidade p = 1/N de
ser seleccionado. Note-se que, a amostragem com reposição duma população finita pode
considerar-se teoricamente como infinita.
b) SEM REPOSIÇÃO – se cada elemento da população não pode ser escolhido mais de uma
vez. Nestes casos, o procedimento de amostragem é o seguinte: seleccionar o primeiro
elemento da amostra dando a cada elemento da população igual probabilidade de ser
escolhido, ou seja, p = 1/N; seleccionar o segundo elemento da amostra, considerando que
os N – 1 elementos restantes possuem igual probabilidade de serem escolhidos, ou seja, a
p = 1/(N – 1); repetir o processo até os N elementos da população serem seleccionados.
Em qualquer dos casos, a selecção dos elementos da amostra pode ser auxiliada pela
utilização de uma tabela de números aleatórios (Tabela C, em anexo). Para cada posição na
tabela, os dígitos 0, 1,..., 9 têm igual probabilidade de ocorrerem e as várias posições na tabela
são independentes.
Populações infinitas
As questões relacionadas com a amostragem têm muita importância, pois garantem a validade
das conclusões que se pretendem elaborar em estatística. Na maíoria das “situações reais” não
é possível estudar toda a população estatística, pelo que é necessário seleccionar amostra(s) e
analisar características dessas amostra(s) de modo a “dizer coisas” acerca da população. De
entre as características da amostra(s), a média da amostra x é de utilização generalizada e
constitui um dado importante na “prática estatística”. Assim, é possível e importante estudar a
distribuição (de probabilidades) da média na amostragem.
Observe-se com atenção a Fig. 21. A partir de uma população estatística com N=8042
elementos, seleccionaram-se aleatoriamente amostras de n=3, n=10 e n=100 elementos e para
cada amostra calculou-se a média amostral x . Os polígonos de frequências absolutas dos
resultados obtidos (a média x para cada amostra seleccionada) indicam que:
a) O valor médio da distribuição dos valores de x das amostras aleatórias é igual à média da
população µ;
b) O desvio-padrão da distribuição dos valores de x decresce com o aumento do tamanho
amostra;
c) A distribuição dos valores de x vai ficando cada vez mais simétrica à medida que o
tamanho da amostra aumenta; este último resultado é conhecido como TEOREMA DO
LIMITE CENTRAL (de que falaremos mais adiante).
N=8042 n=3
µ=30,3 E{X}=30,3
σ=30,33 σ{X}=17,80
F
X X
n=100
n=10 E{X}=30,3
E{X}=30,3 σ{X}=3,05
σ{X}=9,13
F
X X
Fig. 21 – Distribuição na amostragem de x nas amostras possíveis de tamanho n=3, n=10 e n=100 que
se podem obter duma população "original" com N=8042 elementos.
Se a selecção de uma amostra fôr aleatória, então a média x da amostra é resultado duma
variável aleatória à qual está associada uma distribuição de probabilidades. Pode-se, portanto,
recorrer ao valor médio e à variância para descrever resumidamente aquela distribuição de
probabilidades.
Assim, qualquer que seja o tamanho da amostra n, o valor médio da distribuição de
probabilidades de x é dado por:
E{ X } = µ
e a variância é igual a:
σ2
V {X } =
n
O desvio-padrão das probabilidades de x , que se designa erro-padrão da média (usualmente o
desvio-padrão dum estimador de um parâmetro, i.e. duma “estatística”, denomina-se erro-
padrão) é igual a:
σ
{X } = σ {X } =
n
Por maioria de razão, para um certo tamanho de amostra n, quanto maior é a variabilidade da
população maior é a variabilidade da distribuição das médias na amostragem.
Qual é a altura média dos alunos da EST? Qual é o peso líquido de iogurte
nas embalagens produzidas em determinada fábrica?
Estimação pontual
Quando uma característica da população é estimada por um simples valor, este é designado
por ESTIMATIVA PONTUAL. Dito de outro modo: o ESTIMADOR é uma variável aleatória usada
para estimar uma característica da população. O valor numérico do estimador designa-se por
ESTIMATIVA.
Nos casos em que a distribuição de x na amostragem é normal, pode-se esperar que a média
da população µ se encontre nos intervalos x + σ, x + 2σ e x + 3σ, aproximadamente em
68,27%, 95,45% e 99,73% das vezes, respectivamente (cf. Fig. 18). Por esse motivo, estes
intervalos são denominados INTERVALOS DE CONFIANÇA de 68,27%, 95,45% e 99,73% (para
avaliação) de µ. Os números extremos desses intervalos são denominados LIMITES DE
CONFIANÇA. De modo semelhante, x + 1,96σ e x + 2,58σ são limites de confiança de 95% e
99% de µ. A percentagem de confiança c é frequentemente denominada NÍVEL DE
CONFIANÇA e a probabilidade complementar α (α lê-se “alfa”) é designada por NÍVEL DE
SIGNIFICÂNCIA ou “risco” sendo que c=1–α. Os números 1,96 e 2,58 nos limites de
5
5
É vulgar usar proporções em vez de percentagens nas indicações e cálculos. Logo 95% de confiança indica-se
por c = 0,95 e um nível de significância de 5% designa-se α = 0,05.
valor de Z é arbitrário, isto é, pode ser escolhido (da Tabela A, em anexo) de modo que a
probabilidade (ou confiança) pretendida seja igual a 1–α. Assim, para cada um dos limites de
confiança, Z ficará definido para 1 – α/2 (ou seja, metade de α em cada extremo da
distribuição) (cf. Fig. 18 e Fig. 19). Duma forma geral, a probabilidade do intervalo de (1–
α)100% de confiança de µ com nível de confiança de 1 – α, é dada por:
σ σ
P{x − z α < µ < x + z α } = 1−α
1− 2 n 1− 2 n
Será que a média das alturas dos alunos da EST é 183 cm? Será que, em média,
as embalagens de iogurte da marca W têm um peso líquido de 125 mL?
Se, por exemplo, o teste é feito sobre a média da população µ, podem elaborar-se três tipos de
hipóteses:
H0: µ = µ0 e H1: µ ≠ µ0 – Hipóteses bilaterais
H0: µ ≤ µ0 e H1: µ > µ0
H0: µ ≥ µ0 e H1: µ < µ0 } Hipóteses unilaterais
ERROS DE INFERÊNCIA
"Aceitação"
Concluir H0
Rejeição Rejeição
Concluir H1 Concluir H1
(a)
L1 µ0 L2 X
"Aceitação"
Concluir H0
Rejeição
Concluir H1
(b)
L1 µ0 L2 X
"Aceitação"
Concluir H0
Rejeição
Concluir H1
(c)
L1 µ0 L2 X
Não podemos evitar completamente estes erros, mas podemos tentar minimizar a
probabilidade de os cometer. Os erros de tipo I poderão ser reduzidos, directamente, se
diminuirmos α (o nível de significância) e por conseguinte aumentando a confiança. No
entanto, sabe-se que, para determinado tamanho de amostra n, o valor de α está inversamente
relacionado com o valor de β, ou seja, à menor probabilidade de cometer erros de tipo I está
associada a maior probabilidade de cometer erros de tipo II ( α ∝1 β ). O único modo de
reduzir ambos os erros é aumentar o tamanho da amostra n a partir da qual se pretende inferir.
Por outro lado, é possível medir o “poder estatístico” de um teste estatístico recorrendo à
Com este “tipo” de hipóteses pretende-se responder a perguntas do género: “Será que o
volume médio de sumo nas embalagens de determinada marca é igual a 20 cl, ou não?”.
Observe-se a Fig. 22(a), onde se ilustra este tipo de testes de hipóteses. Só se aplicam se a
variável se distribui normalmente na população. Caso contrário, os testes apenas se aplicam
quando o tamanho da amostra é grande, por regra n>30 elementos. O procedimento que a
seguir se apresenta utiliza conceitos relacionados com intervalos de confiança.
1−α=0,95
X
L1=550-1,96σ /√n µ0=550 L2=550+1,96σ /√n
Fig. 23 – Ilustração da regra de decisão para H0: µ = 550 e H1: µ ≠ 550 (com α=0,05). Apresentam-se
duas escalas para as abcissas: os valores-limite na distribuição de Z e os valores da variável “original”
X correspondentes àqueles limites.
s
L = µ 0 − t[n−1,1−α ]
n
ii) Para as hipóteses H0: µ ≤ µ0 e H1: µ > µ0; Se x ≤ L, concluir H0; caso contrário, i.e. se x >
L, concluir H1. O limite (superior) de confiança, quando se conhece a variância σ2, calcula-se
da seguinte forma:
σ
L = µ 0 + z [1−α ]
n
ou então recorrendoà distribuição t-Student e à variância amostral s2, através de:
s
L = µ 0 + t[n−1,1−α ]
n
Se a variância populacional σ2 fôr conhecida, é possível recorrer à distribuição normal
reduzida Z. Nesse caso, os cálculos envolvem z[1-α] em vez de t[n-1,1-α] e σ em vez de s, mas as
regras de decisão são, em tudo, semelhantes às mencionadas anteriormente.
Note-se, mais uma vez, que no caso de testes de hipoteses unilaterais os valores de z (ou t) são
obtidos para probabilidades de (1 – α) em vez de (1 – α/2), em virtude de interessar apenas um
dos limites do intervalo de confiança.
obtém-se que t [11,0.95] = 1,796 para α=0,05. Como | t0 | > t, rejeita-se a H0,
isto é, a conclusão é igual àquela que se obteve usando limites.
Este é o procedimento mais vulgar de realizar testes de hipóteses não só acerca da média
como para outros parâmetros populacionais importantes. Nos manuais de estatística aplicada
referem-se a estes testes de hipóteses com teste de z e teste de t para uma amostra (em inglês,
“one-sample z-test” ou “one-sample t-test”).
[Resolver Exercícios – Capítulo V]
Até aqui têm-se tratado tópicos da estatística relacionados com uma única variável (estatística
univariada ou univariável). No entanto, é possível e muitas vezes desejável, estudar a relação
que existe entre duas ou mais variáveis. Considere-se o caso de se pretenderem estudar duas
variáveis. Com muita frequência e em muitos casos práticos, verifica-se que existe uma
relação entre duas variáveis. Frequentemente, é possível expressar essas relações sob a forma
matemática, estabelecendo uma equação que “ligue” as variáveis.
Nestes dois exemplos, as relações entre as duas variáveis são funcionais e todos os valores de
Y estão sobre a linha recta (no primeiro exemplo) ou sobre a curva (no segundo exemplo) que
descrevem aquelas relações (Fig. 24).
25000 120
100
20000
80
15000
60
Y
Y
10000
40
5000
20
0 0
0 2 4 6 8 10 0 2 4 6 8 10
X X
No entanto, em várias situações não se conhece a relação funcional entre duas variáveis X e Y,
mas poderá existir uma RELAÇÃO ESTATÍSTICA entre aquelas variáveis, como por exemplo na
descrição do crescimento de microrganismos através dum model exponencial. De facto, diz-se
relação estatística porque será obtida a partir dos resultados, através de métodos estatísticos
apropriados. A Fig. 25 é composta por dois DIAGRAMAS DE DISPERSÃO que mostram relações
estatísticas lineares e não-lineares entre variáveis.
12000 1050
900
10000
x1000 UFC/ml
750
8000 y = 1811,5 + 84,13x
Peso (kg)
600
6000 y = 13,068e 0,2158x
450
4000 300
2000 150
0 0
0 25 50 75 100 0 5 10 15 20
Nº em balagens Horas
Fig. 25 – Diagramas de dispersão entre o peso e o número de embalagens (à esq.) e entre a densidade
de bactérias e o tempo de incubação (à dir.). As linhas (e respectivas equações) correspondem às
relações estatísticas (lineares, à esq., e não-lineares, à dir.) possíveis de estabelecer entre as variáveis.
Para evitar critérios individuais e subjectivos na escolha do modelo de regressão que se ajusta
ao conjunto dos dados (rectas, curvas, etc. cf. Fig. 25), é necessário definir a “melhor recta ou
cruva de ajustamento”. Para definir, objectivamente, uma das várias relações possíveis entre
duas variáveis X e Y, considere-se a Fig. 27 na qual os dados estão representados pelos n
pontos de coordenadas (x1, y1), (x2, y2), ..., (xn, yn). Assim, para um dado valor de X, digamos
por exemplo x1, haverá uma diferença entre y1 e o valor correspondente determinado (ou
estimado ŷ1 ) pela equação da curva ajustada (representada pela linha C na Fig. 27). Essa
diferença D1, designa-se por ERRO, DESVIO ou RESÍDUO e pode ser positivo, negativo ou nulo.
Se a curva (ou recta, etc.) se distanciar de igual forma de todos os pontos (xi, yi) então:
∑ Di =∑ ( yi − yˆ i ) = 0
Logo, pode obter-se uma medida da “qualidade do ajustamento” de uma recta (ou curva) a um
conjunto de dados pela quantidade seguinte:
∑ ∑
SQ = Di 2 = (Yi − Yˆ ) 2
Quanto menor for SQ, então melhor será o ajustamento. O método dos mínimos quadrados
pretende MINIMIZAR A QUANTIDADE SQ (alguns autores utilizam Q), que é a SOMA DOS
QUADRADOS DOS ERROS. Sendo assim, de todas as rectas (ou curvas) que se ajustam a um
conjunto de pontos, aquela que tem a propriedade de resultar no menor valor de SQ é
denominada a melhor recta (ou curva) de ajustamento, é a “equação dos mínimos quadrados”.
Fig. 26 – Ilustração (adaptada de Neter et al.) dos conceitos relacionados com a regressão (ver texto).
A mais simples relação funcional entre duas variáveis é definida pela equação da recta
Y = A+ B⋅ X
em que A é intercepção ou ordenada na origem e B é o declive (Fig. 28). Nesta equação, A e B
são parâmetros derivados da(s) amostra(s)6. Contudo, independentemente de se estar a estudar
uma amostra ou uma população, será invulgar que todos os pares de resultados (xi, yi) se
posicionem exactamente sobre a recta, pelo que será mais adequado escrever a equação na
seguinte forma:
Y = A+ B⋅ X +ε
em que ε (lê-se “épsilon”) designa o erro, ou desvio, ou resíduo (ou seja, a diferença entre
cada valor de yi e o valor estimado ŷi – cada diferença Di definida anteriormente).
50
Variável dependente, Y
40
30
B
20
10
}e 2
A
0
0 2 4 6 8 10
Variável independente, X
Fig. 28 – Ilustração dos parâmetros da equação da recta yˆ = 4,4 + 4,8 x . A ordenada na origem
(A=4,4) corresponde ao valor estimado de Y quando X=0, enquanto que o declive (B=4,8) é a variação
do Y por cada alteração unitária do X, isto é, se X aumentar de 4 para 5 então Y aumentará 4,8
unidades. A recta desenhada não coincide com os pontos. As diferenças (distâncias verticais) entre os
valores observados (pontos) e estimados (linha) correspondem aos erros (destaca-se o erro relativo à
segunda observação, e2).
A RECTA DOS MÍNIMOS QUADRADOS que se ajusta ao conjunto de pontos (x1, y1), (x2, y2), ...,
(xn, yn) em que n=1, 2, …, i tem equação:
Yˆ = A + B ⋅ X
em que Yˆ (lê-se “estimador de Y”) indica que a cada valor de X (um dado xi) corresponde um
valor estimado (ou esperado) de Y na recta ajustada ( ŷi ). O método dos mínimos quadrados
considera a distância vertical entre yi e ŷi e tenta mínimizar a soma dos quadrados desses
desvios (ou erros):
6
Os “verdadeiros” parâmetros podem indicar-se por α e β. Num contexto mais actual da estatística, as
estimativas que se obtêm a partir da amostra, b0 e b1, designam-se por coeficientes de regressão e constituem as
“melhores estimativas dos verdadeiros” parâmetros β0 e β1, respectivamente a ordenada na origem e o declive.
SQ = ∑ ( yi − yˆ i ) 2
Alguns autores acrescentam que SQ se refere à porção não-explicada da variação de Y.
Simultaneamente, pretende-se calcular os parâmetros da equação da recta, os coeficientes A e
B, uma vez que os parâmetros “reais” α e β exigiriam a análise de toda a população, isto é, de
todos os pares (X,Y), o que na maíoria dos casos é impossível. Assim, podemos calcular o
declive B, da equação da recta de regressão para uma amostra de pares de valores (xi,yi) da
seguinte forma:
B=
∑ xy = ∑ ( xi − x )( yi − y ) = n∑ xi ⋅ yi − (∑ xi )(∑ yi )
∑ x2 ∑ ( xi − x ) 2 n ∑ xi 2 − ( ∑ xi ) 2
em que B é a melhor estimativa do DECLIVE DA RECTA ou COEFICIENTE DE REGRESSÃO,
sendo que -∞ < B < +∞. A notação utilizada no termo intermédio, Σxy, indica o cálculo da
soma dos produtos cruzados dos desvios da média. Sucintamente, pretende reflectir a
distância em relação aos eixos dos pares de valores. Similarmente, a notação Σx2 refere-se à
soma dos quadrados dos desvios de xi relativamente à media x . O termo final é designado por
“fórmula de máquina” do declive. O declive pode entender-se como a variação de Y resultante
dum incremento unitário de X. Se B > 0, então para aumentos de X, Y aumentará a quantidade
B. Pelo contrário, se B < 0 então Y diminuirá com o incremento de X. Se B = 0, a recta será
horizontal, ao nível de A, e pode “afirmar-se” que Y não varia relativamente a X.
Demonstra-se matematicamente que o ponto ( X , Y ) , designado por centróide, faz sempre
parte da recta ajustada através do método dos mínimos quadrados. Sendo assim, podemos
substituir esse ponto na equação da recta e obter:
Y = A+ B⋅ X
ou, escrito de outra forma,
A =Y − B⋅ X
em que A é a melhor estimativa da INTERCEPÇÃO ou ORDENADA NA ORIGEM (ou seja, o valor
de Y quando xi = 0). Outra formulação para o cálculo de A pode ser:
(∑ xi )(∑ xi2 ) − (∑ xi )(∑ xi ⋅ yi )
A=
n ∑ xi2 − (∑ xi ) 2
As equações apresentadas para calcular os parâmetros da recta dos mínimos quadrados
derivam da resolução simultânea do SISTEMA DE EQUAÇÕES NORMAIS:
∑ yi = A ⋅ n + B ⋅ ∑ xi
∑ xi ⋅ yi = A ⋅ ∑ xi + B ⋅ ∑ xi2
3 3
SQ=1,37
2 2
Y
Y
1 1
0 0
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
X X
3 3
SQ=1,05 SQ=0,28
2 2
Y
1 1
0 0
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
X X
Fig. 29 – Ilustração (adaptada de Neter et al.) das rectas que se podem ajustar a um conjunto de dados,
incluindo a recta dos mínimos quadrados (com SQ=0,28). Indica-se a SQ para cada tentativa (cf.
exemplo anterior). As linhas tracejadas destacam os erros.
As pequenas violações destes pressupostos não afectam muito a validade dos resultados do
método dos mínimos quadrados, pois tem sido demonstrada a “resistência” deste
procedimento. Contudo, a observância destas condições contribui para a validade das
conclusões que se obtiverem. Por outro lado, podemos resolver as violações de alguns dos
pressupostos através da transformação dos dados (ver a seguir).
[Resolver Exercícios – Capítulo VI]
Até agora, discutiu-se a “forma” da relação estatística entre duas variáveis, isto é, pretendeu-
se conhecer como a variação de X se reflecte em Y. Para isso, tentou-se modelar a “relação de
causa-efeito”, de forma a predizer o valor de Y a partir de X.
(a)
1000 8
7 y = 0.216x + 2.570
Ln(x1000 UFC/mL)
800 y = 13.068e0.216x
6
x1000 UFC/mL
600 5
4
400 3
2
200
1
0 0
0 5 10 15 20 0 5 10 15 20
Horas Horas
(b)
120 2.5
y = 1.463x + 1.547
100 y = 35.239x1.463 2.0
80
Log(Peso)
Peso (kg)
1.5
60
1.0
40
20 0.5
0 0.0
0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 0.0 0.1 0.2 0.3
Altura (m) Log(Altura)
Fig. 30 – Transformação de variáveis na análise de regressão. (a) Relação exponencial (com B>0)
entre o tempo de incubação (horas) e nº de microrganismos (x1000 UFC/mL) “linearizada” através da
transformação de Y em ln(Y); (b) Relação potência entre a altura (m) e peso (kg) de determinada
amostra de alunos da EST “linearizada” pela transformação de X e Y em log(X) e log(Y).
Covariação
Covariância
De forma similar ao cálculo da variância, que recorre à soma dos quadrados dos desvios e ao
tamanho da amostra (através dos graus de liberdade), é possível aperfeiçoar a medida de
covariação.
A COVARIÂNCIA é uma medida de associação entre duas variáveis aleatórias X e Y. O valor
médio, ou esperança matemática, da distribuição de probabilidades da covariância de duas
v.a. X e Y, isto é, a covariância média em provas aleatórias repetidas, designa-se por σ{X,Y}
(nestes apontamentos seguiremos essa notação em vez de Cov{X,Y}), e depende da
probabilidade com que xi e yi ocorrem simultaneamente. Pode obter-se a covariância para um
conjunto de n pares de valores (X,Y), ou seja, n – 1 graus de liberdade, através de:
σ {X ,Y } =
∑ xy = ∑ ( x i − x )( y i − y )
n −1 n −1
Interpretação da covariância
Neste contexto, uma medida de associação entre duas variáveis deve ser independente da
escala de medição original, de modo a ser possível comparar o grau de associação num
determinado conjunto de pares de variáveis com a associação entre variáveis noutro conjunto.
Prova-se que ρ{X,Y} toma valores entre –1 (associação inversa “perfeita”) e +1 (associação
directa “perfeita”), ou seja
–1 ≤ ρ{X,Y} ≤ +1
O valor +1 é obtido quando existe uma relação funcional entre X e Y de tipo linear com
declive B positivo, isto é, Y = A + B X. Para o valor –1 a relação será similar mas com B
negativo. O resultado ρ{X,Y}=0 indica que não existe associação entre as variáveis X e Y, e
diz-se que as duas variáveis aleatórias não estão correlacionados linearmente.
Em resumo, quanto mais aproximado de ρ = 1 for o coeficiente de correlação linear, mais
“forte” o grau de associação entre as duas variáveis aleatórias consideradas.
Antes de mais, será apropriado desenvolver uma fundamentação que nos permita calcular o
coeficiente de correlação r numa amostra. Assim, numa amostra constituida por n pares de
valores (xi,yi) em que i=1, 2, …, n, pode calcular-se um estimador sem vício do COEFICIENTE
DE CORRELAÇÃO r através de:
r=
∑ (x i − x )( y i − y )
=
n∑ xi ⋅ y i − (∑ xi )(∑ y i )
∑ (x i − x) 2 ⋅ ∑(y i − y) 2 n∑ xi2 − (∑ xi ) 2 ⋅ n ∑ y i2 − (∑ y i ) 2
O desenvolvimento deste coeficiente deve-se a Karl Pearson (c. 1900), e alguns autores
(particularmente os anglófonos) referem-se a esta quantidade como coeficiente de correlação
do produto-momento.
O termo final da equação apresentada é designado por “fórmula de máquina” e permite
calcular o coeficiente de correlação a partir de quantidades entretanto calculadas para a
obtenção da recta de regressão dos mínimos quadrados entre duas variáveis.
Prova-se, aínda, que considerando os desvios-padrão amostrais das variáveis X e Y, sX e sY,
podemos relacionar o coeficiente de correlação linear amostral r e a estimativa do declive da
recta dos mínimos quadrados B através de:
s
r = B⋅ X
sY
Não existem pressupostos para o cálculo do coeficiente de correlação, mas para a prova de
hipóteses acerca do coeficiente de correlação linear populacional ρ{X,Y} é necessário cumprir
algumas condições. Na regressão, assume-se que para cada valor de X os valores de Y
correspondentes provêm de forma aleatória de uma população com distribuição normal. Em
correlação, para além desse pressuposto, também se deve verificar que os valores de X são
aleatoriamente obtidos de uma população com distribuição normal. Alguns autores referem
que não se verificando estes pressupostos, mesmo aumentando o tamanho da amostra não é
possível diminuir os efeitos adversos da “não-normalidade”.
O coeficiente de correlação r da amostra é uma estimativa pontual do parâmetro da população
ρ (ver secções “Estimação da média da população” e “Teste (ou Prova) de hipóteses”). O teste
de hipótese mais comum acerca de ρ, é saber se o coeficiente de correlação da amostra r
provém duma população com coeficiente de correlação ρ igual a zero7. Em termos mais
simples, será que existe correlação linear entre as duas variáveis? Se existir correlação, então
r será significativamente diferente de zero (que é o mesmo que concluir em favor de H1). As
HIPÓTESES NULA E ALTERNATIVA são, neste caso particular:
H0: ρ = 0 e H1: ρ ≠ 0.
Ora, se a amostra “provém de uma população com distribuição normal”, isto é, tanto X como
Y são variáveis aleatórias com distribuição normal então o ERRO-PADRÃO DO COEFICIENTE
DE CORRELAÇÃO sr será igual a:
1− r2
sr =
n−2
Recorde-se que o conceito de erro-padrão, ou de desvio-padrão de um parâmetro, foi
introduzido quando se abordou a distribuição de x na amostragem (ver secção “Estimação da
média da população”). Deve enfatizar-se que a expressão utilizada acima para calcular o erro-
padrão sr só se aplica quando pretendemos testar H0: ρ = 0 vs. H1: ρ ≠ 0.
Os testes de hipóteses relativos ao coeficiente de correlação recorrem à transformação t de
Student para n – 2 graus de liberdade seguinte: t [r ] = r s y . Assim, para testar as seguintes
hipóteses:
H0: ρ = 0 e H1: ρ ≠ 0
a regra de decisão será concluir H0 se L1 ≤ r ≤ L2; caso contrário, se r < L1 ou r > L2, rejeitar
H0 (o mesmo que concluir H1). Para as hipóteses consideradas, os limites L1 e L2 obtêm-se
através de:
1− r2 1− r2
L1 = −t α
e L2 = +t α
.
n − 2,1− 2
n−2 n − 2,1− 2
n−2
Um método simples de testar as hipóteses alternativas é comparar o valor de r obtido com o
valor crítico na tabela de r (Tabela D, em anexo) para n – 2 graus de liberdade e um nível de
significância α. Se | r | < r[n–2; α] concluir H0; caso contrário, rejeitar H0. Um outro
procedimento para testar aquelas hipóteses, é calcular a estatística de teste t[r] e consultar a
tabela t-Student (Tabela B anexa) para n – 2 g.l. Se | t[r] | > t [n −2;1−α 2 ] rejeitar H0, com (1 –
α)100% de confiança.
7
Se ρ=0 então não existe correlação linear entre X e Y, aliás como se viu para a covariância.
COEFICIENTE DE DETERMINAÇÃO
Podem estimar-se os parâmetros de uma recta que constitua o melhor modelo de relação
estatística entre duas variáveis aleatórias. Pode-se, aínda, determinar o grau de associação das
variáveis independentemente do modelo adoptado e testar se é significativamente diferente de
zero. No entanto, não se abordou a “avaliação da significância” ou “utilidade” da equação da
recta dos mínimos quadrados para descrever a relação estatística entre X e Y. Em virtude da
complexidade dos conceitos e das técnicas envolvidas, relacionadas com a análise de
variância (que não fazem parte do programa desta disciplina), este tópico será abordado, para
já, apenas superficialmente.
É possível interpretar os resultados do método dos mínimos quadrados de outro modo. A
equação resultante permite “explicar parte da variabilidade de Y em termos de variação de X”.
Analise-se, neste contexto, a Fig. 31. A variabilidade dos resultados observados pode ser
decomposta em duas componentes. Uma parte está relacionada com os desvios dos valores
observados, dos pontos (xi,yi), à recta estimada, ou sejam, as distâncias verticais Di = yi − yˆ i
(por exemplo D7 na Fig. 31). A partir destes desvios obtém-se a soma dos quadrados dos erros
(ou dos desvios) SQE. Esta porção da variabilidade “fica por explicar” depois de se ajustar o
modelo de regressão. Outra parte da variabilidade pode ser medida pelas distâncias verticais
d i = yˆ i − y (e.g. d7 na Fig. 31). Destas distâncias se obtém a soma dos quadrados da
regressão SQR, que pretende quantificar a variabilidade “que é explicada” pela equação
obtida8. Simplisticamente, podemos afirmar que a variação observada num determinado
problema ou conjunto de dados9:
Dados = Ajustamento + Resíduos
É possível aproveitar aquela informação e determinar a proporção ou percentagem da
variabilidade total de Y que é explicada pelo modelo de regressão. Esta quantidade designa-se
por COEFICIENTE DE DETERMINAÇÃO r2. Este coeficiente pode ser entendido como um índice
da “bondade” do ajuste do modelo que obtivemos por regressão, e calcula-se genericamente
8
Se as variáveis não estivessem relacionadas e Y não variasse em função de X, muito provavelmente o declive da
recta de regressão seria (aproximadamente) igual a zero, ou seja, a recta seria horizontal (ao nível de y )!
9
Na “linguagem” da análise de regressão, a relação pode escrever-se: SQT = SQR + SQE, em que SQT se refere à
variabilidade total observada num conjunto de dados. Esta relação designa-se “identidade da ANOVA”.
através de:
SQR
r2 =
SQT
em que SQT = SQR + SQE (uma outra forma de escrever a relação Dados=Ajuste+Resíduos).
12000
y7 (x7;y7)
10000
D7 {
8000
} d7
Peso (kg)
y
6000
4000
2000
0
x x7
0 20 40 60 80 100
Nº embalagens
Fig. 31 – Diagrama de dispersão dos resultados relativos a duas v.a. X e Y. Ilustração dos
conceitos envolvidos na obtenção de r2. O centróide está assinalado por um círculo. As
linhas tracejadas mostram as coordenadas do centróide e do ponto de coordenadas (x7,y7).
Destacam-se, ainda, as diferenças D7 e d7 relativas ao ponto (x7,y7).
r2 = = i i i i
∑ y 2
n x 2 − ( x )2 ⋅ n y 2 − ( y )2
∑ i ∑ i ∑ i ∑ i
O coeficiente de determinação r2 é muito comum na literatura e é utilizado como medida da
adequação (ou do ajuste) do modelo de regressão obtido. Pode entender-se como a proporção
(ou percentagem) da variabilidade da v.a. Y que é explicada pela variável X de acordo com o
modelo de regressão obtido (0 ≤ r2 ≤ 1). Curiosamente, o coeficiente de determinação pode
ser obtido elevando r ao quadrado, daí a confusão em alguns textos sobre o seu significado.
Na Fig. 32, apresentam-se diversos exemplos de rectas de regressão (método dos mínimos
quadrados) e respectivos coeficientes de determinação.
Os resultados da análise de regressão devem ser apresentados sobre a forma de equação,
tamanho da amostra e coeficiente de determinação, por exemplo:
R2 = 1
R2 = 0
Y
Y
X X
2
R = 0.8508
Y
R2 = 0.9176
X X
Fig. 32 – Ilustração de várias rectas de regressão obtidas pelos métodos dos mínimos quadrados e
respectivos coeficientes de determinação.
9. BIBLIOGRAFIA E MEDIAGRAFIA
10
A abordagem deste tópico, em particular, não faz parte do programa desta disciplna mas será tratado mais à
frente no curso de Engenharia Alimentar (por exemplo, em Análise de Dados e Planeamento Experimental) e
deve ser prática corrente em estudos que utilizem a análise de regressão.
Neter J., Wasserman W. & G.A. Whitmore – Applied Statistics. 3rd Edition, Allyn and Bacon
Inc., Boston, 997p.
Reis E., Melo P., Andrade R. & T. Calapez – Estatística aplicada. Volumes I e II. Edições
Sílabo, Lisboa, 266p. + 322p.
Sokal, R.R. & F.J. Rohlf – Biometry. W.H. Freeman and Co., San Francisco, 776p.
Zar, J. – Biostatistical analysis. 3rd Edition, Prentice Hall International Editions, USA, 662p. +
App.
EXERCÍCIOS
I – AMOSTRA
1. Dê o domínio de cada uma das seguintes variáveis e diga se são variáveis discretas ou
contínuas:
a) Número G de litros de sumo de fruta num recipiente.
b) Número B de caixas de laranjas num armazém.
c) Soma S de pontos obtidos ao lançar um par de dados.
d) Diâmetros D de 100 maçâs de calibre comercial "médio".
e) Número T de toneladas de farinha de trigo produzidas numa moagem.
f) Número C de decilitros de vinho em garrafas de vinho.
5. Cinco moedas foram lançadas 1000 vezes e, em cada lance, foi anotado o número de
"caras". Os números de lances nos quais foram obtidas 0, 1, 2, 3, 4 e 5 "caras" estão indicados
na tabela seguinte:
Número de "caras" Número de lances (frequência)
0 38
1 144
2 342
3 287
4 164
5 25
Total 1000
12. Uma amostra de comprimentos de peixe, medidos em cm, foi resumida na seguinte tabela:
Classes de comprimento (cm) Nº de indivíduos
10,5 – 12,5 2
12,5 – 14,5 2
14,5 – 16,5 6
16,5 – 18,5 8
18,5 – 20,5 10
20,5 – 22,5 10
22,5 – 24,5 36
24,5 – 26,5 46
26,5 – 28,5 22
28,5 – 30,5 6
30,5 – 32,5 4
32,5 – 34,5 8
34,5 – 36,5 6
36,5 – 38,5 2
1. Uma urna de paredes não transparentes contém 6 bolas vermelhas, 4 bolas brancas e 5
bolas azuis, que não se distinguem pelo tacto. Se retirar uma bola da urna, determine a
probabilidade de: a) ser vermelha; b) ser branca; c) ser azul; d) não ser vermelha; e) ser
vermelha ou branca.
6. Considere uma urna com 6 bolas marcadas com os números 2, 6, 8, 10, 10 e 12. Se dessa
urna retirar uma bola, observar e anotar o número marcado, repuser a bola na urna e retirar
novamente uma bola, os números anotados constituem uma amostra de tamanho n=2 da
variável X.
a) Construa o espaço amostral.
b) Calcule a probabilidade do evento "média da amostra igual a 10".
c) Calcule a probabilidade do evento "variância da amostra igual a 8".
Nº de avarias 0 1 2 3 4 5 6
A 0,1 0,2 0,3 0,2 0,09 0,07 0,04
B 0,3 0,32 0,1 0,08 0,1 0,05 0,05
2. Considerando que 20% dos pacotes de leite embalados por uma máquina são defeituosos,
determine a probabilidade de, entre 4 pacotes, ocorrer: a) 1 defeituoso; b) 0 defeituosos; c) no
máximo 2 pacotes defeituosos.
4. Supondo que a v.a. X tem distribuição binomial, com parâmetros n e p, e que E{X}=5 e
V{X}=4, determine n e p.
5. De uma urna com 6 bolas verdes e 2 bolas brancas, fazem-se 4 extracções repondo, em
cada extracção, a bola na urna.
a) Determine E{X} de saída de bola verde.
b) Determine a probabilidade do valor médio da distribuição de probabilidades.
8. Uma empresa comercializa garrafas de vinho de 1 litro. Supôe-se, no entanto, que 40%
dessas garrafas contém realmente uma menor quantidade de líquido do que o volume indicado
no rótulo. Tendo adquirido 6 dessas garrafas, qual a probabilidade de:
a) Duas delas conterem menos de um litro?
b) No máximo 2 conterem menos de um litro?
c) Pelo menos 2 conterem menos de um litro?
d) Todas conterem menos de um litro?
e) Todas conterem o volume indicado no rótulo?
f) Represente a função densidade de probabilidade da variável em questão.
9. Determine a probabilidade de, ao lançar 30 vezes uma moeda, sairem 2 "caras". Determine
o desvio-padrão da distribuição de probabilidades.
10. Uma máquina de colocar rótulos em garrafas de vinho não está correctamente calibrada e
origina 3% de garrafas com rótulo mal colocado. Determine a probabilidade de, em 150
garrafas, 4 serem defeituosos.
11. Numa fábrica, 1% dos produtos elaborados são defeituosos. Se seleccionar aleatoriamente
uma amostra de 10 elementos, calcule a probabilidade de:
a) Não existir nenhum elemento defeituoso nessa amostra.
b) Existir um elemento defeituoso na amostra.
c) Existir, no máximo, um elemento defeituoso nessa amostra.
13. Uma fábrica de embalagens, utilizadas para determinado produto alimentar, sabe que em
cada 100 produz duas defeituosas.
a) Qual é a probabilidade de um cliente ao comprar 100 embalagens receber todas sem
defeito?
b) Qual a probabilidade de receber, nessa mesma compra, pelo menos 3 embalagens
defeituosas?
4. Calcule o valor de zi tal que: a) Prob{Z < zi}=0,9918; b) Prob{-zi < Z < +zi}=0,95.
5. Considere a variável X com distribuição normal, de média µ=3 e variância σ2=4. Calcule,
recorrendo à distribuição normal reduzida e com a ajuda da tabela de z, a Prob{X < 5}.
6. Considere que uma composição de diâmetros de ameixas segue uma distribuição normal de
média µ=5 cm e variância σ2=5,25 cm2. Calcule:
a) A probabilidade das ameixas terem diâmetros compreendidos entre 3,5 cm e 8 cm.
b) A probabilidade das ameixas terem diâmetro maior do que 9,5 cm.
c) A probabilidade das ameixas terem diâmetro menor do que 3,5 cm.
d) O diâmetro abaixo do qual se encontram 95% das ameixas.
e) O diâmetro acima do qual se situa metade da composição de tamanhos das ameixas.
f) O diâmetro que corresponde ao quantil de ordem 28%.
7. Considere a v.a. X com distribuição normal de média µ=5 e variância σ2=9. Calcule A de
modo que Prob{5-A < X < 5+A} seja igual a: a) 68%; b) 95%; c) 99%.
10. Considere a distribuição de t para 12 g.l. Determine o valor de ti para o qual Prob{t < ti} é
igual a: a) 0,95; b) 0,90; c) 0,55.
12. O gráfico da distribuição t, com 9 g.l., está representado na figura seguinte. Determine os
valores de t1 para os quais:
a) A área sombreada à direita = 0,05.
b) A área sombreada total = 0,05.
c) A área em branco = 0,99.
d) A área sombreada à esquerda = 0,01.
e) A área à esquerda de t1 = 0,90.
14. Admite-se que o tempo de espera num determinado consultório (v.a. X) se distribui
normalmente. Num dia, seleccionado aleatoriamente, registaram-se os tempos de espera de
onze utentes, calculando-se um tempo médio de x = 41 min e ∑ ( xi − x ) 2 = 1690 .
a) No máximo, quanto tempo esperará 90% dos utentes daquele consultório?
b) E qual é o tempo mínimo de espera para 95% dos utentes?
1. Considere a seguinte população estatística, constituida pelas alturas (em cm) de 39 alunos
de Estatística do ano lectivo 1992/93 (ver quadro na página seguinte).
a) Calcule para a população a média µ, a variância σ2 e o desvio-padrão σ.
b) Seleccione 5 amostras com critério aleatório simples de tamanho n=12, com reposição.
Calcule para cada amostra a média x e o desvio-padrão s (Utilize a tabela de números
aleatórios; Tabela C anexa, para obter as amostras).
c) Para cada amostra, determine uma estimativa pontual e uma estimativa por intervalo de
confiança da média da população µ. Compare estas estimativas com o valor de µ calculado
anteriormente.
2. Pretende-se estimar, com uma confiança de 95%, a média µ de uma população cuja
variância σ2=4. Seleccionou-se, aleatoriamente e com reposição, uma amostra de tamanho
n=16. A média da amostra foi x =6,8. Apresente uma estimativa pontual de µ e uma
estimação por intervalos de confiança.
3. Pretende-se estimar a média µ de uma população com uma confiança de 95%, utilizando
como estimador a média de uma amostra seleccionada com critério aleatório simples, com
reposição. Assim, recolheram-se 10 elementos com esse critério, obtendo-se os seguintes
valores: 12, 15, 8, 10, 6, 8, 18, 7, 15 e 11.
a) Calcule a média e a variância da amostra.
b) Calcule um valor aproximado da variância das médias na Amostragem.
c) Calcule um valor aproximado do erro-padrão das médias na Amostragem.
d) Calcule o intervalo de confiança de 95% de µ.
5. Considere uma população com distribuição normal e σ2=0,97, a partir da qual foi
seleccionada, por amostragem aleatória simples com reposição, uma amostra de n=9
elementos. Os valores obtidos foram os seguintes: 10, 12, 14, 11, 15, 14, 10, 13 e 15.
a) Apresente uma estimativa pontual da média da população.
b) Apresente estimativas pontuais da variância e do erro-padrão das médias na Amostragem.
c) Calcule o intervalo de 95% de confiança da média da população µ.
d) Calcule a amplitude h do intervalo de confiança obtido na alínea anterior.
e) Se se pretender estimar a média populacional com uma amplitude igual a metade da
amplitude calculada na alínea anterior, mantendo o nível de confiança de 95%, qual o
tamanho aproximado da amostra n que se deveria considerar?
f) Com base nos resultados da alínea anterior, que conclusão poder retirar da relação existente
entre a precisão do intervalo de confiança (amplitude h) e o tamanho da amostra, para o
6. Sabe-se, por experiência, que numa moagem o número de sacos de farinha cheios por hora
por uma máquina tem distribuição aproximadamente normal. Em nove dias escolhidos
aleatoriamente foi realizado o controlo do número de sacos cheios durante uma hora, tendo-se
obtido os seguintes resultados:
9 9
∑ xi = 10206 e ∑ ( xi − x ) 2 = 25688
i =1 i =1
a) Construa um intervalo de confiança de 95% para o número médio de sacos cheios por hora
na fábrica.
b) Construa um intervalo de confiança de 95% para o mesmo parâmetro, considerando agora
que σ=60.
c) Comente os resultados obtidos, explicando também a diferença entre eles.
8. O conteúdo (em litros) de garrafas de óleo alimentar segue distribuição normal. Admita-se
que os respectivos parâmetros são µ=0,99 litro e σ=0,02 litro. Nestas condições, qual é a
probabilidade de:
a) O conteúdo médio numa amostra de 16 garrafas seleccionadas para inspecção ser superior a
1 litro?
b) Numa amostra de 100 garrafas o conteúdo médio ser inferior a 9,85 dl?
c) Tendo recolhido uma amostra de 100 garrafas e determinado um conteúdo médio inferior a
9,85 dl, que pensaria da hipótese avançada de início (isto é, µ=0,99 litro)?
d) Encontre um intervalo de confiança tal que a probabilidade de x100 nele estar contida seja
de 0,95, isto é encontrar a e b tais que Prob{a < x100 < b}=0,95.
9. Supôe-se que a média de uma população é µ=50 cm. Seleccionou-se uma amostra de
tamanho n=10 com um critério a.s. com reposição. Obtiveram-se os seguintes valores: x = 53
cm e s=3 cm. Para um nível de confiança de 99%, verifique se a suposição inicial feita sobre a
média populacional é verdadeira.
11. Uma fábrica de pasta tomate deve produzir este produto com um pH médio de 4,5. Sabe-
se que o processo de produção tem σ=0,25. Para poder controlar o valor da média de pH
seleccionou-se, com critério a.s., uma amostra de 10 embalagens, nas quais foi medido o pH.
Obtiveram-se os seguintes resultados:
4,1 4,2 4,8 4,0 4,2
3,9 4,0 4,7 4,2 4,3
Com uma confiança de 95% pode-se concluir que a pasta de tomate está a ser produzida com
a característica da qualidade indicada?
12. A dose diária recomendada (DDR) de cálcio para adultos da classe etária 25 – 50 anos é
800 mg. Duma população Algarvia, seleccionaram-se com critério a.s., treze indivíduos desse
intervalo de idades, para os quais se determinou a quantidade daquele mineral que ingerem
por dia. Os valores (em mg) para essa amostra da população foram: 987, 888, 741, 698, 654,
666, 678, 543, 567, 555, 639, 693 e 654.
a) Será que as pessoas ingerem menor quantidade de cálcio do que a DDR?
b) Noutra população, a quantidade média de cálcio ingerida (obtida a partir duma amostra a.s.
de vinte adultos) foi de 876 mg (com s = 54 mg). Será que nesta população se ingere mais
cálcio do que a dose diária recomendada?
1. Considere o seguinte conjunto de 4 pontos [ou pares de dados (xi, yi)]: (9; 10), (34; 21), (39; 15) e
(59; 25).
a) Represente graficamente aquele conjunto de pontos em papel milimétrico.
b) Que relação parece existir entre os pontos?
c) Calcule a recta dos mínimos quadrados (que melhor se ajusta aos dados).
2. Para elaborar uma recta de calibração que permita quantificar a quantidade de amónia em
amostras de àgua obtiveram-se os seguintes pares de valores:
Concentração (X em mM) 10 20 30 40
ABS (Y x 10-3) 182 332 571 699
a) Construa o diagrama de dispersão e ajuste uma recta dos mínimos quadrados aos dados.
b) Qual a ABS duma solução com 25 mM de amónia?
c) Se, numa amostra, a ABS for de 432 (x10-3), qual a concentração de amónia em solução?
d) Calcule o coeficiente de correlação linear entre as variáveis.
e) Teste, com 95% de confiança, se existe correlação linear?
f) Calcule o coeficiente de determinação e interprete o resultado.
3. Durante uma experiência preliminar de cultivo de uma espécie de camarão para eventual
produção em larga escala, obtiveram-se as seguintes taxas de crescimento médio (em
percentagem) para determinadas temperaturas da água dos tanques:
Temperatura (X em ºC) 15 18 21 24
Taxa de crescimento (Y em %) 8,9 9,5 13,1 14,2
a) Construa o diagrama de dispersão e ajuste uma recta dos mínimos quadrados aos dados.
b) Qual a taxa de crescimento se a temperatura da água for de 2º C?
c) Para se atingir uma taxa de crescimento de 10%, qual deverá ser a temperatura da água nos
tanques?
d) Calcule o coeficiente de correlação linear entre as variáveis.
e) Teste, com 95% de confiança, se existe correlação linear?
f) Calcule o coeficiente de determinação e interprete o resultado.
4. Numa escola, pretende-se verificar se existe alguma relação entre a altura (em cm) e o peso
(em kg) dos estudantes. Com esse objectivo, foram seleccionados aleatoriamente 100 alunos,
tendo-se obtido os seguintes pesos médios para diferentes valores de alturas:
Altura 155 150 180 135 156 168 178 160 132 145 139 152
Peso médio 70 63 72 60 66 70 74 65 62 67 65 68
5. O número médio de bactérias por unidade de volume existente numa cultura depois de x
horas é apresentado na tabela seguinte:
Nº horas (X) 0 1 2 3 4 5 6
Nº Bactérias (Y x104) 32 35 65 80 120 195 275
a) Construa o diagrama de dispersão dos dados em papel milimétrico. Que tipo de relação
parece existir entre as duas variáveis?
b) Calcule o logarítmo neperiano dos valores do número médio de bactérias por unidade de
volume. Construa novo diagrama de dispersão, agora com os valores de tempo (Nº horas) e o
logarítmo neperiano do número de bactérias, isto é, “gráfico de X versus ln(Y)”. Que tipo de
relação parece existir entre o tempo e ln(nº bactérias)?
c) Ajuste uma recta dos mínimos quadrados aos dados obtidos na alínea anterior.
d) Calcule o coeficiente de correlação linear r. Com uma confiança de 95% e de 99%,
verifique se r é diferente de zero. Que conclusão pode retirar da relação entre o tempo e e
número de bactérias?
e) Calcule o coeficiente de determinação e interprete o resultado que obteve.
f) Estime o número esperado de bactérias ao fim de 7 horas de incubação da cultura.
I - Amostra.
1.
a) G={qualquer valor desde zero até à capacidade máxima do recipiente}; var. contínua.
b) B={0, 1, 2, ... até ao máximo de caixas armazenáveis}; var. discreta.
c) S={2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}; var. discreta.
d) D ∈ [limíte inferior, limite superior]; var. contínua.
e) T ∈ R+; var. contínua.
f) C ={qualquer valor desde zero até à capacidade máxima da garrafa}; var. contínua.
2. 5.
Classes Pi F Facum Nº de "caras" facum
213,5 – 229,5 221,5 4 4 0 0,038
229,5 – 245,5 237,5 1 5 1 0,182
245,5 – 261,5 253,5 5 10 2 0,524
261,5 – 277,5 269,5 4 14 3 0,811
277,5 – 293,5 285,5 3 17 4 0,975
5 1,000
3.
Classes Pi f Facum 6.
60,5 – 62,5 61,5 0,37 11 Escala f
62,5 – 64,5 63,5 0,17 16 1 0,000
64,5 – 66,5 65,5 0,07 18 2 0,000
66,5 – 68,5 67,5 0,13 22 3 0,056
68,5 – 70,5 69,5 0,03 23 4 0,111
70,5 – 72,5 71,5 0,23 30 5 0,056
6 0,389
4.
7 0,333
Classes Pi f facum
8 0,056
15,75 – 15,87 15,81 0,06 0,06
15,87 – 15,99 15,93 0,19 0,25
15,99 – 16,11 16,05 0,63 0,88
16,11 – 16,23 16,17 0,06 0,94
16,23 – 16,35 16,29 0,06 1,00
7.
a) b) n(≤S)=80, n(≤T)=980, n(>K)=660.
Classes comerciais Facum
SS 10
S 80
Q 140
K 340
T 980
TG 1000
8. a) n=9
b) x =4,11; M=4; moda= 5; mínimo=1; máximo=9; h=8; σ2=5,3611; σ=2,3154; c.v.=56,32%
12. a) 2 cm; 11,5 cm; 13,5 cm; 15,5 cm...; 33,5 cm; 35,5 cm; 37,5 cm.
b) x =24,86 cm; s2=24,638 cm2; s=4,964 cm; c.v.=19,97%
f) 21,7 cm g) 23,9 cm h) [19,1 cm; 27,3 cm]
i) x + s = 29,8 cm → 88%; x - s = 19,9 cm → 18%; x + 2s = 34,8 cm → 98%; x - 2s = 14,9
cm → 5%; x + 3s = 39,7 cm e x - 3s = 9,98 cm (estes últimos resultados encontram-se fora
dos limites dos dados)
j) 93%
7.
a) P{X=0}=0,0156; P{X=1}=0,0938; P{X=2}=0,2344; P{X=3}=0,3125; P{X=4}=0,2344;
P{X=5}=0,0938; P{X=6}=0,0156
b) P{X≤4}=0,8907 c) E{X}=3
c) P{0,9861 litro< x <0,9939 litro}=95% logo rejeita-se H0: µ=0,99 litro, i.e. com 95% de
confiança pode-se dizer que a suposição inicial é falsa.
d) [9,9861 litro; 0,9939 litro]
9. P{46,92 cm< x <53,08 cm}=99% logo não se rejeita a H0 porque L1 < x < L2 i.e. com uma
confiança de 99% pode-se afirmar que a média da população é de 50 cm.
10. a) Como x > (L=9,29%) não se rejeita H0 com uma confiança de 99%, i.e. pode-se
afirmar que o processo de redução da gordura “não surtiu efeito”; b) α porque se se rejeitar H0
então conclui-se que o teor em gordura <10% quando na realidade não é, o que representa
maior perigo para os doentes.
11. P{4,35< x <4,65}=95% e, por isso, rejeita-se H0, ou seja, com 95% de confiança, a fábrica
não está a produzir pasta de tomate com pHmédio=4,5.
12. a) Como x < (L=794,45 mg) rejeita-se a H0, i.e., com 95% de confiança as pessoas estão a
consumir menos do que 800 mg de cálcio por dia; b) Uma vez que x > (L=820,88 mg) rejeita-
se a H0, ou seja, com 95% de confiança as pessoas estão a consumir mais do que 800 mg de
cálcio por dia.
4. b) ŷ =31,066 + 0,232 x
c) r=0,863. P{-0,356<r<+0,356}=95%, portanto um nível de confiança de 95% rejeita-se H0:
ρ=0, i.e. não existe correlação linear entre variáveis d) r2=0,745
5. c) ln y=3,339 + 0,375 x
d) r=0,992. P{-0,100<r<+0,100}=0,95 e P{-0,157<r<+0,157}=0,99, logo rejeita-se a H0: ρ=0
para ambos os níveis de confiança, ou seja, não existe correlação linear entre variáveis
e) r2=0,984 f) ŷ (x=7 h)=389,2 x 104 bactérias (usando forma linearizada da relação)
TABELAS
0,4
0,3
f
0,2 p
0,1
α Z
0
-4 -2 0
zi 2 4
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
0,4
0,3
f
0,2 p
0,1
α t
0
ti
-4 -2 0 2 4
t p
g.l. 0,55 0,75 0,9 0,95 0,975 0,99 0,995 0,9995
1 0,158 1,000 3,078 6,314 12,706 31,821 63,656 636,578
2 0,142 0,816 1,886 2,920 4,303 6,965 9,925 31,600
3 0,137 0,765 1,638 2,353 3,182 4,541 5,841 12,924
4 0,134 0,741 1,533 2,132 2,776 3,747 4,604 8,610
5 0,132 0,727 1,476 2,015 2,571 3,365 4,032 6,869
6 0,131 0,718 1,440 1,943 2,447 3,143 3,707 5,959
7 0,130 0,711 1,415 1,895 2,365 2,998 3,499 5,408
8 0,130 0,706 1,397 1,860 2,306 2,896 3,355 5,041
9 0,129 0,703 1,383 1,833 2,262 2,821 3,250 4,781
10 0,129 0,700 1,372 1,812 2,228 2,764 3,169 4,587
11 0,129 0,697 1,363 1,796 2,201 2,718 3,106 4,437
12 0,128 0,695 1,356 1,782 2,179 2,681 3,055 4,318
13 0,128 0,694 1,350 1,771 2,160 2,650 3,012 4,221
14 0,128 0,692 1,345 1,761 2,145 2,624 2,977 4,140
15 0,128 0,691 1,341 1,753 2,131 2,602 2,947 4,073
16 0,128 0,690 1,337 1,746 2,120 2,583 2,921 4,015
17 0,128 0,689 1,333 1,740 2,110 2,567 2,898 3,965
18 0,127 0,688 1,330 1,734 2,101 2,552 2,878 3,922
19 0,127 0,688 1,328 1,729 2,093 2,539 2,861 3,883
20 0,127 0,687 1,325 1,725 2,086 2,528 2,845 3,850
21 0,127 0,686 1,323 1,721 2,080 2,518 2,831 3,819
22 0,127 0,686 1,321 1,717 2,074 2,508 2,819 3,792
23 0,127 0,685 1,319 1,714 2,069 2,500 2,807 3,768
24 0,127 0,685 1,318 1,711 2,064 2,492 2,797 3,745
25 0,127 0,684 1,316 1,708 2,060 2,485 2,787 3,725
26 0,127 0,684 1,315 1,706 2,056 2,479 2,779 3,707
27 0,127 0,684 1,314 1,703 2,052 2,473 2,771 3,689
28 0,127 0,683 1,313 1,701 2,048 2,467 2,763 3,674
29 0,127 0,683 1,311 1,699 2,045 2,462 2,756 3,660
30 0,127 0,683 1,310 1,697 2,042 2,457 2,750 3,646
35 0,127 0,682 1,306 1,690 2,030 2,438 2,724 3,591
40 0,126 0,681 1,303 1,684 2,021 2,423 2,704 3,551
45 0,126 0,680 1,301 1,679 2,014 2,412 2,690 3,520
50 0,126 0,679 1,299 1,676 2,009 2,403 2,678 3,496
55 0,126 0,679 1,297 1,673 2,004 2,396 2,668 3,476
60 0,126 0,679 1,296 1,671 2,000 2,390 2,660 3,460
65 0,126 0,678 1,295 1,669 1,997 2,385 2,654 3,447
70 0,126 0,678 1,294 1,667 1,994 2,381 2,648 3,435
75 0,126 0,678 1,293 1,665 1,992 2,377 2,643 3,425
80 0,126 0,678 1,292 1,664 1,990 2,374 2,639 3,416
85 0,126 0,677 1,292 1,663 1,988 2,371 2,635 3,409
90 0,126 0,677 1,291 1,662 1,987 2,368 2,632 3,402
95 0,126 0,677 1,291 1,661 1,985 2,366 2,629 3,396
100 0,126 0,677 1,290 1,660 1,984 2,364 2,626 3,390
120 0,126 0,677 1,289 1,658 1,980 2,358 2,617 3,373
∞ 0,126 0,675 1,282 1,645 1,960 2,327 2,576 3,291
*
De facto estes números são pseudo-aleatórios em virtude do software usado para os gerar (Microsoft Excel).