Академический Документы
Профессиональный Документы
Культура Документы
2015.2
Objetivos
1. Compreender o uso da estatstica na prtica acadmica ou empresarial;
2. Desenvolver clculos bsicos da estatstica e interpret-los;
3. Utilizar a objetividade e a probabilidade como uma base nas tomadas de decises;
4. Entender o uso e a importncia da inferncia e da previso estatstica em pesquisas de mercado, de
opinio e em consultorias empresariais.
Metodologias e Recursos
Utilizar as tcnicas estatsticas atravs de aulas expositivas, prticas em laboratrio de informtica com
uso do Microsoft Excel e apresentao de cases pelo professor, possibilitando o discente na resoluo de
problemas em sua rea de atuao e formao.
Sistema de Avaliao
Verificar no Portal da disciplina
Sistema de frequncia
O aluno deve ter no mnimo 75% de frequncia. Se o aluno tiver acima de 15 faltas estar reprovado por
falta, visto que cada aula so trs faltas ou trs presenas, respectivamente.
Bibliografia Recomendada
Bsica:
TRIOLA, M. F. Introduo Estatstica. 11 Edio. Rio de Janeiro. Livros Tcnicos e Cientficos,
2013.
MORETIN, L. G. Estatstica bsica: Probabilidade e Inferncia. Volume nico. So Paulo: Pearson,
2010.
LAPONNI, J.C. Estatstica Usando o Excel. 4 Edio. Editora Campus, 2005.
Complementar:
LEVIN; FOX; FORDE. Estatstica para Cincias Humanas. 11 Edio. So Paulo: Pearson, 2012.
Notas de Aula
Bioestatstica
Pgina 2
Notas de Aula
Bioestatstica
Pgina 3
Modelo Casio fx 82 MS
ou
HP Modelo: 12C
Programa Da Disciplina
CONTEDO
Nota de Aula 1 Introduo Geral Estatstica: Conceito de Estatstica; Aplicaes; Origem;
Pesquisa de Mercado e de Opinio: Etapas, Objetivo, Briefing, Variveis; Pesquisas Qualitativas,
Quantitativas e seus mtodos;
Nota de Aula 2 - Amostragem: Inferncia Estatstica; Populao; Parmetro; Amostra; Estimativa;
Margem de erro; Tcnicas de amostragem; Amostras no probabilstica; Amostras probabilsticas.
Nota de Aula 3 - Medidas descritivas para dados no agrupados: Medidas de tendncia central:
Mdia aritmtica simples; Moda; Mediana; Separatrizes, Box Plot; Medidas de disperso: Amplitude
total; Varincia; Desvio padro; Coeficiente de variao.
Nota de Aula 4 Correlao e Regresso Linear: Mtodos de Previso Estatstica.
Nota de Aula 5 - Medidas descritivas para dados agrupados Distribuio de Frequncias: Tipos
de Frequncias, Histograma, Polgono de Frequncias, Ogiva de Galton, Assimetria, Curtose. Medidas
de tendncia central e Disperso para dados agrupados.
Nota de Aula 6 Probabilidade: Conceitos Iniciais, Definio, Teorema da Soma e da Multiplicao
e Probabilidade Condicional.
Nota de Aula 7 Tabelas Estatsticas e Grficos atravs do Microsoft Excel: Tabelas; Elementos
fundamentais de uma tabela; Normas de construo de tabelas; Quadros; Banco de dados; Srie
estatstica; Caracterstica de uma srie estatstica; Tipos de sries estatsticas; Grficos; Elementos
essenciais dos grficos; Tipos de grficos; Estatsticas descritivas para dados no agrupados.
Nota de Aula 8 - Distribuio Normal de Probabilidade: Introduo breve Probabilidade e Uso da
tabela da Normal.
Notas de Aula
Bioestatstica
Pgina 4
Coleta de Dados
Tratamento dos
Dados
Apresentao dos
Resultados
1.1. Aplicaes: Algumas cincias utilizam estatstica como uma ferramenta prpria, possuindo-a com
suas terminologias prprias, como sendo:
Bioestatstica: o planejamento, coleta, avaliao e interpretao de todos os dados obtidos em
pesquisa na rea biolgica, mdica e reas da sade em geral;
Estatstica Econmica ou Econometria: um ramo da estatstica direcionado para a anlise de
fenmenos econmicos;
Estatstica aplicada Engenharia: um ramo da estatstica que estuda as suas aplicaes no controle de
processos de produtos e servios, no planejamento de novas estratgias de produo, nas vendas, no
controle de qualidade, em ensaios destrutivos e no destrutivos, com o objetivo de verificar a
porcentagem de peas no conforme as especificaes ou a probabilidade de vida de equipamentos ou
peas, dentre outras;
Estatstica Fsica: o ramo da fsica que atravs da estatstica analisa sistemas fsicos de alta
complexidade, com elevado nmero de entidades constituintes, como os tomos, as molculas, os ons,
entre outros;
Estatstica aplicada Contabilidade: A estatstica utilizada na rea da contabilidade para comparar o
sexo de carteira de clientes, para comparar cargos de funcionrios da empresa, onde se compara o custo
gasto colocando os mais importantes acima da pirmide para comparao entre cargos similares, variao
e montagem na estrutura de cargos e salrios, contagem de estoque, de imobilizado, perdas, juros, dentre
outros;
Notas de Aula
Bioestatstica
Pgina 5
1.2. Origem:
A palavra estatstica originou-se da expresso latina statisticum, que significa Estado, que
depois de vrias significados, surgiu em alemo a palavra statistik que significa anlise de dados sobre o
Estado. O Estado teve fundamental importncia na origem da Estatstica como cincia, pois
originalmente, as estatsticas eram colhidas para as finalidades relacionadas com o Estado, como os
recenseamentos, por exemplo. Como disciplina, s no sculo XIX que se estruturou, mas j era
conhecida desde a antiguidade, h mais de 4 mil anos.
Nas decises do dia-a-dia, o indivduo h de forma direta ou indireta que se basear em dados
observados para isso. Por exemplo, ao decidir pelo seguro de um carro de uma determinada seguradora,
geralmente, este procura verificar se este seguro satisfaz as suas necessidades, ou seja, se o seu preo
compatvel com o seu oramento, alm de outras caractersticas.
Posteriormente, compara se dados deste seguro com o de outras seguradoras e, atravs de uma
anlise processada internamente em sua mente, toma-se a deciso de adquiri-lo ou no.
Essa analogia no difere na realizao das pesquisas cientficas, que tem por objetivo responder
as indagaes ou comprovar as hipteses elaboradas pelo pesquisador. E para isso, preciso,
inicialmente, coletar dados que possam fornecer informaes relevantes para responder esses
questionamentos, mas para que os resultados da pesquisa sejam confiveis, tanto a coleta de dados quanto
a sua anlise devem ser feitas de forma criteriosa e objetiva. Para isso, o planejamento eficaz da
realizao de uma pesquisa cientfica necessrio. Mas para isso necessrio entender o que realmente
uma pesquisa.
Notas de Aula
Bioestatstica
Pgina 6
Notas de Aula
Bioestatstica
Pgina 7
Notas de Aula
Bioestatstica
Pgina 8
2.2. Populao (N): o conjunto de todos os elementos que possuem em comum determinadas
caractersticas de interesse para uma pesquisa. Por exemplo: Pessoas, Maquinrios, Solues Qumicas,
Produtos, dentre outros.
Quanto ao tamanho, a populao pode ser classificada como finita ou infinita. Desta forma, as
finitas so as que possuem um tamanho limitado de elementos, em que possvel identificar do primeiro
at o ltimo componente populacional, analogamente, as infinitas so aquelas cujo nmero de elementos
ilimitado, ou seja, impossvel de identificar o ltimo indivduo. Assim, a populao, nesse caso to
grande que dificultoso a sua anlise com preciso.
Portanto, a escolha em analisar toda a populao (censo) uma deciso arbitrria do
pesquisador. Desta forma, os pesquisadores que optarem em utilizar o censo tero que verificar a seguinte
medida estatstica conhecida como parmetro.
2.3. Parmetro: a medida usada para descrever uma caracterstica numrica da populao em estudo e
para isso necessrio uma anlise integral desta. Assim, como na prtica este procedimento se torna
invivel, seu valor quase sempre desconhecido, na maioria das vezes. Um exemplo prtico de parmetro
a Idade mdia de todos os alunos de uma sala de aula, ou seja, a mdia () e a varincia (2), so
exemplos de parmetros.
Muitos pesquisadores defendem que o censo proporciona uma preciso incontestvel nos
resultados estatsticos, pois todo o universo analisado. No entanto, essa preciso pode ser contestada por
diversos fatores, dentre eles, as mudanas comportamentais dos componentes da populao, nos casos em
que a pesquisa demanda perodo longo, ou por erros de coleta de dados, como informaes inverdicas,
dentre outras. Ento, para abster-se desses fatores que o censo pode causar de forma implcita e, muitas
das vezes, explcita, a utilizao da amostragem uma soluo, pois a mesma permite que o pesquisador,
ao contrrio do censo, cometa alguns equvocos previsveis e aceitveis ao estudo, mas para que esses
equvocos sejam tolerveis, faz-se necessrio que o pesquisador entenda estatisticamente o que
amostragem.
2.4. Amostra (n): uma parcela significativa de uma populao, ou seja, uma parte da populao que a
representa estatisticamente.
Os pesquisadores que optarem em utilizar o processo de amostragem tero que utilizar as
seguintes medidas estatsticas conhecidas como estimativa e margem de erro.
Notas de Aula
Bioestatstica
Pgina 9
2.5. Estimativa: o valor numrico do estimador obtido com base nos resultados amostrais. Um
exemplo prtico de estimativa a Idade mdia de uma parte significativa dos alunos de uma sala de aula,
ou seja, a mdia amostral ( x ), a varincia amostral (S), so exemplos de estimadores.
2.6. Margem de Erro (e): Um estudo em que se optou na utilizao da amostragem como mtodo de
coleta de dados, sempre apresentar uma falha embutida nas suas anlises, visto que no se analisou
todo o universo. Essa falha conhecida como margem de erro (ou erro amostral), e tem uma relao
forte e inversamente proporcional com o tamanho da amostra e dos resultados que foram obtidos com a
pesquisa, ou seja, quanto maior for a quantidade de elementos pesquisados, menor a quantidade de erros
cometidos, ou seja, menor a margem de erro, mas em contra partida, maior o custo financeiro da mesma.
E vice-versa quando o tamanho amostral for menor.
Um exemplo prtico de margem de erro visto nas pesquisas eleitorais em que atravs de uma
amostragem de eleitores um determinado candidato aparece com um percentual de tantos por centos de
aceitao ao pleito, levando-se em considerao a margem de erro tolervel de tantos pontos percentuais
para mais ou para menos, ou seja, ele estar entre x% e y% dentro da margem de erro, isso quer dizer que,
se fosse analisada toda a populao de eleitores, existem uma possibilidade de que no dia da eleio o
resultado percentual do candidato fique entre x% e y%.
A margem de erro definida, na grande maioria das vezes, antes da coleta de dados, para evitar
assim retrabalho aos pesquisadores do estudo, pois caso a margem de erro fique muito alta (acima de 5%
para mais ou para menos), o retrabalho inevitvel ocasionando um custo a mais a quem encomendou a
pesquisa, e isso ocorre, na prtica, por falta de planejamento amostral adequado ao estudo almejado.
Assim, para planejar um estudo estatstico com uso de amostragem faz-se necessrio conhecer
dois processos bsicos de amostragens, as amostras no probabilsticas e as probabilsticas.
3. TCNICAS DE AMOSTRAGEM:
3.1. Amostras No Probabilsticas: Uma amostra no probabilstica (ou no casual ou no aleatria),
quando a probabilidade de seleo de cada unidade amostral da populao desconhecida. Nesse caso,
no se podem supor os resultados obtidos para o universo da populao, visto que a amostra, por ser no
probabilstica no significativa. Desta forma, devem ser evitadas, porque alm de no conhecer a
margem de erro e a confiabilidade, introduzem tendenciosidade (ou vis ou vcio) na seleo das unidades
e estimao das mesmas, ou seja, distorcendo os dados do estudo para uma determinada direo.
As amostras no probabilsticas mais comuns so:
Notas de Aula
Bioestatstica
Pgina 10
a) Amostras por Convenincia: As amostras por convenincia ocorrem quando as unidades a serem
analisadas esto mais acessveis ao pesquisador de acordo com as convenincias sociais, econmicas, de
tempo, dentre outras. um tipo de amostragem que vantajosa por ser rpida, de baixo custo e de fcil
acessibilidade, mas no h nada que a credite estatisticamente.
b) Amostras por Cotas: So amostras em que se leva em conta a porcentagem de alguma(s)
caracterstica(s) da populao de origem.
c) Amostras por Julgamento ou Intencional: uma forma de amostragem por convenincia na qual os
elementos populacionais so selecionados com base no julgamento arbitrrio do pesquisador, ou seja, o
pesquisador identifica os elementos que corroboraro com o objetivo do seu estudo sem o risco de fugir
deste objetivo pr-definido, ou seja, no h uma escolha aleatria dos elementos pesquisados e sim o
contrrio.
3.2. Amostras Probabilsticas: Uma amostra probabilstica (ou ao acaso ou aleatria) quando cada
unidade amostral tem uma probabilidade conhecida e diferente de zero de ser escolhida frente a
populao de origem, garantindo, se for realizada de forma correta, a iseno de vcios.
As tcnicas de amostragem probabilstica consistem em Amostra Aleatria Simples, Amostra
Aleatria Estratificada, Amostra sistemtica e Amostra por Conglomerado:
a) Amostra Aleatria Simples (AAS): Selecionado por um processo ao qual a probabilidade de escolha
de todos os elementos a mesma para todos, ou seja, a populao de origem considerao homognea,
pois os seus elementos tm caractersticas parecidas entre si.
a1) Frmula para determinao do tamanho da amostra com AAS:
N .n0
N n0
Bioestatstica
Pgina 11
Onde:
N = Tamanho da populao
n = Tamanho da amostra
Se a confiana do estudo for de 95%, de acordo a tabela da Normal Padro: n0
1
,
e
2,575
e
3
Se a confiana for 99,9%: n0
e
N
N!
aos nmeros selecionados. Existiro
amostras possveis diferentes de tamanho n. Nesse
n n!( N n)!
caso, haver dependncia nas retiradas, pois o fato de no recolocar o elemento retirado afeta a
probabilidade de o elemento seguinte ser retirado.
OBS 4: A amostra aleatria simples pode ser tambm com reposio consiste em selecionar n
elementos um de cada vez, a partir dos elementos da populao (N), repondo o elemento sorteado na
populao antes do prximo sorteio. Com tal procedimento, qualquer elemento pode ser sorteado mais do
que uma vez. Nesse caso, haver independncia entre as retiradas, pois o fato de recolocar o elemento
retirado no afeta a probabilidade de o elemento seguinte ser retirado.
OBS 5: bom lembrar que a partir de um determinado nmero da populao a ser investigada, a amostra
no sofre variao considervel para mais ou para menos e, portanto, no adianta aumentar o nmero
amostral, imaginando que poder haver mais resultados porque este no sofrer alterao significativa.
Exemplo 1: Pensando em proporcionar ainda mais praticidade e comodidade para o aluno, a Devry
Brasil criou no ano 2014 o aplicativo Devry Aluno. Por meio dele, os estudantes da Fanor podem utilizar
seus smartphones IOS para solicitar alguns servios realizados pelo Ncleo de Atendimento ao Aluno
(NAA) da faculdade e fazer tudo com mais agilidade, como por exemplo:
- Solicitar declarao de matrcula para fins diversos;
- Solicitar Histrico Escolar;
- Solicitar Reviso de Prova Final;
- Acompanhar e ser avisado sobre o vencimento de faturas, evitando
multas desnecessrias;
- Manter-se atualizado e ser alertado sobre os principais eventos do
Calendrio acadmico oficial de sua faculdade, dentre outros.
Visando a satisfao de seus clientes (ou atuais alunos), a Devry Brasil
deseja fazer melhorias no seu aplicativo e adequ-lo s necessidades
destes. Para isso, ser feita uma pesquisa estatstica entre os alunos dos
cursos de engenharias da Fanor, para verificar quais melhorias devem
ser implementadas. De acordo o ltimo levantamento feito em Julho de
h
nos cursos de engenharias do campus 2.356 alunos regularmente matriculados. Assim, qual deve ser a
2015,
quantidade de alunos a serem pesquisados pela faculdade, se for considerado:
a) Uma margem de erro de 4%, com uma confiana de 95%?
b) Se diminuirmos a margem de erro para 2%, qual ser o tamanho da amostra (n), mantendo a mesma
confiana de 95%?
c) E se pesquisssemos 2000 clientes, qual seria a margem de erro, com a confiana de 95%?
e) Se para a faculdade o que importa o quanto ela vai pagar pela pesquisa, ou seja, o custo da mesma,
qual das alternativas (a, b e c) voc aconselharia ela a utilizar? Por qu?
f) Se para a faculdade o que importa o resultado estatstico da pesquisa e ao mesmo tempo com menor
custo, qual das alternativas (a, b e c) voc aconselharia ela a utilizar? Por qu?
Notas de Aula
Bioestatstica
Pgina 13
b) Amostra Aleatria Estratificada (AAE): Muitas vezes a populao se divide em subpopulaes (ou
estratos), sendo razovel supor que em cada estrato a varivel de interesse analisada apresenta um
comportamento substancialmente diverso, ou seja, a populao considerada heterognea, mas
homogneo dentro de cada estrato.
Assim, deve-se adotar um tipo de amostragem que represente bem as diferentes caractersticas
dentro de cada um dos grupos, podendo ser, por exemplo, proporcional ao tamanho de cada um deles.
Exemplo 2: A prefeitura de Fortaleza implantou o sistema de bicicletas pblicas chamado Bicicletar,
que visa oferecer cidade uma opo de transporte sustentvel e no poluente. Este projeto operado
pela empresa Serttel e tem o apoio da Unimed Fortaleza. O Sistema composto por estaes inteligentes,
conectadas a uma central de operaes via wireless, alimentadas por energia solar, distribudas em pontos
estratgicos da cidade, onde os clientes cadastrados podem retirar uma bicicleta, utiliz-la em seus
trajetos e devolv-la na mesma, ou em outra Estao.
Um nutricionista deseja fazer um estudo com o
objetivo de verificar a prevalncia de usurios do
sistema que utilizam suplementos alimentares antes
e/ou aps prtica do esporte. Os usurios definidos
por ele so os que retiraram as bicicletas nas estaes
da Avenida Beira Mar. Assim, para participar do
estudo, foi definido ainda que os usurios devam ter
utilizados o sistema em no mnimo trs vezes por
semana
no
turno
manh,
tarde
e/ou
noite,
Notas de Aula
Bioestatstica
Pgina 14
c) Amostra Sistemtica (AS): Esse tipo de amostragem uma variao da amostragem aleatria
simples, mas que exige que um sistema aleatoriamente seja definido.
Segue abaixo outros tipos de exemplos de amostras sistemticas:
Exemplo1: Um engenheiro de controle da qualidade seleciona cada centsima fonte de computador que
passa em uma esteira transportadora.
Exemplo2: Um professor retira da populao para compor a amostra os alunos aleatoriamente escolhidos
que possuem o algarismo 0 como ltimo nmero da sua matrcula.
Exemplo3: Uma indstria tem 900 mquinas e o engenheiro de produo deseja uma amostra formada por
50 mquinas para uma pesquisa. Pode-se, neste caso, usar o seguinte procedimento: Como 900/50 = 18,
escolhe-se por sorteio casual um nmero de 01 a 18, o qual indicaria o primeiro elemento sorteado para a
amostra, os demais elementos seriam periodicamente considerados de 18 em 18. Assim, se supor que o
nmero sorteado fosse 4, a amostra seria: 4 mquina, 22 mquina, 40 mquina, 58 mquina, 76
mquina, dentre outros. Ao final, pode-se voltar ao incio para completar a quantidade amostral a
pesquisar.
d) Amostra por Conglomerado: Primeiramente, na amostra por conglomerado, a populao-alvo
dividida em estratos mutuamente exclusivos e coletivamente exaustivos. Aps isso, reduz-se,
arbitrariamente, a quantidade de estratos a serem analisados. Aps isso, sorteiam-se quais grupos sero
pesquisados e por fim, define-se qual o tipo de amostra probabilstica dever ser utilizada (AAS, AAE ou
AS). Podendo tambm, se assim o pesquisador desejar, utilizar o censo nos grupos selecionados para
coleta de dados. Com isso, a amostragem por conglomerado tem duas grandes vantagens: a viabilidade e
o baixo custo, ou seja, a que traz o menor custo-benefcio, se comparado s outras tcnicas probabilsticas
disponveis.
Notas de Aula
Bioestatstica
Pgina 15
Exemplo 3: Considere que um pesquisador deseja avaliar atravs de uma pesquisa por amostragem a
opinio dos alunos de engenharia da Fanor sobre a sua satisfao com relao coordenao do seu
curso. Assim, levantou-se a populao de alunos por cada curso da referida rea, como segue abaixo:
Cursos
Quantidade Populacional
469
403
739
593
440
198
2.842
Se esse pesquisador fizer uma amostra por conglomerado para 3 cursos, quantos alunos sero
pesquisados, com uma margem de erro de 2% e uma confiana de 95%, levando em considerao um dos
mtodos de amostragem (AAS, AAE ou AS)?
Notas de Aula
Bioestatstica
Pgina 16
Notas de Aula
Bioestatstica
Pgina 17
2.1. Mdia Aritmtica Simples: definida como sendo o quociente da soma de todos os valores de um
conjunto de dados pelo total de valores deste conjunto.
Mdia amostral
Mdia populacional
xi
i 1
x
i 1
, Onde
xi = Valores da varivel
n = Nmero de valores da amostra
N = Nmero de valores da populao
OBS1: A mdia por ser influenciada por todos os valores do conjunto de dados considerada como uma
medida sensvel, ao contrrio das outras medidas de tendncia central existentes.
Propriedades:
a) A mdia de um grupo de dados sempre ser nica, independente da sua localizao;
x
n
i 1
X 0
c) O resultado de multiplicar a mdia pela quantidade n de valores da varivel x igual a soma dos n
valores da varivel;
d) Somando-se ou subtraindo-se uma constante c (valor invarivel) a todos os valores de uma varivel,
a mdia do conjunto ficar aumentada ou diminuda dessa constante, respectivamente, de forma anloga,
se multiplicar ou dividir, a mdia ficar multiplicada ou dividida, respectivamente.
n
x
i 1
x .c
i
i 1
xi
c
i 1
Falando ainda de mdia, h a mdia aparada, que no to utilizada na prtica estatstica pois a
mesma tende a manipular o resultado final desta medida de tendncia central, mas vale a pena conhecer o
que este tipo de medida como segue no prximo tpico.
2.1.1. Mdia Aparada: Uma mdia aparada calculada aparando-se certa porcentagem dos maiores ou
menores valores do conjunto de dados. Por exemplo, para calcular a mdia aparada de 10%, deve-se
eliminar 10% dos valores maiores e 10% dos valores menores, e ento calcular a mdia dos valores que
sobraram. Podendo-se usar de forma arbitrria a porcentagem a ser retirada da amostra para um novo
Notas de Aula
Bioestatstica
Pgina 18
clculo. Ao contrrio da mdia aritmtica, a mdia aparada uma medida resistente, pois no sofre
influncia dos valores extremos.
A segunda medida de tendncia central a analisar a moda, como segue no prximo tpico.
2.2. Moda (Mo): Na linguagem coloquial, moda algo que est em evidncia, ou seja, algo que se v
bastante. Na Estatstica, como o prprio nome sugere, a Moda aquele elemento que mais vezes aparece
no conjunto de dados. No muito sensato dizer que a moda uma medida de tendncia central, pois
nem sempre ela representa o centro do conjunto de dados, visto que ela identifica o(s) valor(es) que
ocorre(m) com maior frequncia, podendo ser nico, se existir, como pode tambm no existir. Nesse
caso, mais correto cham-la de medida de posio.
Quando dois valores ocorrem com a mesma frequncia mxima, cada um deles uma moda.
Das diferentes medidas de tendncia central, a moda a nica medida que pode ser usada com
dados em nvel nominal de mensurao, conforme o exemplo 1:
Exemplo 1: Um estudo sobre tempos de reao de pessoas em um teste foi composto por 30 canhotos, 50
destros e 20 ambidestros. Embora no possamos tomar a mdia numrica dessas caractersticas, podemos
afirmar que a moda destro, que a caracterstica com maior frequncia.
Quando no conjunto h apenas um valor que se repete alm dos demais de forma mxima,
chama-se este conjunto de unimodal, bem como se tiver dois valores que se repete alm dos demais, de
forma mxima e na mesma quantidade bimodal, assim acima de 2 modas multimodal. Se o conjunto
de dados no tiver nenhum valor que se repete alm dos demais de forma mxima, o conjunto de dados
amodal.
Notas de Aula
Bioestatstica
Pgina 19
n 1
2
Pelo exemplo 2, como segue, possvel verificar como a realizao da mediana para uma
quantidade mpar de valores.
Agora, se o conjunto de dados (n) constitudo por um nmero par de dados, a mediana a
mdia aritmtica dos dois valores que ficam na posio central dos dados ordenados que pode ser
encontrado atravs da seguinte notao:
n n
1
2 2
2
Pelo exemplo 3, como segue, possvel verificar como a realizao da mediana para uma
quantidade par de valores.
A mediana tem como vantagem a no afetao por valores extremos, ao contrrio da mdia
aritmtica, por isso a mediana uma medida mais robusta (forte) que a mdia, pois na mdia qualquer
alterao nos dados, modifica-se o valor da mdia, e a mediana nem sempre isso acontece.
Depois de verificado as trs medidas de tendncia central que so utilizadas com maior
freqncia, dentre as trs, a mdia aritmtica a medida mais usada na tomada de deciso, pois a mesma
Notas de Aula
Bioestatstica
Pgina 20
encontrada com uso de todos os valores do conjunto de dados, ao passo que a mediana e a moda no
utiliza todos eles, e sim alguns ou nenhum dos valores (amodal), apresentado resultados distorcidos da
realidade dos dados apresentados.
Quando se descreve os dados, alm das medidas de tendncia central, necessrio analisar a
variabilidade dos dados, pois atravs destas pode-se tirar algumas concluses mais consistentes na tomada
de deciso. Assim, o prximo item mostrar as medidas de variabilidades mais utilizadas no campo
estatstico.
3. MEDIDAS DE DISPERSO:
Ao se fazer a descrio dos dados, alm de verificar o centro da distribuio deles atravs das
medidas de tendncia central prescindvel verificar tambm se os dados se comportam de forma
homognea ou heterognea, e isso ser possvel atravs das medidas de disperso.
Essa verificao importante, pois atravs delas podem-se tomar decises mais consistentes e
eficazes. Um exemplo disso eram que os bancos, h uns anos atrs, costumavam exigir que os clientes
formassem filas separados para os diversos guinches, mas atualmente passaram adotar a fila nica. O
motivo dessa modificao foi que o tempo mdio de espera era o mesmo para ambos os formatos de filas,
no afetando a eficincia dos caixas, mas a adoo de fila nica ocorreu ao fato de os clientes preferirem
tempos de espera com menor variao. Assim, que milhares de bancos efetuaram essa modificao que
resultou em uma variao menor (e clientes mais satisfeitos), mesmo que a mdia de tempo de
atendimento no tenha sido afetada.
Com isso, pode-se concluir que as medidas de disperso avaliam a variabilidade dos dados com
relao sua mdia. As medidas de disperso mais usadas so a amplitude total, varincia, desvio padro
e coeficiente de variao.
A primeira medida de disperso a ser analisada nesta nota de aula ser amplitude total, como
segue no tpico seguinte.
Notas de Aula
Bioestatstica
Pgina 21
Pelo exemplo 4 possvel verificar que se no for levado em considerao os valores em si,
pode-se tomar concluses bastante equivocadas, pois amplitude total a mesma para ambas as turmas,
mas os valores de cada uma delas so visivelmente diferentes.
x
n
S2
i 1
n 1
xi = Valores da varivel
X = Mdia aritmtica simples
n = Nmero de valores da amostra
Notas de Aula
Bioestatstica
Varincia populacional
n
x
i 1
, onde
xi = Valores da varivel
= Mdia populacional
N = Nmero de valores da populao
Professor Ms. Kleison Freitas kfreitas@fanor.edu.br
Pgina 22
Propriedades:
a) A varincia de uma constante c igual a zero;
b) Ao somar ou subtrair uma mesma constante c a todos os valores do conjunto de dados, a varincia
no ficar alterada;
c) Se multiplicar ou dividir cada valor do conjunto de dados por uma mesma constante c, a varincia
ficar multiplicada ou dividida, respectivamente, pela constante ao quadrado (c).
Mas, mesmo elevando os desvios ao quadrado, surge o seguinte questionamento: E se ao invs
de elevar cada desvio ao quadrado e depois somar, no seria melhor utilizar o mdulo, em que os desvios
n
x
i 1
X ? E aps isso,
dividir tudo pela quantidade de valores (n), obtendo a o desvio mdio dado pela seguinte notao
n
DM
x
i 1
A resposta para essa pergunta no, pois o mdulo far com que os desvios negativos fiquem
positivos, apresentando uma realidade distorcida dos dados.
Ao elevar ao quadrado, todos os desvios so elevados ao quadrado e no somente alguns,
portanto, o melhor a ser utilizado a varincia porque ela d certeza absoluta que as amostras so
diferentes. J o mdulo no d essa informao de variabilidade, ao contrrio, ele nos d evidncias de
que as amostras so iguais. Por exemplo: Suponha que uma turma fez uma prova e a mdia desta foi 7,0,
e um aluno tirou 8,0, ou seja, a disperso foi de 1 ponto para mais (8 - 7 = 1 ponto). Se outro aluno tirar
6,0, a disperso 1 ponto para menos (6 7 = -1 ponto). Se usar o mdulo, a disperso ao invs de ser -1
e 1, ser 1 e 1, mostrando que no h disperso das notas dos dois alunos, ou seja, ao invs de um aluno
ter tirado a nota 6 e o outro a nota 8, ambos tiraram a nota 8, pois o desvio com o uso do mdulo foi 1
ponto para mais.
Mas mesmo a varincia sendo considerada a ideal para tomar decises sobre a variabilidade dos
dados, a mesma apresenta um grande problema com unidade de medida dos dados que a compem, pois
estes sero elevados ao quadrado, dificultando assim a sua interpretao, pois se a unidade de medida for
em metro, ser metro quadrado, se for em centmetro, ficar centmetro ao quadrado e assim por diante.
Para contornar esse problema e verificar os dados com a unidade de medida original, aconselhase tirar a raiz quadrada da varincia. Nesse caso, chega-se a outra medida de disperso, o chamado desvio
padro, mas antes de analisar esta medida de disperso, faz-se necessrio se atentar para as seguintes
observaes:
Notas de Aula
Bioestatstica
Pgina 23
OBS3: Para um melhor entendimento da diviso por n-1 na frmula da varincia e no por n apenas,
que a varincia trabalha encima de n-1 valores, pois se subtende que pelo menos um valor a prpria
mdia (no havendo disperso de um valor, nesse caso). Portanto, a variabilidade ser entre n-1 valores
e no n.
Por exemplo, sejam os seguintes valores: 1, 2 e 3, a mdia 2, ou seja, um valor a prpria mdia, mas
dois valores no, ou seja, 2 = n-1 = 3-1 = 2. Mas isso no tem 100% de certeza no, pois tem casos em
que a mdia no igual ao conjunto de valores.
OBS4: Observe que no clculo da varincia amostral (S), deve-se dividir a soma dos quadrados dos
desvios por n-1e no por n apenas. Isso se d, pois atravs de estudos que sero vistos em Estimao
de Parmetros, a varincia amostral (S) tende a estimar de forma distorcida a varincia populacional ()
se for dividido apenas por n, ento para que S seja um estimador no viciado ou no tendencioso de
deve-se dividir por n-1.
H uma demonstrao que prova que E(S) = , mostrando que a esperana da varincia amostral igual
a varincia populacional, ou seja, a varincia amostral com diviso da sua frmula por n-1 representa
de forma eficaz e inferencial a varincia populacional, sem ter analisado a populao em si.
Notas de Aula
Bioestatstica
Pgina 24
(x
i 1
X )2
n -1
Notas de Aula
Bioestatstica
Pgina 25
Notas de Aula
Bioestatstica
Pgina 26
Bioestatstica
Pgina 27
4. SEPARATRIZES:
Tanto a mdia como o desvio padro podem no ser medidas adequadas para representar um
conjunto de dados, pois so afetados, de forma exagerada por valores extremos, ou seja, so medidas
sensveis. Ento analisar outras medidas de posio, com as separatrizes, se faz necessrio, assim segue as
medidas:
Quartis: Dividem os valores ordenados (em ordem crescente ou decrescente) da varivel em quatro
partes iguais atravs de trs quartis (Q1, Q2 e Q3), ou seja, (25% abaixo, 50% abaixo e acima, 25%
acima).
Exemplo 5: Seja o seguinte conjunto de dados que representa a idade de determinado grupo de pessoas,
calcule os quartis:
2; 5; 6; 9; 10; 13; 15
OBS: O conjunto de dados MPAR (n = 7), assim:
2
5
6
9
Q1 = P25
Md = Q2 = P50 = D5
10
13
Q3 = P75
13
Soluo:
n 1 7 1
Q1
2valor = 5 anos
4 4
25% das pessoas tem idade abaixo de 5 anos e 75% acima.
n 1 7 1
Q2 Md
4valor = 9 anos
2 2
50% pessoas tem idade abaixo de 50% anos e 3 acima.
3n 1 21 1
Q3
5,5valor = Pega-se o 6 valor = 13 anos
4 4
75% tem idade abaixo de 13 anos e 25% acima.
Exemplo 6: Seja o seguinte conjunto de dados que representa a idade de determinado grupo de pessoas,
calcule e interprete os quartis:
1; 1; 2; 3; 5; 5; 6; 7; 9; 9
OBS: O conjunto de dados PAR (n = 10), mas ao dividir os dados ao meio sobram 5 valores para um
lado e 5 para o outro, ou seja, ao dividir fica uma quantidade mpar para um lado e para o outro, assim:
Bioestatstica
Pgina 28
n n
10 10
1
1
2 2
2
2
5 6 55 5
Q2 Md
2
2
2
2
Quartis: Ao dividir o conjunto de dados em duas partes iguais, ficam 5 valores para um lado e 5 valores
para o outro, ou seja, uma quantidade mpar para um lado e uma quantidade mpar para o outro, assim,
para calcular o quartil 1 e quartil 3, deve-se utilizar a frmula para o caso mpar e no par, assim:
n 1 10 1
Q1
3valor 2
4 4
3n 1 3 *10 1
Q3
8valor 7
4
4
Exemplo 7: Seja o seguinte conjunto de dados que representa a idade de determinado grupo de pessoas,
calcule e interprete os quartis:
1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13
OBS: O conjunto de dados PAR (n = 12). Ao dividir os dados ao meio ficam 6 valores para um lado e 6
para o outro, ou seja, fica uma quantidade par para um lado e uma quantidade par para o outro, assim, as
frmulas devem ser, nesse caso as pares, assim:
Quantidade Par de Valores
1
2
3
Q1 = (2+3)/2 = 2,5
Q2 = (5 + 6)/2 = 5,5
9
9
Q3 = (9+9)/2 = 9
10
13
n n
12 12
1
1
2 2
2
2
6 7 5 6 5,5
Q2 Md
2
2
2
2
Quartis: Ao dividir o conjunto de dados em duas partes iguais, ficam 6 valores para um lado e 6 valores
para o outro, ou seja, uma quantidade par para um lado e uma quantidade par para o outro, assim, para
calcular o quartil 1 e quartil 3, deve-se utilizar a frmula para o caso par, assim:
n n
1
4
4
Q1
3n 3n
1
4
4
Q3
2
Notas de Aula
12 12
1
4 4
3 4 2 3 2,5 anos
2
2
2
36 36
1
4
4
9 10 9 9 9 anos
2
2
2
Bioestatstica
Pgina 29
Notas de Aula
Bioestatstica
Pgina 30
Notas de Aula
Bioestatstica
Pgina 31
Atravs desse grfico, podemos comparar as distribuies de idade entre cada profisso, quanto a
posio e disperso. Temos por exemplo, que advogados tm a menor mdia de idade de escolha da
profisso. Mdicos tm a maior idade, seguidos pelos dentistas. Temos, entretanto, que a variao de
idade para os dentistas muito maior do que para os mdicos e advogados. Provavelmente detectaramos
diferena significativa entre as mdias de idade de advogados e mdicos, e advogados e dentistas, mas
devido a grande variao de idades para dentistas, talvez no se detecte diferena entre mdicos e
dentistas. Temos tambm a ocorrncia de uma observao discrepante (outlier) para idade de dentistas:
enquanto 50% dos dentistas esto entre aproximadamente 29 e 34 anos, houve um dentista com idade
prxima de 20.
Alm disso, enquanto a distribuio de idade para advogados parece razoavelmente simtrica em
torno da mediana, para mdicos e dentistas parece haver uma concentrao maior (moda) para idades
maiores, indicando provavelmente uma distribuio assimtrica direita, isso quer dizer que a moda
mediana mdia. Para visualizar melhor s virar cada grfico para o lado direito e veremos que o lado
maior est do lado direito (assimetria direita).
Portanto, sugere-se o uso do resumo dos cinco nmeros de um conjunto de dados para a
construo do Box-Plot:
1 Valor mnimo (E1): Menor valor do conjunto de dados. Em algumas vezes pode ser considerado um
outlier (dado discrepante);
2 Primeiro Quartil (Q1): um valor que deixa um quarto dos valores abaixo e trs quartos acima dele
(25% abaixo e 75% acima);
3 Segundo Quartil ou Mediana (Q2 ou Md): um valor que divide na metade o conjunto de dados (50%
abaixo e 50% acima);
4 Terceiro Quartil (Q3): um valor que deixa trs quartos dos dados abaixo e um quarto acima dele
(75% abaixo e 25% acima);
5 Valor mximo (En): Maior extremo do conjunto de dados.
Exerccio 8: Segue abaixo as notas de 26 alunos de uma disciplina de Bioestatstica, construa um grfico
Box-Plot:
2,8
7,3
9,0
3,3
7,5
9,3
4,5
7,8
9,6
5,0
7,8
9,8
5,3
8,3
10,0
6,0
8,5
10,0
6,0
8,8
7,0
9,0
7,0
9,0
7,3
9,0
Notas de Aula
Bioestatstica
Pgina 32
Notas de Aula
Bioestatstica
Pgina 33
desta forma em Fortaleza, por exemplo, nos meses que ocorre o vero (dezembro at meados de maro),
o consumo de gua nas residncias aumenta de forma significativa.
A priori essa relao pode ser verificada com auxlio de um grfico de disperso bidimensional,
que ser definido como eixo x, a varivel causa e y, a varivel efeito, como segue:
2.1. Interpretao subjetiva do grfico de disperso:
y
x
Correlao Positiva
entre x e y
Notas de Aula
Bioestatstica
x
Forte correlao
Positiva entre x e y
x
Correlao Positiva
perfeita entre x e y
Pgina 34
Assim, a importncia de tal determinao decorre do fato de que a presena de uma correlao
pode conduzir-nos a um mtodo para estimar a varivel y (efeito) utilizando a varivel x (causa).
2.2. Outliers:
Os conhecidos como outliers, so os pontos discrepantes, ou as observaes extremas que no
so condizentes com o restante da massa de dados, conforme o Grfico abaixo. As causas mais provveis
da ocorrncia de outliers pode ser o registro incorreto dos dados, algum defeito no instrumento de
medio utilizado, dentre outros. Caso isso ocorra, o outlier deve ser se possvel, corrigido, em extremo
caso eliminado. Desta forma, deve-se dar a devida ateno causa de tais anomalias, pois esses dados
discrepantes podem ser teis para descobrir a causa dessa ocorrncia.
Outlier
x
Como as concluses tiradas de grficos de disperso tendem a ser subjetivas, necessita-se de
mtodos mais precisos e objetivos. Ento se utiliza o coeficiente de correlao linear de Pearson para
detectar padres lineares.
2.3. Coeficiente de Correlao de Pearson ( Rxy ):
O Coeficiente de Correlao de Pearson mede o grau de associao entre as duas variveis
analisadas, podendo ser fraca ou forte. Para isso, a notao matemtica que permite verificar essa
associao a que segue:
R xy
XY
X
X 2
X Y
2
Y
Assim, o valor de Rxy deve pertencer ao intervalo -1 Rxy 1, e a sua interpretao a seguinte:
Notas de Aula
Bioestatstica
Pgina 35
Diretamente proporcional: x y
Inversamente proporcional: x y
Contudo, em geral, uma correlao forte no sinnima de uma relao causa-efeito entre as
amostras ou variveis. H situaes em que um coeficiente de correlao prximo de um ou de um menos
um no significa que a maioria dos pares de valores esteja contida em uma reta (ser visto em regresso
linear). Desta forma, o simples conhecimento do coeficiente de correlao no suficiente devido a
anomalias na disperso dos dados, por isso recomendada a construo do grfico de disperso das
amostras para melhor compreender o resultado, pois em alguns casos, a relao de causa e efeito pode ser
provocada por um ou mais fatores ocultos, uma varivel no considerada na anlise.
Por exemplo, suponha que o nmero de vendas dirias de um jornal e a produo diria de ovos
tenha uma forte correlao positiva. No se pode afirmar que o aumento do nmero de jornais vendidos
resulte no aumento da produo de ovos. Para compreender a forte correlao positiva, devem-se
procurar fatores ocultos, por exemplo, o aumento de riqueza da populao que resulta em aumento de
demanda dos dois produtos ao mesmo tempo, jornais e ovos.
Conhecer a relao significativa entre as variveis de extrema importncia para que assim o
investigador possa realizar suas previses com mais segurana, assim, faz-se necessrio conhecer o que
regresso linear.
Notas de Aula
Bioestatstica
Pgina 36
Perda de peso de uma pessoa em decorrncia do nmero de semanas que se submete a uma dieta de
800 calorias-dia;
Despesa de uma famlia com mdico e com remdio em funo de sua renda;
Consumo per capita de certos alimentos em funo do seu valor nutritivo e do gasto com propaganda
na TV;
Taxa de juros em funo da inflao;
Salrio em funo da escolaridade do trabalhador.
Assim, no estudo de regresso linear simples, utilizam-se duas amostras (ou duas variveis) e se
objetiva em analisar a reta que melhor explica a relao entre essas duas variveis, tendo previamente
definido a varivel independente (ou resposta ou causa) e a varivel dependente (ou preditora ou efeito).
A origem do termo regresso remonta a Francis Galton (1822 a 1911), que por volta de 1855,
investigava relaes entre caractersticas antropomtricas de sucessivas geraes. Uma de suas
constataes era de que cada peculiaridade de um homem transmitida aos seus descendentes, mas, em
mdia, numa intensidade menor. Por exemplo: embora pais com baixa estatura tendem a ter filhos
tambm com baixa estatura, estes tm altura mdia do que a altura mdia de seus pais. O mesmo ocorre,
mas em direo contrria, com pais com estatura alta. A esse fenmeno de a altura dos pais mover-se em
direo altura mdia de todos os homens ele chamou de regresso.
O termo regresso remete ao passado, ou seja, para se fazer previses estatsticas necessrio
conhecer o passado (ou histrico) das variveis de causa e efeito da empresa. Caso a empresa no possua
estes dados e quiser fazer previses, a sada buscar dados do seu concorrente.
y x x xy
a
n x x
Notas de Aula
Bioestatstica
xy
x y
n
x
x
n
Pgina 37
4. SRIES TEMPORAIS:
Segundo Corrar (2009), uma srie temporal um conjunto de observaes sequenciais de
determinada varivel, expressas numericamente, obtidas em perodos regulares de tempo. Assim, a
anlise de sries temporais baseia-se na premissa segundo a qual os fatores que influenciaram o
comportamento dos dados no passado continuam influenciando seus movimentos futuros.
Desta forma, os dados coletados de uma srie temporal podem sofrer a influncia de diversos
fatores, como: alteraes macroeconmicas, mudanas no padro tecnolgico vigente, variaes nas
condies de natureza, ou mesmo podem ser afetados por fenmenos imprevisveis, e por consequncia
disso, os dados podem sofrer alguma tendncia (sazonalidade, por exemplo), que consiste em mudanas
nos dados, fazendo-os serem no formato linear (diretamente ou inversamente proporcional), ou no
formato de uma curva, como por exemplo, a exponencial, polinomial, potencial, dentre outras (Quadro 1).
Tipo de Funo Equao Original
Equao
Linearizada
y = a + b.x
y = a + b.x
Linear
bx
y = a.e
ln y = ln a + b.x
Exponencial
b
y
=
a.x
ln
y = ln a + b.ln x
Potncia
y = a + b.ln x
y = a + b.ln x
Logartmica
Quadro 1: Principais transformaes lineares
Fonte: Adaptado de Corrar (2009)
Notas de Aula
Bioestatstica
Varivel
X
Varivel
Y
x
x
ln x
ln x
y
ln y
ln y
y
Pgina 38
Propaganda
Vendas
(R$ milhes) (R$ milhes)
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
30
21
35
42
37
20
8
17
35
25
430
335
520
490
470
210
195
270
400
480
CORRELAO:
1 Passo:
Abrir o arquivo que encontra o banco de dados no Excel ou digitar os valores da tabela acima;
Identificar quais so as variveis quantitativas e qual delas ser x (causa) e y (Efeito);
Bioestatstica
Pgina 39
Verificar se os dados do grfico seguem uma tendncia linear. Se sim, calcula-se a correlao linear
entre as variveis x e y;
y x x xy
n x x
CUIDADO para definir qual varivel x (independente) e qual y (dependente), pois contrrio o
resultado de a e b ser errado.
Clique em Inserir funo INTERCEPO Selecione os dados da varivel y, inclusive o ttulo,
e os dados da varivel y. Resultar: a = 117,07
Notas de Aula
Bioestatstica
Pgina 40
Para encontrar o valor de b (o coeficiente angular, ou seja a inclinao da reta), que representado
pela frmula:
xy
x y
n
x
n
Clique em Inserir funo INCLINAO Selecione os dados da varivel y, inclusive o ttulo, e
os dados da varivel y. Resultar: b = 9,74
Portanto a equao de previso ser: y = a + bx, ou seja, y = 117,07 + 9,74x, que representa:
Vendas = 117,07 + 9,74. Propaganda
Procedimento 2: Atravs da ferramenta ANLISE DE DADOS:
Clique em Ferramentas Anlise de dados Regresso OK Selecione separadamente a
varivel y (vendas) e a varivel x (propaganda), inclusive os ttulos Clique em rtulos Nova
planilha. O que iremos utilizar segue abaixo:
Estatstica de regresso
R mltiplo
0,859366125
R-Quadrado
0,738510137
R-quadrado ajustado 0,705823904
Erro padro
65,17342989
Observaes
10
Onde o Coeficiente de determinao (R) igual a 0,7385, ou seja, 73,85% dos dados esto sendo
explicados pela equao y = 117,07 + 9,74x, e 0,2614 = 26,14% no esto sendo explicados pela reta
encontrada.
Coeficientes
Interseo
117,0701581
Propaganda (R$ milhes) 9,738142292
O quadro acima mostra os coeficientes a e b da reta de regresso.
Notas de Aula
Bioestatstica
Pgina 41
500
400
300
200
y = 9,7381x + 117,07
R2 = 0,7385
100
0
0
10
20
30
40
50
Notas de Aula
Bioestatstica
Pgina 42
Notas de Aula
Bioestatstica
Pgina 43
Notas de Aula
Bioestatstica
Pgina 44
n
30
35
40
50
60
70
80
90
100
110
Pela: k =
6
6
7
8
8
9
9
10
10
11
6
6
7
7
7
7
8
8
8
8
At
k
4. TIPOS DE FREQUNCIAS:
4.1. Frequncia simples ou absoluta (fi): o nmero de observaes correspondente classe i (i =
K
1,...,k), ou seja,
f
i 1
Notas de Aula
Bioestatstica
Pgina 45
4.2. Frequncia relativa fi (%): A frequncia relativa representa a proporo de observaes de uma
classe em relao ao nmero total de observaes. Trata-se, portanto, de um nmero relativo. Para
calcular a frequncia relativa basta dividir a frequncia absoluta do valor individual (ou da classe) pelo
numero total de observaes, ou seja, ento:
f
f i (%) i x100 , onde
n
n = Tamanho da amostra
K
f (%) 1 ou 100%
i 1
F
Fi (%) i 100
n
F
Fi (%) i 100
n
46
52
57
47
54
57
48
54
57
49
54
58
49
55
61
50
55
61
51
55
64
51
56
65
51
56
68
a) Construa uma distribuio de frequncias com classes para os dados acima (Utilize duas casas
decimais aps a vrgula)
Notas de Aula
Bioestatstica
Pgina 46
Responda:
b) Quantos pacientes tem o peso entre 50,68 e 55,02kg?
Soluo:
Notas de Aula
Bioestatstica
Pgina 47
5.2. Polgono* de frequncias: Consideramos um grfico de linha que une os pontos mdios das bases
superiores dos retngulos do histograma (pontos mdios das classes).
Notas de Aula
Bioestatstica
Pgina 48
Notas de Aula
Bioestatstica
Pgina 49
- Mesocrtica: ou de curtose mdia. Ser essa a nossa Curva Normal. Meso lembra meio. Esta curva
est no meio termo: nem muito achatada, nem muito afilada;
- Platicrtica: a curva mais achatada, ou seja, os dados esto muito dispersos da mdia. Seu desenho
lembra o de um prato emborcado. Ento prato lembra plati e plati lembra platicrtica;
- Leptocrtica: a curva mais afilada, ou seja, os dados esto muito concentrados no meio (na mdia),
sempre estar acima da Curva Normal.
OBS: Se a distribuio assimtrica no h razes para verificar o seu grau de achatamento, ou seja, no
existe curtose para ela.
Notas de Aula
Bioestatstica
Pgina 50
h) Construa uma Ogiva de Galton e informe em qual classe se encontram as 10% maiores notas e as 10%
menores.
6. MEDIDAS DE TENDNCIA CENTRAL PARA DADOS AGRUPADOS EM CLASSES:
6.1. Mdia Ponderada (x ) : Quando os dados esto resumidos em uma tabela de frequncia, podemos
aproximar a mdia substituindo os limites da classe pelos pontos mdios delas, e supor que todos os
elementos da classe se concentram no respectivo ponto mdio.
No exerccio 2, por exemplo, a 2 classe de 4,0|---5,2 contm dois valores que se situam em
algum ponto entre os limites da classe, mas no sabemos os valores especficos desses dois nmeros. A
fim de possibilitar os clculos, supomos que todos os dois valores se concentram no ponto mdio 4,6, ou
seja, supomos que a mdia deles 4,6.
Onde:
n = nmero de observaes ou tamanho da amostra
k
X i fi
i 1
Notas de Aula
Bioestatstica
li l s
, onde li = limite inferior e ls = limite superior
2
Pgina 51
6.2. Moda (Mo): Existem diferentes formas de se calcular a Moda de uma Distribuio de Frequncias.
Para isso existem dois mtodos, cada um dos quais traduzidos por uma frmula.
Aprenderemos a determinar a Moda da Distribuio de Frequncias pelo Mtodo de Czuber e
pelo Mtodo de King. Teremos ento que conhecer ambas as frmulas, saber aplic-las e, sobretudo,
saber quando usar uma ou outra.
A regra a seguinte: se a questo no especificar qual das frmulas a ser empregada, pedindo
apenas que se calcule a Moda, usaremos a frmula de Czuber. Consequentemente, s empregaremos a
frmula de King quando assim for solicitado expressamente pelo enunciado.
- Passo Preliminar: Encontrar a Classe Modal
A determinao da Moda de uma Distribuio requer que se proceda a um passo preliminar, que
consiste em identificar a classe modal daquele conjunto. A classe modal ser, simplesmente, aquela que
apresentar maior frequncia absoluta simples, ou seja, maior fi.
- Moda pelo Mtodo de Czuber:
1
Mo limo
h
2
1
Onde:
limo= limite inferior da classe modal
OBS4: Delta () normalmente significa diferena.
1 = Diferena entre a frequncia absoluta da classe modal e da classe imediatamente anterior: 1 = fmo fant
2 = Diferena entre a frequncia absoluta da classe modal e da classe imediatamente posterior:
2 = fmo fpost
h = comprimento do intervalo da classe modal
6.3. Mediana (Md): Quando se trabalha com uma distribuio de frequncias, deve-se inicialmente,
identificar a classe mediana atravs do elemento mediano (EM), assim:
Para n = mpar: EM
n 1
2
n
2
Aps isso, na frequncia acumulada abaixo de, localizar a frequncia imediatamente posterior
Para n = par: EM
Notas de Aula
Bioestatstica
EM Fi ant
Md
Md linfMd
f iMd
.h
Pgina 52
Onde,
linf Md = limite inferior da classe mediana (classe
mediana
classe mediana
n = tamanho da amostra
S
2
(X
i 1
Desvio Padro
k
X )2 fi
n 1
(X
i 1
Coeficiente de Variao
S
CV
X
X )2 fi
n 1
100
Exerccio 2: Os dados abaixo so referentes aos pesos (kg) de 25 crianas que nasceram de forma
prematura. Um nutricionista deseja analisar as condies nutricionais destes recm-nascidos e fazer um
acompanhamento do peso deles nos prximos 3 meses. Complete as informaes que faltam na
distribuio de frequncias e responda os itens abaixo:
Pesos (kg)
fi
fi (%)
Fi
(abaixo de)
Fi
(acima de)
100%
xi
xifi
1,5|--- 1,7
|---
|---
11
|---
|---
TOTAL
25
Bioestatstica
Pgina 53
Estatstica
Pgina 54
Alm disso, ele tambm d os primeiros passos em direo a novos tipos de seguros calculando,
por exemplo, a mortalidade causada pela varola em pessoas de idade dada.
Concomitantemente, os jogos de azar, jogos nos quais a possibilidade de ganhar ou perder no dependem
da habilidade do jogador, mas sim exclusivamente do azar do apostador, so, provavelmente, to velhos
quanto humanidade.
Sendo assim, a origem da probabilidade se deu aos jogos de azar, atravs de questes postas pelo
matemtico francs Pascal (1623-1662) com o clebre cavaleiro Mr, um famoso jogador profissional
que escreveu uma carta a Pascal, propondo-lhe resolver alguns problemas matemticos que tinha
encontrado em suas lidas com jogos de azar.
Sendo assim, hoje h muitas aplicaes que envolvem jogos de azar como as loterias, os cassinos
de jogos, as corridas de cavalos e os esportes organizados (futebol, voleibol, handebol), dentre outros, que
utilizam a teoria das probabilidades diariamente nas duas deliberaes.
Independente de qual seja a aplicao em particular, a utilizao das probabilidades indica que
existe um elemento de acaso, ou de incerteza, quanto ocorrncia ou no de um evento futuro. Assim
que, em muitos casos, pode ser impossvel afirmar por antecipao o que ocorrer, mas possvel dizer o
que pode ocorrer. Por exemplo, se jogarmos uma moeda para o ar, de modo geral no podemos afirmar se
vai dar cara ou coroa. Alm disso, mediante determinada combinao de julgamento, experincia e dados
histricos, em geral, possvel dizer quo provvel a ocorrncia de determinado evento futuro.
Assim, as probabilidades so teis porque auxiliam a desenvolver estratgias e faz com que o
mtodo da inferncia estatstica se baseie na teoria da probabilidade para formular concluses sobre toda
uma populao (N) baseada em uma amostra (n). Dessa forma que alguns motoristas parecem
demonstrar uma tendncia para correr a grande velocidade se acham que h pouco risco de serem
apanhados ou de correr acidentes fatais. Os investidores sentem-se mais inclinados a aplicar seu dinheiro
se as chances de lucro so boas, e voc certamente carregar capa ou guarda-chuva se houver grande
probabilidade de chover. Analogamente, uma empresa pode sentir-se inclinada a negociar seriamente com
um sindicato quando h forte ameaa de greve, ou mais inclinada a investir em novo equipamento se h
boa chance de recuperar o dinheiro, ou ainda de contratar um novo funcionrio que parea promissor,
dentre outros.
Ao longo dos anos, os clculos probabilsticos vieram se aperfeioando, passando da simples
anlise de fatos concretos abstrao destes. Um caso de utilizao da teoria da probabilidade o
envolver a maior loteria do Brasil, a Mega-Sena, onde so apostados de seis a quinze nmeros, entre os
60 disponveis no volante (01 a 60, inclusive respectivamente).
Notas de Aula
Estatstica
Pgina 55
Neste jogo, os apostadores podem apostar de no mnimo seis nmeros e no mximo quinze do
total de 60. Marcando 4, 5 ou 6 pontos (quadra, quina ou sena, respectivamente) recebero prmios.
O preo das apostas dependendo de quantos grupos possveis de seis nmeros existem dentro dos
nmeros escolhidos, variam de R$ 3,50 para seis nmeros (somente 1 jogo possvel) a R$ 8.758,75 para
15 nmeros (5005 jogos possveis). A possibilidade de acertar a Mega-Sena ao fazer uma aposta mnima
de 1 em 50.063.860 (aproximadamente 50 milhes).
O clculo feito da seguinte forma:
n = Total de nmero a escolher (n = 60)
X = Ganhar na Mega-Sena, ou seja, quantidade de nmeros a acertar dentre os 60 nmeros (x = 6
nmeros), ento:
Como a ordem de escolha dos nmeros no importa, ento usa-se a seguinte frmula de
combinao:
n 60
60!
60!
50.063.860 , ento:
x 6 6!(60 6)! 6!54!
P(ganhar na mega-sena) =
1
0,00000002 0,000002% , ou seja, as chances de
50.063.860
ganhar o jogo com uma nica cartela de 1 para 50 milhes. Para todos os efeitos prticos, essa
probabilidade zero, o que significa que o apostador tem quase nenhuma chance de ganhar na loteria com
uma nica cartela, mas mesmo assim, sempre h algum ganhador na loteria. Essa contradio aparente
pode ser explicada com a seguinte analogia:
Suponha que h uma fila de micronibus de Fortaleza at o Porto Alegre (RS). Suponha que
pela distncia entre as duas cidades e pelo comprimento de um micronibus normal, haver, de forma
hipottica, aproximadamente 23 milhes de micronibus na fila. Diretores da loteria selecionariam, ao
acaso, um dos micronibus e colocariam um cheque de 30 milhes de reais em seu porta-luvas. Por um
custo de dois reais o apostador pode viajar pelo pas e selecionar um (e somente um) micronibus e
verificar o porta-luvas.
Em sua opinio, voc acha que o apostador vai encontrar os 30 milhes no micronibus que
escolheu?
Voc deve estar quase certo que no. Agora, permita que qualquer pessoa entre na lotrica e por
dois reais adquira uma cartela e suponha que 50 milhes de pessoas faam isso uma nica vez. Com um
nmero to grande de participantes muito provvel que algum v achar o micronibus com os 30
milhes, mas quase certo que no ser voc.
Notas de Aula
Estatstica
Pgina 56
Este exemplo ilustra um axioma da Estatstica chamando de a lei dos grandes nmeros (proposta
por Bernoulli), que estabelece que a frequncia relativa (proporo entre o nmero de elementos do
espao amostral e o espao amostral) do nmero de vezes em que um resultado ocorre quando um
experimento repetido muitas vezes (um grande nmero de vezes) se aproxima do valor terico da
probabilidade de resultado. Em outras palavras, quando se repete um experimento um nmero
suficientemente grande de vezes possvel, substituir a expresso frequncia relativa por
Probabilidade com erro desprezvel.
Bernoulli afirmou: Para um grande nmero de experincias, tendo cada uma um resultado
aleatrio, a frequncia relativa de cada um desses resultados tende a estabilizar, convergindo para um
certo nmero que constitui a probabilidade desse resultado.
claro que se o nmero de repeties da experincia aleatria for bastante elevado, e a mesma
for repetida em sequncias de n vezes, a frequncia do acontecimento do evento E diferente de
sequncia para sequncia, mas toma valores prximos de um valor dado. Esse valor o limite para o qual
tende a frequncia do acontecimento E, e tambm o valor esperado (terico) da probabilidade desse
acontecimento quando o nmero n de provas que se realizaram tende para infinito. Assim:
P( E )
lim
n
P( E )
lim n( E )
n n()
No entanto, para este processo poder ter preciso, necessrio realizar um grande nmero de
vezes a experincia aleatria. Isto ocorrendo, para qualquer tipo de distribuio de probabilidade
(Normal, Uniforme, Triangular, Exponencial) a lei dos grandes nmeros funciona tambm.
Na prtica empresarial, a utilizao lei dos grandes nmeros ocorre devida uma razo bem
cientfica para escolha do ser humano mdio como foco na formulao desta lei na gesto de pessoas,
podendo formul-la mais ou menos assim: O comportamento de um grande nmero de pessoas mais
previsvel do que o comportamento de um grupo pequeno ou que o comportamento de uma pessoa
isolada. Essa afirmao nos ajuda a entender vrios acontecimentos aparentemente misteriosos da vida
em sociedade, e muita mais na vida na empresa. Por exemplo, ningum controla a quantidade de comida
que deve chegar a uma cidade como Fortaleza, ou quais tipos de comida devem ser encomendados, mas
certo eu encontrar o que quero, quando quero, do jeito que quero. A habilidade que o sistema tem de
antecipar minhas necessidades e desejos sem que eu tenha falado deles a ningum, explicada pela lei
dos grandes nmeros. Eu, um cara mdio, no vou sair procurando nada muito fora da mdia. Chamam
esse talento para computar o que os mdios querem, de talento de marketing, e para isso utilizam a
teoria da probabilidade.
Notas de Aula
Estatstica
Pgina 57
Ainda para uma maior explicao da lei dos grandes nmeros, se no soubermos a probabilidade
de ocorrer algum evento natural (por exemplo, a chance de chover), ou se no conhecemos a frao de
alguma populao que satisfaz uma condio (tal como quantas partes defeituosas foram produzidas
numa linha de montagem) podemos descobrir esta probabilidade ou esta porcentagem atravs de
numerosas observaes e experimentos suficientes.
Um outro exemplo para a lei dos grandes nmeros voc pode achar estranho que uma pessoa
ganhe duas vezes ou mais na Mega-Sena. O New York Times contou a histria de uma mulher de Nova
Jersey (EUA) que ganhou duas vezes a lotaria americana, dizendo que as probabilidades eram de 1 em
17 trilhes. Contudo, os estatsticos Stephen Samuels e George McCabe da Universidade de Purdue
calcularam a probabilidade de algum ganhar a loteria duas vezes num perodo de 4 meses como de 1
para 30.
Por qu essa chance e essa probabilidade de ganho aumenta?
Porque os jogadores no compram um nico bilhete para cada uma das duas loterias, compram
vrios bilhetes mltiplos por semana. Justificando nesse caso a lei dos grandes nmeros com a quantidade
grande de jogadas por jogadores.
Em outras palavras, quer ganhar na Mega-Sena, aposte nela e com muitas cartelas, mas muitas
mesmo.
Um outro exemplo para a lei dos grandes nmeros , se fizermos uma pesquisa sobre a
populao de um Estado brasileiro e observamos apenas alguns cidados (amostra), os resultados podem
conter grande erro, porm se analisarmos vrias pessoas em vrias cidades diferentes dentro deste Estado
(selecionados ao acaso), os resultados das amostras estaro muito prximos dos verdadeiros valores da
populao e quanto maior a amostra (maior nmero de pessoas entrevistadas) maior ser esta
aproximao.
Diante de tudo isto, os jogos, considerados legais, no Brasil estimulado, pois de acordo o site
da Caixa Econmica Federal (Janeiro, 2012), quem joga na Mega-Sena tem milhes de motivos para
apostar e milhes de brasileiros para ajudar. 51% do valor arrecadado com as apostas repassada ao
Governo Federal, que pode, ento, realizar investimentos nas reas da sade, educao, segurana, cultura
e do esporte, beneficiando toda a populao, por exemplo, 18,1% destinado Seguridade Social, 7,76%
ao FIES-Crdito educativo e 3,14% ao Fundo Penitencirio Nacional.
Desde ento, as loterias em geral se tornaram imensamente populares por duas razes. Primeiro,
elas atraem o apostador com a oportunidade de ganhar milhes de reais com um investimento de dois
reais, segundo, quando o apostador perde, pelo menos acredita que seu dinheiro est indo para uma boa
causa.
Notas de Aula
Estatstica
Pgina 58
A Mega-Sena no simplesmente uma vantagem para o povo concedida pelo governo, pois
como a grande maioria dos apostadores so pertencentes classe baixa, os mesmos gastam na loteria
aproximadamente o mesmo que pessoas de classe mdia, mas por terem menos dinheiro, o maior
percentual de seus ganhos dos que apostam na sorte se destinam a esse fim. Isso faz desta uma forma de
atividade regressiva, ou seja, empobrece mais quem j tido como pobre.
Sempre acerto 11 pontos e ganho 2 reais na LOTOFACIL, s
uma vez que acertei 13 pontos e ganhei 10 reais. No total ja
ganhei 32 reais, mas a descontei 12 reais das apostas, sobrou
20 reais, s que a fui descontar os outros jogos que eu no
acertei e vi que fiquei 17 reais mais pobre...
Notas de Aula
Estatstica
Pgina 59
Evento impossvel: o evento que nunca ocorre (), ou seja, no h possibilidade de ocorrncia deste
evento.
Ex: Obter soma maior que 12 no lanamento de dois dados.
Operaes com eventos aleatrios:
a) Unio: Sejam os eventos A e B, a unio do evento A ao evento B entendido por A B. Representa a
ocorrncia de pelo menos um dos eventos, A ou B.
Ex: Seja o experimento: Lanar um dado honesto. Ento, = {1, 2, 3, 4, 5, 6}, sejam os eventos:
E1: Ocorrer face par
E2: Ocorrer nmero menor que 3
Ento, E1 E2 =
Representao esquemtica pelo diagrama de Venn:
E1
E2
b) Interseo: O evento interseo formado pelos pontos amostrais que pertencem simultaneamente
aos eventos A e B, sendo representado por A B.
Ex: Seja o experimento Lanar um dado honesto. Ento, = {1, 2, 3, 4, 5, 6}, sejam os eventos:
E1: Ocorrer face par ou
E1
Notas de Aula
Estatstica
Pgina 60
Nmero de elementos de E
n( E )
, assim: P( E )
Nmero de elementos do
n()
Em outras palavras, probabilidade uma frao entre o nmero de resultados favorveis (aqueles
que satisfazem a necessidade do problema as ser calculado) com o nmero de resultados possveis.
De acordo a Lei dos Grandes Nmeros: Quando o nmero de provas aumenta muito, tendendo
para infinito, a frequncia relativa de cada acontecimento, associado experincia aleatria tende a
estabilizar na vizinhana de um certo valor, ou seja, converge para um limite que a probabilidade desse
acontecimento.
Propriedades/Axiomas:
a) A probabilidade de um evento certo igual a 1, isto , P() = 1
b) O P(E) 1: A probabilidade de um evento ocorrer sempre maior ou igual a zero e menor ou igual a
1.
c) P( A ) 1 P( A) P( A) P( A ) 1 = P(), ou seja, a soma de eventos mutuamente exclusivos
sempre ser igual a 1.
d) P() = 0, mas a reciproca no verdadeira, pois o fato de P(A) = 0 no implica que seja impossvel.
Notas de Aula
Estatstica
Pgina 61
Exerccio 1: Em um teste com 3 questes do tipo verdadeiro e falso, um estudante que no est preparado
deve responder cada uma aleatoriamente (chutando). Portanto:
a) Relacione os diferentes resultados possveis:
Soluo:
Exerccio 2: Uma pessoa vai ler uma frase de uma pgina ao acaso
de um livro de 240 pginas. Qual a probabilidade de ser escolhida
uma pgina com nmero compreendido entre 80 e 120, excluindo
estes dois?
Soluo:
2.2. Teorema da soma: Seja E um espao amostral finito e no vazio. O principal objetivo da regra da
adio encontrar a probabilidade de ocorrncia do evento A, ou do evento B, ou de ambos, ou pelo
menos um deles. Assim:
P (A B) = P (A) + P (B) P (A B)
Ou
P(A B) P(A B) P(A B) P(A B)
P (A e B) = P (A B)
Se os eventos forem mutuamente exclusivos, ou seja, no ocorrem simultaneamente, isto ,
A B = , ento P (A B) = 0, assim: P (A B) = P (A) + P (B)
Notas de Aula
Estatstica
Pgina 62
1
1
1
, P (B) = e P (A B) = . Ento temos:
2
3
4
a) P(A)
b) P(A B)
c) P(A B)
d) P(A B)
e) P(A B)
Exerccio 4: Quando Maria pra em um posto de gasolina, a probabilidade dela abastecer o seu
automvel 0,73; a probabilidade dela pedir para verificar a presso dos pneus 0,28 e a probabilidade
dela pedir para realizar ambos, abastecimento e pneus 0,04. Portanto, a probabilidade de Maria parar em
um posto de gasolina e no pedir nem para abastecer o automvel e nem para verificar a presso dos
pneus igual a:
Soluo:
Notas de Aula
Estatstica
P( A B)
, onde P (B) > 0
P( B)
Pgina 63
n( A B )
n ( )
Nesse caso, P( A / B)
n( B )
n ( )
Se A e B forem independentes:
P( A / B)
P( A).P( B)
P( A) , analogamente P(B/A) = P(B), ou seja, a regra da probabilidade
P( B)
condicional no se aplica.
Exerccio 5: Um nmero sorteado ao acaso entre os inteiros: 1, 2, ... , 15. Se o nmero sorteado for par,
qual a probabilidade de que seja o nmero 6?
Soluo:
Estatstica
Pgina 64
Um outro exemplo de independncia: Imagina a situao em que em uma mo voc tenha um dado e
em uma outra uma moeda, o lanamento de um e de outro no influencia nos seus respectivos resultados.
Ou seja, lana uma moeda para cima e um dado sobre a mesa no vai influenciar em nada, pois so
eventos independentes.
Exerccio 6: Em uma caixa existem 5 bolas brancas e 8 bolas azuis. Duas bolas so retiradas uma aps a
outra da caixa, aleatoriamente e sem reposio. Determine:
a) A probabilidade de serem brancas:
Notas de Aula
Estatstica
Pgina 65
Notas de Aula
Estatstica
Pgina 66
1.2. Frequncia relativa (%): Ao lado do valor encontrado para o estado civil casado, calcular a
frequncia percentual para esse estado civil:
Digitar a seguinte frmula: =(valor encontrado/valor total) Clicar em % com uma casa decimal
(Formatar Clula Em porcentagem, clicar em 1 casa decimal).
Para fixar o valor total clicar no meio dele e depois em f4 e arrasta at fim da tabela.
Para a clula abaixo (Solteiro): Repetir os passos acima;
Em Total, clicar em Somatrio ou =soma(C3:C4) (Cuidado, o total deve resultar em 1 ou
100%).
1.3. Formatao da tabela: Selecione toda zona enunciativa da tabela e clique em Bordas (Borda
superior e inferior). Idem para o Total.
Se quiser: Selecione toda coluna de Frequncia e clicar em Borda externa (quadrado).
Cuidado: A tabela no deve ser fechada nas bordas.
Sada do Excel:
Estado Civil Frequncia Frequncia (%)
Casado
20
55,6
Solteiro
16
44,4
Total
36
100,0
Tabela 1: Estado civil dos funcionrios da empresa x, Fortaleza, Cear, 2013
Fonte: Empresa x
Notas de Aula
Estatstica
Pgina 67
Ttulo: Boto direto do mouse: Opes do grfico Em Ttulo: digitar Estado Civil dos
funcionrios da Empresa x, Fortaleza 2013.
Sada do Excel:
2. TABELA DINMICA:
Clicar em Inserir Tabela dinmica Selecionar todo o banco de dados Intervalo: Selecione
Estado Civil e Sexo (tudo junto) Avanar Nova Planilha Concluir
Arrastar a varivel estado civil para a coluna e a varivel sexo para linha e qualquer uma das duas no
meio.
Notas de Aula
Estatstica
Pgina 68
Sada do Excel:
Sexo
Feminino
Masculino
Total
Estado Civil
Casado Solteiro
12
10
8
6
20
16
Total
22
14
36
Notas de Aula
Estatstica
Pgina 69
Sexo
Feminino
Feminino
Masculino
Masculino
Feminino
Feminino
Feminino
Feminino
Masculino
Feminino
Feminino
Feminino
Feminino
Feminino
Masculino
Feminino
Feminino
Masculino
Masculino
Masculino
Masculino
Feminino
Feminino
Masculino
Feminino
Masculino
Feminino
Masculino
Feminino
Feminino
Masculino
Masculino
Feminino
Feminino
Masculino
Feminino
Grau de instruo
Ensino Mdio
Ensino Mdio
Superior
Ensino Fundamental
Superior
Ensino Fundamental
Ensino Fundamental
Ensino Mdio
Ensino Mdio
Ensino Mdio
Ensino Mdio
Superior
Ensino Fundamental
Ensino Mdio
Ensino Mdio
Superior
Ensino Mdio
Ensino Mdio
Ensino Mdio
Ensino Mdio
Ensino Fundamental
Ensino Mdio
Ensino Mdio
Ensino Mdio
Ensino Mdio
Ensino Fundamental
Ensino Fundamental
Ensino Mdio
Ensino Fundamental
Ensino Fundamental
Superior
Ensino Fundamental
Superior
Ensino Fundamental
Ensino Fundamental
Ensino Mdio
Fonte: Empresa X
*Salrio mnimo
Notas de Aula
Estatstica
Pgina 70
matemticos suos.
A descoberta teve logo grande sucesso e grandes estudiosos da poca foram ligados curva
normal, tais como Laplace que em 1783 a utilizou para descrever a distribuio de erros, e Gauss que em
1809 a empregou para analisar dados astronmicos.
Assim, como Gauss foi a primeira pessoa a reafirmar o papel fundamental proposta por Moivre a
curva da normal chamada hoje de curva de Gauss.
Antes de explanar com mais detalhes a curva de Gauss, faz-se necessrio analisar a lei dos
grandes nmeros proposta por Bernoulli. Esse teorema diz o seguinte: numa situao de eventos casuais,
onde as alternativas so independentes, obter coroa em lances de uma moeda de cara ou coroa, tem a
Notas de Aula
Estatstica
Pgina 71
probabilidade matemtica exata de 50% (porque somente dois eventos possveis: cara ou coroa), mas na
prtica esta probabilidade de 50% apenas aproximada. E essa aproximao tanto mais exata quanto
maior forem s tentativas que voc fizer de lanar moeda, chegando a quase atingir os exatos 50% se
voc lanar a moeda infinitas vezes. Isto , quanto mais lances voc fizer, menor ser o desvio (erro) em
relao mdia de 50% que o resultado ir produzir. Isso quer dizer que os desvios sero menores na
medida em que sobe o nmero de lances. Desvios grandes so raros e desvios pequenos frequentes,
quanto menores os desvios mais frequentes eles sero, de sorte que, aumentando as tentativas (os lances),
aumenta-se o nmero de desvios pequenos, sobrepujando cada vez mais os desvios grandes, de tal sorte
que, no limite, haver quase somente desvios pequenos, sendo o desvio zero o menor deles e, por
consequncia, o mais frequente.
O matemtico francs Moivre assumiu essa idia de Bernoulli e disse: erros grandes so mais
raros que erros pequenos. Assim, quanto menores os erros, mais frequentes eles sero e quanto maiores,
menos frequentes. Dessa forma, os erros se distribuem equitativamente em torno de um ponto modal, a
mdia, formando uma curva simtrica com pico na mdia e caindo rapidamente para as caudas esquerda
(erros que subestimam a mdia) e direita (erros que superestimam a mdia). Alm disso, essa curva
simtrica permitiu a Moivre calcular uma medida de disperso das observaes em torno da mdia,
medida esta que hoje em dia conhecida como o desvio padro. Moivre, ainda chamou esta curva de
normal, por que a mdia dela representa a norma, isto , as coisas todas deviam ser como a mdia, de
sorte que tudo que se desvia dessa mdia considerado erro, portanto a equivalncia, neste caso, entre
desvio e erro.
Um outro matemtica do sculo XIX, de origem belga, Quetelet, fez uma orgia de medies
sobre eventos do homem, tais como natalidade, mortalidade, alcoolismo, insanidade, medidas
antropomtricas, dentre outros, resultando no Tratado sobre o homem e o desenvolvimento de suas
faculdades (1835), afirmando que tudo no homem e no mundo se distribui segundo a curva normal.
Embora essa afirmao de Quetelet tenha tido reaes contrrias, ela evocou pesquisas sem fim sobre esta
histria da distribuio normal dos eventos, chegando hoje em dia a ser mantida a idia de que,
praticamente, todos os eventos se distribuem assim. Da, a hegemonia da curva normal nas anlises
estatsticas em pesquisas cientficas.
Alis, assumir a distribuio normal em pesquisa est baseado em dois fundamentos:
1 Quando a distribuio da prpria populao for normal, ou
2 Quando a distribuio da populao no for normal, mas se tiver o nmero grande de casos (teorema
de Bernoulli atravs da lei dos grandes nmeros ou o teorema central do limite).
Notas de Aula
Estatstica
Pgina 72
2. DISTRIBUIO NORMAL:
Mas por que esta distribuio tem esse nome? Existe uma explicao plausvel para isto, ser
visto mais adiante.
A distribuio normal uma distribuio de probabilidade usada para variveis aleatrias
contnuas (obtidas por mensurao), com a seguinte notao X ~ N (; ) e sua funo densidade de
probabilidade dada por:
f ( x)
1 x
= Mdia populacional
= Desvio padro populacional
= 3,1416...
e = 2,7182...
Notas de Aula
Estatstica
Pgina 73
O grfico que mostra os indcios de que os dados de uma distribuio aproximadamente normal
o histograma ou o diagrama de ramo e folhas.
A distribuio normal uma das distribuies fundamentais da moderna teoria estatstica. A
vantagem da distribuio normal reside na facilidade de defini-la com apenas dois parmetros, a mdia
e o desvio padro da distribuio, por exemplo, suponha a seguinte a curva da normal f(x) para = 40 e
Frequncia relativa
Substituindo os parmetros
0,0450
= 40 e = 10 na funo densidade
0,0400
0,0350
seguintes valores:
0,0300
x
f(x)
20
0,0007
30
0,0146
40
0,0399
50
0,0146
60
0,0007
Segue o grfico 1 com a plotagem dos
0,0250
0,0200
0,0150
0,0100
0,0050
0,0000
0
10
20
30
40
50
60
Parmetros da varivel aleatria
70
80
seguintes valores.
Estatstica
Pgina 74
Uma das caractersticas importantes da normal que a partir desses parmetros ser possvel
calcular, por exemplo, a porcentagem de valores que devero estar acima ou abaixo de um determinado
valor da v.a., ou entre esses dois valores definidos.
Analisando a frmula de f(x), observe que para cada par de parmetros e , h uma curva
diferente de f(x) ou que, para qualquer outro par de parmetros e , a curva f(x) ser diferente.
c) Os valores de f(x) nunca tocam o eixo x da curva da Normal, mas f(x) 0, se x ;
d) A rea sob a curva 1.
Como se trata de distribuio de probabilidade contnua, a rea que fica entre a curva e o eixo x
representa a probabilidade. A probabilidade de ocorrer um evento entre os pontos a e b calculada
pela integral definida (visto na disciplina de clculo) da funo entre os pontos a e b, representada
por:
b
P ( a, b)
a
1 x
, graficamente:
Observa-se que o clculo direto de probabilidade envolvendo a distribuio normal exige recursos
de clculo avanado e, mesmo assim, dada a forma da funo densidade de probabilidade (f.d.p), no um
processo muito elementar. Por isso ela foi tabelada, permitindo assim obter diretamente o valor da
probabilidade desejada.
Verifica-se que, no entanto a f.d.p da normal depende de dois parmetros, a e , o que acarreta
um grande trabalhado para tabelar as probabilidades, considerando-se as vrias combinaes de e .
Esse problema pode ser resolvido por meio de uma mudana de varivel, obtendo-se, assim, a
distribuio normal padronizada ou reduzida.
Notas de Aula
Estatstica
Pgina 75
1 x
1
Na frmula f ( x )
e 2
2
1 X
, e nele se v que quem comanda as aes so os dados empricos de X e os parmetros de
2
2
sua distribuio ( e ). Agora, tanto os X quanto os parmetros de uma distribuio variam de pesquisa
para pesquisa e, assim, as curvas normais que resultam so diferentes. Portanto, ao invs de trabalhar com
os valores brutos de X, vamos padronizar estes valores e transform-los em valores de Z, ou seja, agora a
distribuio normal ter o seguinte formato:
, com isso f ( Z )
Z2
2
e
2
A vantagem deste curva normal padronizada que em alguns parmetros j esto
automaticamente definidos para qualquer escala de medida que voc utilizar , quais seja, a mdia zero
( = 0) e desvio padro um ( = 1), onde suas probabilidades j foram calculadas e so apresentadas em
uma tabela (ver anexo desta nota de aula) de fcil utilizao. Essa tabela nada mais que uma tabela de
converso do nmero de desvios padro entre x e em um algoritmo.
Em que X uma varivel aleatria normal da mdia e varincia (so constantes), assim:
X ~ N(; ) Z ~ N(0; 1), seu grfico ser:
Notas de Aula
Estatstica
Pgina 76
A curva normal padronizada definida pela simetria e pela curtose, sendo chamada de
mesocrtica.
A curtose da distribuio normal se refere altura do pico da curva, o qual acontece na mdia da
distribuio: se o pico muito elevado, a curva chamada de leptocrtica, se o pico achatado a curva
chamada de platicrtica, se for mediano, a curva chamada de mesocrtica, sendo esta ltima, a
caracterstica da normal padronizada, como mostra a figura abaixo:
Trabalhar com a curva normal padronizada facilita muito a vida da gente, pois com ela a mdia
sempre ser zero e o desvio padro ser um. Quando no for padronizada, ento teremos que calcular o
valor da mdia e o valor do desvio padro da distribuio e trabalhar com os dois parmetros.
Notas de Aula
Estatstica
Pgina 77
Notas de Aula
Estatstica
Pgina 78
Cerca de 99,74% dos valores esto a menos ou a mais de 3 desvios padro a contar da mdia. Nesse
ltimo caso, a anlise de quase toda a populao possuir determinada caracterstica.
Com isso, se os dados so aproximadamente normais, as porcentagens sero aproximadamente
iguais a 68%, 95% e 100%, respectivamente.
Ver figura da regra emprica.
Portanto, quase nunca preciso prolongar muito as caudas de uma distribuio normal, porque a
rea sob a curva de mais ou menos 4 ou 5 desvios-padro a contar da mdia desprezvel para quase
todos os fins prticos.
Notas de Aula
Estatstica
Pgina 79
Exemplo 2: O saldo dirio de caixa de uma determinada empresa de grande porte de Fortaleza nos
ltimos 400 dias tem distribuio normal com mdia R$ 80.000 e desvio padro R$ 40.000. Suponha que
o gerente financeiro desta empresa deseja tomar uma deciso de investimento com seu banco e precisa
com urgncia saber qual a probabilidade do saldo do caixa de hoje s 18 horas fechar:
a) Entre R$ 30.000 e R$ 120.000, pois de acordo o Diretor Geral da empresa se o caixa de hoje fechar
com valores dentro desse intervalo, o gerente financeiro pode arriscar a fazer o investimento, mas isso s
pode ser realizado se a probabilidade for alta (de acordo o Diretor Geral acima de 70%). Portanto
verifique para o gerente financeiro se ele pode ou no fazer o investimento.
b) Suponha que o gerente queira saber qual a probabilidade do caixa fechar com valor acima de 100 mil
reais. Confiando nessa possibilidade, voc o aconselha fazer o investimento financeiro maior pensando
nesse valor em reais?
c) Existe a possibilidade do saldo dirio de caixa ser negativo hoje? Se sim, qual a probabilidade disso
acontecer?
Notas de Aula
Estatstica
Pgina 80
Notas de Aula
Estatstica
Pgina 81
60 pacientes atendidos em sua clnica neurolgica: sexo, peso, tipo de tratamento, nmero de convulses
e classificao da doena (leve, moderada e severa). Os dados esto organizados no seguinte banco de
dados:
Paciente
Sexo
Peso
1
2
3
...
58
59
60
M
F
M
...
M
M
F
89,79
64,20
91,00
...
71,00
78,80
71,00
Tipo de
Tratamento
A
A
B
...
B
A
B
N. de
convulses
1
3
2
...
0
2
3
Classificao da
doena
Leve
Severa
Moderada
...
Severa
Leve
Moderada
De acordo com o banco de dados acima classifique o tipo de varivel para as variveis seguintes:
a) Sexo:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua
b) Peso:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua
c) Tipo de Tratamento:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua
d) Nmero de Convulses:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua
e) Classificao da doena:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua
Notas de Aula
Estatstica
Pgina 82
2) O Governo Federal est exigindo uma quantidade maior de informao antes de aceitar um candidato e
decidir sobre a concesso de uma bolsa para uma faculdade privada de Fortaleza. Assim, classifique cada
uma das informaes dos futuros alunos instituio na ficha de inscrio do vestibular:
a) Quantidade de prmios escolares obtidos:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua
d) Idade do candidato:
( ) Qualitativa Nominal ( ) Qualitativa Ordinal ( ) Quantitativa Discreta ( ) Quantitativa Contnua
3) Suponha que foram retirados de vrios questionrios de pesquisas as seguintes perguntas. Classifique
assim o tipo de varivel de cada uma delas:
Pergunta 1: Qual o seu Estado civil?
( ) Solteiro ( ) Casado ( ) Separado ( ) Desquitado ( ) Outro. Qual?___________________
Pergunta 2: Qual a marca de carros que mais passa na cancela do estacionamento deste shopping center?
( ) Marcar A ( ) Marca B ( ) Marca C ( ) Marca D ( ) Outra. Qual?_____________________
Pergunta 3: Qual a sua faixa de Renda familiar mensal (OBS: Identificar a classe social de acordo com a
legenda abaixo)?
) At R$ 724,00
social:
) De R$ 724,01 a R$ 2.172,00
At R$ 724,00 Classe E
) De R$ 2.172,01 a R$ 3.620,00
) De R$ 3.620,01 a R$ 10.860,00
) Mais de R$ 10.860,00
Notas de Aula
Estatstica
Pgina 83
PLANEJAMENTO AMOSTRAL:
4) Identifique o tipo de tcnica de amostragem probabilstica para cada um dos casos abaixo:
a) Suponha que uma pesquisa de opinio pblica ser realizada no Estado do Cear, que constitudo por
184 municpios. Os elementos na populao de interesse so homens e mulheres do Estado com idade
acima de 21 anos. Que tipo de amostragem voc sugeriria sob o ponto de vista econmico-financeiro?
( ) Amostra Aleatria Simples
( ) Amostra Aleatria Estratificada
( ) Amostra Sistemtica
( ) Amostra por Conglomerado
b) Um mdico est interessado em obter informao sobre o nmero mdio de vezes em que 15.000
clnicos gerais, no ano passado, prescreveram certa droga para combater uma gripe. Deseja-se obter uma
amostra 1.600 clnicos gerais. Que tipo de amostragem voc sugeriria e por qu?
( ) Amostra Aleatria Simples ou Amostra Aleatria Estratificada
( ) Amostra Aleatria Simples ou Amostra Sistemtica
( ) Amostra Aleatria Simples ou Amostra por Conglomerado
( ) Nenhuma das Anteriores
c) Suponha que nesta sala de aula existam 50 alunos e deseja-se saber qual o peso (em kg) deles. A
sugesto analisar 30% da populao com escolha atravs da lista de presena do professor. Que tipo de
tcnica de amostragem representa esta situao?
( ) Amostra Aleatria Simples ou Amostra Aleatria Estratificada
( ) Amostra Aleatria Simples ou Amostra Sistemtica
( ) Amostra Aleatria Simples ou Amostra por Conglomerado
( ) Amostra por Conglomerado
Notas de Aula
Estatstica
Pgina 84
Notas de Aula
Estatstica
Pgina 85
7) Baseado nos dados abaixo, que representa a temperatura (em graus celcius) de 11 cidades europeias na
noite do reveillon de 2014:
Lisboa
Paris Mnaco
2C
3C
-5C
Assim, determine e interprete:
Cannes
6C
8) Para dados de observaes das variveis aleatrias y1, y2 e y3 provenientes de uma amostra foram
obtidos os grficos de caixa (box plot) apresentados na figura que se segue:
Segundo estes grficos, possvel afirmar que as
distribuies das variveis aleatrias y1, y2 e y3 so
(aproximadamente), respectivamente:
(A) Assimtrica positiva, simtrica e assimtrica
positiva.
(B) Simtrica, assimtrica positiva e assimtrica
negativa.
(C) Simtrica, assimtrica negativa e assimtrica
positiva.
(D) Assimtrica negativa, assimtrica positiva e
simtrica.
(E) Assimtrica positiva, assimtrica negativa e
simtrica.
Gabarito: B
Estatstica
Pgina 86
10) Em um exame final de Matemtica, o grau mdio de um grupo de 150 alunos foi 7,8 e o desvio
padro, 0,8. Em Bioestatstica, entretanto, o grau mdio final foi 7,3 e o desvio padro, 0,76. Em que
disciplina foi maior a disperso relativa? Por qu?
OBS: Disperso absoluta (= desvio padro), Disperso relativa (= CV).
Gabarito: Bioestatstica
Notas de Aula
Estatstica
Pgina 87
30
25
25
com propaganda (R$ milhes) versus Vendas (R$ milhes), da indstria farmacutica Xis, 2006 a 2008.
20
15
10
5
0
0
10
12
14
20
15
10
y = 1,3125 + 1,9583x
R2 = 0,9083
5
0
0
10
12
14
E atravs do mtodo dos mnimos quadrados (ou mtodo de regresso linear), pergunta-se:
a) De acordo o grfico 1, voc considera que os dados seguem uma linearidade?
( ) No. Por qu?_____________________________________________________________________
___________________________________________________________________________________
( ) Sim. Se sim, qual tipo?
( ) Positiva. Por qu?____________________________________________________________
( ) Negativa. Por qu?__________________________________________________________
b) Atravs do grfico 2, encontre o valor do Coeficiente de Correlao (Rxy)?
c) Atravs da equao de previso (y = a + bx) encontrada, faa uma previso estatstica de quanto
empresa farmacutica teria de vendas (R$ milhes), se investisse 7,5 milhes em propaganda.
d) Se a empresa diz que quer no prximo trimestre um faturamento de vendas no valor de 30 milhes de
reais, quanto ela ter que investir em propaganda?
e) Os 9,17% no grfico 2 so explicados por qual varivel?
Notas de Aula
Estatstica
Pgina 88
De acordo com a mesma varivel dependente vendas (R$ milhes), a empresa tambm obteve a
temperatura mdia (C) da regio sul do Brasil, onde se encontram os maiores consumidores dos seus
medicamentos, como segue o grfico 3:
Grfico 3: Vendas (R$ milhes) da indstria
farmacutica Xia versus a Temperatura mdia do
trimestre na regio sul do Brasil, 2006 a 2008, Brasil.
30
25
com
R2 = 0,7666
20
propaganda
(R$
milhes)
ou
15
Soluo:
10
b) 0,953;
c) Aproximadamente 16 milhes;
5
0
10
15
20
d) 14,65 milhes
Temperatura (C)
13) A indstria de automveis FIAT do Brasil, fez um grfico de disperso com uso do Microsoft Excel
que representa os pesos (em toneladas) e as taxas de consumo de combustvel por quilmetro rodado
(km/litro) para uma amostra de 250 automveis de passeio em rodovias federais do Estado do Cear no
ms de Outubro de 2014. O Estudo tem por objetivo fazer uma previso de consumo de combustvel por
quilmetro rodado com relao ao peso do automvel, para com isso verificar se os prximos automveis
a serem confeccionados devem ter o mesmo peso ou no e usar essa informao na sua campanha
publicitria no lanamento de novos modelos em Julho de 2015.
Grfico 1: Peso (toneladas) e taxas de consumos de
combustveis (Km/litro) de automveis de passeio em
rodovias.
Consumo (Km/litro)
13
12
y = 18,945 - 6,4013x
11
R2 = 0,8588
10
9
8
6
5
1
1,2
1,4
1,6
Peso (toneladas)
1,8
automveis
(toneladas)
aumenta
Notas de Aula
Estatstica
Pgina 89
13.2. Pelos dados apresentados no grfico de disperso 1, o Coeficiente de Correlao de Pearson (Rxy)
de quanto?
(a) -92,27%
(b) -92,47%
(c) -92,67%
(d) -92,77%
(e) Os dados no me permite obter tal medida
13.3. Atravs da reta de regresso (y = 18,945 6,4013x) encontrada, a previso do consumo (km/litro) de
automveis que tem 2 toneladas, ser de:
(a) 6,14 km/litro
(b) 6,54 km/litro
(c) 7,14 km/litro
(d) 7,54 km/litro
(e) Os dados no me permite obter tal previso de consumo (km/litro)
Notas de Aula
Estatstica
Pgina 90
Frequncia
10
8
6
4
2
0
2|---4
4|---6
6|---8
8|---10
10|---12
12|---14
14|---16
Idade
Portanto:
a) Qual a idade mdia dos pacientes?
b) Qual a idade modal dos pacientes?
c) Qual a idade mediana dos pacientes?
d) Pelas medidas descritivas calculadas, os dados so simtricos ou assimtricos?
e) De acordo a curtose do histograma acima, a curva considerada mesocrtica, platicrtica ou
leptocrtica?
f) Quantos pacientes tm idade entre 8 e 10 anos?
g) Quantos pacientes tm idade abaixo de 8 anos?
h) Quantos pacientes tm acima de 10 anos de idade?
Notas de Aula
Estatstica
Pgina 91
15) Para as 3 distribuies abaixo foram calculadas a produo (em kg) de determinado produto
qumico. O resultado foi o seguinte:
Distribuio A
Classes (kg) fi
2|--- 6
6
6|--- 10
12
10|--- 14
24
14|--- 18
12
18|--- 22
6
Mdia = 12kg
Moda = 12kg
Mediana = 12kg
Desvio Padro = 4,42kg
Distribuio B
Distribuio C
Classes (kg) fi
2|--- 6
6
6|--- 10
12
10|--- 14
24
14|--- 18
30
18|--- 22
6
Mdia = 12,9kg
Moda = 16kg
Mediana = 13,5kg
Desvio Padro = 4,2kg
Classes (kg) fi
2|--- 6
6
6|--- 10
30
10|--- 14
24
14|--- 18
12
18|--- 22
6
Mdia = 11,1kg
Moda = 8kg
Mediana = 10,5kg
Desvio Padro = 4,2kg
Assim, construa o histograma para cada uma das distribuies e verifique se so simtricas ou
assimtricas (positivas ou direita; ou negativas ou esquerda) atravs do coeficiente de assimetria de
Pearson. Para esta alternativa utilize a seguinte notao: CA
3x Moda
S
Notas de Aula
Estatstica
Pgina 92
PROBABILIDADE:
1) Os 240 cartes de um conjunto so numerados consecutivamente, de 1 a 240. Retirando-se ao acaso
um carto desse conjunto, a probabilidade de se obter um carto numerado com um mltiplo de 13 ?
Gabarito: 0,075
2) Quatro estudantes que chegaram atrasados no dia da prova deram a clssica desculpa do pneu furado.
Na prova de segunda chamada, o professor pediu que os estudantes identifiquem o pneu furado. Se no
houver realmente nenhum pneu furado e os estudantes responderem na base do chute, qual a
probabilidade de todos eles escolherem o mesmo pneu de um carro popular?
Gabarito: 1/64
3) Escolhe-se ao acaso dois nmeros naturais (*) distintos de 1 a 100. Qual a probabilidade de que o
produto dos nmeros escolhidos seja mpar?
Gabarito: 0,2475
4) Dentre os nmeros formados por trs algarismos, qual a probabilidade de encontrarmos um nmero
maior que 930?
Gabarito: 0,0767
5) A e B jogaram 120 partidas de xadrez e A ganhou 60 vezes, B ganhou 40 vezes e em 20 vezes ficaram
empatados. Se A e B concordam em jogar 3 partidas. Qual a probabilidade de:
a) A ganhar todas as trs
b) Duas partidas terminarem empatadas
c) A e B ganharem alternadamente
Gabarito: a) 0,125; b) 0,069; c) 0,134
Notas de Aula
Estatstica
Pgina 93
7) A seguinte tabela mostra a distribuio dos tipos de sangue na populao para uma amostra de 1000
pessoas:
Fator/Tipo
A
B AB O Total
RH positivo 340 90 40 380 850
150
RH negativo 60 20 10 60
400 110 50 440 1.000
Total
c) Sabendo-se que a pessoa tem fator (RH negativo) qual a probabilidade de que ela tenha o sangue tipo
B?
d) Sabendo-se que a pessoa tenha o sangue tipo A, qual a probabilidade de que ela tenha o fator RH
positivo?
e) Calcule a probabilidade de P(A B):
Gabarito: a) 0,05; b) 0,38; c) 0,133; d) 0,85; e) 0
8) Numa urna h 6 bolas azuis numeradas de 1 a 6 e cinco bolas verdes numeradas de 1 a 5. Extraindo ao
acaso uma bola, qual a probabilidade de sair uma bola azul ou com nmero mpar?
Gabarito: 0,818
9) Sejam A e B eventos tais que P(A) = 0,2, P(B) = p, P(AB) = 0,6. Calcular p considerando A e B:
a) mutuamente exclusivos
b) Independentes
Gabarito: a) 0,4; b) 0,5
10) Em dois lanamentos sucessivos de uma moeda, sabe-se que pelo menos numa das vezes deu cara.
Qual a probabilidade de ter dado cara ambas vezes?
Gabarito: 0,3333
11) De uma classe onde h 15 rapazes e 35 moas sero escolhidos dois alunos ao acaso. Qual a
probabilidade de:
a) seres escolhidos duas moas?
b) serem escolhidos um rapaz e uma moa, em qualquer ordem?
Gabarito: a) 0,4857; b) 0,4285
b) ( ) 0,0001;
Notas de Aula
c) ( ) -0,2;
Estatstica
d) ( ) 3/2;
e) ( ) 2/3; f) ( )
2 ; g) ( )
0,2
Pgina 94
13) Fazendo os lanamentos sucessivos de um dado durante um jogo. Se cair a face 6, o jogo
automaticamente parado. Qual a probabilidade que na terceira tentativa o jogo seja finalizado?
Gabarito: 0,116
15) Em uma locadora de carro, de cada 100 veculos 30 so de 4 portas e 20 tm motor a gasolina. Se de
cada 100 veculos, 5 so a gasolina e tm 4 portas, qual a probabilidade de carros na locadora que no so
a gasolina e nem tem 4 portas?
Gabarito: 0,55
16) Alguns atletas participam de um triathon (prova formada por 3 etapas consecutivas: natao, corrida e
ciclismo). A probabilidade de que um atleta escolhido ao acaso termine a primeira etapa (natao) 4/7.
Para continuar na competio com a segunda etapa (corrida) o atleta precisa ter terminado a natao. Dos
atletas que terminam a primeira etapa, a probabilidade de que um deles, escolhidos ao acaso, termine a
segunda . Qual a probabilidade de que um atleta que iniciou a prova, e seja escolhido ao acaso,
termine a primeira e a segunda etapa?
Gabarito: 3/7
17) Na Copa do Mundo de 2014, no primeiro jogo de abertura o Brasil jogou contra a Crocia. No
primeiro tempo, a seleo brasileira cometeu 10 faltas, sendo que 3 foram cometidas por Neymar e outras
3 por Fred. No intervalo, os melhores lances foram reprisados, dentre os quais uma falta cometida pelo
Brasil, escolhida ao acaso. Qual a probabilidade de que a falta escolhida seja de Neymar ou de Fred?
Gabarito: 0,6
Notas de Aula
Estatstica
Pgina 95
DISTRIBUIO NORMAL:
18) Uma fbrica de carros sabe que os motores de sua fabricao tm durao normal com mdia de
150.000 Km e desvio padro de 5.000 Km. Qual a probabilidade de que um carro, escolhido ao acaso, dos
fabricados por essa firma, tenha um motor que dure:
a) Menos de 170.000 Km:
b) Entre 140.000 Km e 165.000 Km?
Gabarito: a) 0,999; b) 0,9759
19) Suponha que o tempo necessrio para que os usurios de uma biblioteca de uma empresa pblica de
Fortaleza leva para encontrar uma determinada informao que deseja utilizando um novo sistema
computacional segue uma distribuio normal com mdia de 8 minutos e desvio padro de 2 minutos.
Assim, calcule:
a) A probabilidade de um usurio qualquer levar mais de 8 minutos para encontrar a informao desejada.
b) Existe a possibilidade de um usurio levar menos de 1 minuto para encontrar a informao desejada?
Se sim, qual essa probabilidade?
Gabarito: a) 0,5; b) 0,0001; b)
Notas de Aula
Estatstica
Pgina 96