Академический Документы
Профессиональный Документы
Культура Документы
SUMRIO
1. GENERALIDADES ....................................................................................................................................................3 1.1. INTRODUO ..........................................................................................................................................................3 1.2. DIVISO DA ESTATSTICA ........................................................................................................................................3 1.3. MENSURAO.........................................................................................................................................................4 1.3.1. Introduo .....................................................................................................................................................4 1.3.2. Formas de mensurao ..................................................................................................................................5 2. RESUMO DE PEQUENOS CONJUNTOS DE DADOS ...........................................................................................7 2.1. INTRODUO ..........................................................................................................................................................7 2.2. MEDIDAS DE POSIO OU TENDNCIA CENTRAL ........................................................................................................7 2.2.1. As mdias.......................................................................................................................................................7 2.2.2. A mediana......................................................................................................................................................9 2.2.3. A moda ..........................................................................................................................................................9 2.3. MEDIDAS DE VARIABILIDADE OU DISPERSO ........................................................................................................... 10 2.3.1. A amplitude.................................................................................................................................................. 10 2.3.2. O desvio mdio (absoluto)............................................................................................................................ 10 2.3.3. A varincia .................................................................................................................................................. 10 2.3.4. O desvio padro........................................................................................................................................... 11 2.3.5. A varincia relativa ..................................................................................................................................... 11 2.3.6. O coeficiente de variao ............................................................................................................................ 12 3. DISTRIBUIES DE FREQNCIAS .................................................................................................................. 13 3.1. INTRODUO ........................................................................................................................................................ 13 3.2. DISTRIBUIES POR PONTO OU VALORES. ............................................................................................................... 13 3.3. DISTRIBUIES POR CLASSES OU INTERVALOS......................................................................................................... 13 3.4. ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIAS.............................................................................................. 14 3.4.1. A freqncia relativa ou percentual ............................................................................................................. 14 3.4.2. A freqncia acumulada simples ou absoluta. .............................................................................................. 15 3.4.3. A freqncia acumulada relativa ou percentual ........................................................................................... 15 3.4.4. Outros elementos ......................................................................................................................................... 15 3.5. APRESENTAO DE UMA DISTRIBUIO DE FREQNCIAS ........................................................................................ 16 3.5.1. Distribuio de freqncias por pontos ou valores....................................................................................... 16 3.5.2. Distribuio de freqncias por classes ou intervalos .................................................................................. 16 3.6. RESUMO DE UMA DISTRIBUIO DE FREQNCIAS ................................................................................................... 17 3.6.1. Medidas de posio ou tendncia central..................................................................................................... 17 3.6.2. Medidas de variabilidade ou disperso ........................................................................................................ 20 3.6.3. Medidas de assimetria.................................................................................................................................. 22 3.7. PROPRIEDADES DAS MEDIDAS ................................................................................................................................ 22 3.7.1. Medidas de posio...................................................................................................................................... 22 3.7.2. Medidas de disperso................................................................................................................................... 22 4. EXERCCIOS ........................................................................................................................................................... 24 5. RESPOSTAS DOS EXERCCIOS ........................................................................................................................... 29 6. REFERNCIAS ........................................................................................................................................................ 31
viali@mat.ufrgs.br
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
1. GENERALIDADES
1.1. INTRODUO
Por onde quer que se olhe ou escute uma coleo de nmeros so normalmente enunciados como estatsticas. Estes nmeros referem-se aos mais diversos campos de atividades: esportes, economia, finanas, etc. Assim tem-se por exemplo: O nmero de carros vendidos no pas aumentou em 30%. A taxa de desemprego atinge, hoje, 7,5%. As aes da Telebrs subiram R$ 1,5, hoje. Resultados do Carnaval no trnsito: 145 mortos, 2430 feridos. Um nmero denominado uma estatstica (singular). No fechamento da bolsa as aes da Vale foram cotadas a R$ 45.50. As vendas de uma empresa no ms constituem uma estatstica. J uma coleo de nmeros ou fatos denominado de estatsticas (plural). Por exemplo, As vendas da empresa Picunhas totalizaram: 2,5 milhes em janeiro, 2,7 em fevereiro e 3.1 em maro. No entanto o termo Estatstica tem um sentido muito mais amplo, do que apenas nmeros ou coleo de nmeros. A Estatstica pode ser definida como: A cincia de coletar, organizar, apresentar, analisar e interpretar dados numricos com o objetivo de tomar melhores decises. Assim como advogados possuem regras de evidncia e contabilistas possuem prticas comumente aceitas, pessoas que tratam com dados numricos seguem alguns procedimentos padres. Alguns destes mtodos sero vistos no que se denomina de estatstica descritiva.
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
2. O conjunto de todas as notas dos alunos de Estatstica; 3. O conjunto das alturas de todos os alunos da Universidade; etc. Um levantamento efetuado sobre toda uma populao dito de levantamento censitrio ou simplesmente censo. Fazer levantamentos, estudos, pesquisas, sobre toda uma populao (censo) , em geral, muito difcil. Isto se deve vrios fatores. O principal o custo. Um censo custa muito caro e demanda um tempo considervel para ser realizado. Assim, normalmente, se trabalha com partes da populao denominadas de amostras. Uma amostra pode ser caracterizada como: Uma poro ou parte de uma populao de interesse. Utilizar amostras para se ter conhecimento sobre populaes realizado intensamente na Agricultura, Poltica, Negcios, Marketing, Governo, etc., como se pode ver plos seguintes exemplos: Antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto selecionado de eleitores para ter uma idia do desempenho dos vrios candidatos nas futuras eleies. Uma empresa metal-mecnica toma uma amostra do produto fabricado em intervalos de tempo especificados para verificar se o processo est sob controle e evitar a fabricao de itens defeituosos. O IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc. Redes de rdio e tv se utilizam constantemente dos ndices de popularidade dos programas para fixar valores da propaganda ou ento modificar ou eliminar programas com audincia insatisfatria. Bilogos marcam pssaros, peixes, etc. para tentar prever e estudar seus hbitos. O processo de escolha de uma amostra da populao denominado de amostragem. Riscos da amostragem. O processo de amostragem envolve riscos, pois toma-se decises sobre toda a populao com base em apenas uma parte dela. A teoria da probabilidade pode ser utilizada para fornecer uma idia do risco envolvido, ou seja, do erro que se comete ao utilizar uma amostra ao invs de toda a populao, desde que, claro, a amostra seja selecionada atravs de critrios probabilsticos, isto , ao acaso. Baseado nos conceitos anteriores pode-se definir Estatstica Indutiva ou Inferencial como: A coleo de mtodos e tcnicas utilizados para se estudar uma populao baseados em amostras probabilsticas desta mesma populao.
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
procedimentos de categorizao normalmente utilizados em Cincias Sociais, ento o problema torna-se mais complexo. Pode-se distinguir entre diversos nveis de mensurao e para cada um existem diferentes modelos estatsticos apropriados.
1.3.2. F OR M A S
D E M E N SU R A O
Existem quatro formas de mensurao ou tipos ou nveis de medidas ou ainda escalas que so conhecidas como: nominal, ordinal, intervalar e razo. Nvel nominal. A operao bsica e mais simples em qualquer cincia a de classificao. Na classificao tenta-se separar conjuntos de elementos com respeito a certas categorias, tomando decises sobre quais elementos so mais parecidos e quais so diferentes. O objetivo colocar os elementos em categorias to homogneas quanto possvel quando comparados com as diferenas existentes entre as categorias. Os termos nvel nominal de medida ou escala nominal so utilizadas para se referir a queles dados que s podem ser classificados em categorias. Se bem que no sentido estrito no existe na realidade uma medida ou escala envolvida. Existe apenas uma contagem. Variveis que podem ser colocadas nesta categoria so, por exemplo, a classificao das pessoas quanto religio, sexo, estado civil, etc. No existe uma ordem particular entre as categorias ou grupos e alm disso duas categorias quaisquer so mutuamente excludentes, isto , uma pessoa no pode ser ao mesmo tempo catlico e protestante. Alm disso as categorias so exaustivas, significando que um membro da populao deve aparecer em uma e somente uma das categorias. Observe a tabela um abaixo. Tabela 1.1 - Exemplo de varivel nominal Estado civil Casado Solteiro Vivo Divorciado Total Nmero de pessoas 340 250 40 50 700
Deve-se ser salientado que as classes ou categorias podem ser rotuladas com nmeros, mas isto no significa as operaes aritmticas com estes nmeros tenham algum significado em particular. Neste caso os nmeros exercem a mesma funo dos nomes, isto , identificar a categoria. Nvel ordinal. O nvel ordinal o tipo nominal em que se pode ordenar as categorias. A nica diferena entre os dois nveis a relao de ordem que se pode estabelecer entre as categorias. No entanto, no possvel afirmar o quanto uma categoria maior do que a anterior, isto , no se pode afirmar o quanto uma categoria possui da caracterstica. A avaliao atravs de conceitos feita por uma escala ordinal. Veja um exemplo na tabela dois abaixo. Tabela 1.2 - Exemplo de varivel em escala ordinal Conceitos A B C D E Total Nmero de alunos 4 6 15 3 2 30
viali@mat.ufrgs.br h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
No se pode afirmar neste caso que quem tirou A teve um nmero de acertos duas vezes maior que quem tirou C. A nica coisa que se sabe que quem tem A acertou mais questes do quem tem B e este de quem tem C e assim por diante. As famlias podem ser classificadas de acordo com seu estatus scio econmico em: alta, mdia alta, mdia, mdia baixa, baixa. No possvel entretanto afirmar que a diferena entre a alta e a mdia alta seja a mesma que entre a mdia e a mdia baixa. Nvel intervalar. No sentido estrito da palavra o termo mensurao pode ser utilizado para se referir a situaes em que se pode, no somente ordenar objetos com respeito ao grau de que eles possuem certa caracterstica, mas tambm indicar a exata distncia entre eles. Isto possvel atravs de uma escala denominada de "escala de intervalos". A escala de medida intervalar uma escala nominal em que a distncia entre as categorias, ao contrrio da ordinal, sempre a mesma. Ou seja, ela possui todas as caractersticas da escala ordinal mais o fator de que a distncia entre as diversas categorias (ou valores) sempre constante. As escalas de medir temperaturas como a Fahrenheit e a Celsius so exemplos de escalas de intervalo. No entanto, no se pode afirmar que uma temperatura de 40 graus duas vezes mais quente que uma de 20 graus, embora se possa dizer que a diferena entre 20 graus e 40 graus a mesma que entre 75 graus e 95 graus. Isto porque este tipo de escala no possui um zero absoluto. Ou seja o valor zero na escala apenas um ponto de referncia e no significa a ausncia de calor. Escores padronizados so tambm exemplos deste tipo de nvel de medida. Torna-se evidente que uma escala de intervalo requer o estabelecimento de algum tipo de unidade fsica a qual todos concordem, isto , um padro, e, que seja replicvel, isto , possa ser aplicada muitas vezes e fornecendo sempre os mesmos resultados. Comprimento medido em termos de cm ou metros, tempo em segundos, temperatura em centgrados ou Fahrenheit, renda em dlar ou reais. Por outro lado no existem tais unidades para inteligncia, autoritarismo ou prestgio que sejam unnimes entre todos os cientistas sociais e que possam ser assumidas constantes de uma situao para outra. Nvel de razo. Este o mais alto nvel de medida. caracterizado por apresentar todas as caractersticas da escala intervalar mais um zero absoluto. Aqui o zero pode ser entendido como a ausncia da caracterstica e as comparaes de valor (razo) tm sentido. Um exemplo de varivel deste tipo o peso. Um valor igual a zero significa ausncia de peso e um valor de 20 kg duas vezes mais pesado que um de 10 kg.
viali@mat.ufrgs.br
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
2.2.1. A S
MDIAS
mg =
x1 x2 .... xn =
xi
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /
viali@mat.ufrgs.br
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
mh =
1 1 x1 + 1 x2 n + .... + 1 xn
n 1 x1 + 1 x2 + ... + 1 xn
n 1 xi
Observando a expresso do clculo da mdia harmnica pode-se verificar que ela definida como sendo: O inverso da mdia aritmtica dos inversos. Exemplo: Calcular as mdias dos seguintes conjuntos de dados: 9 (b) 4 6 (c) 1/2 (a) 1 Para o conjunto em (a) tem-se:
4/5
3/2
7/4
x = (4 + 6) / 2 = 5 mg =
Para o conjunto em (c) tem-se:
4.6 = 24
= 4, 90
x > mg > mh
(d) A mdia quadrtica
A mdia geomtrica dos valores positivos: x1, x2, ..., xn, representada por mq e calculada por:
2 2 2 2 x x i 1 + x 2 + ... + x n mq = =
viali@mat.ufrgs.br
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
mgp =
wi
w1 w 2 .... w k x1 x2 xk
mhp = w i wi xi
Exemplo: A mdia da primeira prova de Estatstica da turma 135 foi de 6,0 e foi realizada por 55 alunos. Na segunda prova compareceram 50 alunos que tiveram uma mdia de 6,5. A terceira prova realizada por 40 alunos teve mdia de 5,5. Qual a mdia aritmtica geral das 3 provas?
2.2.2. A
MEDIANA
A mediana de um conjunto ordenado de valores, anotada por me, definida como sendo o valor que separa o conjunto em dois subconjuntos do mesmo tamanho. Assim se n (nmero de elementos) mpar a mediana o valor central do conjunto. Caso contrrio a mediana a mdia dos valores centrais do conjunto. Tem-se:
me = x(n+1)/2 se n mpar e
Exemplo: Para o conjunto: 15 18 21 A mediana :
32
45
46
49
me = x(7+1)/2 = x4 = 32,
Ou seja, a mediana o quarto valor na seqncia ordenada de elementos. Se o conjunto acima fosse: 15 18 21 32 45 46 Ento a mediana seria:
me = [x(n/2) + x(n/2)+1] / 2 = [x(6/2) + x(6/2)+1] / 2 = (x3 + x4) / 2 = (21 + 32) / 2 = 53/2 = 26,50
2.2.3. A
M OD A
A moda de um conjunto de valores, anotada por mo, definida como sendo o valor (ou os valores) do conjunto que mais se repete. Convm lembrar que a moda ao contrrio da mediana e da mdia pode no ser nica, isto , um conjunto pode ser bimodal, trimodal, etc. ou mesmo amodal (sem moda). Se a moda existir ser representada por mo.
Prof. Lor Viali, Dr.
viali@mat.ufrgs.br
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
15
mo = 4,
Pois este valor se repete 3 vezes no conjunto e qualquer outro se repete duas ou menos vezes.
A mais simples das medidas de disperso a amplitude, anotada por h, e definida como sendo a diferena entre os valores extremos do conjunto, isto :
h = xmax - xmin
Exemplo: A amplitude do conjunto: -5 4 0 3 8
10, vale:
2.3.2. O
D E SV I O M D I O ( A B SOL U T O )
A amplitude uma medida simples e fcil de calcular. Tem a virtude de dar uma idia da variabilidade do conjunto. No entanto ela no leva em considerao todos os valores do conjunto como seria desejvel. Assim prefere-se, em geral, trabalhar com medidas que utilizam toda a informao disponvel. Uma destas medidas o desvio mdio absoluto ou simplesmente desvio mdio. O desvio mdio representado por dma e definido como sendo a mdia das distncias que os valores do conjunto se encontram da mdia.
2.3.3. A
VARINCIA
O desvio mdio apesar de intuitivamente fcil de interpretar e simples de calcular no muito utilizado em Estatstica. O que de fato a medida de disperso usual a varincia e principalmente sua raiz quadrada que denominada de desvio padro. A varincia anotada por s2 e definida como sendo
Prof. Lor Viali, Dr.
viali@mat.ufrgs.br
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /
10
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
a mdia dos quadrados dos desvios em relao a mdia aritmtica. Por desvio entende-se a diferena entre um valor do conjunto e a mdia. n Nem sempre esta expresso a mais indicada para ser utilizada. Quando a mdia um valor decimal no exato ela no muito prtica, uma vez que entrar no clculo n vezes aumentando os erros de arredondamento que ocorrem. Neste caso melhor se valer de uma expresso alternativa que pode ser derivada da expresso acima desenvolvendo o quadrado dentro do somatrio e fazendo algumas simplificaes. Trabalhando inicialmente apenas com o numerador da frmula acima vem:
2 2 2 2 (xi x) = ( x 2 i 2 xi x + x ) = x i 2 x xi x
2 ( x ix)
Dividindo este resultado por n e simplificando a segunda parcela vem: n n Esta uma segunda expresso para o clculo da varincia e em muitas situaes mais vantajosa de ser usada. Neste caso a varincia pode ser caracterizada como sendo: a mdia dos quadrados menos o quadrado da mdia.
s =
2
( xi x )
= xi x 2
2.3.4. O
D E SV I O P A D R O
A varincia por ser um quadrado no permite comparaes com a unidade que se est trabalhando. Para se ter uma medida de variabilidade com a mesma unidade do conjunto utiliza-se a raiz quadrada da varincia, que denominada de desvio padro. Assim a expresso para o desvio :
s=
(xi x)
n
= xi x2
n
Exemplo: Calcular a varincia e o desvio padro do conjunto: -7 4 0 3 8 10 A mdia x = (-7 + 4 + 0 + 3 + 8 + 10) / 6 = 18/6 = 3 Ento varincia ser:
2.3.5. A
VARINCIA RELATIVA
A varincia relativa, representada por g2 o quociente entre a varincia absoluta e o quadrado da mdia. Isto :
g2 = s2 / x 2
Prof. Lor Viali, Dr.
viali@mat.ufrgs.br
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /
11
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
2.3.6. O
g2 = (184/6) / 9 = 3,41
E o coeficiente de variao ser: g = s /
x = 5,54 / 3 = 184,59%
viali@mat.ufrgs.br
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /
12
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
3. DISTRIBUIES DE FREQNCIAS
3.1. INTRODUO
Para se trabalhar com grandes conjuntos de dados necessrio inicialmente agrupar estes dados. O agrupamento feito em tabelas, denominadas de distribuies de freqncias. Para se construir uma distribuio de freqncias comum fazer a distino entre dois tipos de variveis. A varivel (ou conjunto) discreta (valores que so resultados de contagem) e a varivel (ou conjunto) contnua (valores que so resultados de uma medida). Em geral variveis discretas so agrupadas em distribuies por ponto ou valores e variveis contnuas em distribuies por classes ou intervalos. A separao no rgida e depende basicamente dos dados considerados. Poder ser necessrio usar uma distribuio por classes ou intervalos mesmo quando a varivel discreta.
Esta coleo de valores no constitui informao mas pode ser transformada em informao mediante sua representao em uma distribuio de freqncias por pontos ou valores. Para tal, colocase o conjunto em uma tabela em que a coluna da esquerda representada pelos diferentes nmeros ordenados (os pontos ou valores) e a coluna da direita pelo nmero de vezes que cada valor se repetiu (as freqncias simples ou absolutas). Para o exemplo, na tabela trs, tem-se: Tabela 03 - Distribuio de freqncias por ponto ou valores do nmero de irmos dos alunos da turma U. Disciplina Estatstica.
Nmero de irmos 0 1 2 3 4 5 6 Total Nmero de alunos 7 21 8 5 4 3 2 50
viali@mat.ufrgs.br
h t t p : / / www. m a t . u f r g s . b r / ~ v i a l i /
13
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10
Este conjunto de valores, obviamente no pode ser apresentado da mesma forma que o anterior, pois quase no h repeties. Neste caso necessrio construir uma tabela denominada de distribuio de freqncias por classes ou intervalos. Evidentemente haver perda de informao neste processo, mas o ganho obtido pela facilidade compreenso dos dados compensa. O procedimento para construir esta distribuio envolve os seguintes passos (algoritmo):