Вы находитесь на странице: 1из 123

UniverCidade 1 Estatstica Aplicada - Prof.

Clio Cayres ___________________________________________________________________________________

ESTATSTICA APLICADA
- Apresentao Geral do Caderno de Estudo
A palavra ESTATSTICA provm do latim status, que significa estado. A

primitiva utilizao da estatstica envolvia compilaes de dados e grficos que descreviam vrios aspectos de um estado ou pas. As famlias, os governos e as empresas se apiam largamente em dados estatsticos para tomarem decises. A simples observao de um conjunto de dados no permite que sejam tomadas decises ou, quando muito possibilitaro decises eivadas de princpios empricos. Vivemos uma era em que a cincia deve prevalecer sobre o empirismo, em que a lgica deve prevalecer sobre o achismo. A estatstica abrange muito mais do que o simples traado de grficos e o clculo de mdias. Neste caderno ser visto como tirar concluses gerais e significativas que vo alm dos dados originais. Os diversos assuntos sero abordados de forma objetiva, visando a aplicao direta dos conceitos. Os nicos conhecimentos matemticos necessrios para a compreenso do texto a aritmtica e elementos de lgebra bsica. Quando houver a necessidade de algum conceito um pouco mais avanado, o mesmo ser abordado de forma sinttica e objetiva. Nos casos em que forem necessrios clculos mais complexos ser utilizado o Microsoft Excel, poderosa ferramenta que reduz muito o tempo necessrio para a determinao de valores. Familiarize-se com esta ferramenta. Havendo necessidade, utilize o Ajuda.

UniverCidade 2 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

1. Variveis e Grficos
1.1 Estatstica

O termo ESTATSTICA provm da palavra Estado e foi utilizado originalmente para denominar levantamentos de dados, cuja finalidade era orientar o Estado em suas decises. Neste sentido foi utilizado em pocas remotas para determinar o valor dos impostos cobrados dos cidados, para determinar a estratgia de uma nova batalha em guerras que se caracterizavam por uma sucesso de batalhas era fundamental aos comandantes saber de quantos homens, armas, cavalos, etc. dispunham aps a ltima batalha. Atualmente, a ESTATSTICA definida da seguinte forma: Estatstica um conjunto de mtodos e processos quantitativos que serve para estudar e medir os fenmenos coletivos.

A estatstica teve acelerado desenvolvimento a partir do sculo XVII, com os estudos de BERNOULLI, FERMAT, PASCAL, LAPLACE, GAUSS, GALTON, PEARSON, FISHER, POISSON e outros que estabeleceram suas caractersticas atuais (da SILVA, et al.; 1996,11). Uma outra definio para ESTATSTICA (VIEIRA; 1999,6): Estatstica a cincia dos dados. Envolve a coleta, a classificao, o resumo, a organizao, a anlise e a interpretao da informao numrica. A Estatstica tem importante papel no pensamento crtico, seja no trabalho, na pesquisa, ou no dia-a-dia. Ento o tempo que voc usar estudando essa matria ser um investimento para seu futuro. verdade que algumas pessoas pensam que as estatsticas mentem. Ou, como j disse algum, os nmeros dizem qualquer coisa quando bem torturados. Mas qualquer cincia produz resultado contrrio ao desejado, quando mal aplicada. Ento as estatsticas mentem apenas quando esto erradas ou, no mnimo, esto sendo mal interpretadas.

UniverCidade 3 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ A Estatstica trata dados. Todo dado se refere a uma varivel. Ento a Estatstica trabalha com variveis. A Estatstica no trata constantes. As variveis assumem diferentes valores, nas diferentes unidades. Exemplo: A coordenao de um colgio pretende levantar dados sobre os alunos do 3 ano do ensino mdio, candidatos ao vestibular. O que voc acha que a coordenao pode anotar, porque varivel e o que voc acha que no deve anotar, porque constante? Soluo: A coordenao pode levantar dados sobre a renda familiar, sobre as carreiras pretendidas, que so variveis, mas no deve levantar dados sobre a alfabetizao porque, entre candidatos ao vestibular, a resposta seria uma constante, j que todos possuem, no mnimo o ensino mdio! Os dados so freqentemente selecionados de um conjunto maior, cujas caractersticas preciso estimar. Exerccios: 1 Um colgio pretender realizar uma festa de fim de ano. A maior queixa dos responsveis com relao aos preos cobrados nas barraquinha pelos alimentos disponibilizados. Que dados devero ser melhor aos responsveis? 2 H a necessidade de iniciar um ciclo de palestras para tratar de assuntos como uso de drogas e sexualidade infantil. O profissional contratado para proferir as palestras deseja preparar um material adequado ao perfil cultural dos responsveis. Que levantamento seria necessrio para distribuir melhor os responsveis por turma e maximizar o resultado das palestras? coletados visando atender

UniverCidade 4 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

1.2

Populao e amostra

Conforme ficou claro na definio, a Estatstica tem por objetivo o estudo dos fenmenos coletivos e das relaes que existem entre eles. Entende-se como fenmeno coletivo aquele que se refere populao, ou universo, que compreende um grande nmero de elementos, sejam pessoas ou coisas.

Populao o conjunto de elementos sobre o qual desejamos obter informao. Populao o conjunto de todos os itens (pessoas, coisas) que interessam ao estudo de um fenmeno coletivo segundo alguma caracterstica.

Note que a populao definida em funo da informao que interessa ao pesquisador. Se voc quiser informaes sobre estudantes com faixa etria entre 7 e 14 anos de um municpio do interior do estado, esta ser a sua populao, mesmo que voc s disponha dos alunos de uma nica escola pala coletar os dados. Precisamos, tambm da definio de amostra: Amostra qualquer subconjunto no vazio de uma populao, ou, todo subconjunto de elementos retirados da populao para obter a informao desejada.

Uma caracterstica numrica estabelecida para toda uma populao denominada parmetro. Uma caracterstica numrica estabelecida para uma amostra denominada estimador. Utilizando o exemplo citado acima, a populao seria a totalidade dos alunos com idades entre 7 e 14 anos do municpio pesquisado. Utilizando a populao poder-se-ia concluir como parmetro que, por exemplo, 60 % dos alunos so do sexo feminino. Podemos indicar como uma amostra somente os alunos do turno da manh da mesma escola. Utilizando somente a amostra, poder-se-ia estimar que, por exemplo, 57 % dos alunos so do sexo feminino.

UniverCidade 5 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Populao todos os elementos do conjunto que interessa.

Parmetro

Amostra subconjunto no vazio de uma populao

Estimador

Quando os dados so obtidos de toda uma populao, diz-se que foi feito um recenseamento. Quando so obtidos dados de apenas parte da populao, dizse que foi feita uma amostragem. O conjunto de dados obtidos de toda a populao denominado censo. Censo uma avaliao direta de um parmetro, utilizando-se todos os componentes da populao. Estimao uma avaliao indireta de um parmetro, com base em um estimador atravs do clculo de probabilidades. As principais propriedades do censo so: admite erro processual zero e tem confiabilidade 100 %; caro; lento; quase sempre desatualizado; nem sempre vivel.

As principais propriedades da estimao so: admite erro processual positivo e tem confiabilidade menor que 100 %; barata; rpida; atualizada; sempre vivel.

UniverCidade 6 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ No Brasil, os censos so feitos pela Fundao Instituto Brasileiro de Geografia e Estatstica (Fundao IBGE), que obtm dados de toda a populao. O censo demogrfico realizado a cada dez anos e os seus resultados so corrigidos periodicamente atravs da PNAD Pesquisa Nacional por Amostra Domiciliar.

Comentrio Importante: Estatisticamente, a preciso de um valor numrico avaliada atravs do binmio: confiana e erro processual. Se admitirmos que podemos retirar do Censo todo tipo de erro de natureza humana (erro de clculo de avaliao, de anotao), restar apenas outro tipo de erro devido ao procedimento empregado. Este erro chamado erro processual. No caso de um Censo, o erro processual zero, pois avaliamos um por um, todos os elementos componentes da Populao. Como o erro processual na avaliao zero, a confiabilidade no parmetro obtido 100 %. A preciso, no Censo total. Na estimao, como avaliamos apenas parte e no todos os elementos que compem a populao, admitimos um erro processual positivo na avaliao do valor numrico e por conseqncia uma confiabilidade menor que 100 %, sendo, portanto, menos precisa que o Censo. (da SILVA; 1996,13) A populao pode ser, segundo o seu tamanho, finita ou infinita. finita a populao que possui um nmero determinado de elementos; aa populao infinita possui um nmero infinito de indivduos. Esta definio existe somente no campo terico, uma vez que, na prtica, nunca encontraremos populaes com infinitos elementos mas, sim, populaes com grande nmero de componentes e, nestes casos, tais populaes so tratadas como se fossem infinitas. Quando a populao muito grande, torna-se difcil a observao dos aspectos a serem estudados de cada um dos elementos, devido ao alto custo, ao intenso trabalho e ao tempo despendido para levar a cabo uma exaustiva observao de todos os componentes da populao. Nessas circunstncias, fazemos a seleo de uma amostra suficientemente representativa da populao e, atravs da observao dessa amostra, estaremos aptos a analisar os resultados, da mesma

UniverCidade 7 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ forma que se estudssemos toda a populao, s que nesse caso sem os inconvenientes anteriormente descritos. A definio do tamanho da amostra vai depender do universo que estiver sendo pesquisado. Em alguns casos, coma nas pesquisas eleitorais, utiliza-se uma pequena frao da populao e verifica-se resultados bem positivos. A definio do tamanho da amostra objeto de estudo mais aprofundado.

Exerccios: 1 Uma pesquisa foi realizada entre os alunos de um colgio. Considerando os indicadores apresentados, identifique se o resultado foi baseado em uma amostra ou em uma populao: a) b) c) todos os alunos foram abordados e indicaram a necessidade de instalao de ventiladores nas salas de aula; 75 % das meninas responderam os questionrios e solicitaram aulas de bal; para obter informaes sobre os inspetores responsveis pelos alunos do ensino mdio foram consultadas somente as turmas da manh, sendo que existem turmas tarde; d) todos os alunos responderam que 80 % dos professores so muito rigorosos nos critrios de avaliao. 2 Para os casos acima, identifique se as caractersticas numricas obtidas so parmetros ou estimativas. 3 Em que situaes ser necessria a realizao de um censo? Justifique.

1.3

Estatstica Indutiva e Descritiva

O tratamento estatstico de um conjunto de dados pode envolver dois processos diferentes, isto , a descrio dos dados e o estabelecimento de concluses sobre a populao a partir dos dados obtidos por amostragem. Normalmente, no trabalho estatstico o pesquisador se v obrigado a lidar com grande nmero de valores numricos resultantes de um Censo ou de uma estimao. Estes valores numricos so chamados de dados estatsticos.

UniverCidade 8 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ A Estatstica ensina mtodos racionais para a obteno de informaes a respeito de um fenmeno coletivo, alm de obter concluses vlidas para o fenmeno e tambm permitir tomada de decises, atravs de dados estatsticos observados. A Estatstica pode ser dividida em duas reas: a) Estatstica Descritiva, e b) Estatstica Indutiva.

Estatstica Descritiva ou Dedutiva aquela que tem por objetivo descrever e analisar determinada populao, sem pretender tirar concluses de carter mais genrico. Estatstica Descritiva utiliza mtodos numricos e grficos para mostrar os padres de comportamento dos dados, para resumir a informao contida nesses dados e apresentar a informao de forma conveniente. Necessitamos, tambm, conceituar Estatstica Indutiva:

Estatstica Indutiva ou Inferncia Estatstica a parte da Estatstica que, baseando-se em resultados obtidos da anlise de uma amostra da populao, procura inferir, induzir ou estimar as leis de comportamento da populao da qual a amostra foi retirada. Estatstica Indutiva a parte da Estatstica que tem por objetivo obter e generalizar concluses para a populao a partir de uma amostra, atravs do clculo de probabilidade.

Quando realizado um Censo Demogrfico, obtm-se informaes sobre a totalidade da populao em um determinado perodo. Por exemplo, verifica-se qual a proporo entre homens e mulheres. Pode-se, atravs destes dados, verificarse qual foi a evoluo do crescimento de homens e mulheres em relao a um perodo anterior, pela simples comparao entre os dados. Neste caso utilizados conceitos de Estatstica Descritiva. Entretanto, se forem coletadas amostras em populaes das capitais, por exemplo, e a partir dos dados obtidos forem verificadas as propores entre so

UniverCidade 9 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ homens e mulheres, poder-se-, atravs de Estatstica Indutiva, generalizar a relao entre os sexos para a populao como um todo. A Estatstica Descritiva, na sua funo de descrio dos dados, tem as seguintes atribuies: a) obteno dos dados estatsticos. normalmente feita atravs de um questionrio ou de observao direta de uma populao ou amostra. b) a organizao dos dados. observados, falhas humanas, omisses, abandono de dados duvidosos, etc. c) a reduo dos dados. O entendimento e compreenso de grande quantidade de dados atravs da simples leitura de seus valores individuais tarefa extremamente rdua e difcil mesmo para o mais experimentado pesquisador. A Estatstica Descritiva apresenta duas formas bsicas para a reduo do nmero de dados com os quais devemos trabalhar, chamadas varivel discreta e varivel contnua, que sero objeto de definies mais adiante. d) A representao dos dados. Os dados estatsticos podem ser mais facilmente compreendidos quando apresentados atravs de uma representao grfica, o que permite uma visualizao instantnea de todos os dados Os grficos que sero objeto de estudo mais adiante, quando bem representativos, tornam-se importantes instrumentos de trabalho. So, ainda, atributos da Estatstica Descritiva, visando facilitar a descrio dos fenmenos observados: obteno de mdias, propores, disperses, tendncias, ndices, taxas e coeficientes.

Consiste na ordenao e crtica quanto correo dos va

Exerccios: 1 Quais so as principais atribuies da Estatstica Descritiva?

UniverCidade 10 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 2 Dados amostrais foram coletados e em funo deles um pesquisador concluir fatos para abranger toda a populao. Em que ramo da Estatstica este pesquisador est atuando?

UniverCidade 11 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

1.4

Variveis

Qualitativas.

Variveis

Quantitativas:contnuas e discretas
Quando se realiza um levantamento, de um modo geral, para cada elemento investigado, tem-se associado um resultado ( ou mias de um resultado) correspondendo realizao de uma certa varivel (ou variveis). Vamos, para exemplificar, supor que voc deseje efetuar um levantamento sobre alguns aspectos scio-econmicos das famlias dos alunos matriculados no colgio em que trabalha. Para cada famlia investigada tem-se associado um resultado (ou mais de um resultado) correspondendo realizao de uma certa varivel (ou variveis). No exemplo em questo, sero consideradas as seguintes variveis: estado civil do responsvel, educao do responsvel, nmero de filhos, salrio familiar, idade do responsvel e estado de procedncia. Algumas variveis como sexo, educao, estado civil, etc. apresentam como possveis realizaes uma qualidade (ou atributo) do indivduo pesquisado, ao passo que outras como nmero de filhos, salrio, estatura, etc. apresentam como possveis realizaes nmeros resultantes de uma contagem ou mensurao. As variveis que possibilitam como realizaes qualidade ou atributos so denominadas de variveis qualitativas.

Tabela 1 Informao sobre dados scio-econmicos das famlias dos alunos do Colgio XXX.

Responsvel Nmero Famlia N 01 02 03 04 05 Estado Civil Casado Solteiro Solteiro Casado solteiro Superior Fundamental Fundamental Mdio superior Educao de Filhos 02 03 02 03 04 Idade 39 a 05 m 40 a 07 m 37 a 03 m 40 a 10 m 38 a 02 m Estado de RJ BA RJ SE MG (anos/meses) Procedncia Salrio Familiar (R$) 1.250,00 2.152,00 1.870,00 1.470,00 1.120,00

Fonte: Dados Hipotticos

UniverCidade 12 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ No caso acima, as variveis estado civil, educao, estado de procedncia, so variveis qualitativas, ao passo que as variveis nmero de filhos, idade e salrio familiar so variveis quantitativas.

As variveis que apresentam como possveis realizaes nmeros resultantes de uma contagem ou mensurao so denominadas variveis quantitativas. Dentre as variveis qualitativas, ainda podemos fazer distino entre dois tipos: a) varivel qualitativa nominal para a qual no existe nenhuma ordenao nas possveis realizaes, como o caso do estado de procedncia; b) varivel qualitativa ordinal para a qual existe uma certa ordem nos possveis resultados, como o caso da educao, pois a classificao em fundamental, mdio ou superior correspondem a uma ordenao baseada no nmero de anos de escolaridade. As variveis quantitativas tambm possuem classificao dicotmica: a) variveis quantitativas discretas aquelas cujos possveis valores formam um conjunto finito ou enumervel de nmeros e que resultam, freqentemente, de uma contagem, como por exemplo o nmero de filhos. Como exemplo, temos o nmero de filhos (0, 1, 2, 3 ...). b) variveis quantitativas contnuas aquelas cujos possveis valores formam um intervalo de nmeros reais e que resultam, normalmente, de uma mensurao, como por exemplo o salrio familiar. Classificao de uma varivel Nominal Qualitativa Ordinal Varivel Discreta Quantitativa Contnua

UniverCidade 13 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Para cada tipo de varivel existem tcnicas mais apropriadas para resumir as informaes.

1.5

Arredondamento de Dados

Uma das questes que mais comumente interfere nos resultados de questes envolvendo nmeros o arredondamento. Qual ser a regra mais adequada? Maior do que cinco arredonda para mais, menor do que cinco arredonda para menos? Vejamos uma regra bem simples: a) b) em primeiro lugar precisamos determinar para quantas casas decimais queremos arredondar o nmero; vamos utilizar a regra do nmero par que precede.

Por exemplo: - o resultado do arredondamento de um nmero como 72,8 para o inteiro mais prximo 73, posto que 72,8 mais prximo de 73 do que de 72. De forma semelhante, 72,8146 arredondado para o centsimo mais prximo, ou com duas decimais, 72,81, porque 72,8146 mais prximo de 72,81 do que de 72,82. - ao arredondarmos 72,465 para o centsimo mais prximo, entretanto, deparamo-nos com um dilema pois 72,465 dista igualmente de 72,46 e de 72,47. Utilizemos, ento, a regra do nmero para que precede o cinco. Assim, 72,465 arredondado para 72,46; 183,575 arredondado para 183,58. A prtica do arredondamento especialmente valiosa para reduzir ao mnimo os erros acumulados por arredondamento, quando trata-se de grande nmero de operaes.

1.6

Notao Cientfica

Ao escrever nmeros, especialmente aqueles que comportem muitos zeros, antes ou depois da vrgula, conveniente empregar a notao cientfica que utiliza as potncias de 10.

UniverCidade 14 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Exemplos: Nmero 10 1.000 100.000 Notao Cientfica 101 103 105 Nmero 0,00021 856.000.000 0,0000001 Notao Cientfica 21 x 10-5 856 x 106 10-8

Note que, por exemplo, multiplicando-se 0 nmero 846 por 106, tem-se o mesmo resultado que os deslocar a vrgula, para a direita, 6 (seis) casas. J multiplicando-se 21 por 10-5, tem-se o mesmo resultado do que deslocando-se a vrgula para a esquerda 5 (cinco) casas. A notao cientfica facilita a operao em muitos casos. Por exemplo: - sem o auxlio de uma mquina de calcular, vamos determinar o resultado de (4.000.000) x (0,0000000002). Em primeiro lugar: 4.000.000 = 4 x 106 (4)x(106)x(2)x(10-10) = (4)x(2)x(106)x(10-10) = 8 x (106-10) = 8 x 10-4 = 0,0008 Na operao acima foi efetuada uma multiplicao com potncias de mesma base, ou seja, nmeros em potncia de 10. Na multiplicao de potncias de mesma base, repete-se a base e soma-se os expoentes, respeitando-se os sinais dos expoentes. No caso de diviso, repete-se a base e subtrai-se os expoentes, respeitando-se os sinais dos expoentes. Talvez seja necessrio que voc efetue uma reviso nos conceitos fundamentais de matemtica, para tanto consulte livros de Matemtica Bsica. e 0,0000000002 = 2 x 10-10 Desta forma, passamos a ter:

Um exemplo utilizando a diviso: - Qual ser o resultado de 20.000 dividido por 0,005?

UniverCidade 15 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 20.000 = 20 x 103 0,005 = 5 x 10-3 (20)x(103) : (5)x(10-3) = (20):(5)x(103:10-3) = 4 x (10
3-(-3)

) = 4 x 106

1.7

Grficos

Um grfico uma representao grfica da relao entre variveis. Muitos tipos de grficos so empregados na estatstica, dependendo da natureza dos dados pertinentes e da finalidade para a qual ele destinado. Um grfico corresponde representao dos dados sob diferentes formas grficas, a fim de permitir uma viso rpida e global do fato estudado. De uma maneira geral, pode-se dizer que os grficos devem ser confeccionados de maneira simples e clara, de tal sorte que o observador entenda claramente aquilo que o grfico busca evidenciar, sem necessidade de ficar procurando adivinhar o que ele representa. extremamente importante que o grfico seja construdo com honestidade buscando retratar a realidade. A maioria dos grficos so construdos no plano cartesiano, ou seja entre eixos coordenados abscissas e ordenadas. A abscissa o eixo horizontal e a ordenada o eixo vertical. Ambos so representativos de escalas de grandeza e o ponto onde se encontram denominado origem. Exemplo:

Ordenada

Abscissa Origem

Para a construo de um grfico necessrio que sejam seguidas algumas regras: 1 todo grfico deve ter ttulo e escala; 2 o ttulo deve ser escrito acima do grfico;

UniverCidade 16 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 3 no eixo das abscissas a escala cresce da esquerda para a direita e escrita embaixo do eixo; 4 no eixo das ordenadas a escala cresce de baixo para cima e escrita esquerda do eixo; 5 nos dois eixos devem estar identificadas as variveis ali representadas; 6 as linhas auxiliares (grade) so opcionais, mas ajudam a leitura; 7 os grficos podem exibir, em rodap, a fonte, isto , a instituio, o pesquisador, ou o grupo de pesquisadores que forneceu o grfico ou os dados que permitiram a construo do grfico. Os principais tipos de grficos so: a) grfico de linhas; b) grfico de colunas; c) grfico de barras e, d) grfico de setores.

Outros tipos de grficos so utilizados. Na estatstica extremamente utilizado o HISTOGRAMA. Adiante ser verificada a tcnica de construo do histograma, aps as definies relativas s distribuies de freqncia. Para que possamos construir os grficos enumerados acima, vamos utilizar um exemplo hipottico. Exemplo: Um levantamento feitos na Secretaria de uma escola, com relao ao nmero de alunos que no adimpliram o pagamento das mensalidades, no vencimento, no primeiro semestre do ano 20XX, possibilitou a elaborao da tabela abaixo:

UniverCidade 17 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX.

Meses Janeiro Fevereiro Maro Abril Maio Junho Fonte: dados hipotticos.

Nmero de alunos 17 12 09 19 13 16

Com base nos dados apresentados vamos construir cada um dos grficos enumerados. a) Grfico de Linhas Para a construo do grfico de linhas, siga os seguintes passos: 1 trace o sistema de eixos cartesianos; 2 apresente a varivel (meses) no eixo das abscissas e as freqncias (nmero de alunos) no eixo das ordenadas; 3 marque as intersees de cada par ordenado (ms x nmero de alunos); 4 para cada interseo faa um ponto bem visvel; 5 uma os pontos, e 5 coloque o ttulo na figura.

UniverCidade 18 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Nmero de alunos que no adimpliram, no vencimento, as mensalidades do primeiro semestre de 20XX


Nmero de Alunos
20 15 10 5 0

Observe que o grfico permite visualizar a evoluo dos dados, permitindo que sejam efetuadas concluses, tais como: a) h um decrscimo da inadimplncia entre janeiro e maro; b) acentua-se a inadimplncia no ms de abril. Vamos, agora, construir, para o mesmo exemplo, um grfico de colunas. b) Grfico de Colunas Para construir um grfico de colunas, siga os seguintes passos: a) trace o sistema de eixos cartesianos; b) apresente a varivel no eixo das abscissas e as freqncias nos eixos das ordenadas; c) para representar a varivel, construa colunas com bases de mesma largura, mas alturas iguais s respectivas freqncias, e d) coloque o ttulo na figura.

Janeiro

Junho

Maio

Maro

Abril

Fevereiro

Meses

UniverCidade 19 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX


Nmero de alunos
20 15 10 5 0 Janeiro Fevereiro Maro Meses Abril Maio Junho

Veja que o Grfico de Colunas permite visualizar, tambm, os mesmos elementos descritos no grfico de linhas. Pode-se, com o auxlio do Microsoft Excel, construir algumas variaes do grfico de colunas, como, por exemplo, o grfico de colunas em trs dimenses (3D). As informaes obtidas so as mesmas, somente a aparncia muda. Grfico de Colunas em 3D

Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX


20 15 10 5 0

Nmero de alunos

Janeiro

Fevereiro

Maro

Abril

Maio

S1

Meses

c) Grfico de Barras A construo do Grfico de barras muito similar construo do grfico de colunas, o que ocorre uma inverso dos eixos, ou seja, no grfico de barras as

Junho

UniverCidade 20 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ variveis so representadas no eixo das ordenadas e as freqncias nos eixos das abscissas. Para construir um grfico de barras, siga os seguintes passos: 1 trace o sistema de eixos cartesianos; 2 apresente a varivel no eixo das ordenadas e as freqncias no eixo das abscissas; 3- para representar a varivel, construa barras com bases de mesma largura, mas comprimentos iguais s respectivas freqncias; 4 coloque o ttulo da figura.

Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX


Junho Maio Meses Abril Maro Fevereiro Janeiro 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

d) Grfico de Setores O grfico de setores, tambm denominado de grfico de pizza , possibilita visualizar a importncia relativa de cada varivel no conjunto. Em outras palavras, permite verificar qual a participao percentual de cada elemento na formao do conjunto avaliado. Para a construo de um grfico de setores inicialmente necessrio que seja determinada a participao relativa de cada varivel e para tal utiliza-se o princpio das propores. Vejamos a tabela inicial:

Nmero de alunos

UniverCidade 21 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX. Meses Janeiro Fevereiro Maro Abril Maio Junho Fonte: dados hipotticos. Vamos efetuar a soma dos nmero de alunos que no adimpliram a mensalidade, em todo o semestre: Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX. Nmero de alunos 17 12 09 19 13 16

Meses Janeiro Fevereiro Maro Abril Maio Junho TOTAL Fonte: dados hipotticos.

Nmero de alunos 17 12 09 19 13 16 86

O total, ou seja 86 alunos, corresponde a 100 % dos eventos. Pode-se determinar atravs da Regra de Trs, a participao de cada ms na formao total. Desta forma estaremos calculando a freqncia relativa de cada ms. Para o ms de Janeiro, teremos: 86 -------- 100 % 17 --------X%

Sabendo-se que o produto dos meios igual ao produto dos extremos, tmse que:

UniverCidade 22 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 86 x X = 17 x 100 % logo, X = (17 x 100%) / 86 X = 19,8 % O valor encontrado indica que 19,8 % das ocorrncias verificados no semestre foram no ms de janeiro. Vamos calcular os valores para os outros meses: Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX. Freqncia Meses Janeiro Fevereiro Maro Abril Maio Junho TOTAL Fonte: dados hipotticos. Para a construo de um grfico de setores, deve-se seguir os seguintes passos: 1 trace uma circunferncia. A rea do crculo representar o total, isto , 100 %; 2 lembre-se de que uma circunferncia tem 360. Ento, se aos 100% correspondem 360, a freqncia relativa de cada ms (no exemplo), corresponder um setor cujo ngulo ser calculado atravs de : Y = (360 x freqncia relativa) / 100 3 marque os valores dos ngulos calculados na circunferncia (com o auxlio de um transferidor) e trace raios separando os setores; 4 faa um tracejado ou utilize cores diferentes para cada setor, para facilitar a visualizao; 5 coloque o ttulo na figura. Nmero de alunos 17 12 09 19 13 16 86 Relativa 19,8 14,0 10,5 22,0 15,1 18,6 100,0

UniverCidade 23 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Vamos calcular os ngulos de cada um dos setores do exemplo: Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX.

Freqncia Meses Janeiro Fevereiro Maro Abril Maio Junho TOTAL Fonte: dados hipotticos. Aps calculados os ngulos, tem-se que: Nmero de alunos 17 12 09 19 13 16 86 Relativa 19,8 14,0 10,5 22,0 15,1 18,6 100,0

ngulo

71,28 50,40 37,80 79,20 54,36 66,96 360,00

Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX

Janeiro Maro Maio

Fevereiro Abril Junho

Na construo do grfico de setores, pode-se utilizar alguns artifcio, visando facilitar a visualizao dos valores. Pode-se indicar no prprio grfico o percentual aproximado de cada setor, ou efetuar-se a exploso dos setores. Veja os exemplos abaixo:

UniverCidade 24 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX


Junho 19% Janeiro 20%

Maio 15%

Fevereiro 14%

Abril 22%

Maro 10%

ou

Nmero de alunos que no adimpliram as mensalidades, no vencimento, no primeiro semestre de 20XX Junho Janeiro
19% 20%

Maio 15%

Fevereiro 14%

Abril 22%

Maro 10%

A utilizao do Microsoft Excel facilitar sobremaneira a construo dos grficos. Procure familiarizar-se com a planilha eletrnica e utilize o tutorial grficos para a construo.

UniverCidade 25 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

2 Distribuies de Freqncia
2.1 Dados brutos
Quando so realizados levantamentos estatsticos normalmente so obtidos um nmero muito grande de dados, o que dificulta a visualizao dos resultados. necessrio que os dados sejam arrumados, postos em ordem, para que se possa tirar as concluses que levaram a obteno dos dados. Quando um conjunto de dados coletado, os dados esto geralmente em forma bruta, isto , as observaes numricas no esto arrumadas em qualquer ordem ou seqncia especfica. Os dados coletados esto originalmente na forma bruta, ou seja, so DADOS BRUTOS, que necessitam ser lapidados para que se possa obter concluses sobre eles.

Conforme o nmero de observaes cresce, vai-se tornando muito difcil focalizar os principais aspectos em um conjunto de dados; assim precisamos de meios para organizar as observaes de modo que possamos compreender melhor que informaes os dados esto comunicando.

Dados

brutos

so

aqueles

que

no

foram

numericamente organizados. Vamos supor, por exemplo, que sejam coletadas as notas de 20 alunos em um trabalho de Histria e que se obtenha os seguintes valores: X: 2; 3; 2; 1; 2; 1; 2; 3; 2; 2; 2; 3; 1; 1; 1; 3; 3; 2; 3; 1. No est importando, para a anlise, a correlao entre que aluno tirou qual nota, ou seja, o que est em observao so as notas. Deve-se, ento, para facilitar a observao, ordenar os dados. Vamos ordena-los em ordem crescente: X: 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3.

UniverCidade 26 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

2.2 Rol
Os dados ordenados so denominados de ROL. A construo de um rol imprescindvel para que se possa efetuar anlises e observaes nos dados coletados. Rol o arranjo dos dados brutos em ordem de grandeza crescente ou decrescente.

a partir do rol que poder-se- verificar qual ser a forma mais eficiente de representar de forma tabular os dados obtidos. Quando os valores distintos forem em nmero reduzido pode-se optar pela representao atravs de uma varivel discreta. Quando o nmero de valores distintos for grande, normalmente a melhor opo ser a construo de uma varivel contnua.

2.3 Distribuio de Freqncia


Representar os dados obtidos em um levantamento atravs de uma distribuio de freqncia o passo inicial para que se possa efetuar as anlises necessrias dos dados. Representar os dados de forma tabular atravs de uma tabela, dispor os dados de maneira ordenada. Vamos necessitar de um conceito:

FREQNCIA SIMPLES de um elemento o nmero de vezes que este elemento figura no conjunto de dados.

Observe que no conjunto apresentado, o nmero de elementos distinto da srie no caso as notas, pequeno (1, 2 e 3). Neste caso, torna-se fcil reduzir o conjunto em uma nica tabela. Como o nmero de elementos distinto pequeno, podemos utilizar uma varivel discreta para a representao da srie de valores. Neste caso, vamos dispor o conjunto em duas colunas: na primeira iremos colocar os valores distintos em ordem crescente e na segunda coluna colocaremos

UniverCidade 27 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ os valores das freqncias simples nmero de vezes que cada valores verificado. Os valores distintos, ou seja as variveis, sero representados pela notao xi, ou seja x ndice i, onde i representa a ordem do valor, a classe. As freqncias sero representadas por fi, ou seja f ndice i, Desta forma, teremos: Notas dos alunos no trabalho de Histria Notas (xi) 1 2 3 Fonte: dados hipotticos. Observe que conseguiu-se reduzir um conjunto de 20 elementos que constituam a srie original, para apenas 6, distribudos em pares que possibilitam uma perfeita visualizao dos elementos observados. A opo pela varivel discreta s possvel quando o nmero de elementos distintos da srie for pequeno. A construo de uma varivel discreta bastante simples. Basta observar quais so os elementos distintos da seqncia, ordena-los, e coloca-los na primeira coluna da tabela. Em seguida computar a freqncia simples de cada elementos distinto e coloc-la na segunda coluna da tabela. Freqncia (fi) 6 8 6

Ocorre, entretanto, que o nmero de elementos distinto muito grande. Nestes casos, a construo de uma varivel discreta no aconselhvel, pois dificultaria a anlise. Nestes casos, deve-se utilizar a varivel contnua. Vamos, por exemplo, identificar as notas atribudas para os alunos de uma turma em uma prova de Lngua Portuguesa:

UniverCidade 28 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Y: 7,2 5,9 9,5 9,5 7,8 6,3 4,9 8,5 5,4 9,3 7,2 4,6 9,8 8,7 1,3 7,4 8,4 4,9 6,4 1,2 7,6 8,6 6,8 8,7 4,8 2,5 5,9 8,1 8,2 9,3 4,6 4,3 6,7 5,9 6,9 8,8 6,8 6,7 8,6 1,8 7,4 5,8

Observando os valores nota-se grande nmero de elementos distintos, o que significa que neste caso a varivel discreta no aconselhvel na reduo de dados. Nesta situao conveniente agrupar os dados por faixas de valores, ficando a srie com a seguinte apresentao: Tabela XXX Notas dos alunos da Turma XX em Lngua Portuguesa Classe 1 2 3 4 5 Notas 0 __ 2 2 __ 4 4 __ 6 6 __ 8 8 __10 Freqncia (fi) 3 1 11 13 14

Fonte: Dados hipotticos Esta apresentao da srie de valores denominada varivel contnua. Deve-se optar por uma varivel contnua na

representao de uma srie de valores quando o nmero de elementos distintos da srie for grande.

A construo de uma varivel contnua requer que sejam abordados alguns conceitos: intervalos e limites de classe, limites de classes e amplitude do intervalo de classe. Inicialmente sero abordados estes conceitos, para depois verificar-se a metodologia para a construo de uma varivel contnua.

UniverCidade 29 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

2.4 Intervalos e Limites de Classe


Uma varivel contnua disposta atravs de classes, isto , os dados so dispostos em grupos distintos, que, entretanto, apresentam caractersticas semelhantes. Um bom exemplo para demonstrar a diviso de um conjunto de dados em classes a diviso de um grupo de crianas para um torneio esportivo. Normalmente as crianas so divididas por grupos de idades: at 7 anos; maiores do que 7 anos at 9 anos; maiores do que 9 anos at 11 anos. O que foi feito foi a diviso em classes. Neste caso, ter-se-ia: Classe 1 Classe 2 Classe 3 At 7 anos > 7 anos at 9 anos > 9 anos at 11 anos

Observa-se que as classes representam grupos de crianas com idades diferentes, mas que os intervalos de idades so iguais, exceto para a primeira classe que inclui todas as crianas com idades inferiores a 7 anos. Existes vrias maneiras de apresentar-se o intervalo de classe: iguais ou diferentes entre si. Porm, sempre que possvel, deve-se optar por intervalos iguais, o que facilitar os clculos posteriores. Mas mesmo com intervalos iguais, as distribuies podero apresentar-se das seguintes formas: (a Classe 2 do exemplo acima servir como modelo) Compreende todas as idades entre 7 e 9, exclusive os extremos. Compreende todas as idades entre 7 e 9, inclusive os extremos. Compreende todas as idades entre 7 e 9, inclusive o 9 e exclusive o 7. 7 __ 9 Compreende todas as idades entre 7 e 9, inclusive o 7 exclusive o 9. Em um intervalo, quando diz-se inclusive, quer se dizer que o nmero pertence ao intervalo considerado, ou seja, o nmero est contido no intervalo. Quando diz-se exclusive, quer se dizer que o nmero no pertence ao intervalo, ou seja, o nmero no est contido no intervalo. e

7 7

__ 9 __ 9

7 ___ 9

UniverCidade 30 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Vamos optar pelo ltimo tipo (7

__

9), e desta forma podemos definir

como intervalo de classe a diferena entre o limite superior e o limite inferior da classe. Portanto, no exemplo, 9 7 = 2 o intervalo ou amplitude do intervalo de classe. Ser utilizado L para representar o limite superior de uma classe, e l para representar o limite inferior de uma classe. As classes possuem LIMITES. Como limite podemos interpretar onde inicia e onde termina uma classe. O LIMITE INFERIOR onde comea uma classe, o ponto de partida; o LIMITE SUPERIOR onde termina a classe.

2.5 Amplitude do Intervalo de Classe


A definio da amplitude do intervalo de classe de suma importncia para a construo de uma varivel contnua.

AMPLITUDE DO INTERVALO DE CLASSE a diferena entre o limite superior e o limite inferior da classe. Para identificar a amplitude do intervalo de classe ser utilizado h. Desta forma, ento, tem-se que:

H=L-l

UniverCidade 31 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Na realidade, as classe no precisam necessariamente ter a mesma amplitude. Porm, sempre que possvel devemos trabalhar com classes de mesma amplitude. Isto facilita sobremaneira os clculos posteriores. Note que foi usado para representar a classe, intervalo real semiaberto direita. Isto significa que o intervalo contm o limite inferior, mas no contm o limite superior. No caso da classe 2, significa dizer que ela contm os valores reais maiores ou iguais a 7 e os valores menores que 9. A adoo dos intervalos semiabertos pode gerar algum empecilho para a definio e interpretao dos valores da ltima classe, em especial para a definio do seu limite superior. A prtica favorecer o melhor entendimento. Necessita-se um conceito adicional: o de amplitude total de uma seqncia.

AMPLITUDE TOTAL DE UMA SEQNCIA a diferena entre o maior e o menor elemento de uma seqncia. Representando a amplitude total por At, o maior elemento da seqncia por Xmx e o menor elemento da seqncia por Xmin, a amplitude total ser denotada por At = Xmx Xmin

importante verificar que, quando no dispusermos dos dados, o clculo da amplitude se far levando-se em considerao a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe.

2.6 Ponto Mdio de uma Classe


O ponto mdio de uma classe (mi), o ponto intermedirio do intervalo de classe. obtido somando-se o limite inferior ao limite superior e dividindo-se por 2.

UniverCidade 32 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Assim, o ponto mdio da Classe 2 do exemplo (7 + 9)/2 = 16/2 = 8.

O ponto mdio de uma classe (mi) a mdia aritmtica entre o limite inferior (L). (l) e o limite superior da classe

Para as finalidades das anlise posteriores, admitir-se- quer todas as observaes relativas a um determinado intervalo de classe coincidem com o seu ponto mdio. Quando possvel analisar os dados bruto ou o rol que deram origem distribuio de freqncia, fcil efetuarse a contagem de cada um dos elementos que formam a distribuio. Entretanto, quando s de dispe quantitativamente cada um da dos distribuio (atravs de varivel contnua), impossvel determinar-se componentes da distribuio. Desta forma a utilizao do ponto mdio de fundamental importncia para a anlise dos dados.

UniverCidade 33 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

2.7 Regras Gerais para Elaborar uma Distribuio de Freqncia varivel contnua.
Utilizando tanto os dados brutos, como uma distribuio ordenada rol, o pesquisador deseja construir as tabelas e grficos apropriados que iro possibilitar as concluses. necessrio que se organize os dados, medida em que o nmero de observaes aumenta, ou seja, faz-se necessrio condensar ainda mais os dados nas tabelas adequadas. Assim, precisa-se organizar os dados em grupos de classes, de acordo com as divises do intervalo de observaes estabelecidas de modo conveniente. Tal organizao dos dados em tabelas chamada de distribuio de freqncia.

Uma distribuio de freqncia uma tabela resumida na qual os dados so organizados em grupos de classe ou categorias convenientemente estabelecidas e numericamente ordenadas. (LEVINE; 2000,60)

Quando as observaes so agrupadas ou condensadas em tabelas de distribuio de freqncia , o processo de anlise e interpretao de dados torna-se mais fcil de manejar e mais significativo. Nesta forma resumida, as principais caractersticas dos dados podem ser aproximadas, compensando desse modo o fato de que, quando os dados esto demasiadamente agrupados, as informaes iniciais pertinentes a observaes individuais, que se encontravam anteriormente disponveis, so perdidas ao longo do processo de agrupamento ou condensao. A construo de uma distribuio de freqncia varivel contnua, deve atentar para os seguintes detalhes: a) seleo do nmero apropriado de grupos de classes; b) a obteno de um intervalo de classe e amplitude apropriados para cada grupo de classe, e c) o estabelecimento de limites para cada grupo de classe a fim de evitar a sobreposio.

UniverCidade 34 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ O nmero de classe a ser utilizado depende muito da experincia do pesquisador e das questes que ele pretende responder com a varivel contnua. Utilizando o exemplo das notas atribudas aos alunos em uma prova de Lngua Portuguesa, verifica-se que o total de observaes de 42 dados. No estaria errado a construo da tabela abaixo: Tabela XXX Notas dos alunos da Turma XX em Lngua Portuguesa Classe 1 Notas 0 __ 10 Freqncia (fi) 42

Fonte: Dados hipotticos Entretanto, atravs de uma tabela to resumida, no se obtm nenhuma informao adicional que j no fosse conhecida a partir do exame dos dados brutos ou da anlise do rol. Uma tabela com uma concentrao muito grande de dados no significativa. necessrio que o nmero de classes seja bem definido para anlises realmente conclusivas. Vamos verificar o critrio para a determinao do nmero de classes de uma distribuio de freqncia pelo denominado critrio da raiz. - Critrio da Raiz Se a seqncia estatstica contm n elementos e se indicarmos por K o nmero de classes a ser utilizado, ento pelo critrio da raiz:

K= n
Como o nmero K de classes deve ser necessariamente um nmero inteiro e como dificilmente o resultado um nmero inteiro, deixa-se como opo para o valor de K o valor inteiro mais prximo do resultado, uma unidade a menos ou a mais que este valor. No exemplo (notas de alunos em uma prova de Lngua Portuguesa), verificase que n (nmero de elementos) igual a 42. O nmero de elementos total de uma

distribuio , conforme ser abordado mais adiante, a freqncia total da distribuio.

UniverCidade 35 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Para a determinao do nmero de classes deve-se proceder o clculo:

K = 42
Tem-se que K = 6,4807406984, portanto o valor inteiro mais prximo do resultado 6. As opes para K ento so: 5, 6 e 7. Necessita-se verificar qual a amplitude total da seqncia, e para tanto, inicialmente, necessita-se verificar qual o valor mnimo e qual o valor mximo, e para tanto aconselhvel que os dados brutos estejam organizados em ordem crescente (rol). Dados Brutos Y: 7,2 5,9 9,5 9,5 7,8 6,3 4,9 8,5 5,4 9,3 7,2 4,6 9,8 8,7 1,3 7,4 8,4 4,9 6,4 1,2 7,6 8,6 6,8 8,7 4,8 2,5 5,9 8,1 8,2 9,3 4,6 4,3 6,7 5,9 6,9 8,8 6,8 6,7 8,6 1,8 7,4 5,8

Dados Organizados em ordem crescente (ROL)

Y:

1,2 1,3 1,8 2,5 4,3 4,6

4,6 4,8 4,9 4,9 5,4 5,8

5,9 5,9 5,9 6,3 6,4 6,7

6,7 6,8 6,8 6,9 7,2 7,2

7,4 7,4 7,6 7,8 8,1 8,2

8,4 8,5 8,6 8,6 8,7 8,7

8,8 9,3 9,3 9,5 9,5 9,8

Desta forma verifica-se que Xmx = 9,8 e que Xmn = 1,2. Logo, como At = Xmx tm-se At = 9,8 1,2 At = 8,6. Xmin,

UniverCidade 36 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

A amplitude do intervalo de classe que designada por h, determinada da seguinte forma:

h=
que h = 1,4.

At K

Utilizando o critrio do par mais prximo para o arredondamento, verifica-se

O critrio adotado para o intervalo de classe deve-se, ento, proceder o ajuste dos valores.

o semi-aberto direita,

Para que todos os valores sejam alocados na distribuio, passaremos a considerar que Xmin = 1 e que Xmx = 10, logo At = 9. Desta forma, considerando K = 6, h = 1,5.

O nmero de classes a ser utilizado depende muito da experincia do pesquisador e das questes que ele pretende responder com a varivel contnua. Quando foram ampliados os valores mnimos e mximos, no foram alteradas as caractersticas da distribuio, pois, conforme ser verificado, em uma varivel contnua o que vai identificar uma classe ser o seu ponto mdio.

Ento, a varivel contnua ter a seguinte forma:

UniverCidade 37 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Notas dos alunos da turma XX na prova de Lngua Portuguesa Classe 1 2 3 4 5 6 1 2,5 4 5,5 7 8,5 Notas __ 2,5 __ 4 Freqncia 3 1 7 11 9 11 42

__ 5,5 __ 7 __ 8,5 __ 10

Total Fonte: dados hipotticos.

A representao tabular final apresenta intervalos e freqncias diferentes da apresentada inicialmente, pois agora foram utilizadas as tcnicas corretas para sua elaborao.

A varivel contnua conceituada como uma representao tabular em que coloca-se na primeira coluna os intervalos de classe e na segunda coluna os valores das freqncias simples correspondentes. A coluna classe tem a finalidade apenas de facilitar a referncia s classes, no fazendo parte da varivel contnua. O quadro final tanto da varivel discreta como da varivel contnua denominado de distribuio de freqncia.

UniverCidade 38 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

2.8 Freqncia : simples, acumulada e relativa.


A distribuio de freqncia deve ser utilizada como elemento que possibilite a anlise dos dados. Verifica-se que os dados devidamente distribudos permite a melhor visualizao de como, no exemplo apresentado, as notas foram distribudas entre os alunos. Pode ser constatado que 11 alunos obtiveram notas iguais ou superiores a 5, 5, porm inferiores 7. a) Freqncia Simples (fi). A freqncia simples resultante da contagem dos dados pertencentes cada classe. A freqncia simples a que aparece na forma original da distribuio de freqncia. b) Freqncia acumulada ( facm) A freqncia acumulada ir representar o nmero de elementos at a classe que est sendo visualizada, ou seja, a soma da freqncia simples desta classe com as freqncias simples das classes anteriores. No exemplo, tem-se que: Notas dos alunos da turma XX na prova de Lngua Portuguesa Classe Notas Freqncia Freqncia Acumulada 1 2 3 4 5 6 1 2,5 4 5,5 7 8,5 __ 2,5 __ 4 3 1 7 11 9 11 42 3 4 11 22 31 42

__ 5,5 __ 7 __ 8,5 __ 10

Total Fonte: dados hipotticos.

UniverCidade 39 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Os valores representados na coluna FREQUNCIA ACUMULADA representam o nmero de eventos que esto contidos nas classes de forma cumulativa. Desta forma, verifica-se que 22 alunos obtiveram notas inferiores a 7, ou seja, a freqncia cumulada da Classe 3. A freqncia acumulada da ltima classe da distribuio deve ser igual freqncia total, pois estaro sendo considerados todos os dados da distribuio. c) Freqncia relativa (frel ou f
%)

A freqncia relativa permitir que sejam verificadas a participao percentual de cada grupo de notas. Qual foi o percentual de alunos com notas iguais ou superiores a 5,5, porm inferiores a 7? Para que se possa responder a esta pergunta, necessrio que lembremos que a totalidades dos dados dispostos corresponde 100 % da distribuio. Logo, no exemplo, o total de alunos 42, corresponde 100 %. A freqncia relativa de cada classe a relao percentual da freqncia simples de cada classe para a formao da freqncia total. Mais uma vez necessita-se da Regra de Trs: f
total

.................... 100 %

f i ......................... f % Ento, para a determinao da freqncia relativa de cada classe, basta que multiplique-se a freqncia simples da classe por 100 e divida-se o resultado pela freqncia total.

f rel

f i x100 = f total

Desta forma, as freqncias relativas da distribuio ficaro assim dispostas:

UniverCidade 40 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Notas dos alunos da turma XX na prova de Lngua Portuguesa Classe Notas Freqncia Freqncia relativa 1 2 3 4 5 6 1 2,5 4 5,5 7 8,5 __ __ 2,5 4 3 1 7 11 9 11 42 7,14 % 2,38 % 16,67 % 26,19 % 21,43 % 26,19 % 100,00 %

__ 5,5 __ 7 __ 8,5 __ 10

Total Fonte: dados hipotticos.

Assim possvel verificar-se que, por exemplo, 26,19 % dos alunos obtiveram notas maiores ou iguais a 5,5 e menores do que 7 (Classe 3). A soma das freqncias relativas deve ser igual a 100 %, j quem estaro sendo consideradas todas as classes da distribuio de freqncia.

d) Freqncia relativa acumulada (frel

acm)

A freqncia relativa acumulada ir representar a participao percentual dos elementos at a classe que est sendo visualizada, tomando por base a freqncia acumulada da classe. Da mesma forma que feito para a determinao da freqncia relativa, toma-se por base que o total da distribuio corresponder 100 %. Desta forma, tem-se que:

UniverCidade 41 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

f f
acm

total

.................... 100 %
rel acm

......................... f

Ento, para a determinao da freqncia relativa acumulada de cada classe, basta que multiplique-se a freqncia simples da classe por 100 e divida-se o resultado pela freqncia total.

f relacm =
No exemplo, tem-se que:

f acm x100 f total

Notas dos alunos da turma XX na prova de Lngua Portuguesa Freqncia Classe Notas Freqncia Acumulada Freqncia Relativa acumulada 1 2 3 4 5 6 1 2,5 4 5,5 7 8,5 __ 2,5 __ 4 3 1 7 11 9 11 42 3 4 11 22 31 42 7,14 % 9,52 % 26,19 % 52,38 % 73,81 % 100,00 %

__ 5,5 __ 7 __ 8,5 __ 10

Total Fonte: dados hipotticos.

Observe que a freqncia relativa acumulada da ltima classe deve ser igual 100 %, por estar considerando a distribuio como um todo. Assim, a distribuio de freqncia, considerando os elementos que foram determinados at agora, ficar disposta da seguinte forma:

UniverCidade 42 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Notas dos alunos da turma XX na prova de Lngua Portuguesa Freqncia Freqncia Freqncia Classe Notas Freqncia Acumulada relativa Relativa acumulada 1 2 3 4 5 6 1 2,5 4 5,5 7 8,5 __ 2,5 __ 4 3 1 7 11 9 11 42 3 4 11 22 31 42 7,14 % 2,38 % 16,67 % 26,19 % 21,43 % 26,19 % 100,00 % 7,14 % 9,52 % 26,19 % 52,38 % 73,81 % 100,00 %

__ 5,5 __ 7 __ 8,5 __ 10

Total Fonte: dados hipotticos.

aconselhvel

ao

se dispor os dados sob a

forma de uma distribuio de freqncia, que sejam determinadas as freqncias acumulada, relativa e relativa acumulada, pois desta forma ter-se- um volume de informaes muito teis para o pesquisador.

UniverCidade 43 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

3 .

Medidas

de

Tendncia

Central

Separatrizes
Nos captulos anteriores foi visto com apresentar dados numricos tanto em forma de tabelas quanto na forma de grficos. Agora, como pode-se fazer essas informaes terem sentido? A apresentao grfica dos dados um componente essencial da Estatstica Descritiva, porm no retrata toda a sua abrangncia. A boa anlise dos dados no envolve somente apresentar os dados numricos e observar o que os dados esto tentando transmitir, mas tambm envolve calcular e resumir as funes-chave e analisar os resultados encontrados. (LEVINE; 2000,118) Em qualquer anlise e/ou interpretao, vrias medidas descritivas representado as propriedades de tendncia central, variao e formato podem ser utilizadas para extrair e resumir as principais caractersticas do conjunto de dados. Se essas medidas descritivas forem calculadas atravs de uma amostra de dados, elas sero chamadas de estatsticas; caso sejam calculadas atravs de toda uma populao de dados, elas sero chamadas de parmetros. (LEVINE; 2000,119) As trs principais propriedades que descrevem um conjunto de dados numricos so: a) Tendncia central A maioria dos dados apresenta uma diferente tendncia de se agrupar ou concentrar em torno de um ponto central. Assim sendo, para um conjunto de dados, em particular, geralmente se torna possvel selecionar um valor tpico ou mdia para descrever todo o conjunto. Tal valor tpico uma medida de localizao ou tendncia central. b) Variao Uma segunda propriedade importante que descreve um conjunto de dados numricos a variao. Variao a quantidade de disperso nos dados. Dois conjuntos de dados podem divergir tanto na medida central como na variao, da mesma forma que dois conjuntos de dados podem ter as mesmas medidas de tendncia central, porm divergir bastante em termos de variao.

UniverCidade 44 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ c) Formato O formato da populao obtido atravs de uma comparao relativa entre algumas medidas de tendncia central. Para facilitar o entendimento de diversas frmulas que sero apresentadas, faz-se necessrio que sejam apresentados alguns conceitos, dentre os quais: ndice, notao por ndice e notao em somatrio.

3.1 ndices ou notao por ndices.


Suponha uma srie com os seguintes elementos: Y = { 2, 3, 4, 6, 7, 9 } H, na disposio dos dados, uma correlao entre o elemento e a posio que ele ocupa da srie. O nmero 2 ocupa a primeira posio na srie; o nmero 6 ocupa a quarta posio na srie. Pode-se, ento, convencionar que uma srie pode ser identificada por simbologias que representem o elemento e a posio que ele ocupa. Supondo que o conjunto de dados Y seja representativo das notas de um aluno. Ento, o conjunto Y formado por variveis notas, que podem ser representadas pela letra X. Cada nota ocupa uma posio no conjunto, e cada posio passar a ser representada pelo ndice i. Desta forma, o conjunto Y pode ser identificado pela seguinte notao: Y = { X1, X2, X3, X4, X5, X6 } Onde X a varivel (nota) e 1, 2, etc, a posio de cada nota no conjunto. Pode-se dizer que o conjunto Y formado por um conjunto de variveis X i (leia-se X ndice i ). A notao em ndice muito til pois possibilita a identificao imediata do elemento que est em foco, sem a necessidade de grandes textos. A constncia do uso possibilitar uma familiarizao com a simbologia.

UniverCidade 45 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

3.2 Notao em somatrio.


Muitas vezes necessrio escrever expresses que envolvem somas com muitos termos, ou cujos termos obedecem uma certa formao, como por exemplo, os dados numricos disposto na forma de um rol. Tomando como exemplo o conjunto de notas dos alunos, em uma prova de Lngua Portuguesa: Y: 1,2 1,3 1,8 2,5 4,3 4,6 4,6 4,8 4,9 4,9 5,4 5,8 5,9 5,9 5,9 6,3 6,4 6,7 6,7 6,8 6,8 6,9 7,2 7,2 7,4 7,4 7,6 7,8 8,1 8,2 8,4 8,5 8,6 8,6 8,7 8,7 8,8 9,3 9,3 9,5 9,5 9,8

Verifica-se que so 42 notas, dispostas em ordem crescente. Para identificar a soma, seria necessrio a seguinte indicao: Soma = 1,2 + 1,3 + 1,8 + 2,5 + .... + 9,5 + 9,8 Ora, o que verifica-se que as variveis (notas) esto dispostas em ordem: a primeira nota 2 1,2, a segunda nota 1,3, a terceira nota 1,8, e assim sucessivamente. Se for simbolizado por X a varivel nota e por i o ndice que indica a posio da varivel na srie, pode-se passar a indicar a soma da srie da seguinte forma:

Soma = x1 + x 2 + x3 + ... + x 42
ou seja, estariam sendo indicadas as variveis e seu posicionamento na srie. Supondo uma srie onde no se saiba o nmero de variveis, convencionase que o ltimo elemento da srie ser o ensimo termo, ou seja, o termo de ordem n. Desta forma, a soma de uma srie onde no se conhea o nmero de termo poder ser indicada da seguinte forma:

UniverCidade 46 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Soma = x1 + x2 + x3 + ... + xn
Matematicamente a expresso indicada acima pode ser reduzida, utilizandose a notao em somatrio e para tanto ser utilizada a letra grega sigma corresponde, no nosso alfabeto letra S (de soma). Desta forma, a expresso acima poder ser indicada da seguinte forma:

que

x1 + x2 + x3 + ... + xn = xi
i =1
necessrio que se identifique cada parte da notao em somatrio: X o nome dos termos a serem somados

n o ltimo elemento a ser somado

x
i =1

i
uma observao individual da srie, ou seja, a posio do termo na srie
i

a simbologia
que indica soma.

i=1 indica o primeiro elemento da srie que ser somado A forma correta de l-se a expresso acima : Somatrio de xi para i variando de 1 a n ou soma de xi, para i variando de 1 a n. Se houvesse o interesse de indicar somente a soma dos 15 primeiros elementos da srie, a notao em somatrio seria:

x
i =1

15

UniverCidade 47 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ IMPORTANTE: Para que uma soma possa ser representada pela notao em somatrio fundamental que i assuma todos os valores inteiros consecutivos entre dois valores dados (o termo inicial e o termo final da soma).

UniverCidade 48 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

3.3 Mdias e medidas de tendncia central.


Para resumir a quantidade de informao contida em um conjunto de dados, os estatsticos definem medidas que descrevem, atravs de um s elemento, caractersticas dos dados. Algumas medidas descrevem a tendncia central, isto , a tendncia que os dados tm de se agrupar em torno de certos valores. No dia-a-dia utiliza-se com freqncia o sentido de medidas de tendncia central. Por exemplo, pode-se, ao identificar-se um grupo de idosos, referir-se ao grupo como tendo em torno de 65 anos. O que se quer dizer com isso? Por certo que as idades dos membros que formam o grupo esto prximas de 65 anos, para mais ou para menos. Tecnicamente as medidas de tendncia central possuem metodologia prpria para sua determinao. As principais medidas de tendncia central so: a) mdia aritmtica (simples ou ponderada); b) a mediana; c) a moda. Ser verificado tambm o clculo da mdia geomtrica e da mdia harmnica. Inicialmente sero determinadas as formas para a determinao das medidas de tendncia central levando em considerao um conjunto de dados dispostos sob a forma de uma varivel discreta. Posteriormente ser verificada a metodologia para a determinao das medidas quando for utilizado um conjunto de dados dispostos sob a forma de varivel contnua.

3.4 Mdia Aritmtica.


A mdia aritmtica, tambm comumente denominada somente de mdia, a mais comum das medidas de tendncia central. A facilidade de sua obteno popularizou o seu uso.

UniverCidade 49 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ A mdia aritmtica pode ser calculada atravs de duas metodologias: a) a mdia aritmtica simples ; b) a mdia aritmtica ponderada. A mdia aritmtica simples calculada somando-se todos os termos de uma srie e dividindo-se o resultado pelo nmero total de itens envolvidos. Supondo que um conjunto de dados, representativo das idades dos alunos da Turma 201, em anos, esteja disposto na seguinte forma: A = { 8, 8, 7, 9, 9, 10, 8, 9, 7, 8, 9, 10, 10, 10, 9, 9, 8, 8, 8, 9, 8 } Para o clculo da mdia aritmtica, procede-se a soma das idades e dividese pelo nmero de observaes (nmero de alunos da Turma, no exemplo). Desta forma:

Mdia =

8 + 8 + 7 + 9 + 9 + 10 + 8 + 9 + 7 + 8 + 9 + 10 + 10 + 10 + 9 + 9 + 8 + 8 + 8 + 9 + 8 21

Logo, a mdia das idades ser de 8,6 anos. Identificando o que foi feito atravs de uma frmula, tem-se que:

Mdia =
dividido pelo nmero total de termos).

x
n =1

(mdia igual a soma dos n termos de uma srie, do primeiro at o ltimo,

Apresentado os dados sob a forma de varivel discreta, tm-se que: Idades, em anos, dos alunos da Turma 201. Idades 7 8 9 10 Nmero de Alunos 2 8 7 4

UniverCidade 50 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Fonte: dados hipotticos. Verifica-se que a varivel (x) a idade dos alunos, e que cada varivel possui uma freqncia (fi). A freqncia total (n) a soma do nmero de alunos. Pode-se calcular a mdia aritmtica diretamente na tabela. Inicialmente, em uma nova linha, efetua-se a soma do nmero de alunos, para que se obtenha a freqncia total (n) Em seguida, em uma nova coluna, coloca-se o resultado da multiplicao de cada idade pela freqncia respectiva. Desta forma, a nova tabela ficar assim disposta: Idades, em anos, dos alunos da Turma 201. Idades (xi) Nmero de Alunos (fi) Idade x Nmero de alunos (xifi) 7 8 9 10 TOTAL 2 8 7 4 21 14 64 63 40 181

O resultado ser a diviso dos dois totais: Mdia = (181) / 21 , logo Mdia = 8,6 anos. A mdia aritmtica de dados disposto em uma distribuio discreta indicada atravs da seguinte frmula:
n

Mdia =

x
i =1

fi

UniverCidade 51 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ (leia-se: mdia igual soma das variveis i, multiplicadas pelas respectivas freqncias i, da primeira at a ltima, dividido pelo nmero de elementos). Alguns autores indicam a seguinte forma: frmula para o clculo da mdia aritmtica da

Mdia =

x f
i =1 n

i i

f
i =i

(leia-se: mdia igual soma das variveis i, multiplicadas pelas respectivas freqncias i, da primeira at a ltima, dividido pela soma das freqncias, da primeira at a ltima).

3.5 - A mdia aritmtica Ponderada.


Algumas vezes, em especial nos colgios, comum que sejam atribudos pesos s notas de determinadas provas. A atribuio de pesos visa fazer com que determinados valores tenham mais influncia no resultado final do que outros. Considere-se o seguinte exemplo: As provas bimestrais de um colgio so ponderadas com pesos 1, 2, 3 e 4, respectivamente para o primeiro bimestre, segundo bimestre, terceiro bimestre e quarto bimestre. Um aluno, em Geografia, obteve as seguintes notas: Notas em Geografia Bimestre 1 2 3 4 Nota 6,0 7,2 5,5 7,8

UniverCidade 52 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Fonte: dados hipotticos. Como calculada a mdia, para a disciplina, do aluno? Procede-se a multiplicao da nota de cada bimestre pelo peso respectivo, soma-se os resultados das multiplicaes e divide-se pela soma dos pesos. Notas em Geografia Bimestre 1 2 3 4 Nota 6,0 7,2 5,5 7,8 TOTAL Fonte: dados hipotticos. A mdia aritmtica ponderada, ento, ser igual a: Mdia = 68,1 / 10 , logo Mdia = 6,81. A notao (indicao atravs de uma frmula) da mdia aritmtica ponderada feita da seguinte forma: Pesos 1 2 3 4 10 Nota x Peso 6,0 14,4 16,5 31,2 68,1

Mdia =

x p
i i =1 n

p
i =1

(leia-se: mdia igual soma do produtos dos i elementos multiplicados pelos respectivos pesos i, do primeiro at o ltimo, dividido pela soma dos pesos, do primeiro at o ltimo).

UniverCidade 53 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 3.6 Clculo da Mdia Aritmtica para dados grupados At ento foi verificada a metodologia para o clculo da mdia aritmtica (simples ou ponderada) considerando-se os dados isolados, ou aqueles que esto dispostos em um varivel discreta. Entretanto muitas vezes o pesquisador necessita efetuar o clculo de mdias e somente dispor dos dados dispostos em varivel contnua. Como proceder? necessrio que para cada classe seja identificado um elemento que a represente. Este elemento denominado de ponto mdio da classe (mi).

O ponto mdio de uma classe (mi) a mdia aritmtica entre o limite inferior (li) e o limite superior (Li) da classe.

Ento, o ponto mdio de uma classe :

li + Li mi = 2
(leia-se: o ponto mdio da classe i igual mdia aritmtica da soma do limite inferior da classe i e o limite superior da classe i). Para exemplificar ser utilizada a varivel contnua construda as notas dos alunos em uma prova de Lngua Portuguesa.

Notas dos alunos da turma XX na prova de Lngua Portuguesa Classe Notas Freqncia Ponto mdio

1 2 3 4

1 2,5 4 5,5

__ 2,5 __ 4

3 1 7 11

1,75 3,25 4,75 6,25

__ 5,5 __ 7

UniverCidade 54 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 5 6 7 8,5 __ 8,5 __ 10 9 11 42 7,75 9,25

Total Fonte: dados hipotticos.

A distncia entre os pontos mdios de classes consecutivas igual amplitude do intervalo de classe.

Ponto Mdio da Classe 3 = 4,75 Ponto Mdio da Classe 4 = 6,25 Distncia = (Ponto Mdio da Classe 4 Ponto Mdio da Classe 3) Distncia = m4 m3 Distncia = 6,25 4,75 , logo Distncia = 1,5 A amplitude das classe tambm igual a 1,5. Para o clculo da mdia aritmtica de dados agrupados, os pontos mdios das classe sero ponderados pelas freqncias simples das respectivas classes. Desta forma, apresentado a mdia aritmtica para dados agrupados atravs de uma frmula, tem-se:

X =

fm
i i =1 n

f
i =1

UniverCidade 55 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ (leia-se: mdia aritmtica igual ao somatrio dos produtos das freqncias das classes i pelos pontos mdios das classes i, dividido pelo somatrio das freqncias das classes i).

A utilizao da simbologia X barra (x com uma barra horizontal sobreposta) comumente utilizada para identificar a mdia aritmtica.

Desta forma, para o clculo da mdia aritmtica das notas, proceder-se- a multiplicao do ponto mdio de cada classe pela freqncia da respectiva classe. Em seguida, ser efetuada a soma dos produtos obtidos e este resultado dividido pela soma das freqncias (freqncia total). Notas dos alunos da turma XX na prova de Lngua Portuguesa Freqncia Classe Notas (fi) 3 1 7 11 9 11 42 Ponto mdio (mi) 1,75 3,25 4,75 6,25 7,75 9,25 4,75 3,25 33,25 68,75 69,75 101,75 281,50 fi mi

1 2 3 4 5 6

1 2,5 4 5,5 7 8,5

__ 2,5 __ 4

__ 5,5 __ 7 __ 8,5 __ 10

Total Fonte: dados hipotticos.

A mdia aritmtica das notas, ento, ser:

X =

281,50 = 6,7 42

UniverCidade 56 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Se voc efetuar a soma do rol das notas, chegar a um total de 279. Dividindo-se o valor por 42 (freqncia total), ou seja, calculando-se a mdia aritmtica simples, obter-se- 6,64. A diferena, ou seja 0,06, inexpressiva, no importando para a anlise dos valores.

Quando os dados so agrupados na disposio de uma varivel contnua, passa-se a trabalhar com os dados sem conhecimento de seus valores individuais. Note no exemplo utilizado, que o mximo que se pode afirmar com respeito ao menor valor desta srie que ele um valor maior ou igual a 1,0 e menor do que 10. Mas no possvel, sem a visualizao do rol, conhecer-se os valores individualizados. Este fato que leva a substituio das classes pelos seus pontos mdios para o clculo da mdia da srie.

UniverCidade 57 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

3.7 A Mediana ( md)


A mediana um valor real que separa o rol em duas partes, deixando em cada parte o mesmo nmero de elementos. A mediana um valor que ocupa a posio central de uma srie. Para o clculo da mediana devem ser consideradas algumas condies: a) se os dados estiverem dispostos sob a forma bruta: Neste caso, os dados devero ser ordenados, gerando um rol. Se o nmero de dados for impar, o rol admitir apenas um termo central. Para o clculo do termo central, deve-se, inicialmente, determinar qual a sua posio. Para tanto, deve-se adicionar uma unidade ao nmero de termos e dividir-se o resultado por dois. Posio = (n + 1) /2 O valor que ocupar a posio definida ser a mediana. Veja o exemplo: Qual ser a mediana das idades de um grupo de alunos? Sejam as idades: Y = { 8, 9, 10, 11, 7, 6, 12 } Inicialmente os dados devem ser ordenados, gerando um rol: Y = { 6, 7, 8, 9, 10, 11, 12 } Verifica-se que o nmero de elementos impar ( n = 7 ). A posio do termo central : Posio = ( n + 1 ) / 2 Posio = ( 7 + 1 ) / 2 Posio = 4

UniverCidade 58 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ A mediana (md), ento, ser aquele termo que ocupar a 4 posio no rol, ou seja, md = 9 anos. O valor 9 deixa sua esquerda e sua direita o mesmo nmero de elementos, sendo, portanto, o elemento central da srie.

Y = { 6, 7, 8, 9, 10, 11, 12 }
Termos esquerda da mediana Termos direita da mediana

Mediana

Se o nmero de termo for par, convenciona-se que a mediana a mdia aritmtica dos valores que ocupam as posies centrais. Acrescentando-se uma idade ao rol utilizando anteriormente: Y = { 6, 7, 8, 9, 10, 11, 12, 13 } Passa-se a ter um rol com 8 elementos ( n = 8). Neste caso, procede-se da seguinte forma: Calcula-se a posio central (n/2), o que no exemplo ser igual a 4. Verifica-se qual a posio seguinte, ou seja (n/2)+1 = 4 + 1 = 5. O termo que ocupa a posio central (mediana) definido com sendo aquele que for igual mdia aritmtica dos elementos que ocuparem as posies anteriormente definidas. Veja no exemplo: Termo que ocupa a 4 posio = 9 Termo que ocupa a 5 posio = 10 Mediana (md) = ( 9 + 10 ) /2

UniverCidade 59 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Mediana (md) = 9,5. Ora, no h na srie apresentada idade igual 9,5. Como interpretar o resultado. Deve-se lembrar que a mediana o termo que divide a srie em duas partes iguais. Desta forma, a interpretao ser de que 50 % (metade) dos valores do rol so valores menores ou iguais a 9,5 e 50 % (metade) dos valores do rol so valores maiores ou iguais a 9,5.

Y = { 6, 7, 8, 9, 10, 11, 12, 13 }


Termos esquerda da mediana so menores ou iguais 9,5 Termos direita da mediana so maiores ou iguais a 9,5

Mediana = 9,5

b) Clculo da mediana para dados apresentados sob a forma de varivel contnua. Conforme j foi explicado anteriormente, muitas vezes ao pesquisador somente so disponibilizados os dados sob a forma de uma varivel contnua, o que impossibilita a adoo da metodologia verificada para o clculo da mediana para os dados dispostos sob a forma de rol (varivel discreta), pois mesmo que seja identificada a posio da mediana na srie, o valor do elemento da srie que ocupa esta posio no identificvel. Como proceder para o clculo da mediana neste caso? Ser utilizado, como exemplo, a distribuio que indica as notas dos alunos em uma prova de Lngua Portuguesa.

UniverCidade 60 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Notas dos alunos da turma XX na prova de Lngua Portuguesa Freqncia Classe 1 2 3 4 5 6 1 2,5 4 5,5 7 8,5 Notas __ 2,5 __ 4 (fi) 3 1 7 11 9 11 42 Ponto mdio (mi) 1,75 3,25 4,75 6,25 7,75 9,25

__ 5,5 __ 7 __ 8,5 __ 10

Total ( ) Fonte: dados hipotticos.

O nmero de elementos da srie 42, ou seja, n = fi = 42. A mediana, por definio, separa o nmero de elementos da srie em dois grupos, cada um deles contendo 50 % dos elementos. Portanto, a posio da mediana na srie (n/2) ou ( fi apresentado (42 / 2) = 21. Sabe-se, ento, que a posio da mediana a 21 posio da srie. necessrio que sejam evidenciadas as freqncias acumuladas das classes para a interpretao da posio. /2 ). No caso

UniverCidade 61 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Notas dos alunos da turma XX na prova de Lngua Portuguesa Freqncia Classe Notas (fi) 3 1 7 11 9 11 42 3 4 11 22 31 42 Freqncia acumulada Ponto mdio (mi) 1,75 3,25 4,75 6,25 7,75 9,25

1 2 3 4 5 6

1 2,5 4 5,5 7 8,5

__ 2,5 __ 4

__ 5,5 __ 7 __ 8,5 __ 10

Total ( )

Utilizando, por exemplo, a freqncia acumulada da 3 Classe, a interpretao que se deve ter a seguinte: - esto contidos na terceira classe os elementos da 5 posio, at o elemento da 11 posio (inclusive). Usando a disposio tabular para indicar a explicao acima: Notas dos alunos da turma XX na prova de Lngua Portuguesa Freqncia Classe 1 2 3 4 5 6 1 2,5 4 5,5 7 8,5 Notas __ 2,5 __ 4 (fi) 3 1 7 11 9 11 42 Do 1 at o 3 Do 4 at o 4 Do 5 at o 11 Do 12 at 0 22 Do 23 at o 31 Do 32 at o 42

__ 5,5 __ 7 __ 8,5 __ 10

Total ( )

UniverCidade 62 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Desta forma, considerando que a posio da mediana a 21, pode-se, inicialmente afirmar que a mediana est contida na 4 Classe ( que contm os elementos que ocupam deste a 12 at a 22 posies). A quarta classe, por conter a mediana, denominada como classe mediana. O intervalo de classe (1,5) possui, ento 11 termos (freqncia da classe mediana). Para o clculo da mediana ser utilizada a seguinte frmula:

md = l md

n Fant +2 xh f md

Onde: md = mediana lmd = limite inferior da classe mediana n = nmero de elementos da srie Fant = freqncia acumulada da classe anterior classe mediana fmd = freqncia simples da classe mediana h = amplitude do intervalo de classe. Na distribuio, verifica-se: lmd = 5,5 n = 42 Fant = 11 (freqncia acumulada da 3 classe) fmd = 11 h = 1,5 Ento:

42 11 md = 5,5 + 2 x1,5 11

UniverCidade 63 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Resolvendo a expresso: a) inicialmente efetua-se a diviso que aparece no numerador:

md = 5,5 +

21 11 x1,5 11

b) efetua-se a adio do numerador:

md = 5,5 +

10 x1,5 11

c) efetua-se a diviso:

md = 5,5 + 0,91x1,5
d) efetua-se a multiplicao

md = 5,5 + 1,37
e) efetua-se a adio.

md = 6,87
A mediana, ou seja, o elemento que dividir a distribuio em duas partes iguais a nota 6,87. Verificando o rol que deu origem varivel contnua, possvel observar que no h uma nota 6,87. O termo em destaque no rol o termo que ocupa a posio mediana, ou seja, o 21 termo da srie, e igual a 6,8. Y:

1,2 1,3 1,8 2,5 4,3 4,6 O que ocorreu?

4,6 4,8 4,9 4,9 5,4 5,8

5,9 5,9 5,9 6,3 6,4 6,7

6,7 6,8 6,8 6,9 7,2 7,2

7,4 7,4 7,6 7,8 8,1 8,2

8,4 8,5 8,6 8,6 8,7 8,7

8,8 9,3 9,3 9,5 9,5 9,8

De um modo geral, todas as medidas calculadas para uma varivel contnua sero valores aproximados para estas medidas, uma vez que ao agrupar-se os

UniverCidade 64 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ dados segundo uma varivel contnua, h perda de informaes quanto a identidade dos dados. Entretanto verifica-se que, para o conceito de diviso da distribuio, o valor calculado procede, pois 50 % (metade) das notas so inferiores 6,87 e 50 % das notas so superiores 6,87. Observe que o valor da mdia aritmtica diferente do valor da mediana !!!!

UniverCidade 65 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

3.8 Moda (mo)


A interpretao da moda bastante simples se utilizarmos o dia-a-dia. Dentre os adolescentes, de maneira geral, estar na moda significa estar em evidncia, utilizando as roupas, sapatos e cores que a maioria est usando. Estatisticamente, moda tem um significado semelhante.

MODA o valor de maior freqncia em um conjunto de dados, isto , o valor mais comum. O clculo da moda, da mesma forma que o clculo da mediana, depender da forma com a qual os dados forem apresentados. - Clculo da Moda para dados em ROL Se os dados estiverem em forma de ROL, a identificao da moda feita verificando-se o elemento de maior freqncia (se os dados estiverem sob a forma bruta, deve proceder a determinao do ROL). Por exemplo: Considere um conjunto de notas: Y = { 2, 8, 7, 7, 9, 5, 7, 4, 2, 5, 6 } Dispondo em ROL, tem-se: Y = { 2, 2, 4, 5, 5, 6, 7, 7, 7, 8, 9 } O elemento de maior freqncia a nota 7. Portanto a moda (mo) = 7. As sries, quando s moda, podem ser classificadas das seguintes formas: a) b) c) d) unimodais possuem apenas uma moda, ou seja, somente um elemento se destaca na srie; bimodais possuem duas modas. Dois elementos destacam-se na srie, possuem as mesmas freqncias, que so as maiores; polimodais possuem mais de duas modas. Podem ser trimodais (trs modas), tetramodais (quatro modas), etc. a m o d a i s todos os elementos da srie possuem a mesma freqncia. No h um elemento que se destaque pela maior freqncia.

UniverCidade 66 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Se os dados de um rol forem dispostos sob a forma de uma varivel discreta, a identificao do rol ainda mais simples. Utilizando o mesmo conjunto acima, sob a forma de uma varivel discreta. Y = { 2, 2, 4, 5, 5, 6, 7, 7, 7, 8, 9 }

Xi 2 4 5 6 7 8 9

Fi 2 1 2 1 3 1 1

Observa-se que na apresentao da varivel discreta, as freqncias j esto computadas na segunda coluna. Basta identificar o elemento de maior freqncia. A maior freqncia observada na segunda coluna 3 e corresponde ao elemento 7. Portanto a srie unimodal com mo = 7. - Clculo da moda para dados em varivel contnua A determinao da moda em uma varivel contnua pode ser efetuada atravs de algumas metodologias. Considerando a natureza do curso, ser abordado somente o clculo da MODA DE KING. Segundo KING, a determinao da moda de uma varivel contnua pode ser calculada atravs da freqncia simples da classe anterior e da freqncia simples da classe posterior classe modal, do limite inferior da classe modal e da amplitude do intervalo de classe.

mo = l mo +

f post f ant + f post

xh

Onde:

UniverCidade 67 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ mo = moda lmo = limite inferior da classe modal fpost = freqncia simples da classe posterior classe modal fant = freqncia simples da classe anterior classe modal h = amplitude do intervalo de classe Notas dos alunos da turma XX na prova de Lngua Portuguesa Freqncia Classe 1 2 3 4 5 6 1 2,5 4 Notas __ 2,5 __ 4 (fi) 3 1 7 11 9 11 42

__ 5,5 __ 7 __ 8,5 __ 10

5,5 7 8,5

Total ( ) Fonte: dados hipotticos.

No exemplo verifica-se uma distribuio bimodal, onde as Classes 4 e 6 apresentam as maiores classes (com valores iguais), onde n = 11. Considerando o processo de KING, ser necessrio o clculo das duas modas. - Clculo da 1 moda (Classe 4) lmo = 5,5 fpost = 9 (freqncia da Classe 5) fant = 7 (freqncia da Classe 3 ) h = 1,5. Logo, aplicando-se a Frmula da King:

UniverCidade 68 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

mo = 5,5 + mo = 5,5 +

9 x1,5 7+9 9 x1,5 16

mo = 5,5 + 0,56 x1,5 mo = 5,5 + 0,84 mo = 6,34


A primeira moda igual a 6,34. - Clculo da 2 moda (Classe 6) lmo = 8,5 fpost = 0 (freqncia da Classe 7) fant = 9 (freqncia da Classe 5 ) h = 1,5.

No exemplo, a moda encontra-se na ltima classe da distribuio. Desta forma, para que se possa proceder o clculo necessrio que seja interpretada a existncia de uma classe posterior (7 Classe), com freqncia igual a zero.

Logo, aplicando-se a Frmula da King:

mo = 8,5 + mo = 8,5 +

0 x1,5 0+9 0 x1,5 16

UniverCidade 69 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Verifica-se a existncia de uma frao com numerador igual a zero. Zero dividido por qualquer nmero igual a zero. Zero multiplicado por qualquer nmero igual a zero. Logo:

mo = 8,5
Desta forma, a distribuio, que bimodal, apresenta como modas 6,34 e 8,5.

Observe

que

os

valores

encontrados

pertencem

efetivamente s classe modais determinadas, ou seja 6,34 pertence 4 Classe, ao intervalo 5,5 6 Classe, ao intervalo 8,5 __ 10. __ 7 e 8,5 pertence

Geralmente no necessrio calcular as trs medidas de tendncia central. Normalmente precisa-se de apenas uma das medidas para caracterizar o centro da srie. Ento, surge a questo: Qual medida deve ser utilizada? A medida ideal em cada caso aquela que melhor representa a maioria dos dados da srie. Quando todos os dados de uma srie so iguais ( o que dificilmente ocorrer na prtica), a mdia, a mediana e a moda coincidiro com este valor e, portanto, qualquer uma das medidas representar bem a srie. Na maioria das vezes, tem-se valores diferenciados para a srie e conseqentemente a medida ir representar bem apenas os dados da srie que se situam prximos a este valor. Os dados muito afastados em relao ao valor da medida no sero bem representados por ela. Desta forma, se uma srie apresenta forte concentrao de dados em sua rea central, a mdia, a mediana e a moda ficam tambm situadas em sua rea central, representando bem a srie. Como a mais conhecida a mdia, opta-se por esta medida de tendncia central. Se uma srie apresenta forte concentrao de dados em seu incio, a mediana e a moda estaro posicionadas mais no incio da srie, representando bem esta concentrao. A mdia que fortemente afetadas por alguns valores

UniverCidade 70 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ posicionados no final da srie se deslocar para a direita desta concentrao, no a representando bem. Como a mais conhecida entre a mediana e a moda a mediana, esta ser a medida mais indicada deste caso. A mesma situao ocorre se a srie apresenta forte concentrao de dados em seu final. Logo, deve-se optar pela mediana quando houver forte concentrao de dados no incio ou no final da srie. A moda deve ser a opo como medida de tendncia central apenas em sries que apresentam um elemento tpico, isto , um valor cuja freqncia muito superior freqncia dos outros elementos da srie. Alm das medidas de tendncia central (mdia aritmtica, mediana e moda), tambm existem algumas medidas teis de localizao no-central, que so empregadas particularmente ao se resumirem ou descreverem as propriedades de grandes conjuntos de dados numricos. So elas: o quartil, o decil e o percentil. Estas medidas so denominadas MEDIDAS SEPARATRIZES.

UniverCidade 71 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 3.9 O QUARTIL (Qn) A mediana o valor que divide a disposio ordenada pela metade ( 50% das observaes so menores que a mediana e 50% das observaes so maiores). Os quartis so medidas descritivas que dividem os dados ordenados em quatro partes. possvel a determinao de trs quartis: a) o primeiro quartil, Q1, o valor que faz com que 25 % das observaes seja menores do quem o valor calculado e 75 % das observaes sejam maiores; b) o segundo quartil, Q2, a prpria mediana (Med), pois 50 % das observaes so menores do que o valor calculado e 50 % das observaes so maiores; c) o terceiro quartil, Q3, o valor que faz com que 75 % das observaes seja menores do quem o valor calculado e 25 % das observaes sejam maiores; -Clculo do QUARTIL de uma varivel discreta Para calcular os quartis de uma distribuio de freqncia em varivel discreta so utilizadas as frmulas de ponto de posicionamento, conforme indicado abaixo:

Q1 =

n +1 2 2(n + 1) n + 1 = 4 2 3(n + 1) 4

Q2 =

Q3 =

UniverCidade 72 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

No h sentido o clculo do Q4, ou seja do quarto quartil, pois o valor, por definio indicaria que 100% dos valores seriam menores do que o valor calculado, ou seja, o valor calculado seria, na realidade o valor imediatamente superior ao maior valor da srie representada.

H algumas regras que devem ser seguidas para a obteno dos quartis pelas frmulas de ponto de posicionamento: 1 se o ponto de posicionamento resultante for um nmero inteiro, a observao numrica em questo, correspondente quele ponto de posicionamento, escolhida como o quartil; 2 se o ponto de posicionamento resultante estiver na metade entre dois nmeros inteiros, a mdia de seus respectivos valores considerada como o quartil; 3 se o ponto de posicionamento resultante no se tratar de um nmero inteiro, nem do valor correspondente a metade do caminho entre dois nmeros inteiros, uma regra simples utilizada para estimar o quartil em questo e fazer o arredondamento at o ponto de posicionamento do nmero inteiro mais prximo e selecionar o valor numrico da observao correspondente como o quartil.

Como exemplo ser utilizada a distribuio:

Notas 5 6 7 9 10

Nmero de alunos 3 5 8 5 2 23

Vamos calcular:

UniverCidade 73 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Q1 =

n + 1 23 + 1 24 = = =6 4 4 4

Isto equivale dizer que Q1 pode ser determinado como sendo a sexta observao ordenada, ou seja a terceira nota 6 (seis) divide a distribuio em duas partes, onde esquerda tm-se 25 % da distribuio e direita 75 % da distribuio.

Q2 =

2(n + 1) 2(23 + 1) 2(24) 48 = = = = 12 4 4 4 4

Agora verifica-se que a dcima segunda observao ordenada, ou seja a quarta nota 7 (sete) divide a distribuio em duas partes iguais, com 50 % para cada lado. Verifique que o valor de Q2 igual mediana.

O ponto de posicionamento indica que a dcima oitava observao, ou seja a segunda nota 9 (nove) divide a distribuio em duas partes, sendo 75 % `a esquerda e 25 % direita.

Q3 =

3(n + 1) 3(23 + 1) 3(24) 72 = = = = 18 4 4 4 4

Atravs da utilizao do conceito de freqncia acumulada, pode-se visualizar bem o posicionamento dos quartis:

Notas

Nmero de alunos

Freqncia Acumulada

Observaes

5 6 7 9 10

3 5 8 5 2 23

3 8 16 21 23

Da 1 at a 3 Da 4 at a 8 Da 9 at a 16 Da 17 at a 21 Da 22 at a 23

UniverCidade 74 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

-Clculo do QUARTIL de uma varivel contnua Para a determinao dos quartis em uma distribuio em varivel contnua utiliza-se inicialmente o mesmo procedimento efetuado para a varivel discreta, porm deve-se estar atento aos seguintes detalhes: a) quando do clculo para a varivel discreta o valor encontrado determinava a posio do elemento na distribuio, sendo possvel atravs da utilizao do conceito de freqncia acumulada determinar-se o valor da observao que ocupava tal posio; O clculo do quartil em uma varivel discreta indica a posio da observao na srie, sendo a determinao da observao feita posteriormente, com a anlise da distribuio.

b)

quando utiliza-se uma varivel contnua, o valor calculado indicar a observao que ocupa a posio determinada pelo quartil.

A determinao do quartil em uma varivel contnua possvel com a utilizao da seguinte frmula:

in f acmant Qi = li + 4 xh fclasse
Onde: Qi = quartil i, ou seja o quartil que se deseja determinar ( os valores de i podem ser 1, 2 ou 3) li = limite inferior da classe que contm o quartil in = o nmero do quartil que se deseja determinar multiplicado pela freqncia total da distribuio

UniverCidade 75 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ f acmant = freqncia acumulada da classe anterior classe que contm o quartil desejado f
classe

= freqncia da classe que contm o quartil

h = amplitude do intervalo de classe Lembre-se de que se a classe que estiver sendo observada for a primeira, a freqncia anterior ser zero.

Seja a seguinte hiptese: A direo de uma escola deseja estabelecer um atendimento diferenciado, para os alunos da turma XX e tomar como base as notas em Lngua Portuguesa. Sero implementadas as seguintes aes: a) b) para o conjunto que representar as 25 % menores notas sero oferecidas aulas de reforo; para o conjunto que representar as 25 % maiores notas sero oferecidas aulas de redao. Foi apresentada a distribuio abaixo com as notas dos alunos da turma XX em Lngua Portuguesa. Como efetuar a separao da turma? Este caso pode ser resolvido por intermdio do conceito de quartil. A resposta da primeira condio os alunos que obtiveram as 25% menores notas representa o intervalo compreendido entre a menor nota indicada na distribuio e a nota imediatamente inferior ao valor do Q1.

UniverCidade 76 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Notas dos alunos da turma XX na prova de Lngua Portuguesa Classe 1 2 3 4 5 6 1 2,5 4 5,5 7 8,5 Notas __ 2,5 __ 4 Freqncia 3 1 7 10 8 11 40

__ 5,5 __ 7 __ 8,5 __ 10

Total Fonte: dados hipotticos.

Inicialmente deve-se obter as freqncias acumuladas das classes:

Classe

Notas

Freqncia

Freqncia Acumulada

1 2 3 4 5 6

1 2,5 4 5,5 7 8,5

__ 2,5 __ 4

3 1 7 10 8 11 40

3 4 11 21 29 40

__ 5,5 __ 7 __ 8,5 __ 10

Total

UniverCidade 77 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Em seguida determina-se o ponto de posicionamento do quartil desejado (no caso, o Q1 ).

Q1 =

in 1x 40 = = 10 4 4
A observao que ocupa a posio 10 na distribuio est contida na Classe

3. Desta forma, pode obter as seguinte informaes: li = 4 in = 1 x 40 = 40 f f


acmant classe

=4

=7

h = 1,5 Substituindo-se os valores na frmula:

40 4 4 Q1 = 4 + x1,5 7 Q1 = 4 + 10 4 x1,5 7 6 x1,5 7

Q1 = 4 +

Q1 = 4 + 0,85714 x1,5 Q1 = 4 + 1,28571 Q1 = 5,28571 Q1 5,3


O valor foi arredondado para uma casa decimal. A simbologia utilizada () significa aproximadamente.

O valor encontrado indica que 25 % dos alunos obtiveram notas inferiores 5,3. Desta forma, sero oferecidas aulas de reforo para os alunos com notas inferiores 5,3 em Lngua Portuguesa.

UniverCidade 78 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Observe que o valor encontrado 5,3 est contido na Classe 3, conforme foi indicado pela observao do ponto de posicionamento.

A resposta pode ser indicada, tambm, atravs da seguinte notao:

1 Q1 < 5,3
Ou seja, tero aulas de reforo os alunos com notas iguais ou maiores do que 1 (um) e com notas menores do que 5,3. E quais sero os alunos que tero aulas de redao? Utilizando o conceito de Quartil pode-se concluir que o conjunto que se deseja determinar representam as notas posteriores ao Q3. Deve-se, inicialmente, determinar o ponto de posicionamento:

Q3 =

3 x 40 120 = = 30 4 4
A observao que ocupa a posio 30 na distribuio est contida na Classe

6. Desta forma, pode obter as seguinte informaes: li = 8,5 in = 3 x 40 = 120 f f


acmant classe

= 29

= 11

h = 1,5 Substituindo-se os valores na frmula:

UniverCidade 79 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

3 x 40 29 4 Q3 = 8,5 + x1,5 11 120 29 4 Q3 = 8,5 + x1,5 11 Q3 = 8,5 + 30 29 x1,5 11

1 x1,5 11 Q3 = 8,5 + 0,09091x1,5 Q3 = 8,5 + Q3 = 8,5 + 0,13637 Q3 = 8,63637 Q3 8,6


Desta forma pode-se concluir que sero contemplados com aulas de redao os alunos com notas superiores a 8,6 ( as 25 % maiores notas da turma).

Quando calculado o Q3 determina-se a observao que coloca 75 % das observaes sua esquerda e 25 % das observaes sua direita.

UniverCidade 80 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 3.10 O DECIL (Dn) A mediana o valor que divide a disposio ordenada pela metade ( 50% das observaes so menores que a mediana e 50% das observaes so maiores). Os quartis so medidas descritivas que dividem os dados ordenados em quatro partes. Em diversas situaes tem-se a necessidade de determinar valores que correspondem , por exemplo, 40 % das observaes. Nestes casos, deve-se utilizar o conceito de DECIL, que possibilita a diviso dos dados ordenados em 10 (dez) partes iguais. possvel a determinao de nove decis: a) o primeiro decil, D1, o valor que faz com que 10 % das observaes seja menores do quem o valor calculado e 90 % das observaes sejam maiores; b) o segundo decil, D2, o valor que faz com que 20 % das observaes seja menores do quem o valor calculado e 80 % das observaes sejam maiores; c) o terceiro decil, D 3, o valor que faz com que 30 % das observaes seja menores do quem o valor calculado e 70 % das observaes sejam maiores, e assim sucessivamente at o d) o nono decil, D9, o valor que faz com que 90 % das observaes seja menores do quem o valor calculado e 10 % das observaes sejam maiores. No h sentido em falar-se em D10 (decil dez), pois seria o equivalente a determinar o valor que posiciona sua esquerda 100 % das observaes. Este valor, por certo ser o ltimo elemento da distribuio. O D5 (decil cinco) ter o mesmo valor da mediana (Md) e o mesmo valor de Q2.

-Clculo do DECIL de uma varivel discreta Para calcular os decis de uma distribuio de freqncia em varivel discreta so utilizadas as frmulas de ponto de posicionamento. De maneira genrica, pode-se determinar que:

Di =

i (n + 1) 10

UniverCidade 81 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Onde: i = decil que se deseja determinar n = freqncia total Pode-se ento, utilizar, para a determinao da posio dos decis 3, 6 e 8, por exemplo, as seguintes frmula de ponto de posicionamento:

D3 = D6 D8

3( n + 1) 10 6( n + 1) = 10 8( n + 1) = 10

As regras que devem ser seguidas para a obteno dos decis pelas frmulas de ponto de posicionamento so as mesmas as que foram apresentadas para a obteno dos quartis. Vamos para um exemplo: As idades (em anos) dos alunos de uma escola foram apuradas e possibilitaram a elaborao da seguinte distribuio discreta:

Idades 7 8 9 10 11 12

Nmero de Alunos 14 17 23 15 18 16

Determinar o conjunto de idades que representam 40 % do nmero de alunos. Verifica-se que a questo pode ser resolvida utilizando-se o conceito de decis, pois 40 % dos alunos pode ser indicado atravs do D4, ou seja, a observao

UniverCidade 82 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ que coloca 40 % das observaes sua esquerda e 60 % das observaes sua direita. Inicialmente deve-se determinar a freqncia total e as freqncias acumuladas:

Classe

Idades

Nmero de Alunos

Freqncia Acumulada 14 31 54 69 87 103

Observaes

1 2 3 4 5 6

7 8 9 10 11 12

14 17 23 15 18 16 103

Da 1 at a 14 Da 15 at a 31 Da 32 at a 54 Da 55 at a 69 Da 70 at a 87 Da 88 at a 103

4(n + 1) 10 4(103 + 1) D4 = 10 4 x104 416 D4 = = 10 10 D4 = 41,6 D4 =


A posio ocupada a 41,6, ou seja, est compreendida entre a 41 e a 42 observao. Verifica-se que neste caso que a observao encontra-se na Classe 3. Apura-se que o dcimo aluno com idade de 9 anos ocupa a posio 41 e que o dcimo primeiro ocupa a posio 42. Desta forma, seria vivel afirmar-se que 40 % dos alunos esto compreendidos entre 7 e 9 anos. (no seriam includos todos os alunos com 9 anos, somente os dez primeiros observados). -Clculo do DECIL de uma varivel contnua Para a determinao dos decis em uma distribuio em varivel contnua utiliza-se inicialmente o mesmo procedimento efetuado para a varivel discreta, porm deve-se estar atento aos seguintes detalhes:

UniverCidade 83 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ c) quando do clculo para a varivel discreta o valor encontrado determinava a posio do elemento na distribuio, sendo possvel atravs da utilizao do conceito de freqncia acumulada determinar-se o valor da observao que ocupava tal posio; O clculo do decil em uma varivel discreta indica a posio da observao na srie, sendo a determinao da observao feita posteriormente, com a anlise da distribuio.

d)

quando utiliza-se uma varivel contnua, o valor calculado indicar a observao que ocupa a posio determinada pelo decil.

A determinao do decil em uma varivel contnua possvel com a utilizao da seguinte frmula:

in f acmant Di = li + 10 xh fclasse
Onde: Di = decil i, ou seja o decil que se deseja determinar ( os valores de i podem ser 1, 2, 3, ..., at 9) li = limite inferior da classe que contm o decil in = o nmero do decil que se deseja determinar multiplicado pela freqncia total da distribuio f f
acmant

= freqncia acumulada da classe anterior classe que contm o

decil desejado
classe

= freqncia da classe que contm o decil

h = amplitude do intervalo de classe Lembre-se de que se a classe que estiver sendo observada for a primeira, a freqncia anterior ser zero.

Seja a seguinte hiptese:

UniverCidade 84 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ O Colgio Sabetudo deseja oferecer bolsa de estudos parcial de 30 % para parte de seus alunos, como forma de incentivo. Vai adotar como critrio a renda familiar bruta da famlia do aluno. A inteno favorecer os alunos que tiverem 20 % das menores rendas. Um levantamento possibilitou a construo da distribuio de freqncias abaixo. Qual ser a renda familiar mxima para a obteno da bolsa de estudos?

Classe

Renda Familiar (em R$)

Nmero de Alunos

1 2 3 4 5 6 7

600,00 750,00 900,00 1.050,00 1.200,00 1.350,00 1.500,00

__ __ __ __ __ __ __

750,00 900,00 1.050,00 1.200,00 1.350,00 1.500,00 1.650,00

8 6 17 19 48 32 11

Pelo o que pode ser verificado, 20 % das menores rendas corresponde aos valores que estiverem esquerda do D2. Para que se possa determinar o valor que ocupa tal posio, inicialmente deve-se indicar as freqncia total e freqncias acumuladas da distribuio:

Classe

Renda Familiar (em R$)

Nmero de Freqncia Alunos 750,00 900,00 8 6 17 19 48 32 11 141 Acumulada 8 14 31 50 98 130 141

1 2 3 4 5 6 7

600,00 750,00 900,00 1.050,00 1.200,00 1.350,00 1.500,00

__ __ __ __ __ __ __

1.050,00 1.200,00 1.350,00 1.500,00 1.650,00

Em seguida determina-se o ponto de posicionamento do decil desejado (no caso, o D2 ).

UniverCidade 85 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

D2 =

in 2 x141 = = 28,2 10 10
A observao que ocupa a posio 28,2 na distribuio est contida na

Classe 3. Desta forma, pode obter as seguinte informaes: li = 900,00 in = 2 x 141 = 282 f f
acmant classe

= 14

= 17

h = 150,00 Substituindo-se os valores na frmula:

D2 D2 D2 D2

282 14 10 = 900,00 + x150,00 17 28,2 14 = 900,00 + x150,00 17 14,2 = 900,00 + x150,00 17 = 900,00 + 0,83529 x150,00

D2 = 900,00 + 125,29 D2 = 1.025,29


Desta forma pode-se concluir que podero ser contemplados com a bolsa de estudos os alunos cuja renda familiar for inferior R$ 1.025,29 ( ou seja ou valores que estiverem esquerda do D2 ).

Observe que o valor encontrado est contido na Classe 3.

UniverCidade 86 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 3.10 O PERCENTIL (Pi) ou CENTIL (Ci) A mediana o valor que divide a disposio ordenada pela metade ( 50% das observaes so menores que a mediana e 50% das observaes so maiores). Os quartis so medidas descritivas que dividem os dados ordenados em quatro partes. Os decis so medidas descritivas que dividem os dados em dez partes. Em vrias ocasies faz-se necessrio determinar valores com maiores precises, como por exemplo qual seria a nota mnima para um aluno pertencer ao Quadro de Honra, sabendo-se que somente 8 % das maiores notas sero contempladas? Observa-se que neste caso sero excludas do Quadro de Honra 92 % das notas. Nestes casos, deve-se utilizar o conceito de PERCENTIL, que possibilita a diviso dos dados ordenados em 100 (cem) partes iguais. possvel a determinao de noventa e nove percentis: e) o primeiro percentil, P1, o valor que faz com que 1 % das observaes seja menores do quem o valor calculado e 99 % das observaes sejam maiores; f) o segundo percentil, P2, o valor que faz com que 2 % das observaes seja menores do quem o valor calculado e 98 % das observaes sejam maiores; g) o terceiro percentil, P3, o valor que faz com que 3 % das observaes seja menores do quem o valor calculado e 97 % das observaes sejam maiores, e assim sucessivamente at o h) o nonagsimo nono percentil, P99, o valor que faz com que 99 % das observaes seja menores do quem o valor calculado e 1 % das observaes sejam maiores. No h sentido em falar-se em P100 (percentil cem), pois seria o equivalente a determinar o valor que posiciona sua esquerda 100 % das observaes. Este valor, por certo ser o ltimo elemento da distribuio. O P50 (decil cinqenta) ter o mesmo valor da mediana (Md), o mesmo valor de Q2 e o mesmo valor de D5.

UniverCidade 87 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ -Clculo do PERCENTIL de uma varivel discreta Para calcular os percentis de uma distribuio de freqncia em varivel discreta so utilizadas as frmulas de ponto de posicionamento. De maneira genrica, pode-se determinar que:

Pi =
Onde: i = decil que se deseja determinar n = freqncia total

i (n + 1) 100

Pode-se ento utilizar, para a determinao da posio dos percentis 14, 39 e 77, por exemplo, as seguintes frmula de ponto de posicionamento:

P = 14 P 39 P 77

14( n + 1) 100 39( n + 1) = 100 77( n + 1) = 100

As regras que devem ser seguidas para a obteno dos percentis pelas frmulas de ponto de posicionamento so as mesmas as que foram apresentadas para a obteno dos quartis e dos decis. Vamos para um exemplo: As idades (em anos) dos alunos de uma escola foram apuradas e possibilitaram a elaborao da seguinte distribuio discreta:

UniverCidade 88 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Idades dos Alunos da Escola ABC Idades 11 12 13 14 15 16 Nmero de Alunos 25 19 38 41 16 8

Determinar o conjunto de idades que representam 22 % do nmero de alunos com as menores idades. Verifica-se que a questo pode ser resolvida utilizando-se o conceito de percentis, pois 22 % dos alunos com as menores idades pode ser indicado atravs do P22, ou seja, a observao que coloca 22 % das observaes sua esquerda e 78 % das observaes sua direita. Inicialmente deve-se determinar a freqncia total e as freqncias acumuladas:

Classe

Idades

Nmero de Alunos

Freqncia Acumulada 25 44 82 123 139 147

Observaes

1 2 3 4 5 6

11 12 13 14 15 16

25 19 38 41 16 8 147

Da 1 at a 25 Da 26 at a 44 Da 45 at a 82 Da 83 at a 123 Da 124 at a 139 Da 140 at a 147

Calculando o ponto de posicionamento:

UniverCidade 89 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

22(n + 1) 100 22(147 + 1) P22 = 100 22 x148 3.256 P22 = = 100 100 P22 = 32,56 P22 =
A posio ocupada a 32,56, ou seja, est compreendida entre a 32 e a 33 observao. Verifica-se que neste caso que a observao encontra-se na Classe 2. Apura-se que o trigsimo segundo aluno tem idade de 12 anos e que o trigsimo terceiro tambm possui 12 anos. Desta forma, seria vivel afirmar-se que 17 % dos alunos esto compreendidos entre 11 e 12 anos. (no seriam includos todos os alunos com 12 anos, somente os sete primeiros observados). -Clculo do PERCENTIL de uma varivel contnua Para a determinao dos percentis em uma distribuio em varivel contnua utiliza-se inicialmente o mesmo procedimento efetuado para a varivel discreta, porm deve-se estar atento aos seguintes detalhes: a) quando do clculo para a varivel discreta o valor encontrado determinava a posio do elemento na distribuio, sendo possvel atravs da utilizao do conceito de freqncia acumulada determinar-se o valor da observao que ocupava tal posio; O clculo do percentil em uma varivel discreta indica a posio da observao na srie, sendo a determinao da observao feita posteriormente, com a anlise da distribuio.

b) quando utiliza-se uma varivel contnua, o valor calculado indicar a observao que ocupa a posio determinada pelo percentil. A determinao do percentil em uma varivel contnua possvel com a utilizao da seguinte frmula:

UniverCidade 90 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

in f acmant Pi = li + 100 xh fclasse


Onde: Pi = percentil i, ou seja o percentil que se deseja determinar ( os valores de i podem ser 1, 2, 3, ..., at 99) li = limite inferior da classe que contm o percentil in = o nmero do percentil que se deseja determinar multiplicado pela freqncia total da distribuio f f
acmant

= freqncia acumulada da classe anterior classe que contm o

percentil desejado
classe

= freqncia da classe que contm o percentil

h = amplitude do intervalo de classe Lembre-se de que se a classe que estiver sendo observada for a primeira, a freqncia anterior ser zero.

Seja a seguinte hiptese: O Colgio Bom Futuro deseja incentivar 15 % de seus alunos os de maiores idades, a efetuarem matrcula no turno da noite, oferecendo uma bolsa de 30 %. Um levantamento das idades de todos os alunos possibilitou a elaborao da distribuio de freqncias abaixo. Qual ser a idade mnima para o aluno ser incentivado a efetuar matrcula no turno da noite?

Classe

Idades (anos)

Nmero de Alunos 8 10 12 14 16 18 37 45 46 32 29 23

1 2 3 4 5 6

6 8 10 12 14 16

__ __ __ __ __ __

UniverCidade 91 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Pelo o que pode ser verificado, 15 % das maiores idades corresponde aos valores que estiverem direita do P85. Para que se possa determinar o valor que ocupa tal posio, inicialmente deve-se indicar as freqncia total e freqncias acumuladas da distribuio:

Classe

Idades (anos)

Nmero de Alunos 8 10 12 14 16 18 37 45 46 32 29 23 212

Freqncia Acumulada 37 82 128 160 189 212

1 2 3 4 5 6

6 8 10 12 14 16

__ __ __ __ __ __

Em seguida determina-se o ponto de posicionamento do percentil desejado (no caso, o P85 ).

P85 =

in 85 x 212 = = 180,2 100 100


A observao que ocupa a posio 180,2 na distribuio est contida na

Classe 5. Desta forma, pode obter as seguinte informaes: li = 14 in = 85 x 212 = 18.020 f f


acmant classe

= 160

= 189

h=2 Substituindo-se os valores na frmula:

UniverCidade 92 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

P85 P85 P85 P85

18020 160 100 = 14 + x2 189 180,2 160 = 14 + x2 189 20,2 = 14 + x2 189 = 14 + 0,10688 x 2

P85 = 14 + 0,21376 P85 = 14,21376


Desta forma pode-se concluir que a idade mnima para que o aluno seja incentivado am matricular-se no turno da noite de 14,21376 anos. Observe que o valor encontrado est contido na Classe 5. O valor pode ser melhor determinado utilizando-se a Regra de Trs: 1 ano ..................... 12 meses 0,21376 anos ............... x onde x = 2,56 meses. Ou seja, os alunos com idades iguais ou superiores a 14 anos e 2 meses se enquadram na situao desejada.

UniverCidade 93 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 4 - Medidas de disperso amplitude total, desvio mdio e desvio padro A utilizao de uma medida representativa de posio central (mdia, mediana ou moda) para a representao de um conjunto de dados esconde toda a informao sobre a variabilidade do conjunto de valores. Seja o exemplo: Trs grupos de alunos (A, B e C), com cinco alunos cada, realizou um teste, individual, sendo verificadas as seguintes notas: Grupo A: 3, 4, 5, 6 e 7 Grupo B: 1, 3, 5, 7 e 9 Grupo C: 5, 5, 5, 5 e 5. Se for utilizado o conceito de mdia aritmtica, verifica-se que todos os grupos possuem a mesma mdia, ou seja, 5 (cinco). A simples informao da mdia no possibilita analisar o comportamento das variveis que formam os conjuntos. necessrio, ento, a adoo de um critrio que possibilite, por exemplo, comparar conjuntos diferentes de valores. As medidas de tendncia central so tanto mais apropriadas para descrever um conjunto de dados: a) quanto maior for o nmero de dados do conjunto; b) quanto menor for a disperso.

4.1

A amplitude total

Considerando o exemplo acima, a simples informao da mdia no possibilitaria uma interpretao do resultado. Sendo informada a mdia, sua interpretao poder ser melhor analisada se forem informados: a) o nmero de alunos de cada grupo; b) a nota mnima e a nota mxima de cada grupo. A primeira informao j sabida, ou seja, cada grupo composto por cinco alunos. Ento a segunda informao possibilitar uma melhor anlise do resultado. Quanto menor for a distncia entre a menor nota e a maior nota, maior ser a confiana na mdia.

UniverCidade 94 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Amplitude total (At) de um conjunto de dados a diferena entre o maior valor e o menor valor observado.

Utilizando os valores do exemplo, tem-se que: a) a amplitude total (At) do conjunto A de 7-3 = 4; b) a amplitude total (At) do conjunto B de 9-1 = 8, e c) a amplitude total (At) do conjunto C igual a zero, pois todas as notas so iguais. A confiana na mdia dos grupos para resumir a informao contida nas notas de todos os alunos que formam o grupo ser maior quanto menor for a distncia entre a maior e a menor nota. Verifica-se que a amplitude do grupo C igual a zero, desta forma a mdia aritmtica resume melhor o conjunto de notas. A amplitude muito utilizada pois fcil de entender e de ser calculada. Entretanto, a amplitude no mede bem a variabilidade dos grandes conjuntos de dados. A amplitude no mede bem disperso por uma simples razo: para o seu clculo usam-se apenas os valores extremos. importante que todos os dados sejam usados no clculo da medida de disperso. O exemplo indica a amplitude de um conjunto de observaes e nada mais do que a diferena entre o limite superior (Li) do conjunto e o limite inferior (li). Desta forma, pode-se indicar a amplitude total atravs da seguinte notao:

At = Li li
Amplitude Total em uma varivel contnua Quando a observao estiver disposta atravs de uma distribuio de freqncia em varivel contnua, a amplitude total ser a diferena entre o ponto mdio (mi) da ltima classe e o ponto mdio da primeira classe. Ex:

UniverCidade 95 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Classe 1 2 3 4 5 8 12 16 20 24

Idades __ __ __ __ __ 12 16 20 24 28

N de Alunos 15 18 36 45 10

Ponto mdio 10 14 18 22 26

Neste caso considerando as caractersticas j descritas das distribuies de freqncia, a amplitude total ser obtida atravs da diferena entre o ponto mdio da ltima classe e o ponto mdio da primeira classe, ou seja,

At = ( ponto _ mdio _ da _ ltima _ classe) ( ponto _ mdio _ da _ primeira _ classe)


Desta forma, para a distribuio de freqncias acima, a amplitude total ser: At = 26 10 At = 16 4.2 O desvio mdio (DM)

Um forma de utilizar todos os dados determinar a distncia entre os dados observados e a mdia aritmtica. A distncia ser representada pela diferena entre o dados observado e a mdia aritmtica do conjunto. Este o conceito de desvio em relao mdia:

Desvio em relao mdia a diferena entre o valor observado e a mdia do conjunto.

Entretanto necessrio lembrar que a mdia aritmtica um ponto eqidistante entre os dados. Desta forma, a soma das distncias entre os dados observados e a mdia aritmtica ser igual a zero. Utilizando um dos grupos do exemplo: Grupo B: 1, 3, 5, 7 e 9

UniverCidade 96 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Sabe-se que a mdia aritmtica (mdia) igual a 5 (cinco). Pode-se indicar o Grupo B como sendo formado pelos seguintes elementos: Grupo B : x1, x2, x3, x4, x5 Desta forma, pela definio, pode determinar o desvio em relao mdia:

Desvio = ( x1 mdia) + ( x 2 mdia) + ( x3 mdia) + ( x 4 mdia) + ( x5 mdia)


Substituindo os valores, tem-se: Desvio = (1-5)+(3-5)+(5-5)+(7-5)+(9-5) Desvio = (-4)+(-2)+(0)+(2)+(4) Desvio =0 Verifique que o desvio dos outros grupo tambm igual a zero. Se os desvio forem iguais a zero, de nada adianta para a anlise. Para que se tenha uma estatstica que realmente mea a variao, pode-se tomar a soma dos valores absolutos das distncias. Valor absoluto ou mdulo o nmero sem sinal. Quando se deseja indicar o valor absoluto ou mdulo, de uma operao, utiliza-se duas barras paralelas: 5-9 = 4 ( o nmero sem sinal) Desta forma, pode-se aprimorar o conceito de desvio em relao mdia.

Desvio em relao mdia o valor absoluto da diferena entre o valor observado e a mdia do conjunto. Simbolizando:

Desvio = ( x1 mdia) + ( x 2 mdia) + ( x3 mdia) + ( x 4 mdia) + ( x5 mdia)


Logo, o clculo do desvio em relao media do Grupo B, passaria a ser:

Desvio = (1-5)+(3-5)+(5-5)+(7-5)+(9-5) Desvio = (-4)+(-2)+(0)+(2)+(4) Desvio = 12

UniverCidade 97 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Para aprimorar o resultado, deve-se determinar a mdia do desvio, passando-se a ter o conceito do desvio mdio: Desvio mdio a mdia entre a soma do valor absoluto da diferena entre cada valor observado e a mdia do conjunto, e o nmero de observaes.

Simbolizando:

DesvioMdio =

( x1 mdia) + ( x 2 mdia) + ( x3 mdia) + ( x 4 mdia) + ( x5 mdia) n

Utilizando a notao em somatrio:

DM =

x
i =1

mdia n

Desta forma, o desvio mdio do grupo B seria:

DM = DM =

(1 5) + (3 5) + (5 5) + (7 5) + (9 5) 5 12 DM = 2,4 5
Calcule o desvio mdio dos outros grupos do exemplo. Qual foi o grupo com o menor desvio mdio, o grupo A ou o grupo B? O menor desvio mdio indica que os dados esto mais concentrados em torno da mdia.

-Desvio Mdio em uma varivel Contnua Para a determinao do desvio mdio de uma distribuio de freqncias representada por uma varivel contnua, as distncias de cada observao deve ser ponderada pela freqncia de cada observao.

UniverCidade 98 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Foi verificado anteriormente que o nmero de termos de uma observao representada por intermdio de uma varivel contnua , na verdade, a soma das freqncias das classes. Desta forma, o desvio mdio para uma varivel contnua pode ser indicada da seguinte forma:

DM =

f
i =1

xi mdia

f
i =1

Ou, considerando que fi igual ao nmero de termos da distribuio (n), que


n

DM =
Se o exemplo:

f
i =1

xi mdia n

Classe 1 2 3 4 5 8 12 16 20 24

Idades __ __ __ __ __ 12 16 20 24 28

N de Alunos 15 18 36 45 10

Ponto mdio 10 14 18 22 26

O objetivo determinao o desvio mdio (grau de disperso) entre as observaes (idades) e a mdia aritmtica das idades. Deve-se, inicialmente calcular a mdia aritmtica. Sabe-se que a mdia aritmtica indicada por:

Mdia =

fm f
i i

Ento:

UniverCidade 99 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Classe Idades N de Alunos Ponto mdio fimi (fi) 1 2 3 4 5 8 12 16 20 24 __ __ __ __ __ 12 16 20 24 28 15 18 36 45 10 90 (mi) 10 14 18 22 26 150 252 648 990 260 2.300

Logo, a mdia aritmtica :

Mdia = Mdia =

fm f
i i

2.300 90 Mdia = 25,6anos


Precisa-se, ento, determinar o mdulos das distncias entre cada observao (idades) e a mdia aritmtica da distribuio:

Classe

Idades

N de Alunos (fi)

Ponto mdio (mi) 10 14 18 22 26

fimi 150 252 648 990 260 2.300

fi (mi - mdia) 234 208,8 273,6 162 4 882,4

1 2 3 4 5

8 12 16 20 24

__ __ __ __ __

12 16 20 24 28

15 18 36 45 10 90

Logo, do desvio mdio ser igual a:

DM =

f
i =1

xi mdia

f
i =1

DM =

882,4 DM = 9,8anos 90

UniverCidade 100 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ necessrio que sejam feitas algumas observaes sobre o desvio mdio: a) o desvio mdio resulta em um resultado mais vantajoso (para anlise da disperso) do que a amplitude ou do que ao desvio, principalmente pelo fato de, em seu clculo, levar em considerao todos os valores da distribuio; b) apesar do desvio mdio expressar aceitavelmente a disperso de uma amostra, no to freqentemente empregado, pois o desvio mdio despreza o fato de alguns desvio serem negativos e outros positivos, pois essa medida os trata como se fossem todos positivos. H uma outra medida de disperso mais adequada, que a mais conhecida e a mais usada academicamente, que o desvio padro.

UniverCidade 101 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

4.3

O desvio padro

H duas formas para eliminar sinais negativos: uma a utilizao dos valores absolutos (ou mdulos), outra elevar-se o nmero ao quadrado. Todo nmero elevado ao quadrado positivo ou, no mnimo, igual a zero (j que zero ao quadrado igual a zero).

Tratando-se de desvios (distncias entre Porm, surge um problema: -

a observao e a mdia

aritmtica) pode-se elevar-se ao quadrado o resultado da diferena. todas as observaes possuem unidades de medida, como por exemplo anos, pesos em quilogramas, alturas em metros, etc. A diferena entre a observao e a mdia (que mantm a unidade da observao), possui uma unidade de medida. Ao elevar-se ao quadrado um nmero que possui uma unidade, eleva-se ao quadrado tambm a unidade de medida. Desta forma, supondo que o desvio entre uma observao e a mdia aritmtica da amostra seja igual a - 2,3 anos (com valor negativo), o quadrado deste valor ser igual 5,29 anos2 , o que no faz nenhum sentido. Considerando o exemplo: Grupo B: 1, 3, 5, 7 e 9 Sabe-se que a mdia aritmtica (mdia) igual a 5 (cinco). Pode-se, para o clculo do desvio, para eliminar os valores negativos, elevar-se as distncia (diferenas entre cada observao e a mdia aritmtica) ao quadrado. Desta forma ter-se-:

Desvio = (1 5) 2 + (3 5) 2 + (5 5) 2 + (7 5) 2 + (9 5) 2 Desvio = (4) 2 + (2) 2 + (0) 2 + (2) 2 + (4) 2 Desvio = 16 + 4 + 0 + 4 + 16 Desvio = 40


O valor encontrado deve ser interpretado com uma unidade que ser o grau ao quadrado. No faz sentido.

UniverCidade 102 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Foi visto anteriormente que deve-se dividir o resultado pelo nmero de observaes, para o clculo do desvio mdio. Entretanto, considerando uma srie de conceitos que no so objeto deste estudo, o resultado ser dividido pelo nmero de observaes menos um (n-1). Se o denominador for n em vez de n-1, a mdia das diferenas ao quadrado em torno da mdia aritmtica seria obtida. No entanto, n-1 utilizado devido a certas propriedades matemticas desejveis pela estatstica que mostram que medida que cresce o tamanho da amostra, a diferena na diviso p n ou n-1 vai se tornando cada vez menor. Desta forma, tem-se que:

40 5 1 Desvio = 10 Desvio =
O valor encontrado , na realidade a varincia.

Varincia da amostra aproximadamente a mdia das diferenas ao quadrado entre cada uma das observaes de um conjunto de dados e a mdia aritmtica do conjunto. Varincia simbolizada por 2. ( grega delta, em minsculo) - letra

A varincia indicada pela seguinte expresso:

(x =

mdia) 2 n 1

A varincia mede a disperso mdia em torno da mdia aritmtica, isto , como as observaes maiores flutuam acima dela e as observaes menores se distribuem abaixo dela. Desta forma, o valor anteriormente calcula a varincia, logo 2 = 10

UniverCidade 103 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ No entanto seus clculo resultam em unidades ao quadrado. Para corrigir esta distoro, extrai-se a raiz quadrada da varincia e passase a ter a mais utilizada medida de disperso o desvio padro. O desvio padro assim definido: Desvio padro a raiz quadrada da soma das diferenas ao quadrado em torno da mdia aritmtica dividida pelo tamanho da amostra menos 1. O desvio padro simbolizado por

O desvio padro indicado pela seguinte expresso:

( x mdia)
i

n 1

O desvio padro da amostra pode ser calculado:

= 10 = 3,2
Quanto menor for o desvio padro, mais significativa ser a utilizao da mdia para interpretar o conjunto. Quanto menor for o desvio padro menor ser a variabilidade das observaes em torno da mdia aritmtica. Clculo da varincia e do desvio padro para dados dispostos em varivel contnua O clculo do desvio padro para dados grupados segue procedimento anlogo ao utilizado para o clculo do desvio mdio. Seja o exemplo:

UniverCidade 104 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Classe 1 2 3 4 5 8 12 16 20 24 Idades __ __ __ __ __ 12 16 20 24 28 N de Alunos 15 18 36 45 10 Ponto mdio 10 14 18 22 26

Determinar a varincia e o desvio padro das idades em relao mdia aritmtica. Conforme foi verificado anteriormente, a mdia aritmtica de 25,6 anos. Desta forma, utilizando a frmula para a varincia para dados grupados

f (m mdia ) =
i i

n 1

E sabendo-se que o desvio padro nada mais do que a raiz quadrada da varincia, logo

= 2
Verifica-se:

Classe

Idades

N de Alunos

Ponto mdio 10 14 18 22 26 mi-mdia -15,6 -11,6 -7,6 -3,6 0,4

(mi-mdia)2 243,4 134,6 57,8 13,0 0,2

fi(mi-mdia)2 3654,0 2422,8 2080,8 585,0 2,0 8744,6

1 2 3 4 5

8 __ 12 __ 16 __ 20 __ 24 __

12 16 20 24 28

15 18 36 45 10 124

UniverCidade 105 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Ento, substituindo-se os valores nas frmulas, tem-se: a) a varincia

8744,6 124 1 2 = 71,1

2 =

b) o desvio padro

= 71,1 = 8,4anos

UniverCidade 106 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 5. Correlao e Regresso Nos captulos anteriores foram mostrados dados que identificam a caracterstica de um determinado experimento, como por exemplo as notas dos alunos em uma turma. Entretanto muitas vezes busca-se determinar a relao de causa x efeito entre duas variveis, como por exemplo o nmero de anos de estudo e a renda mdia dos indivduos, ou a relao entre o peso e a altura dos indivduos. 5.1 Diagrama de Disperso A maneira mais simples de se estudar a relao entre duas variveis fazendo um grfico denominado diagrama de disperso. O diagrama de disperso um grfico que permite visualizar a relao entre duas variveis.

Para a construo de um diagrama de disperso deve-se seguir os seguintes passos:


a. colete pares de dados (X e Y) das variveis que pretende estudar; b. trace um sistema de eixos cartesianos e represente uma varivel em cada eixo; c. estabelea as escalas de maneira a dar ao diagrama o aspecto de um quadrado; d. faa um ponto para representar cada par de valores x e y. Seja o exemplo: Foi efetuada uma pesquisa onde foram verificadas as alturas e os pesos de um grupo de alunos, o que possibilitou a construo da seguinte tabela:

Altura (X) Peso (Y)

1,65 58

1,70 67

1,58 45

1,64 73

1,63 56

1,64 49

1,61 54

O diagrama de disperso ter este formato:

UniverCidade 107 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

80 70 60 50

Pesos

40 30 20 10 0 155

160

165 Alturas

170

175

Feito o diagrama, observe a direo e a disperso dos pontos. No exemplo verifica-se que sendo constatado um aumento da altura, h um aumento do peso. Para a construo do diagrama de disperso voc poder utilizar o Assistente Grfico do Microsoft Excel. Siga os seguintes passos: 1 abra o Microsoft Excel; 2 digite os dados coletados, aos pares, em forma de coluna;

UniverCidade 108 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 3 Marque o bloco com os valores ( clique com o mouse sobre o primeiro valor, arraste para a direita e para baixo, at sombrear todos os valores );

4 Ative o Assistente Grfico (procure na Barra de Ferramentas) e selecione DISPERSO;

UniverCidade 109 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Clique com o boto esquerdo do mouse sobre Avanar>, duas vezes, e sua tela ter este formato

UniverCidade 110 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 6 Posicione o cursor sobre a rea Ttulo, clique com o boto esquerdo do mouse e preencha o ttulo do grfico. Repita a operao em Eixo de Valores X (corresponde s alturas) e em Eixo de Valores Y (corresponde aos pesos); 7 Clique com o boto esquerdo do mouse sobre Linhas de Grade e desmarque as opes que estiverem ativadas. Repita a operao em Legenda. Em seguida clique com o boto esquerdo do mouse sobre Avanar >;

Clique em Concluir.

UniverCidade 111 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

Seu grfico de disperso est concludo.

10 - No se esquea de salvar o arquivo. 5.2 Correlao Linear Vrios so os formatos que podem ser observados em um diagrama de disperso e cada um deles dever ter uma interpretao particular: a) Correlao Positiva Fraca indica que os itens analisados possuem algum grau de dependncia entre si, ou seja, sendo constatada uma variao positiva de X (aumento do valor de X), verifica-se alguma variao no mesmo sentido de Y, porm de forma irregular;

UniverCidade 112 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________


16 14 12 10 8 6 4 2 0 0 50 100 150 200 250

b)

Correlao Positiva Forte indica que os itens analisados possuem forte grau de dependncia, ou seja, sendo constatada uma variao positiva em X, verifica-se uma variao bem acentuada de Y, no mesmo sentido, porm no totalmente proporcional;

14 12 10 8 6 4 2 0 0 50 100 150 200 250

c)

Correlao Positiva Perfeita neste caso as variaes de X implicam em uma variao de Y, nas mesmas propores. O grfico tem a aparncia de uma linha reta ascendente;

UniverCidade 113 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________


9,6 9,4 9,2 9 8,8 8,6 8,4 8,2 8 7,8 0 50 100 150 200 250

d)

Correlao Negativa Fraca - indica que os itens analisados possuem algum grau de dependncia entre si, porm de maneira inversa, ou seja, sendo constatada uma variao positiva de X (aumento do valor de X), verifica-se alguma variao no sentido contrrio de Y (reduo do valor de Y), porm de forma irregular;

20 18 16 14 12 10 8 6 4 2 0 0 50 100 150 200 250

e)

Correlao Negativa Forte - indica que os itens analisados possuem forte grau de dependncia, de maneira inversa ou seja, sendo constatada uma variao positiva em X, verifica-se uma

UniverCidade 114 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ variao bem acentuada de Y, no sentido contrrio, porm no totalmente proporcional;

18 16 14 12 10 8 6 4 2 0 0 50 100 150 200 250

f)

Correlao Negativa Perfeita - neste caso as variaes de X implicam em uma variao de Y, no sentido inverso. O grfico tem a aparncia de uma linha reta descendente;

60 50 40 30 20 10 0 0 50 100 150 200 250

g)

Correlao Nula no existe nenhuma relao entre as variveis.

UniverCidade 115 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________


140 120 100 80 60 40 20 0 0 20 40 60 80 100

Existem casos em que a relao entre as variveis considerada no linear, ou seja, no se aproxima de uma linha reta, como por exemplo:

180 160 140 120 100 80 60 40 20 0 0 20 40 60 80 100 120

Muitas vezes, mesmo que no se disponha dos dados, possvel que sejam interpretadas as correlaes entre duas variveis. Identifique o tipo de correlao entre as seguintes variveis: a) preo de um produto e a quantidade consumida do produto; b) nmero de horas de estudo e mdias do aluno; c) horas de treinamento e produtividade.

As solues so: a) forte correlao negativa; b) correlao positiva fraca; c) correlao positiva fraca.

UniverCidade 116 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

A denominao forte e fraca poder ser muito afetada em razo de questes pessoais e pode ser afetada pela construo inadequada do diagrama de disperso. A estatstica possibilita a anlise atravs da determinao de um coeficiente que indique como as variveis X e Y esto se correlacionando. 5.3 Coeficiente de Correlao ( r ) O coeficiente de correlao uma medida do grau de associao linear entre duas variveis. Seu valor varia entre 1 e 1.

Esquematizando:

-1

Quanto mais prximo de 1, mais negativa ser a correlao entre as variveis. Para os valores compreendidos entre 0 e 0,5, diz-se que h fraca correlao negativa. Para os valores menores do que 0,5, inclusive, diz-se que h forte correlao negativa. Quanto mais prximo de 1, mais positiva ser a correlao entre as variveis. Para os valores compreendidos entre 0 e 0,5, diz-se que h fraca correlao positiva. Para os valores maiores do que 0,5, inclusive, diz-se que h forte correlao positiva. Se o valor de r for igual a zero, diz-se que no h correlao entre as variveis.

UniverCidade 117 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Se o valor for igual a 1, diz que h correlao negativa perfeita entre as variveis. Se o valor for igual a 1, diz-se que h correlao positiva perfeita entre as variveis. O clculo da correlao implica na utilizao de uma frmula, denominada de coeficiente de correlao momento-produto de Pearson, um tanto complexa para o nosso nvel de estudos, conforme pode ser verificado:

r=

n xy ( x)( y ) {n( x 2 ) ( x) 2 }x{n( y 2 ) ( y ) 2

Onde n representa o nmero de pares de dados. Entretanto pode-se recorrer ao Microsoft Excel para o clculo do Coeficiente de Correlao. Seja o exemplo: Foi efetuado um levantamento sobre a renda das famlias dos alunos de uma escola e o nmero de filhos de cada famlia, o que possibilitou a construo da tabela abaixo:

Famlias A B C D E F G H I J

Renda (R$) 1.500,00 1.800,00 1.200,00 3.800,00 4.300,00 1.700,00 2.000,00 3.400,00 1.800,00 3.400,00

N de Filhos 5 4 3 1 2 3 2 2 4 1

Qual ser a correlao entre a renda familiar e o nmero de filhos destas famlias?

UniverCidade 118 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Pode-se inicialmente visualizar, atravs da construo do diagrama de disperso se h correlao positiva ou negativa.

6 5 4 3 2 1 0 0,00

1.000,00

2.000,00

3.000,00

4.000,00

5.000,00

Visualiza-se uma correlao negativa, ou seja, possvel verificar que o nmero de filhos diminui medida em que aumenta a renda. Mas qual ser o coeficiente de correlao? Utilizando o Microsoft Excel

1 Digite os dados da tabela

UniverCidade 119 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 2 Selecione, com o mouse, na Barra de Ferramentas

fx .

Na caixa de

dilogo selecione do lado esquerdo Estatstica e do lado direito CORREL;

3 Clique OK;

UniverCidade 120 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 4 Na caixa de dilogo, clique com o boto esquerdo do mouse, no cone colorido da linha Matriz 1;

4 Selecione os valores da coluna Renda, clicando com o mouse (boto esquerdo) sobre o primeiro valor e arrastando at o ltimo valor. Clique outra vez sobre o cone colorido que aparece na tela (aps a linha em branco);

UniverCidade 121 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ 4 Na caixa de dilogo, clique com o boto esquerdo do mouse, no cone colorido da linha Matriz 2. Selecione os valores da coluna Filhos, clicando com o mouse (boto esquerdo) sobre o primeiro valor e arrastando at o ltimo valor. Clique outra vez sobre o cone colorido que aparece na tela (aps a linha em branco).

5 Clique OK.

UniverCidade 122 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________

O valor 0,749981433 indica forte correlao negativa entre as variveis. Desta forma pode-se afirmar que a renda familiar influencia negativamente o nmero de filhos das famlias, ou seja, quanto maior for a renda das famlias, menor ser o nmero de filhos, para a amostra analisada. Uma outra forma de ser efetuada a anlise do coeficiente de correlao multiplicar o resultado por 100, onde o resultado ser identificado por intermdio de porcentagem. No exemplo, -0,75 (j arredondando o valor), multiplicado por 100 igual a - 75. Logo, - 75 %. Interpreta-se da seguinte maneira: a renda das famlias influencia de maneira inversa o nmero de filhos das famlias em 75 %.

UniverCidade 123 Estatstica Aplicada - Prof. Clio Cayres ___________________________________________________________________________________ Referncias: DA SILVA, Ermes Medeiros, et al. Estatstica 1 2. ed. So Paulo : Atlas, 1996. MARTINS, Gilberto de Andrade;DONAIRE, Denis. Princpios de estatstica. So Paulo : Atlas, 1979. LEVINE, David M.; BERENSON, Mark L.; STEPHAN, David. Estatstica:teoria e aplicaes usando Microsoft Excel em portugus. Rio de Janeiro : LTC, 2000. SPIEGEL, Murray Ralph. Estatstica. 2. ed. So Paulo : McGraw-Hill do Brasil, 1985. TOLEDO,Geraldo Luciano;OVALLE,Ivo Izidoro.Estatstica Bsica. 2. ed. So Paulo : Atlas, 1985. BUSSAB, Wilton de ;MORETTIN, Pedro A. Estatstica Bsica. 5. ed. So Paulo : Saraiva, 2005. TRIOLA, Mario F. Introduo Estatstica. 7. ed. Rio de Janeiro : LTC, 2004. PEREIRA, Wilson;TANAKA,Oswaldo K. Elementos de Estatstica. So Paulo : McGraw-Hill do Brasil, 1984.