Вы находитесь на странице: 1из 8

ENSINO DA CORRELAO DE POSTOS NO ENSINO MDIO Antonio Carlos Fonseca Pontes acfpontes@yahoo.com.

br Universidade Federal do Acre

RESUMO Dentre os procedimentos estatsticos, um dos mais populares a correlao linear, em que so estudadas duas variveis medidas em um nico indivduo concomitantemente. Tal popularidade se justifica em funo do possvel relacionamento existente entre caractersticas num mesmo indivduo. Entretanto, o coeficiente de correlao linear de Pearson, que o procedimento mais conhecido para a obteno desse tipo de relacionamento, nem sempre adequado, especialmente quando uma ou ambas as variveis so medidas em escala ordinal. Nessas situaes, o coeficiente de correlao de Spearman mais adequado por levar em considerao a ordem dos dados e no o seu valor intrnseco. Ainda, quando os dados obtidos das variveis no aderem distribuio normal devido, por exemplo, presena de valores discrepantes (outliers), o coeficiente de correlao de Spearman um bom substituto para a verificao do inter-relacionamento das variveis consideradas. O coeficiente de correlao de Spearman simples de calcular e de fcil compreenso, especialmente quando o nmero de pares de dados (ou indivduos) pequeno. Neste trabalho busca-se incentivar a introduo de novas metodologias estatsticas no ensino mdio, especificamente do coeficiente de correlao de Spearman, fortalecendo e enriquecendo o conhecimento dos alunos e professores do ensino mdio e trazendo, ainda que de forma incipiente, um pouco da realidade cotidiana para a sala de aula.

Palavras-chave: estatstica no-paramtrica, anlise combinatria, coeficiente de correlao de Spearman.

ABSTRACT Amongst the statistical procedures, one of the most popular is the linear correlation, where two variables measured in a single individual are studied concomitantly. Such popularity if justifies in function of the possible existing relationship between characteristics in one same individual. However, the Pearson linear correlation coefficient, that it is the known procedure more for the attainment of this type of relationship, nor always it is adjusted, especially when one or both variables is measured in ordinal scale. In such situations, the Spearman correlation coefficient is more adequately by taking in consideration the order of the data and not it its intrinsic value. Still, when the gotten data of the variable do not adhere to the normal distribution due, for example, to the presence of outliers, the Spearman correlation coefficient is a good substitute for the verification of the inter-relationship of the considered variables. The Spearman correlation coefficient is simple to calculate and easy to understanding, especially when the number of pairs of data (or individuals) is small. This work search to stimulate the introduction of new statistical methodologies in average education, specifically the Spearman correlation coefficient, fortifying and enriching the knowledge of the students and professors of average education and bringing, despite of incipient form, a little of the daily reality for the classroom. Key words: nonparametric statistic, combinatorial analysis, Spearmans correlation coefficient.

1.

INTRODUO A correlao entre duas variveis, medidas num mesmo indivduo, calculada com o intuito de

verificar se existe inter-relacionamento entre essas variveis. Padronizou-se que tal medida deve estar no intervalo fechado de -1 a 1, em que -1 indica perfeita correlao negativa ou inversa e 1 indica perfeita correlao positiva ou direta. A correlao negativa indica que o crescimento de uma das variveis implica, em geral, no decrescimento da outra. A correlao positiva indica, em geral, o crescimento ou decrescimento concomitante das duas variveis consideradas. Por exemplo, pode-se desejar saber se existe alguma relao entre pares de variveis como peso e altura de pessoas, populao e rea de pases ou municpios, notas de alunos em disciplinas diferentes, peso e presso sistlica, idade e nveis de colesterol, dentre outros. A correlao obtida atravs do coeficiente de Pearson, que a medida de correlao mais conhecida, linear. Assim, nos casos em que a relao entre as variveis seja no linear (quadrtica, cbica, exponencial, etc.), ela no ser medida adequadamente. Nesses casos os dados devem ser transformados para a obteno da medida adequada. O outro coeficiente de correlao utilizado, o de Spearman, por realizar uma transformao de postos, pode ser utilizado nas situaes em que a relao entre os pares de dados no linear.

2.

METODOLOGIA

2.1

Generalidades Manualmente, ou com o auxlio de ferramentas computacionais, possvel classificar os dados

de uma amostra x1, x2,...,xn-1, xn em ordem crescente. Os dados, ordenados dessa forma, formam uma seqncia denotada por x(1), x(2),...,x(n-1), x(n) , onde os parntesis no subscrito indicam ordem. De modo formal, dizemos que x(1), x(2),...,x(n) so as chamadas estatsticas de ordem da amostra x1, x2,...,xn e x(i) indica a i-sima estatstica de ordem, ou seja, a i-sima observao ordenada. Com base nessa ordenao pode-se definir o posto ou rank de uma observao. Em geral tem-se que o posto de x(i) igual a i, ou seja, o posto dado pelo subscrito da estatstica de ordem. Obviamente que esta definio refere-se aos postos crescentes. No caso de postos decrescentes, possvel obt-los atravs de diferena, ou seja, dados n dados ordenados, o posto decrescente da observao que ocupa o i-sima posio quando se consideram os postos crescentes, dada por

POSTO DECRESCENTE = n POSTO CRESCENTE + 1 = n i + 1 Teoricamente, observaes empatadas, ou seja, que tm valores iguais, no ocorrem. Na prtica, entretanto, tais situaes so comuns e nesse caso, valores equivalentes devem ter postos iguais. Uma maneira encontrada para solucionar tais problemas considerar, para os casos em que haja empates, a mdia dos postos. Assim, quando duas observaes, que teriam supostamente os postos k e k+1 forem iguais, considera-se a mdia desses postos para ambas. Assim o posto para essas observaes seria igual a [k+k+1]/2 = k+1/2. Procedimento equivalente feito se h trs ou mais observaes empatadas. A discusso sobre estatsticas de ordem especialmente til na definio e aplicao de testes no-paramtricos, em que os dados originais so substitudos por seus respectivos postos. Os testes no-paramtricos so poderosos substitutos dos testes paramtricos, especialmente nos casos em que as amostras so pequenas, naqueles em que a distribuio dos dados no normal ou ainda quando dados discrepantes (outliers) ocorrem. Dentre as tcnicas no-paramtricas, o coeficiente de correlao de Spearman (rs) uma das mais conhecidas e utilizadas na prtica. Esse coeficiente utilizado em substituio ao coeficiente de correlao de Pearson (r) nos casos em que a binormalidade dos dados no ocorre e ainda em situaes envolvendo poucos pares de dados.

2.2

Definies e valores mximo e mnimo Dadas duas variveis, X e Y, cujos valores so Xi e Yi, i = 1, 2, ..., n, pode-se buscar relacionar

essas variveis mediante o uso do coeficiente de correlao. O coeficiente de correlao linear de Spearman, conhecido como o coeficiente de correlao de postos, equivale ao coeficiente de correlao de Pearson adaptado a dados transformados em postos de acordo com a transformao de Wilcoxon. A atribuio de postos, nesse caso, feita separadamente para cada uma das variveis. Assim, para a varivel X atribui-se o posto 1 menor varivel, posto 2 segunda menor varivel e assim por diante, at o posto n para a maior varivel. O mesmo procedimento feito para a varivel Y, independente dos valores da varivel X. Os empates so tratados como usualmente, ou seja, valores iguais de cada uma das variveis devem receber o mesmo posto. Assim, se X(k) = X(k+1), ou seja, os valores de ordem k e de ordem k + 1 esto empatados, para ambos atribui-se o posto k k 1 2 2k 1 / 2 k 1 / 2 . O coeficiente de correlao de postos (Spearman) dado por

rS 1

6 i 1 di2
n

n3 n

em que di rX i rYi , com rX i e rYi variam de 1 a n.

O valor mximo para o coeficiente de correlao de Spearman (rS = 1) ocorre quando todos os valores de di so nulos, ou seja, quando os postos das variveis X e Y so iguais para cada um dos indivduos. O valor mnimo obtido quando a soma dos quadrados das diferenas mxima e igual a
n3 n e portando, rS = -1. Tais resultados servem para o professor verificar a veracidade da afirmao 3

de que o coeficiente de correlao de postos varia de -1 (maior correlao negativa) e 1 (maior correlao positiva). A correlao negativa ocorre quando h uma inverso dos valores dos postos da varivel Y em relao varivel X. A correlao positiva ocorre se os postos das duas variveis seguem aproximadamente o mesmo padro. A obteno de coeficientes de correlao de postos com valores prximos de zero sugerem a no existncia de correlao linear entre as duas variveis. O coeficiente de correlao de postos (Spearman) nada mais que o coeficiente de correlao linear de Pearson aplicado aos postos dos dados, obtidos independentemente para cada varivel. Uma diferena que deve ser observada que os valores 1 ou -1 para o coeficiente de correlao de Spearman no so raros de ocorrer na prtica. No caso do coeficiente de correlao de Pearson, para que ele seja igual a 1 ou -1, a varivel Y deve ser funo linear da varivel X.

2.4

Testes para o coeficiente de correlao de Spearman Para realizar testes de hipteses sobre o coeficiente de correlao de postos, em geral utiliza-se

o procedimento assinttico aplicado ao coeficiente de correlao de Pearson. Entretanto, tais procedimentos no so adequados quando o nmero de pares de variveis pequeno. Nesses casos, possvel se obter o nvel de significncia (valor-p) exato para o coeficiente obtido ou ainda utilizar testes de permutao aleatrios para a obteno de valores-p aproximados, nos casos em que o nmero de possveis permutaes grande. Uma das variveis (por exemplo, X) pode ser ordenada e fixada, com valores inteiros variando de 1 a n (se no houver empates), enquanto que a outra (digamos, Y) permutada. Assim, existem n! possveis de combinaes de postos entre X e Y. Sabe-se que o valor da soma das postos, para qualquer das variveis, fixo e igual a n(n+1)/2. Assim, fixados n-1 valores, o n-simo pode ser obtido por diferena. Assim, possvel diminuir o nmero de pareamentos possveis para (n-1)!. Para cada permutao, so obtidas as diferenas di e seus respectivos quadrados (di2). Sabe-se ainda que a soma das diferenas nula ( i 1 di 0 ) e esse fato pode ser utilizado para a checagem dos resultados. Os
n

outros valores necessrios para o clculo do coeficiente so fixos.

3.

EXEMPLOS DE APLICAO Em sala de aula, so vrios os exemplos em que o coeficiente de correlao pode ser utilizado,

abordando situaes (dados) cotidianas. Assim, pode-se calcular o coeficiente de correlao existente entre a altura e o peso dos alunos, entre as notas dos discentes em provas de disciplinas diferentes, entre o nmero de horas de estudo e a nota obtida, entre as idades do pai e a idade da me dos alunos, entre as preferncias de cada aluno pelas disciplinas ofertadas e suas respectivas notas, dentre outros. Outros exemplos podem ser buscados em situaes do dia-a-dia, como, por exemplo, entre o preo de determinados produtos e o nmero de famlias possuidores daquele tipo de produto, entre a rea construda da residncia e o nmero de membros da famlia, etc. Muitas outras situaes podem ser criadas pelos professores, envolvendo outros assuntos que estejam sendo estudados pelos alunos nas diversas disciplinas como, por exemplo, a populao e a rea ou o IDH (ndice de desenvolvimento humano) e a renda per capita de pases, nvel de renda e incidncia de doenas em cidades, nmero de habitantes e nmero de eleitores em determinadas cidades, dentre outros. Basta simplesmente tomar duas variveis que, supostamente, sejam relacionadas para verificar a eficcia desse tipo de coeficiente e exemplificar sua utlizao. Pontes (2003) apresenta as notas mdias de cinco juzes para a preocupao ambiental de 27 produtores rurais do Assentamento Sumar II. Detalhes sobre a maneira de obteno dessas notas podem ser obtidos no trabalho original. Para exemplificar o mtodo aqui apresentado, foram tomadas as notas dos cinco juzes para os seis primeiros moradores, conforme o Quadro 1. Quadro 1. Notas e postos de cinco juzes para seis famlias do Assentamento Sumar II. CASA 1 2 3 4 5 6 JUIZ 1 JUIZ 2 JUIZ 3 JUIZ 4 JUIZ 5 IREci1 Postos IREci2 Postos IREci3 Postos IREci4 Postos IREci5 Postos 3,83 4,26 2,12 3,34 3,67 4,37 4 5 1 2 3 6 2,67 4,52 1,50 2,19 4,63 2,59 4 5 1 2 6 3 2,92 4,56 1,69 2,42 4,48 3,11 3 6 1 2 5 4 2,05 4,29 1,53 2,01 4,75 4,00 3 5 1 2 6 4 3,42 3,69 3,24 3,36 3,80 3,63 3 5 1 2 6 4

A partir do Quadro 1 so obtidos os dez (C5,2) coeficientes de correlao de Spearman (Quadro 2) entre as notas dos cinco juzes. Observa-se que os coeficientes de correlao de Pearson, mais utilizados em trabalhos, no so vlidos nos casos em que o nmero de pares de dados pequeno ou ainda quando os valores a serem comparados so arbitrrios e no resultantes de medidas. No exemplo, as notas tiveram como finalidade a ordenao das famlias em funo da sua preocupao ambiental.

Quadro 2. Valores do coeficiente de correlao de Spearman e seus respectivos valores-p. Pares de Juizes Coeficiente Valor-p 1e2 1e3 1e4 1e5 2e3 2e4 2e5 3e4 3e5 0,486 0,714 0,600 0,600 0,886 0,943 0,943 0,943 0,943 0,329 0,111 0,208 0,208 0,019 0,005 0,005 0,005 0,005 4e5 1,000 < 0,001

Os valores-p obtidos no quadro referem-se ao teste do coeficiente de correlao linear de Pearson aplicado aos postos dos dados. Esses valores definem se duas variveis so ou no correlacionadas do ponto de vista estatstico. Em geral, se esse valor for menor que 0,05, considera-se que a correlao entre as variveis trabalhadas significativa. Se esses valores no forem obtidos de forma correta, as concluses no sero vlidas. Observa-se que o valor do coeficiente igual a 1 s ocorre se os postos das variveis forem todos coincidentes. Isso s ocorre de uma maneira e assim, o valor-p igual a 1/720 = 0,001389.

Tabela 1. Valores do coeficiente de correlao de postos e valores-p. Rs -1,00 -0,90 -0,80 -0,70 -0,60 -0,50 -0,40 -0,30 -0,20 -0,10 0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00 Contagem 1 4 3 6 7 6 4 10 6 10 6 10 6 10 4 6 7 6 3 4 1 120 Contagem Acumulada 1 5 8 14 21 27 31 41 47 57 63 73 79 89 93 99 106 112 115 119 120 % 0,83 3,33 2,50 5,00 5,83 5,00 3,33 8,33 5,00 8,33 5,00 8,33 5,00 8,33 3,33 5,00 5,83 5,00 2,50 3,33 0,83 100,00 % Acumulado 0,83 4,17 6,67 11,67 17,50 22,50 25,83 34,17 39,17 47,50 52,50 60,83 65,83 74,17 77,50 82,50 88,33 93,33 95,83 99,17 100,00

O valor 0,943 ocorre se houver inverso dos postos entre valores contguos (1 e 2, 2 e 3, 3 e 4, 4 e 5, 5 e 6) e apenas essa inverso ocorrer, com os demais pares sendo iguais. Isso ocorre apenas cinco vezes entre as 720 permutaes, ou seja, o valor-p nesse caso
Valor p 5 1 6 0 ,00833 720 720 720

4.

CONCLUSES O coeficiente de correlao de Spearman, conhecido como coeficiente de correlao de postos

pode ser utilizado no ensino mdio, como um elemento de aprendizado dentro do tema anlise combinatria. O clculo desse coeficiente simples, de fcil entendimento e as permutaes necessrias para a obteno da distribuio nula podem ser obtidas sem grandes esforos. Por outro lado, as discusses que podem ser feitas a partir dos resultados obtidos com dados sociais, econmicos e de outras reas, especialmente das cincias sociais aplicadas, tendem a enriquecerem as discusses em sala de aula. Discusses temticas, com a abordagem de temas sociais nas aulas de matemtica podem ser teis para a transformao social que se busca na formao de cidados que tenham interesses e conhecimentos variados. Nenhum conhecimento matemtico novo necessrio para que tal finalidade seja alcanada. Assim, o conhecimento bsico de conceitos matemticos do ensino mdio suficiente para a aplicao dos conceitos aqui apresentados.

5.

BIBLIOGRAFIA

CHEN, P.Y.; POPOVICH, P.M. Correlation: parametric and nonparametric measures. Thousand Oaks: Sage Publication, Inc. 95p. KENDALL, M. Rank correlation methods. London: Charles Griffin & Company LTD. 202 p. PCN Ensino Mdio. Cincias da Natureza, Matemtica e Suas Tecnologias. Braslia, p.04-11;42-45, 1999. PONTES, A.C.F. Obteno dos nveis de significncia para os testes de Kruskal-Wallis, Friedman e comparaes mltiplas no-paramtricas. Piracicaba, 2000. 140p. Dissertao (M.S.) - Escola Superior de Agricultura "Luiz de Queiroz", Universidade de So Paulo. PONTES, A.C.F.; CORRENTE, J.E. The use of nonparametric contrasts in one-way layouts and random block designs. Journal of Nonparametric Statistics, v.17, n.3, p.335-346, 2005. PONTES, L.O.- Agricultura Familiar: Recuperao e Valorao da Floresta no Assentamento Rural de Sumar II. Dissertao (MS), ESALQ/USP, Piracicaba, 2003.

Вам также может понравиться