Вы находитесь на странице: 1из 10

UMA ABORDAGEM DOS TESTES NO-PARAMTRICOS COM UTILIZAO DO EXCEL

Arthur Alexandre Hackbarth Neto, Esp.


FURB Universidade Regional de Blumenau

Carlos Efrain Stein, Ms.


FURB Universidade Regional de Blumenau

1 Introduo Os testes estatsticos so fundamentalmente utilizados em pesquisas que tem como objetivo comparar condies experimentais. Existe uma srie de testes estatsticos que podem auxiliar as pesquisas. Os testes estatsticos fornecem um respaldo cientfico s pesquisas para que estas tenham validade e tenham aceitabilidade no meio cientfico. Os testes podem ser divididos em paramtricos e no-paramtricos. Conforme Callegari-Jacques (2003), nos testes paramtricos os valores da varivel estudada devem ter distribuio normal ou aproximao normal. J os testes no-paramtricos, tambm chamados por testes de distribuio livre, no tm exigncias quanto ao conhecimento da distribuio da varivel na populao. O interesse pelo estudo do presente trabalho deve-se ao crescente desenvolvimento das cincias. Verifica-se o emprego cada vez mais acentuado dos testes no-paramtricos em anlise estatstica em pesquisas seja, sobretudo, na rea das Cincias Sociais, nas Cincias Administrativas ensejando pesquisas de Marketing. Nas Cincias da Sade especialmente na Psicologia e Psiquiatria objetivando o estudo do comportamento humano e outros. A Estatstica no-paramtrica representa um conjunto de ferramentas de uso mais apropriado em pesquisas onde no se conhece bem a distribuio da populao e seus parmetros. Esse eventual desconhecimento da populao refora o estudo e a importncia da anlise de pesquisas atravs dos testes no-paramtricos. Neste trabalho optou-se pela planilha do Excel para o desenvolvimento dos principais testes no-paramtricos propiciando uma tima analise e interpretao dos dados. O Excel um software conhecido pela maioria dos pesquisadores e de fcil acesso. Cada teste foi desenvolvido em uma planilha atendendo a uma classificao segundo nvel de mensurao, nmero de amostras e relacionamento entre os grupos, conforme quadro de classificao encontrado em Siegel (1975).

Existem vrios softwares estatsticos tais como: Statistica, Statgraphics, SPSS, Minitab, SAS, SPHINX, WINKS, entre outros. No entanto, so softwares geralmente de custo elevado e envolvem um aprendizado especfico de usabilidade que exige um certo tempo para o seu aprendizado. De qualquer maneira, tanto o Excel como outros softwares estatsticos especficos necessitam de um grande conhecimento estatstico por parte do usurio. 2 Principais testes no-paramtricos Os testes no-paramtricos so classificados de acordo com o nvel de mensurao e o nmero de grupos que se pretende relacionar. O quadro abaixo apresenta uma viso geral dos principais testes no-paramtricos segundo Siegel (1975).
Quadro 1 Testes no-paramtricos Provas Estatsticas No-Paramtricas Nvel de Mensurao Duas amostras Uma amostra Prova Binomial Nominal Prova Quiquadrado de uma amostra Amostras relacionadas Amostras intependentes Prova de Fisher K amostras Amostras relacionadas Amostras intependentes Prova Qui-quadrado para k amostras independentes

Prova de Mc Prova Q de Prova Qui-quadrado Nemar Cochran para 2 amostras independentes Prova da Mediana Prova U de MannWhitney Prova dos Prova de Kolmogorovsinais Smirnov para 2 Prova de Friedman amostras Prova de Wilcoxon Prova de iteraes de Wald-Wolfowitz Prova de Moses para reaes extremas Prova de Walsh Prova de aleatoriedade de 2 amostras independentes

Ordinal

Prova de KolmogorovSmirnov para uma amostra Prova de iteraes para uma amostra

Prova de extenso da mediana Prova de KruskalWallis

Intervalar

Prova de aleatoriedade para pares

(Adaptado de Siegel, S.)

Em relao ao quadro apresentado acima o mini-curso enfoca a importncia dos testes noparamtricos mais utilizados em pesquisas tendo como objetivo as comparaes entre grupos. Entre eles destacam-se:

Teste de Wilcoxon Teste de Qui-quadrado Teste de Mann-Whitney Teste de Kruskal-Wallis 3 Conhecendo alguns testes no-paramtricos A seguir ser feita uma abordagem dos testes citados acima. Em cada teste sero apresentados: a classificao, os procedimentos e um exemplo prtico com as principais estatsticas obtidas atravs de planilhas pr-elaboradas pelos autores. 3.1 Teste de Wilcoxon O teste de Wilcoxon aplicado quando esto em comparao dois grupos relacionados e a varivel deve ser de mensurao ordinal. Procedimentos para a realizao do teste: a. Para cada par, determinar a diferena (d), com sinal. b. Atribuir postos a essas diferenas independentemente de sinal. Em caso de empates, atribuir a mdia dos postos empatados. c. Para cada posto atribuir o sinal + ou o sinal do d que ele representa. d. Obter o valor T que representa a menor das somas de postos de mesmo sinal. e. Determinar N que o total das diferenas com sinal. f. Se N 25, obter p atravs da distribuio binomial. N x Nx p = P( X k ) = p q x =0 x
k

g. Se N > 25, determinar a mdia e o desvio-padro aproximado da soma dos ranks dos postos. Em seguida, obter o valor de z calculado e o valor de z tabelado. Observa-se portanto, a utilizao da aproximao da distribuio binomial pela distribuio Normal.
T = N (N + 1) 4

T =

N (N + 1) (2 N + 1) 24

z=

T T T

z tab = z
2

h. Por ltimo, comparar o valor real com o valor terico de z. Se z calculado for menor que z tabelado no se pode rejeitar a hiptese nula.

Exemplo: A um grupo de alunos foram ministrados dois testes similares para verificar o aprendizado. O objetivo verificar se os dois testes apresentados so equivalentes. Os resultados dos testes esto no quadro abaixo. Observa-se que cada aluno realizou os dois testes.

Nmero de pontos obtidos pelos alunos

Teste A Teste B

50 49

60 58

65 60

70 70

55 55

65 62

80 75

Para a resoluo do teste contou-se com a ajuda de uma planilha do Excel. Podemos observar no quadro abaixo as diferenas dos escores de cada par, os postos das diferenas sem o sinal e os postos mdios com sinal.
Teste A 50 60 65 70 55 65 80 B 51 55 60 65 56 62 75 d -1 5 5 5 -1 3 5 |d| 1 5 5 5 1 3 5 Posto de d 1 4 4 4 1 3 4 Postos mdios -1,5 5,5 5,5 5,5 -1,5 3 5,5

Da mesma forma, obteve-se o valor T que representa a menor das somas de postos de mesmo sinal e o valor de N que o total das diferenas com sinal.
N= T= 7 3

Como a amostra apresenta N 25, obteve-se o valor de p pela distribuio binomial.


x= N= v<V= p= 2 7 28,57% 0,4530 Nmero de sinais de menor ocorrncia Nmero de casos que acusaram diferena Percentagem de sinais de menor ocorrncia Probabilidade bilateral de ocorrncia

Concluso: Como o valor p calculado ficou acima de 5%, no se pode rejeitar a hiptese nula, ou seja, os dois testes podem ser considerados equivalentes.

3.2 Teste de Qui-quadrado


O teste de Qui-quadrado aplicado quando esto em comparao dois ou mais grupos independentes no necessariamente do mesmo tamanho. A varivel deve ser de mensurao nominal. O teste Qui-quadrado no tem equivalente nos paramtricos. Procedimentos para a realizao do teste:

a. Enquadrar as freqncias observadas em uma tabela de contingncia k x r, utilizando as k colunas para os grupos e as r linhas para as condies. Para comparar dois grupos independentes tm-se k = 2 e para comparar k grupos tm-se k > 2. b. Obter a freqncia esperada de cada clula fazendo o produto dos totais marginais referentes a cada uma e dividindo-o pelo nmero total de observaes independentes (N). c. Obter o valor de Qui-quadrado calculado:

Em tabelas de contingncia 2 x 2:
- Se N < 20, deve-se utilizar a Prova Exata de Fisher; - Se 20 N 40 e nenhuma freqncia esperada menor que 5, utilizar Quical com correo de continuidade de Yates1; - Se N > 40, deve-se utilizar Quical com correo de continuidade de Yates;
N N A D B C 2 = ( A + B ) (C + D ) ( A + C ) (B + D )
2

QuiCal

Em tabelas de contingncia r x 2:
- Em tabelas r x 2 o teste Qui-quadrado pode ser aplicado somente se o nmero de clulas com freqncias esperadas inferior a 5 inferior a 20% do total de clulas e se nenhuma clula tem freqncia esperada inferior a 1. Se essas condies no so satisfeitas pelos dados na forma em que foram coletados originalmente, o pesquisador deve combinar categorias adjacentes de modo a aumentar as freqncias esperadas nas diversas clulas, conforme em Siegel (1975), pgina 124.

Qui Cal =
i =1 j =1

(O

ij

Eij ) Eij

Em tabelas de contingncia r x k:
- Em tabelas r x k, adotam-se os mesmos procedimentos como em uma tabela r x 2. Em todos os casos o nmero de graus de liberdade : gl = (r 1) (k 1) . d. Obter o valor de Qui-quadrado tabelado. Este valor pode ser obtido mediante a tabela da distribuio Qui-quadrado ou no Excel pela funo: =INV.QUI(;(k-1)*(r-1)). e. Por ltimo, comparar o valor real com o valor terico do teste. Se Qui calculado for menor que Qui tabelado no se pode rejeitar a hiptese nula.

A correo de continuidade de Yates utilizada apenas em tabelas 2 x 2.

Exemplo: Uma droga nova foi testada em 30 pacientes, outros 30 receberam placebo. Em 20 dos que receberam a droga melhoraram e apenas 10 dos que receberam placebo melhoraram. Verificar se a droga influenciou significativamente na melhora dos pacientes. O teste foi realizado atravs de uma planilha do Excel. Inicialmente as freqncias foram enquadradas em uma tabela de contingncia. Posteriormente utilizou-se a frmula do Qui-quadrado com correo de Yates para o clculo do valor real do teste (Qui calculado). Como pode ser visto a seguir, segue parte da planilha com o clculo das estatsticas do teste.
Freqncias Observadas A A B Total 20 10 30 B 10 20 30 Total 30 30 60
2

QuiCal

N N A D B C 2 = ( A + B ) (C + D ) ( A + C ) (B + D )

1. Tabela de Contingncia 2 x 2 = k= r= g.l. = 0,05 2 2 1 Colunas Linhas Degrees of freedom N= 60

Frmula com Correo de Yates Quical = Concluso: 5,40 Quitab = 3,84 Rejeita-se Ho p= H diferenas 0,02014

Portanto, podemos observar que, como o valor real do teste ficou acima do valor terico rejeita-se a hiptese nula. Ou seja, pode-se dizer que a nova droga teve uma melhora significativa na cura dos pacientes.

3.3 Teste de Mann-Whitney


O teste de Mann-Whitney aplicado quando esto em comparao dois grupos independentes e a varivel deve ser de mensurao ordinal. Procedimentos para a realizao do teste: a. Determinar os valores de n1 e n2. Em que n1 o nmero de casos no grupo menor e n2 o nmero de casos no grupo maior.

b. Dispor em conjunto os escores dos dois grupos, atribuindo o posto 1 ao escore que for menor algebricamente. Os postos variaro de 1 a N onde N = n1 + n2. s observaes empatadas atribuir a mdia dos postos correspondentes. c. Determinar o valor de U: U = n1 n2 +
n1 (n1 + 1) R1 onde R1 a soma dos postos do menor grupo. 2

d. Obter a mdia e o desvio padro dos postos para ento obter o valor de z calculado. U = n1 n2 2

n1 n2 N 3 N U = N ( N 1) 12 T
t3 t 12

z=

U U onde o somatrio de T (fator U

de correo: T) obtido atravs de: T =

e. Por ltimo, comparar o valor real com o valor terico de z. Se z calculado for menor que z tabelado no se pode rejeitar a hiptese nula. Exemplo: Com o objetivo de testar a eficincia de uma nova rao para engorda, dezoito ratos foram separados aleatoriamente em dois grupos. O primeiro grupo, formado por oito ratos, recebeu
G Repeties 1 2 3 4 5 6 7 8 9 10 A 120 130 122 140 130 125 128 110 r u p o B 122 113 144 150 113 123 162 152 125 130 s Postos ordenados A 4 11 5 14 11 8 10 1 B 5 2 15 16 2 7 18 17 8 11 Postos mdios A 4 12 5,5 14 12 8,5 10 1 B 5,5 2,5 15 16 2,5 7 18 17 8,5 12 Estatsticas A 8,38 67 8 min max U= U' = N= B 10,40 104 10 1 18 31 49 18 Mdia Soma nj

rao normal. O segundo grupo, de dez ratos, foi tratado com uma nova rao de engorda. Verifique atravs do teste de Mann-Whitney se houve um aumento de peso significativo a 5%.

Rao

Normal Nova

120 130 122 140 130 125 128 110 122 113 144 150 113 123 162 152 125 130

Para a resoluo utilizou-se a planilha do Excel. Segue abaixo parte da planilha com alguns clculos: Os postos ordenados, os postos mdios, o valor U entre outros. Em seguida, calcula-se a mdia, desvio padro, z calculado e z tabelado.
0,05 = Significance level Fator de correo de empates 3,5 T = 40 U =

U = z= ztab =

11,2139036 0,80 1,96

Concluso: Como o valor de z calculado menor que z tabelado, a 5%, no se pode rejeitar a hiptese nula. Ou seja, pelo teste de Mann-Whitney no se pode afirmar que houve aumento significativo na engorda dos ratos mediante a utilizao da nova rao. 3.4 Teste de Kruskal-Wallis O teste de Kruskal-Wallis aplicado quando esto em comparao trs ou mais grupos independentes e a varivel deve ser de mensurao ordinal. Procedimentos para a realizao do teste: a. Dispor, em postos, as observaes de todos os grupos em uma nica srie, atribuindo de 1 a N. b. Determinar o valor de R (soma dos postos) para cada um dos grupos de postos.
k R 12 j 3 (N + 1) N (N + 1) j=1 n j 2

c. Determinar Hcal (valor real do teste) atravs de: H Cal =

N3 N

d. O valor terico Quitab obtido atravs de uma tabela da distribuio de Qui-quadrado ou pelo Excel com a funo: =INV.QUI(;(k 1)). e. Por ltimo, comparar o valor real H com o valor terico de Quitab. Se H calculado for menor que Quitab tabelado no se pode rejeitar a hiptese nula. Exemplo: Trs mtodos de preveno de cries so testados em um grupo de 30 crianas. As crianas foram divididas em trs grupos igualmente, de maneira aleatria. Em cada grupo foi aplicado um mtodo de preveno de cries. No final do tratamento as crianas foram examinadas e observouse o nmero de dentes com cries que os mtodos no conseguiram evitar. Verificar atravs do teste de Kruskal-Wallis se h diferenas significativas, a 5%, para os mtodos.

Mtodo

A B C

1 1 2

0 1 1

2 0 2

1 1 2

2 2 3

1 1 2

2 1 2

1 0 2

1 1 1

0 1 1

Para a realizao do teste utilizou-se uma planilha do Excel. O quadro abaixo mostra os trs grupos A, B e C bem como a matriz dos postos ordenados e a matriz dos postos mdios.
T r a t a m e n t o s Matriz dos postos ordenados Matriz dos postos mdios

Repeties 1 2 3 4 5 6 7 8 9 10

A 1 0 2 1 2 1 2 1 1 0

B 1 1 0 1 2 1 1 0 1 1

C 2 1 2 2 3 2 2 2 1 1

A 5 1 20 5 20 5 20 5 5 1

B 5 5 1 5 20 5 5 1 5 5

C 20 5 20 20 30 20 20 20 5 5

A 12 2,5 24,5 12 24,5 12 24,5 12 12 2,5

B 12 12 2,5 12 24,5 12 12 2,5 12 12

C 24,5 12 24,5 24,5 30 24,5 24,5 24,5 12 12

Em seguida, obtm-se as estatsticas do teste. Os somatrios e as mdias dos postos dos grupos. O valor real do teste Hcal. O valor terico obtido levando-se em considerao os graus de liberdade, o nvel de significncia e utiliza a distribuio do Qui-quadrado. Por ltimo, a planilha utilizada para realizar o teste tambm calcula o valor p de significncia atravs da funo: =DIST.QUI(Hcal;(k-1)).
13,85 11,35 138,5 113,5 10 10 N= 30 0,05 = g.l. = 2 k= 3 CE = Correo de Empates = 4410 mdia = soma = nj = 21,30 213 10 Significance level Degrees of freedom FC = Fator de Correo = 0,83648498 Hcal = 8,27 Quitab = 5,99 p= 0,016037

Concluso: Como a estatstica Hcal ficou acima do Quitab, a 5%, rejeita-se a hiptese nula. Portanto, podemos afirmar que existem diferenas significativas entre os mtodos de preveno de cries.

4 Consideraes Finais
O trabalho realizado para este mini-curso foi de grande valia pois culminou num grande esforo por parte dos autores em apresentar alguns dos principais testes no-paramtricos para a comunidade de maneira mais simples e prtica. Do mesmo modo, as planilhas desenvolvidas no Excel, para o mini-curso, se mostraram bastante eficientes. Viabilizaram e facilitaram a aplicao dos testes no-paramtricos sem a necessidade de uso de softwares especficos de Estatstica, que so caros e de difcil acesso. Embora existam vrios testes no-paramtricos, os abordados neste trabalho ocorrem com maior incidncia em pesquisas. Normalmente so empregados testes que comparam dois grupos relacionados, dois grupos independentes ou testes que comparam mais de dois grupos independentes. 9

Para estes tipos de comparao apresentamos os testes: de Wilcoxon, Qui-quadrado, de Mann-Whitney e o teste de Kruskal-Wallis. So testes que apresentam um poder mais elevado e podem ser comparados com os paramtricos equivalentes: teste t e anlise de varincia. Exceto o teste Quiquadrado que no tem equivalente nos paramtricos. Outros testes no-paramtricos tambm foram desenvolvidos em planilhas pelos autores, tais como: teste binomial, teste de Mc Nemar, teste dos sinais, teste de Fisher, teste da mediana, teste de Cochran, teste de Friedman e teste de extenso da mediana. Alguns destes testes so de uso mais restrito em determinado tipo de pesquisa e so casos particulares de alguns dos testes de maior uso.

5 Referncias Bibliogrficas
BARBETTA, Pedro Alberto. Estatstica Aplicada s Cincias Sociais. 5 ed. Florianpolis: Editora da UFSC, 2002. CALLEGARI-JACQUES, Sidia M. Bioestatstica: Princpios e Aplicaes. Porto Alegre: Artmed, 2003. KAZMIER, Leonard J. Estatstica Aplicada Economia e Administrao. So Paulo: McGrawHill, 1982. LEVIN, Jack. Estatstica Aplicada a Cincias Humanas. 2 ed. So Paulo: Harbra, 1987. SIEGEL, Sidney. Estatstica No-paramtrica Para as Cincias do Comportamento. So Paulo: McGraw-Hill, 1975. SPIEGEL, Murray R. Estatstica. Rio de Janeiro : McGraw-Hill do Brasil, 1970. STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo: HARBRA, 1986.

10

Вам также может понравиться