Artigo - Avaliação de Testes de Normalidade

Seo de Bioestatstica
Normalidade de variveis: mtodos de verificao e

comparao de alguns testes no-paramtricos por
simulao
Normality of variables: diagnosis methods and
comparison of some nonparametric tests by
simulation
Vanessa Bielefeldt Leotti Torman1,2, Rodrigo Coster2, Joo Riboldi1
RESUMO
Introduo: Os principais testes estatsticos tm como suposio a normalidade dos dados, que Revista HCPA. 2012;32(2):227-234
deve ser verificada antes da realizao das anlises principais.
1
Departamento de Estatstica,
Objetivo: Revisar as tcnicas de verificao da normalidade dos dados e comparar alguns testes de
Instituto de Matemtica,
aderncia normalidade para diferentes distribuies de origem e tamanho amostral.
Universidade Federal do Rio
Metodologia: Atravs da simulao de cinco distribuies (Normal, t-student, Qui-Quadrado, Grande do Sul, UFRGS.
Gama e Exponencial) e seis tamanhos amostrais (10, 30, 50, 100, 500 e 1000) foram simulados
5000 amostras de cada par distribuio-tamanho amostral e realizados os testes Qui-quadrado, 2
Unidade de Bioestatstica,
Kolmogorov-Smirnov, Lilliefors, Shapiro-Wilk, Shapiro-Francia, Cramer-von Mises, Anderson- Grupo de Pesquisa e Ps-
Darling e Jarque-Bera. Graduao, Hospital de Clnicas de
Porto Alegre.
Resultados: Os resultados obtidos mostram uma clara superioridade dos testes Shapiro-Francia e
Shapiro-Wilk, com percentuais de acerto de 72,41% e 72,15%, respectivamente. Entre os piores
Contato:
resultados encontramos o Kolmogorov-Smirnov e Qui-Quadrado, com percentual de acerto de
Vanessa Bielefeldt Leotti Torman
44,78% e 61,58%, respectivamente.
vanessa.leotti@ufrgs.br
Concluses: Para amostras pequenas recomenda-se que sejam utilizados procedimentos no Porto Alegre, RS, Brasil
paramtricos diretamente para a anlise, em funo da baixa performance dos testes de aderncia
normalidade, dado o baixo percentual de acertos. Para amostras maiores, recomenda-se o uso
dos testes Shapiro-Francia ou Shapiro-Wilk.
Palavras-chave: Distribuio normal; teste de aderncia; Qui-quadrado; Kolmogorov-Smirnov;
Lilliefors; Shapiro-Wilk; Shapiro-Francia; Cramer-von Mises; Anderson-Darling; Jarque-Bera;
poder; erro tipo I
ABSTRACT
Background: The main statistical tests have the normality assumption that must be verified before
performing the main analyzes.
Objective: To review the techniques of testing for normality of data and compare some adherence
tests for different true distributions and sample size.
Method: Through simulation of five distributions (Normal, t-Student, Chi-Square, Gamma and
Exponential) and six sample sizes (10, 30, 50, 100, 500 and 1000) were simulated 5000 samples
of each pair sample size-distribution and applied the Chi-square, Kolmogorov-Smirnov, Lilliefors,
Shapiro-Wilk, Shapiro-Francia, Cramer-von Mises, Anderson-Darling and Jarque-Bera tests.
Results: The results show a clear superiority of the Shapiro-Francia and Shapiro-Wilk tests, with
percentages of accuracy of 72.41% and 72.15% respectively. Among the worst results we find
the Kolmogorov-Smirnov and Chi-Square, with percentage of accuracy of 44.78% and 61.58%
respectively.
http://seer.ufrgs.br/hcpa Rev HCPA 2012;32(2) 227

Torman et al
Conclusions: For small samples it is recommended to use non-parametric procedures directly

for the analyzes, due to the low performance of the tests of adherence to normality, given the
low percentage of accuracy. For larger samples, we recommend the use of the Shapiro-Francia
and Shapiro-Wilk tests.
Keywords: Normal distribution; godness-of-fit tests; chi-square; Kolmogorov-Smirnov; Lilliefors;
Shapiro-Wilk; Shapiro-Francia; Cramer-von Mises; Anderson-Darling; Jarque-Bera; power; type I error
Toda varivel aleatria, seja idade de um grupo de pessoas Assim, importante termos mtodos para verificar se
ou a ocorrncia de um determinado desfecho, assume uma distribuio dos dados que estamos estudando se ajusta a
determinada distribuio de frequncias na populao, uma distribuio normal. H metodologias descritivas, como
que podem ter formas variadas (1). Na literatura estatstica a anlise visual de alguns grficos, e tambm testes no-
encontra-se muitas distribuies tericas. Essas so modelos paramtricos de aderncia, que testam objetivamente a
que procuram representar o comportamento de determinado hiptese de normalidade. Este artigo pretende revisar essas
evento em funo da frequncia de sua ocorrncia. No caso das metodologias existentes e comparar o desempenho de alguns
variveis contnuas, esse evento ser um intervalo de valores. testes no-paramtricos por simulao.
As distribuies de frequncias so, na verdade, distribuies
Cumpre ressaltar que os testes t de Student so classificados
de probabilidade, onde para um evento teremos uma
como testes paramtricos porque exigem uma distribuio
probabilidade de ocorrncia associada. Em outras palavras, a
de probabilidade especfica para a varivel aleatria, no
partir de uma distribuio de probabilidade completamente
caso a distribuio Normal. Entretanto, existem outras
especificada, pode-se calcular a probabilidade de uma varivel
tcnicas paramtricas que suportam outras distribuies
aleatria assumir determinado intervalo de valores.
de probabilidade. Assim, quando os dados no so normais,
Nesse artigo o objeto de estudo a mais conhecida tm-se pelo menos duas solues: a primeira procurar
distribuio de probabilidades: a distribuio Normal ou outro teste paramtrico cuja distribuio de probabilidade
Gaussiana. A suposio de normalidade da(s) varivel(is) assumida se ajuste melhor aos dados; a segunda usar testes
aleatria(s) exigida para a realizao de muitos mtodos de no-paramtricos, como o teste de Mann-Whitney, que no
inferncia estatstica, tais como: fazem pressuposio sobre a distribuio dos dados. Como
nos programas estatsticos mais conhecidos, como o SPSS,
- No caso de uma amostra de uma nica populao, a
os outros testes paramtricos no esto implementados,
suposio de normalidade exigida quando deseja-se obter
usualmente a segunda opo adotada. Assim, a classificao
intervalo de confiana ou executar teste de hiptese sobre a
de paramtrico ou no-paramtrico referente ao tipo de
mdia dessa populao baseados na estatstica t.
teste estatstico, e no varivel aleatria. No correto dizer
- No caso de duas amostras de populaes independentes, que uma especfica varivel paramtrica ou no-paramtrica.
para realizar o teste t de comparao de mdias para amostras
Na prxima sesso, os mtodos disponveis para a
independentes, necessrio que a varivel aleatria assuma
verificao da hiptese de normalidade sero revisados e o
distribuio normal em ambas as populaes (grupos).
estudo de simulao procedido ser descrito. Aps, tem-se
- No caso de duas amostras pareadas (ou relacionadas), a sesso que apresentar os resultados da simulao, e na
para utilizar o teste t de comparao das mdias, necessrio sequncia, as concluses do trabalho.
que a varivel aleatria da diferena entre as duas amostras
Mtodos
tenha distribuio normal.
O primeiro mtodo para verificao do formato da
- No caso de trs ou mais amostras de populaes
distribuio de uma varivel contnua a construo do
independentes, para comparamos as mdias das populaes
histograma. O histograma um grfico de barras justapostas em
atravs da Anlise de Varincia em classificao simples (One-
que no eixo horizontal est a varivel de interesse dividida em
Way ANOVA), entre outras suposies, tem-se que pressupor
classes e no eixo vertical a frequncia da classe correspondente
que a varivel aleatria tenha distribuio normal em cada
(2). Este grfico est disponvel na maioria dos programas
uma das populaes (grupos).
estatsticos. No SPSS verso 18.0, uma das maneiras de obter
- Na estimao da correlao linear de Pearson, o teste de esse grfico atravs do menu Analyze -> Descriptive Statistics ->
significncia do coeficiente de correlao somente vlido se Explore -> Plots marcando-se Histogram. Atravs do histograma,
ambas as variveis aleatrias tiverem distribuio Normal. buscamos verificar se a forma de sino da distribuio Normal
est presente.
- Nos modelos de regresso linear, uma das suposies de
que os resduos do modelo tenham distribuio Normal. Na Figura 1, tem-se dois exemplos de histogramas provenientes
228 Rev HCPA 2012;32(2) http://seer.ufrgs.br/hcpa

Normalidade de variveis: verificao e comparao
de amostras de tamanho 100, onde, na Figura 1-a tem-se forma simtrica da Normal est presente na Figura 1-a, mas
dados gerados de uma distribuio Normal, e na Figura 1-b, no na Figura 1-b, como esperado.
dados gerados de uma distribuio Gama. Verifica-se que a
Figura 1 - Exemplos de Histogramas
Outro grfico que pode ser utilizado para avaliar a solicitou o Histograma anteriormente.
normalidade de uma varivel o grfico Quantil-Quantil,
Na Figura 2, tem-se dois exemplos de Q-Q Plots
ou Q-Q Plot. Neste grfico, no eixo horizontal tem-se os
provenientes de amostras de tamanho 100, novamente
valores observados da varivel, e no eixo vertical, os valores
de dados gerados de uma distribuio Normal (Figura 2-a),
esperados caso a varivel tenha distribuio Normal. Se
e dados gerados de uma distribuio Gama (Figura 2-b).
h uma boa aderncia dos dados distribuio Normal os
Verifica-se que os pontos de aproximam bem da reta no
pontos esto prximos a reta de referncia apresentada no
caso da varivel com distribuio Normal, mas h um grande
grfico. No SPSS verso 18.0, obtm-se o Q-Q Plot marcando-
desvio para a varivel com distribuio Gama.
se Normality Plots with Tests, na mesma janela onde se
Figura 2 - Exemplos de Q-Q Plots

Torman et al
Os mtodos grficos citados anteriormente tm a programa R verso 2.15.0 (3), atravs das funes pearson.test,
desvantagem de serem subjetivos, pois dependem de ks.test, lillie.test, shapiro.test, sf.test, cvm.test, ad.test e jarque.
interpretao visual. Para um resultado mais objetivo, pode- beta.test, respectivamente. As funes ks.test e shapiro.test
se usar testes no-paramtricos de aderncia distribuio esto disponveis na instalao bsica do R, j a funo jarque.
Normal. Algum deles so: Qui-quadrado de Pearson (QQ), bera.test pertence ao pacote tseries (4) e as demais funes
Kolmogorov-Smirnov (KS), Lilliefors (LF) que apenas uma pertencem ao pacote nortest (5).
correo para o teste KS), Shapiro-Wilk (SW), Shapiro-Francia
Estes testes de aderncia tm estatsticas de teste e critrios
(SF), Cramer-von Mises (CM), Anderson-Darling (AD) e Jarque-
de deciso diferentes, entretanto tm em comum as hipteses
Bera (JB).
testadas: a hiptese de nulidade de que a varivel aleatria
Apenas os quatro primeiros testes citados esto disponveis adere distribuio Normal, contra a hiptese alternativa
no SPSS verso 18.0, sendo que o teste qui-quadrado de que a varivel aleatria no adere distribuio Normal.
bastante trabalhoso pois necessita que se classifique a varivel A maneira mais fcil de tomar a deciso observar o valor-p
manualmente, bem como o clculo das frequncias esperadas. dos testes e comparar com o nvel de significncia adotado.
O teste Kolmogorov-Smirnov pode ser obtido em Analyze -> Se o valor-p do teste for menor que o nvel de significncia
Nonparametric Testes -> Legacy Dialogs -> 1-Sample KS. Os escolhido, rejeita-se a hiptese de normalidade. Mais detalhes
testes de Lilliefors e Shapiro-Wilk so exibidos marcando-se sobre estes testes podem ser encontrados em (6) e (7).
Normality Plots with Tests, da mesma maneira utilizada para
Procedendo-se os testes de Lilliefors e Shapiro-Wilk para os
obter o Q-Q Plot. Todos os testes citados esto disponveis no
dados mostrados na Figura 1, tem-se os resultados do Quadro 1.
Quadro 1 - Sada do SPSS para os testes de normalidade.
Considerando um nvel de significncia de 5%, atravs do 3) Para cada distribuio e tamanho amostral, simulou-se
Quadro 1, percebe-se que tanto os dois testes no rejeitam 5000 amostras.
a hiptese de normalidade para a varivel com distribuio
Para analisar a eficincia dos testes foi averiguado o
Normal e rejeitam esta hiptese para a varivel com
percentual de vezes que a deciso correta foi tomada,
distribuio Gama. Entretanto, em algumas situaes os testes
utilizando 5% como nvel de significncia. Isto significa que
podem discordar na deciso estatstica. Zar (8) no recomenda
para a distribuio normal foi avaliado a proporo de no
o uso dos testes qui-quadrado e Kolmogorov-Smirnov, pois os
rejeies da hiptese de nulidade, isto , o complementar da
mesmos tm poder muito baixo, ou seja, em muitas situaes
probabilidade do erro tipo I, ou seja, a especificidade do teste,
onde os dados realmente no provm de uma distribuio
enquanto para as demais distribuies foi avaliada a proporo
normal, estes testes no conseguem rejeitar a hiptese de
de rejeies da hiptese de nulidade, ou seja, o poder ou
nulidade.
sensibilidade do teste. As simulaes foram procedidas no
Assim, torna-se interessante verificar o desempenho dos programa R 2.15.0.
mesmos atravs de simulao, para tentar identificar algum
Resultados do estudo de simulao
com melhor desempenho. Para tanto, procedeu-se um estudo
As funes densidades de probabilidade das distribuies
de simulao com a seguinte configurao:
no-normais simuladas, bem como a densidade da distribuio
1) Foram simuladas variveis de 6 distribuies diferentes: Normal com mesma mdia e varincia de cada uma dessas
Normal (0,1), Qui-quadrado (3), t-student (10), Gama (10,1/3) distribuies encontram-se na Figura 3. Percebe-se que a
e Exponencial (5). distribuio mais similar Normal (representada em vermelho
em todos os grficos) a t-student (10) e a mais discrepante
2) Para todas as variveis foram utilizados 6 tamanhos
a Exponencial (5).
amostrais distintos: 10, 30, 50, 100, 500 e 1000.

Figura 3 - Funes densidade das distribuies simuladas (em preto) e distribuio normal
com mesma mdia e varincia (em vermelho).
Os resultados obtidos nas simulaes foram sintetizados e (Jarque-Bera), conforme a Tabela 1. A dificuldade dos testes em
apresentados na Figura 4, Tabela 1 e 2. identificarem corretamente a falta de normalidade quando os
dados seguem a distribuio t-student se deve ao fato das duas
Na Figura 4 encontramos o percentual de acertos de cada
distribuies possurem densidades muito parecidas. Levando
teste para cada distribuio e tamanho amostral. Em relao s
em considerao todos os tamanhos amostrais, o teste que
amostras provenientes da distribuio Normal, percebe-se que
melhor identificou os dados provenientes da distribuio
o teste de Kolmogorov-Smirnov tem um comportamento no
t-student foi o Shapiro-Francia, com 39,26% de acertos, e nas
esperado em relao ao erro tipo I pois, mesmo realizando-se
distribuies restantes o teste Shapiro-Wilk obteve melhores
o teste com 5% de significncia, este no rejeitou a hiptese
resultados.
de normalidade em nenhuma amostra independentemente do
tamanho amostral. Com exceo desse teste, todos os demais Outro resultado importante que verifica-se na Tabela 1
parecem ter taxas de erro tipo I adequadas, prximas do o percentual total de acertos de cada teste, onde o teste de
valor nominal de 5%, pois o percentual de acerto foi prximo Shapiro-Francia obteve melhor percentual de acertos (72,41%),
do esperado (95%) para a maioria dos tamanhos amostrais seguido pelo teste Shapiro-Wilk, (72,15%). J entre os piores
considerados. Em relao s demais distribuies simuladas, resultados, encontram-se o teste Qui-quadrado (61,58%) e o
o teste Kolmogorov-Smirnov apresentou o menor poder KS (44,78%).
independentemente da distribuio para amostras menores
possvel perceber tambm que o desempenho dos testes
que 500, sendo portanto no recomendvel, concordando
pode ser muito ruim para tamanhos de amostrais pequenos.
com Zar (8).
Para as distribuies mais parecidas com a Normal (Gama e t),
Para a distribuio t-student os testes diferem bastante mesmo os melhores testes s conseguem ter poder acima de
mesmo para o maior tamanho amostral, tendo o percentual de 70% a partir de n=500.
acerto variado desde 1,72% (Kolmogorov-Smirnov) at 94,36%

Torman et al
Tabela 1 - Percentual de acerto dos testes para cada distribuio e tamanho amostral.

Figura 4 - Percentual de acerto em funo dos tamanhos amostrais.

Torman et al
Tabela 2 - Percentual de acerto dos testes para cada tamanho amostral.
Concluses comparou-se alguns deles atravs de simulao. Os resultados

do estudo de simulao procedidos permitem recomendar o
Neste trabalho buscou-se apresentar mtodos de
uso dos testes de Shapiro-Wilk e Shapiro-Francia. importante
verificao da normalidade de variveis, como os grficos
tambm salientar que o desempenho dos testes foi em geral
Histograma e Q-Q Plot. A anlise visual tem a desvantagem
muito ruim para tamanhos amostrais pequenos. Para amostras
de ser subjetiva e um mtodo mais objetivo a realizao de
de tamanho menor ou igual a 10, recomenda-se no proceder
testes no-paramtricos de aderncia distribuio Normal.
ao teste de normalidade e partir diretamente para uma
Como estes testes podem conduzir a concluses diferentes,
estratgia no-paramtrica de anlise.
Referncias
1. Callegari-Jacques SM. Bioestatstica Disponvel em: http://www.R-project. 6. Thode HC. Testing for normality. New
princpios e aplicaes. Porto Alegre: org/ York: Marcel Dekker; 2002.
Artmed; 2003.
4. Trapletti A, Hornik K. tseries: Time 7. DAgostino RB, Stephens MA.
2. Soares JF. Introduo estatstica Series Analysis and Computational Goodness-of-fit techniques. New York:
mdica. Belo Horizonte, MG: Finance. 2012. Disponvel em: http:// M. Dekker; 1986.
COOPMED; 2002. CRAN.R-project.org/package=tseries
8. Zar JH. Biostatistical analysis. Upper
3. Team RDC. R: A Language and 5. Gross J. nortest: Tests for Normality. Saddle River, N.J.: Prentice Hall; 1999.
Environment for Statistical 2012. Disponvel em: http://CRAN.R-
Computing. Vienna, Austria; 2011. project.org/package=nortest
Recebido: 16/02/2012
Aceito: 16/04/2012

Artigo - Avaliação de Testes de Normalidade

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Artigo - Avaliação de Testes de Normalidade

Загружено:

Авторское право:

Доступные форматы

Seo de Bioestatstica

Normalidade de variveis: mtodos de verificao e

http://seer.ufrgs.br/hcpa Rev HCPA 2012;32(2) 227

Conclusions: For small samples it is recommended to use non-parametric procedures directly

228 Rev HCPA 2012;32(2) http://seer.ufrgs.br/hcpa

Figura 1 - Exemplos de Histogramas

Figura 2 - Exemplos de Q-Q Plots

http://seer.ufrgs.br/hcpa Rev HCPA 2012;32(2) 229

Quadro 1 - Sada do SPSS para os testes de normalidade.

230 Rev HCPA 2012;32(2) http://seer.ufrgs.br/hcpa

http://seer.ufrgs.br/hcpa Rev HCPA 2012;32(2) 231

232 Rev HCPA 2012;32(2) http://seer.ufrgs.br/hcpa

Figura 4 - Percentual de acerto em funo dos tamanhos amostrais.

http://seer.ufrgs.br/hcpa Rev HCPA 2012;32(2) 233

Tabela 2 - Percentual de acerto dos testes para cada tamanho amostral.

Concluses comparou-se alguns deles atravs de simulao. Os resultados

234 Rev HCPA 2012;32(2) http://seer.ufrgs.br/hcpa

Вам также может понравиться