Вы находитесь на странице: 1из 191

Rodolfo A. M.

Ambiel
Ivan SantAna Rabelo
Slvia Vernica Pacanaro
Gisele Aparecida da Silva Alves
Irene F. Almeida de S Leme
(Orgs.)

Avaliao
Psicolgica
Guia de consulta para estudantes e
profissionais de psicologia
Avaliao Psicolgica
guia de consulta para estudantes
e profissionais de psicologia
Avaliao Psicolgica
guia de consulta para estudantes
e profissionais de psicologia

Rodolfo A. M. Ambiel
Ivan SantAna Rabelo
Slvia Vernica Pacanaro
Gisele Aparecida da Silva Alves
Irene F. Almeida de S Leme
(Orgs.)

Casa do Psiclogo
So Paulo
2011
2011 Casapsi Livraria e Editora Ltda
proibida a reproduo total ou parcial desta publicao, para qualquer finalidade,
sem autorizao por escrito dos editores.

1a Edio
2011

Editores
Ingo Bernd Gntert e Juliana de Villemor A. Gntert

Reviso Tcnica
Rodolfo A. M. Ambiel, Ivan SantAna Rabelo, Slvia Vernica Pacanaro,
Gisele Aparecida da Silva Alves e Irene F. Almeida de S Leme

Preparao
Tssia Fernanda Alvarenga de Carvalho

Capa
Marina Takeda

Projeto Grfico e Editorao Eletrnica


Fabio Alves Melo

Dados Internacionais de Catalogao na Publicao (CIP)


(Cmara Brasileira do Livro, SP, Brasil)
Avaliao psicolgica : guia de consulta para estudantes e profissionais de
psicologia / Rodolfo A. M. Ambiel...[et al.] . -- So Paulo :
Casa do Psiclogo, 2011.

Outros organizadores: Ivan SantAna Rabelo, Slvia Vernica


Pacanaro, Gisele Aparecida da Silva Alves, Irene F. Almeida de S Leme.
Bibliografia.
ISBN 978-85-8040-071-7

1. Avaliao psicolgica 2. Psicometria 3. Testes psicolgicos


I. Ambiel, Rodolfo A. M. II. Rabelo, Ivan SantAna. III. Pacanaro, Slvia
Vernica. IV. Alves, Gisele Aparecida da Silva. V. Leme, Irene F. Almeida
de S.

11-04584 CDD-150.287
ndices para catlogo sistemtico:
1. Avaliao psicolgica 150.287

Impresso no Brasil

Reservados todos os direitos de publicao em lngua portuguesa

Casapsi Livraria e Editora Ltda.


Rua Santo Antnio, 1010
Jardim Mxico CEP 13253-400
Itatiba/SP Brasil
Tel. Fax: (11) 4524-6997
www.casadopsicologo.com.br
Sumrio

Prefcio Pg. | 7

Captulo 1 Pg. | 11
Da testagem Avaliao Psicolgica: aspectos histricos e perspectivas futuras
Rodolfo A. M. Ambiel
Slvia Vernica Pacanaro

Captulo 2 Pg. | 29
Panorama atual dos testes psicolgicos no Brasil de 2003 a 2011
Slvia Vernica Pacanaro
Gisele Aparecida da Silva Alves
Ivan SantAna Rabelo
Irene F. Almeida de S Leme
Rodolfo A. M. Ambiel

Captulo 3 Pg. | 49
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica
Rodolfo A. M. Ambiel
Josemberg Moura de Andrade
Lucas de Francisco Carvalho
Vicente Cassepp-Borges

Captulo 4 Pg. | 81
Teoria de Resposta ao Item na Avaliao Psicolgica
Felipe Valentini
Jacob Arie Laros
Captulo 5 Pg. | 109
Validade e preciso de testes psicolgicos
Gisele Aparecida da Silva Alves
Mayra Silva de Souza
Makilim Nunes Baptista

Captulo 6 Pg. | 129


Padronizao e normatizao de testes psicolgicos: simplificando conceitos
Ivan SantAna Rabelo
Leila Brito
Marcia Gabriel da Silva Rego

Captulo 7 Pg. | 163


A tica no uso de testes no processo de Avaliao Psicolgica
Maria Cristina Barros Maciel Pellini
Irene F. Almeida de S Leme

Sobre os autores Pg. | 181


Prefcio

O avano cientfico nas diferentes reas do saber pressupe


avaliao, exigindo esta avaliao instrumentos apropriados
para o efeito. A rplica da investigao em diferentes pases e
em amostras alargadas pressupe instrumentos geis, precisos
e vlidos. Neste sentido, em qualquer rea cientfica, funda-
mental o esforo dos pesquisadores na construo e validao de
novos instrumentos de medida. Na Psicologia, enquanto cincia
e profisso com responsabilidades sociais, esta avaliao assume
papel relevante na tomada de decises e, como tal, requer instru-
mentos de avaliao cientificamente aprovados. Em boa medida
a qualidade da pesquisa e da prtica em psicologia, em ambos os
casos sempre dependente da qualidade da informao ou dos resul-
tados que so recolhidos, encontra-se muito associada prpria
atualidade, qualidade, confiana e valor dos instrumentos usados.
Assim, apesar das crticas relativamente frequentes e universais,
algumas vezes justas, e outras vezes injustas, demasiadas vezes
incompreensivelmente oriundas do seio da prpria psicologia, a
consolidao da psicologia em termos de investigao e de exer-
ccio profissional acompanha a emergncia e o fortalecimento do
movimento e histria dos testes psicolgicos. No se podendo
divinizar os testes, ou lhes dar um estatuto de exclusividade na
avaliao psicolgica at porque no precisam de tal estatuto ,
os testes psicolgicos tiveram e continuam a ter um papel impor-
tante no reconhecimento cientfico e social da psicologia.
Um dos problemas na psicologia, como nas demais reas,
que ningum sem slida formao consegue realizar de forma
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

apropriada algo de tecnicamente complexo. Por muita psico-


logia que o psiclogo possa saber, isso no lhe garante por si s a
competncia no uso dos testes psicolgicos. A psicometria como
domnio de formao acadmica e profissional fundamental ao
uso dos testes psicolgicos. Algumas das crticas ao mtodo dos
testes decorrem da pouca formao por parte dos profissionais e
dos prprios crticos. Em qualquer cincia e ramo de atividade,
um instrumento apenas instrumento, e a qualidade de seu uso
depende intensamente da sabedoria ou do grau de competncia
do utilizador. Porque havemos de exigir dos testes psicolgicos
aquilo que eles no podem dar? fundamental termos bons testes,
contudo tambm verdade que um bom teste apenas se rentabi-
liza nas mos de um psiclogo competente!
Uma primeira competncia por parte do psiclogo saber quan-
do deve e quando no deve usar um determinado teste psicolgico.
Esta competncia exige conhecer muito bem o teste e conhecer
bem o contexto particular em que ele vai ser usado. O uso dos
testes psicolgicos, por estas razes, exige muito dos psiclogos do
ponto de vista tcnico e tico, sendo importante que associaes
cientficas e profissionais da psicologia regulem essa utilizao. S
com boa formao acadmica e prtica vai o psiclogo reunindo as
competncias necessrias realizao de boa avaliao, recorrendo,
entre outros meios, aos testes psicolgicos. Por tudo isto, importa
destacar a edio deste livro, entendido como um manual atual
na rea da psicometria nas mos de alunos, profissionais e acad-
micos de psicologia. Para alm dos acadmicos que pesquisam em
psicometria ou que conduzem estudos de validao de provas psi-
colgicas, este manual serve tambm aos alunos e aos utilizadores
dos testes psicolgicos em geral. Tambm estes precisam conhecer

8
Prefcio

os procedimentos bsicos de estatstica utilizados na construo e


validao dos instrumentos. Neste livro, tais procedimentos apa-
recem devidamente enquadrados e justificados pelos conceitos
psicomtricos de preciso, validade e normas, complementando
metodologias clssicas e atuais (teoria da resposta ao item, por
exemplo) de sua estimao. Da mesma forma, na organizao des-
te livro atentou-se s consideraes ticas na avaliao psicolgica.
Incluindo-se a avaliao psicolgica nos atos psicolgicos, seja na
investigao, seja no exerccio profissional, importa acautelar-se
sobre os limites dos instrumentos e da prpria avaliao, assim
como saber acautelar os direitos dos indivduos e instituies en-
volvidos na avaliao.
Pelas ligaes pessoais psicologia e aos psiclogos brasileiros,
em particular tendo a avaliao psicolgica como um dos motivos
dessa aproximao, afirmo o enorme prazer em prefaciar este
manual. Felicito os seus autores pela clareza e pelas preocupaes
pedaggicas colocadas na redao de seus captulos. Precisamos
destes manuais para que alunos, profissionais e acadmicos ultra-
passem as resistncias frequentes ao estudo aprofundado da
psicometria!
Leandro S. Almeida1

1 Professor Catedrtico da Universidade do Minho. Doutorou-se em Psicologia pela Univer-


sidade do Porto, em 1987, tendo estagiado na Universidade de Yale, Estados Unidos, e na
Universidade Catlica de Lovaina, Blgica, durante a preparao do doutoramento. Leciona
e pesquisa sobre inteligncia, cognio e aprendizagem, incluindo a construo e validao
de provas psicolgicas, sendo que algumas dessas provas so estudadas e esto validadas no
Brasil. Entre estas destaca-se a Bateria de Provas de Raciocnio (BPR5), em coautoria com
Ricardo Primi, editada pela Casa do Psiclogo.

9
Captulo 1
Da testagem Avaliao Psicolgica:
aspectos histricos e perspectivas
futuras
Rodolfo A. M. Ambiel
Slvia Vernica Pacanaro

A palavra teste, tal como usada em portugus, originou-se do


termo em latim testis, que significa testemunha, e, posteriormente,
do ingls test, com o sentido de prova. Portanto, etimologica-
mente, realizar um teste realizar uma prova e dar testemunho
de alguma coisa. Nesse sentido, quando se trata de testes psicol-
gicos, seu principal uso como ferramenta na tomada de decises
que envolvem pessoas, a partir do desempenho ou do autorrelato
em provas, questionrios ou escalas que avaliem caractersticas
psicolgicas. Embora o surgimento dos testes psicolgicos tenha
sido registrado no incio do sculo XX, muito antes disso j se
fazia verificao e levantamento de caractersticas e habilidades
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

das pessoas, em diversas culturas e em diversos contextos, princi-


palmente em situaes relacionadas a selecionar candidatos para
algumas funes especficas (Urbina, 2007).
Considerando a longa histria dos testes, suas contribuies
para o desenvolvimento cientfico e da prtica profissional na
psicologia, o presente captulo pretende fazer uma reviso hist-
rica sobre as origens e as aplicaes da testagem, destacando sua
importncia no processo de reconhecimento da profisso. Em
seguida, sero realizadas algumas reflexes sobre a testagem e a
avaliao psicolgica especificamente no contexto brasileiro.

As origens da testagem psicolgica

H registros de que os procedimentos de avaliao variaram


muito ao longo da histria, com influncias das crenas, das filoso-
fias e das posies polticas prprias de cada poca e regio, desde o
perodo neoltico, datando de 12.000 a.C., passando pelas culturas
egpcias e sumria (10.000 a.C.) at os dias atuais (Barclay, 1991;
Van Kolck, 1981; Urbina, 2007). Por exemplo, em 200 a.C., na
China, eram realizados concursos pblicos, e as provas para seleo
envolviam demonstraes de proficincia em msica, uso do arco,
habilidades de montaria, exames escritos sobre temas relacionados
a leis, agricultura e geografia (Urbina, 2007). Especificamente
sobre a testagem psicolgica, os antecedentes da utilizao de
procedimentos de avaliao clnica recaem principalmente sobre
a psiquiatria, com estudos na Alemanha e na Frana no incio do
sculo XIX, com foco no desenvolvimento de provas para avaliar
o nvel do funcionamento cognitivo de pessoas com danos cere-
brais e com outros transtornos (McReynolds, 1986).

12
Da testagem Avaliao Psicolgica: aspectos histricos e perspectivas futuras

Do ponto de vista do desenvolvimento cientfico, os testes


tiveram grande importncia para a psicologia. Em meados do sculo
XIX, os psicofsicos alemes Weber e Fechner deram os primeiros
passos em direo ao reconhecimento da psicologia como disci-
plina cientfica, cujo grande precursor foi Wilhelm Wundt, com
a criao do primeiro laboratrio dedicado pesquisa psicolgica,
em Leipzig, na Alemanha. Com o crescimento deste e de outros
laboratrios no final do sculo XIX, a psicologia desenvolveu-se
cientificamente de forma acelerada, e sua expanso ocorreu com
o treinamento de vrios pesquisadores de outros pases europeus
e dos Estados Unidos. Dentre os pesquisadores, estava Francis
Galton, que se interessou pela mensurao das funes psicol-
gicas, organizando um laboratrio antropomtrico em Londres,
com o objetivo de coletar dados sobre caractersticas fsicas e
psicolgicas das pessoas. A contribuio de Galton para a rea
da testagem ocorreu de algumas formas, tais como a criao de
testes para medida de discriminao sensorial (barras para medir
a percepo de comprimento); apito para percepo de altura do
tom; criao de escalas de atitudes (escala de pontos, questio
nrios e associao livre) e o desenvolvimento e a simplificao de
mtodos estatsticos (Anastasi, 1977).
No mesmo sentido, o psiclogo americano James M. Cattell,
influenciado por Galton, acreditava que a chave para a compreenso
do funcionamento da mente estava nos processos elementares,
e, em seus estudos, deu nfase nas medidas sensoriais. Cattell
elaborou uma bateria com testes que investigava reas relacio-
nadas acuidade sensorial, ao tempo de reao, bisseo visual
de linha e aos julgamentos sobre a durao de intervalos curtos de
tempo, e, tambm, era aplicada em estudantes universitrios com

13
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

o objetivo de predizer-lhes o sucesso acadmico (Logan, 2006).


Contudo, foi em 1900 que Binet e Simon, na Frana, comearam
a tecer uma srie de crticas aos testes at ento utilizados, afir-
mando que eram medidas exclusivamente sensoriais. O foco da
crtica era sobre o fato de que, embora permitissem maior preciso
nas medidas, os testes sensoriais no tinham relao importante
com as funes intelectuais, fazendo somente referncias a habili-
dades muito especficas, quando deveriam ater-se s funes mais
amplas como memria, imaginao, compreenso, entre outras.
Cinco anos depois, os mesmos pesquisadores franceses publi-
caram o primeiro teste para a mensurao da capacidade cognitiva
geral, a Escala Binet-Simon, constituda por trinta itens (dispostos
em ordem crescente de dificuldade) com o objetivo de avaliar
algumas funes como julgamento, compreenso e raciocnio,
detectando, assim, o nvel de inteligncia em crianas das escolas
de Paris. O teste foi desenvolvido a pedido do departamento de
educao do governo francs, a fim de identificar as crianas
com deficincia intelectual e compor um sistema diferenciado de
educao para elas. Essa escala passou por reviso, ampliao e
aperfeioamento em 1908 e em 1911, um ano antes de Wilhelm
Stern propor o Quociente Intelectual (QI), que viria a ser refi-
nado por Lewis Terman, na Universidade de Stanford, nos Estados
Unidos, em 1916. Para a obteno do QI, que exprime nume-
ricamente e de forma padronizada a capacidade intelectual dos
avaliandos, Stern e Terman sugeriram um clculo que se baseava na
diviso da idade mental (IM) pela idade cronolgica (IC) multipli-
cada por cem. Seus estudos sugeriram que, quando a idade mental
ultrapassasse a idade cronolgica, a razo resultante levaria a um
escore acima de cem. Por outro lado, quando a idade cronolgica

14
Da testagem Avaliao Psicolgica: aspectos histricos e perspectivas futuras

ultrapassasse a idade mental, levaria a um escore abaixo de cem


(Sternberg, 2000).
Os estudos de Terman, publicados em 1916, alm de terem
proposto um avano para os estudos relacionados ao QI, tambm
foram responsveis pela adaptao da escala francesa para os
Estados Unidos, onde passou a se chamar Escala Stanford-Binet.
Naquele momento histrico, outros instrumentos inspirados na
Stanford-Binet foram construdos nos Estados Unidos, onde a
avaliao cognitiva ganhou grande impulso por conta da Primeira
Guerra Mundial, ocorrida entre 1914 e 1918 (Dubois, 1970).
Nesse perodo, a demanda por instrumentos simples, rpidos,
de aplicao coletiva e que pudessem captar diferenas de capa-
cidade intelectual de recrutas foi bastante acentuada, o que levou
os pesquisadores a desenvolverem o Army Alpha e, mais tarde, o
Army Beta, que se instituiu como um instrumento no verbal de
avaliao da inteligncia, ou seja, composto por provas que no
exigiam leitura ou escrita dos respondentes, podendo ser utili-
zado com recrutas analfabetos e que no falassem a lngua inglesa
(Fancher, 1985). Ao final da Primeira Guerra Mundial, os testes
Army Alpha e Army Beta, que eram somente utilizados no exr-
cito, foram liberados para uso civil aps vrias revises e estudos
com pessoas de diferentes faixas etrias e nveis de escolaridade
(Anastasi, 1977).
Com o desenvolvimento da testagem psicolgica, ocorrido
durante o perodo da guerra, novos testes foram publicados, e
houve uma melhora na qualidade dos instrumentos, nos proce-
dimentos de administrao e nas pontuaes. No bojo desses
avanos, a partir da dcada de 1920, a testagem educacional
tambm ganhou campo e foram desenvolvidas provas para

15
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

avaliao de desempenho escolar e de habilidades escolares e


acadmicas especficas, tais como o School Aptitude Test (SAT),
o Graduate Record Exam (GRE), o Medical College Admission Test
(MCAT) e o Law School Admission Test (LSAT).
Como se pode perceber, at por volta de 1930 a testagem estava
em plena expanso nos Estados Unidos, em grande parte devido
sua cientificidade e s contribuies para a sociedade em diversos
mbitos. Tambm se percebe que, at ento, o foco estava exclu-
sivamente sobre as capacidades cognitivas e, no por acaso, foram
os estudos sobre a inteligncia humana que obtiveram os maiores
avanos metodolgicos, tericos e cientficos nessa poca.
O ingls Charles Spearman, que realizou seu doutorado no
laboratrio de Wundt, em Leipzig, foi um dos principais tericos
da fase inicial da psicometria. Suas contribuies se deram
ao aplicar modelos matemticos ao estudo do funcionamento
mental, especialmente com o refinamento do mtodo de corre-
lao, previamente desenvolvido por Karl Pearson, e com o
desenvolvimento da tcnica de anlise fatorial. Lanando mo
dessas tcnicas estatsticas, Spearman desenvolveu estudos a
partir dos quais sugeriu a teoria de que todas as habilidades cogni-
tivas convergiam para uma capacidade geral, o chamado fator g.
Por outro lado, Thurstone, em 1938, utilizando-se dos mtodos
propostos anteriormente, sugeria a existncia de habilidades espe-
cficas e independentes que no se organizavam em torno de uma
habilidade geral. De acordo com Ribeiro (1998), estava implcito
nas teorias que o fator geral dependeria de uma energia mental
essencialmente biolgica e inata, enquanto que os fatores espec-
ficos dependeriam da aprendizagem. Essas questes tericas foram
discutidas ao longo de todo o sculo XX, por Cattell (1940; 1971),

16
Da testagem Avaliao Psicolgica: aspectos histricos e perspectivas futuras

Horn (1991) e, finalmente, por Carroll (1993), que apresentou


uma proposta de integrao das teorias da inteligncia, por meio
de um modelo hierrquico das habilidades.
Assim, conforme exposto at aqui, alm do desenvolvimento
tcnico que os testes ajudaram a implementar na psicologia, eles
contriburam para avanos tericos importantes, uma vez que
permitiam que as teorias fossem testadas na realidade. Esse perodo
inicial de desenvolvimento da testagem psicolgica ocorreu na
Europa e, principalmente, nos Estados Unidos. Na seo a seguir,
sero abordados os avanos da rea e das prticas no Brasil.

O caminho dos testes no Brasil

A testagem e a avaliao psicolgica no Brasil passaram por


diversos avanos e dificuldades ao longo de sua histria. Pasquali
e Alchieri (2001) destacam que a histria dos testes psicolgicos,
no contexto brasileiro, teve um perodo inicial de grande empol-
gao e uso indiscriminado, seguido por fases de crticas (e muitas
vezes com sentido), para posterior organizao e regulamentao
do uso, o que ainda est em processo na realidade brasileira.
Pasquali e Alchieri (2001) destacam que o desenvolvimento
da testagem e da avaliao psicolgica no Brasil passou por cinco
grandes fases, tendo incio na primeira metade do sculo XIX.
Tais perodos so: produo mdico-cientfica acadmica (1836-
1930); estabelecimento e difuso da psicologia no ensino nas
universidades (1930-1962); criao dos cursos de graduao em
psicologia (1962-1970); implantao dos cursos de ps-graduao
(1970-1987); e emergncia dos laboratrios de pesquisa, de 1987

17
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

em diante. Nesta ltima fase consolidaram-se vrios eventos


cientficos em avaliao psicolgica em virtude da preocupao
de vrios grupos de pesquisadores quanto produo de instru-
mentos mais srios e confiveis.
Embora a psicologia tenha sido fundada oficialmente em
1879, por Wundt, na Alemanha, antes disso j havia profissionais
interessados na compreenso de processos psicolgicos no Brasil,
tanto que, ao longo do sculo XIX, era comum encontrar disci-
plinas de psicologia em faculdades de medicina. Assim, a partir
de um ponto de vista estritamente positivista, observa-se que, nas
dcadas de 1830 e de 1840, duas teses em faculdades de medi-
cina, versando sobre inteligncia, foram defendidas. No incio da
dcada de 1900, foram fundados laboratrios de psicologia e adap-
tao para a realidade brasileira de alguns testes internacionais,
tais como o Binet-Simon, realizada pelo mdico Isaias Alves, na
Bahia. importante ressaltar que, assim como ocorreu na Europa
e nos Estados Unidos, o interesse inicial dos pesquisadores era
conhecer os processos psicolgicos bsicos, relativos principal-
mente percepo, voltando, somente nos passos seguintes, o
foco para funes cognitivas superiores (Amendola, 2011).
As pesquisas iniciais e as possibilidades prticas do uso dos
testes foram entusiasmantes e muito promissoras, tanto que o
perodo compreendido entre 1930 a 1962 foi marcado pelo estabe-
lecimento e pela difuso do ensino da psicologia nas universidades,
fazendo parte da grade curricular de diversos cursos, tais como
administrao, jornalismo, sociologia, medicina, direito, entre
outros. Junto a isso, vrios laboratrios de pesquisa e institutos
de psicologia aplicada, principalmente de seleo e orientao
profissional e de condutores, foram fundados no Brasil, ajudando

18
Da testagem Avaliao Psicolgica: aspectos histricos e perspectivas futuras

a desenvolver a testagem, tanto do ponto de vista da pesquisa


quanto da prtica. Por isso Andriola (1996) afirmou que, at
aquele momento, tal perodo poderia ser considerado como a fase
de ouro no que se refere produo cientfica e construo de
instrumentos de medida, com o desenvolvimento de testes espe-
cficos para a populao brasileira, embora ainda se recorresse
prtica de usar instrumentos importados sem maiores esforos de
adaptao para a realidade do pas.
O ano de 1962 foi marcado pela oficializao da psicologia como
profisso no Brasil, o que se deu pela aprovao da Lei n 4.119, de
27 de agosto daquele ano. evidente que essa lei no aconteceu
de repente; ao contrrio, foi fruto de uma srie de avanos ocor-
ridos ao longo de vrios anos, os quais fizeram com que a psicologia
deixasse de ser uma disciplina aplicada para ganhar um campo
prprio (Pereira & Pereira Neto, 2003). A partir dessa Lei, que
culminou com a criao do Conselho Federal de Psicologia e de
suas sucursais regionais em 1974, os cursos de formao de psic-
logos foram oficializados, tendo currculos mnimos estabelecendo
os contedos bsicos a serem ensinados nas graduaes. Alm
disso, organizaes como a Fundao Getlio Vargas e o Insti-
tuto de Seleo e Orientao Profissional (ISOP), sob a direo
de Emilio Mira y Lpez, fortaleceram-se consideravelmente, junto
com outros laboratrios e departamentos que foram fundados nas
universidades.
Apesar de ter sido um perodo produtivo dos pontos de vista
cientfico e poltico, instalou-se uma crise de ordem ideolgica na
rea, com crticas relacionadas ao uso indiscriminado de testes
estrangeiros sem adaptao. Junto a isso, com o aparecimento
e o fortalecimento de abordagens mais sociais e humanistas na

19
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

psicologia, uma forte oposio s prticas e s tcnicas positivistas


se apresentou, fato que desencadeou alguns prejuzos relativos
pesquisa e ao ensino dos testes (Padilha, Noronha & Fagan,
2007). importante ressaltar que muitas das crticas que emer-
giram nesse momento tinham um fundamento lgico e prtico e,
de fato, algumas questes trouxeram consequncias importantes
no s para a psicologia, mas tambm para as pessoas que se
submetiam s avaliaes. Entretanto, como ressaltaram Noronha
e cols. (2002), tais crticas careciam de fundamentos cientficos
e partiam, por vezes, exclusivamente para argumentos polticos e
at emocionais, com um discurso que perdurou ao longo de pelo
menos duas dcadas.
Como se percebe, em grande parte, tais crticas faziam sentido
naquele momento, devido baixa qualidade da formao dos
alunos em avaliao psicolgica, uma vez que nos cursos recm-
-criados ainda no havia docentes especializados no assunto
em contraposio grande procura dos alunos pelos cursos de
graduao em psicologia. A esse propsito, o texto de Pasquali
e Alchieri (2001) relata que, em dez anos de existncia da
profisso, a quantidade de cursos oferecidos subiu de seis para 21,
contando, em 1970, com oito mil alunos cursando.
Dada a situao da formao dos profissionais e dos pesqui-
sadores no Brasil, foram observadas algumas aes no sentido
de promover cursos de ps-graduao em psicologia por diversas
importantes universidades, tais como as Pontifcias Universi-
dades Catlicas do Rio de Janeiro, do Rio Grande do Sul e de
So Paulo, a Universidade de Braslia e a Universidade de So
Paulo. Entretanto, isso no foi suficiente para que os testes, que
surgiram como ferramentas promissoras e rapidamente foram

20
Da testagem Avaliao Psicolgica: aspectos histricos e perspectivas futuras

difundidos em vrios mbitos, se aprimorassem tcnica e cientifi-


camente; ao contrrio, com prticas de utilizao abusivas e sem
as devidas reflexes e formao, os testes psicolgicos, em meados
das dcadas de 1980 e de 1990, foram motivo de reportagens e
manifestaes pblicas contrrias ao seu uso, expondo situaes
vexatrias de atuaes de profissionais da psicologia, principal-
mente no mbito da seleo de pessoal. Infelizmente, havia muito
de verdade no que foi veiculado. Contudo, chegar a tal situao
fez com que a rea ganhasse um novo impulso, buscando garantir
a qualidade da formao dos profissionais e dos docentes, por um
lado, e dos instrumentos e dos testes, por outro.
Uma das iniciativas tomadas nesse sentido foi a fundao do
Instituto Brasileiro de Avaliao Psicolgica (IBAP), por parte
de psiclogos pesquisadores que tinham em comum o fato de
conduzirem estudos relacionados construo, adaptao e
validao de testes psicolgicos no Brasil. Desde seu surgimento,
o IBAP tem promovido aes em prol de uma melhor qualidade
dos testes e da avaliao psicolgica no Brasil, por meio de publi-
cao de uma revista cientfica (Revista Avaliao Psicolgica),
bem como da promoo de congressos e eventos que fomentam a
produo cientfica e a reunio de profissionais em torno do tema
(Gomes, 2003; Hutz & Bandeira, 2003).
Outra tendncia observada foi o oferecimento de linhas de
pesquisa em avaliao psicolgica em cursos de ps-graduao
stricto sensu, ou seja, mestrado e doutorado. Segundo Primi
(2010), dos 65 programas existentes em universidades de psico-
logia no Brasil, h linhas de pesquisa na rea na Universidade
Federal de Minas Gerais (UFMG), na Universidade Federal de
Uberlndia (UFU), na Universidade Federal do Rio Grande do

21
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Sul (UFRGS), na PUC-RS, na Universidade Federal de Santa


Catarina (UFSC), na USP (campi de Ribeiro Preto e So Paulo),
na PUC de Campinas, na UnB e na Universidade So Francisco
(USF), sendo que esta ltima foi a primeira instituio cuja rea
de concentrao especfica em Avaliao psicolgica e desenvol-
vimento de testes.
Na histria recente da avaliao psicolgica no Brasil, o fato
que se destaca a publicao da resoluo 02/2003, que insti-
tuiu critrios mnimos de qualidade para se considerar um teste
psicolgico apto para o uso profissional. Basicamente, esses crit-
rios dizem respeito fundamentao terica do teste, evidncias
empricas, ou seja, obtidas a partir de pesquisas cientficas, da vali-
dade e da preciso do teste (esses conceitos sero abordados no
captulo 4 deste livro), dos sistemas de correo e interpretao
dos resultados (veja o captulo 5) e da compilao de todas essas
informaes em um livro chamado Manual Tcnico, que compe o
material do teste.
Essa resoluo foi importante por alguns motivos. Como j
citado, at o incio da dcada de 2000, os instrumentos care-
ciam fortemente de pesquisas que atualizassem seus contedos.
possvel imaginar que, se o Conselho estabeleceu os critrios
mnimos de qualidade citados anteriormente, muitos dos testes
disponveis antes dessa data no apresentavam muitas dessas
informaes. O leitor, ao estudar este livro na ntegra, vai perceber
que bastante difcil (e arriscado) pensar no uso de testes psico-
lgicos que no apresentem os requisitos mnimos para considerar
um teste psicolgico aprovado.
Dessa forma, a Resoluo 02/2003 disciplinou a construo e
a adaptao de testes psicolgicos no Brasil, fornecendo diretrizes

22
Da testagem Avaliao Psicolgica: aspectos histricos e perspectivas futuras

claras aos pesquisadores. Isso fez com que muitos testes utilizados
at aquele momento e que no se enquadravam no novo padro
de qualidade fossem retirados do mercado, o que provocou uma
srie de crticas por parte de profissionais que estavam perigosa-
mente acostumados ao uso desses instrumentos. Por outro lado,
conforme poder ser observado no prximo captulo, o aumento
nas pesquisas a partir da resoluo foi considervel, e por um
motivo muito simples: a partir daquele momento ou se fazia
pesquisa com os instrumentos, de acordo com as novas diretrizes,
ou no haveria mais instrumental disponvel para os psiclogos
realizarem avaliao.

Consideraes finais

Como se pode observar, a histria da testagem e da avaliao


psicolgica muito rica e legitima os investimentos atuais e os
desenvolvimentos recentes, enquanto rea prtica de atuao
do psiclogo. Porm, o desenvolvimento deve continuar e ainda
h muito o que fazer. Nesse sentido, o ano de 2011 promete ser
bastante produtivo, uma vez que o Conselho Federal de Psicologia
o instituiu como o Ano Temtico da Avaliao Psicolgica.
Nessa ao, o objetivo promover debates ao longo de todo
o ano em eventos em todo o pas, abertos a todos os psiclogos
interessados, que podero propor e discutir melhorias para rea.
Para tanto, foram definidos trs eixos que organizaro os debates,
quais sejam:

23
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

1) Qualificao, que versa sobre a formao do psiclogo em


avaliao psicolgica;
2) Relaes institucionais, que visa a debater a insero da
avaliao nos diversos mbitos de atuao da psicologia;
3) E o terceiro eixo, que organizar as reflexes a respeito da
relao entre os dois eixos anteriores.

A partir de tais discusses, devero ser publicados documentos


com os resultados e, talvez, at novas resolues.
No possvel prever o futuro da avaliao psicolgica no
Brasil, mas o estudo do passado certamente pode auxiliar a
compreender o estado atual e a indicar alguns possveis passos
futuros. Por exemplo, em acrscimo s contribuies de Pasquali
e Alchieri (2001), no seria exagero propor mais um perodo para
explicar a histria da rea, relacionando os fatos ocorridos desde
2003. O fato que a preocupao crescente com a formao
na rea parece estar no cerne da continuidade dos desenvolvi-
mentos at ento observados, considerando que profissionais bem
formados podero optar por instrumentos e tcnicas de forma mais
crtica, utiliz-los de forma mais responsvel e contribuir para que
a psicologia como cincia e profisso continue desenvolvendo-se,
tanto do ponto de vista tcnico quanto tico.

24
Da testagem Avaliao Psicolgica: aspectos histricos e perspectivas futuras

Questes

1) Por que os testes psicolgicos foram importantes para o


desenvolvimento cientfico da psicologia?
2) Explique o conceito de quociente intelectual (QI).
3) Por que houve o interesse inicial dos pesquisadores acerca
dos processos psicolgicos bsicos?
4) Descreva brevemente os critrios mnimos de qualidade de
testes psicolgicos, segundo a Resoluo 02/2003.
5) Por que pode ser perigosa a utilizao de testes que no se
enquadrem nos critrios mnimos de qualidade?

25
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Referncias
Amendola, M. F. (2011). Panorama da Histria dos Testes Psicolgicos no Brasil.
Recuperado em 23 de Fevereiro de 2011 de www.canalpsi.psc.br/artigos/
artigo12.htm.

Anastasi, A. (1977). Testes psicolgicos. (2a ed.). So Paulo: EPU.

Andriola, N. B. (1996). Avaliao Psicolgica no Brasil: consideraes a


respeito da formao dos psiclogos e dos instrumentos utilizados. Psique,
6 (2), 99-108.

Barclay, J. R. (1991). Psychological Assessment: a theory and systems approach.


Malabar: Krieger.

Carroll, J. B. (1993). Human cognitive abilities: a survey of factor-analytic studies.


Nova Iorque: Cambridge University.

Cattell, R. B. (1940). A culture-free intelligence test. Journal of Educational


Psychology, 31, 162-179.

Cattell, R. B. (1971). Abilities, their structure, growth, and action. Boston:


Houghton Mifflin.

Conselho Federal de Psicologia (2003). Resoluo n. 002/2003. Recuperado


em 26 de abril de 2011 de http://www.pol.org.br.

Dubois, P. H. (1970). A history of psychological testing. Boston: Allyn & Bacon.


Fancher, R. (1985). The intelligence men: Makers of the IQ controversy. Nova
Iorque: Norton.

Gomes, W. B. (2003). Pesquisa e prticas em Psicologia no Brasil. In O. H.


Yamamoto. & V. V. Gouveia (Orgs.). Construindo a Psicologia Brasileira:
desafios da cincia e prtica psicolgica (pp. 23-59). So Paulo: Casa do
Psiclogo.

Horn, J. L. (1991). Measurement of intellectual capabilities: a review of theory.


In K. S. McGrew, J. K. Werder & R. W. Woodcock (Orgs.). Woodcock-
Johnson Technical Manual (pp. 197-232). Chicago: Riverside.

Hutz, C. S., & Bandeira, D. R. (2003). Avaliao Psicolgica no Brasil:


situao atual e desafios para o futuro. In O. H. Yamamoto & V. V.

26
Da testagem Avaliao Psicolgica: aspectos histricos e perspectivas futuras

Gouveia (Orgs.). Construindo a psicologia brasileira: desafios da cincia e


prtica psicolgica (pp. 261-275). So Paulo: Casa do Psiclogo.

Logan, T. P. (2006). Introduo Prtica de Testes Psicolgicos. Rio de Janeiro:


LTC.

McReynolds, P. (1986). History of assessment in clinical and educational


setting. In R. O Nelson & S. C. Hayes (orgs.). Conceptual foundations of
behavioral assessment (pp. 42-80). Nova Iorque: Guilford.

Noronha, A. P. P., Ziviani, C., Hutz, C. S., Bandeira, D. R., Custdio, E. M.,
Alves, I. C. B. et al. (2002). Em defesa da avaliao psicolgica. Avaliao
Psicolgica, 1, 173-174.

Padilha, S., Noronha, A. P. P., & Fagan, C. Z. (2007). Instrumento de avaliao


psicolgica: uso e parecer de psiclogos. Avaliao Psicolgica, 6 (1),
69-76.

Pasquali, L., & Alchieri, J. C. (2001). Os testes psicolgicos no Brasil. In


L. Pasquali (Org). Tcnicas de Exame Psicolgico - TEP: fundamentos de
tcnicas psicolgicas. (pp. 195-221). So Paulo: Casa do Psiclogo.

Pereira, F. M., & Pereira Neto, A. (2003). O psiclogo no Brasil: notas sobre
seu processo de profissionalizao. Psicologia em Estudo, 8 (2), 19-27.

Primi, R. (2010). Avaliao Psicolgica no Brasil: fundamentos, situao atual


e direes para o futuro. Psicologia: Teoria e Pesquisa, 26 (especial), 25-36.

Ribeiro, I. S. (1998). Mudanas no desempenho e na estrutura das aptides:


contributos para o estudo da diferenciao cognitiva em jovens. Braga:
Universidade do Minho.
Sternberg, R. J. (2000). Psicologia Cognitiva. Porto Alegre: Artmed.

Urbina, A. (2007). Fundamentos da testagem psicolgicos. Porto Alegre. Artmed.

Van Kolck, O. L. (1981). Tcnicas de exame psicolgico e suas aplicaes no


Brasil. Petrpolis: Vozes.

27
Captulo 2
Panorama atual dos testes psicolgicos
no Brasil de 2003 a 2011
Slvia Vernica Pacanaro
Gisele Aparecida da Silva Alves
Ivan SantAna Rabelo
Irene F. Almeida de S Leme
Rodolfo A. M. Ambiel

Sabe-se que o uso de testes psicolgicos, juntamente com a


investigao de outros dados, integra o processo de avaliao
psicolgica. Pasquali (2001) define os testes como um conjunto
de tarefas predeterminadas que o sujeito precisa realizar em
uma determinada situao, do qual resultam em alguma forma
de medida. Posteriormente, Urbina (2007) descreveu os testes
como procedimentos para a obteno de amostras de comporta-
mentos e respostas de indivduos com o objetivo de descrever e/ou
mensurar caractersticas e processos psicolgicos, compreendidos
tradicionalmente nas reas emoo/afeto, cognio/inteligncia,
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

motivao, personalidade, psicomotricidade, ateno, memria,


percepo, entre outras.
Destaca-se que, nas primeiras cinco dcadas do sculo XX, os
testes psicolgicos, independentemente do seu tipo, rapidamente
atenderam s necessidades da sociedade na poca e foram inse-
ridos nos contextos militar, industrial e institucional. Assim,
pertinente lembrar que o progresso da cincia psicolgica e o forta-
lecimento dos pilares bsicos para o desenvolvimento dos testes
colaboraram com a expanso de seu uso. Nas dcadas de 1960
e 1970, houve largo descrdito na rea de testagem psicolgica,
sendo que os instrumentos foram criticados e o seu uso dimi-
nudo e menosprezado na atuao do profissional de psicologia.
Um dos motivos para esse movimento no Brasil foi a associao
dos modelos de avaliao com a cultura tcnica norte-americana
(Pasquali & Alchieri, 2001). No final dos anos oitenta, surgiram
processos judiciais em decorrncia de decises referentes ao psico-
tcnico na rea da seleo, bem como a descrena da prtica
de alguns psiclogos despreparados para a utilizao de testes
psicolgicos.
Desde ento, ocorreram alguns movimentos para que fossem
criadas solues para a melhoria da qualidade dos servios
relativos rea de avaliao psicolgica, como a criao da
Comisso Nacional sobre Testes, em 1980, bem como sua
segunda edio em 1986; o surgimento da Cmara Interinstitu-
cional de Avaliao Psicolgica em 1997; e a criao do Manual
para Avaliao Psicolgica de candidatos Carteira Nacional de
Habilitao e condutores de veculos automotores em 2000; as
resolues que regulamentaram a ao profissional no tocante
aos laudos e aos instrumentos de avaliao psicolgica em 2001;

30
Panorama atual dos testes psicolgicos no Brasil de 2003 a 2011

e a Resoluo CFP 002/2003, que divulgou os requisitos mnimos


e obrigatrios que os instrumentos psicolgicos precisam ter para
o uso profissional adequado (Noronha, Primi & Alchieri, 2004).
Foi a partir da Resoluo N 002/2003 do Conselho Federal
de Psicologia, que foram definidos com um pouco mais de clareza
os requisitos mnimos e obrigatrios que os instrumentos psico-
lgicos precisam ter para o uso profissional adequado. Entre os
principais requisitos, pode-se mencionar:

Apresentao da fundamentao terica do instrumento,


com especial nfase na definio do construto;
Apresentao de evidncias empricas de validade e pre-
ciso das interpretaes propostas para os escores do
teste, justificando os procedimentos especficos adotados
na investigao;
Apresentao de dados empricos sobre as propriedades
psicomtricas dos itens do instrumento;
Informaes sobre os procedimentos de correo e inter-
pretao dos resultados, comunicando detalhadamente o
procedimento e o sistema de interpretao no que se re-
fere s normas brasileiras, relatando as caractersticas da
amostra de padronizao de maneira clara e exaustiva,
preferencialmente comparando com estimativas nacionais,
o que possibilita o julgamento do nvel de representativi
dade do grupo de referncia usado para a transformao
dos escores;
Apresentao clara dos procedimentos de aplicao e cor-
reo, bem como das condies nas quais o teste deve ser

31
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

aplicado, para que haja a garantia da uniformidade dos


procedimentos envolvidos na sua aplicao.

Tambm em 2003, o Conselho Federal de Psicologia (CFP)


instituiu a Comisso Nacional de Avaliao Psicolgica, chamada
de Sistema de Avaliao dos Testes Psicolgicos (SATEPSI), que,
inicialmente, teve como objetivo central a anlise das principais
dificuldades que o psiclogo enfrenta diante da avaliao psico-
lgica e da utilizao de testes (Pasquali & Alchieri, 2001). Essa
Comisso integrada por psiclogos convidados, de reconhecido
saber em testagem psicolgica, que analisam e emitem pareceres
sobre os testes psicolgicos. importante salientar que todos os
instrumentos considerados psicolgicos ou no, encaminhados
para o Conselho Federal de Psicologia (CFP), passam por uma
avaliao do SATEPSI.
Aps o recebimento do instrumento por esta comisso, o
trmite envolve alguns procedimentos internos, tais como o
recebimento do material a ser analisado, a anlise propriamente
dita, a avaliao, a comunicao da avaliao aos requerentes,
com prazo para recurso, a anlise de recurso e a avaliao final.
Segundo a Resoluo CFP 002/2003, um instrumento psicol-
gico recebe parecer favorvel quando, por deciso do Plenrio
do CFP, o teste considerado em condies de uso, pois cumpriu
os requisitos mnimos para a comercializao de um teste psico-
lgico; o parecer emitido ser desfavorvel quando a anlise
indicar que o teste no apresenta as condies mnimas para uso.
Nesse caso, o parecer dever especificar as razes da reprovao,
bem como as orientaes futuras para mudanas e melhorias
nos procedimentos para o uso do instrumento. Aps a reviso

32
Panorama atual dos testes psicolgicos no Brasil de 2003 a 2011

e a reformulao, o pesquisador poder reapresentar o material


a qualquer tempo, e todos os procedimentos de anlise sero
seguidos novamente.
Quando o instrumento aprovado para publicao, comer-
cializao e utilizao profissional, cabe observar que, segundo
a Resoluo n. 006/2004 do CFP, os dados empricos das
propriedades de um teste psicolgico devem ser revisados perio-
dicamente. Para os dados referentes padronizao, o intervalo
entre um estudo e outro no pode ultrapassar quinze anos e, para
validade e preciso, o perodo deve ser de vinte anos. No sendo
apresentadas as revises nos prazos estabelecidos, o teste psicol-
gico perder a condio de favorvel e ser excludo da relao de
testes em condies de comercializao e uso.
Quanto quantidade de testes psicolgicos comercializados
atualmente, o Buros Institute of Mental Measurements fornece aos
profissionais interessados, por meio de sua pgina virtual, infor-
maes acerca de testes publicados e comercializados disponveis
em ingls. Essas informaes incluem rea de aplicao, dados da
editora responsvel pela publicao e pela comercializao dos
testes, ano de publicao, autores, ttulo dos testes, acrnimos e
revises disponveis. Noronha e Reppold (2010) relataram que,
em 2002, foi possvel identificar aproximadamente dois mil ttulos
disponveis nesta base de dados. Atualmente, em 2011, a pgina
inicial da base de dados relata mais de 3500 testes disponveis
para consulta.

33
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

3.500

2.000

Figura 1. Quantidade de testes psicolgicos em lngua inglesa comer-


cializados segundo o Buros Institute of Mental Measurements (Noronha &
Reppold, 2010).

O Sistema de Avaliao dos Testes Psicolgicos1 (SATEPSI)


consiste em um sistema brasileiro de certificao de instrumentos
de avaliao psicolgica para uso profissional, o qual avalia e
qualifica os instrumentos psicolgicos como aptos (pareceres
favorveis) ou inaptos (pareceres desfavorveis) para uso. A lista
completa dos testes informa ttulo, ano de publicao, requerente
(quem submeteu o teste avaliao do CFP), datas de recepo,
anlise, avaliao e recurso e avaliao final, que informa o resul-
tado da apreciao. Na poca de sua criao, a lista contava com
cerca de trinta instrumentos com pareceres favorveis para uso.
Os resultados de um levantamento realizado no ms de abril
de 2011 demonstraram que, at essa data, 121 instrumentos

1 www2.pol.org.br/satepsi

34
Panorama atual dos testes psicolgicos no Brasil de 2003 a 2011

psicolgicos aprovados constavam no sistema, sendo que um


instrumento ainda mencionado como aprovado passou recente-
mente para a classificao desfavorvel.

121

30

Figura 2. Quantidade de testes psicolgicos com parecer favorvel no


Brasil (consulta ao SATEPSI em abril/2011).

Dos 120 aprovados, 33 so instrumentos para avaliao cogni-


tiva, que contempla inteligncia, funes executivas e raciocnio;
27 para avaliao da personalidade; 16 instrumentos para avalia-
o da ateno; 6 para memria; 6 instrumentos para avaliao
de interesses profissionais; 4 para avaliao das habilidades so-
ciais; 4 para avaliao do estresse; 3 para o contexto familiar;
3 para criatividade; 2 para a avaliao da agressividade; 2 para
a avaliao da depresso e 1 instrumento para cada tema refe-
renciado a seguir (categoria Outros): destreza, autoconceito,

35
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

autocontrole, assertividade, avaliao ocupacional, sade geral,


expresso de raiva, lateralidade, avaliao visomotora, expecta-
tiva acerca do lcool, TDAH, ansiedade e ideao suicida.

Agressividade Depresso Outros


2% 2% 12% Inteligncia
Criatividade 27%
3%
Familiar
3%
Estresse
3%
Hab. Sociais
3%
Orient. Profiss.
5%
Memria
5% Ateno Personalidade
13% 22%

Figura 3. Tipos de testes psicolgicos, segundo construto avaliado


(consulta ao SATEPSI em abril/2011).

Durante algum tempo, no Brasil, foi utilizada uma grande quan-


tidade de instrumentos produzidos em outros pases, ocorrendo,
em alguns casos, uma traduo sem os cuidados necessrios, sendo
utilizadas as tabelas de normas estrangeiras que levavam a resulta-
dos e concluses errneos (Duarte, Miyazaki, Ciconelli & Sesso,
2003). Com a implementao do SATEPSI, buscou-se mudar
essa realidade por meio do estabelecimento de padres para os
testes e, indiretamente, para a prtica em avaliao, ao impedir
que instrumentos sem o devido reconhecimento cientfico fossem

36
Panorama atual dos testes psicolgicos no Brasil de 2003 a 2011

utilizados profissionalmente. Esse sistema, apesar de algumas con-


trovrsias, estimulou o desenvolvimento de pesquisas, tanto por
parte da comunidade de pesquisadores, quanto pelas editoras, que
passaram a atender a uma srie de exigncias tcnicas antes de
disponibilizarem instrumentos psicolgicos para comercializao.
Primi e Nunes (2010) relatam que o SATEPSI, ao longo dos
nove anos de existncia, foi gradativamente ganhando a acei-
tao dos profissionais, e os psiclogos foram compreendendo as
propostas e os objetivos desse sistema. Entre outros aspectos, o
sistema tambm provocou o aumento na qualidade dos manuais
de testes, que atualmente so bem mais completos e detalhados do
que h dez anos.
O Departamento de Pesquisa e Produo de Testes da Editora
Casa do Psiclogo realizou um levantamento referente a artigos
publicados sobre o tema avaliao psicolgica, aps a Resoluo
do CFP n 02/2003. Consultada a base de dados do PEPSIC (Peri
dicos Eletrnicos em Psicologia), mencionando a palavra-chave
avaliao psicolgica, foram registrados todos os artigos que
continham essa informao. Do total, 148 registros no possuam
o estabelecimento do perodo e 139 publicaes foram realizadas
aps o ano de 2003. O ano de 2008 foi o que obteve mais publica-
es (N=35), seguido de 2007 (N=25) e 2006 (N=24).
Foi observado tambm que as revistas que mais publicaram
sobre o assunto foram a Revista Avaliao Psicolgica, que obteve
maior nmero de publicaes (N=45), seguida da Revista Psico-
-USF (N=28). Diante desse levantamento, pde constatar-se que,
aps a resoluo do conselho de 2003, ocorreu um aumento nas
publicaes relacionadas construo de instrumentos, a estudos
de evidncias de validade e a outras propriedades psicomtricas,

37
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

na busca de tornar os instrumentos mais seguros para a populao


estudada, bem como relacionadas a atualizaes de pesquisas que
realizem estudos para normas brasileiras.
Com o propsito de analisar o conhecimento dos estudantes
do curso de psicologia no que se refere aos contedos relacionados
avaliao psicolgica, Noronha, Baldo, Barbin e Freitas (2003)
realizaram um estudo com 180 alunos do primeiro ao quinto ano
do curso de psicologia, de uma instituio particular de ensino do
interior do estado de So Paulo. A idade dos participantes variou
de dezessete a 51 anos (M=23,8; DP=7,2).
A pesquisa consistiu na aplicao de um instrumento con-
tendo 45 itens, com questes dicotmicas, cujo objetivo era
investigar quatro reas de conhecimento: conceito de avaliao;
conceito de instrumento de avaliao; uso de instrumento; e
aprendizagem de instrumentos. O instrumento foi aplicado cole-
tivamente, com os seguintes resultados: os itens que faziam parte
do instrumento que obtiveram boas porcentagens de acerto foram
o item 8 - a aprendizagem de testes deveria acontecer apenas no
ltimo ano do curso (97,2%); o item 45 - os testes no servem
para nada (96,9%); o item 32 - os testes so realmente aprendi-
dos na prtica clnica (96,6%); os itens 2 e 21, respectivamente
- a avaliao psicolgica pode ser utilizada em muitos contextos
de atuao profissional, e os testes psicolgicos so instrumentos
pouco importantes na prtica profissional do psiclogo (94,9%);
o item 20 - a entrevista e a observao so tcnicas de avaliao
(93,9%); o item 41 consigo aprender um teste pela leitura do
manual (93,8%); o item 42 - o psiclogo no deve usar testes,
pois eles reduzem o homem a nmeros (93,3%); e o item 12 - a
avaliao um processo de coleta de dados (91,7%).

38
Panorama atual dos testes psicolgicos no Brasil de 2003 a 2011

Os dados revelaram um melhor desempenho dos alunos que


estavam no ltimo ano, quando comparados com os alunos do
primeiro ano, que nunca tiveram nenhum contato de instruo
formal de avaliao, havendo diferena significativa entre os
grupos em quase metade dos itens do instrumento. Observa-
-se ainda que, entre os prprios estudantes de psicologia, h um
desconhecimento da prtica e da importncia em se utilizar a
avaliao psicolgica corretamente.
Neste sentido, Paula, Pereira e Nascimento (2007) realizaram
um levantamento por meio de um questionrio sobre a opinio
dos alunos de psicologia a respeito da avaliao psicolgica,
principalmente sobre a utilizao dos testes psicolgicos. Partici-
param 358 alunos de psicologia que cursavam o ltimo ano da
graduao, pertencentes a quatro instituies, sendo uma pblica
e trs particulares da cidade de Belo Horizonte. Quanto idade
dos participantes, 59% deles tinham at 24 anos; 15%, entre 25 e
26 anos; 25% tinham mais de 26 anos e 1% no relatou a idade.
O questionrio era composto por dezenove itens que
contemplaram as seguintes informaes: formao acadmica,
articulao entre teoria e prtica na graduao e na identificao
dos problemas mais frequentes no uso dos testes psicolgicos. No
que se refere aos instrumentos aprendidos durante a graduao,
os mais citados foram a Escala de Inteligncia Wechsler para
Crianas - WISC (N=259), seguida do Desenho da Figura
Humana DFH (N=204) e das Matrizes Progressivas de Raven
(N=194), e os menos citados foram o Teste de Ateno Concen-
trada - D2 (93), as Figuras Complexas de Rey (N=95) e o Teste
no verbal de inteligncia R1 (N=100). Os instrumentos WISC e
as Matrizes Progressivas de Raven tambm foram os mais citados

39
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

como utilizados nos estgios, bem como o HTP (casa, rvore e


pessoa).
Dos instrumentos informados como os mais citados, todos
esto aprovados pelo CFP, exceto o Teste do Desenho Wartegg e
o DFH de Goodenough-Harris, o que indica que as universidades
tambm procuram escolher instrumentos que contenham infor-
maes relacionadas normatizao, padronizao, validade e
preciso. Tambm foram verificadas informaes sobre os pontos
positivos e negativos dos aspectos da formao acadmica na
rea da avaliao psicolgica, sendo que os pontos positivos mais
citados foram a capacitao profissional dos professores e o conhe-
cimento sobre as tcnicas e os testes ensinados.
Sobre os pontos negativos, os mais mencionados foram a insu-
ficincia de informaes no contedo do ensino e nos nmeros
de disciplinas ofertadas. No que se refere ao conhecimento dos
alunos sobre a Resoluo N 002/2003 do CFP, o estudo indicou
que 83% dos alunos desconheciam essa resoluo, o que preo-
cupante, pois muitos deles j esto trabalhando em diversas reas
da psicologia. Conclui-se, portanto, uma grande necessidade de
aperfeioamento da formao acadmica do psiclogo, visando
aquisio de habilidades suficientes para capacit-lo ao exerccio
profissional de melhor qualidade na rea em questo.
Joly, Silva, Nunes e Sousa (2007) investigaram a produo
cientfica de assuntos relacionados avaliao psicolgica, pesqui-
sando os resumos de painis publicados nos Anais dos Congressos
Brasileiros de Avaliao Psicolgica, nos anos de 2003, 2005
e 2007. Esses resumos estavam disponveis em CD, e a amostra
foi composta por 934 resumos de diversas reas, sendo 264 do

40
Panorama atual dos testes psicolgicos no Brasil de 2003 a 2011

primeiro congresso (2003), 322 do segundo (2005) e 348 do ter-


ceiro (2007).
Os painis foram analisados com base em alguns critrios, a
saber, tipo de estudo (psicomtrico, de aplicao e descritivo);
tipo de pesquisa (documental, emprica, reviso bibliogrfica,
estudo de levantamento, estudo de caso); quantidade e sexo dos
autores; tipo de instituio s quais os autores estavam vinculados
(universidades pblicas, particulares, institutos de pesquisa ou
empresas); regio do pas na qual os autores atuam; procedimento
de avaliao adotado (teste, entrevista, observao, misto); rea
de aplicao; nome do construto avaliado; tamanho da amostra,
faixa etria e tipo de grupo (estudantes, profissionais ou pessoas
institucionalizadas, com e sem distrbio psicolgico diagnosti-
cado); nome; tipo do instrumento utilizado (projetivo, objetivo
ou mais de um) e tipo de aplicao (lpis e papel, informatizada,
relato verbal); incluem-se os seguintes estudos psicomtricos:
validade (que tipo), preciso (que tipo), adaptao, normatizao
e padronizao; e procedimento de anlise utilizado (qualitativo,
quantitativo ou ambos). Destacam-se alguns itens relevantes e
observa-se que, no ano de 2007, ocorreu um aumento nas publi-
caes de 37,2%. Sobre os autores dos resumos, houve uma
predominncia na participao do gnero feminino, havendo um
total de 873 mulheres, em comparao com 492 homens.
No que se refere s distribuies de estudos por regies e ano de
congresso, percebeu-se uma maior participao da regio Sudeste
(64%) em todos os anos avaliados. Observou-se tambm que os
anos de 2005 e 2007 concentraram mais pesquisas envolvendo
adultos e crianas, com relevncia estatstica (22 [12] = 142,539;
p < 0,001).

41
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Foi observado que a utilizao de testes obteve uma grande


prevalncia nas tcnicas utilizadas, e que, no ano de 2007, se
optou por uma maior utilizao de instrumentos do Tipo Lpis
e Papel, com 71,8%, quando comparado aos demais anos. Alm
disso, observa-se que, em um nmero significativo de resumos do
congresso de 2003 (34,5%), no constava essa informao, e que
isso foi diminuindo ao longo dos outros anos.
Houve diferenas altamente significativas entre os tipos dos
instrumentos utilizados em funo dos anos dos congressos (22
[10] = 193, 410; p < 0,001), de modo que ocorreu prevalncia
pela utilizao de instrumentos objetivos em todos os anos do con-
gresso, sendo que, em 2007, essa prevalncia foi de 78,4%. No
que se refere aos instrumentos mais utilizados nas apresentaes
dos painis, pode mencionar-se o Rorschach (N=25), seguido do
WISC (n=12) e Bender (N=11), que avaliam respectivamente
personalidade, inteligncia e psicomotricidade, como os mais cita-
dos nos resumos.
Quanto a teses e dissertaes disponveis na Base de Dados
da Biblioteca Virtual em Psicologia Brasil (BVS-Psi Brasil), Joly,
Berberian, Andrade e Teixeira (2010) realizaram um levan-
tamento utilizando as seguintes palavras-chaves: avaliao
psicolgica, psicometria, validade, preciso e testes psicolgicos,
sendo a busca realizada at setembro de 2007. Obteve-se um
total de 141 resumos referentes pesquisa realizada. As anlises
de frequncias dos resumos revelaram que 54,6% eram disserta-
es de mestrado; 43,3%, teses de doutorado, e 2,1% eram teses
de ps-doutorado, sendo que 19,15% dos estudos foram defen-
didos em universidades da regio sul do Pas; 80,14% no Sudeste,
e 0,71%, no Nordeste.

42
Panorama atual dos testes psicolgicos no Brasil de 2003 a 2011

No que se refere ao gnero das autorias desses trabalhos,


observou-se que 88,9% eram do sexo feminino. Desses estudos,
66,7% foram realizados em universidades pblicas e 33,3%, em
universidades privadas.
Alm disso, foi verificado tambm o tipo de construto estu-
dado, o que revelou que os construtos personalidade e inteligncia
ainda permaneceram como os mais pesquisados, como destacado
tambm na pesquisa anterior, sendo que a anlise de frequncia da
rea de aplicao em que os instrumentos desenvolvidos ou utili-
zados podem ser empregados revelou que a rea clnica (26,3%)
foi a que mais teve estudos direcionados, seguida pela rea de
psicologia escolar e educacional (25,6%).
Alves, Alchieri e Marques (2002) relatam uma crtica atual
atribuda aos testes psicolgicos, a qual se refere funo de
rotular o examinando durante o processo de avaliao. Diante
disso, vale ressaltar o uso dos testes como ferramentas inte-
grantes do processo de avaliao psicolgica e que nunca devem
ser utilizados de forma isolada, bem como o fato de que os resul-
tados oriundos da testagem so comparados a normas criadas para
aquela populao e contexto especficos.
Complementando, h a argumentao de Noronha e cols.
(2003) sobre a escolha de um instrumento de avaliao. As
autoras insistem na importncia de se respeitar a idade, o sexo e
a referncia a normas peculiares populao avaliada. Ao lado
disso, para que os testes sejam teis e eficientes, devem passar
por processos que comprovem suas qualidades psicomtricas
e tambm atender a especificaes que garantam o reconheci-
mento e a credibilidade por parte da sociedade e da comunidade
cientfica.

43
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Quanto expanso de pesquisas relacionadas testagem psi


colgica, ela pode ser decorrente tambm da Resoluo n
002/2003, do Conselho Federal de Psicologia, pois h, a partir dela,
a obrigatoriedade de estudos psicomtricos para os testes psicol-
gicos utilizados para fins profissionais. importante salientar que,
durante as ltimas dcadas, so percebidos avanos importantes
na rea, e, conforme destaca Gouveia (2009), no possvel mais
pensar na rea de avaliao psicolgica como amadora, pois cada
vez mais necessria a preparao de um material de testagem de
melhor qualidade, possibilitando estudos cada vez mais represen-
tativos dos parmetros psicomtricos.
Em acrscimo, destaca-se a necessidade de mostrar aos
alunos ingressos no curso de psicologia das diversas universi-
dades brasileiras a utilidade da rea de avaliao psicolgica e
suas ramificaes, pois h um mercado promissor nesses campos.
Dessa forma, faz-se necessrio um conhecimento tcnico e amplo
a respeito da testagem e do processo de avaliao psicolgica por
parte do psiclogo, o que nortear o profissional para a melhor
forma de realizao de uma interveno.

44
Panorama atual dos testes psicolgicos no Brasil de 2003 a 2011

Questes

1) Nas dcadas de 1960 e 1970, houve amplo descrdito na


rea de testagem psicolgica; os instrumentos foram criti-
cados e o seu uso diminudo e depreciado na atuao do
profissional de psicologia. Aponte alguns motivos para esse
movimento no Brasil.
2) A partir da Resoluo N 002/2003 do Conselho Federal de
Psicologia, foram definidos com um pouco mais de clareza
os requisitos mnimos e obrigatrios que os instrumentos
psicolgicos precisam ter para o uso profissional adequado.
Descreva alguns desses principais requisitos.
3) Tambm em 2003, o Conselho Federal de Psicologia (CFP)
instituiu a Comisso Nacional de Avaliao Psicolgica,
chamada de Sistema de Avaliao dos Testes Psicolgicos
(SATEPSI). Qual o objetivo principal dessa comisso?
4) Sabendo-se que os dados empricos das propriedades de
um teste psicolgico devem ser revisados periodicamente,
indique o perodo (em anos) de regularidade de um teste
quanto padronizao e validade/preciso.
5) Algumas pesquisas relatam uma crtica atribuda aos testes
psicolgicos no que se refere funo do rtulo que ser
plantado no sujeito submetido ao processo de avaliao.
Diante disso, explique quais cuidados podem ser tomados
para uma avaliao psicolgica coesa.

45
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Referncias
Alves, I. C. B., Alchieri, J. C., & Marques, K. C. (2001). As tcnicas de exame
psicolgico ensinadas nos cursos de graduao de acordo com os profes-
sores. Psico-USF, 7 (1), p. 77-88.

Conselho Federal de Psicologia. (2003). Resoluo CFP n 002/2003.


Braslia, DF. Recuperado em 21 de julho de 2010, de http://www.pol.
org.br/pol/export/si-tes/default/pol/legislacao/legislacaoDocumentos/
resolucao2003_02.pdf

Conselho Federal de Psicologia. (2004). Resoluo CFP n 006/2004.


Braslia, DF. Recuperado em 24 de outubro de 2010, de http://www.pol.
org.br/pol/export/si-tes/default/pol/legislacao/legislacaoDocumentos/
resolucao2003_02.pdf

Duarte, P. S., Miyazaki, M. C. O. S., Ciconelli, R. M. & Sesso, R. (2003).


Traduo e adaptao cultural do instrumento de avaliao de qualidade
de vida para pacientes renais crnicos (KDQOL-SF). Revista da Asso-
ciao Mdica Brasileira, 49 (4), 375-81.

Gouveia, V. (2009). A avaliao Psicolgica no Brasil: caminhos, desafios e


possibilidades. Psicologia em foco, 2 (1), 110 119.

Joly, M. C. R. A., Silva, M. C. R., Nunes, M. F. O. & Sousa, M. S. (2007).


Anlise da Produo Cientfica em Painis dos Congressos Brasileiros de
Avaliao Psicolgica Avaliao Psicolgica, 6 (2), 239-252.

Joly, M. C. R. A, Berberian, A. A, Andrade, R. G. & Teixeira, T. C. (2010).


Anlise de Teses e Dissertaes em Avaliao Psicolgica Disponveis na
BVS-PSI Brasil. Psicologia Cincia e Profisso, 30 (1), 174-187.

Noronha, A. P. P., Reppold, C.T. (2010). Consideraes Sobre a Avaliao


Psicolgica no Brasil. Psicologia: cincia e profisso, 30 (num. esp.),
192-201.

Noronha, A. P., Vendramini, C. M. M., Canguu, C., Souza, C. V. R., Cobro,


C, Paula, L. M. et al (2003). Propriedades psicomtricas apresentadas em
manuais de testes de inteligncia. Psicologia em Estudo, 8 (1), 93-99.

Noronha, A. P. P., Primi, R., & Alchieri, J.C. (2004). Parmetros Psicom-
tricos: uma Anlise de Testes Psicolgicos Comercializados no Brasil.
Psicologia: Cincia e Profisso, 24 (4), 88-99.

46
Panorama atual dos testes psicolgicos no Brasil de 2003 a 2011

Noronha, A. P. P., Baldo, C. R., Barbin, P. F. & Freitas, J. V. (2003). Conhe-


cimento em avaliao psicolgica: um estudo com alunos de Psicologia.
Psicologia: teoria e prtica, 5 (2), 37-43.

Oakland, T. (2009). Ethics on assessment: International perspectives. [Confe-


rncia]. Em Congresso Brasileiro de Avaliao Psicolgica. So Paulo: IBAP.

Paula, A. V., Pereira, A. S. & Nascimento, E. (2007). Opinio de alunos de


psicologia sobre o ensino em avaliao psicolgica. Psico-USF, 12 (1),
33-43.

Pasquali, L. (Org.) (2001). Tcnicas de exame psicolgico - TEP. Manual. Vol. I:


Fundamentos das tcnicas psicolgicas. So Paulo: Casa do Psiclogo.

Pasquali, L. & Alchieri, J. C. (2001). Os testes psicolgicos no Brasil. In L.


Pasquali (Orgs). Tcnicas de exame psicolgico - TEP (Manual, Vol. I:
Fundamentos das tcnicas psicolgicas, pp. 195-221). So Paulo: Casa
do Psiclogo.

Primi, R., & Nunes, C. H. S. (2010). O Satepsi: desafios e propostas de aprimo-


ramento. In Conselho Federal de Psicologia (Orgs). Avaliao psicolgica:
diretrizes na regulamentao da profisso (pp. 129-148). Braslia: CFP.

Urbina, S. (2007). Fundamentos da Testagem Psicolgica. Porto Alegre: Artmed


Editora.

Werlang, B. S. G., Amaral, A. E. V., & Nascimento, R. S. G. F. (2010).


Avaliao Psicolgica, testes e possibilidades de uso. In Conselho Federal
de Psicologia (Orgs). Avaliao psicolgica: diretrizes na regulamentao da
profisso (pp. 87-100). Braslia: CFP.

47
Captulo 3
E viveram felizes para sempre: a longa
(e necessria) relao entre psicologia e
estatstica
Rodolfo A. M. Ambiel
Josemberg Moura de Andrade
Lucas de Francisco Carvalho
Vicente Cassepp-Borges

Ao escolher um curso de psicologia, inevitavelmente, o estu-


dante carrega consigo uma srie de interesses e expectativas, sendo
comum encontrar neles gosto por atividades diretamente ligadas
ao contato com as pessoas e a ajuda a elas, e, no por acaso, a
preferncia por atuaes psicolgicas no contexto clnico quase
unnime entre os estudantes ingressantes (Bueno, Lemos &
Tom, 2004; Meira & Nunes, 2005; Noronha & Ambiel, 2008). A
ideia de que a psicologia somente clnica, muito frequentemente
compartilhada por pessoas leigas, tem sido flexibilizada, fazendo
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

com que outras reas tenham ganhado destaque, tais como a


organizacional, a comunitria e a hospitalar. Considerando a fina-
lidade deste livro, qual seja, de apresentar conceitos bsicos sobre
avaliao e testes psicolgicos, importante grifar que, no bojo
dessa expanso social da psicologia, desde o incio da dcada de
2000 a rea tambm tem crescido em credibilidade, eficincia e
qualidade (CFP, 2003).
Entretanto, apesar do crescente interesse por outras reas e por
novos mtodos psicolgicos, h uma ferramenta que parece ainda
no ter cado nas graas de estudantes e profissionais, embora
sua utilizao seja to antiga quanto a prpria psicologia enquanto
cincia. Sim, aqui se est falando sobre a temida (e mal compreen
dida) estatstica!
bastante comum ouvir nos corredores das faculdades de
psicologia murmrios (e muitas vezes lamentaes) a respeito dos
contedos matemticos que parecem no fazer sentido em meio a
outras disciplinas especficas da psicologia. Por conseguinte, no
raro, percebe-se uma certa associao de averses entre estats-
tica, testes psicolgicos e pesquisa em psicologia, como se tudo o
que fizesse uso da estatstica fosse igualmente difcil e chato.
Se voc est lendo este texto e identificando-se com tais afir-
maes, concordando com a maioria delas, saiba que no o
nico. Preocupados com as dificuldades dos alunos nesse assunto,
vrios pesquisadores tm se empenhado em compreend-las.
Por exemplo, Yunis (2006) pesquisou as principais dificuldades
em estatstica de estudantes de psicologia egpcios e descobriu
cinco principais fontes de dificuldade: (1) o contedo do curso, (2)
o professor, (3) os exames, (4) o prprio estudante e (5) a distncia

50
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

do material ensinado da realidade. Esse mesmo autor encontrou


dados mostrando que, quanto mais a estatstica causava ansiedade
nos alunos, mais eles consideravam a matria difcil.
No Brasil, Silva e Vendramini (2005) pesquisaram o autocon-
ceito estatstico (uma varivel afetiva relacionada ao julgamento
que a pessoa faz de si mesma em relao estatstica) de estu-
dantes de psicologia e pedagogia. Entre os itens com os quais os
estudantes concordaram mais estava este: Eu me sinto incapaz
na aula de estatstica. Por outro lado, entre aqueles com mais
discordncia estavam: Eu gosto de estudar estatstica em casa e
Eu acredito que eu posso ser um estatstico ou um cientista futu-
ramente. Em outro estudo, que avaliou a atitude de estudantes
de psicologia em relao estatstica, Vendramini, Silva e Dias
(2009) verificaram que o desempenho na disciplina de estatstica
estava bastante relacionado com a afirmao: A estatstica me faz
sentir como se estivesse perdido em uma selva de nmeros e sem
encontrar sada.
Tambm no Brasil, Noronha, Nunes e Ambiel (2007) obser-
varam que os estudantes de psicologia atribuem pouca importncia
para o uso da estatstica nas prticas de avaliao psicolgica.
Alm disso, os dados sugerem que os estudantes de primeiro ano
relataram ter mais domnio em estatstica do que os do quinto ano.
Ou seja, parece ocorrer algum fenmeno que faz os alunos perce-
berem que desaprendem estatstica ao longo do curso.
Com os estudos citados, pode perceber-se que a estatstica
mesmo percebida por futuros psiclogos como um bicho de sete
cabeas. Mas talvez voc no tenha percebido que, nos ltimos
trs pargrafos, vrias informaes e vrios conceitos estatsticos
foram passados. Possivelmente, voc tenha lido os pargrafos e

51
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

compreendido as informaes, sem que isso lhe causasse nenhuma


ansiedade ou lhe fizesse sentir-se em uma selva sem sada. E esse
o objetivo deste captulo: apresentar conceitos estatsticos bsicos
e essenciais para uma boa utilizao e compreenso de manuais e
de testes psicolgicos de uma forma simples e clara.
Contudo, antes de prosseguir, necessrio dar-se uma boa e
uma m notcia. A m que, por maior que tenha sido o esforo,
no foi possvel livrar voc, leitor, da apresentao de algumas
frmulas. Mas no se preocupe. A boa notcia que voc no
precisa fazer clculos ou grandes operaes matemticas para
utilizar a estatstica no seu dia a dia de estudante de psicologia ou
de pesquisador. Existem softwares que faro o trabalho por voc,
tais como o Microsoft Excel ou o Statical Package for Social Sciences,
o popular SPSS.

A estatstica na psicologia

A parceria entre psicologia e estatstica no nova. Histo-


riadores apontam que no sculo XIX o caminho da psicologia
rumo ao seu reconhecimento como cincia demandou a adoo
de mtodos que viabilizassem a quantificao de caractersticas
psicolgicas. Concomitantemente, os primeiros pesquisadores
interessados em conhecer os processos psicofsicos das pessoas
comearam a fazer uso de procedimentos estatsticos para atribuir
validade cientfica aos seus achados (Sass, 2008).
No momento histrico inicial da psicologia como cincia, um
dos pesquisadores que melhor utilizaram a estatstica em seus
estudos foi Galton. Em seus experimentos, ele, que era bilogo,

52
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

estudava as diferenas individuais das pessoas, com a preocupao


de compreender como a hereditariedade e o ambiente poderiam
influenciar no desenvolvimento e na manifestao de traos
caractersticos de cada um. Nessa empreitada, Galton teve a ajuda
de Cattell, que mais tarde viria a se tornar um dos principais cien-
tistas no campo da personalidade (Memria, 2004, Schultz &
Schultz, 2007).
No incio do sculo XX, surgiram os primeiros testes psicol-
gicos, tal como so conhecidos atualmente. Urbina (2007) afirma
que, nessa poca, as sociedades urbanas, industriais e democr-
ticas comeavam a se consolidar e, em consequncia desses novos
conceitos sociais, tornou-se imperativo tomar decises sobre
pessoas de forma justa e considerando suas caractersticas pessoais
em diversas reas, tais como nos contextos laboral, educacional e
da sade.
A partir desse avano inicial, ao longo do sculo XX as testagens
psicolgica e educacional se desenvolveram sobremaneira, com
a contribuio e o refinamento das anlises estatsticas (Urbina,
2007). Alm disso, a necessidade de selecionar soldados para as
grandes guerras mundiais e o surgimento de softwares e pacotes
estatsticos possibilitaram tornar os instrumentos de avaliao
cada vez mais vlidos e precisos.
Dessa forma, aps uma breve contextualizao histrica sobre
o uso da estatstica pela psicologia, alguns conceitos bsicos sero
expostos. importante notar que a inteno deste captulo, bem
como da disciplina de estatstica nas faculdades de psicologia, no
formar estatsticos e, sim, instrumentalizar os estudantes e os
profissionais da psicologia para uma boa utilizao de manuais de
testes psicolgicos e aplicao em pesquisa.

53
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Populao e amostra

A estatstica um ramo de conhecimento formado por um


conjunto de mtodos matemticos que ajudam as pessoas a tomar
decises. O termo derivado de status (estado) e pode ter duas
interpretaes: estado, enquanto condio atual de determi-
nada situao (por exemplo, meu estado financeiro atual est
pssimo); ou Estado, enquanto administrao pblica, ou seja,
mtodos adotados pelo Estado para monitorar o desenvolvimento
de alguma caracterstica da populao (por exemplo, a renda per
capita do brasileiro subiu 5% nos ltimos anos) (Memria, 2004).
Ao trazer essa ideia para a psicologia, necessrio lembrar que
geralmente se falar sobre pessoas. A esse respeito, importante
entender que a estatstica, sendo um conjunto de mtodos, vai
informar sobre os dados que estiverem disponveis, seja qual for
a fonte da coleta. Por exemplo, em exames mdicos clnicos, a
estatstica ajuda os mdicos a entender a condio de sade do
examinado a partir de uma amostra de alguma substncia biol-
gica, como o sangue. Na psicologia, os dados dizem respeito a
comportamentos coletados de uma parte da populao (Pasquali,
2010).
Essa noo primordial para a compreenso dos prximos pas-
sos: dificilmente ser possvel para um psiclogo fazer uma pesquisa
com toda uma populao e, por isso, seleciona-se uma amostra
para a realizao da pesquisa. Portanto, uma amostra uma parte
de uma populao, selecionada com base em algum critrio. Popu
lao, por sua vez, o conjunto de todos os indivduos de uma
determinada classe. Por exemplo, um pesquisador quer verificar
os nveis do trao de personalidade Extroverso em estudantes

54
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

de psicologia brasileiros; a populao em questo seria composta


por todos os estudantes de psicologia do Brasil, de todas as uni-
versidades, de todas as cidades, de todos os estados brasileiros no
momento da pesquisa. Como isso seria muito complicado e caro,
o pesquisador seleciona uma amostra de estudantes de psicologia
para realizar seu estudo, a qual pode ser uma turma, algumas tur-
mas de uma universidade, algumas universidades de um estado ou,
aleatoriamente, uma parte dos estudantes de psicologia do Brasil.
claro que, quanto menos aleatria for a seleo da amostra,
maior a possibilidade de tendenciosidade dos dados, ou seja, as
informaes so relativas apenas quela pequena amostra, e o
pesquisador no pode generalizar os dados. Por exemplo, seria
errado que um estudo cujos dados foram coletados em apenas uma
turma de psicologia da Universidade Estadual de Londrina (UEL),
no Paran, conclusse que os resultados encontrados, naquela
amostra, refletem as caractersticas dos estudantes de psicologia
do Brasil. Alis, no possvel nem generalizar para os futuros
psiclogos do estado do Paran, qui nem mesmo da prpria
UEL, mas apenas para as pessoas em questo (podendo ou no ser
verdade para o restante da populao estudada).
Afinal, quando se fala em seleo da amostra, deve ser consi-
derada a ideia de representatividade. Ou seja, j que em geral no
se tem dinheiro, tampouco tempo, para avaliar todos os repre-
sentantes de uma certa populao, necessrio que a amostra
selecionada (a) tenha uma quantidade de pessoas suficiente, (b)
no tenha caractersticas prprias que a diferenciem do normal
da populao e (c) seja escolhida de maneira aleatria; desse modo,
o pesquisador no deve escolher os sujeitos que interessam para
chegar ao resultado que deseja.

55
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Medidas de tendncia central e


variabilidade

Basicamente, o uso da estatstica em psicologia tem a finali-


dade de descrever e resumir dados provindos de observaes de
comportamento, que podem ser feitas de diferentes formas, como
testes, questionrios e entrevistas. Tais descries e conjuntos
de dados so realizados, especificamente, por meio de nmeros,
que expressam e ajudam a entender o significado dos resultados.
A funo de descrever e resumir resultados do domnio da
estatstica descritiva. J a funo de interpretar resultados, espe-
cificamente quando se deseja generalizar os resultados de uma
amostra de respondentes para a populao alvo, do domnio da
estatstica inferencial (Glassman & Hadad, 2008; Urbina, 2007).
Especificamente nesta seo, vamos concentrar-nos na estats-
tica descritiva. Podemos observar, nos vrios livros de estatstica
disponveis, que a forma mais comum de estatstica descritiva
so as medidas de tendncia central. Como assinalam Dancey e
Reidy (2006), uma medida de tendncia central de um conjunto
de dados fornece uma indicao do escore tpico (mais comum)
deste conjunto de dados. Em outras palavras, uma maneira
vantajosa de caracterizar um grupo de sujeitos como um todo
achar um nmero nico que represente o que mdio, ou tpico
daquele conjunto de dados. Assim, podemos dizer, por exemplo,
que o tempo mdio de realizao da prova de psicologia social da
turma A do curso de psicologia de uma universidade qualquer foi
de uma hora e dez minutos. Por outro lado, podemos dizer que a
mdia de idade desses alunos de 23,5 anos. Embora as idades

56
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

dos alunos do curso de psicologia variem, a mdia de idade de


23,5 anos oferece uma noo geral das idades deles. As medidas
de tendncia central comumente utilizadas para descrever dados
so a moda, a mediana e a mdia, que sero discutidas a seguir.
A medida de tendncia central mais simples de se obter a
moda (Mo), que simplesmente o valor mais frequente, mais
tpico ou mais comum em uma distribuio de dados. Suponha
que dez candidatos fizeram uma prova de conhecimentos gerais
para provimento de uma vaga de analista de sistemas em uma
determinada empresa. Dois candidatos obtiveram a nota 6,0; trs
candidatos, a nota 7,5; quatro candidatos, a nota 8,0 e um candi-
dato, a nota 10. Qual seria a moda? O valor modal 8,0, j que
quatro candidatos obtiveram essa nota. Em outras palavras, 8,0 a
moda porque a nota que ocorre com maior frequncia. Algumas
distribuies de frequncia podem conter duas ou mais modas; por
exemplo, quando se tm duas modas, falamos que a distribuio
bimodal.
A moda a nica medida de tendncia central que podemos
utilizar para representar variveis do tipo nominal. Nesse
nvel de medida, os nmeros so utilizados de forma arbitrria,
simplesmente como smbolos de identificao de grupos a que
os elementos pertencem (Bunchaft & Cavas, 2002). Exemplos
de variveis no nvel nominal so sexo (masculino e feminino),
religio (catlica, evanglica, esprita, etc.) e curso universitrio
(psicologia, medicina, direito, cinema, etc.). Vale ressaltar que a
moda pode, entretanto, ser utilizada para descrever o escore mais

57
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

comum em qualquer distribuio, independentemente do nvel de


mensurao1 (Levin & Fox, 2004).
Uma segunda medida de tendncia central a mediana (Mdn),
a qual diz respeito pontuao que est no meio da distribuio
da frequncia. Quando uma distribuio de frequncias disposta
em ordem de tamanho, torna-se possvel localizar a mediana, o
ponto do meio de uma distribuio. A mediana encarada como
uma medida de tendncia central, pois separa a distribuio de
frequncias em duas partes iguais (Levin & Fox, 2004). Consi-
dere a seguinte distribuio de frequncia: 12, 11, 18, 16, 15, 13
e 17. Quando se vai determinar a mediana, o primeiro passo
ordenar os dados do menor para o maior, como segue: 11, 12,
13, 15, 16, 17 e 18. Cada valor tem um posto; por exemplo, o
valor 11 assume o 1 posto, o valor 12 assume o 2 posto e assim
por diante. O posto do valor da mediana pode ser determinado
por inspeo (valor do meio em uma distribuio de frequncia
mpar) ou pela frmula: N + 1 . Nesse caso, temos 7 2+ 1 , que resulta
2
em 4. Assim, no posto 4, temos o valor da mediana igual a 15.
No caso de uma distribuio de frequncias par, a mediana ser a
mdia entre os dois valores centrais.
Compreendidas a moda e a mediana, passaremos a explicar
a mdia. A medida de tendncia central mais comum, intensa e
extensivamente utilizada, a mdia aritmtica, geralmente deno-
minada de mdia (M) (Ferreira, 2005). Para calcular-se a mdia,
deve-se somar o escore de cada sujeito e dividir o resultado pelo
nmero de sujeitos. A ttulo de informao, a frmula da mdia :
X , na qual:
X =
N

1 Para maiores informaes sobre nveis de mensurao, consultar Bunchaft e Cavas (2002),
Hogan (2006) ou Pasquali (2003).

58
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

X = mdia (l-se X barra);


= soma (letra grega maiscula sigma);
X = escore bruto em um conjunto de escores;
N = nmero total de escores no conjunto (Levin & Fox,
2004).

Segundo Glassman e Hadad (2008), a mdia comumente


utilizada devido a duas caractersticas ou vantagens. Primeiro, no
necessrio dispor as pontuaes em uma ordem sequencial para
calcular a mdia; segundo, ao contrrio da mediana ou da moda,
a mdia reflete todas as pontuaes, ou seja, se voc mudar uma
pontuao, a mdia tambm vai mudar. Um dos problemas da
mdia que ela sensvel aos casos extremos, os famosos outliers
no jargo da estatstica (Dancey & Reidy, 2007). Suponha que
voc queira saber a mdia da renda mensal dos sujeitos da sua
pesquisa e, por coincidncia, Bill Gates esteja na sua amostra.
Nesse caso, a mdia da renda mensal ser maximizada. Em outro
caso aberrante, voc quer saber a mdia de idade dos sujeitos da
sua pesquisa, e o homem mais velho do mundo, certificado pelo
livro dos recordes, est na sua amostra. Mais uma vez, o valor da
mdia de idade ser maximizado. claro que esses exemplos so
exagerados, mas servem para ilustrar que a mdia sofre influncias
dos outliers. Em casos similares, devemos utilizar a mediana em vez
da mdia.
Tambm no devemos utilizar a mdia quando a distribuio
de frequncias no normal. A distribuio normal, ilustrada na
Figura 1, tem a forma de uma curva simtrica que parece um sino

59
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

de perfil. Essa distribuio indica que os sujeitos da sua amostra se


distribuem normalmente em torno de um valor modal.

Figura 1. Curva aproximadamente normal.

Em uma distribuio perfeitamente normal, o ponto mais


elevado ocorre no meio da distribuio, ou seja, a moda, a
mediana e a mdia so iguais. Assim, em uma distribuio normal,
no importa qual medida de tendncia central voc usar, porque
todas produzem o mesmo resultado. Por outro lado, quando se tem
uma distribuio assimtrica, improvvel que a mdia seja repre-
sentativa da maioria das pontuaes. Nesses casos, a maioria dos
pesquisadores prefere utilizar a mediana como uma maneira de
descrever o resultado tpico (Glassman & Hadad, 2008). Alguns
exemplos de variveis com distribuies assimtricas so renda
mensal e nvel de escolaridade da populao.

60
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

As medidas de tendncia central, todavia, nunca devem ser


utilizadas sozinhas, pois, quando o so pelo pesquisador inex-
periente, elas representam os dados de maneira incompleta. As
medidas de variabilidade, por outro lado, nos informam o quanto as
pontuaes esto distribudas em torno do centro. Nesse sentido,
uma medida de tendncia central deve vir sempre acompanhada
de alguma medida de variabilidade. As medidas de variabilidade
mais utilizadas so a amplitude, a varincia e o desvio-padro, as
quais sero discutidas a seguir.
Um indicador simples da variabilidade a amplitude, que
nada mais do que a diferena entre a pontuao mais alta e a
pontuao mais baixa. Por exemplo, para calcular a amplitude
da seguinte distribuio de dados 0, 12, 13, 14, 25, 30, 35, basta
calcular 35 - 0 = 35, ou seja, o valor mais alto menos o valor mais
baixo igual a 35. Como a amplitude s reflete as duas pontuaes
mais extremas, apenas uma medida bruta da variabilidade (Glas-
sman & Hadad, 2008). Embora a amplitude fornea uma ideia da
variao total dos valores, ela, de fato, no fornece uma ideia
global da distribuio dos valores de uma amostra (Dancey &
Reidy, 2004). Por esse motivo, devemos recorrer a outras medidas
de variabilidade.
Uma medida mais informativa da variabilidade dos dados o
desvio padro, caracterizado pela medida de quanto os valores
da nossa amostra variam em torno da mdia. Para calcul-lo,
necessrio, antes, calcular a varincia da distribuio de dados.
Procuramos explicar aqui esses conceitos da forma mais intuitiva
possvel.
De forma simplificada, se subtrairmos a mdia de cada valor
observado, obteremos os desvios, que so uma indicao de quo

61
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

longe cada um desses valores est da mdia. Cada um dos desvios


deve ser elevado ao quadrado para evitar valores negativos. Feito
isso, pode calcular-se a mdia dos desvios ao quadrado para obter
uma indicao da variabilidade do conjunto como um todo. Esse
resultado conhecido como varincia e, embora seja usada de
vrias maneiras pelos estatsticos, ela nos d um nmero inflado,
pois baseada nos quadrados dos desvios, e no nos prprios
desvios em si. Para obtermos uma medida compatvel com os
valores originais das nossas variveis, utilizamos a raiz quadrada
da varincia, que denominada desvio padro (Dancey & Reidy,
2004). Considerados juntos, a mdia e o desvio padro nos dizem
muito sobre o nosso conjunto de dados, pois, em geral, quanto
maior o desvio padro, maior a variabilidade das respostas (Glas-
sman & Hadad, 2008).

Diferenas entre grupos

Uma vez compreendido que as medidas de tendncia central


servem para resumir e organizar um conjunto de dados, necessrio
entender como isso funciona na vida real. No raro encontrar,
nos diferentes estudos realizados em psicologia, perguntas tratando
de diferenas entre grupos. Por exemplo, as mulheres so mais
ciumentas do que os homens? Essa pergunta poderia ser apresen-
tada, em termos de diferenas entre grupos, da seguinte maneira:
Existem diferenas entre mulheres e homens em relao ao cime?
Muitos so os delineamentos possveis para responder a essa
pergunta, isto , podem-se utilizar distintas tcnicas e mtodos
para responder a ela.

62
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

Uma das possibilidades aplicar um instrumento (teste) que


avalie o cime, em homens e mulheres, e, ento, comparar a
pontuao que cada um dos grupos obteve no instrumento em
questo. Contudo, para tornar possvel essa comparao, deve-se
calcular a mdia de cada um desses grupos. S para relembrar,
como j foi explicado, a mdia nada mais do que a soma dos
valores dividida pelo nmero de valores. Por exemplo, se o grupo
de mulheres era composto por 3 mulheres e cada uma obteve uma
pontuao igual a 2 no teste de cime, ento teremos (2 + 2 +
2)/3, isto , a soma dos valores que cada mulher teve dividida pelo
nmero (quantidade) de valores. O resultado, no caso, seria 2.
Outro exemplo, em um estudo realizado por Lopes e cols.
(2006), os pesquisadores buscaram verificar possveis diferenas
entre homens e mulheres em relao neofobia alimentar, que se
refere a uma relutncia em ingerir alimentos novos. Portanto, o
objetivo do estudo foi verificar se homens apresentam mais relu-
tncia do que mulheres, ou vice-versa. No estudo, participaram
266 pessoas, sendo 109 homens e 157 mulheres. Eles utilizaram um
teste que avaliava a neofobia, e, a partir de um procedimento esta-
tstico amplamente conhecido na rea de diferenas entre grupos,
o teste t de Student, verificaram uma tendncia de as mulheres
serem mais neofbicas que os homens. Ou seja, nessa amostra
estudada (j que no participaram todos os homens e todas as
mulheres do mundo), as mulheres tiveram mdias maiores do que
os homens no teste aplicado.
O teste t pode ser utilizado em diferentes condies; para o
caso do estudo de Lopes e cols. (2006), procedeu-se ao teste t para
amostras independentes (j que as pessoas de um grupo no so
as mesmas pessoas do outro grupo). Basicamente, para o clculo

63
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

desse procedimento estatstico, consideram-se diferenas intra-


grupo, ou seja, quanto as respostas das pessoas de um dos grupos
varia, diferenas entre grupos, isto , se h uma tendncia (mdia)
para um grupo obter pontuaes (escores) inferiores ou superiores
em relao ao outro grupo.
Geralmente, dois grupos distintos no apresentaro mdias e
variaes idnticas, por isso, na maior parte dos casos, existiro
diferenas entre dois grupos. Contudo, ser que as diferenas entre
os grupos so suficientes ou significativamente grandes do ponto
de vista estatstico? E, se forem, qual a chance de serem reais (e
no terem ocorrido ao acaso)? Vamos por partes. Primeiro, para
verificar se as diferenas so suficientes, calcula-se o t. De modo
superficial, ele a medida da varincia entre os grupos dividido
pela varincia dentro dos grupos. Assim, quanto maior a varincia
entre grupos em relao varincia intragrupos, maior o valor
de t (Dancey & Reidy, 2006). Isso significa que, para que se tenha
um maior valor de t, e, consequentemente, maior probabilidade
de o teste ser significativo, a diferena entre as mdias dos grupos
deve ser grande, mas os desvios padro dentro dos grupos devem
ser baixos.
Aps o clculo do t, isto , depois de verificar a diferena
entre os grupos, calcula-se a probabilidade de a diferena encon-
trada ser devido ao acaso ou ser real. A comunidade cientfica
adotou o seguinte critrio: para os resultados encontrados nas
pesquisas cientficas serem considerados significativos do ponto
de vista estatstico, deve garantir-se que aquele dado ser encon-
trado novamente (em condies similares pesquisa realizada)
em pelo menos 95% dos casos. Assim, a dvida se o dado ser
ou no encontrado novamente no deve passar de 5% (ou 0,05).

64
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

Chama-se esse clculo de ndice de significncia (indicado pela


letra p).
Outra possibilidade para o uso do teste t, ou seja, de procedi-
mentos estatsticos para comparao de dois grupos (importante:
o teste t possibilita a comparao de dois grupos e no mais que
isso), quando se quer comparar um grupo de pessoas com ele
mesmo. A frmula subjacente ao teste t pareado (comparao
de um grupo com ele mesmo) similar do teste t para amos-
tras independentes, contudo, considera o fato de que as mesmas
pessoas esto sendo comparadas (e, por isso, tende a ser um proce-
dimento mais sensvel).
Esse tipo de procedimento estatstico pode ser utilizado para
casos, por exemplo, em que se quer comparar as pessoas antes de
um determinado fato e depois desse fato. Outra possibilidade de
aplicao desse procedimento para verificar o quanto um deter-
minado grupo varia em um determinado construto. Por exemplo,
Evangelista, Saldanha, Balbinotti, e Barbosa (2010) verificaram
o quanto o grupo de homens atletas (e, posteriormente, o grupo
de mulheres) se diferenciava (intragrupo) em relao a construtos
relacionados s atitudes morais. Os dados apontaram para dife-
renas significativas do ponto de vista estatstico (ou seja, com
pelo menos 95% de segurana de no serem ao acaso) em quatro
das seis dimenses avaliadas no estudo.
Em ambos os casos, amostras independentes e pareado, o
teste t funciona com base em algumas suposies, que so vlidas
para o grupo de procedimentos estatsticos categorizados como
testes paramtricos. Basicamente, a suposio dos testes param-
tricos refere-se distribuio da amostra. Em outros termos, no
caso de procedimentos estatsticos que utilizam a mdia (como o

65
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

teste t), supe-se que os grupos de pessoas apresentam uma distri-


buio normal ou prxima a isso (j discutido anteriormente).
Essa exigncia decorre exatamente do uso da mdia, isto , se as
varincias entre os grupos forem muito desiguais, ento o resultado
verificado no representar nenhum dos grupos (Dancey & Reidy,
2006).
Quando essa suposio no atendida, sugere-se o uso de
testes no paramtricos. Usualmente, o teste Mann-Whitney est
para o teste t para amostras independentes, assim como o teste
Wilcoxon est para o teste t pareado. Ambos tendem a ser bem
mais simples que o teste t, j que no utilizam mdias, desvios
padres e erros padres. Subjacente a esses testes, o raciocnio
imbudo a comparao entre as distribuies dos grupos.
Ao lado disso, ainda em relao comparao entre grupos, em
algumas situaes, torna-se necessria a comparao entre mais
de dois grupos. Para esses casos, nenhum dos testes mencionados
anteriormente vlido. Por isso, utiliza-se a anlise de varincia
(ANOVA), que analisa duas ou mais mdias (ou grupos), buscando
verificar se h ou no alguma diferena significativa do ponto de
vista estatstico (Tabachnick & Fidell, 2007). De modo similar ao
teste t, o conjunto de procedimentos estatsticos que representam
a ANOVA considera tanto a varincia de respostas dentro do
grupo quanto a diferena entre grupos (mdias). Contudo, para o
caso desses procedimentos, no se calcula o t, mas sim o F.
Do procedimento ANOVA, derivam-se resultados de dife-
renas estatsticas (que podem ser ou no significativas) entre
grupos, nos quais as mdias dos mais de dois grupos so comparadas,
e intragrupos, nas quais as varincias entre participantes dentro
dos grupos so verificadas. Por exemplo, no estudo realizado por

66
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

Diniz e Zanini (2010), foram verificadas diferenas entre mdias


de trs grupos diferenciados pela idade nos construtos personali-
dade e coping. Os resultados apresentaram diferena significativa
(portanto, p < 0,05, indicando uma chance menor de 5% dos
dados serem atribudos ao acaso) para trs dimenses relacionadas
personalidade e ao coping das treze possveis.
Cabe ressaltar que a gama de procedimentos que representam
as anlises de varincia bastante ampla e abarca diversas possi-
bilidades de delineamentos. Um critrio inicial que justifica o uso
dessas anlises a existncia de mais de dois grupos (de outro
modo, pode utilizar-se o teste t, por exemplo). A partir disso,
dependendo do tipo de estudo sendo realizado, possvel consi-
derar um nmero amplo de grupos e de variveis independentes
(isto , construtos que esto sendo avaliados), e tambm dife-
rentes variveis dependentes (no caso, aquelas que dividem as
pessoas em grupos). Ainda possvel verificar efeitos entre vari-
veis independentes e dependentes.
Verificam-se, a partir da breve explanao acerca das diferenas
entre grupos, as diversas possibilidades de procedimentos estats-
ticos que podem ser utilizados para observao de diferenas entre
grupos distintos. Essas anlises se diferenciam em complexidade,
isto , o nmero de grupos de pessoas que so capazes de comparar
e o nmero de variveis independentes e dependentes.

Correlaes

Voltando introduo, o estudo de Vendramini, Silva e Dias


(2009) afirma que aqueles estudantes que encaram a estatstica de

67
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

maneira mais positiva tendem a ter melhores notas na disciplina.


Assim, ler este captulo com uma atitude positiva deve melhorar
a sua aprendizagem (assim esperam os autores!). Pode ter certeza
de que no vai doer. De qualquer forma, como as autoras do
estudo citado chegaram a essa concluso? Como voc chegaria a
essa concluso? O teste estatstico que responde a essa pergunta
chama-se correlao. Uma primeira maneira de verificar a relao
entre duas coisas (na linguagem estatstica, duas variveis), mais
racional, seria analisar cada caso individualmente, para depois ver
o todo. Imaginemos que Rafael algum que adora estatstica e
tirou uma nota muito boa. Leonardo, por outro lado, odeia esta-
tstica, e foi muito mal na disciplina. Se houvesse somente alunos
como Rafael e Leonardo, teramos evidncias de que alunos que
gostam de estatstica tendem a se sair melhor na prova.
Todavia, quando se lida com muita gente, existem pessoas que
fogem regra. Podemos ter um aluno como Michelangelo, por um
lado, que ama estatstica, mas, coitado, ficou doente um dia antes
da prova e no teve um bom desempenho. Por outro lado, Dona-
tello, que odeia estatstica, com medo de ter de fazer duas vezes
sua to temida matria, estudou demais e tirou uma excelente
nota. Casos como esses estariam mostrando que no h relao
entre gostar de estatstica e a nota na disciplina.
Mas, como so muitos alunos, possivelmente existiro vrios
Leonardos, Rafais, Donatellos e Michelangelos. Devemos desco-
brir se temos mais Rafais e Leonardos do que Donatellos e
Michelangelos? Existe, entretanto, uma pergunta anterior a essa:
Como saber se um estudante Leonardo, Rafael, Donatello ou
Michelangelo? Ocorre que no h um critrio claro para rotular
se a pessoa gosta ou no de estatstica. Fazer isso seria perder

68
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

a riqueza do dado, pois o que fazer com os que gostam mais ou


menos da matria? E os que gostam mais ou menos para mais?
Enfim, mais interessante pegar a quantificao deste gostar, em
vez de criar rtulos, e o mesmo vale para a nota na matria. Para
no se perder, mais fcil colocar dois eixos em um grfico, no
qual um representa a nota de cada sujeito, e o outro, o quanto tal
sujeito gosta de estatstica (Figura 2). Cada ponto uma pessoa, e
as letras representam as iniciais de onde estariam os alunos Rafael
(R), Leonardo (L), Donatello (D) e Michelangelo (M).

Figura 2. Diagrama de disperso entre o desempenho em estatstica


e as atitudes com relao matria (adaptado de Vendramini, Silva &
Dias, 2009).

69
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Conforme foi observado na amostra, o Michelangelo, ou algum


que gosta de estatstica e se sai mal na disciplina, um aluno hipo-
ttico, que no existe. Ou voc est observando algum ponto
prximo ao M no grfico? Os Donatellos tambm so raros. O
que se observa no grfico que, geralmente, quem tem atitudes
negativas com relao estatstica no se sai bem na prova, e
quem tem atitudes positivas obtm sucesso. Olhando os pontos
espalhados no grfico, conseguimos chegar a essa concluso, ainda
que se trate de uma concluso de olho. Desse modo, precisamos
de algo mais simples e mais preciso para indicar o quanto a relao
entre duas coisas forte.
Para isso serve aquela linha que est no grfico, chamada de
best fit line, ou linha de melhor ajuste. A ideia que essa seja uma
linha reta que represente todos os pontos do grfico da melhor
maneira possvel. Os pontos devem estar prximos a essa linha
para indicar que h correlao positiva, ou seja, que a tendncia
encontrarmos alunos como Rafael e Leonardo na turma de
estatstica. Ambas as variveis crescem juntas, ou seja, quanto
mais positiva a atitude com relao estatstica, melhor o desem-
penho na disciplina. Se essa linha, que melhor representa os
pontos do grfico, estivesse no sentido Donatello-Michelangelo,
essa correlao seria negativa, pois o aumento em uma varivel se
relaciona com a diminuio na outra. Isso significaria que, quanto
mais positiva a atitude com relao estatstica, pior a nota na
matria. Tal concluso, entretanto, no faz sentido, talvez por
isso no tenha sido encontrada nos dados empricos de Vendra-
mini, Silva e Dias (2009), porm esperamos que tenha servido
para voc compreender o conceito de correlao negativa.

70
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

Mas ainda no est to simples. muito ruim trabalhar com


grficos de disperso, como o da Figura 2, pois eles ocupam
muito espao, e temos de nos concentrar muito para entend-
-lo. Alm disso, apenas observando a linha e os pontos, no
possvel ter uma noo muito clara do quo relacionadas so as
duas variveis. Assim, resume-se toda essa informao em um
nmero, que alcanado por meio de um clculo que considera
o quanto cada ponto do grfico est distante da linha de melhor
ajuste. Esse nmero varia de -1 at +1, passando pelo zero. Uma
correlao igual a zero, conforme pode ser deduzido na prpria
linguagem, significa que no existe relao entre duas variveis.
Assim, se quando a atitude com relao estatstica se tornasse
mais positiva, a nota aumentasse ou diminusse aleatoriamente,
ou se houvesse Rafais, Leonardos, Donatellos e Michelangelos
em igual proporo, teramos uma correlao prxima de zero.
Quando os pontos esto espalhados aleatoriamente, qualquer
que seja a linha de melhor ajuste, haveria dificuldade de repre-
sentar bem todos os pontos. Por outro lado, se todos os pontos
do grfico estivessem em cima da linha, ou seja, se no houvesse
distncia alguma entre a linha e os pontos, a correlao seria
perfeita, indicando que o aumento das notas na estatstica estaria
ligado a gostar da matria, sem espao para excees. O valor de
uma correlao perfeita +1, ou -1 se essa correlao perfeita
ocorrer em sentido oposto (o aumento em uma varivel se
relaciona perfeitamente com a diminuio da outra). Para inter-
pretar valores intermedirios a 0 e a 1, torna-se importante a
experincia do pesquisador. Diferentes livros trazem diferentes
critrios; Duffy, Mclean e Monshipouri (2011) interpretam as
correlaes da maneira descrita na Tabela 1.

71
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Tabela 1. Interpretao do coeficiente de correlao de acordo com


Duffy, Mclean e Monshipouri (2011).

Valor Interpretao
0,00 a 0,19 Sem relao ou relao desprezvel
0,20 a 0,29 Relao fraca
0,30 a 0,39 Relao moderada
0,40 a 0,69 Relao forte
0,70 a 1,00 Relao muito forte

Contudo, pode relevar-se esse critrio, considerando que reas


como a psicometria, por medir o psquico, trabalham com maiores
margens de erro do que as engenharias por exemplo. Uma corre-
lao no to forte nas cincias exatas pode ter alguma relevncia
para as humanas. Embora a palavra moderada parea indicar
algo de pouco valor, correlaes moderadas so valiosas para a
psicologia. Caso voc tenha curiosidade, a correlao encontrada
por Vendramini, Silva e Dias (2009) foi de 0,618. Assim, se voc
entendeu o que uma correlao e os demais conceitos deste
captulo, existem dados empricos sugerindo que voc pode estar
comeando a se interessar por estatstica e, desse modo, est en-
trando no grupo do Rafael.

Anlise Fatorial

Correlaes so conceitos importantes na estatstica aplicada


psicologia, mas constituem apenas a base de uma anlise fato-
rial. Tudo aquilo que voc viu foi apenas a relao entre duas
coisas (variveis). Agora, imaginemos a correlao entre diversas

72
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

coisas ao mesmo tempo. Por exemplo, a Tabela 2 mostra diversas


frases para as quais os sujeitos hipotticos que responderam
pesquisa hipottica devem dizer como determinada frase se
aplica a eles, em um contnuo que vai de no se aplica de jeito
nenhum a se aplica totalmente.

Tabela 2. Matriz de correlaes hipotticas da Escala de gosto por


eventos culturais e esportivos.

Frase 1 2 3 4 5 6 7 8
1. Eu gosto de ir a exposies
1
em museus.
2. Eu frequentemente vou ao
+ 1
teatro.
3. Apresentaes circenses
+ + 1
me deixam alegre.
4. Adoro filmes com enredos
+ + + 1
esportivos.
5. Acompanho jogos de
0 0 0 + 1
basquete no ginsio.
6. Toro para meu time de
0 0 0 + + 1
futebol no estdio.
7. Assisti pelo menos a uma
0 0 0 + + + 1
partida de vlei neste ano.
8. A corrupo na poltica 1
0 0 0 0 0 0 0
me revolta.

Caso as afirmaes acima fossem reunidas em uma escala, seria


esperado que sujeitos que gostam de ir ao cinema tambm gostam
de teatro e de circo, ocasionando correlaes positivas entre as

73
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

frases desse grupo (por isso o smbolo +). As pessoas que gostam
de basquete tambm possuem maior tendncia a gostar de futebol
e vlei, criando outro grupo de frases. A frase 4 (Adoro filmes
com enredos esportivos) pode relacionar-se com afirmativas dos
dois grupos. A frase 8 (A corrupo na poltica me revolta), no
entanto, parece no ter relao com nenhum dos dois grupos. Por
outro lado, no se espera que frases de um grupo no se correla-
cionem com as de outro, pois um sujeito que vai ao estdio de
futebol pode ir ou no ao teatro. Note que a correlao entre
uma afirmativa com ela mesma est representada pelo nmero
1, pois se trata de uma correlao perfeita. Um sujeito que gosta
de ir a exposies em museus sempre vai gostar de ir a exposi-
es em museus. Note tambm que metade da tabela vazia, pois
preench-la seria repetir informao.
Uma vez que percebemos que existem dois grupos distintos, o
prximo passo, sempre seguindo o esprito de simplificar, veri-
ficar o que cada grupo de frases tem em comum e refazer a Tabela
2. Em vez de dizer como cada item se relaciona com cada item,
podemos dizer como cada item se relaciona com o grupo de itens.
A Tabela 3 batiza os grupos e mostra quais frases tem a ver (+)
com quais grupos.

74
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

Tabela 3. Matriz Fatorial da Escala de gosto por eventos culturais e


esportivos.
Fator 1. Fator 2.
Frase Eventos Eventos
culturais esportivos
1. Gosto de ir a exposies em
+ 0
museus.
2. Frequentemente vou ao teatro. + 0
3. Apresentaes circenses me
+ 0
deixam alegre.
4. Adoro filmes com enredos
+ +
esportivos.
5. Acompanho jogos de basquete no
0 +
ginsio.
6. Toro por meu time de futebol no
0 +
estdio.
7. Assisti pelo menos a uma partida
0 +
de vlei neste ano.
8. A corrupo na poltica me
0 0
revolta.

Anlise fatorial tem um nome estranho, mas no fundo algo


simples. Cada grupo de frases que se correlacionam pode se chamar
fator. O objetivo da anlise determinar quantos fatores existem
e quais frases (geralmente itens de um teste psicolgico) se rela-
cionam com quais fatores. Cabe salientar que a relao item-fator
(chamada de carga fatorial), a exemplo da correlao, tambm
quantificada com um nmero que varia de - 1 a + 1, obviamente
que passando pelo zero. Uma carga fatorial de 0,32 (Pasquali,

75
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

2005), geralmente arredondada para 0,30, indica que existe


alguma relao entre o item e o fator.
Outro indicador importante a preciso do grupo de frases
(fatores). Quando falamos de escalas, estamos falando de instru-
mentos de medida, e sempre importante verificar a preciso
de uma medida. A preciso de um instrumento indicada pela
relao entre seus itens; se todos os itens estiverem medindo a
mesma coisa de maneira semelhante, ento esse instrumento
preciso. Voc teria alguma hiptese de como verificar essa relao
entre os itens? A resposta est debaixo do seu nariz: por corre-
laes. Nesse caso especfico, o Alfa de Cronbach () o teste
mais famoso, pois indica em um nmero as relaes entre todos os
itens. Esse indicador vai de zero a um e, embora haja controvrsias
sobre qual seria um valor aceitvel para o , convencionou-se que
um teste preciso possui superior a 0,80, sendo que alfas maiores
que 0,70 podem ser considerados aceitveis.

Consideraes finais

Com este texto, visou-se a apresentar informaes e conceitos


tcnicos, prprios da estatstica, de forma leve e acessvel, para
estudantes de psicologia e para profissionais que, por algum
motivo, tenham desenvolvido atitudes no muito positivas em
relao estatstica, mas que necessitem agora de informaes
a respeito. Deve deixar-se claro que este captulo no esgota as
possibilidades de uso dessas tcnicas estatsticas, tampouco explora
de forma aprofundada qualquer conceito matemtico que esteja
por trs dessas anlises. O objetivo foi unicamente apresentar os

76
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

procedimentos e dar alguns exemplos de utilizao prtica, ques-


tionando alguns mitos em relao estatstica na psicologia. O
leitor interessado pode recorrer a uma vasta literatura na rea.
Inclusive, possvel encontrar livros de estatstica aplicados espe-
cificamente psicologia.
Dessa forma, espera-se ter contribudo com a formao de
futuros usurios de testes ou pesquisadores, ao demonstrar que a
estatstica pode ser uma grande aliada dos psiclogos para tomar
decises sobre o futuro das pessoas, seja por meio de pesquisas,
seja por meio da correta interpretao e compreenso das infor-
maes provindas de manuais de testes. As pesquisas mais atuais
usam nmeros para demonstrar seus achados, e espera-se que um
psiclogo esteja por dentro do conhecimento atual na sua rea.
Se voc no gosta de nmeros porque prefere ajudar as pessoas,
deve compreender que o conhecimento das tcnicas estatsticas
far com que ajude as pessoas de uma maneira mais qualificada
e eficaz.

77
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Questes

1) Diferencie amostra de populao.


2) Liste e discuta as medidas de tendncia central e de
variabilidade.
3) Como identificar se os resultados encontrados no ocorre-
ram ao acaso?
4) Em que casos devem-se utilizar procedimentos estatsticos
no paramtricos?
5) Explique a lgica por trs do conceito de correlao positiva.

78
E viveram felizes para sempre: a longa (e necessria) relao entre psicologia e estatstica

Referncias
Bueno, J. M. H., Lemos, C. G., Tom, F. A. M. F. (2004). Interesses profissionais
de um grupo de estudantes de psicologia e suas relaes com inteligncia
e personalidade. Psicologia em estudo, 9 (2), 271-278.

Bunchaft, G & Cavas, C. S. T. (2002). Sob medida: um guia sobre a elaborao


de medidas do comportamento e suas aplicaes. So Paulo: Vetor Editora.

Conselho Federal de Psicologia - CFP (2003). Resoluo n 02/2003. Recupe-


rado em 28 de fevereiro de 2011, de http://www.pol.org.br

Dancey, C. P. & Reidy, J. (2007). Estatstica sem matemtica para psicologia


usando SPSS para Windows. 3a ed. Porto Alegre: Artmed.

Diniz, S. S., & Zanini, D. S. (2010). Relao entre fatores de personalidade e


estratgias de coping em adolescentes. Psico-USF, 15 (1), 71-80.

Duffy, S. P., McLean, S. L. & Monshipouri, M. (2011). Pearsons r correlation.


Recuperado em 20 de fevereiro de 2011, de http://faculty.quinnipiac.edu/
libarts/polsci/Statistics.html

Evangelista, P. H. M., Saldanha, R. P., Balbinotti, C. A. A., Balbinotti, M.


A. B., & Barbosa, M. L. L. (2010). Atitudes morais de jovens atletas
praticantes de modalidades esportivas coletivas: um estudo comparativo
segundo a varivel sexo. Motriz, 16 (2), 379-86.

Ferreira, D. F. (2005). Estatstica bsica. Lavras: Editora UFLA.


Glassman, W. E. & Hadad, M. (2008). Psicologia: abordagens atuais. 4a ed.
Porto Alegre: Artmed.

Hogan, T. P. (2006). Introduo pratica de testes psicolgicos. Rio de Janeiro:


LTC Editora.

Levin, J & Fox, J. A. (2004). Estatstica para Cincias Humanas. 9a ed. So


Paulo: Prentice Hall.

Lopes, F. A., Cabral, J. S. P., Spinelli, L. H. P., Cervenka, L., Yamamoto, M. A.,
Branco, R. C. et al (2006). Comer ou no comer, eis a questo: diferenas
de gneros na neofobia alimentar. Psico-USF, 11 (1), 123-5.

Meira, C. H. M. G. & Nunes, M. L. T. (2005). Psicologia clnica, psicoterapia


e o estudante de psicologia. Paidia, 15 (32), 339-343.

79
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Memria, J. M. P. (2004). Breve histria da estatstica. Braslia: Embrapa Infor-


mao Tecnolgica.

Noronha, A. P. P. & Ambiel, R. A. M. (2008a). Estudo correlacional entre


Escala de Aconselhamento Profissional (EAP) e Self Directed Search
(SDS). Interao em Psicologia, 12 (1), p. 21-33.

Noronha, A. P. P., Nunes, M. F. O. & Ambiel, R. A. M. (2007). Importncia e


domnios de avaliao psicolgica: um estudo com alunos de Psicologia.
Paidia, 17 (37), 231-244.

Pasquali, L. (2003). Psicometria: Teoria dos testes na Psicologia e na Educao.


Petrpolis: Vozes.

Pasquali, L. (2005).Anlise Fatorial para Pesquisadores. Braslia: LabPAM.

Pasquali, L. (2010). Teoria da medida. In L. Pasquali (org.), Instrumentao


psicolgica: fundamentos e prticas. Porto Alegre: Artmed.

Sass, O. (2008) Controle social na sociedade industrial: aproximaes entre


psicologia e estatstica. InterMeio, 14 (28), 41-56.

Schultz, D. P., & Schultz, S. E. (2007). Histria da Psicologia Moderna. 8a ed.


So Paulo: Thomson Learning.

Silva, M. C. R. & Vendramini, C. M. M. (2005). Autoconceito e desempenho


de universitrios na disciplina Estatstica. Psicologia Escolar e Educacional,
9 (2), 261-268.

Tabachnick, B. G., & Fidell, L. S. (2007). Using Multivariate Statistics. 5a ed.


Boston: Allyn & Bacon.

Urbina, S. (2007). Fundamentos da Testagem Psicolgica. Porto Alegre: Artmed


Editora.

Vendramini, C. M. M., Silva, M. C. R. & Dias, A. S. (2009). Avaliao de


atitudes de estudantes de psicologia via modelo de crdito parcial da TRI.
Psico-USF, 14 (3), 287-298.

Yunis, F. A. (2006). Factors influencing the psychology student in dealing with


statistics courses. ICOTS, 7, 1-5.

80
Captulo 4
Teoria de Resposta ao Item na Avaliao
Psicolgica
Felipe Valentini
Jacob Arie Laros

Maria, psicloga recm-formada, na sua primeira experincia


profissional requisitada para realizar uma avaliao das habi-
lidades cognitivas de um cliente. Aps selecionar alguns testes
com pareceres favorveis pelo Sistema Satepsi (disponvel em
www2.pol.org.br/satepsi) e estudar os respectivos manuais,
Maria continua com algumas dvidas: Um dos manuais indica
que os itens possuem dificuldade mdia de 0,50 e boa capaci-
dade discriminativa (correlaes bisseriais entre 0,40 e 0,80).
O que isso indica? Outro manual sugere, por meio da curva de
informao, que o teste mais eficiente ao avaliar pessoas com
escores baixos no construto. O que isso significa? O ltimo teste
aplicado via computador, com base na TAC (Testagem Adaptiva
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Computadorizada), por meio da qual as pessoas podem ser compa-


radas entre si, mesmo respondendo a questes diferentes. Como
isso possvel?
Este captulo foi construdo visando a apresentar os princi-
pais conceitos e discusses acerca da Teoria Clssica dos Testes
(TCT), bem como na Teoria de Resposta ao Item (TRI). Espera-
-se, desse modo, auxiliar os psiclogos e estudantes de graduao
a resolver as dvidas de Maria, assim como outros problemas
que surgem na prtica da Avaliao Psicolgica e que envolvem
conceitos bsicos de psicometria. Primeiramente, sero exploradas
as definies bsicas da TCT. Posteriormente, ser apresentada a
TRI e suas principais aplicaes.

Teoria Clssica dos Testes (TCT)

Em qualquer rea do conhecimento (at mesmo para as cin-


cias exatas), o problema da medida inerente cincia. Como
medir a distncia entre duas estrelas, por exemplo, localizadas a
anos-luz da Terra? Nesse contexto, fcil perceber que as medidas
produzidas (mesmo para o tamanho do parafuso utilizado em naves
espaciais) no esto isentas de erros. Na psicologia, a cincia que
se ocupa da medida e do seu erro a psicometria.
A medida, de acordo com a psicologia, pode ser definida como
a utilizao de nmeros e de categorias para representar um
comportamento (Andrade, Laros & Gouveia, 2010; Nunnally
& Bernstein, 1994). Alm dos comportamentos, a psicometria
moderna interessa-se pela medida do trao latente ou theta (q).
O trao latente pode ser definido como a habilidade, aptido ou

82
Teoria de Resposta ao Item na Avaliao Psicolgica

fator hipottico que organizam e agem sobre os comportamentos


(Pasquali, 2003). Neste sentido, a psicometria moderna ocupa-se
tanto da medida dos comportamentos quanto dos traos latentes.
Um dos aspectos importantes da medida e do erro na TCT, que
se baseia na Teoria do Escore Verdadeiro (TEV), diz respeito
fidedignidade. A teoria parte do pressuposto de que, a despeito do
erro de medida, uma parte dos escores dos examinandos genui-
namente verdadeira. Sendo assim, os escores totais observados (e
a varincia) de um grupo de pessoas so equacionados pela soma
dos escores verdadeiros e do erro. Ou seja, escore observado =
escore verdadeiro + erro (Crocker & Algina, 1986; Hogan, 2006;
Nunnally & Bernstein, 1994).
A fidedignidade refere-se estabilidade dos escores dos sujeitos
em administraes repetidas do mesmo teste ou formas paralelas.
Em outras palavras, a fidedignidade (ou preciso) o grau em que
os escores z de um sujeito permanecem consistentes em admi-
nistraes repetidas de um mesmo teste. Em termos prticos, a
fidedignidade, na TCT, indica a porcentagem que representa o
escore verdadeiro sobre o escore total. Suponha-se, por exemplo,
que o manual de um teste relate um coeficiente de fidedigni-
dade de 0,85. Por meio da equao da TEV, correto afirmar
que 85% da varincia dos escores observados so atribuveis
varincia verdadeira. Alm disso, 15% devem-se varincia de
erro. Ressalta-se, no entanto, que o coeficiente de fidedignidade
para um conjunto de escores um conceito puramente terico
(Crocker & Algina, 1986).
No que se refere ao item, as principais qualidades da medida
avaliadas so a dificuldade, a capacidade de discriminao e a
possibilidade de resposta ao chute (Nunnally & Bernstein, 1994).

83
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

O parmetro da dificuldade do item na TCT operacionali-


zado por meio do clculo da proporo de acerto (Nunnally &
Bernstein, 1994). Um item, por exemplo, submetido a cem parti-
cipantes e respondido corretamente por oitenta deles, teria o seu
parmetro de dificuldade igual a 0,80 (ou seja, 80/100=0,80), indi-
cando que, em mdia, 80% das pessoas acertam o item. Nota-se
que esse indicador de dificuldade apresentado em uma escala
invertida: quanto maior o parmetro de dificuldade, mais fcil
o item, pois uma proporo maior de pessoas consegue responder-
-lhe corretamente. Por esse motivo, tem-se dito que o parmetro
de dificuldade na TCT, na realidade, um indicador de facilidade
do item.
O parmetro discriminao diz respeito qualidade do item
em separar os examinandos em grupos conforme suas capacidades
(ou escores). Ou seja, o poder do item est em distinguir sujeitos
com escores relativamente parecidos. Um item pouco discrimina-
tivo tem sua utilidade diminuda, uma vez que pouco auxilia o
teste a separar as pessoas mais habilidosas das menos habilidosas.
Na TCT, a discriminao avaliada, principalmente, por meio
da correlao bisserial ou pela correlao ponto-bisserial entre o
item e o escore total. Neste aspecto, esperada uma correlao
item-total positiva, refletindo o fato de que as respostas corretas
ao item so mais frequentes nos examinandos com escores
totais altos. Quanto maior a correlao, maior a discriminao
(Hambleton, Swaminathan & Rogers, 1991; Nunnally & Bern-
stein, 1994; Pasquali, 2003). Correlaes negativas indicam que
as respostas corretas ao item so mais frequentes nos examinandos
com os menores escores totais. Neste caso, h indcios de que o

84
Teoria de Resposta ao Item na Avaliao Psicolgica

item apresenta algum problema, normalmente relacionado troca


de gabarito (Andrade, Laros & Gouveia, 2010).
Finalmente, na TCT, a avaliao da possibilidade de acerto ao
acaso (ou chute) dada em funo do nmero de alternativas
de resposta. Por exemplo, um item de mltipla escolha com quatro
alternativas (A, B, C e D) possui 25% (1 item / 4 alternativas =
0,25) de chance de acerto devido ao acaso (Nunnally & Bern-
stein, 1994). O pressuposto que o examinando que no tem a
habilidade suficiente para dar a resposta chutar cegamente, sem
avaliar qual das respostas a mais provvel. Destaca-se que este
pressuposto da TCT foi amplamente criticado, uma vez que, em
geral, as alternativas incorretas no tm a mesma atratividade
(Embretson & Reise, 2000; Crocker & Algina, 1986; Hambleton,
Swaminathan & Rogers, 1991).
Uma das principais limitaes das medidas obtidas por meio
da TCT que as estatsticas de pessoas (os escores) so depen-
dentes das caractersticas psicomtricas dos itens, e as estatsticas
psicomtricas de itens so dependentes das caractersticas do
grupo de examinandos. Suponha-se que um mesmo teste seja apli-
cado a dois grupos de pessoas com caractersticas distintas, e um
dos grupos bem mais habilidoso do que o outro. Neste caso, o
parmetro da dificuldade do teste receberia diferentes indicadores
para o primeiro e para o segundo grupo. No entanto, o parmetro
da dificuldade deveria ser uma caracterstica do teste e no dos
examinandos (Andrade, Laros & Gouveia, 2010; Hambleton,
Swaminathan & Rogers, 1991; Nunes & Primi, 2009).
A Teoria de Resposta ao Item (TRI) surgiu como uma proposta
para lidar com estes e outros problemas da TCT. A seguir, sero
discutidos os principais aspectos e as aplicaes da TRI.

85
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Teoria de Resposta ao Item (TRI)

Conceitos Bsicos

A TRI conjunto de modelos que procuram representar a


probabilidade de uma pessoa apresentar uma determinada resposta
a um item, considerando os parmetros do item e o nvel de habi-
lidade da pessoa avaliada (Andrade, Tavares & Valle, 2000). O
surgimento da TRI representou avanos em alguns aspectos da
psicometria, pois, por intermdio dela, possvel estimar os par-
metros dos itens de maneira independente do grupo avaliado,
assim como estimar as habilidades dos participantes de maneira
independente das caractersticas psicomtricas dos itens. Alm
disso, outro avano que o item pode ser considerado individual-
mente em vez do teste como um todo. Finalmente, a fidedignidade
do teste pode ser avaliada para diferentes nveis de habilidade,
gerando indicadores mais precisos (Andrade, Laros & Gouveia,
2010; Hambleton & Swaminathan, 1985; Hambleton, Swamina-
than & Rogers, 1991; Pasquali & Primi, 2003).
A TRI tambm conhecida como a Teoria do Trao Latente,
pois considera que as respostas observadas de um teste esto
embasadas em traos latentes ou habilidades no observveis
(Hambleton & Swaminathan, 1985; Pasquali, 2007), sendo as
habilidades representadas pelo q (theta), o maior foco da teoria.
Neste modelo torico, adota-se uma escala padronizada para
mensurao deste valor. Essa escala possui distribuio semelhante
ao escore z, podendo assumir valores entre - (infinito) a +
(Hambleton & Swaminathan, 1985; Pasquali, 2007). Todavia, na
maior parte das vezes, o theta varia entre -3 e +3.

86
Teoria de Resposta ao Item na Avaliao Psicolgica

A TRI possui dois postulados gerais. O primeiro indica que o


desempenho (ou escore) de uma pessoa num determinado item
pode ser explicado unicamente pelo trao latente da pessoa e
pelas caractersticas do item. Ou seja, a partir do q do participante
e das caractersticas do item, possvel estimar a probabilidade
de ele acertar o item (ou endoss-lo, em escalas de preferncia).
O segundo postulado indica que possvel expressar a probabi-
lidade do desempenho em funo do q, por meio de uma curva
ascendente, denominada Curva Caracterstica do Item CCI
(Andrade, Laros & Gouveia, 2010; Baker, 2001; Hambleton &
Swaminathan, 1985; Nunes & Primi, 2009). A CCI especifica que
a probalidade de resposta correta maior conforme o aumento
da habilidade. Entretanto, digno de nota que esta relao no
linear, conforme a Figura 1 (Andrade, Tavares & Valle, 2000;
Baker, 2001; Hambleton & Swaminathan, 1985).

Figura 1. Curva Caracterstica do Item (CCI).

87
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Por meio da curva de CCI, tambm possvel identificar os


parmetros de dificuldade (b), discriminao (a) e acerto ao acaso
(c) dos itens. O valor do parmetro b representa o tamanho de
q necessrio para que o item seja respondido corretamente ou
endossado. Mais especificamente, o b representa a habilidade q
necessria para uma probabilidade de acerto igual a (1 + c)/2. No
exemplo da Figura 1, c = 1, portanto (1+0,1)/2 = 0,55. Sendo
assim, um q de aproximadamente 0 suficiente para que a proba-
bilidade de acerto seja de 0,55 (o que indica que se trata de um
item de dificuldade mdia). Assim, quando maior o valor de b,
mais difcil o item (Andrade, Tavares & Valle, 2000; Hambleton
& Swaminathan,1985).
Para a discriminao do item, considera-se a inclinao da
curva. Por esse motivo, o parmetro a tambm conhecido como
slope (inclinao). Mais especificamente, o parmetro a representa
a inclinao da derivada da tangente (linha pontilhada e inclinada
na Figura 1) da CCI no momento em que ela incide sobre o par-
metro b, isto , o ponto de inflexo. Quanto maior a inclinao,
maior a discriminao do item. Baixos valores de a indicam que o
item tem pouco poder para diferenciar examinandos com habili-
dades q semelhantes (Andrade, Tavares & Valle, 2000; Hambleton
& Swaminathan, 1985).
Nos testes de mltipla escolha, esperado que algumas pessoas,
mesmo com habilidades muito baixas, lhes respondam correta-
mente devido ao acaso (ou chute). Para indicar o tamanho
deste efeito, utiliza-se o parmetro c, que se refere simples-
mente probabilidade de acerto ao acaso. Em outras palavras, o
parmetro c indica a probabilidade de um aluno com baixa habi-
lidade responder corretamente ao item. Na CCI, este parmetro

88
Teoria de Resposta ao Item na Avaliao Psicolgica

corresponde ao valor no qual a curva intercepta o eixo das orde-


nadas Y (eixo da probabilidade de acerto, neste caso). Na Figura
1, o item apresenta o parmetro c estimado em 0,10. Ou seja, uma
pessoa, mesmo com habilidade muito baixa, possui cerca de 10%
de chances de responder corretamente ao item devido ao acaso
(Andrade, Tavares & Valle, 2000; Hambleton & Swaminathan,
1985).
Uma das vantagens da TRI, em comparao com a TCT,
refere-se estimao dos parmetros de itens e da habilidade do
examinando. Na TRI, pelo menos teoricamente, a estimativa de
habilidade do examinando no depende dos parmetros dos itens,
assim como os parmetros dos itens independem das habilidades
dos participantes. Ressalta-se que esta independncia somente
ocorre quando os pressupostos da TRI so satisfeitos e quando os
dados se adequam ao modelo da TRI.
Na parte inferior da Figura 2, so indicadas as distribuies de
habilidades dos grupos A e B. Nota-se que o grupo B , em mdia,
um pouco mais habilidoso do que o grupo A. Caso este item
fosse analisado pela TCT, a proporo de questes respondidas
corretamente seria maior para o grupo B. Consequentemente,
o parmetro dificuldade acompanharia esta tendncia, e o item
seria estimado como mais fcil para o grupo B do que para o
grupo A. Entretanto, na TRI, embora as curvas de distribuio
das habilidades do grupo A e B sejam diferentes, conforme Figura
2, as estimativas vo resultar na mesma CCI (se os pressupostos
da TRI forem satisfeitos). Sendo assim, o item e a habilidade so
compreendidos como invariantes (Hambleton & Swaminathan,
1985).

89
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Figura 2. Curva Caracterstica do Item estimada para dois grupos com


distribuies de habilidades q diferentes.

Outro conceito bsico importante para a TRI o da Curva de


Informao (CI). Existem dois tipos de CI: Uma para o item (CII
- Curva de Informao do Item) e uma para o teste (CIT - Curva
de Informao do Teste). Ambas so definidas como a quantidade
de informao fornecida pelo item (ou teste) para avaliao de
uma habilidade q (Andrade, Laros & Gouveia, 2010; Pasquali,
2007). Por meio dela, possvel avaliar para quais intervalos de
habilidade o item mais til, considerando a maior quantidade
de informao, bem como para qual faixa eles agregam mais erro
do que informao. Ressalta-se que cada item de um teste possui
uma CII, contribuindo para a CIT geral do teste. Alguns aspectos
podem impactar na informao de um teste: (a) quanto maior a
discriminiao dos itens (parmetro a), maior ser a informao;
(b) a CI maior quando o parmetro b for igual ao q mdio do
grupo de examinandos; (c) a CI diminui em funo do acerto ao

90
Teoria de Resposta ao Item na Avaliao Psicolgica

acaso (parmetro c); (d) a CI aumenta conforme o acrscimo de


itens (Baker, 2001).
A Figura 3 reproduz uma CIT ilustrativa de um teste. A curva
de linha contnua indica a informao do teste para os diferentes
nveis de q, enquanto a curva de linha pontilhada indica o erro
padro de medida. Neste exemplo, a maior quantidade de infor-
mao relativa s habilidades entre -1 e 0. Para os nveis de
q inferiores a -2 e superiores a +1, o teste produz mais erro do
que informao legtima. Em suma, possvel avaliar que o teste,
neste exemplo, seria mais indicado para pessoas com habilidades
mdias.

Figura 3. Curva de informao do teste (CIT).

Modelos da TRI

Hambleton, Swaminathan e Rogers (1991) salientaram que, em-


bora seja possvel conceber um nmero bastante grande de modelos

91
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

de TRI, poucos so utilizados na prtica. O nmero de parmetros


estimados e o tipo de resposta ao item (dicotmico e escala Likert,
por exemplo) so as principais caractersticas que diferenciam
os modelos. De maneira geral, os mais utilizados so os modelos
logsticos de um, dois e trs parmetros para itens dicotmicos,
bem como os modelos para itens politmicos (Andrade, Laros &
Gouveia, 2010).
O modelo de um parmetro foi criado por Rasch (1960) e,
posteriormente, adaptado para um modelo logstico por Wright
e Stone (1979). Nesta perspectiva, avaliada somente a dificul-
dade dos itens, ou seja, o parmetro b. Sendo assim, assume-se
que a dificuldade do item a nica caracterstica deste que
influencia o desempenho do examinando. Alm disso, pressupe-
-se que todos os itens possuem nveis iguais de discriminao. Na
escala q, itens com b inferiores a -2 podem ser considerados fceis
e itens com b superiores a +2, difceis (Hambleton & Swamina-
than, 1985). A equao do modelo logstico de um parmetro
definida como segue:

1
P (Uij = 1 | q j) =
1 + e-D (qj bi )

Onde:

P (Uij= 1 | q j) = a probabilidade de um indivduo com


habilidade qj responder corretamente ao item i;

92
Teoria de Resposta ao Item na Avaliao Psicolgica

D = uma constante e igual a 1 (quando se deseja com-


parar o modelo logstico com os resultados obtidos pelo
modelo da funo ogiva normal, utiliza-se D = 1,7);
E = uma constante igual a 2,718;
bi = o parmetro de dificuldade do item i.

Espera-se que essa equao no cause pesadelos Maria, que


est buscando auxlio a uma demanda de avaliao psicolgica
prtica. Entretanto, esta equao diz respeito simplesmente
curva que representa o modelo de um parmetro. Retirando as
constantes E e D, restar apenas o parmetro b e o q, que deter-
minam a probabilidade de acertar o item.
O modelo de dois parmetros foi desenvolvido por Lord (1980),
sendo adaptado posteriormente por outros autores. Neste modelo,
alm do parmetro de dificuldade b, tambm se avalia a capaci-
dade discriminativa dos itens (parmetro a). Segue a equao do
modelo de dois parmetros:

1
P (Uij = 1 | q j) =
1 + e-D ai (qj bi )

Maria deve ter notado que a nica alterao da equao do


modelo de um parmetro para o de dois parmetros a insero da
letra aj,que corresponde, exatamente, discriminao do item j.
Na CCI, este parmetro se refere inclinao da curva, sendo que
as curvas mais inclinadas indicam itens mais teis para diferenciar
as habilidades dos avaliandos (Andrade, Laros & Gouveia, 2010).

93
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Teoricamente, o parmetro a pode assumir valores entre - e


+. Entretanto, itens com discriminao menor do que 0 devem
ser excludos, pois algo deve estar errado com eles. Isso ocorre,
geralmente, em razo de um gabarito errado ou de itens confusos,
nos quais h mais de uma alternativa correta. Portanto, na prtica,
a discriminao varia de 0 a 2. Baker (2001) afirma que os valores
de b entre 0,65 e 1,34 indicam um poder discriminativo mode-
rado do item; entre 1,35 e 1,69, alto; acima de 1,70, muito alto.
Embora sejam desejveis itens com discriminao minimamente
moderada, itens extremamente discriminativos no so teis para
algumas situaes de avaliao psicolgica, pois separam os indiv-
duos basicamente em dois grupos (com e sem habilidade q).
O modelo logstico de trs parmetros, tambm desenvolvido
por Lord (1974, 1980), acrescentou a probabilidade de acerto ao
acaso, ou pseudoprobabilidade de acerto (representado pela letra
c). Para a equao deste modelo, Maria j espera que seja inse-
rido apenas o valor do parmetro c (e alguns ajustes, obviamente).
Sendo assim, a equao do modelo de trs parmetros pode ser
escrita da seguinte forma:

1
P (Uij = 1 | q j) = ci + (1 ci )
1 + e-D ai (qj bi )

Este modelo bastante til para os testes nos quais so ofere-


cidas as alternativas de respostas (ou opes de marcao).
O parmetro c pode variar de zero a um. Espera-se que, para
itens bons com cinco alternativas, o parmetro c no ultrapasse
0,20 (1 / 5 alternativas = 0,2); para quatro alternativas, o valor
mximo seria de 0,25 (Andrade, Laros & Gouveia, 2010). Para

94
Teoria de Resposta ao Item na Avaliao Psicolgica

itens problemticos, o parmetro c aumenta com a presena de


alternativas no atraentes ou que estejam obviamente incorretas.
Ou seja, para os itens nos quais bastante fcil detectar uma ou
duas alternativas incorretas, restaro apenas outras duas ou trs
alternativas para o chute, o que aumenta a probabilidade de
acerto ao acaso.
Os modelos anteriormente apresentados pressupem a utiliza-
o de itens dicotmicos. Na prtica, estes so os mais utilizados
pelos profissionais da rea. Todavia, necessrio destacar que uma
grande parte dos testes psicolgicos utilizam itens politmicos
(escala Likert de quatro pontos, por exemplo). Para que a TRI seja
utilizada na construo destes instrumentos, alguns modelos para
escalas politmicas foram propostos (veja, por exemplo, Andrich,
1978; Samejima, 1974).
Nos modelos de TRI para itens politmicos, so estimadas as
probalidades de um participante dar a resposta da categoria x ao
item i. Sendo assim, passa-se a avaliar a probabilidade de endosso
da categoria x, em vez da resposta certa. O tipo de escala utilizada
pelo item a diferena bsica entre os dois principais modelos.
O modelo de resposta gradual de Samejima (1974) assume que
as categorias do item podem ser ordenadas entre si, enquanto o
modelo de escala gradual proposto por Andrich (1978) assume
que, alm da possibilidade de ordenar as categorias, os escores das
categorias so igualmente espaados.
Nota-se que os modelos politmicos so representados, grafi-
camente, por meio das CCIs, em relao s categorias, alm da
habilidade e da probabilidade de endosso (Andrade, Tavares &
Valle, 2000). Na Figura 4, apresentado um exemplo de CCI para
itens politmicos (modelo de escala gradual).

95
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Figura 4. CCIs para um item politmico.

A Figura 4 refere-se a um item politmico com quatro possibi-


lidades de resposta. Portanto, so apresentadas quatro curvas, cuja
ordem indica que os participantes com maiores nveis de habili-
dade (ou trao latente, neste caso) tendem a endossar as categorias
que representam os valores mais altos (Andrade, Tavares & Valle,
2000). Suponha-se, por exemplo, que o item corresponda
avaliao do sentimento de felicidade na ltima semana. A cate-
goria 0 indicaria a resposta de pouco feliz e a categoria 3, muito
feliz. Na Figura 3, pessoas com q at -1 tenderiam a endossar a
categoria 0. J as pessoas com q entre -1 e 0 tenderiam a alcanar
a categoria 1. A maior probabilidade de resposta para as pessoas
com com q entre 0 e +1 a categoria 2. Finalmente, as pessoas
com q maior do que +1 tenderiam a endossar a categoria 3.

Pressupostos

Da mesma forma que outros modelos de estimao, a TRI possui


alguns pressupostos. Um deles diz respeito unidimensionalidade,

96
Teoria de Resposta ao Item na Avaliao Psicolgica

ou seja, para estimao dos parmetros, condio necessria


que o conjunto de itens avalie apenas um nico trao latente. As
respostas a um teste de matemtica, por exemplo, no podem sofrer
influncia da compreenso de lngua portuguesa dos participantes.
O problema deste pressuposto, entretanto, que ele dificilmente
pode ser plenamente satisfeito. As respostas a um teste de inte-
ligncia, por exemplo, com frequncia no esto isentas de uma
srie de outros aspectos, tais como motivao, experincia prvia
em outras testagens, calma para responder, etc. Para resolver este
paradoxo, alguns autores tm ressaltado que a presena de um
trao latente dominante o suficiente para satisfazer este pres-
suposto (Hambleton, Swaminathan & Rogers, 1991; Cond &
Laros, 2007; Laros, Pasquali & Rodrigues, 2000; Vitria, Almeida
& Primi, 2006).
Destaca-se que, a despeito das dificuldades, importante
avaliar a unidimensionalidade. Cond e Laros (2007) concluram,
por meio de um estudo emprico com aproximadamente 19 mil
alunos, que a estimao da habilidade apresenta menor relao
com a dificuldade do conjunto de itens conforme aumenta a unidi-
mensionalidade. Em outra palavras, a invarincia das estimativas
da habilidade (uma das vantagens da TRI sobre a TCT) aumenta
em funo da unidimensionalidade. No intuito de avaliar este
pressuposto, a Anlise Fatorial de Informao Plena (Full Informa-
tion Factor Analysis FIFA) frequentemente utilizada para itens
dicotmicos. Para os testes que avaliam mais de uma dimenso
(por exemplo, testes de personalidade), uma soluo adotada
estimar os parmetros dos itens para cada fator. Neste caso, deve
garantir-se a unidimensionalidade dos fatores por meio de uma
anlise fatorial prvia.

97
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Outro pressuposto importante o da independncia local. Ele


visa a garantir que os itens sejam respondidos exclusivamente em
funo da habilidade q dominante. Em outras palavras, a resposta
de um examinando a um item x no afeta sua resposta aos demais
itens (Andrade, Laros & Gouveia, 2010; Hambleton & Swamina-
than, 1985; Lord, 1980). Em caso de violao do pressuposto, as
respostas dos participantes passam a sofrer influncias de aspectos
no controlados na anlise, por exemplo, se o prprio item
oferecer sugestes da resposta correta, algumas pessoas as perce-
bero e outras no. Neste caso, o fator perceber as dicas estaria
influenciando as respostas dos examinandos, sem o controle do
pesquisador. A melhor maneira de lidar com este problema
previni-lo durante a construo dos itens (Embreston & Reise,
2000). Em geral, o pressuposto da independncia local pode ser
assumido uma vez que o pressuposto da unidimensionalidade
satisfeito (Cond & Laros, 2007; Pasquali & Primi, 2003).
O tamanho da amostra, embora no seja exatamente um pres-
suposto, tambm um aspecto importante da TRI. A amostra
tem sido um calcanhar de Aquiles para a psicologia e para as
cincias humanas em geral. Na TRI, no h concenso sobre o
seu tamanho ideal, ainda que alguns autores sugiram um nmero
mnimo entre cem e trezentos participantes (Comrey & Lee,
1992; Pasquali, 2007). A despeito de tal divergncia, um ponto
de corte testado empiricamente foi apresentado por Nunes e Primi
(2005). Eles avaliaram diversas subamostras de um banco com 44
mil participantes, e as concluses indicaram que as estimativas dos
parmetros tendem a ser mais estveis quando geradas com amos-
tras maiores de duzentos sujeitos.

98
Teoria de Resposta ao Item na Avaliao Psicolgica

Principais aplicaes

Tendo discutido os conceitos bsicos, modelos e pressupostos


da TRI, sero apresentadas, nesta seo, algumas das principais
aplicaes dela. Destaca-se a construo de instrumentos, a equa-
lizao e a testagem computadorizada.
Inegavelmente, a principal utilizao da TRI na construo
de instrumentos e nas anlise das suas qualidades psicomtricas.
Nunes e Primi (2009) descatam o frequente uso da TRI na seleo
dos itens para as verses finais dos instrumentos. Normalmente,
a partir dos parmetros estimados, selecionam-se os itens mais
discriminativos, bem como os que apresentam os nveis de difi-
culdade mais adequados para a populao alvo do teste. Sendo
assim, buscam-se eliminar os itens que pouco contribuem para
curva de informao do teste. Por meio desta seleo, tambm
possvel diminuir o nmero de itens do teste, sem, no entanto,
causar impacto negativo na qualidade do instrumento. Algumas
pesquisas brasileiras fizeram uso da TRI na construo de instru-
mentos, como os testes de inteligncia WISC-III (Nascimento
& Figueiredo, 2002), BPR-5 (Primi & Almeida, 1998) e SON-R
2-7 (Laros, Tellegen, Jesus & Karino, 2011) e a Bateria Fatorial
de Personalidade (Nunes, Hutz & Nunes, 2008).
Outra importante aplicao da TRI diz respeito ao processo de
equalizao. Este objetiva tornar comparveis os escores de dois
grupos de pessoas (ou mais) submetidos a duas verses distintas
de um teste, desde que ambos avaliem o mesmo construto (Kolen
& Brennan, 2010). Por exemplo, o escore de Maria no teste de
inteligncia x torna-se comparvel com o escore de Joo no teste
de inteligncia y, desde que mantidos alguns pressupostos. Este

99
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

procedimento bastane til quando no possvel aplicar o


mesmo instrumento em dois momentos e/ou grupos. Por exemplo,
um pesquisador est interessado em avaliar o desenvolvimento
cognitivo de bebs, crianas, adolescente e adultos. Considerando
a dificuldade de encontrar um nico instrumento que avalie todas
estas faixas etrias, o pesquisador constri quatro testes e os aplica.
Obviamente, ele bastante inteligente e pensou nos pressupostos,
o que lhe permitiu comparar o desenvolvimento cognitivo dos
quatro grupos submetidos a quatro testes diferentes.
A equalizao na TRI possvel ao considerar que a estimao
da habilidade q de um examinando invariante entre os itens do
teste. Ou seja, conhecidos os parmetros dos itens, dois grupos
de participantes que respondem a dois testes distintos tero suas
habilidades estimadas na mesma escala, tornando-os comparveis.
A psicloga recm-formada Maria, agora, deve entender como tal
comparao possvel. Entretanto, ainda necessrio inform-
la de que isso pode ser realizado somente se alguns pressupostos
forem observados. Alm dos pressupostos usuais da TRI discutidos
anteriormente, importante que ambos os testes (ou subtestes)
avaliem exatamente o mesmo construto psicolgico. Caso um
teste avalie ansiedade e outro depresso, por exemplo, o processo
de equalizao torna-se invivel.
Outro pressuposto importante a presena de um delinea-
mento que permita lincar os diferentes testes (linking designs).
Embora existam quatro ou cinco delineamentos conhecidos, os
mais utilizados so o de itens ncoras e o de grupos em comum.
No primeiro (delineamento de itens ncoras), so construdos dois
ou mais testes distintos, mas que mantm alguns itens (ncoras)
em comum, por meio dos quais os testes so lincados. Outro

100
Teoria de Resposta ao Item na Avaliao Psicolgica

delineamento possvel diz respeito construo de testes distintos


para grupos distintos, mas tambm aplicados, concomitantemente,
a um grupo comum. Neste caso, o grupo comum responderia a
ambos os testes, permitindo o linque (Hambleton, Swaminathan
& Rogers, 1991).
Finalmente, a TRI utilizada nas principais testagens adapta-
tivas computadorizadas (TAC - Computerized Adaptative Testing,
CAT). Baseando-se nos parmetros da TRI, um sistema infor-
matizado seleciona e aplica os itens mais adaptados ao perfil do
participante. Maria deve estar lembrada que, por meio da curva
de informao, possvel saber para quais nveis de habilidade um
determinado item mais indicado. Por um lado, a aplicao de
itens de inteligncia muito difceis, por exemplo, pode facilmente
desestimular um examinando com baixas habilidades cognitivas.
Por outro lado, itens muito fceis podem ser ridicularizados por
pessoas com altas habilidades cognitivas. Sendo assim, a aplicao
de itens de dificuldade condizentes com a habilidade q do partici-
pante pode aumentar a confiabilidade dos escores e diminuir o
tempo de aplicao (Hambleton, Swaminathan & Rogers, 1991;
Nunes & Primi, 2009).
Embora os algoritmos envolvidos sejam complexos, a lgica
da TAC bastante simples. O computador, primeiramente, sele-
ciona alguns itens de boa discriminao e dificuldade mdia.
Ento, realizada uma estimativa preliminar da habilidade q do
examinando, com base nas respostas aos itens iniciais. Conforme
o participante erra ou acerta, o computador seleciona e apresenta,
respectivamente, itens mais fceis ou difceis, processo durante o
qual a estimativa de habilidade ajustada. O computador encerra
o processo ao atingir um nmero predeterminado de itens e/ou

101
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

um valor de erro mnimo, tambm predeterminado (Hambleton,


Swaminathan & Rogers, 1991).
Alm das vantagens de maior precisso e menor tempo de tes-
tagem oferecidas pela TAC, ela reduz consideravelmente o grave
problema relacionado divulgao dos gabaritos e das respostas
dos testes (Nunes & Primi, 2009). Ora, os itens respondidos por
um participante so distintos daqueles respondidos por outro
participante, e assim por diante. Alguns itens so obviamente
repetidos, mas apresentados, normalmente, em ordem diferente.
Tudo isso dificulta o processo de memorizao, cpia e divulgao
dos itens, evitando fraudes nos processos de avaliao psicolgica.
Obviamente, quanto mais amplo e melhor for o banco de itens
disponveis ao sistema informatizado, mais precisos sero os resul-
tados e menores sero os problemas com a divulgao do teste.
Reside aqui a principal dificuldade da TAC: custo! Para montar
um banco suficientemente grande e bom, o custo financeiro
razoavelmente elevado.
No seria justo encerrar este subcaptulo sem mencionar as
aplicaes nas avaliaes educacionais. Sem dvida, a TRI tem
sido bastante til em provas nacionais, tais como ENEM, SAEB,
na avaliao dos estudantes de So Paulo, do Rio de Janeiro e da
Bahia, dentre outros, bem como em avaliaes internacionais, tais
como o SAT (EUA) e o exame TOEFL. Todavia esta discusso
extrapola o escopo deste captulo. Para outras informaes,
sugerem-se as seguintes referncias: Andrade, Laros e Gouveia
(2010); Laros, Pasquali e Rorigues (2000); Nunes e Primi (2009),
dentre outros.

102
Teoria de Resposta ao Item na Avaliao Psicolgica

Consideraes finais

Este captulo teve como objetivo apresentar uma introduo


sobre a Teoria Clssica dos Testes e a Teoria de Resposta ao Item.
Embora se tenham explicado brevemente os principais aspectos
da TCT, nosso foco maior era discutir a TRI, considerando sua
crescente utilizao, o que, obviamente, no reflexo da impor-
tncia das teorias. Embora a TRI represente alguns avanos na
cincia psicomtrica, a TCT, de forma alguma, deve perder o
seu espao, na medida em que ainda bastante til em diversos
contextos. ATCT, aparentemente, apresenta a vantagem de
maior robustez violao dos pressupostos da TRI. Alm disso,
existe um nmero relativamente restrito de pesquisas sobre o
efeito de tais violaes nas estimativas dos parmetros e habi-
lidades geradas pela TRI. Ademais, a TCT e a TRI apresentam
correlaes altas no que diz respeito s estimativas de dificuldade
e de habilidade, indicando que elas so parecidas nesses aspectos
(Fan, 1998; MacDonald & Paunonen, 2002).
Espera-se que este captulo tenha auxiliado a psicloga Maria a
resolver as suas dvidas. Maria precisa escolher, aplicar e analisar
alguns testes psicolgicos. Esta tarefa deve estar embasada na
adequao dos instrumentos demanda de avaliao, bem como
na qualidade psicomtrica dos instrumentos. Portanto, acredita-se
que o conhecimento bsico de psicometria fundamental para a
utilizao adequada dos testes psicolgicos.

103
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Questes

1) Quais so as vantagens e desvantagens da TRI? Tais van-


tagens e desvantagens indicam que se deva abandonar a
TCT?
2) Elabore um quadro resumo contendo os principais conceitos
e as principais caractersticas da estimao dos parmetros
de dificuldade, discriminao e chute na TCT e na TRI.
Destaque as principais semelhanas e diferenas.
3) Defina a Curva de Informao do Teste e a Curva de Infor-
mao do Item. Indique suas principais utilidades.
4) Quais so os pressupostos dos principais modelos da TRI?
Por que importante avali-los?
5) Quais so as principais aplicaes da TRI? Qual delas voc
julga ser a mais relevante para a avaliao psicolgica (jus-
tifique a sua escolha)?

104
Teoria de Resposta ao Item na Avaliao Psicolgica

Referncias
Andrade, D. F. de, Tavares, H. R., & Valle, R. da C. (2000). Teoria de resposta ao
item: conceitos e aplicaes. So Paulo: Associao Brasileira de Estatstica.

Andrade, J. M., Laros, J. A., & Gouveia, V. V. (2010). O uso da Teoria de


Resposta ao Item em avaliaes educacionais: Diretrizes para pesquisa-
dores. Avaliao Psicolgica, 9, 421-435.

Andrich, D. (1978). A rating formulation for ordered response categories.


Psychometrika, 43, 561-573.

Baker, F. B. (2001). The basics of item response theory (2nd ed.). New York: Eric
Clearinghouse on Assessment and Evaluation.

Comrey, A. L., & Lee, H. B. (1992). A first course for identifying biased test
items. Hillsdale: Erlbaum.

Cond, F. N., & Laros, J. A. (2007). Unidimensionalidade e propriedade de


invarincia das estimativas da habilidade pela TRI. Avaliao Psicolgica,
6, 205-215.

Crocker, L., & Algina, J. (1986). Introduction to classical and modern test theory.
New York: Harcourt Publishers.

Embretson, S. E., & Reise, S. P. (2000). Item response theory for psychologists.
Mahwah: Lawrence Erlbaum.

Fan, X. (1998). Item response theory and classical test theory: an empirical
comparison of their item/person statistics. Educational and Psychological
Measurement, 58, 357-381.

Hambleton, R. K., & Swaminathan, H. (1985). Item Response Theory: Princi-


ples and Applications. Boston: Kluwer Nijhoff Publishing.

Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of


Item Response Theory. London: Sage.

Hogan, T. P. (2006). Introduo prtica de testes psicolgicos. Rio de Janeiro:


LTC - Livros Tcnicos e Cientficos Editora.

Kolen, M. J., & Brennan, R. L. (2010). Test Equating, Scaling, and Linking:
Methods and Practices (2nd ed.). New York: Springer.

105
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Laros, J. A., Tellegen, P. J., Jesus, G. R., de, & Karino, C. A. (2011). SON-R
2-7[a]: Teste no-verbal de inteligncia. Manual com validao e normati-
zao brasileira. So Paulo: Casa do Psiclogo.

Laros, J. A., Pasquali, L., & Rodrigues, M. M. (2000). Anlise da unidimensio-


nalidade das provas do SAEB. Relatrio Tcnico. Braslia: LabPAM.

Lord, F. M. (1974). Estimation of latent ability and item parameters when


there are omitted responses. Psychometrika, 39, 247-267.

Lord, F. M. (1980). Applications of item response theory to practical testing


problems. Hillsdale: Lawrence Eribaum.

MacDonald, P., & Paunonen, S. V. (2002). A Monte Carlo comparison of item


and person statistics based on Item Response Theory versus Classical
Test Theory. Educational and Psychological Measurement, 62, 921-943.

Nascimento, E., & Figueiredo, V. L. (2002). WISC-III e WAIS-III: Alteraes


nas verses originais americanas decorrentes das adaptaes para uso no
Brasil. Psicologia: Reflexo e Crtica (15), 603-612.

Nunes, C. H., & Primi, R. (2005). Impacto do tamanho da amostra na cali-


brao de itens e estimativa de escores por Teoria de Resposta ao Item.
Avaliao Psicolgica, 4, 141-153.

Nunes, C. H., & Primi, R. (2009). Teoria de Resposta ao Item: Conceitos e


aplicaes na psicologia e na educao. In C. S. Hutz (Org.), Avanos
e polmicas em avaliao psicolgica (pp. 25 -70). So Paulo: Casa do
Psiclogo.

Nunes, C. H., Hutz, C. S., & Nunes, M. F. (2008). Bateria Fatorial de Persona-
lidade (BFP): Manual tcnico. Itatiba: Casa do Psiclogo.

Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric Theory (3rd ed.). New
York: McGraw-Hill.

Pasquali, L. (2003). Psicometria: Teoria dos testes na Psicologia e na Educao.


Petrpolis: Vozes.

Pasquali, L. (2007). TRI - Teoria de Resposta ao Item: Teoria, Procedimentos e


Aplicaes. Braslia: LabPAM.

Pasquali, L., & Primi, R. (2003). Fundamentos da Teoria da Resposta ao Item


- TRI. Avaliao Psicolgica, 2, 99-110.

106
Teoria de Resposta ao Item na Avaliao Psicolgica

Primi, R., & Almeida, L. S. (1998). BPR-5: Manual Tcnico. So Paulo: Casa
do Psiclogo.

Rasch, G. (1960). Probabilistic models for some intelligence and attainment tests.
Chicago: Mesa Press.

Samejima, F. (1974). Normal ogive model on the continuous response level in


the multi-dimensional latent space. Psychometrika, 39, 111-121.

Vitria, F., Almeida, L. S., & Primi, R. (2006). Unidimensionalidade em testes


psicolgicos: conceito, estratgias e dificuldades na avaliao. Revista de
Psicologia da Vetor, 7, 1-7.

Wright, B. D., & Stone, M. H. (1979). Best test design. Chicago: Mesa Press.

107
Captulo 5
Validade e preciso de testes
psicolgicos
Gisele Aparecida da Silva Alves
Mayra Silva de Souza
Makilim Nunes Baptista

Introduo

Todos os psiclogos j ouviram falar dos conceitos validade e


preciso, mesmo que nunca tenham sentido a necessidade de se
aprofundar neles. Um estudo realizado por Vendramini e Lopes
(2008), com trinta psiclogos de diversas reas de atuao e trinta
estudantes concluintes do curso de Psicologia, revelou que mais
de 50% dos participantes no conseguem ler as informaes sobre
evidncias de validade e preciso, apesar de quase 30% dos profis-
sionais considerarem a leitura desses aspectos importante para se
manterem atualizados e aproximadamente 40% dos estudantes
avaliarem que esse dado til para a utilizao segura dos testes.
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Ocorre que esses dois conceitos em questo so imprescindveis


na prtica do psiclogo que faz uso de testes psicolgicos; muitas
vezes, entretanto, no so abordados adequadamente no curso de
graduao em Psicologia.
Vrios autores questionam a formao do psiclogo no Brasil e
apontam falhas nesse percurso (Bettoi & Simo, 2000; Dias, 2001;
Francisco & Bastos, 1992; Pereira & Carellos, 1995). Dentre as
crticas mais citadas, ressalta-se a distncia entre teoria e prtica,
com falta de articulao entre elas, e a limitao de uma formao
voltada para a prtica em clnica particular, o que dificulta o profis-
sional de psicologia a lidar com demandas diversificadas (Moura,
1999).
Sobre a formao especfica em avaliao psicolgica, outros
pesquisadores expem dificuldades como as abordagens geral e
reduzida do contedo, incompatveis com a demanda prtica da
rea, teoria e tcnica precrias no ensinamento de testes e na
confeco de relatrios, assim como a no reciclagem de profes-
sores e a precariedade de material que estes utilizam (Hutz &
Bandeira, 2003; Jacquemin, 1995; Noronha & Alchieri, 2004;
Pereira & Carellos, 1995; Sbardelini, 1991; Simes, 1999;
Wechsler & Guzzo, 1999).
Os conceitos de validade e preciso popularizaram-se no meio
profissional com o movimento do Conselho Federal de Psicologia
(CFP), em 2001, que se preocupou com a melhora da qualidade
dos testes, que at ento estavam sendo utilizados na prtica
profissional do psiclogo, em avaliao psicolgica. Essa ao foi
reflexo da crise do uso de testes, na dcada de 1960, quando estes
deixaram de ser utilizados porque se acreditava que no cumpriam
os objetivos a que se propunham (Hutz & Bandeira, 2003; Urbina,

110
Validade e preciso de testes psicolgicos

2007). Dentre outras exigncias do CFP, como a apresentao de


fundamentao terica do instrumento, um teste precisa possuir
evidncias empricas de validade e preciso relatadas em seu
manual para que seja aprovado para o uso profissional e para que
seja tambm devidamente comercializado.
Um exemplo de teste muito utilizado na prtica do psiclogo, e
que gerou muita polmica pelo questionamento da sua validade,
o teste de Wartegg. Trata-se de uma tcnica grfica para avaliao
da personalidade segundo a teoria dos arqutipos de Jung. Assim,
so apresentados estmulos em oito campos, nos quais, basica-
mente, o respondente deve continuar o desenho.
Estudos realizados com o teste em questo (como o de Salazar,
Trccoli & Vasconcellos, 2001, e o de Souza, Primi & Miguel,
2007) no conseguiram encontrar evidncias de validade sufi-
cientes para sustentar as interpretaes sugeridas no seu manual,
e, dessa forma, no possvel assegurar o que o teste realmente
avalia, impossibilitando, desse modo, seu uso na prtica profis-
sional. No entanto, isso no impede que novos estudos sejam
realizados com este instrumento, com o objetivo de buscar evidn-
cias de validade, bem como com outros objetivos relacionados s
qualidades psicomtricas do teste. O teste Wartegg poder ser
utilizado novamente, aps ser considerado aprovado quando da
apreciao feita pelo Conselho Federal de Psicologia, caso sejam
encontradas evidncias de validade, bem como ndices de preciso
adequados (dos quais se tratar nos prximos tpicos), e outros
requisitos sejam atendidos.
A resoluo CFP 006/2004 altera o artigo 14 da Resoluo
CFP n. 002/2003, estipulando que estudos referentes validade
e preciso dos instrumentos devem ser realizados de modo a

111
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

no ultrapassar um perodo de vinte anos. Assim, nenhum teste


aprovado ou reprovado para sempre, sendo que apenas pode no
haver naquele momento estudos que evidenciem e justifiquem seu
uso de forma segura.

Validade

A validade de um teste, basicamente, diz respeito ao cumpri-


mento da tarefa de medir o que este se destinou a medir, ou seja,
a comprovao que o teste mede aquilo a que ele se prope.
comum tambm encontrar a definio de validade como o nvel
em que o teste mede a caracterstica que quer medir. Em muitos
testes, encontram-se evidncias de validade, porm a pergunta
que se faz : Ser que essas evidncias so suficientes para essa
avaliao? Por isso validade se refere aos questionamentos: O
teste avalia o que ele anteriormente se props a avaliar?, e Quo
bem ele faz isso? (Anastasi & Urbina, 2000; Cronbach, 1996;
Hogan, 2006).
O termo validade remete a um conceito unitrio, como da
possibilidade de um teste ser vlido ou no, porm as coisas no
funcionam dessa forma, num ponto de vista do tudo ou nada
(Hogan, 2006; Urbina, 2007). Dessa maneira, passou-se a consi-
derar que um teste pode possuir evidncias de validade, pois se
buscam saber as suas qualidades diante de um propsito ou uma
utilizao particular. Portanto, um mesmo teste pode servir a um
objetivo de avaliao e no servir a outro diferente. Esses obje-
tivos diferentes podem ser, por exemplo, populaes diferentes
(estudantes, pacientes psiquitricos, populao geral, etc.) ou

112
Validade e preciso de testes psicolgicos

contextos diversos (clnica, hospital, trnsito etc.). Imagine-se um


teste de personalidade usado para propsitos diferentes: a) numa
clnica, onde o psiclogo vai explorar as caractersticas de perso-
nalidade do paciente, com a finalidade de trabalhar esses aspectos
em psicoterapia, e b) no trnsito, no qual sero avaliados aspectos
da personalidade do candidato carteira de habilitao, sendo
aprovados aqueles considerados aptos, com vistas a diminuir os
acidentes no trnsito.
Na realidade, no o teste que possui essas evidncias de
validade; so as interpretaes feitas a partir dos resultados encon-
trados numa pesquisa com o teste em questo. Isso se deve ao
fato de que as caractersticas psicolgicas avaliadas no so dire-
tamente observadas; exemplificando, tem-se a possibilidade de
avaliar a altura de uma pessoa com uma fita mtrica, mas, nos
estudos de validade de testes psicolgicos, faz-se o uso de nmeros,
de anlises estatsticas, porm sempre se tem de atribuir um signi-
ficado para os nmeros encontrados, uma interpretao (AERA,
APA & NCME, 1999).
Foi pensando assim que a definio de validade passou a ser
concebida como o grau no qual as interpretaes obtidas dos
dados empricos do teste encontram sustentao em base cien-
tfica slida Urbina (2007). Tal autor props ainda que sejam
consideradas as evidncias encontradas de forma acumuladas, de
maneira que o grau dessas evidncias concorde com os resultados
do teste para os objetivos propostos.
Uma vez que a conceituao de validade foi concluda, deve-se
pensar em como se buscam evidncias de validade. Numa abor-
dagem clssica, a validade foi dividida em trs tipos (Anastasi &
Urbina, 2000), a saber:

113
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

a) Validade de contedo: Responde pergunta os itens do tes-


te representam adequadamente a caracterstica que se quer
avaliar?;
b) Validade de critrio: Responde pergunta os itens do tes-
te conseguem fazer uma previso de uma varivel externa
ao teste no futuro ou no presente?. Por exemplo, um teste
vocacional utilizado com o propsito de avaliar se o in-
divduo tem aptides necessrias para exercer determinada
profisso, e, se evidncias so encontradas nesse sentido,
diz-se de uma evidncia de validade de critrio;
c) Validade de construto: Responde pergunta quanto os itens
do teste realmente medem uma determinada caracters
tica?. Pensando na evoluo do conceito, esse tipo engloba
o conceito atual de validade, pois todos os estudos nesse
sentido buscam responder a essa questo.

Esta definio de validade de Anastasi e Urbina (2000),


chamada de definio tripartite, foi questionada e aprimorada
posteriormente. Achou-se importante, mesmo assim, apresent-la
neste captulo para dar ao leitor uma viso histrica das definies
de validade e tambm porque esta definio ainda utilizada nos
manuais anteriores s novas nomenclaturas e em outras discus-
ses sobre validade feitas pela comunidade cientfica. Um dos
autores que contribuiu significativamente para a reformulao da
definio tripartite foi Messick (1989), quem, em um dos ques-
tionamentos feitos a esta definio, argumentou que tanto a
validade de contedo quanto a de critrio tambm apresentam
informaes sobre o construto, de modo que quase toda a infor-
mao sobre o teste contribuir para sua validade de construto,

114
Validade e preciso de testes psicolgicos

de formas diversas. Dessa maneira, validade de construto passou


a ser entendida como um conceito abrangente em que se incluem
outras formas de validade (Primi, Muniz & Nunes, 2009).
Assim, contemporaneamente so utilizadas outras nomen-
claturas, que foram reformuladas pela AERA, APA & NCME
(1999), e distinguem-se, no em tipos, mas em fontes pelas quais
se possvel encontrar evidncias de validade, a saber:
a) Evidncias de validade baseadas no contedo: Nessa fonte,
busca-se uma relao entre o contedo do teste (o que seus
itens abordam) e o domnio que se quer avaliar. Para se ter uma
evidncia de validade baseada no contedo, necessrio que os
itens do teste estejam representando de forma adequada a carac-
terstica psicolgica que se quer avaliar. Por exemplo, um teste
para avaliao de depresso precisa conter itens que descrevam
a depresso. Pensando no conceito de depresso pelo DSM-
-IV-TR (APA, 2002), o transtorno depressivo maior envolve
sintomas centrais que so o humor deprimido e a anedonia, e
outros sintomas somticos, como alteraes de apetite, de sono,
dificuldade de concentrao, pessimismo, sentimentos de culpa,
ideias de morte, dentre outros. Dessa forma, um teste que avalia
depresso precisa conter tanto os sintomas centrais, como os
outros sintomas, pois a juno deles (e mais outros critrios, no
caso) que vai poder configurar ou no um transtorno depressivo.
Para avaliar se o contedo dos itens do teste adequado ou no,
geralmente so chamados especialistas na rea (chamados juzes),
que vo avaliar se a descrio do contedo foi feita de maneira
cuidadosa, desmembrando seus componentes principais, e julgar a
relao entre o que o teste traz em seu contedo e o que deveria
trazer, de acordo com a literatura. Essa fonte equivale ao tipo de
validade de contedo.

115
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

b) Evidncias de validade baseadas nas relaes com outras


variveis: Nessa fonte, so buscadas relaes entre os escores do
teste e outras variveis medindo a mesma caracterstica, carac-
tersticas relacionadas ou caractersticas diferentes. As outras
variveis podem ser sexo, idade, desempenho acadmico, critrio
diagnstico e tambm outros testes. Por exemplo, um teste que
visa a avaliar a inteligncia de alunos do terceiro ano do ensino
fundamental pode ser comparado ao desempenho acadmico
desses alunos nas disciplinas da escola (notas ao final do ano),
e, se for encontrada uma boa relao entre os dois (pontuaes
que indiquem inteligncia alta e sucesso escolar, por exemplo),
pode-se interpretar que foi encontrada uma evidncia de validade
baseada na relao com outras variveis, critrios externos. A
relao entre essas duas caractersticas, que so as mesmas, est
ilustrada na Figura 1, a seguir. As Figuras 2 e 3 ilustram as relaes
medindo caractersticas relacionadas e caractersticas diferentes.
A partir dessas relaes, portanto, possvel inferir evidncias
de validade que convergem (mesma caracterstica ou caracte-
rsticas relacionadas) ou divergem (caractersticas diferentes).
Quanto s evidncias de validade que divergem, ilustradas pela
Figura 3, pode-se citar um estudo que relaciona dois instru-
mentos: um avaliando inteligncia e outro, personalidade. Assim,
esperam-se relaes muito baixas entre esses testes, j que avaliam
caractersticas (construtos) diferentes. Se as relaes encontradas
forem de fato baixas, pode-se interpretar que foi constatada
evidncia de validade divergente.

116
Validade e preciso de testes psicolgicos

Figura 1 Figura 2

Figura 3

Com essa fonte de validade, tambm possvel obter dados


sobre a capacidade do teste de predio. Um exemplo um teste
utilizado na seleo de pessoal para uma vaga de emprego numa
empresa, capaz de predizer o sucesso do indivduo avaliado no
cargo pretendido. Em uma avaliao para cargos hierrquicos
mais altos, por exemplo, uma das habilidades a serem avaliadas
a da liderana, que pode predizer o desempenho desses candidatos
quando ocuparem o cargo que requer esse tipo de habilidade. Essa
fonte equivale validade de critrio.
c) Evidncias de validade baseadas na estrutura interna:
Como o prprio nome j sugere, essa fonte de evidncia de
validade busca relao entre o teste e seus itens. Com o uso de
anlises estatsticas, possvel saber a contribuio de cada item
no resultado total do teste (correlaciona-se um item ao resul-
tado total do teste, e, se essa relao for significativa, supe-se
que o item contribui para o teste no geral, na representao da
caracterstica que se pretende medir); assim os itens podem ou

117
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

no ser considerados adequados para avaliao do domnio que


se quer medir. Outra forma de se avaliar esse tipo de evidncia
verificando o agrupamento de itens em fatores j previstos teorica-
mente. A Bateria Fatorial de Personalidade (BFP), por exemplo,
um instrumento psicolgico construdo para a avaliao da perso-
nalidade a partir do modelo dos Cinco Grandes Fatores (CGF),
que foram confirmados pelo procedimento estatstico de anlise
fatorial, apresentando os fatores: Extroverso, Socializao, Reali-
zao, Neuroticismo e Abertura para novas experincias (Nunes,
Hutz & Nunes, 2010).
d) Evidncias de validade baseadas no processo de resposta:
Fornecem dados sobre processos mentais presentes na execuo
das tarefas propostas pelo teste, atribuindo-se significado psicol-
gico para a realizao correta do item a partir das relaes entre seus
componentes cognitivos. Baseando-se sempre na teoria referncia
da caracterstica avaliada pelo teste, so criados modelos expli-
cativos do processamento mental que ocorre durante a execuo
das tarefas propostas nos itens do teste e previses dos compor-
tamentos de acerto, tempo de reao, etc. As observaes dos
padres de resposta so comparadas ao modelo terico, e, quanto
mais prximas, maior a confiana no modelo terico de base para
a interpretao do que o teste avalia. Outra maneira de estudar
essa fonte de validade analisar as respostas do indivduo, quando
questionado sobre suas estratgias para responder aos itens do teste
(Primi, Muniz & Nunes, 2009). Cunha e Santos (2009) realizaram
um estudo que objetivava a busca por essa evidncia de validade,
por meio da anlise das respostas de crianas ao teste Cloze, em
que seriam exploradas diferenas qualitativas nos erros apresen-
tados. A partir dessa anlise das respostas, foi possvel verificar

118
Validade e preciso de testes psicolgicos

que as crianas com mdias mais altas cometeram mais erros lexi-
cais, e as com mdias mais baixas, erros semnticos. Os resultados
encontrados demonstraram o que era conceitualmente esperado,
portanto, foram encontradas evidncias de validade baseadas no
processo de resposta para o Cloze.
e) Evidncias de validade baseadas nas consequncias da
testagem: Essa fonte avalia as consequncias sociais do uso do
teste para verificar se as implicaes de sua utilizao coincidem
com os resultados desejados de acordo com a finalidade para a qual
foi criado. A expectativa a de que o teste contribua de maneira
benfica em contextos clnicos e escolares, em seleo de pessoal,
etc. Porm, para que se obtenha o resultado desejado do uso do
teste, no basta apenas que este seja validado, pois existem outras
variveis que podem interferir, de maneira a comprometer as inter-
pretaes resultantes da sua utilizao. Buscar por essa fonte de
evidncia de validade implica ter uma viso ampliada da situao,
e no somente do teste, na medida em que esto envolvidos, alm
do psiclogo responsvel pela avaliao, os outros agentes (profis-
sionais de outras reas, governos, dentre outros) que fazem uso
desses dados finais para tomada de decises, e podem utilizar essa
informao de maneira equivocada, enviesada, de modo a preju-
dicar indivduos e sociedade, de maneira geral.
Uma crtica a essa fonte de validade que ela se esquiva das
propriedades de controle na pesquisa e na construo de testes;
por outro lado, ampliar a situao da testagem e avaliar suas
consequncias pode ser visto como uma atitude tica (Primi,
Muniz & Nunes, 2009). Como exemplo, um instrumento diag-
nstico aplicado num indivduo e, se conseguir detectar
precocemente uma doena e indicar uma interveno adequada

119
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

ao caso, sinal de que o efeito produzido foi benfico, como dese-


jado, e este resultado agrega evidncia de validade consequencial
ao teste utilizado; em contraposio, se essa avaliao provocar
um diagnstico equivocado ou indicaes desfavorveis de inter-
veno, inicia-se um questionamento sobre a validade daquele
teste para avaliao naquele contexto.

Preciso

A preciso (tambm conhecida como confiabilidade ou, ainda,


fidedignidade) refere-se estabilidade do teste, de maneira que,
quanto mais prximas forem as pontuaes obtidas por mtodos
ou em situaes diferentes, maior ser a consistncia do teste
(Anastasi & Urbina 2000; Cronbach, 1996). Imagine-se uma s
pessoa sendo submetida a um teste que avalia traos de personali-
dade, realizado em dois lugares diferentes, por pessoas diferentes.
Como se trata de uma s pessoa que est sendo avaliada, e como
est sendo avaliada nos dois lugares pelo mesmo teste (que avalia
a mesma coisa), espera-se que os resultados sejam muito prximos.
Se assim ocorrer, como esperado, pode-se conferir preciso aos
resultados do teste, e, no caso de dois resultados diferentes,
desconfia-se de um erro de medida.
O conceito de preciso ope-se ao de erro de medida, de
maneira que, quanto mais preciso for considerado um teste, signi-
fica que mais livre de erros ele se encontra. Dessa forma, a preciso
de um teste determinada pelo nvel com que suas pontuaes
so livres de erros. necessrio considerar qual fenmeno est
sendo estudado, avaliar suas particularidades, pois fenmenos

120
Validade e preciso de testes psicolgicos

psicolgicos diferentes possuem caractersticas distintas e sofrem


influncia de diferentes fatores (Anastasi & Urbina 2000; Cron-
bach, 1996)
Nenhuma medida est livre de erro, e os erros que interferem
no resultado de um teste podem vir de vrias fontes, dentre as quais
se destacam as relacionadas ao contexto da testagem (incluindo o
aplicador, o avaliador, o ambiente de testagem e os motivos da
aplicao do teste), ao testando e ao teste em si. Essas fontes de
erro incluem condies emocionais, como disposio, ansiedade,
fadiga, ou acertos ao acaso em determinadas situaes, familiari-
dade com o contedo, subjetividade, ambiente barulhento, dentre
outras. Se os devidos cuidados forem tomados no desenvolvi-
mento, na seleo, na aplicao e na correo dos testes, parte dos
erros provindos dessas trs fontes pode ser anulada ou minimizada.
Em contraposio, em situaes nas quais o testando no responde
s questes ou tenta falsear respostas que pensa ser desejveis, no
possvel manipular o erro, porm pode ser possvel detect-lo.
Por isso importante saber das prticas adequadas e dos proce-
dimentos padronizados no uso dos testes, porque so formas de
reduzir os erros na testagem (Urbina, 2007).
Existem diferentes mtodos utilizados para se estimarem os
coeficientes de preciso, e cada um deles tem suas fontes de erro
principais (Anastasi & Urbina 2000, Urbina, 2007). No se trata
de eliminar os erros, mas, sim, de identificar suas fontes e estimar
a extenso da sua influncia, de modo que, se o erro for muito
grande, o teste perde sua utilidade. A seguir so apresentados os
mtodos e suas fontes de erro centrais:

121
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

a) Mtodo das formas alternadas: O mesmo indivduo pode


ser avaliado com duas ou mais formas do teste (formas pa-
ralelas), no mesmo dia ou em dias diferentes. No caso da
aplicao das formas alternadas no mesmo dia (imediato), a
principal fonte de erro est ligada ao contedo. Cabe pen-
sar em duas formas de um teste matemtico. Em uma forma
do teste, o item 1 a resoluo da operao 2 + 2, e, em
outra forma (paralela) do teste, o item 1 a resoluo da
operao 3 + 3. Sabe-se de um dito popular que diz: Mais
certo do que dois mais dois so quatro. Pessoas que co-
nhecem esse ditado podem responder certamente ao item 1
da primeira forma do teste pela familiaridade do resultado
dessa operao, e no pela resoluo matemtica da soma
dos dois nmeros, e so, portanto, favorecidas nesse item.
Um indivduo pode, por exemplo, errar o item 1 da segunda
forma porque tem dificuldade em operao matemtica de
soma. Concluindo, se uma das formas do teste est mais
suscetvel familiaridade dos respondentes do que a outra,
as pontuaes nas duas formas podem ser diferentes, ge-
rando erro e diminuindo o coeficiente de preciso. Quando
se trata de formas alternadas aplicadas em dias diferentes,
alm do erro ligado ao contedo, essa avaliao pode so-
frer influncias do tempo. Ao se avaliar personalidade, por
exemplo, distinguem-se os traos, que so caractersticas
relativamente duradouras, e os estados, que so caracte-
rsticas temporrias. Nesse caso, a aplicao das formas do
teste em dias diferentes no mesmo indivduo pode provocar
respostas diferentes, pois seu estado pode estar diferente de
tempos em tempos.

122
Validade e preciso de testes psicolgicos

b) Mtodo de teste-reteste: Consiste na aplicao e reaplicao


do mesmo teste ao respondente, mas em ocasies diferen-
tes. Aqui, a principal fonte de erro relacionada ao tempo,
j que so feitas duas aplicaes do teste em momentos
distintos. A preciso obtida por meio de um coeficiente
resultante de uma anlise de correlao entre pontuaes
do teste obtidas em duas estimaes diferentes. Quanto
mais correlacionadas essas pontuaes estiverem (coefi-
ciente mais prximo de 1), maior a preciso encontrada, e
quanto menos correlacionadas (coeficiente mais prximo
de 0), menor preciso da medida (Anastasi & Urbina 2000;
Cronbach, 1996; Urbina, 2007).
c) Modelo das metades (Split-half): Consiste na diviso do tes-
te em duas partes homogneas ou equivalentes, porm ele
aplicado uma nica vez ao testando. Essa diviso pode
ocorrer de modo que sejam separados com relao aos itens
pares e mpares, ou, ainda, a primeira e segunda metade do
teste, etc. Fatores relacionados ao contedo dos itens cons-
tituem as principais fontes de erro.
d) Mtodo de coeficientes de Kuder-Richardson e alfa de
Cronbach: Consiste na aplicao do teste uma nica vez e
no estabelecimento de uma relao entre respostas indivi
duais nos itens com o escore total do teste. A fonte de erro
principal est relacionada ao contedo dos itens. Pode ha-
ver variao na homogeneidade do teste, e, quanto mais
homogneo ele for, com itens homogneos, maior ser o co-
eficiente de preciso calculado por esse mtodo.
e) Mtodo de preciso entre avaliadores: Consiste em solicitar
a avaliao de dois ou mais avaliadores diferentes ao mesmo

123
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

mtodo respondido pelo mesmo indivduo, estabelecendo-


-se uma correlao entre os resultados dos avaliadores. Esse
mtodo est sujeito fonte de erro relacionada subjetivi-
dade do avaliador. Quando os testes dependem em grande
parte do julgamento do avaliador, como o caso das tcni-
cas projetivas, os resultados para o mesmo teste aplicado
na mesma pessoa podem ser diferentes, pois nessa avaliao
est embutida a subjetividade e a interpretao pessoal do
avaliador.

Consideraes finais

Pode-se pensar numa relao entre os dois conceitos abor-


dados nesse captulo. De modo geral, uma boa preciso condio
imprescindvel para que um teste seja vlido, porm somente esta
caracterstica no suficiente. Mesmo que se obtenha um teste
consistente, estvel, este pode estar medindo algo que no aquilo
para o qual foi destinado a medir, ou seja, vlido. Dessa forma,
um coeficiente baixo de preciso revela seguramente uma perda
na qualidade psicomtrica, validade de um teste, mas o contrrio
no necessariamente acontece, ou seja, um teste sem evidncias
de validade pode ter bom desempenho na preciso, apesar de ser
pouco provvel (Hogan, 2006; Urbina, 2007).
Como apontado nos tpicos anteriores sobre validade e preci-
so, considera-se que esses conceitos no so pura e simplesmente
restritos ao processo de construo e estudos, validao e pre-
ciso dos instrumentos. A operacionalizao dos dois conceitos

124
Validade e preciso de testes psicolgicos

abordados depende tambm do uso adequado do teste, desde sua


aplicao at sua correo, e dos cuidados na interpretao dos
seus resultados. necessrio o conhecimento da caracterstica que
se est avaliando, alm dos alcances e limites do teste utilizado,
para que possa agregar um valor significativo no processo de ava-
liao, alm do que o processo de avaliao considerado como
muito maior e amplo do que somente a testagem psicolgica.

Questes

1) Um teste pode ser considerado aprovado ou reprovado pa-


ra sempre pelo Conselho Federal de Psicologia? Explique.
2) Qual o perodo mximo de tempo estipulado pelo Conse-
lho Federal de Psicologia que deve existir entre os estudos
de validade e preciso de um instrumento?
3) Qual a definio contempornea de validade?
4) Cite e explique a definio tripartite (clssica) de validade.
5) Cite e explique as fontes de evidncias de validade, segun-
do AERA, APA e NCME (1999).
6) Qual a definio de preciso?
7) Cite e explique os mtodos utilizados para se estimarem os
coeficientes de preciso.
8) Qual a relao existente entre validade e preciso?

125
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Referncias
American Educational Research Association, American Psychological Asso-
ciation, & Nacional Council on Measurement in Education. (1999).
Standards for Educational and Psychological Testing. Washington: American
Educational Research Association.

American Psychiatric Association. (2002). Diagnostic and Statistical Manual


of Mental Disorders- IV- TR. Washington, DC: American Psychological
Association.

Anastasi, A., & Urbina, S. (2000). Validade: Conceitos Bsicos. In A. Anastasi


& S. Urbina, Testagem Psicolgica (pp. 107-127). Porto Alegre: Artmed.

Bettoi, W., & Simo, L. M. (2000). Profissionais para Si ou Para Outros? Psico-
logia Cincia e Profisso, 20 (2), 20-31.

Conselho Federal de Psicologia (2003). Resoluo n 002/2003. Recuperado


em 14 de maro de 2011, de http://www.pol.org.br

Conselho Federal de Psicologia (2004). Resoluo n 006/2004. Recuperado


em 14 de maro de 2011, de http://www.pol.org.br

Cronbach, L. J. (1996). Fundamentos da Testagem Psicolgica. Porto Alegre:


Artes Mdicas.

Cunha, N. B., & Santos, A. A. A. (2009). Validade por processo de resposta


no teste Cloze. Fractal: Revista de Psicologia, 21 (3), 549-562.

Dias, C. A. (2001). Consideraes sobre elaborao de currculos para


formao de psiclogos: a partir de uma perspectiva didtica. Psicologia
Cincia e Profisso, 21 (3), 36-49.

Francisco, A. L., & Bastos, A. V. B. (1992). Conhecimento, formao e prtica


- o necessrio caminho da integrao. In A. L. Francisco, C. R. Klomfahs,
& N. M. D. Rocha (Orgs.), Psiclogo brasileiro: construo de novos espaos
(pp. 211-227). Campinas: tomo.

Hogan, T. P. (2006). Introduo prtica de testes psicolgicos. Rio de Janeiro:


LTC.

Hutz, C. S., & Bandeira, D. R. (2003). Avaliao psicolgica no Brasil:


situao e desafios para o futuro. In O. H. Yamamoto & V. V. Gouveia

126
Validade e preciso de testes psicolgicos

(Orgs.), Construindo a psicologia brasileira: desafios da cincia e prtica


psicolgica. So Paulo: Casa do Psiclogo.

Jacquemin, A. (1995). Ensino e Pesquisa sobre testes psicolgicos. Boletim de


Psicologia, XLV(102), 19-21.

Messick, S. (1989). Meaning and values in test validation: the science and
ethics of assessment. Educational Researcher, 18 (2), 5-11

Moura, E. P. G. (1999). A psicologia (e os psiclogos) que temos e psicologia


que queremos: reflexos a partir das propostas de Diretrizes Curriculares
(MC/SESU) para os cursos de graduao em psicologia. Psicologia Cincia
e Profisso, 19 (2), 10-19.

Noronha, A. P. P., & Alchieri, J. C. (2004). Conhecimento em avaliao psico-


lgica. Estudos de Psicologia (Campinas), 21 (1), 43-53.

Nunes, C. H. S. S., Hutz, C. S., & Nunes, M. F. O. (2010). Bateria Fatorial de


Personalidade (BFP). Manual Tcnico. So Paulo: Casa do Psiclogo.

Pereira, A. P. C., & Carellos, S. D. M. S. (1995). Examinando o Ensino das


Tcnicas de Exame Psicolgico. Cadernos de Psicologia, Belo Horizonte, 3
(4), 33-36.

Primi, R., Muniz, M., & Nunes, C. H. S. S. (2009). Definies Contempor-


neas de Validade dos Testes Psicolgicos. In C. S. Hutz (Org.), Avanos
e Polmicas em Avaliao Psicolgica (pp. 243-265). So Paulo: Casa do
Psiclogo.

Salazar, A., Troccli, B., & Vasconcelos, T. (2001). Investigao das Correla-
es entre Medidas Projetivas e Objetivas de Personalidade. In XXXI Reunio
Anual de Psicologia (SBP). Rio de Janeiro, RJ.

Sbardelini, E. T. B. (1991). Os mitos que envolvem os testes psicolgicos.


Documento CRP-08, 1 (1), 53-57.

Simes, M. R. (1999). O ensino e a aprendizagem da avaliao psicolgica: o


caso da avaliao da personalidade. Psychologica, 22, 135-172.

Souza, C. V. R., Primi, R., & Miguel, F. K. (2007). Validade do Teste Wartegg:
correlao com 16PF, BPR-5 e desempenho profissional. Avaliao Psico-
lgica, 6 (1), 39-49.

Urbina, S. (2007). Fundamentos da Testagem Psicolgica. Porto Alegre: Artmed.

127
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Vendramini, C. M. M., & Lopes, F. L. (2008). Leitura de manuais de testes


psicolgicos por estudantes e profissionais de psicologia. Avaliao Psico-
lgica, 7 (1), 93-105.

Wechsler, S. M., & Guzzo, R. S. L. (1999). Apresentao. In S. M. Weschler e


R. S. L. Guzzo (Orgs.), Avaliao psicolgica: Perspectiva internacional (pp.
9-11). So Paulo: Casa do Psiclogo.

128
Captulo 6
Padronizao e normatizao de testes
psicolgicos: simplificando conceitos
Ivan SantAna Rabelo
Leila Brito
Marcia Gabriel da Silva Rego

Os testes psicolgicos diferenciam-se de outras tcnicas de


avaliao, por se tratar de procedimentos referenciados a normas
e a diretrizes interpretativas padronizadas, com base em categorias
preestabelecidas. Outros procedimentos tambm so utilizados
em contextos de avaliao psicolgica, como meios de acesso ao
universo psicolgico do indivduo, visando maior compreenso
da sua singularidade para melhor adequao das formas de inter-
veno quando necessrias. Alguns tipos de entrevistas, tcnicas
de observao, aplicao de atividades ldicas, entre outros, cons-
tituem exemplos de estratgias de avaliao psicolgica que no
pertencem categoria de testagem.
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

A avaliao psicolgica pode ser representada como resultante


de trs critrios, a saber: a medida, o instrumento e o processo
de avaliao. Alchieri e Cruz (2003) mencionam que cada um
destes critrios possui uma representao terica e uma metodol-
gica prpria e que concebe assim, de forma constitutiva, uma via
prpria de compreenso do seu objeto de investigao, denomi-
nado de fenmenos ou processos psicolgicos.
Mtodos que envolvem o ato de desenhar, narrar histrias,
realizar encenaes ou brincar com bonecos, em geral, no se
propem a apresentar estudos normativos ou indicadores met-
dicos de interpretao, ficando assim tambm caracterizados fora
do que considerado testagem psicolgica. Apesar de no perten-
cerem categoria de testes, os resultados de tais instrumentos
podem ter credibilidade, desde que as concluses apresentadas
pelo psiclogo estejam condicionadas a um referencial terico
vlido, que sustente as interpretaes segundo o pressuposto do
determinismo psquico1.
Seja na testagem psicolgica ou em outras formas de avaliao,
a experincia do profissional, o conhecimento do constructo que
est sendo investigado e o embasamento terico consistente,
acompanhados de outros mtodos de observao e de anlise,
so condies imprescindveis para garantir a confiabilidade dos

1 Determinismo Psquico - Eventos mentais so precedidos de eventos anteriores que os de-


terminam; uma crena de que a mente funciona como uma mquina em que cada fase se
encadeia anterior e posterior (Freud, 1901/1960). O termo mais comumente encon-
trado na Psicanlise, contudo outras teorias tambm o aplicam. No Behaviorismo, pode-se
compreender que o acontecimento de um comportamento se d a partir da influncia de
vrios fatores ambientais que o precedem, e este influencia nos comportamentos decorrentes
deste. A fora de uma nica resposta pode ser, e usualmente , funo de mais do que uma
varivel e uma nica varivel usualmente afeta mais do que uma resposta (Skinner, 1957
apud Chiesa, 1994, p. 113).

130
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

resultados que se integraro de modo a compor uma avaliao


coerente (Urbina, 2007). Neste captulo, abordar-se-o as questes
referentes padronizao e normatizao dos testes psicol-
gicos, mesmo sabendo que diferenciar o que se enquadra como
teste psicolgico de outros tipos de procedimentos de avaliao
psicolgica no algo simples. Focar-se-, portanto, no teste
psicolgico considerando-o como um instrumento de mensurao
padronizado que avalia caractersticas ou processos psicolgicos
fundamentados em uma teoria e que atende aos requisitos de vali-
dade e preciso.
Em resumo, segundo Werlang, Villemor-Amaral e Nascimento
(2010):

Para os testes psicolgicos serem confiveis, devem


ser padronizados e atender a requisitos de fide-
dignidade e validade. A padronizao refere-se
necessria existncia de uniformidade tanto para a
aplicao do instrumento, como nos critrios para
interpretao dos resultados obtidos. A fidedigni-
dade diz respeito coerncia sistemtica, preciso e
estabilidade do teste, e a validade reflete se o teste
mede realmente o que pretende medir (p. 92).

Assim, uma avaliao psicolgica realizada com qualidade est


relacionada principalmente utilizao de tcnicas de avaliao
reconhecidas pela Psicologia. A Comisso de Avaliao Psico-
lgica do Conselho Federal de Psicologia, em parceria com as
instituies de ensino e pesquisa, definiu critrios de adaptao de
instrumentos de avaliao para a realidade brasileira, considerando

131
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

que a fundamentao terica e as propriedades psicomtricas dos


testes disponveis estejam de acordo com parmetros internacio-
nais de qualidade, baseados em estudos de preciso, validade e
normatizao (Werlang e cols., 2010).

Padronizao e normatizao: conceitos


iguais ou distintos?

Alguns autores, tais como Cronbach (1996), Alchieri & Cruz


(2003), Pasquali (2003, 2010), entre outros, procuram fazer uma
distino clara entre padronizao e normatizao, sendo:

Padronizao: A uniformidade na aplicao dos testes


(material, ambiente, aplicador, instrues de aplicao e
correo, etc.);
Normatizao: A uniformidade na interpretao dos esco-
res dos testes (tabelas, percentis, escore z etc.).

J Urbina (2007) considera que um teste psicolgico pode ser


descrito como padronizado, desde que contemple duas facetas
que possibilitam objetividade no processo de testagem. A primeira
relaciona-se uniformidade dos procedimentos, desde a aplicao
at a correo e interpretao dos resultados, englobando, inclu-
sive, o local em que o teste administrado, as circunstncias de
sua administrao, o examinador, tudo que pode afetar os resul-
tados, objetivando tornar to uniformes quanto possvel todas as
variveis que esto sob controle do examinador, para que os indi-
vduos que se submetam ao teste o faam da mesma forma.

132
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

A segunda faceta refere-se ao uso de padres para a avaliao


dos resultados. Estes padres costumam ser normas derivadas
de um grupo de indivduos, denominados amostra normativa ou
amostra de padronizao, sendo que o desempenho coletivo do
grupo, tanto em termos de mdia quanto de variabilidade, passa a
ser um padro pelo qual o desempenho dos outros indivduos que
se submetem ao teste sejam comparados. Desta forma, apesar de
observar-se a diferena entre padronizao e normatizao exis-
tente, no h uma diferenciao dos termos.
A nosso ver, tal distino se faz relevante, porque trata de duas
questes muito importantes, principalmente do ponto de vista
didtico, para a compreenso destes conceitos na psicometria.
Haja vista que a literatura neste sentido no insistente sobre
a nomenclatura, pelo contrrio, as duas expresses so utilizadas
indistintamente. Contudo, como se trata de questes especficas
para a aprendizagem na rea, tratar-se- o tema em duas sees
separadas neste captulo.

Padronizao

A padronizao, em seu sentido mais geral, refere-se unifor-


midade dos procedimentos no uso de um teste vlido e preciso,
desde os cuidados a serem tomados na aplicao do teste (unifor-
midade das condies de testagem) at os parmetros ou critrios
para a interpretao dos resultados dos sujeitos submetidos
testagem (Anastasi, 1977).

133
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Precaues a serem tomadas na aplicao


dos testes: padronizando as condies de
administrao dos testes psicolgicos

importante padronizar as condies de aplicao dos testes


psicolgicos com o intuito de garantir que a coleta de dados sobre
o sujeito seja de boa qualidade. Uma m aplicao pode compro-
meter o resultado dos testes, tornando-os invlidos, mesmo
quando da utilizao de uma boa ferramenta. Vale ressaltar que
uma m aplicao no invalida a qualidade psicomtrica do teste,
mas, sim, invalida o protocolo do sujeito, ou seja, os dados obtidos
na avaliao no sero confiveis.
O mau uso que se faz de um teste psicolgico compromete
sua utilidade. Por isso a padronizao to importante na rea
de avaliao psicolgica, pois pretende garantir o uso adequado e
autntico dos testes psicolgicos.
Segundo Pasquali (2001), para se garantir uma boa adminis-
trao dos testes psicolgicos, preciso acatar alguns requisitos no
que se refere ao material da testagem, ao ambiente da testagem, s
condies de aplicao e ao aplicador.

O material de testagem

A qualidade e a pertinncia do teste so duas condies que


devem ser atendidas:

Qualidade do teste: O teste tem de ser vlido e preciso.


Caso o uso de testes seja feito sem cumprimento destes

134
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

parmetros, corre-se o risco de processos jurdicos e conde-


nao tica, tornando-os inteis.
Pertinncia do teste: Alm de ser vlido e preciso, o teste
tem de ser relevante ao problema apresentado pelo sujeito.
O aplicador deve conhecer a utilidade de um dado teste,
se este ser para uma avaliao de personalidade, cogniti-
va, para rea organizacional, clnica, etc., e, assim, escolher
aquele que melhor se aplica necessidade do sujeito.

Alm da pertinncia, o teste deve adaptar-se ao nvel (intelec-


tual, profissional, etc.) do candidato. importante seguir risca
as instrues e recomendaes que explicitam seus manuais, sem,
entretanto, assumir uma postura estereotipada e rgida (Alchieri
& Cruz, 2003).

O ambiente de testagem

Com relao ao ambiente de aplicao dos testes psicolgicos,


algumas condies devem ser atendidas, a saber: o ambiente fsico,
as condies psicolgicas, o momento (tempo de aplicao) e o
estabelecimento de rapport.
Ambiente fsico: Deve proporcionar ao candidato a sensao
de estar em suas melhores condies para responder ao teste; para
tanto, importante diminuir ou, se possvel, eliminar a presena
de distratores ambientais, pois o ambiente no pode tornar-se um
fator desfavorvel, desmotivador e incmodo para o testando.
Entre os fatores a serem considerados, ressalta-se a utilizao
de uma sala adequada, com mveis igualmente adequados e

135
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

confortveis, iluminao apropriada, ventilao, higiene, ausncia


de barulho. O ambiente deve reunir condies adequadas tanto
em aplicaes individuais quanto coletivas.
Condies psicolgicas: Devem atender a condies do sujeito
e do profissional que aplica o teste. Entre os aspectos relevantes,
deve observar-se se o sujeito apresenta-se em condies normais
de sade fsica e psicolgica; preciso certificar-se de que o sujeito
compreendeu exatamente a tarefa a realizar, sempre tomando
o cuidado para no mudar as instrues do manual. O nvel de
ansiedade do sujeito que submetido ao teste pode ser reduzido
com o estabelecimento do rapport. Estabelecer rapport significa
assumir uma atitude que faa o sujeito sentir-se vontade ao fazer
o teste, implicando o examinador mostrar-se motivador, encora-
jador, no irritadio, sem gritar ou demonstrar expresses faciais e
corporais desagradveis, durante o contexto da testagem.
Para Silva (2008), o rapport permite ao profissional oferecer res-
paldo informativo fundamental para uma melhor compreenso da
dinmica desse processo, no sentido de colocar o(s) examinando(s)
ou o(s) paciente(s) mais prximo(s) desse momento avaliativo, e o
prprio psiclogo se faz agente de motivao e solicitude.
O momento: De acordo com os ambientes fsico e psicolgico,
ser avaliado quanto tempo dever durar a aplicao dos testes
psicolgicos, considerando os dois fatores mencionados acima
como determinantes para uma boa aplicao. Quando a bateria de
testes for muito extensa, recomendado dividi-la em mais de uma
sesso, com o objetivo de evitar fadiga, aborrecimento e outros
dissabores que impedem um uso adequado dos testes.

136
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

Ainda preciso considerar, no mbito do ambiente de testagem,


o que denominamos de situaes adversas, tais como a aplicao
de testes para fins periciais e a testagem para seleo. Em alguns
casos, o sujeito pode encontrar-se em condies psicolgicas e, s
vezes, at fsicas no satisfatrias, principalmente em situaes de
grande competio, como em concursos pblicos.

Condies de aplicao

Condies desfavorveis para administrao de testes psicol-


gicos podem causar efeitos no desempenho deles. Alguns estudos
mostram que os resultados nos testes so afetados pelos procedi-
mentos utilizados durante a administrao dos instrumentos.
Treffinger (1987) fez uma reviso de vrios estudos sobre o
efeito de condies de aplicao e clima psicolgico no desem-
penho em testes de criatividade. Tais estudos indicam que os
resultados so afetados pelos procedimentos utilizados durante a
administrao dos instrumentos. Para os responsveis pela apli-
cao de testes, indispensvel orientao ou treinamento, no
sentido de afianar condies adequadas e comparveis em todas
as aplicaes.
de suma importncia controlar alguns fatores, a saber:

1) O tempo suficiente para o examinando responder e o exa-


minador fazer as observaes necessrias para emitir seu
julgamento;
2) O nvel de dificuldade das palavras e a maneira de apresen-
tar as instrues;

137
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

3) O controle de fatores que podem distrair a ateno do


examinando.

H de se considerar que so muitas as variveis que afetam


uma avaliao, at mesmo o estado fsico do examinando ou sua
motivao.

O aplicador

O aplicador do teste um elemento importante da situao,


principalmente na testagem individual. Pasquali (2003) diz que
seu modo de ser e de atuar pode afetar bastante os resultados do
teste. Sobre o assunto at este momento no existem pesquisas
que permitam concluses decisivas sobre o grau de influncia que
estas variveis do examinador tm sobre os resultados dos testes.
Considera-se que o psiclogo um ser humano como todos os
outros, com seus problemas inclusive, mas tambm um tcnico
ou perito que deve ter desenvolvido algumas habilidades prprias
da profisso, das quais obviamente ele deve fazer uso em situaes
como a testagem psicolgica.
Em relao ao aplicador de testes psicolgicos, caracteristica-
mente, deve ser um psiclogo e atender a alguns requisitos, tais
como:

Conhecimento: O aplicador deve conhecer intimamente o


material utilizado, para que possa transmitir segurana e
responder a alguma dvida que possa surgir durante a tes-
tagem, bem como realizar anlises fidedignas;

138
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

Aparncia: O aplicador deve causar boa impresso, usando


roupas adequadas e limpas, evitando exageros at mesmo
em perfumes;
Comportamento durante a testagem: O papel do aplicador
o de conduzir a testagem, mantendo a ordem, o respeito,
a orientao;
Gravao de sesses: Somente com o consentimento do
examinando.

importante ainda ficar atento a no ceder a presses quanto


utilizao de determinado teste, mesmo que haja interesse
em reduzir custos da avaliao que interfiram na qualidade do
trabalho. necessrio prevalecer o princpio da isonomia, que
consiste em tratar todos do mesmo modo, com condies de
avaliao iguais (Pasquali, 2003).
Porm, o requisito mais importante para procedimento de teste
o preparo prvio do aplicador. Anastasi (1977) comenta que,
durante os testes, no pode haver emergncias, o que a nica
forma de garantir a uniformidade de procedimento.

Lei e testes psicolgicos

Esse tema fundamental, pois as pessoas tm direitos garan-


tidos em normas da Constituio dos pases e das Naes Unidas.
Por lei, os peritos devem prestar servios de qualidade sociedade,
e esta qualidade pode ser judicialmente procurada por meio das
leis pertinentes. O psiclogo responde por sua conduta nesta rea

139
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

de testes. A lei considera o psiclogo como perito e, portanto,


legalmente responsvel em sua atuao profissional.
O princpio essencial estabelecido pelo Cdigo de Nuremberg
(1949) o de garantir que fossem respeitadas as pessoas humanas
que viessem a participar de experimentos mdicos ou cientficos.
O princpio fundamental estabelecido por este Cdigo o de que
toda experimentao com seres humanos requer o prvio consenti-
mento livre e esclarecido do sujeito participante. J na Declarao
de Helsinque reafirmado o princpio do consentimento livre e
esclarecido e colocado o bem-estar do sujeito como prioritrio. De
acordo com Ambroselli (1987), a pesquisa mdica aos interesses
da cincia e aquelas da sociedade no devem jamais prevalecer
sobre o bem-estar dos sujeitos.
Embasados nestes princpios, os comits de tica em Psico-
logia, inclusive no Brasil, vm elaborando normas que devem ser
seguidas na aplicao de testes. De um modo geral, estas normas
podem ser resumidas segundo as Normas para a testagem educa-
cional e psicolgica da American Psychological Association (APA,
1985, apud Cronbach, 1996, p. 97).

Sigilo e divulgao dos resultados

Devem seguir-se as normas do sigilo profissional contidos


no Cdigo de tica do Psiclogo no Brasil (CFP, 1987). Nele
constam informaes sobre o que vedado ao psiclogo e quais
seus deveres.
A pessoa que se submete ao teste tem o direito de receber infor-
maes sobre os resultados da testagem. Tambm tem direito aos

140
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

resultados o solicitante da avaliao, como empresas que solicitem


ao psiclogo a avaliao psicolgica no processo de recrutamento
e de seleo e, outros exemplos, os juzes em casos de percia judi-
cial e, em casos de crianas, adolescentes, o responsvel legal, que
nem sempre o solicitante. Eles apenas tm direito s informaes
estritamente necessrias resposta da solicitao.
preciso seguir as normas de sigilo entre profissional e
paciente; assim, toda e qualquer informao sobre o sujeito, os
arquivos e outras anotaes provenientes do processo psicolgico
deve ser mantida em local seguro, de forma que ningum possa ter
acesso a ela. Pasquali (2003) menciona que os arquivos devem ser
seguros, de modo que ningum possa ter acesso a uma informao
restrita sem autorizao especfica do profissional responsvel. As
identidades dos indivduos devem ser codificadas de tal forma que
somente o profissional responsvel seja capaz de identific-las.
Em processos judiciais, o juiz pode solicitar abertura de regis-
tros sigilosos. preciso ter em mente que o indivduo no pode
sair indevidamente prejudicado com a exposio de informaes
sigilosas.

Normatizao

A normatizao pressupe que um teste necessita ser contex-


tualizado para poder ser interpretado. Tal conceito diz respeito a
padres de como se deve interpretar um resultado que a pessoa
atingiu em um teste. Segundo Urbina (2007), os resultados brutos
no so muito teis numa avaliao psicolgica, representando um
grupo de nmeros que no transmitem nenhum sentido, mesmo

141
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

depois de mais de um exame aprofundado. Por meio da estatstica


descritiva (distribuies de frequncia, grficos, percentis, variabi-
lidade, etc.), pode-se relacionar ou dar sentido aos dados de modo
a facilitar a sua compreenso e utilizao.
Exemplificando, um indivduo que apresentou quarenta pon-
tos num teste de inteligncia no verbal e vinte pontos num
teste de memria visual pouco significa dentro de uma avaliao
psicolgica. Outra forma de apresentao dos resultados pouco
eficiente seria dizer que este sujeito acertou 70% das questes,
pois comparado com um teste em que os indivduos da amostra de
padronizao acertaram muitas questes (com mdias altas), ou
seja, um teste considerado fcil, diferente de 70% de acerto nas
questes em um teste considerado difcil, com mdias de padroni-
zao baixas.
Assim, qualquer resultado bruto deve ser referido a alguma
norma ou a algum padro para que tenha algum sentido. A norma
permite posicionar o resultado de um sujeito, possibilitando
inferncias:

A posio em que a pessoa se localiza no trao medido pelo


teste que produziu o resultado medido;
A comparao da pontuao deste sujeito com os resulta-
dos de outras pessoas com caractersticas similares.

No processo de criao de normas, um teste deve ser apli-


cado a uma amostra representativa do tipo de pessoa para o qual
foi planejado. Esse grupo, denominado de amostra de padroni-
zao, possibilita a composio de tabelas que sero estabelecidas
como normas, indicando no somente as mdias, mas tambm os

142
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

diferentes graus de desvios, acima ou abaixo da mdia. Isso possi-


bilitar avaliar diferentes graus de superioridade ou inferioridade
naquele determinado aspecto ou faceta que o teste se props a
medir (Cronbach, 1996).
Segundo Pasquali (2001), o critrio de referncia ou a norma
de interpretao normalmente definido por dois padres, sendo
eles o nvel de desenvolvimento do indivduo humano, isto ,
as normas de desenvolvimento, e um grupo padro composto
pela populao tpica para a qual o teste foi construdo, tambm
chamado de normas intragrupo.

Normas de desenvolvimento

Este tipo de normas se fundamenta em variveis que podem


ser expressas no desenvolvimento progressivo de aspectos psico-
lgicos, tais como maturao psicomotora, maturao psquica,
idade mental, srie escolar, entre outras. Tais caractersticas
informam sobre aquilo que o indivduo passa ao longo de sua
vida. Neste sentido, so utilizados, como critrio de norma, trs
principais fatores: a idade mental, a srie escolar e o estgio de
desenvolvimento.

A idade mental

Segundo Anastasi (1977), o conceito de idade mental foi


introduzido por Binet e Simon na reviso de 1908 das escalas de
Binet-Simon. Nestes casos, os itens individuais so agrupados em
nveis de idade. Exemplificando, itens solucionados na amostra de

143
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

padronizao pela maioria das crianas com nove anos de idade


so atribudos para ser aplicados e avaliados em crianas no nvel
de nove anos; os itens respondidos pela maioria das crianas com
dez anos sero colocados ao nvel de dez anos, e assim sucessiva-
mente. Dessa forma, espera-se que o resultado de uma criana no
teste corresponda ao nvel mais alto dentro de sua idade; seguindo
ainda o exemplo citado, crianas de oito anos devem ser capazes
de responder s questes dentro deste nvel de idade; se elas acer-
tarem itens classificados como para dez anos, sua idade mental
(IM) ser dez, embora sua idade cronolgica (IC) seja oito anos.
A autora explica que, na adaptao norte-americana da escala
de Binet-Simon, a Stanford-Binet (Terman & Merrill, 1960), a
idade mental (IM) foi expressa em termos da idade cronol-
gica (IC), resultando no quociente intelectual (QI) por meio da
frmula:
IM
QI = 100 x ---------
IC

Dessa forma, o QI comparvel em diferentes idades, na


medida em que a interpretao de um determinado QI sempre a
mesma, qualquer que seja a idade do sujeito. Logo, se um sujeito
responde a todas as questes relacionadas ao seu nvel de idade
cronolgica, representar um QI de 100; por exemplo, uma
criana de oito anos:

QI = 100 x (8/8) = 100

144
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

Todavia, vale ressaltar que, apesar da aparente simplicidade


lgica, o QI no aplicvel na maioria dos testes psicolgicos,
principalmente nos testes para adultos. O uso do QI deve ser
precedido de uma verificao da variabilidade em diferentes
idades, a fim de assegurar que foi satisfeita a condio de variabili-
dade uniforme do QI ou uma variabilidade proporcional crescente
da idade mental. Vrios testes de Inteligncia que apresentam
normas por idade no satisfazem as condies para a constncia
de QI (Anastasi, 1977).

Normas educacionais - Srie escolar

comum a interpretao de resultados de testes educacionais


de aproveitamento em termos de normas de srie. O conceito de
srie escolar como norma empregado para testes de desempenho
acadmico e pode ser utilizado quando se trata de disciplinas
que so oferecidas numa sequncia de vrias sries escolares. As
normas so construdas por meio da pontuao bruta mdia obtida
por alunos em cada srie, resultando numa pontuao tpica para
cada srie. Assim, a criana que apresentar uma pontuao tpica
da 4 srie obter um escore padronizado de quatro (Anastasi,
1977; Pasquali, 2003).

Estgio de desenvolvimento

Piaget e seus colaboradores examinaram o desenvolvimento cog-


nitivo e estabeleceram uma sequncia de estgios consecutivos do
desenvolvimento, denominados: sensrio-motor, pr-operacional,

145
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

operacional concreto, operacional formal. Normas divididas por


estgios de desenvolvimento so utilizadas por profissionais da
psicologia infantil que estudam os desenvolvimentos mental e psi-
comotor em termos de idades consecutivas de desenvolvimento,
como Gesell e Piaget.
Gesell e colaboradores (Ames, 1937; Gesell & Amatruda, 1947;
Halverson, 1933; Knoblock & Pasamanick, 1974) estabeleceram
normas para oito idades tpicas (de quatro semanas a 36 meses)
de desenvolvimento das crianas no que tange ao comportamento
motor, adaptativo, lingustico e social. Pesquisadores e estudiosos
da escola piagetiana (Laurendeau & Pinard, 1962, 1970; Pinard &
Laurendeau, 1964) desenvolvem testes empregando estes estgios
como mtodo de interpretao dos resultados (Pasquali, 2001).

Normas intragrupo

Como os resultados brutos dos testes normalmente se apre-


sentam em diferentes unidades, torna-se impossvel a comparao
direta de resultados. O nvel de dificuldade de cada teste tambm
pode influenciar nessa comparao entre resultados brutos. Assim,
normas representadas por meio de transformaes normativas
permitem express-las em unidades que possibilitam comparaes.
Anastasi (1977) elucida que existem vrias maneiras por meio
das quais os resultados brutos podem ser transformados; contudo,
os resultados dos testes normalmente so expressos por trs
tipos: resultados por idade, j descritos anteriormente, percentis
e resultado padro. Assim, nas normas intragrupo, o critrio de
referncia dos resultados so a populao ou o grupo para o qual

146
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

o teste foi desenvolvido. A pontuao que o sujeito apresentou


em um teste toma sentido em relao aos resultados dos demais
sujeitos da populao.

Percentis

O percentil indica a posio relativa do sujeito na amostra de


padronizao. Assim, a localizao do sujeito, do ponto de vista
percentlico, indica quanto por cento de pessoas desta popu-
lao (amostra) apresentaram resultados inferiores ao dele. Por
exemplo, se 40% dos sujeitos obtiveram um escore bruto menor do
que vinte, este valor ser expresso como percentil quarenta, o que
indica que 40% dos sujeitos tm escore menor que vinte e 60%
tm escore maior. Um percentil de cinquenta indica que o sujeito
se situa na mediana dos escores da amostra (Pasquali, 2001).
Apesar de o percentil apresentar uma compreenso mais
simples e ser comumente empregado na testagem psicolgica,
sua grande dificuldade situa-se no fato de que as distncias entre
escores percentlicos sucessivos no so constantes, mas variam
segundo a posio do escore no incio/fim da escala ou no meio
dela. Portanto, os percentis no devem ser confundidos com
resultados de porcentagem, pois isso significaria porcentagem
de itens respondidos corretamente nos testes, mas o percentil
representa resultados transformados, apresentados em termos de
porcentagem de pessoas que participaram da amostra de padroni-
zao (Cronbach, 1996).
Percentis so teis tambm para comparar a realizao do indi-
vduo em diferentes testes, no servindo apenas para mostrar a

147
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

posio do indivduo na amostra normativa. Exemplificando, se


uma criana obtm um resultado bruto de trinta, num teste arit-
mtico, e de 58, num teste de leitura, no se podem comparar
diretamente os resultados, porque suas unidades de medida tm
caractersticas diferentes. Contudo, se a referncia aos resultados
percentlicos indicar que uma pontuao de trinta no teste de
aritmtica significa uma localizao de percentil 65, enquanto
um resultado de 58 num teste de leitura corresponda a um posto
de percentil quarenta, ento, pode inferir-se que a criana apre-
sentou um resultado melhor no teste aritmtico do que no de
leitura (Anastasi, 1977).
Entre as vantagens da utilizao dos resultados em percentil,
verifica-se como primordial sua universalidade para interpretao
e comparao de resultados. Pode ser usado tanto em crianas
como em adultos, e adequado para tipos de testes variados, seja
para medir variveis de personalidade, seja para medir atitudes,
capacidades cognitivas, etc. Sua principal desvantagem encontra-
-se vinculada distribuio dos sujeitos na amostra, pois, ao se
aproximar da curva normal, so concentradas grandes quanti-
dades de sujeitos representativos na mediana ou prximos ao
centro da distribuio, enquanto os extremos so muito compri-
midos, conforme observado na Figura 1.

148
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

Figura 1 - Distncias intervalares de escores percentlicos e escores z


(Pasquali, 2001).

Escore Padro

Com os avanos no desenvolvimento da testagem psicolgica,


observa-se cada vez mais o crescente uso de resultados em formato
de escore padro, tambm conhecidos como resultados padro ou
simplesmente escore z. O escore padro revela a distncia do
sujeito em relao mdia, em termos do desvio padro da distri-
buio (Anastasi & Urbina, 2000).
Normas fundamentadas no escore padro baseiam-se no clculo
de um escore z que est relacionado ao resultado bruto do sujeito,
podendo ser calculado de duas formas distintas, que resultaro ou
em um escore padro ou em um escore padro normalizado. O
primeiro resultado pode ser determinado por uma transformao

149
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

linear, enquanto o outro se d por meio de uma transformao no


linear, ambas a partir dos resultados brutos originais.

Escore padro linear

Derivado do resultado bruto, o escore padro linear pode ser


expresso em uma escala padro sem afetar a posio relativa dos
indivduos no grupo e nem mudar a forma da distribuio original.
Os escores padro so teis para expressar os escores brutos de
formas paralelas de um mesmo teste, sobretudo se as formas
possuem dificuldades diferentes. Os escores padro tambm faci-
litam a comparao e a interpretao dos resultados (Pasquali,
2001).
Em sua maioria, os resultados padro linearmente derivados
so denominados apenas de escore padro ou escore z e repre-
sentam a relao entre o desvio do escore bruto em comparao
mdia e ao desvio padro dos escores do mesmo grupo. Para
calcular um escore z, basta encontrar a diferena entre o resultado
bruto do indivduo e a mdia do grupo normativo, e depois dividir
essa diferena pelo desvio padro (DP) do grupo normativo. A
frmula usada para clculo deste procedimento :

X M Onde:
Z = ---------------- X = escore bruto
DP M = mdia do grupo
DP= desvio padro

150
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

Exemplificando:
Imagine-se o clculo do escore z de dois sujeitos em um grupo
no qual a mdia igual a 75 e o desvio padro igual a cinco.

Resultado bruto de Andr: X1 = 85

85 75
Z1 = ----------------
5

Z1 = + 2,00

Resultado bruto de Roberto: X2 = 68

68 75
Z2 = ----------------
5

Z2 = 1,4

Escore padro normalizado (EPN)

Assim como explicado anteriormente, o objetivo da transfor-


mao dos resultados brutos em outro tipo de escala derivada
tornar compatveis os resultados obtidos em diferentes testes.
Contudo, existem casos em que os resultados no se apresentam
na mesma forma do ponto de vista da distribuio normativa dos

151
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

resultados; assim, por exemplo, comparar o resultado de um teste


com distribuio assimtrica com o resultado de outro cuja distri-
buio no assimtrica, aproximando-se da curva normal.
Testes com resultados de formas diferentes precisaro de trans-
formaes no lineares para ajustar os resultados a qualquer tipo
especificado de curva de distribuio. Tal transformao no linear
calculada por meio das tabelas da curva normal, e incide basica-
mente em transformar os percentis em escores z (Anastasi, 1977).
A idade mental e os resultados de percentil, descritos ante-
riormente, representam transformaes no lineares, mas esto
limitadas a desvantagens j discutidas em cada tpico. Apesar da
possibilidade de ajustar os resultados a algum outro tipo de distri-
buio, a curva normal comumente utilizada para este fim. O
motivo relaciona-se ao fato de as distribuies de resultados brutos
frequentemente se aproximarem mais da curva normal do que de
qualquer outro tipo de curva, assim como nas medidas fsicas, tais
como peso e altura, que usam escalas de unidades iguais, obtidas
por meio de operaes fsicas, produzindo geralmente distribuies
normais. Outra convenincia importante da curva normal apre-
sentar muitas propriedades matemticas proveitosas, facilitando
outros clculos e comparaes.
Segundo Anastasi (1977), os resultados padro normalizados
apresentam-se em termos de uma distribuio que foi transformada
a fim de se adequar a uma curva normal, podendo ser calculados
por meio de referncia a tabelas que deem a porcentagem de
casos colocados em diferentes distncias DP da mdia de uma
curva normal. Para isso, inicialmente, verifica-se a porcentagem
de sujeitos da amostra de padronizao que estejam no nvel de
cada resultado bruto ou acima dele. Em seguida, essa porcentagem

152
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

dever ser localizada na tabela de frequncia da curva normal,


obtendo-se assim o correspondente escore padro normalizado.
Estes escores so apresentados de forma similar ao escore padro
linear, ou seja, com uma mdia de zero e um DP de um.
Assim, um EPN de zero indica que o sujeito est na mdia de
uma curva normal, superando 50% do grupo. J um resultado de
-1,00 significa que o respondente supera aproximadamente 16%
do grupo, enquanto um resultado de + 1,00 indica uma superao
de 84%. Tais porcentagens correspondem, respectivamente, a uma
distncia de 1 DP abaixo e 1 DP acima da mdia de uma curva
normal.
Simplificando, o escore padro normalizado (EPN) so
escores padro forados a apresentar uma distribuio normal
pela converso dos equivalentes percentis dos escores brutos em
correspondentes escores padro ao longo da curva normal, inde-
pendentemente da forma original da distribuio. Os escores
padro normalizados geralmente apresentam mdia cinquenta e
desvio padro dez.

Transformaes do escore padro

Nos exemplos anteriormente apresentados, observou-se a pre-


sena de casas decimais e valores negativos (pois o z vai de menos
infinito a mais infinito, na prtica, de -5 a +5), o que tende a
produzir nmeros que podem tornar-se difceis e confusos de utili-
zar tanto para clculos quanto para descries. Assim, costuma-se
empregar outra transformao linear visando a deixar o escore
padro em um formato mais conveniente (Anastasi, 1977; Pas-
quali, 2001).

153
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Segundo Pasquali (2001), para essa transformao, normal-


mente o z multiplicado por um coeficiente e ao produto
agregada uma constante, utilizando a frmula:

Escore transformado = a + b(z)

Assim, o coeficiente de multiplicao do z (isto , o b da


frmula), tanto quanto a constante somada (o a da frmula),
arbitrrio, o que resulta em diversas formas de apresentao das
normas quantas se desejar. No obstante, alguns valores a e b
so habitualmente mais empregados, o que permite estabelecer
normas j tradicionalmente conhecidas, tais como o escore T, o QI
de desvio, o escore CEEB (College Entrance Examination Board),
entre outros.
A principal vantagem de se empregarem transformaes j
utilizadas universalmente que tornam todas estas normas com-
parveis entre si (Pasquali, 2001). As frmulas de transformao
para algumas destas normas so:

Escore T = 50 + 10z
QI de Desvio = 100 + 15z (Escalas de Wechsler) ou
QI de Desvio = 100 + 16z (Stanford-Binet)
CEEB = 500 + 100z.

Outra transformao bem conhecida a escala de padro


nove, tambm chamada de classes normalizadas ou estanino,
empregada pela Fora Area dos Estados Unidos, durante a
Segunda Guerra Mundial. Esta transformao fornece um sistema

154
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

de escores de apenas um dgito, com uma mdia de cinco e um


DP de 1,96. A palavra stanine derivada da expresso standard
nine point scale, ou seja, o nome padro nove baseia-se no fato
de os resultados irem de um a nove. Realizar a transformao a
resultados de apenas um dgito facilita a realizao de clculos,
sobretudo com mquinas (Anastasi, 1977).
O estanino apresenta grande vantagem prtica, pois de fcil
utilizao para representar resultados de sujeitos submetidos
testagem, mas o seu clculo relativamente trabalhoso. Esta
transformao consiste em dividir os z, que vo comumente de -3
a +3, em uma quantidade de classes. As divises de classes mais
usadas so cinco, sete, nove (estaninos) e onze. Como exemplo,
ao dividir os z em cinco classes, obtm-se uma diviso facilmente
compreensvel e prtica dos resultados dos sujeitos, tais como:

Superior / Mdia Superior / Mdia / Mdia Inferior / Inferior

As formas de transformao dos escores descritas produzem


resultados anlogos se as distribuies de frequncia forem nor-
mais. Quanto mais as distribuies se espaam da normalidade,
menor a recomendao e a utilizao de transformaes no
linear dos escores (Pasquali, 2001).

Consideraes finais

A Resoluo n 002/2003 do Conselho Federal de Psicologia


(CFP, 2003) regulamenta a utilizao, a elaborao e a comer-
cializao de testes psicolgicos, restringindo o uso por parte dos

155
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

psiclogos apenas a testes que tenham sido comprovados por


estudos cientficos e encaminhados para a avaliao da Comisso
de Avaliao Psicolgica do Sistema de Avaliao de Testes
Psicolgicos (SATEPSI). Entre as recomendaes da resoluo,
so solicitados a apresentao da fundamentao terica que
embasa o teste, as evidncias empricas de validade e preciso,
os dados informando as propriedades psicomtricas dos itens do
instrumento, as informaes a respeito do sistema de correo e
interpretao dos resultados, e tambm dos procedimentos padro-
nizados de aplicao e interpretao.
No estabelecimento de normas de testes, englobando desde
sua criao, desenvolvimento e utilizao, deve-se dar grande
ateno amostra de padronizao. A amostra em que se funda-
mentam as normas deve ser satisfatoriamente ampla, a fim de
proporcionar valores estveis. Outra amostra da mesma popu-
lao escolhida de maneira semelhante no deve apresentar
normas consideravelmente dspares das obtidas anteriormente.
As normas com amplo erro de amostragem representariam um
pequeno valor para a interpretao dos resultados de um teste
(Anastasi & Urbina, 2000).
Do mesmo modo, importante a exigncia de que a amostra
seja representativa da populao considerada. Devem-se inves-
tigar, cuidadosamente, fatores relevantes durante a seleo dos
sujeitos que iro compor a amostra de padronizao, capazes de
tornar a amostra no representativa. Entre estes fatores, devem
ser considerados aspectos como idade, sexo, escolarizao, nvel
socioeconmico, acesso informao, entre outros.
Usualmente, considera-se a Padronizao como todo o processo
de estabelecer procedimentos padronizados e valores normativos

156
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

para a comparao e a avaliao do desempenho dos indivduos ou


de grupos. O processo de desenvolvimento de um teste padroni-
zado exige fases, tais como pr-testagem de itens, anlise de itens,
estudos de validade e preciso, desenvolvimento de normas, etc.
Entende-se, portanto, a Normatizao como o conjunto de
valores tpicos descritivos do desempenho, num determinado
teste, de um grupo especfico de indivduos supostamente repre-
sentativos de uma determinada populao. As normas do valores
tpicos para diferentes grupos homogneos (segundo a idade, a
escolaridade etc.), por meio da equivalncia dos escores brutos,
obtidos no teste, com alguma forma de escore derivado (desvio
de QI, percentil, estanino, etc.). Vale ressaltar que as normas no
devem ser consideradas exclusivamente como padres ou nveis
desejveis de desempenho.
Por fim, destacou-se a importncia do processo de padronizao
e de normatizao como meios para aumentar a probabilidade de
que as ferramentas para avaliao psicolgica estejam cada vez
mais adequadas ao trabalho desenvolvido por profissionais, e
tambm como instrumentos para que avaliaes no sejam invali-
dadas em virtude da m utilizao dos testes, trazendo benefcios
infindveis principalmente para o indivduo submetido testagem.
Em sntese, a apreciao e a compreenso cada vez mais cuida-
dosa e consistente teoricamente das tcnicas e ferramentas de
avaliao psicolgica, capazes de indicar, com maior preciso, os
caminhos para tomada de deciso, surgem como uma necessidade
prioritria nos cenrios nacional e internacional.
A consolidao do campo da avaliao psicolgica dentro da
psicologia reveste-se de capacidade potencial de colaborar no

157
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

apenas para a melhoria da qualidade de vida das pessoas, mas


tambm para que organizaes e instituies disponham ainda
mais de ferramentas competitivas no atual contexto globalizado, a
partir da qualidade dos servios oferecidos a seus clientes. Assim,
a testagem provavelmente apresentar um melhor desempenho e,
desta forma, cooperar mais eficazmente para o sucesso das avalia-
es psicolgicas, o que poder reverter-se em melhores produtos
e servios oferecidos.

158
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

Questes

1) A testagem psicolgica diferencia-se de outras tcnicas de


avaliao, por se tratar de procedimentos referenciados a
normas e a diretrizes interpretativas padronizadas. Para al-
guns autores h uma distino clara entre padronizao e
normatizao. Defina estes dois conceitos.
2) Suponha que, durante um processo de Recrutamento e Se-
leo, a utilizao de testes psicolgicos tenha sido feita de
forma inadequada. Em uma situao como esta, o resul-
tado do examinando pode ficar comprometido? Justifique.
3) O aplicador do teste um elemento importante no proces-
so de testagem. Explique os motivos pelos quais o aplicador
pode afetar os resultados do teste.
4) A principal vantagem de se empregar transformaes j
utilizadas universalmente que tornam os resultados com-
parveis entre si. Assim sendo, seria o QI aplicvel em
todos os testes psicolgicos?
5) Os escores de postos de percentil so o mtodo mais direto
e disseminado para transmitir resultados de testes referen-
ciados em normas, contudo, os escores de percentil so
muitas vezes confundidos com escores percentuais. Sendo
estes dois tipos de escores distintos, justifique a diferena
entre eles.

159
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Referncias
Alchieri, J. C. & Cruz, R. M. (2003). Avaliao psicolgica: conceito, mtodos e
instrumentos. So Paulo: Casa do Psiclogo.

Ambroselli, C. (org.) (1987). Comits dthique a Travers Le Monde: recherches


em cours 1986. Obra coletiva publicada por LInserm (pp. 5-12). Paris:
ditions Tierce.

Ames, L. B. (1937). The sequential patterning of prone progression in the


human infant. Genetic Psychology Monographs, 19, 409-460.

Anastasi, A. (1977). Testes Psicolgicos. So Paulo: EPU.

Anastasi, A. & Urbina, S. (2000). Testagem psicolgica. Porto Alegre: Artes


Mdicas.

Binet, A. & Simon. T. (1905). Mthodes nouvelles pour le diagnostic du


niveau intellectuel des anormaux. LAnne Psychologique, 11, 191-244.

Conselho Federal de Psicologia (1987). Resoluo 002 de 15 de agosto de 1987.


Braslia: CFP.

Conselho Federal de Psicologia (2003). Resoluo 002 de 24 de maro de 2003.


Braslia: CFP.

Cronbach, L. J. (1996). Fundamentos da testagem psicolgica. Porto Alegre:


Artes Mdicas.

Freud, S. (1960). The psychopathology of everyday life. In Standard Edition,


Vol. 6. Londres: The Hogarth Press. (Originalmente publicado em 1901).

Gesell, A. & Amatruda, C. S. (1947). Development diagnosis (2a ed.). Nova


Iorque: Hoeber-Harper.

Halverson, H. M. (1933). The acquisition of skill in infancy. Journal of Genetic


Psychology, 43, 3-48.

Knoblock, H. & Pasamanick. B. (orgs.) (1974). Gesell and Amatrudas develop-


mental diagnosis (3a ed.). Nova Iorque: Harper & Row.

Laurendeau, M. & Pinard, A, (1962). Causal thinking in the child: A genetic


and experimental approach. Nova Iorque: International Universities Press.

160
Padronizao e normatizao de testes psicolgicos: simplificando conceitos

Laurendeau, M. & Pinard, A. (1970). The development of the concept of space in


the child. Nova Iorque: International Universities Press.

Pasquali, L. (2001). Tcnicas de Exames Psicolgicos - TEP: Manual. So Paulo:


Casa do Psicologo.

Pasquali, L. (2003). Psicometria: teoria dos testes na psicologia e na educao.


Petrpolis: Vozes.

Pasquali, L. (org.) (2010). Instrumentao Psicolgica: fundamentos e prticas.


Porto Alegre: Artmed.

Pinard, A. & Laurendeau, M. (1964). A scale of mental development based


on the theory of Piaget. Description of a project. Journal of Research in
Science Teaching, 2, 253-260.

Terman, L. M. & Merrill, M. A. (1960). Stanford-Binet Intelligence Scale:


Manual for the third revision, Form L-M. Boston: Houghton Mifflin.

Treffinger, D. J. (1987). Research on creativity assessment. In S. G. Isaksen


(Org.), Frontiers of creativity research: Beyond the basics (pp. 103-119).
Buffalo: Bearly.

Urbina, S. (2007). Fundamentos da testagem psicolgica. Porto Alegre: Artmed.

Werlang, B. S. G., Villemor-Amaral, A. E. & Nascimento, R. S. G. F. (2010).


Avaliao psicolgica, testes e possibilidades de uso. In Conselho Federal
de Psicologia, Avaliao psicolgica: diretrizes na regulamentao da profisso
(pp. 87-100). Braslia: CFP.

161
Captulo 7
A tica no uso de testes no processo de
Avaliao Psicolgica
Maria Cristina Barros Maciel Pellini
Irene F. Almeida de S Leme

A Avaliao Psicolgica, tarefa prevista em lei como priva-


tiva do psiclogo1, nos ltimos anos vem difundindo-se, trazendo
muitas contribuies em diversas reas do conhecimento da psico-
logia. Pode definir-se a Avaliao Psicolgica como um processo
tcnico e cientfico de coleta de dados e interpretaes, com
pessoas ou grupos de pessoas, por meio de informaes obtidas em
questionrios, mtodos, instrumentos psicolgicos, entrevistas,
entre outros (Noronha & Alchieri, 2002; Primi, Flores-Mendoza
& Castilho, 1998; Wechsler, 1999).
Enquanto a Avaliao Psicolgica refere-se a um processo
amplo que envolve a integrao de informaes provenientes de

1 Lei 4119/62, artigo 13, pargrafo 1.


Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

diversas fontes, como testes, entrevistas, observaes, anlises de


documentos, entre outras, a testagem psicolgica deve ser consi-
derada como uma das etapas da avaliao, por meio da utilizao
de testes psicolgicos de diferentes tipos.
Pasquali e Alchieri (2001) definem testes psicolgicos como
um procedimento sistemtico para observar um comportamento
e descrev-lo com a ajuda de escalas numricas. Tradicional-
mente, so encontrados testes com o objetivo de mensurar reas
tais como inteligncia, cognio, psicomotricidade, ateno,
memria, percepo, emoo, afeto, motivao, personalidade,
dentre outras, nas suas mais diversas formas de expresso, segundo
padres definidos pela construo dos instrumentos.
Pellini, Rosa e Vilarinho (2002) apontam um ponto impor-
tante que merece reflexo quanto qualidade dos instrumentos,
mais especificamente, quanto qualidade cientfica destes, com
validao e normas atualizadas e adequadas populao que ir
utiliz-los. Os Princpios ticos e Cdigo de Conduta da American
Psychological Association (1992) dizem, em seu Artigo 2.07:

1. Os psiclogos no baseiam sua avaliao ou decises de in-


terveno ou recomendaes sobre dados ou resultados de
testes que estejam desatualizados para a atual finalidade.
2. De modo semelhante, os psiclogos no baseiam tais de-
cises ou recomendaes em testes e medidas obsoletas e
no teis para a atual finalidade.

A respeito de trabalhos e pesquisas com os instrumentos de


avaliao psicolgica, Jacquemin (1997) comenta:

164
A tica no uso de testes no processo de Avaliao Psicolgica

Os trabalhos srios e confiveis que permitem


conhecer a situao real a respeito dos testes, sua
utilizao e edio no Brasil, so bastante escassos.
A publicao de Hutz e Bandeira (1993) apresenta
um levantamento da literatura realizado a partir dos
resumos publicados em cerca de 1300 peridicos
indexados na Psychological Abstracts (1974-1992) e
a anlise manual dos peridicos brasileiros (1987-
1992), para conhecer as tendncias contemporneas
dos testes. Os resultados apontam uma situao
bastante precria no Brasil, tornando o trabalho do
psiclogo brasileiro, em psicodiagnstico, bastante
difcil e problemtico (inclusive do ponto de vista
tico) (Hutz, 1989) (p. 59).

Alves (1998) comenta sobre a qualidade psicomtrica dos


testes como fundamental para a sua utilizao, pois o emprego de
instrumentos no padronizados para a realidade brasileira leva
muitas vezes ao uso de testes totalmente inadequados, o que
tambm invalida todas as concluses tiradas a partir dessas avalia-
es (p. 22). A autora levanta, nessas consideraes, a questo
da atualizao das normas dos testes e a necessidade de pesquisas
peridicas para o estabelecimento dessas normas (Pellini, Rosa &
Vilarinho, 2002).
O Conselho Federal de Psicologia (CFP), rgo que analisa e
avalia os instrumentos de uso restrito dos psiclogos, orienta os
profissionais a observarem os estudos realizados com cada teste,
principalmente no que se refere aos estudos de validade, de
preciso e de padronizao. Assim, os requisitos bsicos para uma

165
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

determinada utilizao so os resultados favorveis desses estudos,


orientados para os problemas especficos relacionados s exign-
cias de cada rea. Conforme a Resoluo do CFP n 002/2003, que
regulamenta a produo e a utilizao de testes psicolgicos, as
condies de uso dos instrumentos devem ser consideradas apenas
para os contextos e propsitos para os quais os estudos empricos
indicaram resultados favorveis. De acordo com os Artigos 10 e
16 da Resoluo CFP n. 002/2003 (transcritos abaixo), s ser
permitida a utilizao dos testes psicolgicos que obtiverem o
parecer favorvel pelo CFP e ser considerada falta tica a utili-
zao de instrumento que no esteja em condio de uso.

Art. 10 - Ser considerado teste psicolgico em


condies de uso, seja ele comercializado ou dispo-
nibilizado por outros meios, aquele que, aps receber
Parecer da Comisso Consultiva em Avaliao
Psicolgica, for aprovado pelo CFP.
Pargrafo nico - Para o disposto no caput deste
artigo, o Conselho Federal de Psicologia considerar
os parmetros de construo e princpios reconhe-
cidos pela comunidade cientfica, especialmente os
desenvolvidos pela Psicometria.
Art. 162 - Ser considerada falta tica, conforme
disposto na alnea c do Art. 1 e na alnea g e
h do Art. 2 do Cdigo de tica Profissional do
Psiclogo, a utilizao de testes psicolgicos que no

2 Alterado pela Resoluo CFP 023/2007; artigo 9..

166
A tica no uso de testes no processo de Avaliao Psicolgica

constam na relao de testes aprovados pelo CFP,


salvo os casos de pesquisa.
Pargrafo nico - O psiclogo que utiliza testes
psicolgicos como instrumento de trabalho, alm do
disposto no caput deste artigo, deve observar as infor-
maes contidas nos respectivos manuais e buscar
informaes adicionais para maior qualificao no
aspecto tcnico operacional do uso do instrumento,
sobre a fundamentao terica referente ao cons-
tructo avaliado, sobre pesquisas recentes realizadas
com o teste, alm de conhecimentos de Psicometria
e Estatstica.

funo do Psiclogo a avaliao e a escolha dos mtodos e


tcnicas a serem utilizados em sua prtica profissional. No caso
dos testes, importante, primeiramente, a consulta ao Sistema
de Avaliao de Testes Psicolgicos (SATEPSI), disponvel no
site do Conselho Federal de Psicologia (www.pol.org.br), bus-
cando verificar se o instrumento escolhido consta na listagem
com parecer favorvel para uso profissional. Aps a confirmao
do parecer favorvel do instrumento, igualmente importante
consultar o manual do referido teste, de modo a obter informa-
es adicionais acerca do construto psicolgico que ele pretende
medir, bem como sobre os contextos e propsitos para os quais
sua utilizao se mostra apropriada.
Para a utilizao de alguns instrumentos que exigem uma ou
mais habilidades especficas (tericas e de interpretao) por parte
do aplicador, deve-se verificar, tambm, se no existem dificuldades
tanto por parte do psiclogo (conhecimento para a interpretao

167
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

conforme a teoria e constructo em que o teste foi criado), ou,


ainda, dificuldades fsicas ou psquicas do examinando. Ressalta-
-se a obrigatoriedade de utilizar-se o teste dentro dos padres
referidos por seu manual e cuidar da adequao do ambiente, do
espao fsico, do vesturio dos aplicadores e de outros estmulos
que possam interferir na aplicao.
Pellini e Pereira (2008), em matria publicada no Jornal Psi
CRPSP, destacam que o uso de instrumentos de forma imprpria,
com parecer desfavorvel, ou mesmo uma interpretao errnea,
pode prejudicar os examinados, alm de implicar falta tica por
parte do profissional. As autoras mencionam ainda que os instru-
mentos utilizados devem estar de acordo com as normas para evitar
prejuzos populao usuria. Este importante alerta se deve
disseminao do uso dos testes psicolgicos em processos seletivos
e em vrias outras circunstncias, de maneira irresponsvel.
O uso de instrumentos no favorveis pode causar prejuzos aos
usurios e resultar numa avaliao inadequada, como: candidatos
no recomendados para assumirem cargos/funes em processos
seletivos para uma vaga em uma empresa ou concurso pblico (na
rea de recursos humanos); pacientes para realizao de cirurgia
baritrica se submeterem a processos avaliativos em que o recurso
utilizado no afira as verdadeiras condies psquicas desses
pacientes (na rea clnica/hospitalar); riscos de envolvimento em
acidentes por candidatos que receberam carteira nacional de habi-
litao (CNH) sem terem a aptido necessria; recomendao
indevida de apto a candidatos ao registro e porte de arma de
fogo, sem ter a condio necessria, trazendo riscos para o prprio
candidato ou para as demais pessoas da sociedade, entre outros.
Quando realizadas as avaliaes psicolgicas nestes contextos,

168
A tica no uso de testes no processo de Avaliao Psicolgica

deve garantir-se que os instrumentos utilizados atendam aos crit-


rios de aplicao, correo e interpretao, definidos em seus
manuais, previamente analisados e aprovados pelo CFP, a fim de
evitar danos e consequncias, muitas vezes, irreversveis.
As autoras alertam, nessa mesma matria do Jornal Psi - CRPSP
(2008), para outra questo que tambm requer ateno e refere-
-se ao fato de que muitos testes estrangeiros so trazidos ao Brasil,
colocados em uso, inclusive por no psiclogos, e utilizados como
parmetros para comparaes de sujeitos que a eles se submetem.
Isso traz prejuzo ao usurio, que pensa que est adquirindo
servios profissionais, quando, na verdade, est sendo avaliado por
pessoas sem formao nem qualificao requeridas para a reali-
zao da avaliao, com instrumentos que, ainda que tenham
excelente reputao em seu pas de origem, no esto adaptados
populao brasileira, o que pode implicar desvios significativos
de resultados.
Muitos instrumentos jamais passaram por estudos de validao
e, mesmo que tais estudos tenham sido realizados em outros pases,
imprescindvel a adaptao nossa realidade.
Assim, os testes de qualquer natureza importados de outros
pases devem ser traduzidos para a lngua portuguesa e padro-
nizados a partir de estudos realizados com amostras nacionais,
considerando a relao de contingncia entre as evidncias de
validade, preciso e dados normativos com o ambiente cultural
onde foram realizados os estudos para sua aplicao prtica profis-
sional (Pellini & Pereira, 2008).
Estima-se que as pesquisas com testes demoram em torno de
quatro anos para o cumprimento das exigncias mnimas de estudos

169
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

para sua padronizao, e esse outro componente dificultador no


Brasil. Entre os diversos fatores que envolvem e demandam muito
tempo de realizao, encontram-se as dificuldades em aplicar os
instrumentos em pesquisa3. Diante dessa informao, ressalta-se
a pertinncia e a necessidade de parcerias para a aplicao dos
instrumentos nos mais variados contextos: clnicas, escolas, orga-
nizaes, instituies de ensino etc.
Acredita-se que, consolidando essas parcerias entre institui-
es, pesquisadores e populao, ocorra uma coleta de dados mais
efetiva e representativa, atentando-se sempre aos cuidados para
a aplicao de forma correta e sistemtica, alm de se observar a
regulamentao relacionada pesquisa com seres humanos.
importante salientar que esse um requisito orientado
pelo Conselho Federal de Psicologia, conforme seu artigo 1 da
Resoluo n 006/2004, que altera o artigo 14 da Resoluo n
002/2003:

Art. 1 - Altera o art. 14 da Resoluo CFP n.


002/2003, que passa a ter a seguinte redao:

Art. 14 - Os dados empricos das propriedades de


um teste psicolgico devem ser revisados periodica-
mente, no podendo o intervalo entre um estudo e
outro ultrapassar: 15 (quinze) anos, para os dados
referentes padronizao, e 20 (vinte) anos, para os
dados referentes validade e preciso.

3 Leme, I. & Rabelo, I., matria publicada na newsletter DIPSI, Blumenau, 2007.

170
A tica no uso de testes no processo de Avaliao Psicolgica

Enfim, para que um profissional atue de forma tica quanto ao


uso de instrumentos, deve procurar manter contnuo aprimora-
mento profissional; utilizar, no contexto profissional, apenas testes
psicolgicos com parecer favorvel, que se encontram listados
no site do SATEPSI; realizar a avaliao psicolgica em condi-
es ambientais adequadas, de modo a assegurar a qualidade e o
sigilo das informaes obtidas; guardar os documentos produzidos
decorrentes de Avaliao Psicolgica em arquivos seguros e de
acesso controlado; proteger a integridade dos instrumentos, no
os comercializando, publicando ou ensinando queles que no so
psiclogos.

A devolutiva no processo de Avaliao


Psicolgica

importante mencionar outro aspecto fundamental envolvido


no processo de avaliao, que se refere entrevista devolutiva.
Conforme a Resoluo do CFP n. 01/2002, que regulamenta a
Avaliao Psicolgica em Concursos Pblicos e em processos sele-
tivos da mesma natureza, a devolutiva direito de todo candidato
sujeito a processos de avaliao psicolgica:

Art. 6 - . . .

1 - O sigilo sobre os resultados obtidos na avaliao


psicolgica dever ser mantido pelo psiclogo, na
forma prevista pelo cdigo de tica da categoria
profissional.

171
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

2 - Ser facultado ao candidato, e somente a


este, conhecer o resultado da avaliao por meio de
entrevista devolutiva.

Deste modo, o candidato dever ser informado sobre os servios


prestados e orientado quanto aos resultados obtidos, conforme
artigo 1, alneas g e h do Cdigo de tica, que diz ser respon-
sabilidade do psiclogo informar a quem de direito os resultados
decorrentes da prestao de servios psicolgicos, transmitindo
somente o que for necessrio, para a tomada de decises, que
afetam o usurio ou beneficirio e orientar a quem de direito
sobre os encaminhamentos apropriados, a partir da prestao de
servios psicolgicos, e fornecer, sempre que solicitado, os docu-
mentos pertinentes ao bom termo do trabalho.
A entrevista devolutiva, em sua maioria, resultante de um
processo de avaliao psicolgica, sendo esta entendida como um
processo tcnico-cientfico de coleta de dados, estudos e interpre-
tao de informaes a respeito dos fenmenos psicolgicos que so
resultantes da relao do indivduo com a sociedade, utilizando-se
de estratgias psicolgicas: mtodos, tcnicas e instrumentos.
Os resultados dessas avaliaes ou devolutivas devem consi-
derar e analisar os condicionantes histricos e sociais e seus efeitos
no psiquismo, com a finalidade de servirem como instrumentos
para atuar no somente sobre o indivduo, mas na modificao
desses condicionantes que operam desde a formulao da demanda
at a concluso do processo, segundo a Resoluo n 07/2003 do
Conselho Federal de Psicologia.
A devolutiva no se constitui apenas em transmitir os resul-
tados de um processo de avaliao psicolgica, mas , tambm, o

172
A tica no uso de testes no processo de Avaliao Psicolgica

fruto de um trabalho realizado a partir de uma solicitao externa


(Pellini, 2006).
Essas solicitaes so oriundas de diversas reas de atuao
profissional: clnica, organizacional, educacional, judiciria, hos-
pitalar, entre outras, e se configuram em solicitaes que exigem
cuidados e responsabilidades. O psiclogo deve ter sempre claro em
seu trabalho o objetivo de estar realizando uma avaliao. Depen-
dendo do motivo da solicitao, ele pode mudar radicalmente, por
exemplo, o destino de uma pessoa, famlia, o desenvolvimento de
uma criana ou uma deciso judicial.
importante destacar o tipo de linguagem a ser empregada
na devolutiva. No caso de trabalhar a devolutiva entre colegas
psiclogos, o comunicado pode ser feito em termos tcnicos, cons-
tando as referncias aos recursos utilizados e discutindo-se os
detalhes dos aspectos mais primitivos s defesas mais regressivas
e mais maduras do cliente. J em relao a outros profissionais, o
psiclogo deve compartilhar somente as informaes relevantes,
resguardando o carter confidencial e preservando o sigilo.
Algumas categorias profissionais tm caractersticas distintas a
serem observadas. Uma solicitao feita por um juiz, por exemplo,
que nomeia um psiclogo como perito no sistema judicirio, deve
resultar em um laudo ou em um parecer, sendo que esses tipos
de documentos escritos devem ser formulados com os devidos
cuidados de redao e transmitindo somente o que for necessrio
para a tomada de decises e para que os operadores do Direito
possam compreend-los.
Para uma devolutiva solicitada por escola, o psiclogo deve
referir-se exclusivamente s questes levantadas na demanda

173
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

inicial, em linguagem acessvel a quem vai receber o resultado,


tomando as devidas precaues no sentido de no invadir a inti-
midade do caso por questes que no se relacionem ao campo
pedaggico.
Nas situaes de recrutamento e seleo, alerta-se para a impor-
tncia de ter claro o perfil do cargo para selecionar as tcnicas que
sero utilizadas e os procedimentos, de forma a no causar danos
aos candidatos. No momento da devolutiva, o psiclogo deve
comunicar claramente ao solicitante se suas caractersticas esto
ou no contemplando os anseios da empresa.
Nesses casos, necessrio ter o cuidado de no utilizar expres-
ses como voc no passou no teste ou voc no passou na
avaliao psicolgica, porque o candidato poder considerar-se
incapaz e portador de alguma dificuldade ou problema. Isso pode
no corresponder realidade, mas apenas ao fato de que ele no
apresenta as caractersticas exigidas para o desempenho da funo
(Pellini, 2006).
A importncia da devolutiva nos processos de avaliao psico-
lgica para obteno da CNH outro aspecto que devemos
considerar. Existe a obrigatoriedade do cumprimento do Cdigo de
tica do Psiclogo, no art. l, alnea g, e da Resoluo n 007/2009
do Conselho Federal de Psicologia que institui normas e proce-
dimentos para a avaliao psicolgica no contexto do Trnsito e
revoga a Resoluo CFP n 012/2000.
Esta recente resoluo destaca, em seu art. 1, as normas e os
procedimentos para avaliao psicolgica de candidatos Carteira
Nacional de Habilitao e condutores de veculos automotores,
no item III - Dos instrumentos de avaliao psicolgica, alnea

174
A tica no uso de testes no processo de Avaliao Psicolgica

a- Entrevista Psicolgica, em que obriga o psiclogo a realizar a


entrevista devolutiva, apresentando de forma clara e objetiva a
todos os candidatos o resultado de sua avaliao psicolgica.
A partir dos contextos acima, ressalta-se, ainda, que a devolu-
tiva no processo de avaliao psicolgica, assim como em qualquer
rea em que o psiclogo estiver atuando, deve sempre ser reali-
zada de forma a promover o crescimento do indivduo, e no o
contrrio.
Quanto guarda do material produzido que fundamentou a
avaliao psicolgica, este deve ser guardado pelo prazo mnimo
de cinco anos, e o psiclogo e/ou a instituio em que foi realizada
a avaliao psicolgica responsvel pelos materiais relativos
avaliao.
Para referncia e orientao quanto elaborao desse docu-
mento (de acordo com os princpios tcnicos e ticos necessrios
para elaborao qualificada da comunicao escrita), devem
ser seguidos os parmetros da Resoluo CFP n 007/2003, que
institui o Manual de Elaborao de Documentos Escritos produzidos
pelo psiclogo, decorrentes de avaliao psicolgica.
Quanto responsabilidade tcnica, o psiclogo deve ser capaz
de transmitir ao candidato informaes que o esclaream sobre
sua condio psicolgica atual, e, se necessrio, encaminh-lo a
outro profissional ou servio especializado, conforme previsto no
art. 1 alnea g e h do Cdigo de tica Profissional (2005).
Tal contexto remete reflexo sobre o tema da devolutiva,
que, alm de sua importncia, teve alterao introduzida pelo
Cdigo de tica - Resoluo CFP n 010/2005. A mudana intro-
duzida pelo Cdigo de tica vigente que este prev como dever

175
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

do psiclogo que a devolutiva seja tambm fornecida por escrito


pessoa atendida, caso esta venha a solicitar que seja feito dessa
forma.

Art. 1 - So deveres fundamentais dos psiclogos: . . .


h. Orientar a quem de direito sobre os encaminha-
mentos apropriados, a partir da prestao de servios
psicolgicos, e fornecer, sempre que solicitado, os
documentos pertinentes ao bom termo do trabalho.
A lei 10.241/1999, que dispe sobre os direitos dos
usurios dos servios e das aes de sade no Estado,
tambm especifica que a prestao das informaes
deve ser fornecida por escrito:

Artigo 2 - So direitos dos usurios dos servios de


sade no Estado de So Paulo:

IX - receber por escrito o diagnstico e o trata-


mento indicado, com a identificao do nome do
profissional e o seu nmero de registro no rgo de
regulamentao e controle da profisso.

Como mencionado, a devolutiva refere-se ao momento em que


o psiclogo transmite pessoa atendida o resultado do trabalho
realizado, orientando-o e fazendo os encaminhamentos necess-
rios. Isso pode ocorrer tanto durante o atendimento (por exemplo,
no decorrer de um processo psicoteraputico) ou na sua finalizao
(por exemplo, aps a realizao de uma avaliao psicolgica).
Caber ao psiclogo, no entanto, avaliar quais informaes
devem ser documentadas, considerando: a situao especfica,

176
A tica no uso de testes no processo de Avaliao Psicolgica

os objetivos propostos do trabalho para o qual foi contratado e a


fundamentao terica do seu trabalho.
Ressaltam-se ainda os cuidados e deveres do psiclogo nas suas
relaes com a pessoa atendida quanto ao sigilo profissional, s
relaes com a justia e ao alcance das informaes, identificando
riscos e compromissos em relao utilizao das informaes
presentes nos documentos em sua dimenso de relaes de poder,
conforme dispe o Manual de Elaborao de Documentos Decor-
rentes de Avaliao Psicolgica, em seus princpios ticos.

Consideraes finais

Conclui-se que a tica no uso de testes no processo de Avaliao


Psicolgica corresponde elaborao ou escolha adequada de
instrumentos, considerando a correta condio de aplicao e
anlise de seus resultados. Implica definir o que aferir, como aferir,
as consequncias dessa aferio e o uso dos resultados obtidos, ou
seja, significa um processo. Segundo Sass (2000), um equvoco
considerar a Avaliao Psicolgica to somente como geradora de
um produto.
Este autor destaca que a avaliao psicolgica marcada forte-
mente pelo aspecto tcnico, o que parece ocultar a sua principal
determinao: o aspecto poltico, pois sua dimenso tcnica,
dotada de procedimentos que avaliam pessoas e tomam decises
por elas, incide diretamente sobre a ao tico-poltica que o
psiclogo executa em relao quele que avaliado.
Portanto, parece que o profissional da psicologia somente pode
atuar de forma crtica e tica.

177
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Questes

1) Defina Avaliao Psicolgica.


2) Ao utilizar um teste psicolgico, quais aspectos devem ser
observados?
3) Qual a conduta adequada para o uso de testes internacio-
nais na populao brasileira?
4) No que consiste a entrevista devolutiva?

178
A tica no uso de testes no processo de Avaliao Psicolgica

Referncias
Alves, I. C. B. (1998). Avaliao Psicolgica: tica, situao no Brasil e na
formao do psiclogo. In IV Encontro mineiro O uso dos testes psicol-
gicos (pp. 17-32). Belo Horizonte: Vetor.

American Psychological Association. (1992). Ethical principles of psycholo-


gists and code of conduct. Washington, DC: American Psychological
Association.

Conselho Federal de Psicologia. (2002). Resoluo 001/2002. Recuperado em


19 de abril de 201, de HTTP://www.pol.org.br.

Conselho Federal de Psicologia. (2003). Resoluo 002/2003. Recuperado em


19 de abril de 2011, de HTTP://www.pol.org.br.

Conselho Federal de Psicologia. (2003). Resoluo 007/2003. Recuperado em


19 de abril de 2011, de HTTP://www.pol.org.br.
Conselho Federal de Psicologia. (2004). Resoluo 006/2004. Recuperado em
19 de abril de 2011, de HTTP://www.pol.org.br.

Conselho Federal de Psicologia. (2005). Resoluo n 010/2005. Recuperado


em 19 de abril de 2011, de HTTP://www.pol.org.br.

Conselho Federal de Psicologia. (2007). Resoluo n 023/2007. Recuperado


em 19 de abril de 2011, de HTTP://www.pol.org.br.

Conselho Federal de Psicologia (2011). Sistema de Avaliao de Testes Psico-


lgicos SATEPSI. Recuperado em 21 de maro de 2011, de http://
www2.pol.org.br/satepsi/sistema/admin.cfm.

Jacquemin, A. (1997). As tcnicas de exame psicolgico como instrumento na


pesquisa e objeto de pesquisa. Boletim de Psicologia, XLVII(107), 57-68.

Jornal PSI CRP-SP. A insero do psiclogo no Poder Judicirio e sua interface


com o Direito. Questes ticas. (Janeiro/maro, 2006). Jornal Psi CRPSP,
146. Recuperado em 21 de maro de 2011 de: http://www.crpsp.org.br/
portal/comunicacao/jornal_crp/146/frames/fr_q. aspx.

Noronha, A. P., & Alchieri, J. C. (2002). Reflexes sobre os Instrumentos de


Avaliao Psicolgica. In R. Primi.(Org.), Temas em Avaliao Psicolgica.
(pp. 7-16). Campinas: Impresso Digital do Brasil, IBAP.

179
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Pasquali, L., & Alchieri, J. C. (2001). Os Testes Psicolgicos no Brasil. In L.


Pasquali (org.), Tcnicas de Exame Psicolgico TEP (p. 195-221). So
Paulo: Casa do Psiclogo.

Pellini. M. C. B. M. (2006, abril/junho). Devolutiva: direito do cliente, dever


do psiclogo: Fornecimento dos resultados parte fundamental na pres-
tao de servios psicolgicos. Jornal Psi CRPSP, 147. Recuperado em
21 de maro de 2011 de http://www.crpsp.org.br/portal/comunicacao/
jornal_crp/147/frames/fr_questoes_eticas.aspx.

Pellini. M. C. B. M., & Pereira, D. C. (2008, maro/abril). Teste psicolgico:


o que voc precisa saber antes de escolher um. Jornal Psi CRPSP, 155,
Recuperado em 21 de maro de 2011 de http://www.crpsp.org.br/portal/
comunicacao/jornal_crp/155/frames/fr_orientacao.aspx.

Pellini, M. C. B. M., Rosa, H., & Vilarinho, M. A. (2002). Uma reflexo sobre
as Questes ticas no Ensino das Tcnicas de Avaliao Psicolgica nos
Cursos de Graduao em Psicologia. Caderno Uniabc de Psicologia, 31,
61-69.

Primi, R., Flores-Mendoza, C. E., & Castilho, A. V. (1998). Estudo explora-


trio das propriedades psicomtricas do Teste de Raven Escala Avanada
Informatizado. Boletim de Psicologia, 48, 67-75.

Sass, O. (2000). O lugar da avaliao psicolgica. In M. C. B. M. Pellini,


Avaliao psicolgica para porte de arma de fogo: contribuies da prova de
Rorschach. So Paulo: Casa do Psiclogo.

Wechsler, S. M. (1999). Guia de procedimentos ticos para a avaliao psico-


lgica. In S. M. Wechsler & R. S. L. Guzzo (Orgs.), Avaliao psicolgica:
Perspectiva internacional (pp. 133-141). So Paulo: Casa do Psiclogo.

180
Sobre os autores

Felipe Valentini
Psiclogo graduado pela Universidade do Vale do Rio dos Sinos.
Mestre em em Psicologia pela Universidade Federal do Rio Grande
do Norte (UFRN). Atualmente doutorando do Programa de
Ps-Graduao em Psicologia Social, do Trabalho e Organiza-
es (PSTO), da Universidade de Braslia (UnB). Desenvolve
pesquisas nas reas de psicometria, avaliao psicolgica, inteli-
gncia, personalidade e famlia.

Gisele Aparecida da Silva Alves


Psicloga. Mestre em Psicologia, com nfase em Avaliao
Psicolgica, pelo Programa de Ps-Graduao stricto sensu da
Universidade So Francisco (USF), campus Itatiba. Pesquisadora
do Departamento de Pesquisa e Produo de testes da Editora
Casa do Psiclogo.

Irene F. Almeida de S Leme


Psicloga com MBA em Gerncia e Administrao de Recursos
Humanos pela Fundao Getlio Vargas, So Paulo (FGV-SP).
Experincia em desenvolvimento e implantao de projetos rela-
cionados gesto e desenvolvimento de pessoas, recrutamento
e seleo e em projetos de orientao vocacional. Participou da
adaptao brasileira dos testes Color Trails Test, Memria Visual
de Rostos (MVR), Teste de Inteligncia Geral - Beta III (Army Beta
Tests) e do instrumento Leadership Judgement Indicator (LJI).
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

Coordenadora do Departamento de Pesquisa e Produo de Testes


da Editora Casa do Psiclogo.

Ivan SantAna Rabelo


Psiclogo, mestre em avaliao psicolgica pela Universidade
So Francisco (USF) e doutorando pela Escola de Educao
Fsica e Esportes, da Universidade de So Paulo (EEFE-USP).
Atua como coordenador e pesquisador na editora Casa do Psic-
logo e como professor do curso de psicologia da Universidade
Paulista (UNIP) em disciplinas relacionadas avaliao psico-
lgica, psicometria, tcnicas projetivas e superviso de estgio
em psicologia organizacional junto clnica escola. Participou da
adaptao brasileira dos testes Color Trails Test, Memria Visual
de Rostos, Teste de Inteligncia Geral - Beta III (Army Beta Tests) e
do instrumento Leadership Judgement Indicator (LJI). Tem expe
rincia na rea de Recursos Humanos, com foco na implantao
de departamentos de treinamento e desenvolvimento (T&D),
avaliao psicolgica nas organizaes, recrutamento e seleo e
desenvolvimento de liderana.

Jacob Arie Laros


Doutor em Personality and Educational Psychology pela Rijksu-
niversiteit Groningen (RuG), Holanda, com ps-doutorado em
Educational Psychology pela mesma universidade (2002). Realizou
um segundo estgio ps-doutoral na Universidad de Valncia,
Espanha (2009). Suas especialidades, tanto em pesquisa como em
ensino, so avaliao educacional em larga escala, avaliao de
programas educacionais e sociais, elaborao de testes de habi-
lidades cognitivas e anlise de dados. professor adjunto IV no

182
Sobre os autores

Instituto de Psicologia da Universidade de Braslia (UnB) no curso


de ps-graduao em Psicologia Social, do Trabalho e das Orga-
nizaes (PSTO). autor de duas baterias de testes no verbais
de inteligncia: o SON-R para crianas de 2,5 a sete anos e o
SON-R para pessoas de seis a quarenta anos. Atua principalmente
na pesquisa dos seguintes temas: Anlise Exploratria de Dados
(AED), Teoria Clssica de Testes (TCT), Teoria de Resposta ao
Item (TRI), Anlise Grfica de Itens (AGI), Anlise Fatorial (AF),
Anlise de Regresso Multinvel (ARM) e Modelagem por Equa-
es Estruturais (MEE). Formou mais de vinte alunos (mestrado e
doutorado) e tem mais de cinquenta trabalhos publicados (artigos,
captulos e livros).

Josemberg Moura de Andrade


Psiclogo formado pela Universidade Federal da Paraba, mestre
e doutor em Psicologia Social, do Trabalho e das Organizaes
(PSTO) na rea de Avaliao e Medida pela Universidade de
Braslia (UnB). Atualmente professor adjunto I do Departamento
de Psicologia da Universidade Federal da Paraba. Foi professor
adjunto da Universidade Federal Fluminense, exerceu a funo
de psicometrista no Centro de Seleo e de Promoo de Eventos
da Universidade de Braslia (CESPE/UnB) e colaborou como
assistente de pesquisa no Canadian Research Institute for Social
Policy, Universidade de Nova Brunswick, Canad. Tem expe-
rincias em Psicologia e Educao, com nfase na Construo e
Validao de Escalas Atitudinais e Testes Psicolgicos. Atua como
parecerista ad hoc dos peridicos Psicologia: Teoria e Pesquisa, Psico-
logia: Reflexo e Crtica, Estudos de Psicologia, Psico-USF, Aletheia,
Avaliao Psicolgica e Fractal Revista de Psicologia. Suas principais

183
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

reas de interesse so: avaliao psicolgica e educacional, instru-


mentao em psicologia e educao, Psicometria, Metodologia e
Psicologia social.

Leila Brito
Psicloga clnica. Especialista em Docncia no Ensino Superior
pela Universidade Cidade de So Paulo (UNICID), cursa atual-
mente Psicopedagogia pela Universidade Cidade de So Paulo
(UNICID). Tutora do EAD da Universidade Cidade de So
Paulo (UNICID). Assistente tcnica de Testes da Editora Casa do
Psiclogo.

Lucas de Francisco Carvalho


Psiclogo graduado em Psicologia pela Universidade Presbiteriana
Mackenzie e formado em Acompanhamento Teraputico pelo
Instituto de Psiquiatria do Hospital das Clnicas de So Paulo.
Mestre e doutorando em Avaliao Psicolgica pela Universidade
So Francisco. Realizou parte de seu doutorado na University of
Toledo, Estados Unidos. Foi bolsista de mestrado pela Coordenao
de Aperfeioamento de Pessoal de Ensino Superior (CAPES) e
bolsista de doutorado pela Fundao de Ampato Pesquisa do
Estado de So Paulo (FAPESP). Atualmente professor do curso
de Psicologia da Universidade Presbiteriana Mackenzie.

Makilim Nunes Baptista


Psiclogo, mestre em Psicologia pela Pontifcia Universidade
Catlica de Campinas (PUCCAMP) e doutor pelo departamento
de Psiquiatria e Psicologia Mdica da Universidade Federal de So
Paulo. Atualmente docente do Programa de Ps-Graduao

184
Sobre os autores

stricto sensu em Psicologia da Universidade So Francisco (USF),


bolsista em produtividade pelo Conselho Nacional de Desen-
volvimento Cientfico e Tecnolgico (CNPq), coordenador
do Laboratrio de Avaliao Psicolgica em Sade Mental
(LAPSAM-III) do Programa de Ps-Graduao stricto sensu em
Psicologia da USF, membro do grupo de trabalho Psicologia da
Famlia na Amrica Latina, da Unio Latino-Americana de
Entidades de Psicologia (ULAPSI). Tem experincia na rea de
Psicologia, com nfase em Avaliao Psicolgica, Tratamento e
Preveno Psicolgica, atuando principalmente na pesquisa dos
seguintes temas: depresso, suporte familiar, suicdio, adolescentes
e estresse.

Marcia Gabriel da Silva Rego


Psicloga, mestre e doutora em Neurocincias e Comportamen-
to pelo Instituto de Psicologia da Universidade de So Paulo.
Coordenadora do curso de Ps-Graduao em Educao, Sade
e Neuropsicologia realizado na Faculdade Victor Hugo, So Lou-
reno, Minas Gerais. responsvel tcnica pelo Instituto Espao
Residir. Professora titular da Universidade Paulista (UNIP) e psic-
loga do Hospital das Clnicas da Universidade de So Paulo. Tem
experincia na rea de Psicologia, com nfase em Neuropsicologia,
atuando principalmente nos seguintes temas: Neuropsicologia, Sn-
drome de Asperger, Hiperlexia, Processos Cognitivos e Linguagem.

Maria Cristina Barros Maciel Pellini


Psicloga, mestre em Psicologia Clnica pela Universidade So
Marcos (Unimarco) e doutora em Psicologia Escolar e do Desen-
volvimento Humano pelo Instituto de Psicologia da Universidade

185
Avaliao psicolgica: guia de consulta para estudantes e profissionais de psicologia

de So Paulo (IP-USP), com especializao em Administrao


de Recursos Humanos pela Universidade Paulista (UNIP) e no
Mtodo de Rorschach pela Sociedade Rorschach de So Paulo.
Experincia na rea de Psicologia do Desenvolvimento Humano,
com nfase em Avaliao Psicolgica, atuando na pesquisa dos
seguintes temas: Psicologia e formao, Mtodo de Rorschach,
Avaliao psicolgica, tica profissional, tica e Cidadania.
Atualmente professora adjunta e coordenadora auxiliar do curso
de Psicologia dos campi Norte e Tatuap da Universidade Paulista
(UNIP).

Mayra Silva de Souza


Psicloga. Especialista em Psicologia Hospitalar. Mestre e doutora
em Psicologia, com nfase em Avaliao Psicolgica, pelo
Programa de Ps-Graduao stricto sensu da Universidade So
Francisco (USF), campus Itatiba.

Rodolfo A. M. Ambiel
Psiclogo. Mestre em Avaliao Psicolgica pela Universidade
So Francisco, campus Itatiba, bolsista da Fundao de Amparo
Pesquisa de So Paulo (FAPESP). Professor auxiliar da Univer-
sidade So Francisco. Membro do Departamento de Pesquisa e
Produo de Testes da Editora Casa do Psiclogo. Tem experincia
na rea de Psicologia, com nfase em Fundamentos e Medidas da
Psicologia e Orientao Profissional.

186
Sobre os autores

Slvia Vernica Pacanaro


Psicloga. Mestre em Avaliao Psicolgica pela Universidade
So Francisco. Especialista em Educao e Psicopedagogia pela
Pontifcia Universidade Catlica de Campinas (PUCCAMP).
Pesquisadora do Departamento de Pesquisas e Produo de Testes
da Editora Casa do Psiclogo.

Vicente Cassepp-Borges
Graduado em Psicologia pela Universidade do Vale do Rio dos
Sinos. Doutor em Psicologia Social, do Trabalho e das Organiza-
es (PSTO) pela Universidade de Braslia (UnB). Colaborador
do Centro de Estudos Psicolgicos sobre Meninos e Meninas de
Rua (CEP-Rua) na Universidade Federal do Rio Grande do Sul
(UFRGS) desde 2002, sob orientao da professora Slvia Helena
Koller, e do Laboratrio de Pesquisa em Avaliao e Medidas
(LabPAM), sob orientao do professor Luiz Pasquali. Recebeu o
Prmio Estudantil da Sociedade Interamericana de Psicologia em
2007. Atualmente, Professor adjunto da Universidade Federal
da Grande Dourados. Seus temas de interesse so o Amor e a
Avaliao Psicolgica.

187
Este livro oferece ao leitor um guia prtico dos princpios
bsicos da psicometria contendo informaes necessrias para a
compreenso e avaliao dos testes psicolgicos. Apresenta uma
descrio dos conceitos e tcnicas mais relevantes que formam os
alicerces necessrios para uma prtica fundamentada, acessvel
para alunos e profissionais da psicologia.
Aborda os procedimentos estatsticos usados com frequncia
na testagem, os referenciais para a introduo de escores,
fidedignidade, validade, consideraes sobre os itens de testes,
aspectos sobre a atual conjuntura da avaliao psicolgica no
Brasil e diretrizes ticas para seleo, administrao,
pontuao e comunicao dos resultados.
Alm dos assuntos sob a tica da Teoria Clssica dos
Testes, tambm apresenta aspectos da Teoria de Resposta
ao Item (TRI), de forma adaptada ao leitor que no possui
sofisticao em estatstica e psicometria.
Dessa forma, torna-se um livro indispensvel para
disciplinas vinculadas ao contexto da avaliao psicolgica
nas universidades, assim como possibilita capacitao aos
profissionais e pesquisadores em psicologia, educao,
bem como em todas as reas nas quais so desenvolvidos e
utilizados instrumentos para a pesquisa cientfica
e para atuao profissional.