Вы находитесь на странице: 1из 10

Copyright 1996 Papeles del Psiclogo

Noviembre , n 66 , 1996
ISSN 0214 - 7823

DIRECTRICES PARA LA TRADUCCION Y ADAPTACION DE LOS TESTS

Jos Muiz y Ronald K. Hambleton

Universidad de Oviedo y Universidad de Massachusetts

[ Imprimir ]

Los tests en sus distintas modalidades constituyen uno de los instrumentos de medida ms
utilizados por los profesionales de la psicologa y por los investigadores. Como cualquier otro
instrumento de medida en cualquier campo de actividad, su utilizacin incorrecta resulta
nefasta, pero ello es especialemnte grave en psicologa y educacin, donde con frecuencia
estn implicadas decisiones de suma importancia para la vida de las personas. La mayora de
los problemas en torno a los tests provienen de su uso inadecuado, ms que del test en s, de su
construccin, o de sus propiedades tcnicas. Este uso inapropiado por parte de personas sin
una formacin suficiente, es el responsable de muchas de las crticas que reciben los tests,
cuestionarios y las escalas psicolgicas. Pero la realidad es que los tests siguen siendo una
instrumentacin imprescindible en la prctica psicolgica y educativa en todo el mundo, y
todo indica que va a seguir sindolo en el futuro, por tanto no hay que ahorrar esfuerzos en
mejorar su uso. Cmo hacerlo es una cuestin abierta, que ofrece muchas posibilidades y
modelos, y cualquier opinin es bienvenida. Los Colegios de Psiclogos de la mayora de los
pases tratan de mejorar esta prctica de formas muy diversas. Una lnea clave de actuacin es
promover que los tests que se comercializan estn tcnicamente bien construidos. A la base de
ello est una formacin psicomtrica adecuada y la publicacin de normas tcnicas que deben
de seguir los constructores. Los estndares tcnicos ms utilizados son los elaborados por la
Asociacin Americana de Psicologa y otras organizaciones (1985), actualmente en proceso de
revisin, esperndose una nueva edicin para 1998. Las propias casas editoras de tests,
primeras interesadas en un uso deontolgico apropiado, as como los Colegios Profesionales,
toman algunas medidas complementarias, tales como restringir el acceso a los tests en funcin
de su especializacin, registrar oficialmente a los usuarios cualificados, etc. La posibilidades
son muy variadas, vanse por ejemplo los trabajos de Bartram (1996), Fremer (1996), Evers
(1996) o Muiz (1996a).

La creciente globalizacin mundial que se est produciendo a todos los niveles y en todas las
esferas de la actividad humana, debido a la facilidad y rapidez de las comunicaciones, potencia
que los instrumentos de medida generados en determinado pas rpidamente se utilicen en otro
distinto. Existe adems un inters creciente en todo lo relacionado con los estudios
interculturales, como bien sealan van de Vijver y Lonner (1995). Ahora bien, los tests no son
automticamente utilizables, deben de adaptarse cuidadosamente en funcin de las diferencias
interculturales entre el idioma/cultura originario y aqullos en los que se pretende utilizar. Esto
es especialmente importante en un pas como Espaa en el que un porcentaje muy elevado de
los tests y las escalas que se utilizan provienen de traducciones y adaptaciones de otros
idiomas y culturas. Con la inminente integracin europea el problema seguramente se
agudizar. Para no sesgar de entrada el uso de estos tests hay que asegurarse de que su
traduccin/adaptacin es la adecuada. Si ya apareciesen fallos a este nivel bsico, cualquier
medida posterior encaminada a mejorar su uso caera en saco roto. Como se ir viendo,
traducir un test no es una mera cuestin de conocer bien los dos idiomas implicados, es un
proceso mucho ms complejo, por eso ms que de traduccin habra que hablar de adaptacin.
Consciente de este problema, el Colegio Oficial de Psiclogos (COP) ha participado en un
Comit Internacional auspiciado por la Comisin Internacional de Tests (ITC), de la cual es
miembro, para preparar unas directrices tcnicas para la adaptacin de los tests de unos pases
a otros. Este Comit ha elaborado un conjunto de veintids directrices o recomendaciones que
aparecern publicadas en un amplio documento. Avances de este documento, en los que se
basa nuestra exposicin, pueden verse en Hambleton (1993, 1994, 1996) y Van de Vijver y
Hambleton (1996).

El Comit, presidido por Ronald K Hambleton, est formado por las siguientes personas,
representando a diversas asociaciones internacionales:

- Glen Budgell. Canad


- Rob Feltham. Inglaterra
- Roco Fernndez Ballesteros. Espaa
- John H. A. L. de Jong. Holanda
- Ingrid Munck. Suecia
- Jos Muiz. Espaa
- Ype Poortinga. Holanda
- Isik Savasir. Turqua
- Charles Spielberger. Estados Unidos
- Fons Van de Vijver. Holanda
- Jac N. Zaal. Holanda

Posibles fuentes de error al adaptar un test

Si bien, como antes se ha sealado, estn muy claras las razones por las que se adaptan los
tests, la metodologa para hacerlo no lo est tanto, y aparece dispersa en diversas
publicaciones. Esta es la razn fundamental por la que la Comisin Internacional de Tests se
plante la tarea de elaborar un documento tcnico al respecto, del cual lo que aqu se presenta
es un avance.

Ahora bien, dnde se producen los errores cuando alguien trata de adaptar un test de una
cultura a otra?. Hay cuatro grandes reas implicadas en la confeccin de un test en las cuales
se pueden tomar decisiones errneas:

- Contexto

- Construccin y adaptacin

- Aplicacin

- Interpretacin de las puntuaciones

Contexto: Se refiere al mbito sociocultural en el que estn enmarcadas las personas a las que
se aplicar el test. La mayora de los constructos utilizados en Psicologa son altamente
dependientes de los aspectos culturales, por tanto, lo primero de lo que hay que cerciorase es
que el constructo a evaluar es equiparable en ambas culturas. Si no se da esa equivalencia
razonable carece de sentido la adaptacin, y si se hace se estarn midiendo constructos
distintos en cada cultura. Hay que aportar datos empricos de la equivalencia, para lo cual
pueden llevarse a cabo estudios sobre el terreno por equipos de personas multiculturales y
multilnges para evitar un sesgo etnocntrico. Por ejemplo, evaluacin de variables como
inteligencia, actitudes, o personalidad, resultan altamente dependientes de la matriz cultural,
por lo que su utilizacin en estudios comparativos requiere sumo cuidado al adaptar la prueba.
Si existen datos acerca de la equivalencia de los constructos, puede pasarse a la fase de la
adaptacin propiamente dicha, que medir las conductas concretas para evaluar el constructo.

Construccin y adaptacin del test: La filosofa general que ha de guiar la adaptacin es que
el test mida el mismo constructo de la misma forma, pero ajustndose a las peculiaridades de
la nueva poblacin. Naturalmente esto no resulta nada fcil. La primera decisin difcil es la
seleccin de los traductores. Es fundamental que los traductores no slo conozcan ambos
idiomas, sino que estn familiarizados tambin con ambas culturas. En numerosas situaciones
hay que cambiar los tems casi completamente, y eso slo se puede hacer desde un
conocimiento profundo de la cultura objetivo del nuevo tem. Es tambin necesario que los
traductores tengan un cierto conocimiento de la tecnologa para la construccin de tests, y de
la materia a traducir, para lo cual han de recibir algn tipo de formacin. Si no disponen de
esos conocimientos tienden a traducir literalmente, lo cual obviamente no siempre es lo ms
adecuado.

Una tcnica habitual en la traduccin es lo que se denomina traduccin inversa. Primero se


traduce el test al idioma objetivo por uno, o mejor, un equipo de traductores, y otro equipo
vuelve a traducir esa versin al idioma original, la bondad de la traduccin se juzga en funcin
del grado de coincidencia con la versin original. Este popular mtodo no est exento de
problemas, existiendo otros diseos recomendables, vase por ejemplo el captulo de
Hambleton (1996).

Una traduccin correcta es slo el punto de partida para que un test resulte bien adaptado. A
partir de ah hay que comprobar empricamente sus propiedades psicomtricas, tales como la
fiabilidad, validez y estandarizacin en la nueva poblacin. Elaborar y mantener actualizados
los baremos es trabajoso, y caro en tiempo y dinero, pero bajo ningn concepto deben de
utilizarse los de la poblacin de origen sin ms. Otro aspecto clave es asegurarse de que
ciertos tems no estn sesgados contra determinado grupo. La tecnologa psicomtrica para la
deteccin del sesgo es en la actualidad abundante y eficaz, vase, por ejemplo, una exposicin
en castellano en el trabajo de Fidalgo (1996).

Dos aspectos claves que los adaptadores deben de valorar, aparte de la adecuacin de los
propios estmulos, es el tipo de formato de los tems y el concepto de velocidad en la
ejecucin de las tareas. Hay formatos, como el de eleccin mltiple, muy habituales en ciertas
culturas, que no lo son tanto en otras. Estas diferencias pueden mitigarse con suficientes
ejemplos y ejercicios. Los occidentales tendemos a asumir que no slo hay que hacer las cosas
bien, sino rpido, y as somos socializados desde nios. Pero esta asuncin no se da en todas
las culturas (van Leest y Bleichrodt, 1990; van de Vijver y Poortinga, 1991), y cuando se les
pide que trabajen en la prueba lo ms rpidamente posible, no entienden qu prisa puede haber
para acabar pronto, pues probablemente tiempo es de las pocas cosas de las que estn
sobrados. Hay que tratar de minimizar los efectos de la velocidad de respuesta, siempre y
cuando, claro est, no forme parte del constructo a evaluar.
Aplicacin: La forma en la que se aplica un test influye en sus propiedades psicomtricas,
tales como su fiabilidad y validez. Las relaciones de los aplicadores con las personas a las que
se pasa el test (rapport), la forma de dar las instrucciones de la prueba, y en general las
interacciones aplicador-examinado deben de cuidarse al mximo. Como seala Hambleton
(1996), los aplicadores, a) deben ser elegidos entre personas de la poblacin a la que se aplica
el test, b) estar familiarizados con los distintos matices de la cultura de que se trate, c) tener
experiencia y aptitudes para la aplicacin de tests, y d) conocer la importancia de seguir al pie
de la letra los procedimientos reglados para la aplicacin de los tests. Deben de programarse
sesiones de entrenamiento riguroso para los aplicadores.

Interpretacin: En general, interpretar los resultados de cualquier test requiere un psiclogo


especialista en el rea del test y con la formacin psicomtrica apropiada. Y esto sigue siendo
vlido cuando el test proviene de una adaptacin. Lo que ocurre es que con los tests adaptados
hay un peligro adicional, a saber, la tentacin de comparar grupos o pases en el test y
establecer una clasificacin de ganadores y perdedores. Como sealan algunos autores
(Hambleton y Bollwark, 1991; Wesbury, 1992), los estudios comparativos deberan de usarse
para comprender las semejanzas y diferencias entre los grupos analizados, pero nunca para
establecer comparaciones sin ms. Y no es adecuado establecerlas porque raramente
encontraremos dos comunidades que sean equiparables completamente en aspectos tan
influyentes como motivacin a la hora de hacer las pruebas, curricula escolares, valores
culturales, nivel de vida, polticas educativas, oportunidades de acceso a la educacin, etc.

Finalmente, para interpretar las puntuaciones el psiclogo debe de disponer de una


documentacin exhaustiva acerca de cmo se llev a cabo el proceso de adaptacin. El manual
del test deber incluir todo tipo de detalles del proceso adaptativo, que en determinadas
circunstancias pueden dar las claves interpretativas de un resultado.

Directrices para la adaptacin de los tests

Para tratar de minimizar los errores en las cuatro grandes reas citadas (contexto, adaptacin,
aplicacin e interpretacin), el Comit de la Comisin Internacional de Tests (ITC), propuso
recomendar veintids directrices que se consideran claves para una correcta adaptacin o
construccin simultnea de los tests psicolgicos y educativos.

Contexto

C.1. Los efectos de las diferencias culturales que no sean relevantes para los objetivos
centrales del estudio deberan minimizarse en la medida de lo posible.

C.2. Debera de evaluarse la cuanta del solapamiento de los constructos en las poblaciones de
inters.

Adaptacin del test

D.1. Los constructores/editores de tests deberan de asegurar que el proceso de adaptacin


tiene en cuenta las diferencias lingsticas y culturales entre las poblaciones a las que se
dirigen las versiones adaptadas del test.

D.2. Los constructores/editores de los tests deberan de proporcionar datos que garanticen que
el lenguaje utilizado en las instrucciones, en los propios tems y en el manual del test, son
apropiados para todas las poblaciones culturales e idiomticas a las que va dirigido el test.

D.3. Los constructores/editores de tests deberan de aportar evidencia de que las tcnicas de
evaluacin elegidas, los formatos de los tems, las reglas de los tests, y los procedimientos son
familiares a todas las poblaciones a las que van dirigidos.

D.4. Los constructores/editores de tests deberan de facilitar evidencia de que el contenido de


los tems y los materiales de los estmulos son familiares para todas las poblaciones a las que
van dirigidos.

D.5. Los constructores/editores de tests deberan aportar una justificacin racional sistemtica,
tanto lingstica como psicolgica, para mejorar la precisin del proceso de adaptacin, as
como reunir datos acerca de la equivalencia de todas las versiones en los distintos idiomas.

D.6. Los constructores/editores de tests deberan asegurar que el diseo de recogida de datos
permite el uso de tcnicas estadsticas apropiadas para establecer la equivalencia entre los
tems correspondientes a las diferentes versiones idiomticas del test

D.7. Los constructores/editores de tests deberan aplicar tcnicas estadsticas apropiadas para
1) establecer la equivalencia entre las diferentes versiones de un test, y 2) identificar
componentes problemticos o aspectos del test que puedan ser inadecuados para alguna de las
poblaciones a las que va destinado el test.

D.8. Los constructores/editores de tests deberan proporcionar informacin sobre la evaluacin


de la validez en todas las poblaciones objetivo a las que va dirigido el test adaptado.

D.9. Los constructores/editores de tests deberan aportar datos estadsticos sobre la


equivalencia de los tests para todas las poblaciones a las que van dirigidos.

D.10. No deben utilizarse preguntas no equivalentes en todas las versiones dirigidas a


diferentes poblaciones cuando se prepara una escala comn, o cuando se comparan estas
poblaciones. Sin embargo, pueden ser tiles para reforzar la validez de contenido de las
puntuaciones de cada poblacin por separado.

Aplicacin

A.1. Los constructores y los aplicadores de los tests deberan tratar de prever los tipos de
problemas que cabe esperar, y tomar las medidas oportunas para evitarlos mediante la
preparacin de materiales e instrucciones adecuados.

A.2. Quienes aplican los tests deberan de ser sensibles a cierto nmero de factores
relacionados con los materiales utilizados para los estmulos, los procedimientos de
aplicacin, y las formas de respuesta, que pueden reducir la validez de las inferencias extraidas
de las puntuaciones.

A.3. Aquellos aspectos del entorno que influyen en la aplicacin del test deberan de
mantenerse lo ms parecidos posible para todas las poblaciones a las que va dirigido el test.
A.4. Las instrucciones para la aplicacin del test en el idioma fuente y en el objetivo deben
minimizar la influencia de fuentes de variacin no deseadas.

A.5. El manual del test debera de especificar todos los aspectos del test y de su aplicacin que
han de revisarse al utilizarlo en un nuevo contexto cultural.

A.6. El aplicador no debe de interferir, debiendo minimizarse su influencia sobre los


examinados. Deben de seguirse al pie de la letra las reglas explcitas descritas en el manual del
test.

Interpretacin de las puntuaciones

I.1. Cuando se adapta un test para utilizarlo en otra poblacin, debe de facilitarse la
documentacin sobre los cambios, as como los datos acerca de la equivalencia entre las
versiones.

I.2. Las diferencias entre las puntuaciones obtenidas por las muestras a las que se aplic el test
no deben de tomarse sin ms directamente. El investigador tiene la responsabilidad de
sustanciar las diferencias con otros datos empricos.

I.3.Las comparaciones entre poblaciones slo pueden hacerse al nivel de la invarianza que se
haya establecido para la escala en la que se expresan las puntuaciones.

I.4. El constructor del test debera de proporcionar informacin especfica acerca de las
distintas formas en las que los contextos socioculturales y ecolgicos de las poblaciones
pueden afectar al rendimiento en el test, y debera sugerir procedimientos para tener en cuenta
estos efectos en la interpretacin de los resultados.

Algunos comentarios a las directrices

En el documento final que la Comisin Internacional de Tests editar con las directrices, cada
una de ellas llevar una explicacin y fundamentacin de su sentido, se indican los pasos a
seguir para cumplirla, se sealan los errores ms frecuentes y se sugieren referencias y
documentacin complementarias. Aqu nos limitaremos a hacer algunos comentarios
generales. Para una exposicin ms detallada en castellano vase Hambleton (1996).

Contexto. Las dos primeras directrices tratan de asegurar que haya una equivalencia de los
constructos medidos en las dos poblaciones de inters. A medida que la distancia cultural entre
las dos (o ms) poblaciones de inters aumenta, ms probabilidades hay de que haya
diferencias entre los constructos. Por ejemplo, una variable tan clsica como la inteligencia
tiende a ser conceptualizada de muy diverso modo de unas culturas a otras; mientras en
Occidente suele asociarse a eficiencia y rapidez, en algunas sociedades del Este se asocia con
actitudes reflexivas y reposadas, ms que con rapidez (Lonner, 1990). La primera directriz
hace hincapi en la necesidad de minimizar la incidencia de cualquier aspecto ajeno al
constructo medido. Por ejemplo, en algunos estudios internacionales recientes (Wainer, 1993)
se observ que las diferencias en motivacin podan estar a la base de algunas de las
diferencias halladas.

Adaptacin. Una vez que los constructores del test han aportado los datos que garantizan que
hay una equivalencia apropiada entre los constructos a medir en ambas poblaciones, y por
tanto tiene sentido adaptar el test, empieza el proceso real de su construccin. Este proceso
une a la problemtica psicomtrica general para construir un test la dificultad aadida de
plasmar fielmente el test original, si se trata de una adaptacin; podra darse el caso tambin
de una doble construccin simultnea en las dos (o ms) poblaciones de inters. El meollo
central de la construccin/adaptacin gira en torno al funcionamiento adecuado del equipo de
traductores. Amn de la posibilidad de utilizar diseos tcnicos sofisticados, con la utilizacin
de monolnges y bilnges para asegurarse de las equivalencias, es clave que los traductores
conozcan las culturas implicadas adems de los idiomas (Bracken y Barona, 1991; Brislin,
1986; Hambleton y Kanjee, 1995; Prieto, 1992). Tal vez algunos puristas apuntarn que no se
puede dominar un idioma sin hacerlo tambin con la cultura y costumbres, y seguramente
tienen razn, pero hay que asegurarse de ello. Es imprescindible que los traductores, an sin
ser expertos, conozcan las reglas bsicas de la construccin de los tests. Por poner un solo
ejemplo, los traductores tienen que saber que cuando se utilizan tems de eleccin mltiple la
longitud de las alternativas tiene que ser aproximadamente la misma. Una buena exposicin en
castellano sobre la construccin de los tems puede consultarse en Prieto y Delgado (1996).
Las directrices subrayan la necesidad de asegurarse que los contenidos, formatos, estmulos,
grficos, diagramas, figuras, unidades de medida, y signos en general, son igualmente
familiares para las culturas implicadas.

Otro aspecto clave subrayado en varias de las directrices es que los constructores recojan datos
de todo tipo que permitan evaluar la validez y comparabilidad de las dos versiones. La
tecnologa estadstica es actualmente potente y variada para analizar los datos, pero no hay que
olvidar que cuanto ms amplias sean las muestras utilizadas con ms eficacia funcionan las
tcnicas estadsticas. Estas tcnicas son complementarias de los correspondientes anlisis
racionales, no los sustituyen. En los ltimos aos se ha perfeccionado notablemente la
tecnologa para evaluar el sesgo de las puntuaciones (Camilli y Shepard, 1994; Fidalgo, 1996;
Holland y Wainer, 1993), pero sigue siendo de suma importancia el anlisis racional por parte
de un equipo de expertos en las culturas implicadas. Lo que las tcnicas detectan es que cierto
tem funciona de modo diferente en un grupo que en otro, por eso suelen agruparse bajo el
nombre genrico de Funcionamiento Diferencial de los Items, ser el psiclogo quien tenga
que analizar las razones de ese funcionamiento diferencial. En sntesis, hay que garantizar
tanto por medios estadsticos como analtico-racionales que el test es igualmente vlido para
las poblaciones de inters.

Aplicacin. Las seis directrices correspondientes a la aplicacin de los tests tratan de subrayar
aquellos aspectos claves para una aplicacin correcta de los tests. A veces se descuida la
aplicacin, confindola a personas sin la debida formacin. Esto constituye un grave error,
pues una aplicacin defectuosa afecta directamente a la validez del test. Si esto ocurre en
general, cuando se trata de un test adaptado hay que extremar las precauciones, asegurndose
que las condiciones de aplicacin no constituyen una fuente de error respecto del test original.
El peligro es mayor cuanto mayor es la distancia cultural entre las poblaciones origen y
objetivo. El aplicador no debe de interferir ni con su conducta, apariencia, instrucciones, etc.,
en el proceso estrictamente reglado de la aplicacin del test. Los constructores de los tests
deben de asegurarse mediante una seleccin y entrenamiento adecuados que los aplicadores
actan correctamente. Suele ser muy til llevar a cabo algn estudio piloto para comprobarlo.

Interpretacin de las puntuaciones. En el paso final correspondiente a la interpretacin de


las puntuaciones puede echarse a perder toda la labor anterior de construccin y aplicacin del
test si no se acta adecuadamente. En primer lugar, las puntuaciones de los tests siempre son
datos que deben de utilizarse convergentemente con otros en la toma de decisiones. Ayudar
notablemente a la interpretacin si se dispone de la documentacin apropiada sobre todo el
proceso de construccin y aplicacin, diseos utilizados, mtodos para la evaluacin de la
equivalencia entre las dos versiones, tems que se han modificado y por qu, etc. As y todo se
recomienda prudencia extrema a la hora de interpretar las diferencias halladas entre
poblaciones distintas. No se pueden interpretar directamente sin ms, hay que fundamentar
esas diferencias, cuyas posibles causas pueden ser mltiples. Por ejemplo, cuando se compara
el rendimiento acadmico de estudiantes de pases desarrollados con otros del tercer mundo,
pueden atribuirse simplista e irresponsablemente las diferencias a diferencias reales en las
correspondientes aptitudes, cuando en realidad existen toda una serie de factores diferenciales
tales como las polticas educativas, los curricula, el acceso a la escolarizacin, equipamientos
y recursos educativos disponibles, idioma materno frente al escolar, etc., por citar slo algunos
ejemplos. Las directrices subrayan la necesidad de una prudencia suma a la hora de interpretar
las diferencias. La tecnologa psicomtrica desarrollada bajo el enfoque de la teora de
respuesta a los tems (Hambleton et al., 1991; Muiz, 1996b; Navas, 1996), permite establecer
equiparaciones entre las puntuaciones con bastante precisin.

Resumen y Conclusiones. Se han presentado las directrices para la traduccin y adaptacin


de los tests elaboradas por la Comisin Internacional de Tests, en la que ha participado el
Colegio Oficial de Psiclogos de Espaa, dada la importancia de este asunto para nuestro pas,
donde se utilizan numerosos tests originarios de otras culturas. Estas directrices aparecern
publicadas en un amplio documento, un breve avance del cual es lo que se ha expuesto aqu.
El primer aspecto a resear es que la traduccin de un test no es una mera cuestin lingstica,
conlleva una verdadera adaptacin a la cultura en la que se quiere introducir. Esta labor de
adaptar un test no es simple, articulndose en torno a cuatro grandes reas las fuentes de error
ms habituales: el contexto sociocultural de las poblaciones implicadas, la propia
construccin-adaptacin del test, su aplicacin, y la interpretacin de las puntuaciones. Las
directrices propuestas se dirigen a aquellos aspectos que deben cuidarse especialmente, aunque
no es posible dar un recetario o vademecum que recoja todas las fuentes potenciales de error.
En lo que corresponde al contexto, es central asegurarse que el constructo a evaluar es
equivalente en las poblaciones de inters, lo cual est muy relacionado con la distancia
cultural entre unas y otras. La mayora de los constructos psicolgicos vienen influidos por el
marco sociocultural de las personas, por lo que no se puede asumir sin ms la invarianza
intercultural de los constructos. Ya puestos a adaptar la prueba, la seleccin de un equipo
multicultural de traductores es bsico. Estos deben no slo dominar los idiomas implicados,
sino conocer los matices culturales y tener una base mnima de conocimientos acerca de la
confeccin de los tests. Una aplicacin defectuosa puede echar por tierra toda la labor previa y
atentar gravemente contra la validez del test. La seleccin y entrenamiento de los aplicadores
es una tarea central para el uso correcto del test. Finalmente las directrices previenen contra el
uso alegre de las diferencias interculturales, cuya explicacin puede deberse a causas muy
variadas. Lo fundamental de una prueba es que d informacin sobre la poblacin estudiada,
permitiendo diagnsticos precisos para intervenir con eficacia; el anlisis de las diferencias
interpoblacionales es secundario, y seguramente menos significativo psicolgicamente que el
estudio de las semejanzas.
Bibliografa

American Educational Research Association, American Psychological Association,


National Council on Measurement in Education (1985). Standards for educational and
psychological testing. Washington, DC.: American Psychological Association.

Bartram, D. (1996). Tests qualifications and test use in UK: the competence approach.
European Journal of Psychological Assessment, 12(1), 62-71.

Bracken, B. A. y Barona, A. (1991). State of the art procedures for translating, validating and
using psycho-educational tests in cross-cultural assessment. School Psychology International,
12, 119-132.

Brislin, R. W. (1986). The wording and translation of research instruments. En W. J. Lonner y


J. W. Berry (eds.), Field methods in cross-cultural psychology (pp. 137-164). Newbury Park,
CA: Sage Publications.

Camilli, G. y Shepard, L. A. (1994). Methods for identifying biased test items. London: Sage
Publications.

Evers, A. (1996). Regulations concerning test qualifications and test use in The Netherlands.
European Journal of Psychological Assessment, 12, 2, 153-159.

Fidalgo, A. (1996). Funcionamiento diferencial de los tems. En J. Muiz (coor.), Psicometra.


Madrid: Universitas.

Fremer, J. (1996). Promoting high standards for test use: developments in the United States.
European Journal of Psychological Assessment, 12, 2, 160-168.

Hambleton, R. K. (1993). Translating achievement tests for use in cross-national studies.


European Journal of Psychological Assessment, 9, 1, 57-68.

Hambleton, R. K. (1994). Guidelines for adapting educational and psychological tests: a


progress report. European Journal of Psychological Assessment, 10, 3, 229-244.

Hambleton, R. K. (1996). Adaptacin de tests para su uso en diferentes idiomas y culturas:


fuentes de error, posibles soluciones y directrices prcticas. En J. Muiz (Coor.), Psicometra.
Madrid: Universitas.

Hambleton, R. K. y Bollwark, J. (1991). Adapting tests for use in different cultures: technical
issues and methods. Bulletin of the International Test Commission, 18, 3-32.

Hambleton, R. K. y Kanjee, A. (1995). Translation of tests and attitude scales. En T. Husen y


T. N. Postlewaite (eds.), International Encyclopedia of Education (2 ed. pp. 6326-6334).
Oxford, UK: Pergamon Press.

Hambleton, R. K., Swaminathan, H. y Rogers, H. J. (1991). Fundamentals of item response


theory. Newbury Park, CA: Sage Publications.
Holland, P. W. y Wainer, H. (eds.) (1993). Differential item functioning. Hillsdale, NJ:
Lawrence Erlbaum Publishers.

Lonner, W. J. (1990). An overview of cross-cultural testing and assessment. En R. W. Brislin


(ed.), Applied cross-cultural psychology. (Vol. 14, pp. 56-76). Newbury Park, CA: Sage
Publications.

Muiz, J. (1996a). Reunin en Madrid de la Comisin Europea de Tests. Papeles del


Psiclogo, 3, 65, 89-91.

Muiz, J. (1996b) (coor.). Psicometra. Madrid: Universitas.

Navas, M. J. (1996). Equiparacin de puntuaciones. En J. Muiz (coor.), Psicometra. Madrid:


Universitas.

Prieto, A. J. (1992). A method for translation of instruments to other languages. Adult


Education Quarterly, 43, 1-14.

Prieto, G. y Delgado, A. R. (1996). Construccin de los tems. En J. Muiz (coor.),


Psicometra. Madrid: Universitas.

Van Leest, P. F. y Bleichrodt, N. (1990). Testing of college graduates from ethnic minority
groups. En N. Bleichrodt y P. J. Drenth (eds.), Contemporary issues in cross-cultural
psychology. Amsterdam: Swets and Zeitlinger.

Van de Vijver, F. y Hambleton, R. K. (1996). Translating tests: some practical guidelines.


European Psychologist, 1, 2, 89-99.

Van de Vijver, F. y Poortinga, Y. H. (1991). Testing across cultures. En R. K. Hambleton y J.


Zaal (eds.), Advances in educational and psychological testing. Boston: Kluwer Academic
Publishers.

Van de Vijver, F. y Lonner, W. (1995). A bibliometric analysis of the Journal of Cross-


Cultural Psychology. Journal of Cross-Cultural Psychology, 26, 591-602.

Wainer, H. (1993). Measurement problems. Journal of Educational Measurement, 30, 1-21.

Westbury, I. (1992). Comparing American and Japanese achievement: Is the United States
really a low achiever? Educational Researcher, 21, 10-24.

Nota. Este trabajo fue realizado durante una estancia de Jos Muiz en la Univeridad de
Massachusetts, con una beca de investigacin del Ministerio de Educacin y Ciencia,
referencia PR95-342.

Вам также может понравиться