Академический Документы
Профессиональный Документы
Культура Документы
Psicometría
Durante muchos años la TCT ha sido el modelo básico usado en la cons-
trucción de los tests. No obstante, y como observamos en varias partes de este
libro, la complejidad de los problemas de medida, especialmente en el marco
de las Evaluaciones a Gran Escala (EGE), lleva a situaciones que la TCT no
es capaz de resolver de una forma eficaz. La popularidad creciente de la TRI
se basa en que proporciona justificación teórica para hacer muchas cosas que
no son posibles en el marco de la TCT. Algunos de los problemas, como vere-
mos, también tienen soluciones desde la TCT, pero menos eficaces.
6. La construcción de un test
Un buen instrumento de evaluación debe ser construido de una forma rigurosa si
queremos que sea adecuado para los usos a los que está dirigido. En la práctica,
el desarrollo de un test es una tarea laboriosa que requiere de la colaboración en-
tre expertos en la materia o constructo a evaluar y expertos en medición. Los
tests pueden desarrollarse en el marco de dos grandes modelos, conocidos como
Teoría Clásica de los Tests (TCT) y Teoría de Respuesta al Ítem (TRI).
Aunque el uso particular marcará algunas especificidades en el instru-
mento, hay una serie de normas que si se siguen, llevarán a buen puerto la ta-
rea de construcción del test. Existe un conjunto de guías de buenas prácticas
sobre el desarrollo y construcción de tests, cuya lectura recomendamos antes
de embarcarse en la construcción de un test, entre las que se encuentran: Stan-
dards for Educational and Psychological Tests (AERA, et al., 1999), Stan-
dards for Quality and Fairness (Educational Testing Service, 2000); y Tech-
nical Standards for IEA Studies (Martin, Rust y Adams, 1999).
En el terreno de los test educativos, otro complemento para aprender más so-
bre la construcción de instrumentos son los textos recientes sobre medida en edu-
cación a los que remitimos a los lectores: Haladyna (2004), Popham (2000), Nit-
ko (2001) y Linn y Gronlund (2000). En el ámbito de la psicología social y de la
personalidad son interesantes los textos de Netemeyer, Bearden y Sharma (2003)
y De Velis (2003) y en castellano el de Morales, Urosa y Blanco (2003).
Aunque en ningún caso pueden obviarse las lecturas señaladas, presenta-
mos algunas consideraciones sobre el desarrollo de los tests en la práctica. Re-
visaremos el proceso de construcción del test a partir de las fases siguientes:
1. Identificación del propósito o finalidad del test.
2. Restricciones para la aplicación.
3. Marco del test o mapa del constructo.
4. Especificaciones derivadas del marco.
5. Especificación del formato de los ítems y reglas de puntuación.
6. Revisión de los ítems del test.
7. Estudio piloto.
8. Estudio de campo.
9. Construcción del manual del test y sus revisiones.
26
1. Tests psicológicos y educativos
27
Psicometría
detectar personas que potencialmente puedan presentar un determina-
do trastorno, deficiencia, etc., sirviendo como «criba» antes de la apli-
cación de otras pruebas de carácter más exhaustivo.
A partir del propósito del test y del dominio o constructo que se pretende me-
dir se desarrolla el marco sobre el que comenzará el diseño del test.
28
526 CARRETERO-DIOS y PÉREZ. Desarrollo y revisión de estudios instrumentales
a cabo los resultados suelen alejarse de los encontrados con la escala original. Así,
distintos autores han destacado como la traducción suele ser una elección rápida y
arriesgada que conduce a resultados inadecuados (Osterlind, 1989; Smith et al., 2003),
y que finalmente provoca, en el mejor de los casos, un paso atrás en la investigación
para una nueva formulación de ítems, y en el peor, un abandono del proceso y un dato
más sin conexión ni utilidad. Por ello, hay que insistir en que la creación y adaptación
de tests es cuestión de reflexión y no de premura, y que se adopte la elección que se
adopte, deben seguirse las recomendaciones generales sobre este difícil proceso (AERA
et al., 1999). Dado que la traducción es una práctica habitual entre los investigadores,
las normas que van a presentarse van a ocuparse de este proceso, aunque entendido
como uno de los posibles pasos a dar dentro de una adaptación, y sin dejar de recomen-
dar al lector que acuda a trabajos especializados como los anteriormente citados.
EN RESUMEN:
El término Test suele reservarse, generalmente, para todos aquellos instrumentos de
medición utilizados en el ámbito cognitivo; es decir, para aquellos instrumentos cons-
truidos para medir: aptitudes, conocimientos, rendimiento, habilidades, etc.
Cuando se quieren medir variables que no pertenecen al ámbito cognitivo, sino al
afectivo u oréctico (personalidad, actitudes, intereses, opiniones, etc.), se utilizan las Es-
calas, los Cuestionarios y los Inventarios. Las escalas muestran el enunciado del ele-
mento junto a una serie de alternativas de respuesta categorizadas de forma ordenada (es-
calas de categorías o escalas de clasificación), de manera que el sujeto pueda mostrar
su posición respecto a lo que se muestra en el enunciado, eligiendo la categoría con la
que se sienta más identificado. Los cuestionarios suelen estar formados por elementos cu-
yas alternativas de respuesta no forman categorías ordenadas (listados). Cada alternativa
es independiente de las demás. En este caso, la tarea del sujeto consiste en elegir la al-
ternativa o alternativas que prefiera o la/s que, en su opinión, refleje mejor aquello que
se está valorando, y los inventarios se suelen reducir a una serie de enunciados ante los
que los sujetos han de responder en función de su grado de acuerdo o desacuerdo.
A lo largo de estas Unidades Didácticas se va a utilizar la palabra Test para hablar en
términos generales de todos los instrumentos de medición psicológica ya que es el tér-
mino más amplio y aceptado internacionalmente, y se utilizarán los otros términos
cuando se haga referencia expresa a un determinado tipo de instrumentos de medición.
53
02 PSICOMETRIA (7):Maquetación 1 29/03/2010 10:12 Página 54
PSICOMETRÍA
Tabla 2.1 Esquema de las etapas a cubrir para la construcción de una prueba piloto
䡲 Qué se va a medir
䡲 Determinar la finalidad del test 䡲 A quien se va a medir
䡲 Para qué se va a medir
䡲 Ítems de elección
䡲 Redacción de los ítems
䡲 Ítems de construcción
䡲 Instrucciones de administración
䡲 Confección de la prueba piloto 䡲 Formato de presentación
䡲 Formato de registro de respuestas
䡲 Individual – colectiva
䡲 Papel y lápiz- Informatizada
䡲 Aplicación de la prueba piloto
䡲 Correo, mediante entrevista personal, por
teléfono, etc.
Como paso previo a la construcción de un test es necesario tener muy claro cual va
a ser su objetivo; es decir qué es lo que se quiere medir, a quién se quiere medir y para
qué se quiere medir.
Supongamos que los profesores de Psicometría queremos construir un test (examen)
de Psicometría para evaluar los puntos fuertes y débiles del conjunto de los alumnos res-
pecto al programa de nuestra asignatura y poder incluir en la página Web algunas reco-
mendaciones que les permitan superar las dificultades encontradas durante el estudio.
Ya tenemos el objetivo del test:
54
02 PSICOMETRIA (7):Maquetación 1 29/03/2010 10:12 Página 55
Quizás pueda parecer una trivialidad el hacer tanto hincapié en la necesidad de co-
nocer claramente lo que se quiere medir antes de iniciar la construcción de un test; a lo
mejor lo sería si la variable a medir fuera una variable de tipo físico, como la longitud,
la altura, etc., ya que son variables que están bastante claras para todo el mundo y to-
dos saben cómo hay que medirlas. El problema surge cuando lo que se trata de medir
es una variable psicológica, inobservable de forma directa; una variable o atributo latente
a la que se le da también la denominación de constructo.
Los constructos (variables teóricas inobservables), tal y como ya hemos expuesto an-
teriormente, se manifiestan a través de una serie de conductas que ya sí son observables
de forma directa y, por lo tanto, sí son susceptibles de medición. Estas conductas, para
que puedan ser consideradas como manifestaciones del constructo han de ser más o
menos uniformes y constantes a lo largo del tiempo y en una serie de situaciones. Así,
por ejemplo, diremos que una persona es agresiva, no porque en una ocasión haya dado
muestras de agresividad, sino porque cuando se enfrenta a ciertas situaciones lo normal
es que reaccione siempre agresiva. Ahora bien, ¿en qué consiste dar muestras de agresi-
vidad o reaccionar de forma agresiva?, hay una serie de conductas que pueden ser con-
sideradas como tales; por ejemplo, un niño tendrá un comportamiento agresivo si en los
recreos pelea con los demás niños sin motivo, si cuando se le regaña reacciona violen-
tamente rompiendo alguna cosa, etc.
Todas las cuestiones que hacen referencia a estas conductas son las que deben ser re-
flejadas en los ítems del test; de ahí la importancia de definir claramente el constructo
que se quiere medir puesto que, en la medida en que el constructo esté mejor definido,
se tendrá un mayor y mejor conocimiento de las conductas en las que se manifiesta, evi-
tándose la omisión de algunas áreas de conducta importantes y la inclusión de otras que
resulten irrelevantes.
Por ejemplo, si quisiéramos construir un test para medir la habilidad verbal o la im-
pulsividad lo primero que tenemos que hacer es definir ambos constructos. Una defini-
ción puede ser la propuesta por Thorndike (1989):
55
02 PSICOMETRIA (7):Maquetación 1 29/03/2010 10:12 Página 56
PSICOMETRÍA
Además de tener en cuenta la población a la que va dirigido el test, otro de los as-
pectos fundamentales a tener en cuenta es la utilización que se le vaya a dar; es decir,
para qué se va a utilizar, qué decisiones se van a tomar a partir de las puntuaciones que
obtengan los sujetos. Un test puede utilizarse para tomar decisiones diferentes. Por ejem-
plo, una prueba de inglés puede utilizarse para evaluar el nivel medio de los alumnos
en primero de bachillerato, para detectar aquellos alumnos que muestran un nivel defi-
ciente, o puede utilizarse en una academia de idiomas para clasificar a los alumnos se-
gún su nivel de inglés y asignarlos a distintos cursos.
56
02 PSICOMETRIA (7):Maquetación 1 29/03/2010 10:12 Página 57
Por ejemplo, no es lo mismo querer construir un test de inteligencia general para de-
tectar niños superdotados, que querer construirlo para detectar niños deficientes. En el
primer caso, los ítems del test deberán ser en su mayoría muy difíciles, para que sólo pue-
dan ser respondidos correctamente por los niños más inteligentes; mientras que, en el se-
gundo caso, deberán ser muy fáciles, de manera que sólo sean respondidos de forma in-
correcta por aquellos niños que muestren una inteligencia deficiente.
La tabla 2.2 muestra los usos más frecuentes de los tests así como las decisiones que
se suelen tomar a partir de las puntuaciones obtenidas por los sujetos.
Del conocimiento de la finalidad del test; es decir, de las respuestas a qué se va a me-
dir, a quién se va a medir y para qué se va a medir, van a depender las especificaciones
que se deban hacer en cuanto al contenido del test, la dificultad de sus ítems, la longi-
tud de la prueba, el tiempo de aplicación, etc. Especificaciones que iremos ampliando
a continuación.
Tabla 2.2 Principales usos de los tests (adaptada de Navas, 2001, pág. 100)
57