Академический Документы
Профессиональный Документы
Культура Документы
O A p i T U L O
'f l
I
m todos los campos del esfuerzo humano se utilizan medidas de una u otra forma, v cada campo
posee su propio sistema, compuesto por herramientas y unidades de medición. Si se acaba de
comprometer en matrimonio o piensa hacerlo, tal vez haya oído sobre la unidad de medida lla
mada quilate; Si usted compró una computadora, es posible que haya escuchado sobre la unidad
de medida llamada byte. Y si necesita aire acondicionado, seguramente querrá saber sobre el
BTU (unidad térmica británica). Otras unidades de medición con las que se puede o no estar
familiarizado son la milla, la milla náutica, la milla por hora y los ciclos por segundo. Los profe
sionales en los campos que utilizan estas unidades, conocen sus usos potenciales, beneficios v
limitaciones en las mediciones que realizan con ellas. Por ende, también los usuarios actuales
y potenciales de las mediciones psicológicas necesitan familiarizarse en el trabajo con las uni
dades de medida comúnmente utilizadas, los fundamentos teóricos que las contextualízan y las
herramientas empleadas según los objetivos de la medición.
Pruebas y evaluación
Las raíces del surgimiento de las pruebas psicológicas v la evaluación tal v como se concibe hoy
en día, datan de principios del siglo XX en Francia. En 1905, Alfred Binet y un colega publicaron
una prueba diseñada para asignar el grado escolar apropiado para niños parisinos. La prueba de
Binet tendría consecuencias más allá del distrito escolar de París. Al paso de una década se utilizó
una versión en inglés de la prueba estructurada por Binet para escuelas de Estados Unidos.
Cuando Estados Unidos declaró la guerra a Alemania y participó en la primera guerra mun
dial en 1917, el ejército necesitaba una forma para evaluar rápidamente a grandes cantidades de
reclutas para descartar problemas intelectuales y emocionales. Las pruebas psicológicas aporta
ron esta metodología necesaria para lograrlo. Durante la segunda guerra mundial, el ejército se
apoyó aún más en las pruebas psicológicas para evaluar a los reclutas interesados en el servicio
militar. Después de la guerra se desarrollaron y utilizaron un mayor número de pruebas que pre
tendían medir una amplia gama de variables psicológicas.
1
con la aplicación de una prueba (como "Prueba en progreso") y la interpretación de la puntua
ción v resultados obtenidos de la misma ("Las pruebas indicaron que..."). Durante la primera
guerra mundial, el proceso de las pruebas determinó de manera óptima un grupo experimental
obtenido mediante la evaluación de miles de reclutas militares. Se sospecha que esto sucedió al
mismo tiempo en que las pruebas lograron el reconocimiento e inserción en el vocabulario de los
profesionales y de la gente en general. E l uso del término pruebas para denotar todo, desde la
aplicación hasta la interpretación de una prueba, puede encontrarse no sólo en libros de texto de
la posguerra (como Chapman, 1921; Hull, 1922; Spearman, 1927), sino en muchos otros escritos
relacionados con el tema publicados décadas posteriores. Sin embargo, en la segunda guerra
mundial, inicia el surgimiento de una distinción semántica entre pruebas y un término más in
clusivo, evaluación -
Durante la segunda guerra mundial, la Oficina de Servicios Estratégicos de Estados Unidos
(OSS) utilizó diversos procedimientos y herramientas de medición, entre ellos pruebas psicoló
gicas, en la selección de personal militar para puestos especializados que involucraban activi
dades tales como espionaje, manejos de inteligencia militar y otros procesos similares. Como se
resume en "Evaluación humana" (OSS, 1948) y en otras fuentes (Murray y Mackinnon, 1946),
los datos generados por la evaluación, estaban sujetos a la integración e interpretación por parte
de personal altamente capacitado, provenientes de centros de evaluación. El modelo de la OSS,
el cual utilizó diversas herramientas innovadoras de evaluación, así como la interpretación de los
datos obtenidos por personas altamente capacitadas, inspiró más tarde lo que ahora se conoce
como enfoque del centro de evaluación para la evaluación de personal o Assessment Center
(Bray, 1982).
Escenarios militares, clínicos, educativos y de negocios son algunos de los muchos contex
tos que implican observaciones conductuales y la integración activa de pruebas y otros datos
por parte de evaluadores. En esas situaciones es preferible el término evaluación al de pruebas.
El término evaluación implica que las pruebas son sólo un tipo de herramienta utilizada por
evaluadores profesionales y que la valoración de los datos arrojados, está íntimamente ligada
al conocimiento, habilidad y experiencia del evaluador. Como observaron Sundberg y Tyler
(1962), "Las pruebas son herramientas. En manos de alguien torpe o de una persona sin escrúpulos,
se convierten en perversiones pseudocientíficas" (p. 131, énfasis en el original). En la mayoría de
los contextos de evaluación, es el proceso en sí mismo el que da vida y significado a las puntua
ciones obtenidas en las pruebas.
Evaluación psicológica, un libro de texto sobre medición de Maloney y Ward (1976), hizo eco so
bre la dificultad que tienen los psicólogos en el uso anacrónico de "pruebas psicológicas" para des
cribir sus tan variadas actividades relacionadas con la evaluación. Al articular varias diferencias
entre pruebas y evaluación, Maloney y Ward clarificaron la compleja estructura de los minuciosos
procesos de resolución de problemas involucrados en la evaluación psicológica —diferenciándo
los de aquellas tareas más sistematizadas y relacionadas a la calificación de las pruebas—.
Maloney y Ward concibieron la evaluación como un proceso de resolución de problemas
que podía tomar diferentes formas. La conducción de una evaluación depende de muchos
factores, no sólo de aquel que constituye la razón para la evaluación. Diferentes herramientas
de evaluación, entre ellas distintas pruebas psicológicas, deben estar presentes en el proce
so de la evaluación, determinadas por los objetivos particulares, las personas y circunstancias
específicas en el momento de la misma, así como otras variables únicas, generadas por el con
texto y ambiente. Por el contrario, se consideró que las pruebas psicológicas tenían un alcance
mucho más reducido, ya que sólo se refería al "proceso de aplicar, calificar e interpretar las
pruebas psicológicas" (Maloney y Ward, 1976, p. 9). El examinador es un punto clave en el
proceso de evaluación, en el que las decisiones, predicciones, o ambas, se realizan a partir del
mayor número de fuentes de información (incluidas las pruebas).
Maloney y Ward también distinguieron entre pruebas y evaluación en función de sus objeti
vos. Al realizar una prueba, un objetivo típico es el medir la magnitud de algún atributo o rasgo
psicológico. Por ejemplo, se puede hablar de pruebas de inteligencia si el propósito de aplicar una
prueba es obtener una cuantificación del funcionamiento intelectual del individuo o grupo de
individuos a quienes se aplica la prueba. En la evaluación, la cual se realiza de forma persona
lizada, el objetivo suele extenderse más allá de la obtención de una cifra o de un coeficiente
Evaluaciones alternativas Las enmiendas a la Declaración de los individuos con discapacidades educa
tivas (IDEA, por sus siglas en inglés), PL 105-17, se transformó en ley a partir de 1997. Muchas de
las disposiciones de las enmiendas de IDEA se exponen en otras partes de este libro. Por ahora,
sólo se hará referencia a una sección de esta ley que introduce el término evaluación alternativa.
Esta sección establece que el Estado o la agencia educativa local "(i) debe desarrollar guías para
la participación de niños con capacidades diferentes en evaluaciones alternativas, haciendo hin
capié en aquellos niños que no pueden participar en programas de evaluación distritales y esta
tales; con el fin de (ii) desarrollar y... conducir las evaluaciones alternativas".
La PL 105-17 no define "evaluaciones alternativas". Sin embargo, un análisis de las prácticas
de evaluadores hechas con anterioridad, donde participaron estudiantes con necesidades edu
cativas especiales, ilustrará el concepto. Por ejemplo, a un estudiante que tiene dificultad para
leer la letra pequeña de una prueba en particular, se le puede dar una versión de la misma prue
ba con letra más grande, o se le puede adecuar un ambiente iluminado especialmente para la
prueba. A un estudiante con debilidad auditiva se le puede aplicar la prueba usando el lenguaje
implicar el análisis de una muestra de sangre, de un tejido, etcétera, una prueba psicológica ge
neralmente implica el análisis de una forma de comportamiento. La forma de comportamiento
puede variar desde las respuestas de un cuestionario por escrito, respuestas orales a preguntas,
hasta el desempeño de alguna tarea. La muestra del comportamiento puede ser originada por el
estimulo de la prueba misma o puede ser un comportamiento que ocurre de manera natural (bajo
observación).
^ J a s pruebas psicológicas y otras herramientas de evaluación pueden diferir en un gran nú
mero de variables como contenido, formato, procedimientos de aplicación, puntuación, contextos
de interpretación y calidad técnica. El contenido (o los temas) de la prueba, por supuesto, varia
rán de acuerdo al enfoque teórico que la prueba maneje. Pero aun cuando dos pruebas psicoló
gica? tienen el propósito de medir lo mismo — por ejemplo, la personalidad— pueden diferir de
una manera amplia en los contenidos debido a factores como la definición de personalidad que el
autor de la prueba maneje, así como el marco teórico de referencia. Por ejemplo, los reactivos de
la prueba de la personalidad orientada a partir de la teoría psicoanalítica, deben tener muy poco
parecido a las pruebas de personalidad orientadas desde un enfoque existencial, y sin embargo,
ambas son pruebas de personalidad.
El término formato le pertenece a la forma, al plan, a la estructura, arreglo o disposición de
los reactivos de la prueba, así como a las consideraciones específicas, como los límites de tiempo
establecidos. Formato también se utiliza para referirse a la forma en que se aplica una prueba:
computarizada, con lápiz y papel o alguna otra forma. Cuando se hace referencia específica a
una prueba computarizada, el formato también puede referirse a la forma del software: IBM o
compatible con Apple. El término formato no sólo se destina a las pruebas; también se utiliza para
denotar la forma o estructura de otras herramientas y procesos de evaluación, como los procedi
mientos específicos usados para obtener un tipo particular de ejecución.
Las pruebas difieren en sus procedimientos de aplicación. Algunas pruebas, en particular aqué
llas diseñadas para aplicarse en forma individual, pueden requerir de un aplicador muv activo y
con mucho conocimiento. La aplicación de una prueba puede implicar la demostración de varios
tipos de tareas por parte del evaluado, así como la observación del desempeño del evaluado. De
manera alternativa, algunas pruebas, en particular aquéllas diseñadas para aplicarse en grupos,
tal vez no requieran que el aplicador de la prueba esté presente mientras los que la contestan, lo
hagan de forma individual.
Las pruebas difieren en los procedimientos de calificación e interpretación. Para entender mejor
cómo V por qué, es preciso definir puntuación y calificación. Los aficionados a los deportes están
familiarizados con estos términos. Para ellos, se refieren al número de puntos que acumulan
los competidores y el proceso o forma en la que acumulan esos puntos. En las pruebas y la eva
luación, se puede definir formalmente la puntuación como un código o proceso sumatorio de
puntos, por lo general, aunque no necesariamente de naturaleza numérica, el cual refleja una
evaluación del desempeño en una prueba, tarea, entrevista u otras formas de conducta. Califica
ción es el proceso de asignar esos códigos o puntajes evaluativos al desempeño en las pruebas,
tareas, entrevistas u otras formas de conducta. Algunas puntuaciones resultan de la simple suma
de respuestas (como la suma de respuestas correcto/incorrecto o de acuerdo/en desacuerdo) y
algunas puntuaciones resultan de la aplicación de procedimientos más elaborados.
Las puntuaciones mismas pueden describirse y categorizarse de muchas maneras. Aquí se
considerará una categoría de calificación: la puntuación de corte (también llamada corte), que
es un punto de referencia, por lo general numérico, determinado a través de juicios lógicos y
utilizado para dividir una serie de datos en dos o más clasificaciones. Algunas acciones serán
determinadas o algunas inferencias se realizarán a partir de la base de esta clasificación. Las pun
tuaciones de corte en las pruebas, generalmente relacionadas con otros datos, se utilizan en las es
cuelas en diversos contextos, tales como para establecer el grado, programa o clase en el cual será
asignado un niño en particular. Las personas encargadas de la contratación laboral, utilizan las
puntuaciones de corte como una ayuda en la toma de decisiones para elegir a los candidatos y el
desarrollo organizacional de su personal. Las oficinas gubernamentales utilizan las puntuaciones
de corte para determinar a quién se le dará licencia como profesional en un campo determinado.
Es probable que existan más de 20 métodos diferentes que pueden usarse de manera formal para
derivar puntuaciones de corte (Dwyer, 1996).
De acuerdo con la investigación realizada por Victoria Husted Medvec et al. (Medvec e t a l., 1995; Medvec y Savitsky,
1997), las personas que sólo hacen algún corte categórico pueden sentirse mejor sobre su cumplimiento que aquellas
que hacen el corte por un margen importante. Pero los que pierden el corte por un mínimo de error pueden sentirse peor
que aquellos que lo pierden por un margen sustancial En una investigación con atletas olímpicos se presentó evidencia
consistente con esta visión. Los medallistas de bronce estuvieron, de manera paradójica, más felices con el resultado que
los medallistas de plata. Los ganadores de bronce podrían decirse a sí mismos. “Al menos gané una medalla' y estar
felices al lespecto. En contraste, los medallistas de plata se podrían sentir frustrados por haber ido a ganar la medalla
de oro y haberla perdido.
En ocasiones, no se utilizan métodos formales para llegar a una puntuación de corte. Algunos
profesores usan un método informal, según su percepción, para certificar, por ejemplo, que una
puntuación de 65 o más en una prueba significa “aprobado”, y una puntuación de 64 o menos
significa reprobado . Ya sean derivados de manera formal o informal, las puntuaciones de corte
típicamente toman en cuenta, por lo menos hasta cierto grado, los valores de quienes las esta
blecen. Además, existe otro lado de la ecuación humana que se relaciona con las puntuaciones
de corte, uno del que rara vez se escribe en los textos de mediciones. El juicio humano tiene un
lugar importante no sólo en el establecimiento de puntuaciones de corte, sino también en la forma
de reaccionar ante ellas. Se han explorado en formas de investigación innovadora, algunas conse
cuencias relacionadas con haber sido excluido por puntuaciones de corte, véase la figura 1-1.
Las pruebas difieren de manera considerable en términos de las pautas para calificar e in
terpretar. Algunas pruebas están diseñadas para ser calificadas por los que las contestan, otras
1. Las variantes de esta palabra incluyen el adjetivo psicométrico y los sustantivos psicometrisla y psicomealra. En forma
tradicional un psicom etrista tiene un grado de maestría y está calificado para adm inistrar pruebas específicas. Un psico-
meatra tiene un grado doctoral en psicología o algún campo relacionado (com o educación) y se especializa en áreas com o
las diferencias individuales, psicología cuantitativa, o teoría de la evaluación.
Figura 1-2
Sobre entrevistar y ser entrevistado
Los entrevistadores tienen distintos estilos para realizar entrevistas. ¿Cómo podría caracterizar el estilo de entrevistar
de lloward Stern contra el de ¡ait Leño?
nal. Se presume que una ventaja de la entrevista de panel (a veces llamada también entrevista de
consejo) es que la idiosincrasia reflejada en las preguntas de uno de los entrevistadores, puede
ser minimizada por las aproximaciones que los otros entrevistadores realicen (Dipbove, 1992).
Una desventaja de la entrevista de panel es el costo adicional de emplear a múltiples entrevis
tadores, en especial cuando se cuestiona la recuperación de la inversión (Dixon et al., 2002).
Los psicólogos que estudian el comportamiento del consumidor utilizan estas entrevistas
para responder las preguntas corporativas acerca del mercado para varios productos y servicios
y de cómo publicitarios y promoverlos mejor. Los investigadores de la psicología y otros campos
relacionados utilizan las entrevistas para explorar otros miles de temas. Una encuesta informal
sobre literatura revela investigaciones recientes en ias que se emplea la entrevista para explorar
temas tan diversos como la negociación en la elección de comida en las parejas recién casadas
(Bove et al., 2003), la experiencia de escuchar voces desde la perspectiva de aquellos que las es
cuchan (Jones et al., 2003), v la concepción de lo que constituye ___________________________
la "masculinidad" desde la perspectiva de varones adolescentes
SÓLO P I E N S E . . .
(Pascoe, 2003).
La popularidad de la entrevista como método para reunir ¿Qué lipos de habilidades debe tener el
información se extiende más allá de la psicología. Sólo piense en anfitrión de un programa de entrevistas
un día en el que no estuvo expuesto a una entrevista en la televi en la televisión para ser considerado un
sión, la radio, o Internet. Sin tomar en cuenta el foro, la calidad, entrevistador elicaz? ¿Estas habilidades
más no la cantidad, de información útil que proporciona una en dllieren de las que necesita un profesional en
trevista, depende en cierto grado del entrevistador. Una entrevis el campo de la evaluación psicológica?
ta es un encuentro recíproco. El entrevistado reacciona ante el en
trevistador y el entrevistador reacciona ante el entrevistado. Los
entrevistadores varían de muchas maneras; por ejemplo, el ritmo de las entrevistas, la compe
netración con los entrevistados, y su habilidad para conjuntar el ser genuinos, empáticos y con
Datos de historia de caso En un sentido general, los datos de la historia de desarrollo (historia
clínica en su caso), se refieren a registros, transcripciones y otros instrumentos escritos, pictóricos
o de otra forma, y en cualquier medio, que preserve la información de archivos, registros formales
e informales y otros datos y documentos importantes en relación al evaluado. Los datos de histo
ria de la historia del desarrollo pueden incluir archivos o extractos de archivos que se conservan
en instituciones y agencias tales como escuelas, hospitales, empleos, instituciones religiosas y
agencias de justicia criminal. Otros ejemplos de datos de historias del desarrollo o historia clínica
son las cartas y la correspondencia por escrito; fotos y álbumes familiares, recortes de periódicos
y revistas, videos caseros, películas y audiocasetes. Muestras de trabajo, arte, garabatos e ilustra
ciones que muestren los intereses y pasatiempos son aún más ejemplos.
Los datos de la historia del desarrollo pueden ser una herramienta de gran utilidad en una
amplia variedad de contextos de evaluación. En una evaluación clínica, por ejemplo, los datos de
la historia de desarrollo, pueden aportar información sobre el pasado de un individuo y su adapta
ción actual, al igual que los sucesos y circunstancias que pudieron haber contribuido a los cambios
en la adaptación. Los datos de la historia de desarrollo pueden ser
de un valor incalculable para las evaluaciones neuropsícológicas,
SÓLO P I E N S E . . . en donde proporcionan información sobre el funcionamiento neu-
¿Cuáles son las fortalezas y debilidades de la ropsicológico previo al suceso traumático u otro evento que resulte
historia de desarrollo como una herramienta en un déficit. Los psicólogos escolares confían en los datos de la
de evaluación? historia de desarrollo, entre otras cosas, para responder preguntas
acerca del proceso de la historia educativa del estudiante.
Otro uso del término historia del desarrollo, sinónimo de estudio
de caso, está relacionado con la recolección de los datos de historia del caso en un informe ilus
trativo. Por ejemplo, un estudio de caso detalla cómo un número de aspectos de la personalidad
del individuo, combinado con las condiciones del ambiente produce a un líder mundial exitoso.
Un estudio de caso de un individuo que intentó asesinar una figura política de renombre puede
aportar información sobre los tipos de individuos y condiciones que puedan conducir a tentativas
similares en el futuro. Un ahora clásico en el tema de pensamiento de grupo contiene un basto
material sobre historias de casos en los que la toma de decisiones colectiva, no siempre resultó en
las mejores decisiones (Janis, 1972).
Observación conductual Para saber cómo se comporta alguien en una situación particular, es ne
cesario observar su comportamiento en esa situación. Esa sabiduría "en el lugar exacto" sugiere
al menos un enfoque de evaluación. La observación conductual, como lo emplean los profesio
nales de la evaluación, puede definirse como el monitorear las acciones de otros y de uno mismo
a través de medios electrónicos o visuales, mientras se registra información cuantitativa y/o cua
litativa con respecto a dichas acciones. La observación conductual puede utilizarse en diferentes
escenarios para una variedad de objetivos de evaluación. Puede ser usada, por ejemplo como un
auxiliar diagnostico en un contexto clínico o como un medio para recolectar información en una
investigación basica. Las observaciones deben hacerse en el laboratorio o en escenario estructu
rados. Un eiemplo de esto es la observación que hace un investigador a un niño a quien se le pide
que realice algunas tareas como parte de un experimento. La observación también puede ocurrir
en un escenario natural el cual propicia la aparición natural del comportamiento o en el que se
espere que este ocurra. Para este tipo de observación conductual, se hace referencia al término
Observación naturalista.
La observación conductual como un auxiliar para diseñar
intervenciones terapéuticas ha demostrado ser en extremo útil en
escenarios institucionales, como escuelas, hospitales, prisiones y SÓLO P I E N S E . . .
hogares de grupo. Con el uso de listas de comportamientos espe ¿Cuáles son las fortalezas y debilidades
cíficos a observar, sean autoconstruidas o publicadas, el personal de la observación conductual como una
puede observar de primera mano, el comportamiento de la perso herramienta de evaluación?
na observada y con ello diseñar sus intervenciones terapéuticas
de una manera coherente. En un contexto escolar, por ejemplo, la
observación naturalista en un patio de juegos de un niño con una cultura diferente al resto del
cual se sospecha que tiene problemas lingüísticos, puede revelar que el niño tiene las habilidades
para hablar el idioma del lugar donde se encuentra, pero no es capaz - p o r razones de timidez,
cultura, etcetera— de demostrar esas habilidades trente a los adultos.
A pesar del valor potencial de la observación conductual, se tiende a usarla cada vez con
menos frecuencta fuera de los escenarios institucionales. Para los profesionales privados no es
económicamente factible emplear horas fuera del consultorio para observar a los clientes Sólo
piense en el tiempo que tomaría administrar una prueba sobre las habilidades para comprar en
una tienda si el evaluado/comprador utilizará algunos cupones de descuento (véase figura 1-3).
Las computadoras como herramientas Los profesionales que se especializan en la evaluación psi
cológica y educativa han reconocido el valor de las computadoras en la administración, califica
ción e interpretación de las pruebas. Desde 1930, se disponía de al menos una prueba psicológica
de puntuación electromagnética, los Inventarios de intereses vocacionales de Strong (SVlli, por
sus siglas en inglés) (Campbell, 1971). En 1946, gracias a los esfuerzos de un ingeniero de Mi-
neápolis, llamado Elmer Hankes, el perfil de los SVIB pudo realizarse a máquina. Y al tinal de la
década de 1950, las computadoras no sólo se usaron para calificar v obtener un perfil, sino tam
bién para la interpretación de pruebas y la obtención de un perfil psicológico (Rome ct al., 1965).
Con el advenimiento de la computadora personal en la década de 1970, la administración, califi
cación e interpretación de pruebas se convirtió en una realidad. A medida en que ha florecido la
tecnología, el uso de computadoras ha prosperado.
En la actualidad, las computadoras, ya sean de escritorio, laptop o palm-held, son parte esen
cial de las oficinas de personal clínico, de consulta y otros usuarios de pruebas. Desde el punto
de vista de los usuarios de pruebas, la evaluación psicológica asistida por computadora (CAPA,
por sus siglas en inglés) se refiere a la conveniencia y economía de tiempo al administrar, cali
ficar e interpretar pruebas. Por tanto, el término "asistencia" en relación a la evaluación asistida
por computadora se refiere a la ayuda para los usuarios de pruebas, no para quien la resuelve. La
CAPA ie permite a los que contestan la prueba, trabajar de una manera independiente, mientras
responden los reactivos presentados en una pantalla de video. La computadora entonces puede
calificar la prueba, analizar los patrones de respuesta, y hasta proporcionar un tipo de informe
(véase el recuadro Close-up)-
Para muchos usuarios de pruebas, la CAPA representa un gran avance sobre el pasado, no
tan distante, en el que se tenían que administrar las pruebas de manera personal y hasta poner
las respuestas en algún otro formato para efectuar el análisis (como utilizar de manera manual
una plantilla de respuestas u otro instrumento) antes de comenzar la laboriosa tarea de calificar e
interpretar los datos resultantes. La CAPA abrió un mundo de posibilidades para los usuarios de
pruebas, lo que permitió la construcción de éstas con base en puntuaciones complejas y estrategias
de combinaciones de datos que de otra manera no pudieran ser prácticas. La CAPA también ha
permitido la medición de habilidades que no podrían ser medidas con métodos más tradicionales
¿Alguna vez ha contestado un examen cuyos resultados le hayan deben seguir antes de que el programa produzca que una línea de
sido entregados en un Informe generado por una computadora? texto narrativo se imprima de manera automática sobre el informe.
¿Qué tipo de Informe fue? Y, ¿cómo lo obtuvo? Más que un informe descriptivo y menos tentativo en sus
Los Informes psicológicos generados por computadora pue conclusiones que el informe de selección, está el informe consul
den calegorlzarse como Informes de calificación, informes inter tivo. Un informe consultivo ofrece un análisis detallado de los
pretativos e integración de resultados. Aquí se define cada uno de datos de la prueba en un lenguaje apropiado para la comunicación
los formatos de Informes y se describe el tipo de información que entre la evaluación y los profesionales. Ofrece la opinión experta de
puede encontrarse en ellos. un individuo o grupo de individuos quienes han dedicado años de
Informes de calificación estudio a la interpretación de un instrumento en particular.
Informes interpretativos Sin importar su naturaleza, un Informe puede ser creado de muchas
maneras en diferentes sitios web. Aquí está un “breve curso" sobre
En general, un informe interpretativo es una constancia gene el procesamiento CAPA.
rada a computadora del desempeño de una prueba, presentada de El término procesamiento central se utiliza para referirse
manera numérica y narrativa, que incluye una explicación de los al hecho de mandar los protocolos de pruebas contestadas en
hallazgos. papel u otro formato de una locación a alguna otra con el fin de
Existen tres variedades del informe interpretativo: el informe ser calificado e interpretado por dicho protocolo. Los resultados
descriptivo, el informe de selección y el informe consultivo. entonces pueden ser regresados al usuario de la prueba por correo
El informe descriptivo es un tipo de informe interpretativo electrónico, disco, correo, fax o teléfono.
que se caracteriza por tener resúmenes narrativos breves. De he Una variedad del procesamiento central es el teleprocesamíenlo.
cho, la "descripción" en un informe descriptivo puede ser tan breve El teleprocesamiento se refiere a la calificación computarizada,
como el comentario de un enunciado en donde una puntuación interpretación u otra conversión de datos de pruebas que han sido
particular se origina desde una perspectiva normativa. Los infor enviadas para su procesamiento, a través de medios como el teléfo
mes descriptivos pueden ayudar al usuario de pruebas o evaluador no, la Web u otros. Dicha información se procesa en la institución
a determinar en cuál de las muchas puntuaciones de una prueba se que maneja la prueba y no en el lugar de aplicación.
debe centrar. Procesamiento local puede definirse tan sólo como la
Un informe de selección proporciona más información calificación, interpretación, u otra conversión de datos de una prue
que un informe descriptivo, pero menos que un informe consultivo. ba. Con el hardware y software apropiados, el usuario de la prueba
Ofrece información narrativa, al igual que análisis o comentarios puede utilizar la misma computadora para administrar una prueba y
sobre relaciones entre las puntuaciones. Como su nombre lo indi luego calificarla. En una era de un hardware de computación relati
ca, un informe de selección es útil en particular para propósitos de vamente barato, hoy en día la mayoría de las pruebas son procesa
selección. En el software están programados varios criterios que se das de manera local.
SÓLO P I E N S E . . .
¿Cuáles son los pros y contras de los distintos tipos de procesamiento de la CAPA?
(figura 1-4). Por supuesto, cada rosa tiene sus espinas; en la tabla 1-1 se presentan algunos de los
pros y contras de la CAPA.
Otras herramientas Pueden aplicarse varios instrumentos como herramientas de evaluación. Los
psicólogos y otros profesionales que las emplean para evaluar a las personas con capacidades
diferentes y miembros de otras poblaciones específicas, han sido muy innovadores. Por ejemplo,
Wilson et al. (1982) desarrollaron un mecanismo para proporcio-
___________________________ nar respuestas a pruebas, el cual implicaba una placa para la den
tadura que se activaba con la lengua. Para aquellos que contestan
SÓLO P I E N S E . . .
la prueba y no tienen la capacidad del habla o del control de sus
En general, ¿cuándo es una buena ¡dea la miembros, este instrumento permite cinco tipos de respuesta.
utilización de video en la evaluación? ¿Cuáles La próxima vez que vaya a rentar un DVD, tómese un mo
son las desventajas, si existen, de utilizar mento para pensar en el papel que puede tener un video en la
video en la evaluación? evaluación. De hecho, una gran variedad de videos son utiliza
dos en los contextos de capacitación y evaluación. Por ejemplo, al
personal de una corporación se le puede pedir que considere las
posibles reacciones ante una variedad de incidentes de acoso sexual en el lugar de trabajo presen
tados a través de un video. Al personal de policía se le puede preguntar cómo respondería ante
diferentes tipos de emergencia, que se presentan ya sea en forma de actuación o por medio de la
grabación de situaciones reales. A los psicoterapeutas se les puede pedir que respondan con un
diagnóstico y un plan de tratamiento para varios clientes presentados en videocasete. Esta lista
de aplicaciones potenciales del video para la evaluación no tiene fin.
CAPA obtiene una interpretación de resultados estandarizada debido a La interpretación estandarizada de resultados de la CAPA, basada en una
la eliminación de la no conliabilidad surgida a los diversos puntos perspectiva conjunta, unitaria puede no ser óptima; la interpretación
de vista en el juicio profesional que cada profesional pueda hacer de podría ser mejor desde puntos de vista alternativos.
los resultados
La capacidad de las compuladoras de combinar dalos de acuerdo con Las computadoras carecen de la flexibilidad de los humanos para reco
las reglas es más exacta que la de los humanos. nocer la excepción a la regla en el contexto de la 'visión global'
Se pueden utilizar asistentes no profesionales en el proceso de adminis La utilización de no profesionales, disminuye, o desaparece, la oportuni
tración de la prueba, y puede ser administrada de manera general a dad de que los profesionales observen la conducta de los evaluados
grupos de evaluados en un solo sitio. durante la realización de la prueba e identifiquen cualquier condición
inusual o variable "extraña’ que pueda afectar las respuestas de la
persona.
Grupos profesionales como VPA desarrollan directrices y normas para Los no profesionales interesados en las ganancias pueden también
utilizar producios de CAPA.
crear y distribuir pruebas con poco apego a las directrices y normas
profesionales.
Las pruebas en papel y lápiz pueden convenirse en productos de CAPA El uso de pruebas a papel y lápiz que han sido convertidas para su
con las ventajas consecuentes, como un tiempo más corto entre la administración en computadora hacen que surgan dudas sobre la
administración de la prueba y su calificación e interpretación. equivalencia entre la prueba original y su forma convertida.
La seguridad en los productos de CAPA se puede mantener no sólo por La seguridad de los productos CAPA puede ser violada por hackers
los medios tradicionales (como gabinetes cerrados) sino por produc de computadores, y la integridad de los dalos puede ser alterada o
ios electrónicos de alta tecnología (como los íirewalls) destruida por eventos inesperados como la introducción de virus
computacionales.
Las computadoras pueden adaptar de manera automática el contenido y No todos los evaluados realizan la misma prueba o tienen la misma
la longitud de la prueba con base en las respuestas de los evaluados. experiencia de aplicación durante la realización de la prueba.
El desarrollador de las pruebas Los desarrolladores de las pruebas y los editores crean pruebas
y otros métodos de evaluación. La APA (American Psychological Association), estima que más
de 20000 pruebas psicológicas nuevas se desarrollan cada año (APA, 1993). Entre estas pruebas,
hay algunas que fueron creadas para un caso específico de investigación, algunas que fueron
creadas con la esperanza de ser publicadas, y algunas que representan refinamientos, revisiones
o modificaciones de pruebas existentes. L.os creadores de las pruebas aportan una gran variedad
de nociones e intereses al proceso de desarrollo. Para un vistazo interesante a información biblio
gráfica de algunos desarrolladores de pruebas, visite la sección "Perfiles de desarrolladores de
pruebas" en nuestro sitio: www.mhhe.com/cohentesting6.
Los desarrolladores y los editores aprecian el impacto significativo que los resultados dfi las
pruebas pueden tener en la vida de las personas. De acuerdo con esto, un gran número de organi
zaciones profesionales han publicado estándares de comportamiento ético que refieren, de mane
ra específica, aspectos del desarrollo y uso de pruebas en forma ética y responsable. Tal vez el
documento más detallado que refiere esos aspectos es uno escrito hecho de manera conjunta por
la AERA (American Educational Research Association), la APA (American Psychological Asso
ciation) y el NCME (National Council on Measurement in Education). Referidos por muchos
psicólogos tan sólo como "los estándares", los Estándares para las pruebas psicológicas a educativas
cubren aspectos relacionados con la construcción y estandarización de pruebas, administración y
usos, y aplicaciones especiales de las pruebas, tales como adecuaciones especiales en la aplicación
de pruebas a minorías lingüísticas. Publicadas de manera inicial en 1954, las revisiones de los
estándares fueron publicadas en 1966, 1974,1985 y 1999. Los Estándares es una obra de referencia
indispensable no sólo para los desarrolladores de pruebas, sino también para los usuarios de las
mismas.
El usuario d6 las pruebas Las pruebas son utilizadas por un amplio rango de profesionales, in
cluidos los profesionales clínicos, los consejeros, el personal de recursos humanos, profesores y
personal escolar. Los Estándares, al igual que las guías y pautas de aplicación oficiales de varias
organizaciones profesionales, tienen mucho que impartir a los usuarios de las pruebas sobre el
cómo, por qué y bajo qué condiciones deben usarse las pruebas. Por ejemplo, los principios de la
ética profesional, promulgados por la Asociación Nacional de Psicólogos Escolares, ANPE (Na
tional Association of School Psychologists, NASP), (Jacob-Timm & Hartshorne, 1998) enfatizan
que los psicólogos escolares deben seleccionar y usar la o las pruebas que sean las más apropiadas
para cada alumno en lo particular. La ANPE (2000) además enfatiza que las preguntas que sir
van para agilizar la evaluación psicológica de los estudiantes deben ser respondidas de la manera
más comprensible; es decir, con tanta información y datos como sea posible, incluidas las inferen
cias y descripciones fenomenológicas de las observaciones conductuales.
Sin importar qué tan sólida sea una prueba, su propósito será fallido si el usuario falla en el
manejo y aplicación competente de todas las fases de las pruebas o del proceso de evaluación. Poi
esta raz¡5n, el responsable de una prueba tiene obligaciones de carácter ético y.estructural antes,
durante y después de la administración de la prueba. Las guías éticas dictan que antes de que una
En 191/, los nitroos reclutas de la Armada se sentaban en el suelo mientras seles realizaba la primera prueba grupal
de inteligencia no eran condiciones ideales para las pruebas según los estándares actuales.
prueba sea administrada, ésta debe guardarse de tal manera .que se asegure de manera razonable
que los contenidos esgecífifias a a se.harán saber por adelantado. Otra obligación del usuario an
tes de la administración de la prueba, es asegurarse de que una persona capacitada y preparada
realice la aplicación de manera adecuada. El administrador de la prueba (o examinador) debe
estar familiarizado con los materiales y procedimientos y debe tener en el sitio correspondiente,
todos los materiales necesarios para administrar la prueba de manera apropiada. Los materiales
necesarios pueden ser un reloj cronómetro, lápices y un número suficiente de protocolos de la
prueba.2
Además de tener los suplementos suficientes, el examinador también se asegura de que
la habitación en donde se llevará a cabo la evaluación o prueba, sea cómoda y apropiada (fi
gura 1-5). Deben evitarse hasta donde sea posible, condiciones de distracción como ruido excesi
vo, calor, frío, interrupciones, luz del Sol en exceso, sobrepoblación o ventilación inadecuada.
2. En la vida cotidiana, en una conversación que no esté relacionada con las pruebas, protocolo se refiere a una etiqueta di
plomática. Un uso menos común de la palabra es un sinónimo de la primera copia o el documento en sucio de un tratado
u otro documento oficial antes de su ratificación. Este segundo significado está más cerca de la manera en que la palabra
se utiliza con referencia a las pruebas psicológicas. Protocolo se refiere a la forma u hoja en la cual se han introducido las
respuestas de quien aplica el examen. Los protocolos son de manera típica hojas individuales o panfletos de papel.
■ El estado de ansiedad que están experimentando y el grado en que la ansiedad puede afectar
de manera significativa los resultados de la prueba.
■ Su capacidad y disposición para cooperar con el examinador o para comprender las instruc
ciones de la prueba escrita.
■ El grado de dolor físico o angustia emocional que estén sintiendo.
■ El grado de incomodidad física por no haber comido lo suficiente, haber comido en exceso u
otras condiciones físicas.
■ El estado en que están alertas y despiertos en contraposición al estado de somnolencia.
■ La predisposición que tienen a estar de acuerdo o en desacuerdo cuando se les presentan
estímulos para provocar una reacción.
■ El grado de preparación e información que han recibido antes de la evaluación.
■ La importancia que le hayan atribuido al verse situados en un buen o mal lugar.
■ El grado en que son, por falta de un término mejor, "afortunados" y pueden acertar en una
prueba de opción múltiple (aun cuando quizá no hayan aprendido el tema en cuestión).
La Asociación Estadounidense de Películas (Motion Picture Associa de Internet promulgados por la Asociación de Clasilicació
tion ol America, MPAA) hace clasificaciones de éstas; todos hemos tenidos en Internet (Internel Contení Raling Asociation). Al
escuchado: “La siguiente película tiene clasificación PG-13" PG-13 estos sistemas y la literatura disponible sobre ellos, un eq
eslá dirigido a que los "padres extremen precauciones" respecto a investigación concluyó:
permitirles a los niños menores de trece años ver la película. Tam
bién existe una Gpara el “público general", PGpara "se sugiere guía Los esfuerzos de varias industrias de un medio independien
de los padres" y WC-7/para “no se admiten menores de 17 años". resultado en una serie de clasificaciones, iconos, delinicioni
¿Alguna vez se ha preguntado quién evalúa en realidad las pe procedim ientos confusos que son, en muchos casos, difícili
lículas y las sitúa en una de estas cinco clasificaciones? De hecho, entender y recordar. Casi lodo s estos sistemas de clasificaci
es un grupo de 8 a 13 padres de familia, a quienes la MAAP emplea sido agilizados por la amenaza de la intervención del gobier
y cada industria ha intentado balancear el hacer accesible e;
de tiempo completo para ver y evaluar las películas. En el sitio de
inform ación contra sus prop ios intereses económicos. Aúne
la MAAP, http://www.mpaa.org se publican algunos criterios para
creación de un sistem a de clasificación que luncione bien p,
clasificar las películas desde PG, hasta NC-17. Ahí se encuentra, por padres no es una tarea sencilla, eslá claro que las preferenci
ejemplo, que “un filme clasificado como R puede incluir lenguaje los padres con frecuencia no han prevalecido (Bushman & (
fuerte o violencia, desnudos en las escenas sensuales, abuso de 2003, pp. 138-139).
drogas u otro o una combinación de los elementos anteriores, por
tanto, se les aconseja a los padres, por anticipado, que tomen este Mientras usted aprenda más sobre las pruebas psico
anuncio de clasificación de una manera seria". la evaluación, piense en la descripción de la evaluación er
El grupo de padres que hace la clasificación ve la película que tria del entretenimiento. Contraste la evaluación en esa int
propone un productor, debate sobre ella y después vota por una la evaluación en la psicología. Piense en los reactivos. Po
clasificación. Gana el volo mayoritario. Además de esa descripción, piense en los reactivos respecto a la definición de término
se proporcionan unos cuantos detalles respecto al proceso de cla evaluación psicológica. ¿Qué tan claro es lo que se mide i |
sificación real en la red. Se sabe que sin tomar en cuenta los votos prueba psicológica definida? Piense en el proceso de eval
del consejo de padres, sus clasificaciones pueden cambiar por el Por ejemplo, piense en las diferencias entre clasificadores
voto de dos tercios de un consejo que esté constituido de 14 a 18 dores y cómo figuran eslas diferencias en una clasificació
miembros de la industria del entretenimiento. cación definitiva. Piense también en la utilidad de las eval
Si existe algún misterio sobre el proceso de clasificación de En la industria del entretenimiento, el "usuario final" es ur
las películas, eso es sólo la punta del iceberg respecto al misterio guardián que toma una decisión respecto a una elección r
en la industria del entretenimiento en general. Existen sistemas de con el entretenimiento para un menor. ¿Quiénes son los “i
clasificación representadas con recomendaciones de rango de eda finales" potenciales en las evaluaciones educativas y psic
des y resúmenes de contenido en forma de icono. Existen sistemas ¿Qué tipo de decisiones tendrían que tomarse con base er
de clasificación para la música, software electrónico y juegos de mación? ¿Qué tan útil es la información desarrollada en la
video. Hasta existe un sistema de clasificación para contenidos estas decisiones?
La sociedad en general
El que un individuo sea único es uno de los hechos característicos más fundamenta
les de la vida... En todos los periodos de la historia humana, el hombre ha observa
do y descrito las diferencias entre los individuos... Pero los educadores, políticos y
administradores han sentido una necesidad por organizar o sistematizar de alguna
manera, la complejidad de muchas facetas de las diferencias individuales (Tyler.
1965, p. 3).
Otras personas involucradas Además de las cuatro partes primarias a las que se ha enfocado este
apartado, de manera breve se tomará nota de personas que pueden participar de alguna maneia
en las actividades relacionadas a las pruebas y la evaluación. Las organizaciones, compañías
v agencias gubernamentales apocan el desarrollo de pruebas por varias razones, una de ellas
podría ser la certificación del personal. Existen compañías que ofrecen la calificación e interpre
tación de pruebas. En algunos casos, estas compañías y servicios son extensiones de editores de
pruebas, y en otros casos son independientes. Hay personas cuya única responsabilidad es la
mercadotecnia y venta de las pruebas. A veces a estas personas las emplean los editores, a veces
no. Hay académicos quienes revisan las pruebas y evalúan la solidez psicométrica. Todas estas
personas, al igual que muchas otras, son también partes, que contribuyen en mucho o poco a la
actividad y empresa que implica la evaluación, una empresa que es claro que tiene pocas fronte
ras en términos de los escenarios en donde puede encontrarse.
Escenarios clínicos Las pruebas y muchas otras herramientas de evaluación son usadas en es
cenarios clínicos como hospitales públicos, privados y militares, clínicas de pacientes internos
y externos, consultorios de práctica privada, escuelas y otras instituciones. Estas herramien
tas son utilizadas para ayudar a diagnosticar o descartar problemas de conducta. ¿Qué tipos de
situaciones agilizarían el empleo de esas herramientas? Aquí hay una pequeña muestra.
■ Un cliente de psicoterapia privada desea realizar una prueba para ver si se le puede propor
cionar algún indicio no obvio respecto a su inadaptación.
■ Un psicólogo escolar evalúa de manera clínica a un niño que experimenta dificultades de
aprendizaje para determinar qué factores son las principales causas de su problema.
■ Un investigador de la psicoterapia utiliza procedimientos de evaluación para determinar si
un método psicoterapéutico en particular, es efectivo en el tratamiento de algún problema.
Las pruebas empleadas en escenarios clínicos pueden ser pruebas de inteligencia, personali
dad neuropsicológicas, u otros instrumentos especializados, según el área del problema que se
requiere evaluar. El sello distintivo del uso de pruebas en los escenarios clínicos es que la prueba
o la técnica de medición se emplea sólo con un individuo a la vez. Las pruebas en grupo se usan
como método para la selección de grupos de investigación; es decir, para identificar aquellos in
dividuos que requieren una evaluación diagnóstica posterior. En el capítulo 13, ademas de otras
secciones, se observa la naturaleza, los usos y beneficios de la evaluación tanto en escenarios
clínicos como en consejería (counseling).
Escenarios militares y de negocios En los negocios, así como en el ejército, a las pruebas psicoló
gicas se les conceden diversos usos, tal vez de manera más notable es aquel para la toma de deci
siones sobre las carreras del personal. Como se verá en el capítulo 16, se emplea un amplio rango
de pruebas de logro, aptitud, interés, motivacionales y otras para la toma de decisiones de contra
tación, al igual que en decisiones relacionadas con promociones, transferencias, satisfacción en el
trabajo v elección de una capacitación futura. Para un candidato a controlador de tráfico aéreo un
desempeño en una prueba de atención prolongada hacia los detalles puede ser un requerimiento
para el puesto. Para una promoción al rango de oficial para el ejército, un desempeño exitoso en
una serie de tareas de liderazgo puede ser esencial.
Otra aplicación de las pruebas psicológicas implica la ingeniería y el diseño de productos
y ambientes. Los psicólogos de la ingeniería emplean una variedad de pruebas existentes y en
especial inventadas en una investigación diseñada para ayudar a la gente en casa, en su lugar de
trabajo y en el ejército. Productos que van desde computadoras de casa, muebles de oficina, hasta
páneles de control para jets, se benefician del trabajo de tales esfuerzos de investigación.
Mediante el uso de pruebas, entrevistas y otras herramientas de evaluación, los psicólogos
que se especializan en marketing y en la venta de productos están interesados en tomar el pulso a
los consumidores; es decir, ayudar a predecir la receptividad del público de un producto nuevo,
una nueva marca o una campaña de propaganda o marketing.
I /»'i man Witkin 1/ sus asociados (Witkin y Goodenough, 1977) estudiaron variables relacionad
con l/i personalidad en algunas formas muy innovadoras. Por ejemplo, identificaron a personas
dependientes del campo {o contexto) e independientes del campo por medio de un dispiosi-
tu o especialmente diseñado, llamado cuarto inclinado/silla indinada. A los evaluados se les bine
ron preguntas diseñadas para evaluar su dependencia o independencia de las referencias visuales.
Figura 1-6
El amplio mundo de la evaluación
' I\°\
\ o v \a 2. r " 2 2 T
creemos que-este libro será más útil cuando surjan nuevas preguntas.3 Pero además de un libro
como éste, ¿en dónde se consulta información actualizada sobre pruebas y evaluación?
Catálogos de pruebas Quizá una de las fuentes de información más accesible sobre una prueba
sea un catálogo distribuido por el editor de la prueba. Debido a que la mayoría de los editores
de pruebas tienen catálogos de sus inventarios disponibles, esta fuente de información sobre las
pruebas pueda conseguirse con una simple llamada telefónica, un correo electrónico o una nota.
Como podrá esperarlo, sin embargo, los catálogos de los editores por lo general, contienen sólo
una breve descripción de la prueba y muy rara vez incluye el tipo de información técnica deta
llada que el posible futuro usuario de la prueba puede requerir. Además, el objetivo del catálogo
es vender la prueba. Por esta razón es raro encontrar, si es que se encuentra, una exploración
altamente crítica y detallada en el catálogo de pruebas de las editoriales.
Volúmenes de referencia El Instituto Buros de Mediciones Mentales ofrece una "tienda rápida"
con una gran cantidad de información relacionada con las pruebas. La versión inicial de lo que
evolucionaría en el Anuario de mediciones mentales (AMM) fue recopilado por Oscar Buros (figura
1-7) en 1933. En este escrito, se utilizó la última edición de la recopilación aütorizada de revisio
nes de pruebas realizada en el 15o. Anuario de mediciones mentales (Plake et a i, 2003), aunque el
16o. no puede estar muy lejos. El Instituto Buros también publica Pruebas a ser editadas (Murphy et
al., 2002) al igual que un gran número de obras de referencia relacionadas con pruebas. Para una
lista de sus últimos ofrecimientos, al igual que algunas ligas a varias bases de datos relacionadas
al tema, se puede visitar el sitio del instituto en http://www.unl.edu/buros/index/simm.html.
3. Esperamos sinceramente que este pensamiento llegue a usted cuando haya terminado su trabajo en curso y se encuen
tre a usted mismo yendo hacia una librería para vender los libros de texto usados.
Bases de datos en línea Una de las bases de datos bibliográficos más extensa de la publicaciones re
lacionadas con pruebas es la mantenida por el Educational Resources Information Center (ERIC).
Fundado por el Departamento de Educación de Estados Unidos y operado fuera de la Universi
dad de Meryland, el sitio de ERIC en www.eric.ed.gov/researchdb/index.html contiene noticias
y fuentes valiosas sobre pruebas y evaluación. Hay extractos de artículos, artículos originales y
ligas a otros sitios web útiles. ERIC busca promover información balanceada sobre evaluación
educativa y promocionar recursos para determinar el uso responsable y ético de pruebas.
La American Psychoiogical Association (APA) mantiene un número considerable de bases
de datos útiles para localizar información relacionada con la psicología, en artículos de publica
ciones periódicas, capítulos de libros y disertaciones doctorales. PsycINFO es una base de datos
de extractos que datan desde 1887. ClinPSYC es una base de datos derivada de PsycINFO que se
centra en extractos de naturaleza clínica. PsycSCAN; Psicofarmacología, contiene resúmenes de ar
tículos que tienen relación con la psicofarmacología. PsycARTICLES es una base de datos de
artículos con una amplia extensión que datan desde 1988. Health and Psychosocial Instruments
(HAPI) contiene un listado de medidas creadas o modificadas para estudios específicos de in
vestigación, pero que no están disponibles en forma comercial. Está disponible en muchas bi
bliotecas de universidades a través de BRS Information Technologies, y también disponible en
CD-ROM (actualizado dos veces por año). PsycLAW es una base de datos gratuita y disponible,
que contiene discusiones sobre temas selectos relacionados con la psicología y la ley. Se puede
Otras fuentes Las bibliotecas escolares contienen un gran número de otras fuentes que pueden
utilizarse para adquirir información sobre pruebas y temas relacionados con ellas. Por ejemplo,
dos fuentes para explorar el mundo de pruebas y mediciones no publicadas son el Directory of
Unpublished Experimental Mensures (Goldman & Mitchell, 1977) y Test in Microfiche, disponible
en Test Collections. La APA dispone del Finding Information About Psychological Tests (1995), su
propia guía para localizar información relacionada con la utilización y aplicación de pruebas. Y
ahora, como sitio de referencia sobre estas muchas fuentes de información... véase la tabla 1-4.
Después de indagar sobre una cantidad considerable de información acerca de pruebas y
otras herramientas de evaluación, en el siguiente capítulo se explorarán los aspectos históricos,
culturales, ético/legales de la actividad y desempeño de la evaluación.
hllp://edres.org/scnpts/cal Para obtener más experiencia de primera mano con la evaluación computerizada,
aprender su lógica y observarla “tras bambalinas
wv-w apa.org/science/iag-iindtests.btm Valiosa información general sobre como encontrar información sobre pruebas psico-
o « lógicas publicadas e inéditas
www.gre.org "" El examen de registro para graduados (Gradúate Record Examinaron, GRE) es una
prueba en el futuro de muchos lectores de este libro. Es el sitio oficial de infor
mación autorizada para el GRE
htlp //edres.org/irl Después de leer el capitulo 1 de este libro, tal vez desee leer este materia! avanzado y
profundo sobre un enfoque de medición llamado ítem response Iheory.
http://edres.org/mdt Después de leer el capítulo 7 de este libro, tal vez desee leer este material avanzado
y profundo sobre un enfoque para clasificar a los examinados con base en una
teoría de decisión estadística
Tabla 1-4
Fuentes de información sobre las pruebas: Algunas ventajas y desventajas
Catálogos de pruebas disponibles Contiene una descripción general de la prueba, Diseñada de manera primaria para vender la prueba a los
del editor de las pruebas y incluyendo para lo que esta diseñada y para usuarios de pruebas o evaluadores y rara vez contiene
distribuidores afiliados de la quién está diseñada. Disponible para casi reseñas críticas, la información no está lo suficiente
prueba todos los que soliciten el catálogo mente desarrollada para poder tomar una decisión de
aplicación y uso del instrumento.
Manuales de pruebas Por lo general, la fuente más detallada disponible lo s detalles con respecto a la solidez psicomélrica de la
para información relacionada con la muestra prueba por lo general están disponibles y escritos con
de estandarización y las instrucciones para la base en estudios conducidos por el autor y/o editor
administración de ia prueba También puede de la prueba. El manual de la prueba misma puede
contener información útil resoecto a la leería ser difícil de obtener para los estudiantes, puesto
en la que se basa la prueba, si ése es el caso. que su distribución está restringida a profesionales
Es típico que contenga al menos algo de calificados.
información respecto a la solidez psicomélri-
ca de la prueba.
Volúmenes de referencia como Muy parecido a les informes de Consumidor para Pocas desventajas si el que ia revisa intenta de manera
el Anuario de mediciones las pruebas, contiene descripciones y reseñas genuina ser objelivo y encaminado al conocimiento,
mentales, disponible en criticas de pruebas escritas por terceras pero, como con cualquier otra reseña, puede propor
libro impreso o en línea. partes quienes presumiblemente no tienen cionar una visión equivocada, si éste no es el caso.
nada que perder o ganar al apremiar o criticar También, para cuestiones muy detalladas de la muestra
el instrumento, su muestra de estandarización de estandarización y otros aspectos relacionados, lo
y su solidez psicomélrica. mejor es consultar ef manual de la prueba.
Artículos de publicaciones Fuentes actualizadas de reseñas y estudios de A igual que con los volúmenes de referencia, las reseñas son
periódicas solidez psicomélrica. Proporciona ejemplos valiosas porque contienen información y. hasta donde es
prácticos de cómo se usa un instrumento en posible, no son tendenciosas. El lector debe investigar
la investigación o en contextos aplicados. tantos artículos como le sea posible en su intento por
aprender cómo se usa ei instrumento en realidad: un
articulo sólo puede proponer una visión atípica.
Bases de datos en linea Ampliamente conocidas y respetacas en ias tases ¡Atención! Algunos sitios web se disfrazan de bases de
de dalos del ERIC. son las "minas de oro" datos para pruebas psicológicas, cuando en realidad
virtuales de información útil que contiene están diseñados para entretener o vender algo, en vez
aspectos a detalle. Aunque algunas pruebas de informar. Es común que estos sitios ofrezcan prue
psicológicas legitimas puedan estar disponi bas que se puedan contestar en línea. A medida en que
bles para la autoadministración y la califica aprenda más sobre las pruebas, será más crítico del
ción en línea, la vasta mayoría no lo está. valor de estas “pruebas psicológicas" autocaiificadas y
autoadministradas.
Un vistazo a la red
Revise los siguientes sitios web para más información sobre temas de este capítulo:
Standards for Educational and Psychological Testing American Board of Professional Psychology
www.apa.org/science/standards.html (ABPP)
www.abpp.org
National Council on Measurement in Education
www.ncme.org American Board of Assessment Psychology
(ABAP)
American Educational Research Association www.assessmentpsychologyboard.org
(AERA)
wwvv.aera.net American Academy of School Psychology
http://espse.ed.psu.edu/spsy/aasp/aasp.ssi
Illinois State Board of Education-Alternative Assessment
www.isbe.net/assessment/lAA.htm National Association o f School Psychologists
www.isbe.net/assessment/default.htm (NASP)
www nasponline.org/index2.html
IDEA
www.ed.gov/offices/OSERS/Policy/ IDEA/ index.html PsycLAW
www.apa.org/ psyclaw
www.ideapractices.org/law/index.php