Вы находитесь на странице: 1из 4

ESTADSTICAS Y MEDICIN

Por Ray M. Zeisset.


Traducido y adaptado del ingls por Ps. Rodrigo Faras Veloso

Captulo 3
Caractersticas de los buenos Tests Psicolgicos y formas para
saber si lo son.
Si se pretende medir la altura de una persona, la medicin resulta algo
sencillo si se cuenta con una cinta de medir que estimamos es lo suficientemente
exacta. Pero cuando lo que se intenta medir son rasgos psicolgicos, es decir,
rasgos de la personalidad o inteligencia, el problema de la medicin se torna un
poco ms difcil de abordar pues muchas veces se estn midiendo convenciones
o acuerdos acerca de lo que se mide.
En otras palabras, es fcil decir que tal persona mide tantos centmetros
desde los pies a la cabeza, pero cuando lo que se mide es un constructo abstracto
como inteligencia o extraversin, debemos partir por definir qu vamos a
entender por tales conceptos y cmo podemos crear un instrumento que lo pueda
estimar en una forma relativamente exacta. Pues, a diferencia de la altura de una
persona, no podemos ver a lainteligencia o a la extraversin, y lo que debemos
conseguir es una medida que las cuantifique con exactitud y establemente en el
tiempo.
Una sencilla metfora explica mejor el asunto. De la misma forma que no
puede verse el viento, slo podra estimarse su direccin o intensidad si se
observaran briznas de pasto revoloteando en el aire. La direccin o agitacin que
tomen las mismas nos pueden decir algo acerca de eso invisible que llamamos
viento, pero del que podemos apreciar visiblemente sus efectos. Con los tests
psicolgicos pasa algo semejante, se miden rasgos visibles tales como capacidad
para resolver problemas en el caso de la inteligencia y predileccin por estar en
compaa de otros si se trata de medir el rasgo de extraversin.
As pues, los items del test deben reflejar exactamente lo que deseamos
medir, la direccin o intensidad del viento, as como tambin la estabilidad de tal
medida, si el viento tiende predominantemente a ser de una determinada forma.
Qu caractersticas tienen los buenos tests psicolgicos?: Bsicamente cuatro:
1.- Son confiables
2.- Son vlidos.
3.- Tienen normas apropiadas.
4.- Son tiles.

Biblioteca virtual Instituto GRAFOS www.grafos.cl

Pgina 1

CONFIABILIDAD
El que un test sea confiable se refiere a qu tan consistentemente en el
tiempo mide lo que pretende medir. La idea central es que el test no arroje
distintos resultados cada vez que se mide el mismo rasgo. En ese caso el test
resulta de poca utilidad. Lo que se busca es que sea capaz de repetir los mismos
resultados en dos momentos distintos.
Un test que no es confiable es como una cinta de medir elstica, que en
cada medicin de la altura de una persona arroja resultados distintos. Es distinto
cuando se mide con una cinta metlica que consistentemente proporcionar
resultados ms estables en la medicin de la altura de la persona.
Para estimar la presencia o ausencia de confiabilidad en un test, el mtodo
estadstico empleado es la CORRELACIN. Es decir, al correlacionar los puntajes
de la misma muestra de personas en dos momentos de tiempo, obtenemos un
coeficiente de correlacin, el cual va desde el rango de .00 (ausencia de
correlacin) hasta 1.00 (correlacin perfecta).
Ahora bien, al tratarse de estimaciones y no de medidas perfectas,
debemos considerar que en toda medicin habr un puntaje verdadero y un error
de medida, que se debera a imperfecciones en nuestro instrumento de medicin.
Si pudiramos medir infinitas veces a la misma muestra, el promedio de los
puntajes sera el puntaje verdadero, pero como en la realidad esto no puede
hacerse, lo que se hace es estimar el error de medida.
Estos errores pueden deberse a:
- Diferencias en el estado de las personas en el momento de tomarse el test,
debido a fatiga, concentracin o estado de nimo.
- Cambios en las condiciones ambientales entre las dos ocasiones en que se
mide el test, tales como temperatura, ruido, etc.
- Errores del administrador de las pruebas.
- Aprendizaje de los encuestados entre una y otra aplicacin ya sea para
responder correctamente una respuesta o para predisponerse a responder
de una determinada forma.
Formas de estimar la confiabilidad
1.- Test Retest:
Medir a la misma muestra de sujetos con el mismo instrumento en dos
ocasiones diferentes, separadas por un lapso de al menos dos semanas entre
ellas y correlacionar los resultados.
Una correlacin aceptable no debiera bajar de 0.80. De ser inferior, es decir de
0.50; 0.20; etc, se asume que el test no es confiable.
Estadgrafos usados para realizar esta correlacin son el ndice de spearmanbrown, el de Pearson y otros ms (que vienen en Excel y otros programas
estadsticos).
Biblioteca virtual Instituto GRAFOS www.grafos.cl

Pgina 2

2.- Formas alternativas:


Administrar formas diferentes pero equivalentes del mismo test, a la misma
muestra de personas y correlacionar los resultados.
3.- Anlisis de consistencia interna:
Es el grado de consistencia entre los items del instrumento. Se evita el tener que
aplicar en dos ocasiones el test por dos vas diferentes:
a) Biparticin: Se divide el instrumento en dos mitades equivalentes y se
administra una sola vez, correlacionndose posteriormente ambas mitades.
b) Coeficiente alfa: Se realiza computacionalmente, y se correlaciona la
varianza de cada tem con respecto a los dems.

VALIDEZ
Aunque existen varios tipos de validez, en un sentido amplio este concepto quiere
decir que el test mide lo que pretende medir, o para lo que fue construido.
Establecer la validez de un test es un proceso ms complejo que establecer
su confiabilidad. Un instrumento no tiene una sola validez, sino que varias,
dependiendo del propsito especfico del mismo as como la forma de evaluar la
validez.
Las diversas valideces del instrumento y sus formas de estimarla son las
siguientes:
1.- Validez de contenido:
Se determina mediante
a) Examinando la idoneidad o adecuacin de los tems y preguntndose
cules de ellos miden el contenido que el test pretende medir.
b) Juzgando si los items abarcan completamente lo que pretende medir el test.
c) Determinando si el nivel de dificultad de los items es el adecuado.
Este tipo de validez es ms importante para los tests de potencia intelectual que
para los de personalidad.
2.- Validez de criterio:
Se determina mediante la comparacin del instrumento no validado con uno que
ya cuenta con esta caracterstica y que mide rasgos semejantes. Y tal instrumento
est validado porque ya ha sido ampliamente investigado y generalmente
aceptado.

Biblioteca virtual Instituto GRAFOS www.grafos.cl

Pgina 3

3.- Validez de constructo:


Se refiere a que el test tiene significancia psicolgica, es decir, que mide
exactamente el constructo o idea terica (como inteligencia).
Puede determinarse:
a) Definiendo tan claramente como sea posible el constructo terico a ser
medido.
b) Analizando cmo se correlaciona el test con otros tests que miden el mismo
constructo terico.
c) Preguntando a expertos en el tema a ser medido en el llamado juicio de
expertos.
d) Preguntndoles a los encuestados en detalle acerca de sus respuestas,
tratando de determinar el proceso especfico mediante el cual llegaron a las
respuestas.
e) Analizando la consistencia interna del test.
La validez de constructo de un test no queda establecida por slo una medicin
exitosa, sino que es producto de un proceso gradual de acumulacin de evidencia
para determinar la naturaleza y caractersticas de lo que nuestro instrumento est
realmente midiendo.
La confiabilidad es necesaria para la validez.
Es importante notar que la confiabilidad es necesaria, pero no suficiente
para que un instrumento sea aceptable. Pues puede que se est consistentemente
evaluando a lo largo del tiempo algo que no es lo que se deseaba medir. Pues
puede estarse consistentemente evaluando capacidad para responder items de
alternativa mltiple y no inteligencia viso espacial, por ejemplo.
La confiabilidad de un test limita su potencial validez. Todo test vlido es
confiable, pero no todos los tests confiables son vlidos.

NORMAS
Un buen test ha de tener normas, las cuales son puntajes y otra informacin para
el grupo de personas usado para estandarizar el test.
Los grupos de estandarizacin han de ser amplios, bien definidos y
representativos de la poblacin para la cual van a ser utilizados.
Las normas son tiles para comparar, por ejemplo, el promedio obtenido en
el instrumento por un determinado individuo o grupo con el promedio de la norma.

UTILIDAD
El test ha de tener una utilidad prctica, incluyendo criterios tales como facilidad
de aplicacin y correccin, costo, disponibilidad, tiempos de aplicacin y
correccin razonables, etc.
Biblioteca virtual Instituto GRAFOS www.grafos.cl

Pgina 4

Вам также может понравиться