Академический Документы
Профессиональный Документы
Культура Документы
La evaluacin psicomtrica
de la inteligencia
NDICE DE CONTENIDOS
Introduccin
Parte I: Principios y supuestos bsicos de la evaluacin
psicomtrica
A. La aplicacin de un test como experimento psicolgico.
B. El rendimiento en los tests como signo de las aptitudes.
C. La evaluacin de la inteligencia como medicin de aptitudes.
D. Distribucin normal y normas de los tests.
INTRODUCCIN
La primera de estas hiptesis es la que permite que las puntuaciones brutas de los tests
puedan convertirse a una escala tpica de medida (por ejemplo, puntuaciones z) en la que,
realmente, lo que se hace es atribuir a cada una de ellas un valor ordinal, una posicin
dentro de la serie ordenada de puntuaciones que sirvieron de norma al construir el test...
Lo que, evidentemente, supone que la asignacin de valor a las puntuaciones de cualquier
individuo en el test se lleva a cabo de acuerdo con la segunda idea expresada: por
comparacin.
En este sentido, lo que en realidad nos dicen tales puntuaciones es que, comparado con tal
norma estadstica, el sujeto X se sita en la posicin Xi con respecto al resto de sujetos que
han sido examinados con la misma prueba, lo que hace que una de las cuestiones
esenciales en la construccin de cualquier test sea la seleccin de la muestra de validacin,
A. LA CUESTIN DE LA FIABILIDAD
Del mismo modo que, cuando realizamos medidas con una cinta mtrica, nos gustara que
fuera "de fiar", que no midiese hoy una cosa y maana otra distinta, de un test de
inteligencia debemos esperar que no nos ofrezca un resultado diferente cada vez que se lo
aplicamos al mismo individuo, y ese es el sentido bsico del concepto de fiabilidad de un
test. As, pues, cuando hablamos de fiabilidad de un test nos estamos refiriendo al grado en
que podemos confiar en las puntuaciones que nos ofrece al aplicarlo.
Dicho ms formalmente, lo que entendemos por fiabilidad de un test es el grado en que las
puntuaciones observadas al emplearlo coinciden con las puntuaciones verdaderas que
deberan obtenerse en el caso de que sus mediciones estuviesen libres de error... Slo que
al definir de este modo la fiabilidad tenemos un problema de gran importancia: puesto que
ningn test est completamente libre de errores de medida, es imposible conocer
directamente las puntuaciones verdaderas.
La identidad de la aplicaciones.
Junto a estos elementos, deberamos tener tambin en cuenta otros aspectos que influyen
en el valor de los coeficientes de fiabilidad, como son:
-
La variabilidad del grupo empleado como muestra (cuanto mayor sea, mejor ser la
fiabilidad de la prueba).
B. LA CUESTIN DE LA VALIDEZ
Con ser importante, la fiabilidad de un test es una condicin insuficiente por s misma para
determinar su valor como instrumento de evaluacin, ya que una alta fiabilidad asegura
que estamos midiendo correctamente algo, pero... qu es lo que estamos midiendo?
Y es que no basta con que digamos que un instrumento mide tal variable para que ello sea
cierto: cmo podemos estar seguros de que es as?
Como sealara Cronbach (1984), el ms bsico y fundamental de los criterios de calidad
psicomtrica de cualquier test es, sin duda, la validez, un concepto que incluye al menos las
siguientes dimensiones: la validez de contenido, la validez criterial y la validez de
constructo.
1. Validez de contenido.
La validez de contenido hace referencia al grado en que los tems de un instrumento de
medida son una muestra adecuada del dominio o mbito que se pretende testar, esto es, al
hecho de si el instrumento examina la variable o variables que intenta examinar y si
examina todos los aspectos relevantes de la misma (Cronbach,1971).
El establecimiento de la validez de contenido se basa en el anlisis racional de los tems
que componen un instrumento de medida (por lo general, recurriendo al juicio de varios
expertos en la materia objeto de examen) y se define bsicamente como validez muestral,
esto es, como el grado en que los tems que conforman el test cubren el conjunto de
aspectos del dominio objeto de examen y el grado de relevancia de dichos tems con
respecto a tal dominio.
Son los tems elegidos apropiados para el test y ste mide el objeto que interesa?
Contiene el test la informacin necesaria para abarcar bien el conjunto de aquello que
se supone que se va a medir?
Porcentaje de poblacin
ste fue el mtodo utilizado por Wechsler en sus conocidas Escalas de Inteligencia, que
ofrecen como medida global un Cociente de Inteligencia no obtenido segn la frmula
antes presentada de Terman-Merrill, sino a partir del clculo de las desviaciones tpicas de
las puntuaciones observadas en las muestras de normalizacion, por lo que es conocido
como Cociente de Desviacin (las versiones actuales de la vieja EMI tambin utilizan esta
estrategia). Al proceder
de este modo, sean
Distribucin de la poblacin en funcin del C.I.
cuales sean los datos
brutos
originales
obtenidos al aplicar el
test, su tratamiento
68.26%
estadstico nos ofrece
una
escala
estandarizada,
13.59%
13.59%
constante, cuya media
se
ha
situado
2.14%
2.14%
arbitariamente en 100 y
0.13%
0.13%
con una desviacin
-3DT -2DT -1DT
X
+1DT +2DT +3DT
tpica de 15 puntos (16
C.I. Wechsler: 55
70
85
100 115 130 145
en el caso de la
Stanford-Binet).
C.I. Sta.-Binet: 52
68
84
100 116 132 148
Como puede comprenderse, este procedimiento opera sobre el supuesto de la distribucin
normal de las aptitudes intelectuales, al que ya hicimos referencia y, bsicamente, no
consiste en otra cosa que en transformar las puntuaciones directas en puntuaciones tpicas,
lo que otorga a este tipo de medidas de los tests una serie de caractersticas que no
podemos perder de vista.
En primer lugar, puesto que la tipificacin se lleva a cabo a partir de las puntuaciones
observadas en muestras de sujetos diferentes para cada edad, dos CI de desviacin del
mismo valor en sujetos de edades diferentes no son equivalente entre s: al derivarse el
primer CI de la tipificacin de las puntuaciones de una muestra y el segundo de la
tipificacin de las puntuaciones de otra distinta, uno y otro no tienen nada que ver,
realmente, entre s... Razn por la que resulta incorrecto valorar la puntuacin obtenida por
un individuo de 7 aos utilizando como referencia las normas o baremos de la muestra de
individuos de 10 aos, o de cualquier otra edad diferente a la suya.
Por el mismo motivo, resulta inadecuado determinar el CI de un sujeto al que se le aplic
la versin espaola de un test como la Escala de Inteligencia de Wechsler para Nios
(WISC) utilizando las normas elaboradas a partir de las puntuaciones de los sujetos de su
misma edad en la versin inglesa o francesa.
En segundo lugar, no podemos perder de vista que la tipificacin de las puntuaciones de un
test implica siempre un proceso probabilstico, con un cierto margen de error, de modo que
al obtener un CI de desviacin ste se estima con un margen de confianza determinado.
Consecuentemente, un CI nunca es una cifra segura, sino una estimacin que se mueve en
una banda de valores, mayor o menor en funcin de que se haya elegido un margen de
confianza ms o menos elevado (p<0.05, p<0.01, etc.).
Esta es una cuestin especialmente importante y delicada en ciertas situaciones de
evaluacin en las que mover un CI 4 puntos hacia arriba o hacia abajo (es decir, en una
banda de 8 puntos) puede suponer llegar a conclusiones muy diferentes. El caso ms
evidente son las definiciones administrativas de Deficiencia Mental basadas en valores
determinados de CI, pero nos referimos tambin a otros casos, como cuando los resultados
de un test aplicado en dos ocasiones (antes y despus de una intervencin) se utilizan como
criterio para determinar la eficacia de un tratamiento, o como el caso en que se trata de
establecer si hay diferencias significativas entre dos medidas de aptitudes diferentes para
inferir la eventual
existencia
de
un
determinado
perfil
aptitudinal
68.26%
caracterstico en un
sujeto o grupo de
sujetos.
13.59%
13.59%
Aunque hasta ahora
2.14%
2.14%
0.13%
0.13%
nos hemos estado
refiriendo, en estos
-3DT -2DT -1DT
X
+1DT +2DT +3DT
ltimos prrafos, a los
C.I. Wechsler: 55
70
85
100
115
130
145
CI
de
desviacin,
C.I. Sta.-Binet: 52
68
84
100
116
132
148
cuanto hemos dicho Percentiles....:
1
5 10 20 50 60 80 90 95
99
sobre la tipificacin de Puntuacin Z: -3
-2
-1
0
+1
+2
+3
puntuaciones
es Puntuacin T: 20
30
40
50
60
70
80
aplicable a aquellos
tests de aptitudes que ofrecen los resultados utilizando otro tipo de ndices, como
percentiles o decatipos.
Construccin con cubos: Con unos pequeos cubos o dados de madera, el nio debe
reconstruir diversos modelos tridimensionales que, previamente, el examinador
construye a su vista. No tiene tiempo limitado.
Rompecabezas: El nio debe ensamblar las piezas de una figura sencilla y muy familiar
(alimentos y animales, segn el caso) que puede constar de entre dos y seis fragmentos.
En esta prueba hay tiempo lmite y bonificacin en la puntuacin por resoluciones
correctas rpidas.
Memoria pictrica: Tras observar durante 10 segundos una lmina con seis dibujos de
objetos corrientes, el nio debe recordar cules eran tras ocultarlos el examinador.
Existe tiempo lmite.
Secuencia de golpeo: El nio debe reproducir en esta prueba varias secuencias rtmicas
producidas previamente por el examinador, golpeando las teclas apropiadas en un
pequeo xilfono. No hay tiempo lmite.
Accin imitativa: El nio debe imitar diversos movimientos amplios con los brazos,
manos y pies, realizado por el examinador frente a l.
Copia de dibujos: El nio debe reproducir con lpiz en un papel tres figuras sencillas
que el examinador ejecuta ante l y seis ms que se le presentan en tarjetas
individuales. No hay tiempo lmite.
Dibujo de un nio: Se le pide al examinando que dibuje un nio (si es varn) o una
nia (si de trata de una chica) con la mayor exactitud y nivel de detalle que pueda. No
hay tiempo lmite.
Fluencia verbal: En un tiempo lmite de 20 segundos, el nio debe decir tantos casos
como pueda de una categora semntica dada (cosas para comer, animales, cosas de
vestir y cosas para montarse en ellas).
D. nio
Me.Num
Fluencia
Recuent
Opuestos
X
X
X
X
X
X
X
X
X
X
X
Concep
Copia
X
X
Imitac
C.Brazos
C.Piernas
X
X
Der-Izq.
X
X
Me.Verb
Vocabul.
Golpeo
Mem.Pic
Clculo
Rompec.
Gral. Cognit.
Verbal
Perc.-Manip.
Numrica
Memoria
Motricidad
Cubos
La relacin entre escalas y tests en las MSCA es la que se observa en la siguiente tabla:
Cubos de Kohs. Como Wechsler, Alexander incluy en sus escalas una adaptacin de
los clsicos cubos de Kohs, una tarea que se considera que suele considerarse un muy
buena medida de G. En este subtest, el examinando debe reconstruir con los cubos diez
diseos geomtricos planos que ponen en juego su capacidad de estructuracin
espacial, y en particulat su aptitud para el anlisis y la sntesis de configuraciones
visuales abstractas, geomtricas, que carecen de significado.
Construccin con cubos. Similar a la prueba anterior, en las tareas de construccin con
cubos el sujeto debe resolver tres problemas espaciales tridimensionales, construyendo
con unos cubos con caras coloreadas y caras sin colorear un bloque.
Por el nivel mnimo de lenguaje que requieren (slo necesario como medio de
comunicacin entre examinador y examinando al dar las consignas), las Escalas de
Alexander se consideran un instrumento especialmente til en la medicin de la
inteligencia en el caso de personas sordas, con un nivel muy bajo de desarrollo del lenguaje
o que no dominan la lengua de examen por ser su lengua materna otra diferente. Del
mismo modo, se considera en general una prueba muy sensible a los signos de deterioro
mental orgnico.
Su aplicacin es posible desde los 7 aos y proporciona un ndice de edad mental y otro de
cociente intelectual.
B. TESTS FACTORIALES
1. Tests de Matrices Progresivas, de Raven.
Las matrices progresivas son uno de los instrumetnos ms ampliamente utilizados como
medida del factor g, finalidad con las que fueron ideadas por Raven.
Bsicamente, la estrategia de evaluacin consiste en presentar a los sujetos un conjunto de
estmulos organizados en formato de tabla (o matriz), de modo que forman varias series al
En las tres escalas, las puntuaciones obtenidas en los subtests se combinan para tener una
puntuacin directa que luego se pasa a centil o a CI de desviacin. La saturacin de g
hallada vara en torno a 0,90 pero la validez predictiva no supera el valor de 0,27. La
fiabilidad es alta y la validez es superior a 0,5.
Subtest de Factor E (Aptitud espacial): Formada por 20 tems en los que hay que
identificar cul de entre varias opciones es la correspondiente al modelo que se
presenta.
En todas las tareas del PMA la velocidad de ejecucin es un factor fundamental, ya que se
da un tiempo limitado para la ejecucuin de las diferentes tareas. En cuanto a la aplicacin,
puede ser tanto individual como colectiva y dura aproximadamente unos 30 minutos.
Subtest de Aptitud numrica (Factor NA): Presenta un total de 40 tems en los que se
presentan sumas, restas, multiplicaciones, divisiones, races cuadradas, races cbicas,
porcentajes y proporciones seguidos de varias opciones de respuesta entre las que se
incluye la correcta. Se proporcionan normas para valorar esta variable en relacin con
la anterior, como ndices de la aptitud acadmica del individuo.
Subtest de Razonamiento abstracto (Factor AR): Como es habitual en este tipo de tests,
se trata de una tarea de series a completar; en este caso, 50 series de incompletas de
figuras geomtricas.
Subtest de Relaciones espaciales (Factor SR): Este subtests est formado por 60 tems
en los que el sujeto debe elegir entre varias formas geomtricas tridimensionales la que
se formara al plegar un modelo de desarrollo plano dado.