Вы находитесь на странице: 1из 11

Construccton de pruebas psicologicas 2'

Brown, F. (1980) Medicin en I Especiticaciones de la finalidad I


Psicologa"I y Educacin. Mxico: El
Manual Moderno
2 ... I
Traducclfm de la finalidad en terminos operacionales I
I
,'J '(
CONSTRUCCION DE PRUEBAS Delineacion del
Definicion del
Anilisis d8lu8stos

PS~COlOG'ICAS: GENERAllDADES
contenldo y las Identificaci n de los
habilidades rasgo critarios V 10' rasgos
"JU ~ ,."
componentes
J ~,,,
I
\
I
.. '. d\'~'.jLos procedimientos utilizadospara construir pruebas psicologicas tienen Elaboracion de los reactivos
Revi'iones
"," , como fin asegurar que estas alcancen sus finalidadys y metas deseadas. Esto
~ <1: se logra mediante la aplicacion de los principios de rnedicion analizados en el
,; I., capftulo 11. Aun cuando el proceso exacto varfa.idependiendo del tipo de I i
',\ prueba 'psicologica, se puede establecer una secuencia general en los pasos Comprobacion V aOlilisis de los reactivos
":: de construcci6n de las pruebas psicologicas, que incluyen la especificacicn Discriminacibn
Djficultad
de su fmalidad, la construccion y la cornprobacion de reactivos, el ensam- Alternativas apropiadas
blaje'd'e'la forma final de la prueba, el analisis y estandarizacion de las califi- V~lidacion cruzada

cacionesde la prueba psicologica. En la construccion de cualquier prueba


especffica, se pueden omitir algunas de las etapas. Puede variar su orden
I
1 ",

'se
18 h1 0 'pueden llevar a cabo varias etapas de manera simultanea. Sin embargo, I Estructuracibn de la formafinal de la prueb~
'~',',!; esp'osible identificar una frecuencia general (ver la fig. 2-1). I
, . En este capitulo se presentara una revision general del proceso de Estandarizacion
'" :,:' ,de~ono de pruebas psicologicas, para mostrar en forma ampIia el modo Aplic~cibn
Lineamientos
, en que se ajustan las etapas, unas a otras, A continuation, en los capltulos Limites de tiempo
que siguen, tomareinos en consideration las etapas individuales. Durante Calificacicnes
toda la exposicion, es preciso recordar que el proceso de desarrollo de
J}rUebas psicologicas es una ciencia y un arte. Utiliza tanto el razonamiento
I
Anilisis tecnico de la prueba
'estadfstico como el logico y equilibra las consideraciones practices con las Confiabilioad
teo'ncas. La meta es la de desarrollar un instrumento tecnicamente apropia- Validez
Normas
do,dentro de las limitaciones practicas.
'~ . ,~. ,,' Antes de iniciar el analisis de la construccion de pruebas psicologicas,
~"f:-.~.,t..~"-=
,
..1
es preciso hacer hincapie en dos puntos evidentes, que se pasan por alto con
~
Prueba lista parautilizarse
,I" demasiada frecuencia. Enprimer lugar, en muchas situaciones, una prueba es
s610 uno de entre varies metodos posibles de obtencion de la informacion
Fig. 2-1. Etapas en la construcclon de una prueba.
deseada, Por ejemplo, si dcseamos medir los conocimientos de maternaticas
if.o de un estudiante de secundaria, Ie podemos aplicar un examen. Alternativa-
mente, podrfamos utilizar sus calificaciones en los cursos de matematicas
En segundo lugar, existen pruebas publicadas disponibles en la mayorta
o pedirles a los maestros que calificaran sus conocimientos. Si hay algun
de. ,lOS campo~ de la actividad psicologica (Buros, I974a). Asi, podemos
~. r- 'otro metodo mas preciso 0 practico para obtener fa informacion deseada se
u tihzar con trecuencia una prueba existente, en lugar de construir otra
, 1\:;.-( de'beIi utilizar de preferencia un examen 0 una prueba.
'l;;il~'1 ':e . , , nue~a. Por supuesto, las ventajas del usa de una ya existente es el ahorro
~funu~ ~ de tlemp~. y esfu~rzo de construccionde la prueba y 13 disponibilidad de la
informacion previa respecto a la eficacia de 13 prueba y el significado de
22 Construccion de pruebas psicol6giCtU [Capitulo 2) Construccton de pruebas pstcologicas 23

sus calificaciones. EI mayor inconveniente es el de que puede no haber conducta en esta muestra de situaciones, podr iamcs hacer inferencias res-
pruebas publicadas que sean optimas para la situacion dada. pecto a su honestidad.
Goodenough (1949) hizo otra distinclon dentro de 13 c1ase de pruebas
representativas. Las clasific6 como muestras y como signos, La base primor-
LO QUE REPRESENT AN LAS PRUEBAS dial de su distinci6n es la claridad con la que se pucde definir el universo
PSICOLOGICAS muestreado, En su clasificacion, una prueba es una muestra cuando los
reactivos son obtenidos de un universo clararnente definido; es un signa.
Las funciones de las pruebas psicologicas se pueden ver a partir de cuando el universo es abierto y no esta definido claramente. La irnplica-
i diversas perspectivas. En el capitulo I, analizamos varias clasificaciones ci6n del termino "signo" es que la prueba indica 0 senala la naturalcza del
'posibles de las pruebas. Otro plan de clasificacion que nos ayudara a com- universo, objeto del muestreo. As! pues, las pruebas que son muestra sc
prender el proceso de su construccion establece una distincion entre 10 que considera que describen el universo, mientras que las de signos, 10 explican.
representan y 10 que predicen las pruebas psicolegicas. Desde este punto de La idea de una prueba como un signo se puede aclarar por medio de
vista una prueba psicol6gica es una representaci6n cuando sus reactivos dos ejernplos, Tomemos en consideraci6n la creatividad , que es un concepto
son similares a las conductas que nos interesa medir y es predictor, cuando muy utilizado; pero que se define raramente con c1aridad. Un buen metodo
se enfoca en alguna conducta, no considerada en la prueba que deseemos para abordar el estudio de la creatividad podria ser el desarrollo de una
predecir. prueba de aptitudes y de resolucion de problemas que parezcan medir la
Para ilustrar el concepto de la prueba psicologica como representacion, capacidad creativa. A continuacion, relacionariamos las calificaciones
supongamos, por ejemplo, que deseamos medir la capacidad de un nino obtenidas en esas medidas con otros indices de creatividad, tales como las
para sumar numeros de tres dfgitos, Podriamos pedirle al nirto que resol- clasificaciones hechas por jueces expertos, La obtencion de premios por
viera un gran numero de problemas de suma de dos numeros de tres dfgi- realizaciones creativas 0 el exito en ocupaciones que requieren capacidades
'tos; sin embargo, esto daria como resultado una prueba sumamente prolon- de creacion. Si esos estudios dernuestran que las cahficaciones obtenidas
gada. En lugarde ello, podriamos escoger una muestra de problemas y en esa prueba se relacionan con esos resultados, habremos contribuido a
.> JI
.pedirle al nino que los resolviera. En base a su ejecuci6n en esos problemas, definir 10 que se entiende por creatividad. En esencia, nuestra prueba psico-
seria posible inferir hasta que punta podria obtener buenos resultados logica habra servido como un "signo" que indique la presencia de capacida-
en toda la gama de problemas posibles. La exactitud de nuestra inferencia des creativas.
dependerfa de 10 bien que hicieramos el muestreo de los reactivos incluidos o bien, tomemos en consideracion la inteligcncia. Uno de los modos
en la prueba psicologica, a partir de todo el conjunto potencial de reactivos. de definir la "inteligencia" es mediante los tipos de (areas incluidas en las
Si por algiin error de muestreo escogieramos muchos reactivos faciles, pruebas de in teligencia. AI utilizar el concepto de pruebas psicologicas
sobreestimarfamos su capacidad; si los problemas dificiles estuvieran repre- como signos, la consabida frase de "inteligencia es 10 que mide una prueba
sentados en exceso, su capacidad sesubestlmaria. No obstante, el metodo de inteligencia", que', se cita con frecuencia, no es simple mente una defi-
de selecci6n de reactivos esta claro. Hacemos un muestreo sistematico de nicion circular.' Mas bien, indica que la buena ejecuci6n de las tareas inclui-
reactivos del conjunto total de reactivos potenciales. La muestra de reactivos das en una prueba de inteligencia es una indicacion de que la persona en
incluida en la prueba representa, por 10 tanto, el dominio 0 universo de cuestion es .inteligente. ,
reacti\l'bs posibles.
En general, el concepto de muestreo es mas apropiado para las pruebas
Aun cuand~ las pruebas de ejecuci6n tales como la aritrnetica y de de rendimiento, en las que se especifican, por 10 comun con c1aridad, el
vocabulario, proporcionan los ejernplos mas claros de las pruebas como contenido y las habilidades que se deben medir. Sin embargo, al medir
representaci6n, este concepto se puede aplicar tambien a otros campos. construcciones utilizadas en las teorias psicologicas, el universo se suele
Supongamos que deseamos medir la honestidad de los nines de la escuela definir de modo incompleto. En este caso, es mucho mas apropiado cor.si-
prirnaria. Uno de los modos posibles de hacerlo serfa escoger una muestra derarlas como pruebas de signos.
de situaciones en las que un nii'\o tenga oportunidad de demostrar su hones-
'ti~iad, 0 su falta de ella, Y observar si, en esas situaciones, es realmente
honesto. Podrfamos dejar que el nino corrigiera su propia hoja de examenes, PRUEBAS PSICOLOGICAS PREDICfIVAS
permitirle ver las respuestas para un examen inminente 0 darle Ia oportuni-
En muchas situaciones, nos interesa una prueba debido a que sus
dad de sacar a escondidas de la clase algun objeto valioso, AI observar su
calificaciones nos perrniten predecir el modo en que se desempefiara una
24 Construccion de pruebas pstcolozicas [Capitulo 2) Construccion de pruebas psicologicas 25
persona en una situacion cualitativamente diferente. Por ejernplo, aunque predecir el exito academico en una carrera de ingenierfa. Asi, la misma prue-
#t.~una 'prueba de adrnision a la universidad puede incluir muchos reactivos ba sirve 10 mismo como muestra (del rendimiento en matematicas de secun-
, ' 1 de:. vocabulario, no nos interesa en sf mismo el vocabulario del alumno; daria) que como predictor (del exito en ingenierta); sir. embargo, el proceso
eri,'l~gar de ello, deseamos conocer la caIificaci6n obtenida por cad a estu- de construccion de pruebas variara, depeudiendo de las iunciones primor-
dianteen el vocabulario, debido a que predice su rendimiento en la univer- diales de ellas, Si la meta principal es la de desarrollar una prueba que mida
sidad. El interes se enfoca en 10 que se predice y no en el predictor. Nos el rendimiento en matematicas, el muestreo representative del universo de
interesa el rendimiento de un alumno en la prueba tan solo porque predice los problemas de maternaticas sera una condicion sine qua non para la selec-
alguna .otra conducta, 0 caracteristicas ,de interes, Asi, el hecho de si los cion de reactivos; si la exactitud de la prediccion es 10 mas importante, la
1, readivos de una prueba son un muestreo adecuado de un universe dado 0 representatividad del muestreo ' se subordinara al poder predictive como
:.;;~; rto,;tien:~, relativamente poca importancia. _ base para la seleccion de los reactivos. As! pues, aun cuando la prueba
l ." ....... '!.' -....., . .' ,
':".' ":'El'elemento esencial en' una prueba predictiva es que sus calificaciones puede servir para ambos fines, se resaltara uno u otro en el proceso de cons-
.,' \ se relacionan con. el, comportamiento de interes (el criterio), Hasta donde truccion.
R,tr: s~iecCi6n, dereactlvos para esa prueba se base en la exactitud con la que
~i.~~,p,~~tce:u~a conducta externa, se podran incluir en ella, reactivos que pa-
", 'rezeanno .tener ninguna relaci6n 16gica con la conducta que se este tomando FINALIDAD DE LA PRUEBA
, em .consideracion. Por eiemplo, en un inventario de intereses se puede
- , U;cl~. un reactivo en el que se Ie pregunte a la persona si Ie gusta [ugar al
",' go'tr. L6gicamente, este reactive puede tener muy poca relacion con cual-
quier elecci6n vocacional, con la excepcion posible de la de un golfista Desde un punta de vista pragmatico, el constructor de pruebas tiene
que tomar dos decisiones irnportantes: determinar el contenido de la prueba
pm.f~si~;n.~l. "Sin embargo, si se puede demostrar q~e el agrado por ~l go~f
I I " est4relacionado con los intereses por otras ocupaciones, se podria incluir
y su formato. 0 sea que debe determinar las conductas, los conocimientos
" estelieactivo en laprueba, ya que vaticinarfa los intereses en esas ocupa- o las habilidades que cubrira esta y como se presentaran los reactivos. Sin
J" _ ,
,j. I.

clones, embargo, antes de poder tomar esas decisiones, deberan hacerse dos pregun-
i f ~ .' .;,'~.': ::,' tas previas: .. i,para que fines servira laprueba?" y "i,qu~ grupo de sujetos
-vb:;' seran sometidos al examen?". Las respuestas a estas dos preguntas estable-
,~""'0:'1\';.

totE 1'~,: REPRESENTACION POR PREDICCION ceran lfmites y sugeriran c6mo seguir adelante en el proceso de construcci6n
ICJI,kf.,:)i;(iUI ,:)~ de la prueba.
III "ril6bDU'~dlstfh'ci6n entre las pruebas representativas y las de prediccion se La pregunta relativa a la finalidad es predorninante. Comunrnente, se
!1\\r reriere"a :$i los reactivos de la prueba y la conducta relevante, no contenida desarrolla una pruebq para alguna cornbinacion de usos y finalidades, mas
tp:;~lEit'elta,:lso'nsiJnilareso'diferentes.Si 13 prueba y laconducta no contenida que para un solo proposito. Aun cuando este proposito se define por 10
!t:$>!I'~t\~lellil'so'n"esen'cialmentesimilares , se dice que la ptl1eba"rep'resenta la comun, al menos de m)lnera implicita, es muy conveniente una declaraci6n
'1:~'-~oli(fJ'cta:' reievarife; slsondfferentes, la prueba es d~ 'pi'edicci6n.. Elpro- explicita y completa de sus fines.Por ejemplo, la flnalidad de la College
-~8~E1aesihono'deia'pniebU'variar4 dependiendo de si 'fUrlCi.orlata como Entrance Examination Board's Scholastic Aptitude Test (SAT) Prueba de
'ihhi'tnu'estn: un signo o unapredicclon. Cuando la pruebase construye Aptitudes Escolares del Conse]o de Examenes de Admisi6n a la Universidad
para muestra, se seleccionaran reactivos tornados slstematicamente de un se describe como sigue:
unlverso definido y' la. evaluacion consistira en detenninar 10 adecuado del Puesto que las escuelas secundarias difieren muche en sus cursos, sus normas
muestreo. Por otra parte, cuando una prueba espredictora, la etapa crucial academicas y sus practicas de calificacion, los funcionarios encargados de la
k;.'!iI. :seralla.de establecer, empfricamente, que existe una relaci6n entre el reactive admision a la universidad necesitan con tar con a1guna medida estandar de
t'-; ,y.::la -conducta que se intenta predecir. capacidad para comparar las solicitudes de los candidates procedentes de
distintas escuelas.
La distincion no es una dicotomia clara, ya que la misma prueba
puede ser de muestra y de predicci6n. Como ilustraci6n de esto, podemos
I Una prueba utilizada como predictor es una muestra de conducta, en un sentido
decir que se podrfa desarrollar una prueba mediante el muestreo de reactivos amplio, puesto que los reactlvos que flguran en el son s610 una muestra de todes
enseflados en los cursos de matematicas de secundaria. AI administrar esa los posibles en eJ universo.
prueba a los alumnos que ingresan a la preparatoria, se pod ria utilizar para
26 Construccion de pruebas psicologicas ( Can itulo 2)
Construccion de pruebas pslcologicas 27
>I!! , .EI SAT es una prueba objetiva con duracicn de tres horas, destinada
" "",.a proporcionar una medida estandar de las capacidades verbales y materna- leyendo tareas y materiales cubiertos durante las cIases. Adernas de especi-
\ \,'> ~-ticas de los
candidates a ingresar a la universidad. Lassecciones verbales del ficar el contenido, el constructor de una prueba debe especificar tarnbien
': "- r: )'. SAT pondran a prueba Ia capacidad para comprender las relaciones entre las ~abiIidades ~~~ se van a medir (por ejernplo, los conocimientos, las apli-
~~ ";IP.Wt1as paIabras y las ideas y entender 10 que se lee. Las secciones maternatlcas caciones, los analisis y las evaluaciones).
',' 0: 'tryr;npoilen:aproeb'a Ia capacidad para comprender simbolos matematicos y utili-
te \' \'0 o.zarlos en Ia resolucion de problemas (College Entrance Examination Board, Si ~a .prueb~ p~ic?logica se desarrolla para medir algun rasgo 0 alguna
ca~actenst1ca psicologica dada, la tarea del constructor sera distinta. En
" ' J " [.,.1971. pags. 5,6).
... '
primer lugar, debera definir, de modo tan expJicito como Ie sea posible el
., " , i ... -Observese que esta declaracion no s610 explica la finalidad de la prueba

~~":~llit5:qtinubrayael contenido. " .".., rasgo ~ue se rnedira. A continuacion, tendra que indicar las condudtas
~tfo"'f;'~~)JJ':"rr'-",T I ' : " " ' ! ! . ' - 1 " [I" ~~"r "OW::-; , a traves de las cuales se manitestara el rasgo, Es decir, que describira las
;!-:-:": :~:: . La otra consideraci6n primordial es la de la composiciony las caracte- conductas observables, las habilidades 0 las aptitudes que sean indicadoras
."."" ~ ~ -;;r,t";"'. ',:10 0 (," '" <. -:;' ' . ' ,_...'

"",~ i[~HE~tdel grupo at que se destina la prueba. En este caso, el constructor de del rasgo que se medira.
~rlCitlN,l~ p.R;l.~b,a; debe to~ar, ~n consideracion ~ariables tales co.mo la ed~d de
" . qutenes 10 tomaran, nivel intelectual, educacion, or/genes socloeconcmicos y Pruebas de predicci6n
",:, culturales y nivel de lectura. Por supuesto, las variables que seran pertinentes . Cuando se des~rrolla una prueba psicologica con fines predictivos, la
'.''.\ en' circunstancias especfficas dependeran del tipo y las finalidades de la pnmera etapa consiste en efectuar un analisis sistematico de la ejecucion
. .,v.l~~~
"nrueba.
. Por ejernplo, puesto que el SAT se disef'16 para los solicitantes a ~ue se t~~ta de predecir. En otras palabras, se Heva a cabo un analisis de
.1:lii }ngresar a las preparatorias, las universidades de E.U.A., la gran mayorfa de ~uestos . .Los resultados de ese analisis deben indicar una medida apro-
. . las personas que se someten a ella son egresados de secundaria y preparatoria, piada de cn.terio. ~ identifi~ar los rasgos y las conductas .que se necesitan
" 'de:l'(a 18 anos de edad y se han visto cxpuestos a un nucleo cornun de para que la eJeCUClOn sea satisfactoria.
~~periencia~, educativas. ASl pues, seran mas hornogeneos que la poblaci6n
. Un criterio es una medida del exito, 0 sea, la conducta que debe pre-
geit'eral en su nivel de desarrollo intelectual. Por consiguiente, los reactivos
(,'
decir .I~ ~rueba, Se debe definir 10 que constituye una ejecucion apropiada,
que figuran en la SAT estan disetlados tenlendo en cuenta la dificultad y
especificandose un Indice de exito. Por ejernplo, el exito como ensamblador
extension apropiada para este grupo especial.
de regulador~s. se puede definir como el numero de unidades ensambladas
por hora, el exito de un vendedor por su volumen de ventas, el de un alumno
CONTENIDO DE LAS PRUEBAS por e~ pro~edio de ~ali.ficaciones, etc. Una medida adecuada de criterio
debe~a medir el rendimiento apropiado y estar libre de desviaciones ten-
denciosas, '
, Para proceder a la elaboration de la prueba psicol6gica, el constructor
debeni traducir sus propositos en terminos operacionales. Es decir, que Otra de las finali~ades del analisis de puestos es identificar las conductas
d~be espeCificar las operaciones' que utilizani para 5U construcciOn. Esta y: por ende, I~s ra~gos.:~ue parezcan tener relacion con el exito en el trabajo.
,eSI;ecificaci6n cubre una vez mas dos grandes I1reas: contenido y formato. SI un empleo Implicara la instalaci6n de resortes pequei'los en el mecanismo
d~ .un relo), el con~tructor de Ia prueba podria suponer que la destreza
l..asproebas representativas dlglta! era una .capacldadpecesaria; si unos de los componentes de un empleo
i En el caso de las pruebas de rendimiento, la primera etapa consiste en fue,ra el lIevar. lnventarios, podrla suponer que uno dc, los requisitos previos
bosquejar el contenido y las habilidades que cubre la prueba. 2 Una prueba sena la capacldad ~ara la aritmetica; si el trabajo consistiera en cortar baldo-
puede cubrir los sonetos de Shakespeare, las leyes de las permutaciones, sa~ p~ra que st:. aJustar~n a superficies de pisos de formas irregulares, el
los facto res sociales y econ6micos que estuvieron a la base del auge del cnteno pnmord~al. po?na ser el de la representaci6n espacial. Despues de
partido nazi 0 los principios de construcci6n de pruebas de rendimiento. EI establecer una hlpotesls respecto a las aptitudes, las habilidades 0 los rasgos
contenido se puede especificar todav!a mas, en relaci6n a algunos materiales que se nect:slta~ para real~zar el trabajo, ci constru..:tor de Ia prueba podra
dados; por ejemplo, en un examen en las aulas, el contenido se puede definir escoger los rcaCllVOS que mldan esas &ptitudes y esas habilidades.

Los planes de Ulla prueba psicol6gica


~:~ Otto metodo altemativo, que se esta haciendo cada vez mas comun. es el de disei'lar
proebas psicologlcas para medir el alcance de una lista especificada de objetivos EI vehicu~o utilizado para especificar la amplitud de una prueba es
conductuales. Esto 10veremos en los capitulos 13 y 14. el plan de la nllsma. Este no es mas que una tabla que muestra los topicos
que se cubren y las habilidades que se mediran en la prueba, junto con la
28 Construccion de pruebas pslcologicas (Capttulo 2) Construcci6n de pruebas psico/6gicas 29
Prueba de.estadfsticas descriptivas alternativas, como en los reactivos de comparacion, elecclon multi.
" " , 1'10.
,0 'f
pie 0 verdadero y falso. En los reactiv03 de respuesta libre, el
! ' ; Conceptos <:Mculo Interpretacion
~ I
suieto proporciona una respuesta, como en cODipletamiento de
Distribuciones 10% 10% 5% frases, respuestas cortas 0 preguntas de ensayo.
'Tendenda central 10% 10% 5% 2. Pruebas de velocidad vs. pruebas de poder, En una prueba de velo-
,Variabilldad , 15% 5% 5% cidad los reactivos suelen ser muy sencillos: perc existe un tiernpo
Correlacion 15% 0% 10% limite estricto; asi, la calificacion es un indice de la velocidad de
" las respuestas. Una prueba de poder sc com pone de reactivos de
Fig. 2-2. Elemplo de plan d! prueba. dificultad variable y tiene un limite de ticrnpo que permite dar
respuesta a todos ellos. En esa forma, la calificacion refleja el
nivel de dlficultad de los reactivos a los que puede responJer el
suieto.
lmportancia relativa que se atribuye a cada categoria de contenido de
las habilidades. En 1a fig. 2-2 se da un ejernplo simple del plan de, una 3. Ejecuci6n maxima vs. eiecucten tipica. '~n las pruebas de ejecu-
.. , ,proeba para una unidad de estadistica descriptiva. Observese que las are~s cion maxima, el sujeto recibe in~trucciones de tratar de obtener
C:,h\;'~, d'e.'con'tenido que se cubren se indican en un eje, mientras que las c~p.acI- la rnejor calificacion que pueda. En las pruebas de ejecucion
dades que se miden estan en el otro. Los porcentaies dentro de las ca~ll1a~ t ipica, nos interesa conocer su comportamiento habitual 0 normal.
indican la proporcion de reactlvos de la prueba psicologica qu.e se de~lcara En general, las pruebas de rendimiento y de aptitudes son medidas
~ "cada tema. Esas proporciones deben refleiar la importancia r:lahva de de ejecucion maxima en tanto que las de personalidad, son medi-
cada area. Por supuesto, el plan de una prueba para un examen mas prolon- das de ejecucion tfpica.
gado 0 amplio tendda que ser mas extenso. 4. Papel y lapiz vs. ejecucion. Esta distincion se refiere al modo en
, E1 plan de una prueba psicol6gica sirve .para dos ~ines. En la etapa que se presentan los reactivos de una prueba y como se dan las
de' elaboracion de los reactivos, indica la cantidad y el tipo .de .ello~ ,que es respuestas. Las pruebas de eiecucion implican, con frecuencia,
la manipulacion de algun aparato u objeto.
pI rredactar
e cA s o . , se puede comparar 1a distribucion
continuacion . direal
de los reactlvos en la forma final de la prueba con las proporciones 10 rca- 5. Aplicaci6n colectiva vs, individ ual, Las pruebas colectivas sc
da~e'n el plan, para determiner si los reactivos sirven de hecho para efectuar pueden aplicar a mas de un solo individuo a la vez, por 10 que
un muestreo adecuado del universe de que se trate. suelen ser de papel y lapiz. Las pruebas individuales se pueden
aplicar solo a una persona cada vez y pueden ser de ejecucior,
o verbales.
Pruebas e~,tructuradas vs, proyectivas. En una prueba est rue-
FORMATO DE LA PRUEBA
6.
turada, se especifican con claridad los estimu'os y las tareas del
E1 constructor de una prueba debe determiner tambien el mo~o.en que
sujeto; en una prueba proyectiva, los estimulcs y las tareas son
se presentaran los reactivos. ~Utilizara una prueba de papel y lapiz o se
ambiguos. Las pruebas estructuradas frecuentemente se les llama
requerira algun tipo de aparato? ~Tendrlin que reconocer sim.~leme~t~ los
objetivas, aun cuando est a distincion se refiere, de manera mas
sujetos la respuesta correcta, como en las preguntas de elec.clOn mu1t~ple,
adecuada, a los procedimientos de caIificacion (ver las pags,
~. deberan dar la respuesta correcta por si mismos? ~Que importancia se 31-33).
concedera a la velocidad de respuesta? A continuaci6n se dan algunos de los
formatos de pruebas mas comunes. Cualquier prueba combinara varias de esas dimensiones; es dccir,
puede ser una prueba de velocidad, de papel y lapiz, utilizando reactivos
de reconocimiento. Ademas, una prueba puede incluir varios tipos diferen-
ALGUNAS DIMENSIONES COMUNES DE tes de reactivos; por ejemplo, los examenes de clase incluyen con frecuen-
FORMATOS DE PRUEBAS cia tanto preguntas de eleccion alternativa (como las de elec~ion multiple
o las de verdadero y falso) como de respuesta libre (tales como las de ensayo
o respuestas cortas).
1. Respuesta a1temativa vs. libre. En un reactivo de respuesta a1t~r
nativa, e1examinando escoge la respuesta apropiada de entre vanas
,3D Construccion de pruebas psicologtcas (Capitulo 2) Construccion de pruebas pslcologicas 31
Como en la mayoria de los casos, cualquier reactivo puede presentarse desarrolladas por los editores de pruebas comerciales. Hay grupos de especia-
'en varios fonnatos; el problema es elegir el "meior", Hay dos considera- listas, que trabajan a partir del plan de la prueba, para escribir reactivos que
ci~nes que ayudan a tomar una decision entre fonnatos posibles: las caracte- cubran las areas de contenido y habilidades que se requieren. Al principio,
risticas de sujetos que han de tomar la prueba y ciertos factores practices. se escribcn muchos mas reactivos de los que se necesitaran, debido a que
, Elpapel de la composicion del grupo examinado se puede ilustrar mediante seran nurnerosos los que se eliminen mediante los analisis sucesivos. A
ItI' " ja'practica deadrninistrar examenes orales a los niflos pequenos y las perso-
continuacion, se revisan y corrigen las primeras redacciones de las preguntas,
nas' con capacidades limitadas para la lectura, y el uso de pruebas con un tanto POI parte de los escritores originales como por otras personas. La
contenido verbal minima para las personas con deficiencias de lenguaje, Las correccion irnplica la elirninacion de la redaccion ambigua, el fortaleci-
'consideraciones practicas se ilustran mediante el empleo de reactivos de miento de las alternativas debiles y la exclusion de reactivos duplicados y,
;~l_
,'efecci6n multiple en las pruebas a nivel nacional de adrnision a las universi- par ende, inutiles.
'aa'des'donde, debido al volumen de las priiebas aplicadas el unico rnetodo
'facHble de calificarlas es el de utilizar maquinas electronicas de alta velo-
cidad. ANALISIS Y COMPROBACION DE REACTIVOS

Los reactivos que sobreviven a esta seleccion inicial se combinan, a


CONSTRUCCION DE LA PRUEBA continuacion, en una 0 mas formas de prueba previa. Estas pruebas previas
se aplican a una muestra de personas similares a las que se exarninara con la
prueba terminada. Por ejernplo, para una prucba de rendimiento, las prue-
bas previas se aplicaran a los alumnos del mismo nivel escolar y Que tengan
ELABORACION DE LOS REACfIVOS
los mismos antecedentes de informacion que requiera la prueba. 1...:1 meta
L,

" de la comprobacion previa es obtener informacion sobre como reaccionan


,L Despues de tomar esas decisiones preliminares, quien desarrolla la prue:
los aJumnos ante los reactivos. Esta prueba consistira en comentarios cuali-
,.,:~:. f1.f" l-1?a:,e~lara:listo, para comenzar a redactar! los react~vos. ?6na Ivezrmas, tendra tativos, tales como los de ambigl.iedades percibidas en los reactivos, e indices
, "varias opciones para actuar. Tomemos en consideraci n as uentes que
cuantitativos de la dificultad y el poder de discrirninacion de los reactivos .
.L' \'podrian utilizarse para desarrollar reactivos individuales. "Para un examen
.. ;."
1.'

'en ,~Iase, el maestro puede utilizar libros de texto, t~eas: de lectura, expo-
1
La dificultad de los reactivos es el porcentaje de personas que respon-
':J$idoit'es f debates en clase, como fuentes para las preguntas, En contraste, den a elias correctamente. EI conocer la dificultad de ellos es importante
ren las 'p'mehas de rendimiento desarrolladas para usarse en diversas escuelas, para que el constructor de la prueba pueda estructurar un examen de cierto
los redactores de los reactivos no toman solarnente en ,consideracion un nivel de dificuitad. Por ejernplo, se puede desear una prueba dificil si se
texto , sino varios utilizados ampliarnente; no. emplean las opiniones de un destina a seleccionar estudiantes para una educacion 0 un adiestramiento
,.",
iOl<):maestro,smo lasde una gran variedad de maestros y expertos en planes avanzado. Aunque-e] concepto de dificultad tiene sentido en el caso de que
ra~ estudios. Las preguntaso reactivos de los Inventarios de personalidad los los reactivos tenganrespuestas correctas (pruebas de ejecuci6n maxima), su
, sugleren por 10 cornun las teorfas de personalidad, los vocables y las frases significado puede no ser tan claro en reactivos en que no haya respuestas
ltiUei~e utilizan para 'descrlblr la personalidad, las declaraclones que se encuen- "correctas", tales como en las pruebas de personalidad. Sin embargo, en
'trait en loshistoriales clfnicos, las palabras que usan las personas para descri- el caso de los reactlvos de eiecucion tfpica, podemos desear cierto patron
'6Ifie a'sf mismas e incluso las preguntas 0 los reactlvos de otros inventarios de respuesta (por ejernplo, el porcentaje de acuerdo con una afirmacion).
de personalidad. EI Indice mas importante es el del poder discriminative de los reactivos,
_. > EI procesode desarrollo de buenosreactivos es la redacci6n, correcci6n, Este analisis estadistico indica la amplitud con la que el reactivo mide 10
prueba y revision, A'continuacion, se repiten estas etapas hasta desarrollar que debe medir. Idealmente debera disponerse de un criterio externo de
reactivos satisfactorios. Por ejernplo, tomemos en consideracion las pruebas medida, con el fin de que se pueda determinar empiricamente si las perso-
nas que respondieron correctamente a un reactive obtuvieron tam bien
:s Aun cuando utilizaremos el t~rmino de "redaccion de reactivos" para referirnos aI
calificaciones elevadas en el criterio. En la practica, esas medidas externas
proceso de construcclon de los reactivos de pruebas, algunos de estos (como los frecuentemente no se encuentran djsponibles. Como substituto de ellas,
que se incluyen en las pruebas de ejecuci6n) pueden tener componentes no verba- se utiliza la calificacion total en la prueba como medida de criterio y se
les y, por ende, en terminos estrictos, no se escriben ni se redactan. cornparan las respuestas a los reactivos individuates con las caiificaciones
32 Construccian de pruebas psicologicas (Capitulo 2) Construccion de pruebas psicologicas 33

,qS}" -totales, con el ~in de detennin~ si las personas q~e obtuvieron caIificaciones Despues de efectuar los cambios editoriales finales que se consideren
~ . .;ele:vadas~ ell' la'[prueba respondleron a un reactive en forma correcta con oportunos, se imprime la prueba. Ahora, por primera vez, la prueba exis-
..
i;'~\ mayor frecuencia que las que obtuvieron calificaciones mas baias, Cuando tira como entidad clara. Hasta este momenta tenemos una coleccion de
lIl..1: ~;(' ~~s.toJocurre,.se
dice que el reactivo discrimina. Observese que, en est a situa- buenos reactivos, perc no necesariamente una buena prueba. EI hecho de
'vi! .~i~nila discriminacion se refiere al hecho de efectuar distinciones entre si la prueba sera buena 0 mediocre depende de su estandarizacion y de
analisis tecnicos posteriores.
: personas que tengan conocimientos 0 habilidades mayores 0 menores en el
.,)<1 . ~~a medida por la prueba.

~r in" .j'j.')!;:fEb' las medidas de'~jecubion tfpica, el procedimiento an'Alogo detennina


id.:rSl ;'las',:re'spuesta$ estande acuerdo con las respues'tas del grupo designado ANALISIS DE LA PRUEBA
1tI r. cOmo; criterio.
1 Por ejemplo, los reactivos en ~na medida (te,ldominancia",
~: (h,', se.cornpararan con las respuestas de personas que, por algun metoda inde-
,.:,. pendiente, han side identificadas como dominantes.
EST ANDARIZACION
El tercer tipo de informacion obtenida mediante un analisis de reactivos
es el.,del" numero de. personas que seleccionan cada una de las respuestas En 13 medicion al administrar una prueba, la meta es obtener una
~~ ~~t~~~tivas'para un reactive. Las alternativas que son muy poco frecuentes estimacion tan precisa como sea posible de la ejecucion de los sujetos.
,po que.no se escogen nunca se deberan revisar, ya que no contribuyen en nada La estimacion precisa en las pruebas psicologicas, igual que en otros pro-
a fa'-', eficiencla
. "" del reactivo. cedimicntos cicnt ificos, depende del control de los errores -0 sea, de la
: :'Jor En " situaciones especiflcas, se pueden realizar otros analisis, Si la minimizacion de la intluencia de factores irrelevantes para los fines de la
prueba tiene como fln medir s610 un rasgo hornogeneo, se necesitara alguna medicion. Esto se logra, haciendo que la situacion de prueba sea 10 mas
medida de las interrelaciones entre los reactivos. a bien, si es importante sernejante posible para todos los individuos,
la velocidad, se podra hacer un analisis de los efectos de diversos limites de EI proceso de desarrollo de esos con troles se denornina estandarizaci6n .
.~empo~, "~I Este terrnino tiene distintos significados para los diferentes autores. Todos
, Puesto que los analisis estadisticos derivados de diferentes muestras estan de acuerdo en que la estandarizaci6n implica que a cada sujeto le sean
varian debido a los errores de muestreo, los analisis de reactivos se llevan a presentados IuS mismos reactivos (0 equivalentes) y que existan reglas
cabo, con .frecuencia en .dos muestras independientes. Este proceso, deno- especificas para la administraclon y la calificacion de la prueba. Otros
)\I'~ ,\,minado de ,validaci6n cruzada, nace que se reduzcan las probabilidades de autores ai'laden el requisito de que se disponga de normas de ejecucion. La
". i' ".tomar decisiones basadas en procedimientos estadfsticos que retlejen solo definicion de estandarizacion que adoptamos en este libro incluye solo la
.las fluctuaciones aleatorias, en lugar de las verdaderas diferencias, necesidad de un contenido de reactivos comun y procedimientos estandar
,:~:. ',i . , J
de administracion y calificacion. En otras palabras, la estandarizaciori se
referira a los procedirnientos para obtener calificaciones y no a los requisi-
ENSAMBLAJE DE LA PRUEBA tos necesarios para interpretar los datos."

La etapa que sigue es la de preparar la 0 las fonnas finales de la prueba. Contenido


Los, resultados de los analisls de reactivos se utilizan para seleccionar los EI primer elemento esencial es el conjunto de reactivos cornunes que
reactivos que proporcionen la mejor discriminaci6n, tengan la dificultad se aplican a todos los sujetos que se someten a la prueba, A menos que se
apropiada y no posean ambiguedades ni alternativas deficientes. Esta selec- pruebe a todas las personas utilizando reactivos iguales (0 equivalentes),
cion requiere equilibrio y ajuste reciproco, puesto que quiza sea necesario no sera posible comparar directamente su ejecucion, ya que los resultados
~.c~:uir.menos reactivos, discriminativos para asegurar el balance conveniente se basaran en diferentes muestras de reactivos. Debido a que gran parte
~!lV ,~n,. el contenido.. Si se construyen fonnas equivalentes de la prueba, el
constructor tendra a su cargo la tarea adicional de equiparar las form as en 4 Aunque cualquier prueba que satisfaga estos criterios se podra considerar como una
terminos de contenido, dificultad y poder de discriminacion, asf como "prucba estandarizada", cste ultimo tcrrnino se refiere For 10 cornun a las pruebas
publicadas comercialmente que esten estandarizadas 'j, adernas, pronorcionan datos
tarnbien en fun cion de otras dimensiones pertinentes.
normativos,
34 Construccion de pruebas psicologicas (Capttuio 2) Construccion de pruebas psicologicas 35

de, la exposicion anterior se ha centrado en el modo en que se desarrolla


A. Indicaciones para un examen en el salon de clase (resctivos de elec-
este conjunto estandar de reactivos, no parece necesario hacer comentarios cion multiple).
adicionales al respecto. Seleccionen la alternativa correcta para cada reactivo y marquen
Aplicaci6n
su letra en el lugar apropiado de la hoja de respuestas.
Aun cuando se aplicaron los mismos reactivos a todos los sujetos, las B. Direcciones para una prueba de aptitudes.
calificaciones no sedan comparables a men os que se aplicaran en las mismas
condiciones. Por supuesto, la comparabilidad total es imposible, debido
a que una prueba se aplicara a diferentes personas, en diversos tiempos y 1. VOCABULARIO
Jugares y por diferentes examinadores. Sil!. embargo, es posible eliminar
gran parte de la variabilidad extrana, utilizando instrucciones prescritas Cada palabra de prueba, en mayusculas, va seguids por cmco respuestas posibles,
para la aplicaci6n de las pruebas, limites de tiempo estandar y metodos La respuesta correcta es la palabra que signlfique casi exactamente 10 mismo que la
palabra de.la prueba. Haga una linea Ilena con el lapiz en el espacio que queda entre
objetivos de calificacion. el par de lineas de puntos, a la derecha, que corresponda a la respuesta correcta. Ejemplo:
Por 10 comun se requieren dos conjuntos de instrucciones: uno para
quien se sornete a la prueba y otro para quien la aplica. En el primero se Frecuente: A) siempre B) a menudo A B r: 0 E
C) nunca D) muy E) pronto
!kn" debeexplicar, en forma tan clara y simple como resulte posible, el modo .. I .. ..
eli que el sujeto debe responder a los reactivos. Esas instrucclones se irnpri- "A ~enudo" es 10 que mas se acerca en significado a "frecuente", por 10 que se trazo
men at comienzo de la prueba," de preferencia en una pagina separada, Y una linea continua entre las lineas de puntos de la derecha, bajo la B.
pueden ir desde las instrucciones mas simples, de una sola frase para los
examenes en el salon de clase hasta las clausulas mas cornplejas sobre exarne- Marquen una respuesta para cada palabra. Si no conccen el significado de una palabra
hagan la mejor eleccion que puedan. '
nes estandarizados (ver la fig. 2-3). Las indicaciones dadas a los sujetos
I" deben indicar .el modo en que se elegira una respuesta, como marcarla Dispondran de tres minutes para completar esta prueba,
(por ejernplo, en el librito de la prueba 0 en una hoja de respuestas por
separado) y los limites de tiempo. En muchas pruebas, las instrucciones
lncluiran tarnbien una indicacion relativa a como responder cuando no se NO DEN VUELTA A LA PAGINA HASTA QUE SE LES
,.este~.seguro. Por 10 cornun, es conveniente tambien incluir varios reactivos INDIQUE QUE LO HAGAN
'!-;>o ~. de muestra. La inclusi6n de estos ultlmos es esencial, cuando el formato
sea desconocido para los suietos.
Fig. 2-3. Ejemplo de las direcciunes de prvebas.
" Las indicaciones para quien aplica la prueba se imprimen en un manual
por separado. Estas direcciones incluyen las que se dan at sujeto, con una
explicacion mas amplia sobre sus derivaciones. Estas instrucciones incluyen La mayoria de':las medidas de eiecucion tfpica se administran sin limite
tam bien detalles sobre aspectos tales como la disposici6n del salon de exa- d.e tiempo; sin embargo, cuando se mide rendimiento 0 aptitudes, la velo-
menes, la distribucion de rnateriales, el registro del tiempo y de las califica- cldad. s~ele ser un fa~tor importante. Se puede establecer un continuo para
ciones. Tambien se deberan dar instrucciones sobre como manejar los d.e,scnblr las pruebas, b~sado en el papel que juega la velocidad en la ejecu-
problemas y las preguntas que se presenten durante la sesi6n de examen. cl~n. Por un lado existen pruebas estrictamente depoder en los que al
Uno de los aspectos preponderantes de cualquier procedimiento de sujeto se Ie da tiempo ilimitado para responder a reactivos presentados en
medici6n es el de los lfrnites de tiempo. En muchos casos, dichos limites se orden creciente de dificultad. Por consiguiente, las calificaciones indican
deb~n en parte a restricciones practices, tales como la duracion de los perfo-
el nurnero de reactivos a las que se respondio de manera correcta 0 bien
.n':H1,i ,aBS-de 'clase, No 'obstante, es preferible que los lfrnltes de tiempo esten
dicho de otro modo, el nivel de dificultad alcanzado. Por otro lado 5~
:r' detenninados por consideraciones psicometricas y las finalidades de la encuentr~n las prueba~ de limite de tiempo 0 velocidad. En las pruebas
~''''. ,'p'tiieba m i s m a . . de velocidad, los reactivos son tan sencillos que cualquiera pueda respon-

s 51 una prueba tiene varias s~cciones (subpruebas) que requieren diferentes indica- De E. E. Cureton y sus colaboradores, The Multi-Aptitude Test, Nueva York: The
clones, se deberan incluir lineamientos separados at comienzo de cada secclon. Psychological Corporation, 1955.
J6 Construccion de pruebas psicologtcas (Capttulo 2) Construccion de pruebas psicologicas 37
" ;~\ ~~,rlps con facilidad, en el caso de que cuente con un tiempo suficiente
. para ello; sin embargo, se establecen lfmites de tiempo para que sean pocas CRITERIOS DE CALIFICACION Y EJEMPLOS DE
personas, las que puedan concluir la prueba, en el caso de que haya alguna. RESPUESTAS: VOCABULARIO
En ese caso, las calificaciones reflejan diferencias en la velocidad de res-
puestas y no en la dificultad. . En general, es aceptable cualquier significado reconocido de la palabra,
sin tomar en cuenta la elegancia de la expresion. Sin embargo, la pobreza
La mayoria de las pruebas caen entre esos dos extremos. Una buena. de contenido se castiga hasta cierto punto; la indicacion de que se tienen
regia practica, que se utiliza con frecuencia en las pruebas de rendimiento y
conocimientos vagos del sentido de la palabra no permite obtener la maxima
aptitudes, es establecer limites de tiempo que permitan que aproximada-
calificacion, Las respuestas a las palabras 1-3 se califican con 2 6 0, mien-
mente 90% de los sujetos concluyan en el tiernpo permitido. Adernas, si
tras que todas las dernas se califican con 2, I 6 O. Damos a continuaci6n
'isei,disponen .105 reactivos en orden de dificultad creciente, la mayor ia de
principios generales para calificar las respuestas a los reactivos del voca-
!~~.,Jlers6nas podran completar todos aquellos a los que puedan responder de bulario.
~d a,Pl"(\anera:.correcta. Las ventajas administrativas de este procedimiento son
evidentes. 2 Puntos

Cali1icaciones I. Un buen sin6nimo.


. EI tercer elernento de la estandarizacion es el de las calificaciones 2. Un u'~o importante .
objetivas. La objetivldad implica un acuerdo entre dos 0 mas calificadores 3. Una 0 mas caracterfsticas primarias 0 definitivas.
at { .competentes (preparados), De modo ideal, el acuerdo entre diferentes 4 Clasificacion general a la que pertenece la palabra.
callflcadores tiene que ser perfecto. En la practica, sobre todo en el caso 5. Varias caracterfsticas descriptivas correctas que no son precisa-
de-reactivos de respuestas libres, dicho acuerdo sera mucho menos completo. mente definitivas pero que indiquen acumulativamente la
Una regia empirica consiste en considerar la calificaci6n como objetiva cornprension de la palabra.
,: ~'" slel acuerdo promedio entre pares de calificadores competentes es de 90% 6. Para los verbos, un ejernplo definido de la accion 0 relacion
'~nlo(mas, S610 en el caso de que la calificacion sea objetiva se podran atribuir
causaL
-:.~ ... [as, diferencias entre las calificaciones a las diferencias existentes entre los
tlr5l\t.sujetos exarninados,' '.' z ' : ',. , .
Punto
c. ,. " , j _ . .
~*I'..l'..!..-L~Un: cuando se dispone de una gran cantidad de tecnicas de cali fica- I. Una respuesta que no sea incorrecta; pero que tenga pobreza de
~~tr'Ci6t\;lde'sdemanualeshasta las que utilizan maquinas califlcadoras electro- contenido. .
1.'::1.'" nieas de alta velocldad, los requerimientos de la ::calificici6n objetiva se 2. Un sinonimo vago 0 inexacto.
, , pueden reducir a tres etapas baslcas. La primera es la del registro inmediato 3. Un uso menor, poco desarrollado 0 mal explicado.
ycarente de arnbiguedades de la respuesta. Tanto si el sujeto efectua una 4. ~tributos,que sean correctos: pero que no scan deflnitivos 0 no
mlirCa en tina hoia de respuesta IBM, como si escribe una letra, una palabra, incluyan caracteristicas distintivas,
un numero, una frase 0 un ensayo, 0 responde en forma oral, su respuesta 5. Un ejernplo en el que se utilice la palabra rnisma, sin desarrollo.
se ;registrara de manera inmediata y completa. Este registro perrnanente 6. ~efinici6~, ~o.rr:~ta de una forma relacionada de la palabra; por
evita las distorsiones posibles debidas a perdldas de la memoria y propor- ejernplo, pnsa en lugar de "apresurado"; "obstruccion" en
.;<u; ciona.las bases para Ia clasiflcacion de las respuestas. lugar de "obstruido" .
-f", "). : P: . - I.

EI segundo requisito es una Iista de respuestasestandar 0 correctas o Puntos


I" osea, u~a clave d~. califlcacien, Para un examen deelecciones multiples,
esta clave tiene que incluir el numero 0 la letra de la respuesta correcta I. Respuestas claramente erroneas.
acada pregunta; para los reactivos de respuestas cortas se tratara de una 2. Verbalismos; por ejernplo, "Reparar un automovil", cuando la
Iista de las respuestas correctas y las variaciones aceptables; para un ensayo, encuesta demuestre que no hay una comprension real.
se da un bosquejo de los puntos que se deben tocar. En el caso de un inven-
tario de la personalidad, la clave designata las respuestas que indiquen la
presencia (Q la ausencia) del rasgo 0 la caracterfstica que se mida. Si res- Fig. 2-4. Ejemplo de un manual de califi~acione.: Escala de inteligencia de Wechsler
para adultos (WAIS).
38 Construccion de pruebas pstcologicas (Capitulo 2)
Construccton de pruebas psicologtcas 39
3. Las-respuestas con una gran pobreza de contenido 0 que sean puestas diferentes reciben pesos diferentes, estos pesos deberan indicarse
muy vagas, incluso despues de hacer preguntas al respecto. en la clave.
Para los reactivos especfficos, se muestra un criterio general de califica- EI tercer requisito es un procedimiento para comparar las respuestas
ci6n para cada palabra, al nivel de 2 puntos, dando a continuaci6n varios dadas por el sujeto con las que figuran en la clave esto es, un procedimiento
ejemplos de respuestas. En algunos casos, se da un criterio general para las para c1asificar objetivamente las respuestas. En los reactivos de elecci6n
calificaciones de I punto y 0 puntos, con varios ejernplos. Para otros reacti- alternativa, tales como los de elecciones multiples, este procedimiento es
vos no hay una generalizaci6n apropiada a los niveles de credito que van mas directo y evidente, Cuando el buen juicio del calificador puede ser uno de
al!Ade los proporcionados por los criterios generales de calificaci6n y s610 los factores irnportantes, como sucede al calificar exarnenes de ensayos,
sei dan ejernplos de respuestas, Por supuestoj- esaslistas contienen s610 unas
o

n: ' es preciso desarroIIar indicaciones detalladas para la asignacion de las califi-


cuantas de las numerosas respuestas que son posibles 0 que puedan dar los caciones. En el manual de (WAIS) Escala de Inteligcncia Wechsler para
sujetos. No obstante, tienen como finalidad complementar las definiciones Adultos (ver la fig. 2-4), se da un ejernplo excelente de especificaciones
dadas en los diccionarios y los principios generales de calificaci6n, de tal para la calificacion. Este manual de calificaciones proporciona ilustra-
modo que se facilite la tarea de calificar la prueba con exactitud. ciones de las respuestas aceptables y las variaciones permitidas. EI califi-
cador cornpara las respuestas dadas por un individuo con los ejernplos
proporcionados en el manual de calificaciones y, a continuaclon, asigna
EJEMPLOS DE RESPUESTAS; VOCABULARIO* a cada respuesta la calificacion de la respuesra muestra que mas se acerque.
Aun cuanJo este procedimiento no asegura un acuerdo perfecto en tre los
1. Silla calificadores, logra que la calificaci6n sea objetiva .
.? puntas - un mueble para sentarse: asiento
sentarse... scntarse para comer
1 punta - mueble hecho de madera AN A.L1SIS PSICOMETRICO
opuntas - asentarse... objeto suave... estar en una reuni6n
La apucacion de los procedirnientos analiz ados antes, solo asegurara
2. Enero una cosa: que la calificacion dada a un individuo rcfleje sus capacidades
2 puntas - primer mes del ano o sus caractcr isticas de pel sonalidad , y no las peculiaridades 0 las vicisitudcs
un meso .. el primer meso .. un mes de invierno frio de la situacion de prueba. No proporcionan Una respuesta para las preguntas
1 punta - despues de diciembre... comienza el afio... Afio Nuevo irnportantes como: i.hasta que punta son consistentes las calificaciones de
es el 1 de enero la prueba? ;,Que es 10 que rnide la prueba? i.Que inf'erencia se puedc sacar
opuntos - un dios romano de las calificaciones de la prueba? i.Como se pueden interpretar las califica-
ciones de la prueba? A estas preguntas sole se pucde dar una respuesta
3. Construcci6n mediante un analisis adicional, del que nos ocuparernos brevemente a conti-
nuacion, Sin embargo, la importancia se indica por el espacio que sc II.:
2 puntos - edificar 0 constituir algo; algo edificado sistematica-
dcdica en cap itulos posteriores de este libro, y no por e l enfasis que hacernos
mente construir... erigir algo.. unir mediante un plan aqui.
1 punto - construir un edificio... hacer... procesar una casa
opuntos - dividir... apretar, reunir... utll Confiabilidad
A menos que una prucba proporcione medidas consistentes, se podra
Fig. 2-4. Ejemplo de un manual de calificaciones: Escala de inteligencia de Wechsler tener muy poca fe en la exactitud de sus calificacione s Es decir un indivi-
para adultos (WAIS) (cont.l. duo debera obtener, aproxirnadamente, las misrnas calificaciones en cada
aplicacion de una prueba. Sin consistencia, estas mcdiciones Son analoga
Para preservar la seguridad del WAIS, no se utilizaron los reactivos reales. Los vocablos a la medicion de distancias con una regla de caucho. Se obtendrian resulta-
hipoteticos ernpleados son similares a los reales de la subprueba de vocabulario y el dos difercntes en cada ocasi6n (medtclon). depcnd ier.do de 10 que se estirnru
fonnato del manual de calificaclones es identico aI del manual del WAIS. Reproducida la regia. .
con autorizacion, Copyright 1955 by the Psychological Corporation, Nueva York,
N.Y. Derechos reservados,
Construccion de pruebas psicologicas 41
40 Construccion de pruebas psicologicas , (Capttulo 2)

La estimacion del grado de consistencia de una medicion, 10 que se Hemos indicado ya que para que la prueba se pueda aplicar a mas de
conoce como confiabilidad de la prueba, requiere ya sea la aplicacion de un grupo se necesitaran datos normativos para cada g~po, puesto que
, ., . A' . m es precise obrener datos
la prueba dos veces, la aplicaci6n de formas equivalentes de la prueba 0 el todos tendran vartaciones entre S1. SI mlS 0., . : .
analisis de su estructura interna. En la practica, esto significa que el cons- adicionales de validez y confiabilidad, puesto que una prueba que es valida
tructor debe obtener una muestra representativa de sujetos, aplicar uno de (0 confiable) en una situacion , no 10 sera necesari~~ente en otra: aun~lue
los procedimientos mencionados y calcular un coeficiente de confiabiIidad. sea muy similar. Por ende, la reunion de [nformacion ~~bre u~la prueba es
Puesto que hay diferentes tipos de confiabilidad, apropiados en situaciones un proceso continue, que se debe seguir en tanto se utilice el ll1strumento.
diferentes, el constructor de la prueba debera reunir varios tipos de pruebas
de confiabilidad en diversas muestras (ver los capftulos 5 y 6).
" o
Validez
La caracteristica mas importante de una prueba es su validez -0 sea,
la extension con la que la prueba debe medir. Sin pruebas de la validez
de una prueba no sabremos 10 que mide en realidad; asi, no sera posible
interpretar 0 dar un significado a las calificaciones.
Puesto que los reactivos que constituyen la prueba se seleccionaron
parcialmente sobre la base de su poder discriminative, tendrernos la segur i-
dad de que las calificaciones tendran cierta validez. Sin embargo, puesto
que la prueba como un total puede ser algo mas que una suma de sus partes
(los reactivos), es necesario reunir datos de validez, utilizando la prueba
en su forma final. Esto significa que es preciso utilizar la prueba en varias
situaciones, en una gran varied ad de grupos y determinando su eficacia
(ver los capitulos 7 y 8). Puesto que la validez es una situacion especifica,
la recopilacion de los datos de validez es esencialmente un proceso inter-
minable. La obligaci6n del constructor de la prueba es la de proporcionar
datos suficientes para saber que caracteristicas mide y que criterios predice

Datos normativos
Los resultados de las pruebas tienen por si mismos poco significado.
S610 alcanzan un significado cuando se compara una calificaci6n individual
con los resultados obtenidos por otras personas en la misrna prueba, Al
comparar las calificaciones de un individuo con las de otras personas en una
. poblaci6n especificada (que se llama grupo normative), obtenemos una
indicaci6n de su desernpefio relativo en cornparacion al de otros de la misma
poblaci6n. Asi, el constructor de la prueba puede reunir datos que muestran
el desempeno de un grupo pertinente de personas. Puesto que, en la mayorfa
de los casas, deseamos cornparar las calificaciones de los individuos con las
de varies grupos diferentes, el que desarrolla la prueba debe proporcionar
datos utiles para varios grupos normativos. Por otra parte, puesto que las
calificaciones en las pruebas psicologicas se expresan por 10 cornun en escalas
que no son de calificaciones brutas, el constructor de la prueba debe desarro-
lIar tam bien escalas apropiadas para cxpresar las calificaciones (ver los capf-
tulos 10 y 1 I).

Вам также может понравиться