Вы находитесь на странице: 1из 24

Pruebas y

evaluacin
psicolgicas
RESUMEN
JUAN ALBERTO FLORES BANDERAS
MATERIA: PRUEBAS EN LA ADULTEZ

Captulo 1: Pruebas y evaluacin psicolgica


Pruebas y evaluacin
A manera de introduccin, se describe un poco la historia del surgimiento de
las pruebas psicolgicas, cmo es que en 1905 Alfred Binet y un colega suyo,
publican una prueba diseada para asignar el grado escolar apropiado para
nios parisinos. Esta prueba lleg a ser tan importante que se utiliz una
versin en ingls para el estudiantado norteamericano.
Posteriormente, en 1917, tras el inicio de la primera guerra mundial, surgi la
necesidad de evaluar rpidamente reclutas para descartar problemas
intelectuales y emocionales. Son las pruebas psicolgicas las que aportan la
metodologa necesaria para lograr esos objetivos.
Definicin
Hay una seria distincin entre los conceptos Evaluacin psicolgica y Pruebas
psicolgicas.

Evaluacin psicolgica se define como la recoleccin e integracin de


datos relacionados con la psique individual con el propsito de hacer una
evaluacin psicolgica, concretada mediante el uso de herramientas
como pruebas, entrevistas, estudio de caso, observacin conductual, as
como equipo y procedimientos diseados especficamente para la
medicin de esta.
Pruebas psicolgicas se define como el proceso para medir variables
relacionadas con la psique mediante instrumentos o procedimientos
diseados para obtener rasgos de comportamientos definidos como
conductas.

Para poder comenzar con el proceso de evaluacin, debe haber una sugerencia
previa proveniente de profesores, psiclogos escolares, consejeros, jueces,
mdicos o analistas de R.H. Posteriormente se reunir con el evaluado o
aquellos involucrados con l, para indagar los motivos para elaborar la
evaluacin. La evaluacin se apoyar por los datos recolectados previamente
(historia clnica o de desarrollo), las entrevistas y las herramientas a utilizar
como son las pruebas.
La relacin que se establece entre evaluador y evaluado, puede verse de 3
maneras diferentes segn distintos autores.

Evaluacin psicolgica colaborativa: Propuesta por Constance


Fischer (1978) El evaluador y evaluado, pueden trabajar como socios
desde el contacto inicial hasta la retroalimentacin final. En este enfoque
se considera al evaluado como un experto en sus perspectivas actuales
y los eventos que recuerda de su vida (Fischer,2014)
Stephen Finn y sus colegas, Describen la Evaluacin psicolgica
teraputica, que consiste en promover un autodescubrimiento
teraputico y lograr una mayor comprensin de determinados aspectos
de la conducta a travs del proceso de evaluacin.

Evaluacin psicolgica dinmica: que es un modelo y filosofa que


implica diversos tipos de intervencin por parte del evaluador durante el
proceso de la evaluacin. intervenciones como son sugerencias,
retroalimentacin o consejos explcitos, esto se utiliza para acercar al
evaluado hacia el problema por lo cual fue referido.

Debido a las enmiendas hechas a la declaracin de los individuos con


discapacidades educativas (IDEA), se introduce el trmino evaluaciones
alternativas, el cual menciona que se deben elaborar guas para la
participacin de nios con capacidades diferentes en evaluaciones alternativas.
Se define a este concepto como un proceso o procedimiento de evaluacin o
de diagnstico que vara en la forma de aplicacin usual, normativa o
estandarizada para obtener una medicin, ya sea en virtud de una adecuacin
determinada hecha para el evaluado, o con mtodos alternativos diseados
para medir las mismas variables.
Herramientas de la evaluacin psicolgica
La prueba: Instrumento o procedimiento de medicin. Cuando la palabra
prueba est acompaada por un modificador, se refiere a un instrumento o
procedimiento diseado para medir una variable relacionada con ese
modificador.
Prueba psicolgica: instrumento o procedimiento diseado para medir
variables relacionadas con la psicologa, por ejemplo: inteligencia,
personalidad, aptitudes, intereses, actitudes y valores. Las pruebas
psicolgicas y otras herramientas de evaluacin pueden diferir en un
gran nmero de variables como contenido, forma, procedimientos de
aplicacin, puntuacin, contextos de interpretacin y calidad de tems.
La entrevista: Una entrevista psicolgica, va ms all de una simple
pltica y tiende a ahondar mucho ms en el entrevistado. Es una
relacin directa entre dos o ms personas, que pretende establecer los
requerimientos de la interaccin personal. Las entrevistas difieren con
respecto a muchas variables como son su propsito, extensin y otras
restricciones bajo las cuales son conducidas, as como la disposicin por
parte del entrevistado de proporcionar informacin de una manera
abierta y directa. Las entrevistas pueden ser usadas por psiclogos y
otros especialistas en escenarios clnicos, de consejera, forenses y
neuropsicolgicos para ayudar a la toma de decisiones sobre lo
apropiado que resultaran las intervenciones educativas; en R.H ayudan
a la recomendacin sobre la contratacin, el despido y el desarrollo
organizacional del personal.
El portafolio: consiste en una muestra de trabajo, recopilacin de
actividades realizadas por el evaluado concernientes al rea a evaluar.
Datos de historia de caso: Se refiere a registros, transcripciones y
otros instrumentos escritos, pictricos o de otra forma y en cualquier
medio, que preserve la informacin de archivos, registros formales e
informados y otros datos y documentos importantes en relacin al
evaluado. Estos datos pueden incluir archivos o extractos de archivos

que se conservan en instituciones y agencias tales como escuelas,


hospitales, empleos, instituciones religiosas y agencias de justicia
criminal, entre otros. Estos datos pueden ser una herramienta de gran
utilidad en una amplia variedad de contextos de evaluacin.
Observacin conductual: para saber cmo se comporta alguien en
una situacin particular, es necesario observar su comportamiento en
esta situacin. Se puede definir como el monitoreo de las acciones de
otros y de uno mismo a travs de medios electrnicos y visuales,
mientras se registrar la informacin cuantitativa y/o cualitativa con
respecto a dichas acciones. Se utiliza para disear intervenciones
teraputicas.
Pruebas de representacin de papeles: que consiste en actuacin
de un papel improvisado o en parte improvisado en una situacin
simulada.
Las computadoras como herramientas: Evaluacin psicolgica
asistida por computadora (CAPA) se refiere a la convivencia y economa
de tiempo al administrar, calificar e interpretar pruebas.
Partes involucradas
El desarrollador de pruebas: Quienes, junto con los editores, crean pruebas
y otros mtodos de evaluacin.
El usuario de las pruebas: Son utilizadas por un amplio rango de
profesionales, incluidos los profesionales clnicos, los consejeros, el personal de
R.H profesores y personal escolar.
El evaluado: los evaluados tienen diferentes aproximaciones a la situacin de
evaluacin, y los usuarios o aplicadores, deben ser sensibles ante la diversidad
de respuestas posibles ante dicha evaluacin. Cualquier persona puede ocupar
el papel de evaluado, incluso un individuo que ha fallecido. En este caso, se
utiliza el trmino autopsia psicolgica, que se define como una reconstruccin
del perfil psicolgico del individuo fallecido con base en registros de archivos,
artefactos y entrevistas conducidas con anterioridad con el evaluado o con
gente que conoci.
Escenarios
Escenarios educativos: en este escenario se ayudar al estudiante, por
medio de pruebas, a identificar quien necesita un nuevo o diferente grado
escolar o adecuaciones curriculares.
Escenarios Geritricos: las pruebas se aplican para establecer el
funcionamiento cognitivo, psicolgico, adaptativo y algn otro, relacionado con
su desempeo general.
Escenarios de consejera: Ocurre en ambientes tan diversos como escuelas,
prisiones o instituciones de carcter privado o pblico. El objetivo de esas
evaluaciones es el mejor desempeo del evaluado, en trminos de adaptacin,
productividad, calidad de vida o alguna variable relacionada.

Escenarios clnicos: las pruebas y muchas otras herramientas de evaluacin


son usadas en escenarios clnicos como hospitales pblicos privados y
militares, clnicas de pacientes internos y externos, consultorios de practica
privadas, escuelas y otras instituciones.
Escenarios militares y de negocios: en los negocios as como en el ejrcito,
a las pruebas psicolgicas se les conceden diversos usos, tal vez de manera
ms notable es aquel para la toma de decisiones sobre las carreras del
personal. Otra aplicacin de las pruebas psicolgicas implica la ingeniera y el
diseo de productos y ambientes.
Credencializacin gubernamental u organizacional: En este caso, una de
las aplicaciones de la medicin se encuentra en la obtencin de licencias y
permisos gubernamentales, la certificacin o la credencializacin general de los
profesionales.

Captulo 2: Consideraciones histricas, culturales y tico/legales


Perspectiva histrica
De la antigedad al siglo XIX
Una forma primitiva de pruebas de destreza existi en China en el ao 2200
a.C. en donde el emperador chino conduca un programa de pruebas que
implicaban alguna forma de examen para los funcionarios pblicos cada tercer
ao.
Hasta el Renacimiento comenz a surgir la medicin en las ciencias
conductuales, tal y como la reconocemos en la actualidad. Para el siglo XVIII,
Christian von Wolff haba anticipado que la psicologa pudiese ser una ciencia,
y concibi a la medicin psicolgica como un rea de especializacin dentro de
esa ciencia. El significado histrico del programa de pruebas en la antigua
China es que hace miles de aos existi una civilizacin que mostro evidencias
de una preocupacin por algunos de los mismos principios de la psicometra
que interesan y se manejan en la actualidad.
El siglo XIX
La evaluacin fue una actividad importante en el primer laboratorio de
psicologa experimental, fundado en la universidad de Leipzig en Alemania por
Wilhem Max Wund. Uno de los estudiantes de Wund llamado James McKeen
Cattel se puso en contacto con Francis Galton y despus de su contacto se
inspir y acu el trmino prueba mental en una publicacin de 1890.
Otros estudiantes de Wund incluyen a Spearman (creador del concepto
psicomtrico de la confiabilidad de la prueba y la construccin de marco para
el anlisis de factores), Henri (colabor con Binet), Kraepelin (uno de los
primeros en experimentar con la tcnica de la libre asociacin de palabras),
Titchener, Stanley Hall y Witmer (conocido como el fundador no muy
conocido de la psicologa clnica; fund

La primera clnica psicolgica en USA en la Universidad de Pensilvania; y en


1907, fund la revista Psychological Clinic con el primer artculo titulado
Clinical Psychology)
El siglo XX
La medicin de la inteligencia
Binet y Henri publican varios artculos en los que abogan por la medicin de
capacidades. Diez aos ms tarde Theodore Simon publican una escala de
medicin de inteligencia de 30 reactivos para identificar a nios en edad
escolar con deficiencia mental.
En 1939, David Wechsler introdujo la prueba WAIS, diseada para medir la
inteligencia de los adultos.
Las pruebas de inteligencia grupales aparecieron en USA, en respuesta a la
necesidad del ejrcito de explorar la capacidad intelectual de los reclutas.
La medicin de la personalidad
Al Comit sobre Salud Emocional del gobierno, presidido por el psiclogo
Robert S. Woodworth, se le asign la tarea de elaborar una medida de
adaptacin y estabilidad emocional que pudiera administrarse de manera
rpida y eficaz a grupos de reclutas. El cuestionario fue denominado Hoja de
datos personales, donde se les peda que indicaran s o no a una serie de
preguntas.
Despus de la guerra, Woodworth elabor una prueba de personalidad para
uso civil basada en la Hoja de datos personales y la llam Inventario
psiconeurtico de Woodworth. Fue la primera prueba de personalidad basada
en un informe personal, usada en forma extensa.
Otro mtodo para evaluar se describi como de naturaleza proyectiva. La
prueba proyectiva es aquella en la que se asume que un Individuo proyecta
en algn estmulo ambiguo sus propias e individuales necesidades, temores,
esperanzas y motivaciones.
Quiz la prueba proyectiva ms conocida es la de Rorschach, que consiste en
una serie de manchas de tinta, elaborada por el psiquiatra suizo Herman
Rorschach.
Cultura y evaluacin
La comunicacin entre evaluado y el evaluador es una de las partes
fundamentales de la evaluacin. Los evaluadores deben ser sensibles a
cualquier diferencia entre el vocabulario o el idioma que le sean familiares a los
evaluados y el lenguaje en que se conduce la evaluacin. Los evaluadores
tambin deben ser sensibles al grado en que los evaluados hayan sido
expuestos a la cultura dominante y el grado en que hayan elegido
conscientemente ser parte de sta.

Comunicacin verbal: El lenguaje, el medio por el cual se comunica


informacin es una variable clave, aunque a veces se ha pasado por alto en el
proceso de evaluacin. Es obvio que el examinador y el examinado deben
hablar el mismo idioma.
Comunicacin no verbal y conducta: Expresiones faciales, seas con los
dedos y las manos adems de cambios en la posicin o postura corporal del
individuo pueden transmitir mensajes. Los mensajes transmitidos por este
medio, pueden variar de una cultura a otra.
Consideraciones legales y ticas
En la medida en que es reconocido y aceptado un cdigo de tica profesional
por los miembros de una profesin, se definen las normas de cuidado
esperadas por los miembros de esa profesin.
Las preocupaciones del pblico
Anticipndose a los estndares de la actualidad, Ruch propuso varias normas y
lineamientos para el desarrollo de pruebas. Tambin escribi sobre la
necesidad urgente de crear un organismo de investigacin que emprendera
evaluaciones imparciales, experimentales y estadsticas de las pruebas.
Legislacin
El objetivo principal de la legislacin sobre la verdad en las pruebas es
proporcionar a quienes responden las pruebas un medio para conocer los
criterios contra los que se les est comparando.
La preocupacin de la profesin
En 1954, la APA public sus Technical Recommendations for
Psychological Test and Diagnostic Test, un documento que enunciaba
normas de pruebas y recomendaciones tcnicas.
Caractersticas de usuario de pruebas: En 1950 el Comit sobre Normas ticas
para la Psicologa de la APA public un reporte llamado Ethical Standards for
the Psychological Test and Diagnistic Aids, que defini 3 niveles de
pruebas en funcin del grado en el que su uso y aplicacin requiere
conocimiento de las tcnicas de aplicacin especficas para cada una, as como
de materias relacionadas con la psicologa.
En 1993, se fund el Consejo Estadounidense de Psicologa de la Evaluacin
(ABAP) con el objetivo de identificar a los psiclogos de la evaluacin ms
competentes.
Evaluando a personas con discapacidades se pueden presentar dificultades
como transformar la prueba, transformar las respuestas e interpretar de
manera significativa los datos de las pruebas.
Administracin, calificacin e interpretacin de pruebas por medio de
computadora: Un nmero cada vez mayor de pruebas psicolgicas pueden

adquirirse en disco y su administracin, calificacin e interpretacin son tan


simples como oprimir un teclado.
Algunos aspectos importantes respecto a CAPA son:

Acceso al software de la administracin, calificacin e interpretacin de


la prueba
Comparacin de la versin escrita y computarizada de la prueba.
El valor de las interpretaciones de las pruebas por computadora
Pruebas psicolgicas poco profesionales, irregulares y el lnea.

Los derechos de los evaluados


Como lo prescriben las normas, y en algunos casos las leyes, algunos de los
derechos que los administradores de pruebas conceden a quienes responden
son el derecho a dar su consentimiento informado para la prueba, el
derecho a ser informado de los resultados, el derecho a su privacidad y
confidencialidad y el derecho a la clasificacin menos estigmatizadora.

Captulo 3: Un repaso de estadstica


Escalas de medicin
Medicin: se define como el acto de asignar nmeros o smbolos a
caractersticas de los objetos (personas, eventos o lo que sea) de acuerdo a
ciertas reglas. Las reglas usadas al asignar nmeros son lineamientos para
representar la magnitud (o alguna otra caracterstica) del objeto que se mide.
Ejemplo: asignar el nmero 30 a todas las longitudes que tienen exactamente
el mismo largo que una regla de 30 cm.
Escala: es un conjunto de nmeros (u otros smbolos) cuyas propiedades
modelan propiedades empricas de los objetos a los que se asignan los
nmeros. Una forma de asignar una categora a una escala es de acuerdo al
tipo de variable que se mide. Por lo tanto, una escala utilizada para medir una
variable continua se categoriza como una escala continua, mientras que una
escala usada para medir una variable discreta se denomina escala discreta.
La medicin siempre implica error, esto se refiere a la influencia total de los
factores en la calificacin de una prueba, o en cualquier medicin, mas all de
los que se miden en forma especfica por esta prueba o medicin.
La parte de error en la calificacin de la prueba puede deberse a muchos
factores diferentes. Una fuente de error puede haber sido la distraccin
ocasionada por distintos eventos ocurridos durante la aplicacin de la prueba.

Escalas nominales
Las escalas nominales son la forma ms simple de medicin. Estas escalas
implican la clasificacin o asignacin de categoras basada en una o ms
caractersticas distintivas donde deben colocarse todos los objetos medidos en

categoras mutuamente excluyentes y exhaustivas. Ejemplo: en un estudio,


todos los hombres podran ser denominados hombres, 1, B o algn otro
smbolo, y todas las mujeres podran ser denominadas mujeres, 2 o A.
Escalas ordinales
Las escalas ordinales permiten la clasificacin. Sin embargo, adems de la
clasificacin, tambin es permisible un ordenamiento por rangos con base en
alguna caracterstica. Ejemplo, la encuesta de valores de Rokeach (Rokeat
Value Surcey) usa un enfoque as con quienes aceptan responder la prueba al
colocar una lista de valores personales (como libertad, felicidad y sabidura) en
orden de acuerdo con la importancia percibida por quien responde la prueba. Si
una serie de diez valores es ordenada en rangos, quien responde la prueba
puede asignar un valor de 1 al ms importante y 10 al menos importante.
Escalas de intervalo
Las escalas de intervalo contienen intervalos iguales entre nmeros; cada
unidad en la escala es exactamente igual a cualquier otra unidad de escala.
Pero, al igual que las escalas ordinales, estas escalas no contienen un punto
cero absoluto. Como estas escalas no contienen cero absoluto, una suposicin
inherente en su utilizacin es que ningn evaluado posee cero capacidad o
cualidad (o caracterstica) que se mida.
Escalas de razn
Adems de tener las propiedades de las escalas nominales, ordinales y de
intervalo, la escala de razn tiene un punto cero verdadero. Todas las
operaciones matemticas pueden realizarse de manera significativa en este
tipo de escala porque existen intervalos iguales entre los nmeros en ella, as
como un punto cero verdadero o absoluto.
En psicologa, la medicin en el nivel de razn se emplea en algunos tipos de
prueba y reactivos, quiz de manera ms notable en aquellas que tienen que
ver con la evaluacin del funcionamiento neurolgico. Un ejemplo es la prueba
de la capacidad perceptomotriz, cronometrada, la cual requiere que el
evaluado ensamble un rompecabezas.
Escalas de medicin en psicologa
El nivel ordinal de medicin es el que se usa con mayor frecuencia en
psicologa. Como ha sealado Kerlinger (1973): las puntuaciones de las
pruebas de inteligencia, aptitud y personalidad son, ordinales. Indican con ms
o menos precisin no la cantidad de inteligencia, aptitud y rasgos de
personalidad de los individuos, sino ms bien las posiciones ordenadas en
categoras de individuos., admita que la mayora de las escalas psicolgicas
y educativas se aproximan bastante a un nivel de intervalo, aunque adverta
que si las mediciones ordinales eran tratadas como si fueran mediciones de
intervalo, el usuario de la prueba deba estar alerta en forma constante ante
la posibilidad de una desigualdad gruesa de los intervalos

Descripcin de los datos


En la descripcin de los datos, se encuentran los siguientes conceptos:
Distribucin: que se define como un conjunto de puntuaciones de
prueba ordenadas para su registro o su estudio.
Puntuacin cruda: es una cuantificacin directa del desempeo, sin
modificaciones, usualmente numrica. Una puntuacin cruda puede
reflejar una simple cuenta, como el nmero de reactivos respondidos de
forma correcta en una prueba de resultados.
El ejemplo del libro dice que: suponga que por arte de magia ha cambiado de
lugar con el profesor que ensea este curso y que acaba de aplicar un examen
que consta de 100 reactivos de opcin mltiple (donde se concede un punto
por cada respuesta correcta). La distribucin de las puntuaciones para los 25
estudiantes inscritos puede oscilar en un rango terico de 0 (ninguna correcta)
a 100 (todas correctas)
Distribuciones de frecuencia
Los datos de la prueba se pueden organizar en una distribucin de las
puntuaciones crudas. Una forma en que podran distribuirse es por la
frecuencia con que ocurren. En una distribucin de frecuencia, todas las
puntuaciones se enlistan al lado del nmero de veces que ocurri cada
puntuacin. Las puntuaciones podran enlistarse de forma tabular o grfica.
En una distribucin de frecuencia agrupada, los intervalos de las
puntuaciones de una prueba, tambin llamados intervalos de clase,
reemplazan a las puntuaciones de prueba reales. El nmero de intervalos de
clase usados y el tamao o amplitud de cada uno de ellos.
La distribucin de frecuencia de las puntuaciones de prueba tambin puede
ilustrarse en forma grfica. Una grfica es un diagrama o esquema compuesto
por lneas, puntos, barras u otros smbolos que describen e ilustran los datos.
Tipos de grficas

Histograma

Grafica de
barras

Polgono de
frecuencia

Medidas de tendencia central


La medida de tendencia central, es un estadstico que indica el promedio o el
punto medio entre las puntuaciones extremas de una distribucin.
La media aritmtica es el valor obtenido al sumar todos los datos y dividir el
resultado entre el nmero total de datos.

( X )=

f M
n

Donde
f = frecuencia absoluta
M = Marca de clase- punto intermedio de cada intervalo
n = total de datos
Mediana: Es el valor que ocupa el lugar central de todos los datos cuando
stos estn ordenados de menor a mayor.
La mediana se representa por

Me

La mediana se puede hallar slo para variables cuantitativas.


Moda: Es el valor que tiene mayor frecuencia absoluta.
Se representa por

Mo

Se puede hallar la moda para variables cualitativas y cuantitativas.


Medidas de variabilidad
La variabilidad es un indicador de la forma en que las puntuaciones en una
distribucin estn esparcidas o dispersas. Las diferencias en el comportamiento
de todo fenmeno observable que se repite bajo las mismas condiciones.
El rango: el rango de una distribucin es igual a la diferencia entre las
puntuaciones mayor y menor.
La desviacin media: se utiliza para describir la cantidad de variabilidad en
una distribucin. Su frmula es:

DM=

| |
n

Desviacin estndar o Tpica: Esta medida permite determinar el promedio


aritmtico de fluctuacin de los datos respecto a su punto central o media. La
desviacin estndar da como resultado un valor numrico que representa el
promedio de diferencia que hay entre los datos y la media. Para calcular la
desviacin estndar basta con hallar la raz cuadrada de la varianza.
La varianza es la media aritmtica del cuadrado de las desviaciones respecto
a la media de una distribucin estadstica.
Asimetra o sesgo
Las distribuciones se pueden caracterizar por su asimetra o sesgo, es decir,
la naturaleza y grado en que est ausente la simetra. La asimetra es un
indicador de la forma en que estn distribuidas las mediciones en una
distribucin.

Asimetra positiva: se da cuando relativamente pocas de las


puntuaciones caen en el extremo positivo de la distribucin. Por ejemplo,
los resultados de un examen con asimetra positiva pueden indicar que
la prueba fue demasiado difcil; en este caso, habra sido deseable tener
ms reactivos que fueran ms fciles para discriminar mejor los datos
del extremo inferior de la distribucin de las puntuaciones de la prueba.
Asimetra negativa: cuando relativamente pocas de las puntuaciones
caen en el extremo negativo de la distribucin. Por ejemplo, los
resultados de un examen con asimetra negativa pueden indicar que la
prueba fue demasiado fcil; en este caso, habra sido deseable tener
ms reactivos que fueran ms difciles de modo que pudiera hacerse una
mejor discriminacin entre las puntuaciones con respecto al extremo
superior de la distribucin de puntuaciones.

La curva normal
La curva normal es una curva en forma de campana, uniforme, definida en
forma matemtica con su mxima altura en el centro. A partir del centro
disminuye en forma gradual hacia ambos lados aproximadamente al eje X de
manera asinttica (lo que significa que se acerca al eje pero no lo toca) En
teora, la distribucin de la curva normal va desde el infinito negativo hasta el
infinito positivo.
Puntuaciones estndar
Una puntuacin estndar es una puntuacin cruda que ha sido convertida de
una escala a otra, siendo la ultima la que tiene una media y una desviacin
estndar estable de manera arbitraria.

Puntuaciones Z: Es la puntuacin tpica o resultado estndar individual


ms utilizada. Gracias a la puntuacin z se pueden comparar los
resultados de un individuo (o de varios) en distintas pruebas en las que
las distribuciones de los resultados de los otros miembros de la
poblacin sean distintas. La frmula es:

Z=

X X
s

Puntuaciones T: procedimiento para expresar la posicin de las


puntuaciones directas en relacin al grupo. Se expresa como:

Z=

XM
sx

Captulo 4: Supuestos sobre pruebas y evaluacin psicolgica


Qu es una buena prueba?
Una buena prueba es aquella que cumple con los criterios de validez y
confiabilidad, adems de instrucciones claras para su aplicacin, calificacin e
interpretacin. Otra consideracin es que el tiempo utilizado para la prueba sea
economizado con respecto a administrar, calificar e interpretar la misma.
Normas
La evaluacin con normas de referencia consiste en un mtodo de
evaluacin y una manera de derivar significado de las puntuaciones de las
pruebas a evaluar la puntuacin individual de un evaluado y compararla con
las puntuaciones de un grupo de evaluados. En este enfoque, el significado de
una puntuacin individual en una prueba se entiende al relacionarla con otras
puntuaciones en la misma prueba. Un objetivo comn de las pruebas con
normas de referencia es proporcionar informacin acerca de la posicin o el
rango que ocupa un evaluado con respecto a un grupo de comparacin.
Estandarizacin, muestreo y normalizacin
Estandarizacin: el proceso de aplicar una prueba a una muestra
representativa de personas que la responden con el propsito de establecer
normas se conoce como estandarizacin, Se dice que una prueba cumple
con este criterio cuando tiene procedimientos definidos en forma clara para su
administracin y calificacin, lo que incluye datos normativos.
Muestreo: En el proceso de desarrollo de las pruebas, quien las elabora ha
especificado algn grupo como la poblacin para la cual se ha diseado la
prueba. Esta poblacin es el universos completo o conjunto de individuos con
al menos una caracterstica observable.

Normas para una prueba estandarizada: despus de obtener una muestra,


quien elabora la prueba la administra de acuerdo con el conjunto estndar de
instrucciones con las que ser utilizado posteriormente.
Tipos de normas
Percentiles: es una expresin del porcentaje de personas cuya puntuacin se
encuentra `pr debajo de la puntuacin cruda particular.
Normas de edad: tambin conocidas como puntuaciones equivalentes de
edad, indican el desempeo promedio en diferentes muestras de quienes
responden la prueba que tenan diversas edades en el momento en que se
aplic la prueba
Normas de grado: diseadas para indicar el desempeo promedio de los
evaluados en un grado escolar determinado, son desarrolladas cuando se
aplica la prueba a muestras representativas de nios de rango de niveles de
grados consecutivos (de primero a sexto por ejemplo).
Normas nacionales: se derivan de una muestra normativa que fue
representativa de la poblacin a nivel nacional durante el tiempo en que el
estudio de normalizacin fue realizado.
Normas nacionales ancladas: del mismo modo que un ancla proporciona
alguna estabilidad a un barco, as las normas nacionales ancladas proporcionan
alguna estabilidad a las puntuaciones de prueba al anclarlas con otras
puntuaciones de prueba.
Normas de subgrupo: una muestra normativa puede dividirse en segmentos
mediante cualquiera de los criterios utilizados inicialmente para seleccionar
sujetos de la muestra.
Normas locales: elaboradas generalmente por los mismos administradores de
la prueba, estas normas proporcionan informacin normativa respecto al
desempeo de la poblacin local en alguna prueba. Por ejemplo, escuelas
primarias, secundarias o preparatorias del sector privado.
Correlacin e inferencia
Correlacin: es una expresin del grado y direccin de correspondencia entre
dos cosas. Un coeficiente de correlacin (r) expresa una relacin lineal entre
dos (y solo dos) variables. Refleja el grado de variacin relacionado entre la
variable X y la variable Y.

r de Pearson: Es un ndice estadstico que mide la relacin lineal entre


dos variables cuantitativas. Dado dos variables, la correlacin permite
hacer estimaciones del valor de una de ellas conociendo el valor de la
otra variable.

r=

N XY ( X ) ( Y )

NX ( X ) NY
2

( Y )

La Rho de Spearman: es una medida de la correlacin (la asociacin o


interdependencia) entre dos variables aleatorias continuas

Regresin: se define como el anlisis de las relaciones entre variables


con el propsito de entender como una variable puede predecir otra. La
regresin simple, implica una variable independiente (X), referida de
manera tpica como variable predictora, y una variable dependiente (Y),
llamada comnmente variable resultante. El anlisis de regresin simple
da como resultado una ecuacin para una recta o lnea de regresin. La
lnea o recta de regresin es la lnea de mejor ajuste, la lnea que en
un sentido se acerca ms a la mayor cantidad de puntos en la grfica de
dispersin de X y Y.

Inferencia a partir de la medicin


La correlacin, la regresin y la regresin mltiple son todas herramientas
estadsticas usadas para ayudar a asegurarse de que las predicciones o
inferencias extradas de los datos de una prueba son razonables y, en medida
en que sea posible desde el punto de vista tcnico, precisos. Otra herramienta
estadstica que puede ser til para lograr los objetivos es el metaanlisis.

Metaanlisis: es combinar estadsticamente la informacin a travs de


varios estudios. El metaanlisis produce una sola estimacin de la
estadstica que est en estudio.

Captulo 5: Confiabilidad
En este captulo se profundiza en el concepto de la confiabilidad en
una prueba, que comienza desde la planeacin de la misma, hasta los
procesos de estandarizacin, as como en el de normatividad. Como se
pudo observar en un capitulo anterior a este, es necesario determinar si
una prueba es lo suficientemente confiable como para medir lo que fue
diseada para medir. Al determinar la confiabilidad, se asume que la
prueba mide una caracterstica relativamente estable.
Fuentes de varianza de error
Las fuentes de error de varianza incluyen la construccin,
administracin, calificacin y/o interpretacin de la prueba.
Construccin de prueba: una fuente de varianza durante la
construccin de pruebas es el muestreo de reactivos o muestreo de

contenido trminos que se refieren a la variacin entre reactivos


contenidos en una prueba, as como a la variacin entre los reactivos de
diversas pruebas.
Administracin de pruebas: las fuentes de varianza de error que
ocurren durante la aplicacin de la prueba pueden influir en la atencin
o motivacin de quien responde la prueba; por tanto, sus reacciones
ante estas influencias son la fuente de una clase de varianza de error.
Estas influencias pueden ser ambientales o personales.
Calificacin e interpretacin de pruebas: el advenimiento de la
calificacin computarizada y una creciente dependencia de reactivos
objetivos calificables por computadoras han eliminado la varianza de
error causada por diferencias de los evaluadores en muchas pruebas.
Elementos como la subjetividad al calificar por parte del evaluador,
influye bastante a la hora de la interpretacin de las pruebas y puede
mostrar un resultado diferente o inconveniente.

Estimaciones de confiabilidad
Estimaciones de confiabilidad test-retest: Se calcula para
determinar si un instrumento mide de manera consistente de una
ocasin a otra. Este coeficiente se encuentra correlacionado con
las calificaciones obtenidas por un grupo de personas en una
aplicacin con sus puntuaciones en la segunda aplicacin dela
prueba.
Estimaciones de confiabilidad de formas paralelas y formas
alternas: cuando el intervalo entre la aplicacin inicial y el retest
es cortos, los examinados recuerdan muchas de las preguntas y
respuestas de la prueba inicial. Esto afecta sus respuestas en la
segunda aplicacin, por lo regular algunas personas recuerdan
ms del material de la prueba que otras, ocasionando que la
correlacin entre el test y el retest sea menos que perfecta. Se
necesita entonces, una forma paralela del instrumento, que conste
de reactivos similares pero no de los mismos reactivos.
Confiabilidad
de
dividir
por
mitades:
se
obtiene
correlacionando dos pares de puntuaciones obtenidas de mitades
equivalentes de una sola prueba aplicada una sola vez. Es una til
medida de confiabilidad cuando es poco prctico o indeseable
evaluar la confiabilidad con dos pruebas o hacer dos aplicaciones
de una misma prueba (debido a factores como tiempo y costo).

El clculo de un coeficiente de confiabilidad de dividir en mitades


por lo general implica 3 pasos:
1. Dividir la prueba en mitades equivalentes
2. Calcular una r de Pearson entre las puntuaciones en las dos
mitades de la prueba
3. Ajustar la confiabilidad de una mitad de la prueba usando la
formula Spearman-Brown.
Formula Spearman-Brown: esta frmula permite a quien elabora la
prueba o al usuario de la misma, estimar la confiabilidad de su
consistencia interna a partir de la correlacin de las dos mitades.
La frmula general de Spearman-Brown es:
SB=

nr xy
1+ ( n1 ) r xy
r

Donde:
SB=
Confiabilidad ajustada por la formula Spearman-Brown.
r
r xy = la r de Pearson en la prueba con la longitud original
n = nmero de reactivos de la versin revisada dividido entre el nmero
de reactivos de la versin original.
Formula Kuder-Richardson: Se utiliza en caso de que los reactivos de
una prueba sean demasiado homogneos, la KR-20 (nombrada as ya
que fue la vigsima formula desarrollada en una serie) y la estimacin
de la confiabilidad de dividir en mitades sern similares. Sin embargo
esta frmula es la estadstica a elegir para determinar la consistencia
entre reactivos de tipo dicotmicos, sobre todo aquellos que pueden der
calificados como correctos o incorrectos. La frmula es:
r
k
pq

( k1 )(1 )

KR20=

Donde:
r KR20 = el coeficiente de confiabilidad de la frmula 20
k= nmero de reactivos de la prueba
2
= es la varianza del total de las puntuaciones de la prueba
p= es la proporcin de evaluados que aprobaron el examen
q = es la proporcin de reprobados

pq

= es la suma de los productos pq de todos los reactivos.

Coeficiente alfa: desarrollado por Cronbach (1951), puede


considerarse como la media de todas las correlaciones posibles al dividir
en mitades, corregida con la frmula de Spearman-Brown. En contraste
con la KR-20, el coeficiente alfa tambin puede utilizarse en pruebas con
reactivos no dicotmicos. La frmula es:
r

2
i

( k1k )(1 )

Donde:
r = coeficiente alfa
k = es el nmero de reactivos
2i = es la varianza de un reactivo
2i

= es la suma de las varianzas de cada reactivo


= es la varianza total de las puntuaciones de la prueba.

Confiabilidad entre evaluadores: es el grado de acuerdo o


consistencia que existe entre dos o ms evaluadores (o jueces o
calificadores)
Uso e interpretacin de un coeficiente de confiabilidad: si se
disea una prueba especfica que ser usada varias veces en el
trascurso del periodo laboral de una persona con el fin de evaluar su
desempeo, ser razonable esperar que muestre confiabilidad a lo largo
del tiempo. Sera deseable tener una estimacin de la confiabilidad de la
prueba y la postprueba del instrumento. En una prueba diseada para
una sola aplicacin, una estimacin de la consistencia interna seria la
medida de confiabilidad a elegir. Si el propsito de determinar la
confiabilidad es analizar la varianza de error en sus partes, entonces
tendrn que calcularse varios coeficientes confiabilidad.
La naturaleza de la prueba
Relacionada en forma muy estrecha con las consideraciones relativas al
propsito y usa de un coeficiente de confiabilidad estn las
consideraciones relacionadas con la naturaleza de la prueba en s. Aqu
se incluyen consideraciones acerca de si:
1) Los reactivos de prueba son de naturaleza homognea o
heterognea.

2) La caracterstica o capacidad o rasgo que se est midiendo se


considera como dinmica o esttica.
3) El rango de puntuaciones de la prueba est restringido o no
4) La prueba es de velocidad o poder
5) La prueba es o no con referencia a un criterio.
Captulo 6: Validez
La validez aplicada a una prueba, es un juicio o una estimacin acerca
de que tan bien una prueba mide lo que pretende medir en un
determinado contexto. De manera ms especfica, es la elaboracin de
un juicio en base a la evidencia sobre lo apropiado de las inferencias
realizadas a partir de las puntuaciones de una prueba. Una inferencia
es un resultado o deduccin lgicos.
Una manera en que los especialistas der la medicin tradicionalmente
han conceptualizado la validez es de acuerdo con 3 categoras:

Validez
de
contenido: Describe un juicio de cuan
adecuadamente una prueba es una muestra de la conducta
representativa dentro del universo de conductas que la prueba fue
diseada para ejemplificar. Para validar una prueba, es necesario
calcular la razn de validez de contenido, la frmula es:
CVR=

ne (N / 2)
N /2

Donde:
CVR = razn de validez de contenido
ne = nmero de expertos que indican esencial.
N= nmero total de expertos.

Validez relacionada con el criterio: Es un juicio de cuan


adecuadamente puede ser utilizada la puntuacin de una prueba
para inferir la posicin ms probable de un individuo con respecto
a cierta medida de inters, siendo el criterio, la medida de inters.
Dos tipos de evidencias de validez se encuentran asumidas bajo el
rubro de este concepto:
Validez concurrente: es un ndice del grado en que se relaciona
la puntuacin de una prueba con alguna medida de criterio
obtenida al mismo tiempo que la puntuacin.

Validez predictiva: es un ndice del grado en que se relaciona la


puntuacin de una prueba predice alguna medida de criterio. Un
Criterio es definido en forma amplia como el modelo contra el
cual se compara y evala una prueba o la puntuacin de una
prueba. Desde un punto de vista operativo, un criterio puede ser
cualquier cosa. Un criterio debe ser vlido para el propsito para el
que est siendo usado.

Validez de constructo: es un juicio acerca de lo apropiado de las


inferencias realizadas a partir de las puntuaciones o calificaciones
obtenidas en la prueba, respecto a posiciones individuales en una
variable llamada constructo, un constructo es una idea
informada, cientfica, desarrollada como una hiptesis para
describir o explicar un comportamiento, como por ejemplo:
inteligencia,
ansiedad,
satisfaccin
laboral,
personalidad,
depresin, etc.

Validez, sesgo e imparcialidad de la prueba

Sesgo: es un factor inherente a una prueba que de manera


sistemtica impide la medicin absolutamente precisa e imparcial.
Imparcialidad de la prueba: una prueba es imparcial cuando
implican juicios de valor. De esta manera, mientras que las
cuestiones de sesgo de la prueba algunas veces pueden
responderse con precisin y determinacin matemtica, la
imparcialidad puede intentar ser resuelto por infinidad de personas
bien intencionadas que sostienen puntos de vista contrarios.

Captulo 7: Desarrollo de pruebas


No todas las pruebas son creadas de la misma forma. La creacin de una
buena prueba no es una cuestin fortuita, sino el producto de la
aplicacin concienzuda y slida de los principios establecidos para su
elaboracin. El proceso de elaboracin de una prueba contempla cinco
etapas:
1. Conceptualizacin de la prueba: como una cuestin
preliminar, la elaboracin de una nueva prueba puede surgir como
respuesta a una necesidad de evaluar el dominio en una
ocupacin o profesin recin creada. Sin importar cul sea el
estmulo para la elaboracin de una nueva prueba, el futuro
constructor de pruebas enfrenta de inmediato diversas
interrogantes: Qu es lo que va a medir la prueba segn el
diseo?, Cul es el objetivo de la prueba?, existe una necesidad

para esta prueba?, Quin usar esta prueba?, Quin tomara


esta prueba?, Qu contenido cubrir la prueba?, Cmo se
aplicara la prueba?, Cul ser el formato ideal de la prueba?,
debera elaborarse ms de una forma de la prueba?, se
requerir capacitacin especial para los aplicadores?.

2. Construccin de la prueba: que comienza desde la elaboracin


de las escalas que se utilizarn para establecer reglas y con ello
lograr la asignacin numrica en la medicin realizada con base
en el constructo. Se contina con la redaccin de reactivos y el
formato de reactivos y el formato de seleccin de
respuestas. Actualmente se debe considerar la redaccin de
reactivos para ser administrados por computadora si es necesario.
3.
4. Ensayo de la prueba: Habiendo creado una reserva de reactivos
a partir de la cual se elaborar la versin final de la prueba y un
formato amigable y entendible para el evaluado, el elaborador la
pondr a prueba. La prueba debe ser probada con personas
similares en aspectos crticos a la gente para la que fue diseada.
De esta manera, por ejemplo, si una prueba est diseada para
medir autoestima en adolescentes, debera aplicarse entonces a
una poblacin adolescente.
5.
6. Anlisis de reactivos: Entre las herramientas que podran
emplear los elaboradores de pruebas para analizar y seleccionar
reactivos se encuentran:
ndice de dificultad del reactivo
ndice de confiabilidad del reactivo: esto proporciona un indicio de la
consistencia interna de una prueba, entre mayor sea este ndice,
mayor ser la consistencia interna.
ndice de validez del reactivo: indica el grado en el que una prueba
mide lo que se supone debe medir
ndice de la diferenciacin de un reactivo: indica que tan
adecuadamente separa o diferencia un reactivo entre quienes
obtienen puntuaciones altas y quienes tienen puntuaciones bajas en
una prueba completa.
7. Revisin de la prueba: como ltimo paso, queda revisar los
datos obtenidos de manera juiciosa para proceder a moldear la
prueba. Con base en toda la informacin obtenida, algunos
reactivos de la reserva original sern eliminados y otros
redactados de nuevo. Quienes elaboran las pruebas tal vez se
encuentren con que se deben equilibrar los puntos fuertes y
dbiles a lo largo de los reactivos.

8. Captulo 8: La inteligencia y su medicin


9.

Qu es inteligencia?

10.La inteligencia se define como una capacidad multifactica que


se manifiesta de diferentes maneras a lo largo del ciclo vital, la
inteligencia incluye estas habilidades:

Adquirir y aplicar el conocimiento


Razonar de manera lgica
Planear de modo afectivo
Hacer inferencias a partir de la percepcin
Realizar juicio slidos y resolver problemas
Comprender y visualizar conceptos
Poner atencin
Ser intuitivo
Encontrar con facilidad las palabras y pensamientos correctos
Enfrentar, ajustarse y aprovechar situaciones nuevas
11.Definicin de inteligencia: puntos de vista de expertos y
profesionales.
12.Francis Galton: es recordado como la primera persona que
public algo sobre la heredabilidad de la inteligencia, enmarcando
as el debate contemporneo entre la naturaleza y crianza, crea
que las personas ms inteligentes eran aquellas equipadas con las
mejores capacidades sensoriales.
13.Alfred Binet: aunque su prueba, a principios del siglo XX, tuvo el
efecto de iniciar el movimiento de evaluacin psicolgica, tanto
sobre inteligencia como sobre otras materias, escribi que los
componentes de la inteligencia incluyen razonamiento, juicio,
memoria y abstraccin.
14.David Weschler: Lo que define acerca de inteligencia es:
15. La inteligencia, definida en forma operacional, es la capacidad integral o global
del individuo para actuar con determinacin; de pensar en forma racional y de
tratar de manera efectiva con su medio ambiente.

16.Jean Piaget: La investigacin de Piaget est enfocada en el


desarrollo de la cognicin en los nios: cmo piensan, como se
entienden a s mismos y al mundo que los rodea, y como razonan
y solucionan problemas. Para Piaget, la inteligencia puede
concebirse como un tipo de capacidad biolgica evolutiva de
adaptacin al mundo exterior; conforme se desarrollan las
habilidades cognoscitivas, la adaptacin se incrementa y el
ensayo y error mental reemplazan al ensayo y error fsico real.
17.

Medicin de la inteligencia
18.La medicin de la inteligencia implica hacer un muestreo del
rendimiento de un examinado en diferentes tipos de pruebas y
tareas como una funcin del nivel de desarrollo. En todos los
niveles de desarrollo, el proceso de evaluacin intelectual tambin
proporciona una situacin estandarizada desde la cual puede

observarse de cerca el enfoque de un examinado haca varias


tareas. Por consiguiente, ofrece la oportunidad para una
evaluacin que en si misma puede tener gran utilidad clnica.
19.
20.Para la medicin de la inteligencia en distintas etapas de
desarrollo, se toma en cuenta la edad y como se trabajar con el
evaluado.
21.
22.Existen algunos puntos de discusin (como se plantean en este
captulo) que exponen las diferencias que existen en cuanto a los
determinantes de la inteligencia.
23.
24.La primera se maneja como naturaleza vs. Crianza, en esta parte
se comienza explicando que, aunque, en la actualidad la mayora
de los cientficos de la conducta cree que la capacidad intelectual
medida representa una interaccin entre 1) la capacidad innata y
2) las influencias ambientales, esta creencia no siempre fue bien
aceptada. Menciona el preformacionismo que sostiene que
todos los organismos vivos estn preformados al nacer. Todas las
estructuras de un organismo, incluida la inteligencia, estn
preformadas al nacer, y, por lo tanto, no es posible hacer mejoras
al respecto. En general, se concluye, que los proponentes del lado
de la crianza en esta controversia, enfatizan la importancia crucial
de factores como el ambiente prenatal y postnatal, la posicin
socioeconmica, las oportunidades educativas y el moldeamiento
parental en relacin con el desarrollo intelectual.
25.
26.Se menciona tambin herencia e interaccionismo: las personas
difieren en los niveles de inteligencia del mismo modo en que
difieren en los niveles de presin sangunea, en los niveles de
lquido cefalorraqudeo, en la sensibilidad del dolor (Sheffield,
2000) y en muchas otras caractersticas. De acuerdo con el
interaccionismo, las personas heredan un determinado potencial
intelectual. Exactamente cunto de este potencial gentico es
desarrollado depende en parte de la naturaleza del ambiente en el
que se han criado.
27.
28.En cuanto a la estabilidad de la inteligencia, la inteligencia parece
ser estable durante gran parte de la vida adulta del individuo. A
partir de los 75 aos de edad, se observa que comienza una
declinacin en las capacidades cognoscitivas. Otros factores que
afectan en mayor o menor grado son la personalidad, genero
ambiente familiar y cultura.
29.

30.
31.
32.
33.

Captulo 9: pruebas de inteligencia

Las escalas de inteligencia de Stanford-binet


Escalas de Wechsler
Otras medidas de inteligencia

34.
35.
36.
37.
38.
39.