Академический Документы
Профессиональный Документы
Культура Документы
1. Qu es la validez
1.1. Definicin:
Para comprender el concepto de validez es necesario realizar un pequeo estudio de la
evolucin histrica que ha sufrido dicho concepto.
La utilizacin de cuestionarios se vio impulsada por la primera y segunda guerras mundiales.
Durante esos momentos se tuvo la necesidad de incorporar al ejrcito a la poblacin civil,
destinndola al puesto ms adecuado. Tras rellenar los cuestionarios se comprobaba en el
campo de entrenamiento si los sujetos rendan satisfactoriamente o no en el puesto al que
se les haba destinado. Dado que en primer lugar se haca la medicin y posteriormente se
evaluaba el xito, se hablaba de validez predictiva. Es decir, un test posee validez predictiva
si sirve para predecir el comportamiento en un constructo que ser evaluado posteriormente
a la aplicacin del cuestionario.
Ms tarde se trat de evaluar la relacin existente entre las caractersticas de las personas
que realizaban un trabajo y su xito en l. De este modo, se trataba de conocer qu
caractersticas podran predecir el xito laboral y buscarlas cuando se realizaba una
seleccin de personal. Dado que el estudio se realizaba sobre personas que ya tenan el
puesto y se valoraba su ejecucin, se hablaba de validez concurrente, ya que ambas
mediciones se hacan a la vez. Es decir, un test posee validez concurrente si sirve para
predecir el comportamiento en un constructo que es evaluado simultneamente a la
aplicacin del cuestionario.
Como se puede observar, inicialmente los tests eran exclusivamente empleados para
predecir. As pues, en un comienzo, se consideraba que un test era vlido si serva para
predecir alguna variable de inters, denominada criterio (Guilford, 1946).
Por lo tanto, se conceptualiza la validez como correlacin entre el cuestionario y el criterio de
inters (ya sea evaluado con posterioridad o simultneamente a la aplicacin del
cuestionario). As pues, se considera que un test es vlido para evaluar cualquier aspecto
con el que correlacione (Bingham, 1937; Guilford, 1946; entre otros).
Uno de los problemas de la conceptualizacin de la validez como correlacin es el hecho de
que hay que encontrar una medida del criterio adecuada, es decir, se necesitan datos del
criterio que hayan sido obtenidos de una manera fiable y vlida. Por tanto, si ya se posee
una medida vlida del criterio, para qu se necesita aplicar un cuestionario?
Otro problema de esta conceptualizacin es que dejaba fuera a un gran nmero de tests
educativos. En estos no se trata de predecir la conducta, se trata de comprobar cunto se ha
aprendido despus de un periodo de formacin. En estos cuestionarios la puntuacin
obtenida es un indicador de lo que el test pretende evaluar (conocimiento en matemticas,
en ingls, etc.) y no un predictor de criterios distintos del test. Desde esta perspectiva, la
validez hace referencia a que los tems que componen el cuestionario sean representativos
de aquello que se pretende evaluar. A este concepto se le denomin validez de contenido
(Anastasi, 1954). Por otro lado, a lo largo de los aos treinta se produce un auge de las
teoras que tratan de conocer la estructura factorial de la inteligencia. Con estas teoras
comienza a conceptualizarse un test como vlido cuando representa de manera fidedigna el
constructo psicolgico que pretende medir, as como las relaciones esperadas entre los
diferentes constructos. De este modo nace la validez de constructo (Cronbach y Meehl,
1955). Las tcnicas estadsticas empleadas para poder comprobar dicha validez son,
tradicionalmente, el anlisis factorial exploratorio y las matrices multirrasgo-multimtodo
(Campbell y Fiske, 1959), y ms recientemente el anlisis factorial confirmatorio. Por
ejemplo, si se emplea un test que evala la triada cognitiva desde el modelo cognitivo de
depresin de Beck (Beck, Rush, Shawn y Emery, 1979) (pensamientos sobre m mismo,
pensamientos sobre el mundo y pensamientos sobre el futuro), el cuestionario tendr validez
de constructo si evala las tres dimensiones y estas tienen las relaciones que se esperan
con, por ejemplo, ansiedad.
Hasta los aos ochenta se poda hablar de validez predictiva, validez concurrente, validez de
contenido y validez de constructo de un cuestionario, si bien las dos primeras en los
estndares de los tests y manuales educativos y psicolgicos publicados por la APA, AERA y
NCME en 1966 y 1974 se englobaban como validez de criterio.
Posteriormente, Cronbach (1971) puntualiz que en un test que pretende medir un rasgo de
personalidad no existe solo un criterio relevante que predecir, ni un contenido que muestrear
La relacin con otras variables : Las relaciones que se establecen entre el constructo que
se evala y otros constructos son las esperadas segn el marco terico en el que se haya
definido el constructo que evaluar.
Las consecuencias de la aplicacin del cuestionario : Las consecuencias tanto positivas
como negativas que se extraen al emplear un test son las previstas.
Como breve resumen de lo expuesto anteriormente se presenta la siguiente tabla, en la que
se puede apreciar la evolucin del concepto en los diferentes estndares publicados por la
APA.
1.2. Importancia de la validez
El concepto de validez es central en psicometra. Tal y como se coment anteriormente, para
comprobar la validez se deben acumular evidencias que proporcionen una base cientfica
para interpretar las puntuaciones de un cuestionario de manera adecuada. Por ello, lo que
realmente se valida no es el cuestionario en s, sino las interpretaciones que se hacen a
partir de l. Por tanto, no se puede defender que un test sea vlido o que por el contrario
carezca de validez.
Un test puede ser adecuado para un propsito pero no para otro. Si se aplica un
cuestionario con el que se pretende medir autoestima, las respuestas pueden ser
empleadas con diferentes fines (conocer el nivel de autoestima de una persona para
saber si es un problema que tratar en terapia, en seleccin de personal, como
investigacin sobre el propio constructo, etc.). Para poder usar el cuestionario con
una finalidad determinada, se deben acumular evidencias que indiquen que el uso
es correcto (evidencias de validez). En caso contrario, se estara haciendo un mal
uso de los tests, principales herramientas en el trabajo psicolgico, y las
conclusiones que se extrajeran de ellos no seran correctas. En el ejemplo anterior
no se sabra si es un aspecto sobre el que se debe intervenir teraputicamente, no
se sabra si la persona seleccionada realmente tiene la autoestima que se desea o
no se sabe si realmente se est midiendo autoestima.
Para poder realizar correctamente el trabajo como psiclogos, se debe saber si las
conclusiones que se extraen a partir de los tests empleados son adecuadas, ya que en caso
contrario se corre el riesgo de no saber exactamente qu se est evaluando o si esa
medicin realmente es til para el propsito del psiclogo.
CONFIABILIDAD
En el lenguaje cotidiano el trmino fiabilidad se asocia a algo que funciona de manera correcta. Nos
fiamos de nuestro despertador si suena a la hora que se ha programado, de la bscula si nos
proporciona sin error nuestro peso, incluso consideramos que contamos con un buen amigo si
siempre nos apoya cuando lo necesitamos. Si el despertador, la bscula y nuestro amigo no se
texto clsico, Nunnally (1978) considera que el valor mnimo aceptable del coeficiente
de fiabilidad estara en 0,70, sobre todo en un contexto de investigacin bsica. En
cambio, en un contexto aplicado, como el escolar o el clnico, es necesario que la
fiabilidad sea ms elevada, situndola por encima de 0,80 o 0,90. En estos mbitos es
necesario tener en cuenta que las consecuencias de la precisin de los instrumentos de
medida utilizados pueden ser ms decisivas para los sujetos evaluados (pensemos en
los tests de diagnstico clnico, o en los de inteligencia en poblacin infantil, para
determinar la necesidad de clases especiales por los nios). Murphy y Davidshofer
(2005) afirman que en cualquier contexto de evaluacin una fiabilidad por debajo de 0,6
se considerara baja e inaceptable. Kapplan y Saccuzo (2009) van algo ms all y
sugieren que coeficientes de fiabilidad que oscilan entre 0,7 y 0,8 son suficientemente
buenos para la mayora de las ocasiones en las que los tests se utilizan para fines de
investigacin.
Otros autores consideran que un coeficiente de fiabilidad muy cercano a 1 puede
significar que los tems que componen el test son redundantes al evaluar ciertos
elementos o factores del constructo medido, y por lo tanto no aportan informacin
relevante respecto a otros elementos o factores de este constructo, lo que tampoco se
puede considerar como adecuado.
Sin querer establecer criterios estrictos y teniendo en consideracin todo lo que se ha
expuesto hasta aqu, podramos concluir que, en general, es posible interpretar como
una fiabilidad adecuada valores del coeficiente de fiabilidad dentro del intervalo de 0,70
a 0,95.
1.3. Tipos de errores de medida
Hasta este momento solo nos hemos referido a un tipo de error: el error de medida, pero
hay que mencionar que este no es el nico error descrito en el mbito de la psicometra,
sino que tambin podemos hacer referencia al error de estimacin, al error de
sustitucin y al error de prediccin. Estos errores estn relacionados con las
puntuaciones de los sujetos individualmente consideradas. As, el error de medida es, tal
como lo definiremos a continuacin, la diferencia entre la puntuacin obtenida por un
sujeto en el test y su puntuacin verdadera en la caracterstica medida por este test.
Ahora bien, si consideramos los errores no individualmente sino en relacin con un
grupo o muestra de sujetos, podemos obtener los denominados errores tpicos, que son
las desviaciones tpicas de estos errores calculadas a partir de las puntuaciones de
todos los sujetos de la muestra. Por lo tanto, podemos definir ms formalmente estos
diferentes tipos de errores, sus errores tpicos asociados y las frmulas que los
expresan.
- Error de medida . Definimos el error de medida como la diferencia entre la
puntuacin emprica de un sujeto ( X ) y su puntuacin verdadera ( V ).
- Error de estimacin de la puntuacin verdadera . El error de estimacin de la
puntuacin verdadera se define como la diferencia entre la puntuacin verdadera de