Академический Документы
Профессиональный Документы
Культура Документы
Investigacin Cientfica
SESIN N8:
VALIDEZ Y CONFIABILIDAD
Si el criterio se fija en el futuro, se habla de validez predicativa. Por ejemplo, una prueba
para determinar la capacidad administrativa de altos ejecutivos se puede validar
comparando sus resultados con el futuro desempeo de los ejecutivos medidos.
3) Evidencia relacionada con el constructo
La validez de constructo es probablemente 35 la ms importante sobre todo desde una
perspectiva cientfica y se refiere al grado en que una medicin se relaciona consistentemente con otras mediciones de acuerdo con hiptesis derivadas tericamente y que
conciernen a los conceptos (o constructos) que estn siendo medidos. Un constructo es una
variable medida y que tiene lugar dentro de una teora o esquema terico.
Por ejemplo, supongamos que un investigador desea evaluar la validez de constructo de
una medicin particular, digamos una escala de motivacin intrnseca: el Cuestionario de
Reaccin a Tareas, versin mexicana (Hernndez-Sampieri y Corts, 1982). Estos autores
sostienen que el nivel de motivacin intrnseca hacia una tarea est relacionado
positivamente con el grado de persistencia adicional en el desarrollo de la tarea (v.g., los
empleados con mayor motivacin intrnseca son los que suelen quedarse ms tiempo
adicional una vez que concluye su jornada). Consecuentemente, la prediccin terica es
que a mayor motivacin intrnseca, mayor persistencia adicional en la tarea. El
investigador administra dicho cuestionario de motivacin intrnseca a un grupo de
trabajadores y tambin determina su persistencia adicional en el trabajo. Ambas
mediciones son correlacionadas. Si la correlacin es positiva y sustancial, se aporta
evidencia para la validez de constructo del Cuestionario de Reaccin a Tareas, versin
mexicana (a la validez para medir la motivacin intrnseca).
La validez de constructo incluye tres etapas:
1) Se establece y especifica la relacin terica entre los conceptos (sobre la base del marco
terico).
2) Se correlacionan ambos conceptos y se analiza cuidadosamente la correlacin.
3) Se interpreta la evidencia emprica de acuerdo a qu tanto clarifica la validez de
constructo de una medicin en particular.
El proceso de validacin de un constructo est vinculado con la teora. No es posible llevar
a cabo la validacin de constructo, a menos que exista un marco terico que soporte a la
variable en relacin con otras variables. Desde luego, no es necesaria una teora
sumamente desarrollada, pero si investigaciones que hayan demostrado que los conceptos
estn relacionados. Entre ms elaborado y comprobado se encuentre el marco terico que
apoya la hiptesis, la validacin de constructo puede arrojar mayor luz sobre la validez de
un instrumento de medicin. Y mayor confianza tenemos en la validez de constructo de
una medicin, cuando sus resultados se correlacionan significativamente con un mayor
3
En la prctica es casi imposible que una medicin sea perfecta. Generalmente se tiene un
grado de error. Desde luego, se trata de que este error sea el mnimo posible. Es por esto
que la medicin de cualquier fenmeno se conceptualiza con la siguiente frmula bsica:
X=t+e
Donde X representa los valores observados (resultados disponibles), t son los valores
verdaderos y e es el grado de error en la medicin. Si no hay error de medicin (e es
igual a cero), el valor observado y el verdadero son equivalentes. Esto puede verse
claramente as:
X=t+o
X=t
Esta situacin representa el ideal de la medicin. Entre mayor sea el error al medir, el valor
que observamos (y que es en el que nos basamos) se aleja ms del valor real o verdadero.
Por ejemplo, si medimos la motivacin de un individuo y esta medicin est contaminada
por un grado de error considerable, la motivacin registrada por el instrumento ser
bastante diferente de la motivacin real que tiene ese individuo. Por ello es importante que
el error sea reducido lo ms posible. Pero, cmo sabemos el grado de error que tenemos
en una medicin? Calculando la confiabilidad y validez.
CLCULO DE LA CONFIABILIDAD
Existen diversos procedimientos para calcular la confiabilidad de un instrumento de
medicin. Todos utilizan frmulas que producen coeficientes de confiabilidad. Estos
coeficientes pueden oscilar entre O y 1. Donde un coeficiente de O significa nula
confiabilidad y 1 representa un mximo de confiabilidad (confiabilidad total). Entre mas se
acerque el coeficiente a cero (0), hay mayor error en la medicin. Esto se ilustra en la
figura 9.4.
1.
Medida de estabilidad (confiabilidad
por test-retest). En este procedimiento un
mismo instrumento de medicin (o tems o
indicadores) es aplicado dos o ms veces a
un mismo grupo de personas, despus de un
periodo de tiempo. Si la correlacin entre
los resultados de las diferentes aplicaciones
es altamente positiva, el instrumento se
considera confiable. Se trata de una especie
de diseo panel. Desde luego, el periodo de
tiempo entre las mediciones es un factor a
considerar. Si el periodo es largo y la
variable susceptible de cambios, ello puede
confundir la interpretacin del coeficiente
de confiabilidad obtenido por este
procedimiento. Y si el periodo es corto las personas pueden recordar cmo contestaron en
la primera aplicacin del instrumento, para aparecer como ms consistentes de lo que son
en realidad (Bohrnstedt, 1976).
2.
Mtodo de formas alternativas o paralelas. En este procedimiento no se administra
el mismo instrumento de medicin, sino dos o ms versiones equivalentes de ste. Las
versiones son similares en contenido, instrucciones, duracin y otras caractersticas. Las
versiones generalmente dos son administradas a un mismo grupo de personas dentro
de un periodo de tiempo relativamente corto. El instrumento es confiable si la correlacin
entre los resultados de ambas administraciones es significativamente positiva. Los patrones
de respuesta deben variar poco entre las aplicaciones.
3.
Mtodo de mitades partidas (split-halves). Los procedimientos anteriores (medida
de estabilidad y mtodo de formas alternas), requieren cuando menos dos administraciones
de la medicin en el mismo grupo de individuos. En cambio, el mtodo de mitades-partidas
requiere slo una aplicacin de la medicin. Especficamente, el conjunto total de tems (o
componentes) es dividido en dos mitades y las puntuaciones o resultados de ambas son
comparados. Si el instrumento es confiable, las puntuaciones de ambas mitades deben estar
fuertemente correlacionadas. Un individuo con baja puntuacin en una mitad, tender a
tener tambin una baja puntuacin en la otra mitad. El procedimiento se diagrama en la
figura 9.5.
La confiabilidad vara de acuerdo al nmero de tems que incluya el instrumento de
medicin. Cuantos ms tems la confiabilidad aumenta (desde luego, que se refieran a la
misma variable). Esto resulta lgico, vemoslo con un ejemplo cotidiano: Si se desea
probar qu tan confiable o consistente es la lealtad de un amigo hacia nuestra persona,
cuantas ms pruebas le pongamos, su confiabilidad ser mayor. Claro est que demasiados
tems provocarn cansancio en el respondiente.
7
4.
Coeficiente alfa de Cronbach. Este coeficiente desarrollado por J. L. Cronbach
requiere una sola administracin del instrumento de medicin y produce valores que
oscilan entre O y 1. Su ventaja reside en que no es necesario dividir en dos mitades a los
tems del instrumento de medicin, simplemente se aplica la medicin y se calcula el
coeficiente.
La manera de calcular este coeficiente se muestra en la siguiente seccin.
5.
Coeficiente KR-20. Kuder y Richardson (1937) desarrollaron un coeficiente para
estimar la confiabilidad de una medicin, su interpretacin es la misma que la del
coeficiente alfa.
CLCULO DE LA VALIDEZ
La validez de contenido es compleja de obtener. Primero, es necesario revisar cmo ha sido
utilizada la variable por otros investigadores. Y en base a dicha revisin elaborar un
universo de tems posibles para medir la variable y sus dimensiones (el universo tiene que
ser lo ms exhaustivo que sea factible). Posteriormente, se consulta con investigadores
familiarizados con la variable para ver si el universo es exhaustivo. Se seleccionan los
items bajo una cuidadosa evaluacin. Y si la variable tiene diversas dimensiones o facetas
que la componen, se extrae una muestra probabilstica de tems (ya sea al azar o
estratificada cada dimensin constituira un estrato). Se administran los tems, se
correlacionan las puntuaciones de los tems entre s (debe haber correlaciones altas,
especialmente entre tems que miden una misma dimensin) (Bohrnstedt, 1976), y se hacen
estimaciones estadsticas para ver si la muestra es representativa. Para calcular la validez
de contenido son necesarios varios coeficientes.
La validez de criterio es ms sencilla de estimar, lo nico que hace el investigador es
correlacionar su medicin con el criterio, y este coeficiente es el que se toma como
coeficiente de validez (Bohmstedt, 1976). Esto podra representarse as:
Referencia:
Tomado de http://www.tecnicas-de-estudio.org/investigacion/investigacion51.htm
director del Portal Abel Cortese
ACTIVIDAD
ACTIVIDAD
En equipos colaborativos responder las siguientes interrogantes:
En equipos colaborativos responder las siguientes interrogantes:
1. Qu requisitos debe cumplir un instrumento de recoleccin de datos?
1. Qu requisitos debe cumplir un instrumento de recoleccin de datos?
2. Cules son las evidencias del concepto de validez?
2. Cules son las evidencias del concepto de validez?
3. Qu etapas implica la validez de constructo?
3. Qu etapas implica la validez de constructo?
4. Cmo se sabe si un instrumento es vlido y confiable? Graficar brevemente los pasos que
4. Cmo se sabe si un instrumento es vlido y confiable? Graficar brevemente los pasos que
considera el autor del texto.
considera el autor del texto.