Вы находитесь на странице: 1из 10

Fundamentos de la Teoría Clásica de los tests 1

2.- TEORÍA CLÁSICA DE LOS TESTS

2.1. Introducción

Después de haber definido el objeto de estudio de la Psicometría, después de haber


planteado la lógica que sustenta la medición psicológica, en este tema y los dos siguientes se va a
desarrollar el modelo de la Teoría Clásica de los tests (en adelante TCT) y sus posibilidades de
cara a la contrastación de la fiabilidad y validez de los tests.
Frecuentemente se hará uso, especialmente con fines didácticos, de los modelos
estructurales y de medida de matrices de covarianza (en adelante simplemente modelos
estructurales). Digamos, de entrada, que aportan una visión congenérica al estudio de la
fiabilidad y una perspectiva más globalizada y moderna al estudio de la validez.
Dichos modelos estructurales proporcionan un cambio terminológico en los parámetros
psicométricos, unas técnicas de estimación de parámetros propias y, lo que nos va a resultar más
útil, una herramienta de expresión gráfica (los diagramas causales o diagramas path) muy
ilustrativa y que nos ayudará a comprender mejor algunos aspectos de la psicometría.
En aras de ir dosificando la información para facilitar su comprensión, consideramos
pertinentes las siguientes aclaraciones:
- Dado que la mayoría de los coeficientes e índices de fiabilidad son conceptuables,
respectivamente, como correlación entre variables observadas y entre variables observadas y
latentes; vamos a utilizar los diagramas path para comprender el valor de dichos coeficiente o
índices utilizando la regla del trazado1.
- Los constructos o variables latentes (Vi) estarán enmarcados con un círculo y las variables
observadas con un cuadrado (Xi).
- Las flechas rectas y unidireccionales indican una hipotética relación causal en el sentido de la
flecha, las bidireccionales una relación causal en ambos sentidos, y las flechas curvas
(bidireccionales) indican relación de correlación o causalidad sin definir sentido.
- Para este uso didáctico de los diagramas causales no se va a tener en cuenta la exigencia de
que sea mayor el número de ecuaciones que el de incógnitas (parámetros).
La Teoría Clásica de la Respuesta al ítem (en adelante TRI), como modelo alternativo a
la TCT para la construcción de tests y escalas psicológicas que siguen el modelo lineal aditivo,
será estudiada en una posterior asignatura optativa de Psicometría.

1
La regla del trazado dice que la correlación entre dos variables es igual a la suma de efectos que
comunican ambas variables. El valor de cada efecto compuesto es el producto de los efectos simples que lo
constituyen.
Fundamentos de la Teoría Clásica de los tests 2

En este curso desarrollaremos la TCT por considerar que su uso sigue siendo el más
habitual en los tests que el alumno posiblemente esté estudiando en otras asignaturas de la
titulación de Psicología y que tendrá que utilizar para la orientación o el diagnóstico en su futuro
profesional.
Se iniciará el tema con la presentación de los postulados fundamentales de la TCT, así
como su formulación específica en modelos estructurales, para después derivar de ellos las
distintas ecuaciones y procedimientos empíricos de estimación de los parámetros de Fiabilidad y
Validez.

2.2.- Fundamentos de la Teoría Clásica de los Tests

Como se expuso en el tema anterior los errores de medida originan graves distorsiones en
la misma naturaleza de la relación entre las variables implicadas en la investigación objeto de
estudio. Tales errores pueden minimizarse hasta un cierto grado pero nunca eliminarse. La
balanza más precisa que podamos imaginar, siempre sufrirá un cierto desgaste en sus piezas a lo
largo del tiempo, habrá una mínima fricción entre sus componentes, o simplemente nuestro
ángulo de visión al observar el test no será en todo momento exactamente el mismo. Y si esto
ocurre cuando estudiamos objetos, qué será cuando investigamos sujetos. En fenómenos
humanos no hay forma de garantizarse un perfecto control sobre todas y cada una de las
circunstancias (variables) que influyen aleatoriamente en la medida. Precisamente para ese
componente de error aleatorio, la única aproximación posible es la estadística, donde las
decisiones se toman siempre con cierta probabilidad de acertar y cierto margen de error asociado,
que llamaremos error (máximo) de medida.
Descartaremos, por el momento, los errores conceptuales y sistemáticos (para algunos
autores, ambos sistemáticos) como debidos a problema de diseño y/o de fundamento teórico, y
nos centraremos sobre los errores aleatorios, susceptibles de ser abordados (indirectamente)
desde la teoría matemática que expondremos a continuación. Veremos, cómo desde los supuestos
del modelo de medida de la TCT, desde sus restricciones impuestas, podemos acotar, hasta cierto
punto, la cuantía de los errores de medida.
Este modelo de medida, expuesto originalmente por Spearman, y que se denomina
ecuación fundamental de la teoría clásica de los test, viene a decir lo siguiente:
X=V+E (2.1)
La puntuación empírica “X” obtenida por un determinado sujeto a través de un test tiene un
componente verdadero “V” (nivel en el que posee el sujeto el constructo que es objeto de
medida) y un residual de error que es consecuencia de las limitaciones del instrumento de medida
y de la situación de medida. Esta ecuación resulta bastante obvia y razonable, pero hay que
insistir que no es tanto la constatación de una realidad, cuanto la definición de un supuesto. Por
ejemplo, entendemos que las puntuaciones empíricas son combinaciones lineales de las
puntuaciones verdaderas y de los errores (modelo lineal), y no que los errores tienen una relación
multiplicativa con las puntuaciones verdaderas, lo que daría lugar a otro tipo de modelo no lineal.
De la ecuación 2.1 lo único realmente obvio es la puntuación Xi obtenida por un
determinado sujeto. Pero, ¿qué decir de la puntuación verdadera en el atributo o factor (Vi) y del
error (Ei)? Aquí no hay ninguna evidencia, y es a través de conjeturas como estimamos su valor.
Sobre la puntuación verdadera, o simplemente nivel del sujeto en el factor o atributo, se
han dicho muchas cosas. Tal como se considera en este contexto de la teoría clásica, no es alguna
cualidad real inherente a las personas e inmutable que se encuentra en éstas al estilo de las ideas
platónicas y que se refleja, como en el mito de la caverna, en cierto grado (con error), dando
lugar a la puntuación observada. Podría ser así, pero, dado que la puntuación verdadera aunque
Fundamentos de la Teoría Clásica de los tests 3

existiera no podría ser observada directamente, aquí se operativiza como la esperanza


matemática de la puntuación empírica. Esto es la esperanza matemática o media de las medidas
de un rasgo si se realizan a un sujeto "infinito" número de veces. Así podemos "encontrar" (tras
infinitos intentos) la puntuación verdadera y manejarla:

Vi = X i (2.2)
Respecto al error de medida, hay que decir, como ya se ha afirmado, que es aleatorio.
Esto implica que unas veces nos equivocaremos por exceso y otras por defecto, y que a la larga
(después de medir infinitas veces o a infinitos sujetos) habrá simetría y la cantidad de errores
positivos se compensa con la de los negativos. Así:

Ei = 0 (2.3)

Ej = 0
Las ecuaciones 2.1 a 2.6 presentan los axiomas (no demostrables) y univariantes de la
TCT. De ellos se derivan, por demostración, otros postulados también unidimensionales. En este
sentido, cuando se mide un constructo a los infinitos sujetos de una población, la esperanza
matemática o media de las puntuaciones observadas coincide con la de las verdaderas:

X = V + E +V (2.4)
2
A partir de 2.1 2.3 y 2.4 se deduce que también en puntuaciones diferenciales se cumple
el axioma de la TCT:
xi = vi + ei (2.5)

A nivel bivariado, igualmente, se asume como axioma no demostrable que la


correlación entre los errores y el nivel de los sujetos en el factor es igual a cero. Esta suposición
es lógica, ya que si los errores son aleatorios no tendrán nada que ver con la cantidad en que
posee el sujeto el constructo que se mide. Así ocurre también en el modelo de regresión entre la
variable independiente “X” y los errores de estimación. Esta coincidencia no es casual, dado que,
como veremos en los apartados siguientes al hablar en términos estructurales del modelo básico
de medida, las puntuaciones verdaderas en el factor (V) son independientes y las medidas
comportamentales dependen de ellas, llamando azar o error a la parte de la medida que no
depende del valor verdadero del factor o atributo en el sujeto.
re j v j = 0 (2.6)

Igual que ocurre en el modelo de regresión lineal, también los errores cometidos en
distintas situaciones de medida (sujetos o momentos) están incorrelacionados entre sí:
re j ek = 0 siendo j y k dos medidas distintas (2.7)

De 2.6 y 2.7 se deriva que también está incorrelacionado el error cometido en una
situación de medida con la puntuación verdadera de otra situación de medida distinta:

re j ek = 0 siendo j y k dos medidas distintas (2.7)


Estos supuestos referentes a la incorrelación de los errores han sido muy cuestionados y
no son necesarios en la extensión congenérica de la TCT, propia de los modelos estructurales de
medida.

2
X i = Vi + Ei ⇒ X − X = Vi − V + Ei − E ⇒ xi = vi + ei
Fundamentos de la Teoría Clásica de los tests 4

Y, por último, dos supuesto más, necesarios para hacer inferencias estadísticas, hacen
referencia a la normalidad de los errores y a la homocedasticidad o igualdad de varianza de los
mismos para distintos niveles en el constructo.

2.3.- Definición de Coeficiente de Fiabilidad e Índice de Fiabilidad

Como hemos indicado la ecuación fundamental de la TCT en diferenciales: xi =vi +ei.


De donde se deduce3 que:
S x2 = Sv2 + Se2 (2.8)
Igualdad en la que nos vamos a basar en este apartado para desarrollar los algoritmos de
cálculo del índice y del coeficiente de fiabilidad como proporción de variabilidades verdadera y
de las puntuaciones observadas.
Así definimos el índice de fiabilidad (indicador operativo de lo que hemos conceptuado
como fiabilidad absoluta) como la proporción de variabilidad observada (Fx ) Debida a
variabilidad de los sujetos en el factor o atributo (Fv )4.Dentro de un diagrama causal el modelo
de medida básico se puede interpretar como π xv :
rxv = = π xv
Sv
Sx
(2.9)
En consecuencia, definimos el coeficiente de fiabilidad (operativización del concepto de
fiabilidad relativa) como la proporción de variabilidad observada (Fx2) debida a la verdadera
variabilidad de los sujetos en el factor o atributo (Fv2), aunque en este caso en términos de
varianzas (ver ecuación 2.10 y su expresión en diagrama causal) 5. Esto corrobora lo dicho en el
tema uno al relacionar el índice y el coeficiente de fiabilidad. Decíamos entonces, utilizando la
regla del trazado, que el coeficiente es el producto de los dos efectos directos del atributo o
constructo en cada una de los dos indicadores “V1” y “V2", esto es el producto de sus dos
índices6.

∑ (v + e)
2

S x2 = ∑ = ∑ (v +v 2 + 2ve) ∑ v 2 ∑ e 2
+ 2 ∑ = Sv + Se
x2 2
ve
3
= = +
N N N N N N
Ya que la correlación (y por tanto, la covarianza) entre las puntuaciones verdaderas y los errores es cero.

4
A partir de 2.6:

rxv =
∑ xv = ∑ (v + e)v = ∑ (v 2
+ ev)
=
∑v 2

+
∑ ev 1 S2 SS
= v = v v = v
S
NS x S v NS x S v NS x S v N N S x Sv S x Sv S x Sv S x
5
Siguiendo la misma lógica que en la demostración anterior animamos al alumno a que demuestre que:
Dxx=Fv2/Fx2
6
Recordemos, a este respecto lo dicho a modo de introducción en el tema 1. Hemos operativizado la
fiabilidad absoluta como Dxv o como Bxv y la fiabilidad relativa como Dx1x2 o como Bx1v*Bx2v:

Dxv = Bxv
V X
Fundamentos de la Teoría Clásica de los tests 5

Se concluye que el coeficiente de fiabilidad (Dx1x2) es la correlación entre dos medidas de la


misma variable, que es el cuadrado de la correlación entre Xi y V (índice de fiabilidad), pero
sólo si ambos índices de fiabilidad (el de X1 y X2) son iguales. Esto es a partir de 2.9:
Sv2
rx1 x 2 = (2.10)
S x2
2
S2 ⎛ S ⎞
rx1 x 2 = v2 = ⎜⎜ v ⎟⎟ = rxv2 (2.11)
Sx ⎝ Sx ⎠
Este concepto de coeficiente de fiabilidad como el cuadrado de la fiabilidad absoluta es
análogo al concepto de bondad de ajuste en el modelo de regresión simple con variables
observadas. Así el coeficiente de fiabilidad se puede interpretar como la proporción en que la
variabilidad (varianza) observada en las medidas es debida a variabilidad de los sujetos en el
factor.
Para concluir, si el coeficiente es el cuadrado del índice, el índice es la raíz cuadrada del
coeficiente:
rxv = rx1 x 2 2.12

2.4.-Modelo (estructural) de medida en Puntuaciones Directas

Es nuestra intención exponer en las páginas siguientes la TCT a la luz de los modelos
estructurales de medida.
Podemos expresar la ecuación conocida ( Xi = Vi + Ei ) de la siguiente forma, siendo uno
tanto el valor de “Bxv” como el de “Bxe” (ver fig 2.1 y ecuación 2.13):

X i = π xvVi + π xe Ei = 1 * Vi + 1 * Ei (2.13)

Figura 2.1.- Modelo de medida en puntuaciones directas

πxe=1
πxv=1

Se entiende que la variable exógena, marcada con un círculo (ver figura 2.1) como
corresponde a las variables no observables, es el verdadero nivel del sujeto en el atributo (los
factores o constructos son puntuaciones verdaderas o sin error). Así “Vi” es el constructo que
origina, causa o se manifiesta en la variable de comportamiento “ Xi ” (endógena). Así, aunque
operativamente hemos definido Vi como la media de Xi , podemos afirmar, no obstante, en
Fundamentos de la Teoría Clásica de los tests 6

términos teóricos, que la variable Xi es una medida efectuada sobre la variable Vi , y por tanto,
depende de ella.

En el diagrama anterior (fig. 2.1) se entiende que los parámetros Bxv y Bxe no están
estandarizados, dado que sus variables de partida y llegada tampoco lo están. Pero, además, para
que se cumpla que Xi = Vi + Ei , en términos de modelos estructurales los efectos han de valer
“1" necesariamente. En el apartado siguiente presentaremos este mismo modelo de medida en
puntuaciones estandarizadas.

2.5.- Modelo (estructural) de medida en Puntuaciones Estandarizadas

En ciertos casos, conviene utilizar la ecuación estructural en puntuaciones

Figura 2.2 Modelo de medida en puntuaciones estandarizadas para “Zv” y “Zx”, mientras que “E” es
un residual.

e Zx
π
xv
Zv Zx
estandarizadas, pues como veremos sólo en ese caso se puede interpretar Bxv como el índice de
fiabilidad. Para ello partamos del axioma fundamental de la TCT en diferenciales (x = v + e),
dividamos la diferencial de “x” por su desviación tipo y dividimos también por el mismo valor
(para mantener la igualdad) los dos términos del otro miembro de la igualdad (ver 2.14):
xi Sv e
= v i + (2.14)
S x Sv S x S x
Así obtenemos el axioma principal de la TCT en puntuaciones pseudotípicas.
Estandarizadas para x y para v pero no para el error, que viene expresado como un residual. Esto
es como la parte de x no que no depende o es manifestación de v (ver figura 2.2 ecuación 2.15):
Z xi = π xv Z v + eZ x (2.15)
Si seguimos con el proceso de estandarización de los tres componentes, hemos de
multiplicar y dividir los errores por su desviación tipo.
xi Sv Se
= v i + e (2.16)
S x Sv S x Se S x
Y así obtenemos la ecuación fundamental de la TCT en puntuaciones típicas, que mirq
por donde es la ecuación estructural básica correspondiente al diagrama causal del modelo de
medida básico de la TCT:
Z xi = π xv Z v + π xe Z e (2.17)

Ze
π xe
π xv
Zv Zx

Figura 2.3 Modelo de medida en puntuaciones estandarizadas para todos sus componentes.
Fundamentos de la Teoría Clásica de los tests 7

Dejamos al alumno para que compruebe que Bxe es igual a la raíz cuadrada de uno menos
π .
2
xv
Como conclusión del desarrollo del modelo de medida de la TCT en puntuaciones
estandarizadas, entendemos que una puntuación obtenida con cualquier instrumento de medida,
ya sea test o ítem, depende en un grado Bxv de lo que tiene el sujeto de ese constructo y en un
grado Bxe de lo que le han influido otros constructos y/o las circunstancias de medida.

A continuación presentamos la enumeración de los principales postulados que


constituyen la TCT. Algunos de ellos ya han sido presentados en esta primera mitad del tema que
podríamos considerar más literaria y otros se presentan como nuevos en esta versión más
matemática. Aquellos postulados acompañados de un asterisco no están demostrados, o bien por
considerarlos evidentes, o bien por ser supuestos de partida de la TCT.

2.2.- Fundamentos de la Teoría Clásica de los Tests.

*1) Ecuación Fundamental: Xi = Vi + Ei ; Xj = Vj + Ej


*2)
Ei = E j = 0
3) Para m momentos en los que se mide algo al mismo
sujeto: X1 = V + E1
X2 = V + E2
. . .
. . .
Xm = V + Em
__________________
m m

∑ X M *V ∑ E j =1
j
j =1
j

= +
M M M
X =V + E
X =V

Así V no es conceptualizada como cualidad real, al


estilo de las ideas platónicas, sino que se operativiza como
X de las puntuaciones empíricas.
Fundamentos de la Teoría Clásica de los tests 8

4) Análogamente para N sujetos tenemos que:


X 1 = V 1 + E1
X 2 = V 2 + E2
. . .
. . .
. . .
Xn = Vn + En
__________________
n n m

∑X
j =1
i ∑V ∑ E
j =1
i
j =1
i

= +
N N N
X =V + E
X =V

5) A la luz de 2 y 4 tenemos la siguiente ecuación


fundamental en puntuaciones diferenciales:
Xi = Vi + Ei ; Xj = Vj + Ej

X i − X = Vi − V + Ei − E ; X j − X = V j − V + E j − E
xi = vi + ei ; xj = ej

*6) Normalidad y homocedasticidad de los herrores


*7) r =0 ei v i

*8) r =0 ei e k

*9) r =0 e j ek

*10) r =0 ei vk

*11) r =0 e j vk
Fundamentos de la Teoría Clásica de los tests 9

2.3.- Índice y Coeficiente de fiabilidad en términos de


proporción de variabilidad.

12) Calculando el cuadrado de los dos miembros de la


igualdad de la ecuación 6 para N sujetos:
x12 = (v12 + e12 + 2v1e1 )
x22 = (v22 + e22 + 2v2e2 )
. . .
. . .
. . .
xn2 = (vn2 + en2 + 2vnen )
------------------
n n

∑ x ∑ (v + e + 2v e )
2
i
2
i
2
i i i
i =1
= i =1
N n
n n n n

∑ xi2 ∑ vi2 ∑ ei2 ∑v e i i


i =1
= i =1
+ i =1
+2 i =1
N N N N
S = Sv + Se
2
x
2 2

13) Índice de fiabilidad en puntuaciones diferenciales


como r : xv

r = ∑
xv ∑ (v + e)v ∑ (v + ev) ⎛ ∑ v
+∑ ⎟
ve ⎞ 1 2
S SS S
2 2
= = =⎜ = = = ⎜ N
v v v v
N ⎟⎠ S x Sv
xv
NS x Sv NS x Sv NS x Sv ⎝ S x Sv S x Sv Sx

En resumidas cuentas: rxv =


Sv
Sx

13) Coeficiente de fiabilidad en puntuaciones diferenciales


como r y, consecuentemente, relación entre coeficiente e
x1 x 2

índice de fiabilidad:
Fundamentos de la Teoría Clásica de los tests 10

rx1 x 2 = ∑x x 1 2
=∑
(v + e )(v + e ) ∑ (v
1
= 2
2
+ ve2 + e1v + e1e2 )
=
NS x1 S x 2 NS x2 NS x2
⎛ ∑ v 2 ∑ ve2 ∑ ve2 ∑ e1v ∑ e1e2 ⎞ 1 Sv2 ⎛ Sv ⎞
2

= ⎜⎜ + + + + ⎟ 2 = 2 = ⎜ ⎟ = rxv2
⎟S ⎜ ⎟
⎝ N N N N N ⎠ x Sx ⎝ Sx ⎠

rxv = rx1 x 2

2.4.- Postulado fundamental de la TCT en puntuaciones


estandarizadas y su expresión en modelos causales (modelo
estructural de medida básico).
X i = Vi + Ei
xi = vi + ei
xi v e
= i + i
Sx Sx Sx
xi Sv e
= v i + i
(14)
S x Sv S x S x
xi Sv Se
= v i + e i
S x Sv S x Se S x
Z x = rxv Z v + rxc Z e = π xv Z v + π xc Z e

Ze
π xe
π xv
Zv Zx

Figura 2.1.- Modelo de medida en puntuaciones estandarizadas para sus tres componentes.

...una
puntuación obtenida con cualquier instrumento de
medida, ya sea test o ítem, depende en un grado π de lo xv

que tiene el sujeto de ese constructo y en una grado π de xe

lo que le han influido otros constructos y/o las


circunstancias de medida.

Вам также может понравиться