You are on page 1of 79

Parte 11

EVALUACIN DE LAS PROPIEDADES


MTRICAS DE LOS INSTRUMENTOS
DE MEDICIN PSICOLGICA
ITEMA 4
LA FIABILIDAD DE LAS PUNTUACIONES
Enrique Vila Abad
suMARIO
1. Orientaciones didcticas
2. El problema del error de medida
3. El modelo lineal de Spearman
4. Tests paralelos. Condiciones de paralelismo
5. Interpretacin terica del coeficiente de fiabilidad
6. Tipos de errores de medida
7. Factores que afectan a la fiabilidad
7.1. Longitud del test
7.2. Variabilidad de la muestra
8. La fiabilidad como equivalencia y como estabilidad de las medidas
8.1. Mtodo de las formas paralelas
8.2. Mtodo test-retest
9. La fiabilidad como consistencia interna
9.1. Mtodos basados en la divisin del test en dos mitades
9.1 .1 . Spearman-Brown
9.1.2. Rulan
9.1.3. Guttman-Fianagan
9.2. Mtodos basados en la covariacin entre los tems
9.2.1. Coeficiente alfa (a) de Cronbach
9.2.1.1. Estimador insesgado de a
9.2.1.2. El coeficiente a como lmite inferior del coeficiente
de fiabilidad
9.2.1.3. Inferencias sobre a
9.2 .2. Casos particulares del coeficiente a
9.3. Coeficientes basados en el anlisis factorial de los tems: Theta (8) y
Omega (Q)
9.4. El coeficiente b e t a ( ~ ) de Raju
1 O. Estimacin de la puntuacin verdadera de los sujetos en el atributo de in-
ters
11. Fiabilidad de una batera de tests
12. Ejercicios de autoevaluacin
13. Soluciones a los ejercicios de autoevaluacin
14. Apndice
15. Bibliografa complementaria
d
ad de las medidas
mitades
inferior del coeficiente
de los tems: Theta (8) y
jetos en el atributo de in-
1. ORIENTACIONES DIDCTICAS
En los temas anteriores se han expuesto los principios bsicos para la cons-
truccin de tests y las principales tcnicas de construccin de escalas de actitu-
des; se cumple as la primera etapa de la construccin de los instrumentos de me-
dicin psicolgica. Hasta el momento, se cuenta con una prueba piloto que se
ha aplicado a una muestra de sujetos a los que se les han asignado sus puntua-
ciones correspondientes. Vamos a comenzar ahora el estudio de la segunda parte
del proceso, la evaluacin de la calidad mtrica de la prueba piloto y la cons-
truccin del instrumento de medicin definitivo.
Hemos intentado aclarar, en cierta medida, los distintos trminos utilizados en
relacin con estos instrumentos: tests, escalas, cuestionarios, etc.; sin embargo, a
partir de este momento, y teniendo en cuenta que la forma de llevar a cabo la
evaluacin de la calidad mtrica es la misma, vamos a seguir las mismas normas
que en los Standards for Educational and Psychological Testing (AERAIAPAINCME/
1999) que utilizan el trmino test para referirse a todos estos instrumentos de eva-
luacin.
Esta fase de evaluacin de la calidad del test debera comenzar por el anli-
sis de la calidad de los tems ya que, como se ha comentado con anterioridad,
dado que los tems son las unidades elementales del test, difcilmente se podr
contar con un buen test si los tems que lo forman son de mala calidad. Durante
el proceso de construccin de la prueba inicial se ha explicado la forma de lle-
var a cabo una parte del anlisis de los tems a partir de la revisin crtica del
contenido de los mismos por un grupo de expertos o jueces; sin embargo, que-
dara por hacer otro tipo de anlisis que no estuviera basado en juicios subjeti-
vos, sino un anlisis objetivo basado en las respuestas que han emitido los suje-
171
1 PSICOMETRA
tos a los tems. Dado que para llevar a cabo este tipo de anlisis es necesario
que nuestros alumnos se hayan familiarizado con los conceptos de validez y fia-
bilidad, entre otros, el tema dedicado al anlisis de los tems se expondr ms
adelante.
Una vez evaluada la calidad de los tems del test y eliminados aquellos que
no se consideran adecuados, el paso siguiente ser la evaluacin de la calidad
global del test que incluye, entre otras cosas, la evaluacin de la precisin y es-
tabilidad de las medidas (fiabilidad) y la pertinencia de las inferencias realizadas
a partir de las puntuaciones obtenidas (validez) .
En este tema se analiza el problema de la fiabilidad y precisin de la medida,
tratando de encontrar respuesta a la pregunta de hasta qu punto las puntuacio-
nes obtenidas por los sujetos en la prueba que se les ha aplicado estn afecta-
das por errores de medida y en qu cuanta. El tema siguiente est dedicado al
estudio de la fiabilidad desde la perspectiva de los tests referidos al criterio (TRC).
Comenzamos el tema con una alusin al problema del error de medida, cen-
trndonos en los errores aleatorios y en cmo el modelo lineal propuesto por
Spearman intenta buscar soluciones a esta cuestin. Seguidamente presentamos
los distintos tipos de errores aleatorios con los que nos podemos encontrar al
aplicar un instrumento de medicin.
A continuacin, introducimos la definicin, dentro de la Teora Clsica de los
Tests, del coeficiente de fiabilidad, haciendo mencin de los distintos factores
que pueden influir en su cuanta como pueden ser la longitud del test y las ca-
ractersticas de la muestra a la que se aplica, y explicando la necesidad de esta-
blecer procedimientos empricos que nos permitan estimarlo: el mtodo de las
formas paralelas, el mtodo test-retest y los mtodos basados en la consistencia
interna del test; indicando cmo se deben interpretar los coeficientes obtenidos.
A continuacin se presentan tres procedimientos que permitirn estimar el nivel
real del sujeto en el rasgo o caracterstica que mide el test (su puntuacin ver-
dadera).
Al estudiar el tema se recomienda que los alumnos hagan hincapi en los si-
guientes puntos bsicos:
172
Conocer los supuestos bsicos del modelo lineal de Spearman as como
las deducciones que se puedan hacer a partir de esos supuestos.
Tener muy claros los conceptos de error de medida y fiabilidad.
Saber diferenciar los distintos tipos de error de medida.
Conocer la influencia que pueden tener en el coeficiente de fiabilidad
2. E
-
Ur
fiabil
carac
be me
medi1
un ce
Si
termi
puntL
obser
por e1
paci d
del in
si ble,
real s
1 PSICOMETRA
tos a los tems. Dado que para llevar a cabo este tipo de anlisis es necesario
que nuestros alumnos se hayan familiarizado con los conceptos de validez y fia-
bilidad, entre otros, el tema dedicado al anlisis de los tems se expondr ms
adelante.
Una vez evaluada la calidad de los tems del test y eliminados aquellos que
no se consideran adecuados, el paso siguiente ser la evaluacin de la calidad
global del test que incluye, entre otras cosas, la evaluacin de la precisin y es-
tabilidad de las medidas (fiabilidad) y la pertinencia de las inferencias realizadas
a partir de las puntuaciones obtenidas (validez) .
En este tema se analiza el problema de la fiabilidad y precisin de la medida,
tratando de encontrar respuesta a la pregunta de hasta qu punto las puntuacio-
nes obtenidas por los sujetos en la prueba que se les ha aplicado estn afecta-
das por errores de medida y en qu cuanta. El tema siguiente est dedicado al
estudio de la fiabilidad desde la perspectiva de los tests referidos al criterio (TRC).
Comenzamos el tema con una alusin al problema del error de medida, cen-
trndonos en los errores aleatorios y en cmo el modelo lineal propuesto por
Spearman intenta buscar soluciones a esta cuestin. Seguidamente presentamos
los distintos tipos de errores aleatorios con los que nos podemos encontrar al
aplicar un instrumento de medicin.
A continuacin, introducimos la definicin, dentro de la Teora Clsica de los
Tests, del coeficiente de fiabilidad, haciendo mencin de los distintos factores
que pueden influir en su cuanta como pueden ser la longitud del test y las ca-
ractersticas de la muestra a la que se aplica, y explicando la necesidad de esta-
blecer procedimientos empricos que nos permitan estimarlo: el mtodo de las
formas paralelas, el mtodo test-retest y los mtodos basados en la consistencia
interna del test; indicando cmo se deben interpretar los coeficientes obtenidos.
A continuacin se presentan tres procedimientos que permitirn estimar el nivel
real del sujeto en el rasgo o caracterstica que mide el test (su puntuacin ver-
dadera).
Al estudiar el tema se recomienda que los alumnos hagan hincapi en los si-
guientes puntos bsicos:
172
Conocer los supuestos bsicos del modelo lineal de Spearman as como
las deducciones que se puedan hacer a partir de esos supuestos.
Tener muy claros los conceptos de error de medida y fiabilidad.
Saber diferenciar los distintos tipos de error de medida.
Conocer la influencia que pueden tener en el coeficiente de fiabilidad
2. 1
f iab
car<
ben
un
ter
pu
ob
pe
pa
dE
sil
re
1 PSICOMETRA
tos a los tems. Dado que para llevar a cabo este tipo de anlisis es necesario
que nuestros alumnos se hayan familiarizado con los conceptos de validez y fia-
bilidad, entre otros, el tema dedicado al anlisis de los tems se expondr ms
adelante.
Una vez evaluada la calidad de los tems del test y eliminados aquellos que
no se consideran adecuados, el paso siguiente ser la evaluacin de la calidad
global del test que incluye, entre otras cosas, la evaluacin de la precisin y es-
tabilidad de las medidas (fiabilidad) y la pertinencia de las inferencias realizadas
a partir de las puntuaciones obtenidas (validez).
En este tema se analiza el problema de la fiabilidad y precisin de la medida,
tratando de encontrar respuesta a la pregunta de hasta qu punto las puntuacio-
nes obtenidas por los sujetos en la prueba que se les ha aplicado estn afecta-
das por errores de medida y en qu cuanta. El tema siguiente est dedicado al
estudio de la fiabilidad desde la perspectiva de los tests referidos al criterio (TRC).
Comenzamos el tema con una alusin al problema del error de medida, cen-
trndonos en los errores aleatorios y en cmo el modelo lineal propuesto por
Spearman intenta buscar soluciones a esta cuestin. Seguidamente presentamos
los distintos tipos de errores aleatorios con los que nos podemos encontrar al
aplicar un instrumento de medicin.
A continuacin, introducimos la definicin, dentro de la Teora Clsica de los
Tests, del coeficiente de fiabilidad, haciendo mencin de los distintos factores
que pueden influir en su cuanta como pueden ser la longitud del test y las ca-
ractersticas de la muestra a la que se aplica, y explicando la necesidad de esta-
blecer procedimientos empricos que nos permitan estimarlo: el mtodo de las
formas paralelas, el mtodo test-retest y los mtodos basados en la consistencia
interna del test; indicando cmo se deben interpretar los coeficientes obtenidos.
A continuacin se presentan tres procedimientos que permitirn estimar el nivel
real del sujeto en el rasgo o caracterstica que mide el test (su puntuacin ver-
dadera).
Al estudiar el tema se recomienda que los alumnos hagan hincapi en los si-
guientes puntos bsicos:
172
Conocer los supuestos bsicos del modelo lineal de Spearman as como
las deducciones que se puedan hacer a partir de esos supuestos.
'
Tener muy claros los conceptos de error de medida y fiabilidad.
Saber diferenciar los distintos tipos de error de medida.
Conocer la influencia que pueden tener en el coeficiente de fiabilidad
~
e
p
p
d
si
rE
de anlisis es necesario
'"""'L'"''"' de validez y fia-
tems se expondr ms
eliminados aquellos que
evaluacin de la calidad
cin de la precisin y es-
las inferencias realizadas
y precisin de la medida,
qu punto las puntuacio-
aplicado estn afecta-
iguiente est dedicado al
referidos al criterio (TRC).
del error de medida, cen-
o lineal propuesto por
idamente presentamos
podemos encontrar al
de la Teora Clsica de los
de los distintos factores
longitud del test y las ca-
do la necesidad de esta-
maria: el mtodo de las
sados en la consistencia
coeficientes obtenidos.
rmitirn estimar el nivel
test (su puntuacin ver-
hagan hincapi en los si-
al de Spearman as como
esos supuestos.
ida y fiabilidad.
coeficiente de fiabilidad
LA FIABILIDAD DE LAS PUNTUACIONES 1
factores como la longitud del test y la variabilidad de la muestra de suje-
tos a los que se aplica.
Conocer los procedimientos empricos para estimar el coeficiente de fia-
bilidad.
Diferenciar entre la fiabilidad como estabilidad temporal de las puntua-
ciones obtenidas en el test y como consistencia interna de los tems del
test.
Diferenciar entre los distintos procedimientos para estimar la puntuacin
verdadera de un sujeto en un test.
Nota: Para aquellos lectores interesados, al final del tema se incluye un Apndice en
el que se ofrecen las demostraciones de las frmulas que irn apareciendo a lo largo
del mismo.
2. EL PROBLEMA DEL ERROR DE MEDIDA
Uno de los requisitos fundamentales en cualquier teora de la medicin es la
fiabilidad y precisin de los instrumentos utilizados para medir una determinada
caracterstica. La medicin en Psicologa no est exenta de este requisito y de-
bemos contar con instrumentos que sean fiables y, por consiguiente libres, en la
medida de lo posible, de errores de medida. El concepto de error de medida es
un concepto bsico en Psicometra.
Se define el error de medida como la diferencia entre la puntuacin emprica
obtenida por un sujeto en un test y su puntuacin verdadera, entendiendo por test
cualquier instrumento de medicin psicolgica.
Si aplicramos n veces un test a un mismo sujeto, con la finalidad de de-
terminar su capacidad en una determinada caracterstica, es casi seguro que las
puntuaciones obtenidas por ese sujeto seran muy parecidas pero nunca iguales
observndose que, en algunos casos, el valor de la puntuacin emprica estar
por encima de la puntuacin verdadera del sujeto, la que realmente indica la ca-
pacidad que tiene, y en otros por debajo. En cualquier caso ser responsabilidad
del investigador construir pruebas que den lugar al mnimo error de medida po-
sible, y que la puntuacin obtenida proporcione el mayor grado de informacin
real sobre la caracterstica objeto de estudio.
1 PSICOMETRA
A veces, los errores de medida no son debidos al propio instrumento de me-
dicin sino a cambios que operan en el propio sujeto y que pueden ser atribui-
dos a diversas razones: su motivacin cuando realiza la prueba, que conteste al
azar algunos de los tems, las condiciones fsicas en que se encuentre, etc. stos
son errores de carcter aleatorio e impredecibles, con los que hay que contar y
tratar de controlar para que no interfieran de manera significativa en las predic-
ciones que podamos hacer acerca de su capacidad. Son los errores de los que
se va a ocupar la fiabilidad. En el apartado 6 veremos con ms detalle los dis-
tintos tipos de errores de medida que existen.
De lo dicho hasta ahora se puede deducir, en primer lugar, que si aplicamos
repetidas veces un mismo test a un sujeto, lo ms probable es que obtengamos
puntuaciones distintas en las diferentes aplicaciones y, en segundo lugar, que
cuando un sujeto obtiene una puntuacin en un test, dicha puntuacin estar
afectada por errores de medida. Este hecho nos lleva a plantearnos la siguiente
pregunta: cmo podemos saber cul es el valor real del sujeto en la caracters-
tica que estamos estudiando? Para ello, hay que acudir a alguna de las teoras que
se han ido desarrollando y que nos van a proporcionar los medios para hacer es-
timaciones acerca de la cuanta de error que afecta a las puntuaciones empri-
cas y acerca del verdadero nivel del sujeto (o sujetos) en la caracterstica que se
est midiendo.
Dado que este texto est dedicado, fundamentalmente, a la Teora Clsica de
los Tests, el modelo (teora) que se estudiar es el modelo lineal propuesto por
Spearman. Este modelo establece que la puntuacin emprica obtenida por los
sujetos cuando se les aplica un test es funcin lineal de su puntuacin verdadera
en el rasgo que se intenta medir y un componente de error, tal y como se espe-
cificar en el siguiente apartado.
3. El MODELO LINEAL DE SPEARMAN
El modelo lineal de Spearman, establece que la puntuacin emprica obtenida
por un sujeto en un test (X) puede considerarse como una combinacin lineal de
dos componentes: por una parte, la puntuacin verdadera (V) de ese sujeto en
el rasgo que mide el test, y por otra, el error de medida (f) que la afecta. As
pues, podemos establecer la ecuacin del modelo en los siguientes trminos:
X= V+ E
[4.1]
174
)po instrumento de me-
, que pueden ser atribui-
l prueba, que conteste al
2 se encuentre, etc. stos
los que hay que contar y
gnificativa en las predic-
)n los errores de los que
con ms detalle los dis-
r lugar, que si aplicamos
)able es que obtengamos
y, en segundo lugar, que
dicha puntuacin estar
plantearnos la siguiente
1 sujeto en la caracters-
alguna de las teoras que
los medios para hacer es-
las puntuaciones empri-
la caracterstica que se
nte, a la Teora Clsica de
lo lineal propuesto por
prica obtenida por los
su puntuacin verdadera
, tal y como se espe-
acin emprica obtenida
na combinacin lineal de
ra (V) de ese sujeto en
ida (f ) que la afecta. As
los sigui entes trminos:
[4.1]
LA FIABILIDAD DE LAS PUNTUACIONES 1
Como se puede deducir de esta expresin, si aplicamos un test a un sujeto la
puntuacin que obtenga en el test, no coincidir con el valor de la puntuacin
verdadera. Como en cualquier proceso de medicin hemos de tener en cuenta
la presencia del error de medida cometido.
El modelo asume una serie de supuestos:
Primer supuesto. La puntuacin verdadera (V) es la esperanza matemtica de
la puntuacin emprica (X). Esto quiere decir que si a un sujeto se le pasara un
nmero infinito de veces un mismo test, y suponiendo que las aplicaciones fue-
ran independientes entre s de manera que la puntuacin obtenida por dicho su-
jeto en una de las aplicaciones no estuviera influyendo en la obtenida en las de-
ms, la media de todas las puntuaciones observadas (X) sera la puntuacin
verdadera del sujeto.
V= E(X) [4.2]
Segundo supuesto. La correlacin existente entre las puntuaciones verdade-
ras de n sujetos en un test y los errores de medida es igual a cero. Es decir, no
existe relacin entre los errores de medida y las puntuaciones verdaderas.
[4.3]
Tercer supuesto. La correlacin entre los errores de medida (re
1
e) que afectan
a las puntuaciones de los sujetos en dos tests diferentes (X
7
y X
2
) es igual a cero.
Si e
7
representa los errores de medida de las puntuaciones de n sujetos en el
test 1 y e
2
representa los errores de medida de las puntuaciones de los mismos
sujetos en el test 2 el supuesto implica que no existe ninguna razn para presu-
poner que los errores de medida cometidos en un test vayan a influir, positiva o ne-
gativamente, en el otro test, siempre y cuando los tests se apliquen correctamente.
[4.4]
A partir de estos tres supuestos del modelo se pueden hacer las siguientes de-
ducciones:
a) El error de medida se define como la diferencia entre la puntuacin em-
prica obtenida por un sujeto y su puntuacin verdadera.
175
1 PSICOMETRA
[4.5]
b) La esperanza matemtica de los errores de medida es cero.
E(e) =O [4.6]
e) La media de las puntuaciones empricas es igual a la media de las pun-
tuaciones verdaderas.
X=V
[4.7]
d) La covarianza entre las puntuaciones verdaderas y los errores es igual a cero.
Cov (V, E)= O [4.8]
e) La varianza de las puntuaciones empricas es igual a la suma de la va-
rianza de las puntuaciones verdaderas ms la varianza de los errores.
[4.9]
f) La covarianza entre las puntuaciones empricas y las verdaderas es igual a
la varianza de las puntuaciones verdaderas.
[4.1 O]
g) La correlacin entre las puntuaciones empricas y los errores es igual al
cociente entre la desviacin tpica de los errores y la desviacin tpica de
las puntuaciones empricas.
[4.11]
176
[4.5]
a es cero.
[4.6]
a la media de las pun-
[4.7]
os errores es igual a cero.
[4.8]
gual a la suma de la va-
ri anza de los errores.
[4.9]
las verdaderas es igual a
[4.10]
y los errores es igual al
y la desviacin tpica de
[4.11]
LA FIABILIDAD DE LAS PUNTUACIONES 1
h) La covarianza entre las puntuaciones empricas de dos tests es igual a la
covarianza entre las puntuaciones verdaderas.
Cov (X
7
, X
2
) = Cov (V
7
, V
2
) J
[4.12]

4. TESTS PARALELOS. CONDICIONES DE PARALELISMO
Si a una misma muestra de sujetos se le aplican dos tests, X y X', podemos
considerar que son paralelos si, adems de cumplirse los supuestos anteriores,
se cumplen las dos condiciones siguientes:
1. Las puntuaciones verdaderas de los sujetos son iguales en ambos tests.
Segn el modelo lineal podemos establecer:
X= V+ E
X'= V+ E'
2. La varianza de los errores de medida es la misma en ambos tests:
De las condiciones de paralelismo enunciadas podemos sacar una serie de
deducciones importantes dentro del modelo clsico.
a) La media de las puntuaciones empricas obtenidas en dos tests supuesta-
mente paralelos es la misma.
Teniendo en cuenta que la esperanza matemtica de los errores de me-
dida es cero y que las puntuaciones verdaderas de los sujetos son iguales
en ambos tests, podemos concluir la existencia de igualdad entre las me-
dias de las puntuaciones empricas.
- - - -
X=V+E=V
x' = v + fi= v
177
1 PSICOMETRA
b) Las varianzas de las puntuaciones empricas obtenidas en dos tests para-
lelos son iguales.

52 =52+ 52
X V e
Teniendo en cuenta, por definicin de tests paralelos, que la varianza de
los errores es la misma, podemos concluir que las varianzas de las pun-
tuaciones empricas snn iguales.
e) La correlacin entre las puntuaciones empricas obtenidas en dos tests
paralelos (rxx'l es igual al cuadrado de la correlacin entre las puntuaciones
empricas y las puntuaciones verdaderas o bien, al cociente entre la
varia11za de las puntuaciones verdaderas y la varianza de las puntuaciones
empricas.
[4.13]
d) Dados dos o ms tests paralelos, las intercorrelaciones entre cada dos de
ellos son iguales.
[4.14]
5. INTERPRETACIN TERICA DEL COEFICIENTE DE
FIABILIDAD
Definimos el coeficiente de fiabilidad de un test, como:
... la correlacin entre las puntuaciones empricas obtenidas por una muestra
de sujetos en dos formas paralelas del test.
Se puede expresar tambin como el cociente entre la varianza de las pun-
tuaciones verdaderas y la varianza de las puntuaciones empricas.
178
enidas en dos tests para-
lelos, que la varianza de
las varianzas de las pun-
obtenidas en dos tests
n entre las puntuaciones
ien, al cociente entre la
nza de las puntuaciones
[4.13]
iones entre cada dos de
[4.14]
ICIENTE DE
m o:
obtenidas por una muestra
la varianza de las pun-
empricas.
LA FIABILIDAD DE LAS PUNTUACIONES 1
[4.15]
y se pude interpretar, por lo tanto, como la proporcin de la varianza de las
puntuaciones empricas de los sujetos que se debe a la varianza de las puntuaciones
verdaderas, o lo que es lo mismo, la proporcin de varianza verdadera que hay en
la varianza emprica. A medida que dicha proporcin aumenta, disminuye el error
de medida. Si rxx' = 1, el error de medida es cero lo que implica una fiabilidad
perfecta del test. Sin embargo, a medida que dicha proporcin disminuye se
produce un incremento en el error de medida. En el caso de que rxx' =O, la varianza
de los errores de medida sera igual a la varianza de las puntuaciones empricas.
EJEMPLO:
Calcular el coeficiente de fiabilidad de un test de razonamiento abstracto,
sabiendo que la varianza verdadera de dicho test es el 80% de su varianza
emprica.
r _ S ~ = O, 8 0 5 ~ =
0 80
XX' - -2 52
1
Sx x
es decir el 80% de la varianza de las puntuaciones empricas es verdadera
medida del rasgo.
A partir de la expresin (4.13) se puede inferir que:
[4.16]
Al trmino rxv se le denomina ndice de fiabilidad de un test.
El coeficiente de fiabilidad de un test se puede expresar tambin en funcin
de la varianza de los errores:
[4.17]
As mismo, es fcilmente deducible que:
179
1 PSICOMETRA
[4.18]
Es decir, la correlacin entre las puntuaciones empricas y los errores de me-
dida se puede obtener a partir de la correlacin entre las puntuaciones obteni-
das por los sujetos en las dos formas paralelas de un test. El trmino
5
e repre-
5x
senta la proporcin de la desviacin tpica de las puntuaciones de los sujetos en
el test que se debe a la desviacin tpica de los errores y, como vemos, esa pro-
porcin se puede estimar a partir del coeficiente de fiabilidad del test.
Resumiendo, podemos decir que el coeficiente de fiabilidad definido segn
el modelo clsico de Spearman como la correlacin entre las puntuaciones ob-
tenidas por una muestra de sujetos en dos tests paralelos, nos proporciona in-
formacin para poder estimar la cuanta del error de medida.
6. TIPOS DE ERRORES DE MEDIDA
En este apartado haremos alusin a diferentes tipos de errores: el de medida,
el de estimacin, el de sustitucin y el de prediccin.
- Error de medida.
Como ya se ha dicho, el error de medida es la diferencia entre la puntuacin
emprica de un sujeto y su puntuacin verdadera.
E=X-V
A la desviacin tpica de los errores de medida se le denomina error tpico de
medida y se expresa como:

, S t
[4.19]
Cuando se calcula el error de medida obtenemos una medida individual del
error que se comete; es decir, una medida individual de la precisin del test. Esta
medida nos indica la diferencia que existe entre la puntuacin que un sujeto ha
obtenido en un test y el nivel real de dicho sujeto en la variable que medimos
180
[4.18]
y los errores de me-
. as puntuaciones obteni -
EI trmino Se repre-
5x

0
nes de los sujetos en
como vemos, esa pro-
ilidad del test.
abilidad definido segn
las puntuaciones ob-
os, nos proporciona in-
edida.
de errores: el de medida,
cia entre la puntuacin
denomina error tpico de
[4.19]
na medida individual del
la precisin del test. Esta
ntuacin que un sujeto ha
la variable que medimos
LA FIABILIDAD DE LAS PUNTUACIONES 1
con dicho test; es decir, su puntuacin verdadera. Cuando calculamos el error
tpico de medida estamos llevando a cabo una medida grupal del error puesto
que se calcula para todos los sujetos de la muestra.
Este mismo razonamiento es vlido para los distintos tipos de error que se ex-
ponen a continuacin .
- Error de estimacin de la puntuacin verdadera.
Se denomina error de estimacin de la puntuacin verdadera a la diferencia
entre la puntuacin verdadera de un sujeto y la puntuacin verdadera pronosti-
cada mediante el modelo de regresin.
E= V- V'
Definimos el error tpico de estimacin de la puntuacin verdadera, como la
desviacin tpica de los errores de estimacin y viene expresado como:
[4.20]
- Error de sustitucin
Se define el error de sustitucin como la diferencia entre las puntuaciones
obtenidas por un sujeto en un test y las obtenidas en otro test paralelo. Es decir,
el error que se cometera al sustituir las puntuaciones obtenidas en un test X
1
por las obtenidas en un test paralelo X
2
.
e= x,- x2
Definimos el error tpico de sustitucin, como la desviacin tpica de los erro-
res de sustitucin y viene expresado como:
[4.21]
- Error de prediccin.
Se define el error de prediccin como la diferencia entre las puntuaciones
obtenidas por un sujeto en un test (X
1
) y las puntuaciones pronosticadas en ese
mismo test (X) a partir de una forma paralela X
2
.
181
1 PSICOMETRA
e= X
1
- X
La puntuacin X se obtiene mediante la recta de regresin de X
1
sobre X
2
:
[4.22]
Definimos el error tpico de prediccin, como la desviacin tpica de los erro-
res de prediccin y viene expresado como:
[4.23]
7. FACTORES QUE AFECTAN A LA FIABILIDAD
La fiabilidad de un test depende de factores como la variabilidad del grupo
al que se aplica, la longitud del propio test, las caractersticas de los tems que
lo configuran, etc. En este apartado estudiaremos los dos primeros aspectos y el
tercero ser abordado ms adelante en otro tema dedicado especficamente al
estudio de la calidad mtrica de los tems.
7 .1. Longitud del test
Uno de los factores que influyen en la fiabilidad de un test es su longitud, es
decir, el nmero de tems que lo componen. Cuantos ms tems representativos
del rasgo a medir se utilicen mayor ser la informacin que obtengamos acerca
del atributo que estemos estudiando. Cabe pensar que tambin ser menor el
error que cometamos al tratar de estimar la puntuacin verdadera de un sujeto
y, por lo tanto, la fiabilidad del test tender a incrementarse. Entonces, una forma
de intentar aumentar la fiabilidad del test es aumentar su longitud. A veces, si un
test es demasiado largo puede ser interesante averiguar cul sera su fiabilidad
si se le disminuyera el nmero de tems. Si esta disminucin de la fiabilidad no
es muy elevada puede ser ms aconsejable utilizar el test ms corto.
La relacin existente entre la fiabilidad de un test y su longitud, siempre y
cuando los tems a aadir sean paralelos a los que ya tena el test original, se
puede evaluar mediante la ecuacin de Spearman-Brown.
182
gresin de X
1
sobre Xi
[4.22]
acin tpica de los erro-
[4.23]
DAD
a variabilidad del grupo
sticas de los tems que
primeros aspectos y el
cado especficamente al
un test es su longitud, es
s tems representativos
que obtengamos acerca
tambin ser menor el
verdadera de un sujeto
Entonces, una forma
longitud. A veces, si un
r cul sera su fiabilidad
ucin de la fiabilidad no
su longitud, siempre y
tena el test original, se
donde:
LA FIABILIDAD DE LAS PUNTUACIONES 1
nrxx
=---""-----
1 + (n -1)rxx
[4.24]
Rxx =coeficiente de fiabilidad del test alargado o acortado.
rxx =coeficiente de fiabilidad del test inicial.
n = nmero de veces que se ha alargado o acortado el test.
n = EF, siendo EF el nmero de elementos finales del test y El el nmero de
El
elementos iniciales del test.
Esta expresin (4.24), es la que definimos como ecuacin general de Spearman-
Brown y hace referencia al caso en que se quiera aumentar o disminuir la longi-
tud del test inicial n veces.
Todo lo que acabamos de decir, es igual de vlido en el caso de reducir la lon-
gitud del test, con la salvedad de que n ser siempre menor que 1.
Nota: Tngase en cuenta que <<n no es el nmero de tems que se aaden o se eli-
minan del test original, sino que hace referencia al nmero de veces que se aumenta
o disminuye la longitud del test.
~ - - - - - . ~ - . ~ ~ - - - ~ - - ~ - - - - - ~ - - - - ~ ~ - - ~ - ~ - = = - ~ - - - ~ - = - = = = - ~ - - - - - - - - - ~ - - - - - ~ .. 1
EJEMPLO:
Supongamos, que se aplica un test de percepcin visual compuesto por 50
tems a una muestra de sujetos y se obtiene un coeficiente de fiabilidad de 0, 60.
Veamos lo que sucede al incrementar n veces la longitud del test:
nr 2 O 60 1 80
Paran = 2 R = xx = ' =O 75 paran= 3 R = ' =O 82
l XX 1+(n-1)rXX 1+0,60 l l XX 1+1, 20 l
P
2,40
ara n = 4 R = = O 86
1 XX 1 + 1,80 1
3
P
ara n =S R = =O 88
1 XX 1 + 2,40 1
Para n = 6 R =
3
'
60
=O 90
1 XX
1
+
3
1
7 R
4, 20 o
P
aran= =--= 91
1 XX
1
+
3
/
6
1
P
4,80
ara n = 8 R = =O 92
1 XX 1+4,20 1
9 R
5,40 9
P
ara n = = = O 3
1 XX 1+4, 80 1
183
1 PSICOMETRA
Como se puede apreciar en el grfico 4.1, a medida que aumenta el nmero
de tems paralelos aumenta el coeficiente de fiabilidad del test, aunque no de una
manera proporcional. Se puede observar que a partir de un determinado valor de
n no se producen incrementos significativos en la fiabilidad del test. Como con-
secuencia de esto nos podemos preguntar: cunto habra que alargar o acortar
un test para obtener un determinado coeficiente de fiabilidad? y, en segundo lu-
gar, hasta qu punto es razonable dicho aumento?
.9
.8
. 7 ~ - - ~ - - - - - - - - ~ - - - - - - ~ - - - - ~ - - ~
2 3 4 5 6 7 8 9
De nuevo encontramos la respuesta a esta pregunta a travs de la ecuacin
de Spearman-Brown, ya que despejando n tendremos:
Supongamos que con los datos del ejemplo anterior queremos aumentar la
fiabilidad del test hasta obtener un valor de 0,93. Aplicando la expresin ante-
rior tenemos:
n = Rxx (l- rxJ =O, 93(1- 0,60) =
8
,
85
=
9
(xx (1- Rxx) O, 60(1- O, 93)
184
Par
damen
dra ur
lo que
tems r
alterna
test, m
choob
dido 3'
En<
nmer
cienter
atribut
de ten
un coe
vos un
formul
obten e
luego t
7. 2. \
-
La f
a la qu
muestr
en fun<
ms he
puntua
que aumenta el nmero
2l test, aunque no de una
un determinado valor de
idad del test. Como con-
' a que alargar o acortar
lidad? y, en segundo lu-
8 9
a travs de la ecuacin
r queremos aumentar la
icando la expresin ante-
85 = 9
LA FIABILIDAD DE LAS PUNTUACIONES 1
Para conseguir ese coeficiente de fiabilidad sera necesario hacer, aproxima-
damente, 9 veces ms largo el test original de 50 tems. Es decir, el nuevo test ten-
dra una longitud de:
n = EF EF = n El= 9 50= 450 tems
El'
lo que implicara aadir 400 tems al test original. Obviamente, aadir al test 400
tems no parece una solucin razonable al problema y debemos plantearnos otras
alternativas como, por ejemplo, revisar el objetivo para el que se construye el
test, mejorar los tems y analizar cul es el valor de precisin aceptable para di-
cho objetivo (si se hubiera tomado el valor exacto de 8,85 habra que haber aa-
dido 392,5 tems es decir 393, lo cual tampoco sera una solucin razonable).
En ocasiones puede que estemos interesados en saber si es posible reducir el
nmero de tems de un test y que el nuevo coeficiente de fiabilidad sea lo sufi-
cientemente aceptable como para no perder demasiada informacin respecto al
atributo objeto de estudio. Esta situacin se da cuando consideramos el nmero
de tems excesivo. Supongamos, por ejemplo un test compuesto de 100 tems y
un coeficiente de fiabilidad de 0,85 (rxx). Supongamos que para nuestros objeti-
vos un coeficiente de fiabilidad de 0,75 (Rxx) es admisible. La pregunta que nos
formularamos sera cuntos elementos debemos eliminar del test original para
obtener ese coeficiente de fiabilidad. En este caso:
n=Rxx(1-rxJ = 0,75(1-0,85) = 0,11 =O
52
rxx (1-RxJ 0, 85(1-0,75) 0,21 '
EF = n El = 0,52 x 1 00 =52
luego tendramos que eliminar 100- 52 = 48 tems.
7.2. Variabilidad de la muestra
La fiabilidad de un test tambin depende de las caractersticas de la muestra
a la que se aplica. Un test puede presentar tantos coeficientes de fiabilidad como
muestras distintas en las que se calcule. El coeficiente de fiabilidad puede variar
en funcin de la mayor o menor homogeneidad del grupo, siendo menor cuanto
ms homogneo sea; es decir,cuanto ms pequea sea la desviacin tpica de las
puntuaciones empricas obtenidas por los sujetos en el test. Recordemos que he-
185
1 PSICOMETRA
mos definido el coeficiente de fiabilidad como la correlacin entre dos formas
paralelas de un test y la correlacin viene afectada por la variabilidad del grupo.
Por lo tanto, es importante saber hasta qu punto la fiabilidad de un test se ve
afectada por dicha variabilidad.
Supongamos dos grupos de sujetos 1 y 2. Partiendo del supuesto de que el error
tpico de medida de un test se mantiene constante, independientemente de la va-
riabilidad del grupo en que se aplique, podemos establecer la siguiente igualdad:
Por tanto, teniendo en cuenta que, = rxx ) podemos establecer la igual
dad:



y despejando:
donde:
=varianza emprica de las puntuaciones en el grupo 1.
=varianza emprica de las puntuaciones en el grupo 2.
r
11
=coeficiente de fiabilidad en el grupo 1.
r
22
=coeficiente de fiabilidad en el grupo 2.
EJEMPLO:
[4.25]
Se ha aplicado un test a una muestra de sujetos en la que la desviacin tpica de
las puntuaciones empricas obtenidas es igual a 20 y la razn entre la desviacin t-
pica de los errores y la desviacin tpica de las puntuaciones empricas es 0,40. Apli-
cado el test a otra muestra de sujetos en la que la desviacin tpica de las puntuacio-
nes empricas es igual a 1 O, cul sera el valor del coeficiente de fiabilidad del test?
S
Datos: S = 20 S = 1 O 40
x1 ' x 2 ' S '
xl
52
r,
11
= 1 - _ e = 1 - O 1 6 = O 84
52 1 1
X
186
~ ! a c i n entre dos formas
k variabilidad del grupo.
abilidad de un test se ve
1 supuesto de que el error
)endientemente de la va-
:er la sigui ente igualdad:
emos establecer la igual
[4.25]
ue la desviacin tpica de
entre la desviacin t-
empricas es 0,40. Apli-
tpica de las puntuacio-
de fiabilidad del test?
LA FIABILIDAD DE LAS PUNTUACIONES 1
Como se puede apreciar, al reducir la variabilidad de las puntuaciones em-
pricas en el segundo grupo, se reduce el coeficiente de fiabilidad. Asimismo se
puede observar que el valor del error tpico de medida permanece constante (lo
cul es lgico puesto que se ha partido de ese supuesto).
Se, =Sx,.Jl - rxx =20-Jl-0,84 =8
8. LA FIABILIDAD COMO EQUIVALENCIA Y COMO
ESTABILIDAD DE LAS MEDIDAS
Un test debe cumplir dos requisitos bsicos. En primer lugar debe medir el
rasgo que realmente pretende medir (es decir, ser vlido) y, en segundo lugar,
las puntuaciones empricas obtenidas al aplicar el test deben ser estables y pre-
cisas. La precisin hace referencia, como ya hemos apuntado anteriormente, a
la necesidad de que, en la medida de lo posible, las puntuaciones obtenidas es-
tn libres de errores. La estabilidad se refiere a que cuando se evala un rasgo
con el mismo test en distintas ocasiones y bajo condiciones lo ms parecidas
posibles, siempre y cuando el rasgo estudiado no haya cambiado, se debern
obtener unos resultados similares. Este segundo requisito, referido a la repro-
ductividad de unos resultados en condiciones similares, es lo que definimos
como la fiabilidad del test, entendida como estabilidad de las medidas. En defi-
nitiva, lo que pretendemos es poder establecer el grado de acuerdo entre las
puntuaciones obtenidas por los sujetos en distintas aplicaciones.
En este apartado, nos centraremos en dos mtodos basados en la estabilidad
de las medidas para el clculo del coeficiente de fiabilidad, mtodos que cons-
tituyen una aplicacin directa de la definicin de correlacin entre formas pa-
ralelas:
Mtodo de las formas paralelas
Mtodo test-retest
Existen otras formas de abordar el clculo de la fiabilidad de un test, como ve-
remos en el siguiente apartado, basadas en la consistencia interna del test.
187
1 PSICOMETRA
8.1 . Mtodo de las formas paralelas
La forma de proceder, segn este mtodo, sera: primero, construir dos formas
paralelas de un test X y X/, en segundo lugar, aplicar las dos formas del test a
una muestra de sujetos lo suficientemente amplia como para que sea represen-
tativa de la poblacin a la que va dirigido el test y, en tercer lugar, calcular el
coeficiente de correlacin de Pearson entre las puntuaciones de los sujetos en
ambas formas.
[4.26]
donde: X
1
y X
2
corresponden a las puntuaciones obtenidas por los sujetos en
cada una de las formas aplicadas.
El coeficiente de fiabilidad as obtenido recibe tambin el nombre de coefi-
ciente de equivalencia, haciendo referencia al grado en que ambas formas son
equivalentes.
El mtodo de las formas paralelas presenta la ventaja de que, si ambas formas
son aplicadas en el mismo momento se tiene un mayor control de las condicio-
nes en que los sujetos realizan las pruebas. Este mtodo presenta el inconveniente
de la dificultad que supone la construccin de dos formas que sean paralelas.
1
8.2. Mtodo test-retest
Con este mtodo se aplica el mismo test en dos ocasiones diferentes a una
misma muestra de sujetos. Calculamos el coeficiente de fiabilidad mediante la co-
rrelacin entre las puntuaciones obtenidas por los sujetos en ambas aplicaciones.
[4.27]
donde: X
1
y X
2
corresponden, en este caso, a las puntuaciones obtenidas por los
sujetos en cada una de las aplicaciones del mismo test.
188
Como:
ralelas sie1
la misma t
Este mf
tintas del1
remos en,
pueden ca
pretensin
las puntua
bilidad sin
diendo, la:
Al igual
inconveni'
cuenta, es
terferir en 1
dado a cie
su puntuac
riables de t
factor dete
Un segt
currido en1
caciones p
tiempo, un
que el rasg
tores socia
cidir en un
Una lt
bio en el g
radamente
coeficiente
Teniend
en ambas e
dicarn el
fiabilidad 2
ro, construir dos formas
dos formas del test a
para que sea represen-
tercer lugar, calcular el
ones de los sujetos en
[4.26]
idas por los sujetos en
n el nombre de coefi-
que ambas formas son
de que, si ambas formas
control de las condicio-
el inconveniente
as que sean paralelas.
iones diferentes a una
abilidad mediante la co-
en ambas aplicaciones.
[4.27]
ciones obtenidas por los
LA FIABILIDAD DE LAS PUNTUACIONES 1
Como se puede apreciar, el clculo es idntico al mtodo de las formas pa-
ralelas siendo la nica diferencia que en lugar de aplicar dos formas se emplea
la misma en dos momentos distintos.
Este mtodo presenta la ventaja de que no requieren dos ms formas dis-
tintas del mismo test. Con el mtodo test-retest, es el mismo test el que aplica-
remos en distintas ocasiones. En el caso de que se pretendan medir rasgos que
pueden cambiar en el tiempo hay que extremar las precauciones si tenemos la
pretensin de emplear este mtodo ya que se pueden encontrar diferencias en
las puntuaciones obtenidas en las dos aplicaciones y no significar falta de esta-
bilidad sino que si realmente los sujetos han variado en el rasgo que se est mi-
diendo, las diferencias pongan de manifiesto ese cambio.
Al igual que el mtodo de las formas paralelas, este mtodo no est exento de
inconvenientes que hay que tener presentes. Un primer aspecto a tener en
cuenta, es el posible influjo de la memorizacin de algunos tems que puede in-
terferir en la segunda aplicacin. Un sujeto puede recordar la respuesta que haya
dado a ciertos tems y esto puede provocar un aumento o disminucin irreal de
su puntuacin y, consiguientemente, del valor de la correlacin. El efecto de va-
riables de estas caractersticas sobre la repeticin de un test puede llegar a ser un
factor determinante en el valor del coeficiente de fiabilidad.
Un segundo inconveniente a tener en cuenta es el intervalo de tiempo trans-
currido entre una aplicacin y otra. Es deseable incrementar el tiempo entre apli-
caciones para minimizar el efecto de aprendizaje o de memoria pero, al mismo
tiempo, un incremento demasiado grande, hace que aumente la posibilidad de
que el rasgo que estamos estudiando haya variado debido a la influencia de fac-
tores sociales, afectivos o incluso evolutivos propios del sujeto y esto puede in-
cidir en una infraestimacin del coeficiente de fiabilidad.
Una ltima cuestin es la propia actitud del sujeto (Ghiselli, 1981 ). Un cam-
bio en el grado de cooperacin por parte de un sujeto puede provocar, delibe-
radamente, una puntuacin ms baja o ms alta, que dara como resultado un
coeficiente de fiabilidad ms bajo o ms alto.
Teniendo en cuenta estos aspectos, y si las condiciones de aplicacin del test
en ambas ocasiones son lo ms parecidas posibles, los resultados obtenidos in-
dicarn el grado de estabilidad en las puntuaciones obtenidas. Al coeficiente de
fiabilidad as obtenido se le denomina tambin coeficiente de estabilidad.
189
1 PSICOMETRA
9. LA FIABILIDAD COMO CONSISTENCIA INTERNA
Existen situaciones en las cuales solamente es posible llevar a cabo una nica
aplicacin de un test; situaciones en las que la aplicacin de cualquiera de los
dos mtodos que acabamos de describir no sea factible, o donde un anlisis de
la estabilidad o la equivalencia de las medidas no constituya nuestro fin priori-
tario.
En este apartado presentamos una serie de mtodos para estimar la fiabilidad
de un test que slo requieren una aplicacin. Unos hacen referencia a la divi-
sin del test en dos mitades. Otros requieren un anlisis de la varianza y cova-
rianza de las respuestas de los sujetos a los tems. Las diferentes tcnicas que
presentamos aportan un ndice de la consistencia interna de las respuestas de
los sujetos a los tems del test en una sola aplicacin.
9.1. Mtodos basados en la divisin del test en dos mitades
El mtodo de las dos mitades presenta una ventaja sustancial respecto a los
dos mtodos explicados anteriormente. Esta ventaja reside en el hecho de que
consideramos las puntuaciones obtenidas en una nica aplicacin de un test,
con lo cul, la estimacin de la fiabilidad no se ve afectada por factores como
el intervalo de tiempo transcurrido entre una aplicacin y otra, la memoria, el
aprendizaje, etc., y supone un ahorro de tiempo y esfuerzo al no tener que cons-
truir una segunda forma paralela del test, tener que realizar una segunda eva-
luacin de los sujetos. Bsicamente se tratara de aplicar el test a una muestra de
sujetos y, una vez obtenidas las puntuaciones dividir el test en dos mitades, cal-
culando, posteriormente, la correlacin entre las puntuaciones obtenidas por los
sujetos en ambas partes y aplicar, a continuacin, una frmula de correccin
que ya se especificar.
La divisin del test en dos mitades no es siempre una labor tan sencilla como
pueda parecer a primera vista. Las mitades del test debern ser similares en di-
ficultad y contenido para que la correlacin entre las puntuaciones se aproxime
al valor mximo. Uno puede cuestionarse si efectivamente las medias, varianzas
y el contenido de los tems son realmente similares o no, y, por lo tanto, si este
mtodo es adecuado en todo tipo de situaciones. El hecho de conseguir una
igualdad de los valores de la media y la desviacin tpica es posible con este
tipo de agrupamiento, pero como establece Gulliksen (1987) corremos el peli-
gro de agrupar tems anlogos en un solo lado, con lo que pudiera ocurrir que
190
a
e
9
d;
b<
bi
INTERNA
ll evar a cabo una nica
r
n de cualquiera de los
o donde un anlisis de
tuya nuestro fin priori-
a estimar la fiabilidad
n referencia a la divi-
de la varianza y cova-
iferentes tcnicas que
a de las respuestas de
dos mitades
cial respecto a los
ide en el hecho de que
aplicacin de un test,
por factores como
y otra, la memoria, el
al no tener que cons-
lizar una segunda eva-
el test a una muestra de
en dos mitades, cal-
iones obtenidas por los
frmula de correccin
labor tan sencilla como
n ser similares en di-
ntuaciones se aproxime
las medias, varianzas
, y, por lo tanto, si este
cho de conseguir una
ca es posible con este
(1987) corremos el peli-
que pudiera ocurrir que
LA FIABILIDAD DE LAS PUNTUACIONES 1
las dos mitades no fueran iguales en cuanto a contenido se refiere. Este aspecto
deber ser cuidadosamente estudiado debido a su importancia.
Son diversas las formas en las que se puede llevar a cabo la divisin del test
en dos mitades pero, ante todo, una caracterstica que habr que valorar es la
forma en que se ha construido el test.
Una primera forma consistira en dividir el test por la mitad, es decir, consi-
derar los primeros (n/2) tems como una mitad y los ltimos (n/2) tems como la
segunda mitad. Esta forma de dividir el test puede presentar inconvenientes,
puesto que muchos tests estn formados por tems cuya dificultad se va incre-
mentando y, por lo tanto, las dos mitades no seran equivalentes; en el caso de
tests con contenidos heterogneos las dos mitades no seran comparables, y en
el caso de tests con un nmero elevado de tems hay que tener en cuenta el
efecto del cansancio de los sujetos.
Una segunda aproximacin al problema consistira en definir una forma con
todos los elementos pares y una segunda forma con todos los elementos impa-
res, con lo cual reducimos significativamente los problemas planteados por la
forma anterior.
Una tercera forma de abordar el problema puede ser ordenar los tems en
funcin de su grado de dificultad, calculando para ello el ndice de dificultad de
cada tem, y subdividirlos en pares e impares.
Una cuarta forma, aunque no muy recomendable por razones obvias, podra
consistir en la asignacin de los tems al azar a una mitad o a otra.
Normalmente, dado que cuando los tems del test son de dificultad creciente
aparecen ya ordenados a lo largo del test, la forma ms utilizada en la divisin
del test en dos mitades, es asignar a una de las mitades los elementos pares y a
la otra los impares.
Cuando se utiliza el mtodo de las dos mitades la fiabilidad se puede estimar
aplicando cualquiera de las siguientes frmulas: Spearman-Brown, Rulon,
Guttman-Fianagan.
9.1. 1. Spearman-Brown
La ecuacin de Spearman-Brown, constituye una de las formas ms utiliza-
das para estimar la fiabilidad de un test por el mtodo de las dos mitades. Est
basada en la relacin existente entre la longitud de un test y el coeficiente de fia-
bilidad.
191
1 PSICOMETRA
En primer lugar aplicamos el test a una muestra de sujetos. Una vez aplicado
el test, dividimos ste en dos mitades que han de ser paralelas. Por lo tanto, para
ver si la aplicacin de este mtodo es la correcta, habra que comprobar los su-
puestos de paralelismo comentados anteriormente. A continuacin calculamos
la correlacin entre las puntuaciones obtenidas por los sujetos en ambas partes.
La correlacin calculada correspondera al coeficiente de fiabilidad de cada una
de las mitades del test, pero como lo que queremos es calcular la fiabilidad del
test completo, para ello aplicamos la ecuacin de Spearman-Brown para el caso
de longitud doble:
donde:
R = 2rxx
XX 1
+(XX
Rxx =coeficiente de fiabilidad del test.
rxx =coeficiente de fiabilidad de cada una de las mitades.
EJEMPLO:
[4.28]
Hemos aplicado un test de aptitud numrica compuesto de 20 tems a una
muestra de 6 sujetos. Los resultados que se presentan a continuacin corres-
ponden a las puntuaciones que dichos sujetos obtuvieron en los tems pares (X
1
)
e impares(X
2
). Calcular el coeficiente de fiabilidad suponiendo que las dos mi-
tades del test sean paralelas.
SUJETOS
x2
1
1 8 4 64 16 32
2 7 7 49 49 49
3 8 6 64 36 48
4 5 4 25 16 20
5 8 7 64 49 56
6 6 6 36 36 36
Total 42 34 302 202 241
192
Jjetos. Una vez aplicado
alelas. Por lo tanto, para
a que comprobar los su-
nuacin calculamos
sujetos en ambas partes.
fiabilidad de cada una
calcular la fiabilidad del
n-Brown para el caso
[4.28]
itades.
de 20 tems a una
a continuacin corres-
en los tems pares (Xl)
niendo que las dos mi-
16 32
49 49
36 48
16
20
49
56
36
36
202 241
LA FIABILIDAD DE LAS PUNTUACIONES 1
rx,x2 = )[NLx12 -(IX/] [ N L x ~ -(IX2l2]
r = 6x241-42x34 =1.446-1.428=
035
XxX
2
~ ( 6 X 302- 42
2
)(6 X 202-34
2
) .j 48 X 56
1
R = 2rxx = 2x0,35 = 0,70 =O
52
xx 1+rxx 1+0,35 1,35
1
El coeficiente de fiabilidad de cada una de las mitades es 0,35 pero el del test
total es 0,52. Se trata de un coeficiente medio ya que el valor mximo es la uni-
dad. Hemos asumido que las dos mitades son paralelas dado que se trata de un
ejemplo, no obstante para aplicar este procedimiento de forma estricta habra que
haber hecho previamente la compro.bacin analizando, por ejemplo, la igualdad
de las medias de ambas mitades y la igualdad de los errores tpicos de medida.
9.1.2. Rulon
La frmula de Rulon (1939) para la estimacin de la fiabilidad de un test se-
gn el mtodo de dos mitades se utiliza cuando, an no siendo las dos mitades
definidas estrictamente paralelas, podemos considerarlas -equivalentes (tau-
equivalentes) o esencialmente -equivalentes. Lord y Novick (1968) definen los
tests equivalentes como aquellos en los que las puntuaciones verdaderas de los
sujetos de una muestra son iguales en ambas formas, pero las varianzas de error
no tienen porqu ser iguales, y definen los tests esencialmente () tau-equiva-
lentes como aquellos en los que la puntuacin verdadera de cada sujeto en uno
de los tests es igual a la del otro ms una constante. Tanto en una situacin como
en otra se asume el cumplimiento del supuesto de igualdad de las varianzas ver-
daderas de ambas mitades.
Calculados los valores de las puntuaciones en los tems pares e impares, se
calcula la diferencia entre ellas y, a continuacin, su varianza (varianza de la di-
ferencia entre las puntuaciones).
[4.29]
193
1 PSICOMETRA
donde:
d = diferencias entre las puntuaciones de los elementos pares e impares de
cada uno de los sujetos.
S ~ = 5 ~ - i =varianza de la diferencia entre las puntuaciones pares e impares.
S ~ =varianza de las puntuaciones empricas de los sujetos.
EJEMPLO:
Hemos aplicado un test de fluidez verbal compuesto 6 tems a 6 sujetos. A con-
tinuacin se presentan las puntuaciones empricas obtenidas por los sujetos en el
test total, as como las obtenidas en los elementos pares e impares. Calcular el
coeficiente de fiabilidad del test.
p
(P-1) = d
A 4 3 1 2
B 1 1 o 1
e 6 3 3 o
o 2 1 1 o
E 3 1 2 -1
F 5 2 3 -1
X=4+1+6+2+3+s=
35
6 1
5
2
=
42
+ f +
62
+
22
+
32
+
52
- (3 5)
2
= 15 17-12 25 = 2 92
X
6
1 1 1 1
xd =o, 17
5
2
=
4
+
1
+
1
+
1
-(O 1 7)
2
= 1 14
d 6 1 1
Se ha obtenido un coeficiente de fiabilidad medio.
194
9.1.
F
frm
cacit
presi
dond
52
p
tivam
y
X
Ta1
ciona
relacit
EJE
Co1
zando
xp =1,
S ~ =0,
comop
mula dE
~ n t o s pares e impares de
aciones pares e impares.
sujetos.
6 tems a 6 sujetos. A con-
idas por los sujetos en el
e impares. Calcular el
(P-1) = d
1
2
o
1
3
o
1
o
2
-1
3
-1
-12, 25 = 2,92
14
LA FIABILIDAD DE LAS PUNTUACIONES 1
9.1.3. Guttman-Fianagan
Flanagan (1937) y Guttman (1945), de forma independiente llegaron a una
frmula equivalente a la de Rulon y que presenta una mayor sencillez de apli-
cacin. La frmula de Guttman-Fianagan viene determinada por la siguiente ex-
presin:
[4.30]
donde:
5 ~ y Sf = varianzas de las puntuaciones en los tems pares e impares respec-
tivamente.
5 ~ =varianza emprica del test total.
Tanto la ecuacin de Rulon como la ecuacin de Guttman-Fianagan propor-
cionan el mismo valor de la fiabilidad por ser expresiones equivalentes. Dicha
relacin aparece recogida al final del tema en el Apndice.
EJEMPLO:
Con los datos del ejercicio anterior, calcular el coeficiente de fiabilidad utili-
zando la frmula de Guttman-Fianagan.
- -
xp =1,83 X =1,66
5 ~ =0,81 5
2
=1,21
52= 32 +12 +32 +f +12 +22 -(183) 2 =416-3 35=0 81
p 6 ' ' ' '
R =2[1- 5,2 +Si J=2(1- 0,81+1,21)=0 61
XX 5
2
2 92 l
X 1
como puede observarse el resultado es el mismo que el obtenido mediante la fr-
mula de Rulon.
1 PSICOMETRA
9.2. Mtodos basados en la covariacin entre los tems
Al hablar de la fiabilidad como consistencia interna hemos hecho alusin a
dos formas de abordar el tema. Una forma es la basada en la divisin del test en
dos mitades. La segunda forma requiere un anlisis de la varianza y covarianza
de las respuestas de los sujetos a los tems. De esta forma, el coeficiente obte-
nido proporciona una estimacin de la consistencia interna de los tems del test.
En el presente apartado haremos referencia a algunos de los mtodos ms fre-
cuentes para estimar la fiabilidad de un test bajo estas condiciones como son el
coeficiente alpha de Cronbach (1951 ), los coeficientes KR20 y KR21 de Kuder-
Richardson (193 7). Tanto KR20 como KR21 pueden ser considerados como ca-
sos particulares del coeficiente alpha de Cronbach en el caso de que los tems
que forman el test sean dicotmicos.
9.2.1. Coeficiente alfa (a) de Cronbach
El coeficiente de Cronbach (1951) constituye un indicador de la consistencia in-
terna del test. Este coeficiente expresa la fiabilidad del test en funcin del nmero
de tems y de la proporcin de la varianza total del test debida a la covariacin en-
tre los tems. Cuanto ms covarien los tems entre s mayor ser la fiabilidad del test.
La ecuacin general del coeficiente alfa viene expresada como:
donde:
n
L,.L,.cov(jk)
n ,i"'_K ----=---
a=---
n -1 5
2
X
=-n (
1
-L,.5J)
n -1 5
2
X
[
n(r) ] n (5;- L,.5J)
= 1 + (n - 1)r = n - 1 5; =
n = nmero de elementos del test.
L.Sj = suma de las varianzas de los elementos del test.
L.L.cov (jk) = suma de las covarianzas de los tems.
S ~ =varianza de las puntuaciones en el test.
[4.31]
r
1
=cociente entre la covarianza media de los tems y su varianza media.
196
Ej
H
En la
cada
fic ier
EjE/1
Sien
averigu
1 O terr
los tems
a hemos hecho alusin a
t en la divisin del test en
la varianza y covarianza
rma, el coeficiente obte-
a de los tems del test.
de los mtodos ms fre-
condiciones como son el
KR20 y KR21 de Kuder-
r considerados como ca-
n el caso de que los tems
r de la consistencia in-
en funcin del nmero
da a la covariacin en-
ser la fiabilidad del test.
[4.31]
ms y su varianza media.
LA FIABILIDAD DE LAS PUNTUACIONES 1
EJEMPLO 1:
Hemos aplicado un test de percepcin visual a una muestra de seis sujetos.
En la tabla adjunta se presentan las puntuaciones que los sujetos obtuvieron en
cada uno de los cinco tems que forman el test. Se desea saber el valor del coe-
ficiente de fiabilidad del test.
A 3 4
B 2 3
e 4 2
D 2 1
E 1 1 1 2 1
F o o 1 1 1
X
1
=2;
X
2
= 1,83;
X
3
=1,67;
X
4
= 2,5;
X
5
= 2,33;
a= _n_(
1
- :s; ]= (
1
- 1,67 + 1,82 + 0,54 + 0,92 + 1,90 )=
0 94
n-1 S ~ 4 27,29 '
EJEMPLO 2:
Siendo la covarianza media entre todos los elementos de un test igual a 0,25,
averiguar el coeficiente de fiabilidad del test sabiendo que est compuesto por
1 O tems y que la varianza emprica es igual a 40 puntos.
197
1 PSICOMETRA
Para resolver el problema hay que partir de que la varianza de una variable
compuesta, suma de otras variables, es igual a la suma de las varianzas de todas
las variables ms la de las covarianzas, o bien a la suma de las varianzas ms los
n(n-1) trminos de covarianza media:
n n
s; = :s: +n(n - 1)r
1
kSJ; :s: = 40-10 9 0, 25=17,5
j=l j=l
a = .!_Q(1-
17
'
5
)=o 62
9 40
1
9.2. 7. 7 Estimador insesgado de a
El estimador insesgado de a propuesto por Feldt, Woodruff y Salih (1987) se
expresa como:
- (N-3)&+2
a = -'----'----
[4.32]
N - 1
donde:
a= estimador insesgado.
a= valor de alpha de Cronbach.
N= nmero de sujetos de la muestra.
A medida que aumenta el nmero de sujetos de la muestra, el valor del a en-
contrado y el valor del estimador insesgado se aproximan, siendo iguales cuando
N --too. En la prctica, a partir de 100 sujetos, se pueden considerar insignifi-
cantes las diferencias encontradas. Es decir:
[4.33]
Supongamos que en una muestra de 150 sujetos se les ha aplicado un test y
se ha obtenido un valor de a= 0,75.
198
Co
tre am
tra de
9.2. 7.
El e
ri or dE
coefic
Ell
Mui2
El e
test se
he m ~
Otr
ciente
donde
n=
5
2 -
J -
1rianza de una variable
e las varianzas de todas
de las varianzas ms los
0,25=17,5
druff y Salih (1987) se
[4.32]
uestra, el valor del a en-
n, siendo iguales cuando
n considerar insignifi-
[4.33]
les ha aplicado un test y
LA FIABILIDAD DE LAS PUNTUACIONES 1
a= (150-3)0,75+2 =O
75
150-1
1
Como se puede apreciar, a partir de 100 sujetos la diferencia encontrada en-
tre ambos estimadores es insignificante. Si por el contrario tuviramos una mues-
tra de 20 sujetos, las diferencias seran mayores.
a= (20-3)0,75+2 =O
78
20-1
1
9.2. 7 .2. El coeficiente a como lmite inferior del coeficiente de fiabilidad
El coeficiente a puede ser considerado como una estimacin del lmite infe-
rior del coeficiente de fiabilidad de un test, siendo su valor menor o igual que el
coeficiente de correlacin rxx (Guttman, 1945):
[4.34]
El lector interesado puede encontrar una demostracin de dicha relacin en
Muiz (1998).
El coeficiente a es igual al coeficiente de fiabilidad, rXX' cuando los tems del
test sean paralelos y, por tanto, satisfagan las condiciones de paralelismo que
hemos formulado con anterioridad.
Otro estimador del lmite inferior del coeficiente de fiabilidad es el coefi-
ciente 8 (delta) propuesto por Guttman (1945):
(
J
_ n_ 2,2,cov(j,k)
83 = 1 - . ~ + --'---'(_n_-_1-'-) _5_2 ___ _
j =l SX X
donde:
n = nmero de elementos del test.
sj = varianza del elemento j del test.
[4.30]
199
1 PSICOMETRA
S ~ = varianza del test total.
n
L,L,cov(j,k) = s; - L,sJ =suma de las covarianzas de los tems
j ~ l
9.2. 7 .3. Inferencias sobre a
Como acabamos de ver, el coeficiente a nos proporciona una estimacin de la
fiabilidad de un test basada en la consistencia interna del mismo. En ocasiones
queremos ir mas all, y nos planteamos cuestiones como, por ejemplo, si existe una
diferencia significativa entre el valor del coeficiente alfa obtenido en dos o ms
muestras independientes; si alfa puede tomar un valor concreto en la poblacin; si
la diferencia entre dos ms valores distintos de alfa para una misma muestra de
sujetos, es significativa o no; etc. Estos problemas referidos a las inferencias acerca
del coeficiente alfa, dieron lugar, a principios de los aos 60 del siglo veinte, al
desarrollo de la teora muestra! para el coeficiente alfa. Kristof (1963) y Feldt (1965),
de forma independiente, derivaron un estadstico de contraste del coeficiente alfa,
que se distribuye segn una distribucin F de Snedecor, a partir del cul se puede
determinar un intervalo confidencial para el valor de a en la poblacin.
Feldt (1969) deriva el estadstico W para el caso de que se quieran con-
trastar dos valores de alfa obtenidos en muestras independientes. Dicho mtodo
fue ampliado a n muestras independientes a partir del estadstico UX
1
pos-
tulado por Hakstian y Whalen (1976). Feldt (1980) desarroll un estadstico de
contraste para dos valores de alfa obtenidos en la misma muestra y, Woodruff y
Feldt (1986) ampliaron esta metodologa al caso de n coeficientes obtenidos
en la misma muestra.
a) Inferencias para un solo valor de a
Cuando estamos interesados en saber si alpha puede tomar un determinado
valor en la poblacin o, entre qu valores se encuentra alpha en la poblacin,
podemos aplicar el estadstico propuesto por Kristof (1963) y Feldt (1965) inde-
pendientemente. Es decir, una vez que hayamos obtenido un determinado valor
de alfa en una muestra de sujetos, podemos plantearnos la hiptesis de si el va-
lor obtenido es compatible con el hecho de que alfa tome un determinado va-
lor en la poblacin. El estadstico de contraste propuesto puede expresarse como:
200
1-a
F=-
1- &..
[4.36]
donde:
F=s
a =\
&., = v
N= r
n=n
El sig
rencia.
EJEMI
Su por
de 35 te
tenido ur
tadsticar
el coefici
La pri1
dsticamE
como h i ~
Puesto
blecido se
ticamente
La segu
tre los que
1
Obsrves
1 PSICOMETRA
1-a
---;::::0,67; a:s;1-0,67(1-0,83); a:s;0,89
1-0,83
0,76::::; a::::; 0,89
Al nivel de confianza del 95%, est comprendido entre los valores 0,76 y
0,89. Por tanto, el valor planteado por la Ho no est incluido en el intervalo.
b) Inferencias sobre alfa para muestras independientes
Analizaremos dos situaciones: dos muestras independientes y K muestras
independientes.
b. 1) Dos muestras independientes
Para el caso de dos muestras independientes, Feldt (1969) propuso el esta-
dstico de contraste W que permite comprobar la Ho: a
1
= a
2
donde:
~
~
W =se distribuye segn F con (N
1
- 1) y (N
2
- 1) grados de libertad.
&
1
y &
2
= valores del coeficiente alfa en cada una de las muestras.
N
1
y N
2
= nmero de sujetos de cada muestra.
EJEMPLO:
[4.37]
Hemos aplicado un test de razonamiento, a una muestra de 121 sujetos, ob-
teniendo un valor de alfa igual a 0,55 . Se aplic el mismo test a otra muestra de
61 sujetos, obtenindose un valor de alfa igual a 0, 62. Queremos saber si exis-
ten diferencias estadsticamente significativas entre los valores de ambos coefi-
cientes (N.C. 95%).
202
es E
tre
K
m u(
don
L
1<
u
S
a ~ 0, 76
a S 0,89
D entre los valores 0,76 y
1cluido en el intervalo.
dientes y K muestras
(1969) propuso el esta-
a1 =a2
os de libertad.
de las muestras.
[4.37]
uestra de 121 sujetos, ab-
Ismo test a otra muestra de
. Queremos saber si exis-
valores de ambos coefi-
LA FIABILIDAD DE LAS PUNTUACIONES 1
H
0
: a,= a
2
H, =a, -:t- a
2
W= 1-0,55 =118
1-0,62
1
f o,97s(l2o,6o) = 1, 58
fo,o2s( l2o,6o) = 0,63
Podemos afirmar, al N.C. 95%, que la diferencia entre ambos coeficientes no
es estadsticamente significativa puesto que el valor W = 1, 18 se encuentra en-
tre los valores encontrados.
b.2) K muestras independientes
Woodruff y Feldt (1986) ampliaron el estudio de Feldt (1969) para el caso de
K coeficientes obtenidos en K muestras independientes. Bajo la condicin de
muestras independientes han derivado el estadstico de contraste UX
1
:
donde:
k [ _X ]
2
L (1-&;) , -u
U X , = - - ~ - - ~ - - - - ~
52
[4.38]
UX
1
=se distribuye aproximadamente como X
2
con n-1 grados de libertad.
K= nmero de muestras o coeficientes.
&; = valor del coeficiente alfa para cada muestra.
u = media de los coeficientes transformados.
S
2
= media aritmtica de las varianzas de cada muestra.
203
1 PSICOMETRA
siendo:
y
= N(n -1)
' n + 1
donde:
N= nmero de sujetos en cada muestra.
n = nmero de tems en cada test.
EJEMPLO:
Se ha aplicado un test compuesto por 50 tems a tres muestras independien-
tes de 25, 40 y 50 sujetos. Para cada una de estas muestras se obtuvieron los si-
guientes valores de alfa: a
1
= 0
1
55
1
a
2
= 0
1
70 y a
3
= 0
1
75. Deseamos saber si
existen diferencias estadsticamente significativas para los valores de alfa obte-
nidos (N.C. 95%).
Ha : al = a 2 = a 3
Hl : al * a 2 * a 3
-x -x -x
u= (1-0
1
55)
3
+ (1-0,70)
3
+ (1-0
1
75)
3
=
1457
3 3 3
1
= 25(50 -1) = 24 02
1 50+ 1 1 1
2 2
51 = 7j = o 1 o 1 6
9(24102-1)(1-0155)
3
2 2
52= ?j =01013
9(38143 -1)(1- 0170)
3
= 40(50-1) =38 43
2 50+ 1 1 1
2 2
53 = 7j = o 1 o 11
9(48104 -1)(1- 0,75)
3
= 50(50- 1) = 48 04
3 50+ 1 1 1
52= 01016+01013+01011 =0 013
3 1
204
Pe
signi i
e) ln1
Er
la mi
depe1
mos e
Lo
traste
ficier
(198(
(198E
C.}
Fel
dos v
comiE
nme
muestras independien-
estras se obtuvieron los si-
0,75. Deseamos saber si
los valores de alfa obte-
1,457
x =o,o16
-0,55)
3
f----x;;-;- =o, o13
- 0,70)
3
.....-----,x;;-;- = o, o 11
-0,75)
3
LA FiAB!L!DAD :lE lAS PU:'iTUACICNES
[(1-0,55)-y
3
-1,457 r [(1-o, 7ofX -1,457 r
ux = + +
1
O, 013 O, 013
[
V ]2
(1 -0,75)
73
-1,457
+ =1,778+0,104+1,308=3,19
0,013
g./.(n- 1) = 2;
= 7, 3 8
=O, 05
Podemos afirmar, al N.C. 95%, que no existen diferencias estadsticamente
significativas entre los distintos valores de alpha.
e) Inferencias sobre alfa para muestras dependientes
En algunos diseos experimentales es posible administrar distintas pruebas a
la misma muestra de sujetos. En estas situaciones los coeficientes obtenidos son
dependientes y no podemos emplear ninguno de los dos contrastes que acaba-
mos de estudiar.
Los primeros estudios llevados a cabo para establecer un estadstico de con-
traste que nos permitiera ver si existen diferencias significativas entre dos coe-
ficientes obtenidos en la misma muestra, fueron llevados a cabo por Feldt
(1980) y, posteriormente desarrollados para K muestras por Woodruff y Feldt
(1986).
c. 7) Dos muestras dependientes
Feldt (1980, 1987) propuso el empleo del estadstico de contraste t para
dos valores de alfa obtenidos a partir de una misma muestra de sujetos. Feldt re-
comienda el empleo de este estadstico cuando N n 1.000, siendo N igual al
nmero de sujetos y n el nmero de tems. El estadstico se expresa como:
(
& -& ).JN-2
t = 1 2
4 ( 1 - &
1
) ( 1 - &2 ) ( 1 -

) ]
[4.39]
205
1 PSICOMETRA
donde:
t =se distribuye segn una distribucin t de Student con (N- 2) grados de li-
bertad.
&, y &
2
= valores del coeficiente alfa.
N= nmero de sujetos en la muestra.
G x =correlacin al cuadrado entre las puntuaciones de los SUJetos en los dos
1 2
tests.
EJEMPLO:
Aplicamos dos tests de percepcin visual a una muestra de 125 sujetos. La co-
rrelacin entre las puntuaciones de ambos tests es igual a 0,70. Los valores del
coeficiente alfa fueron, respectivamente: 0,75 y 0,84. Queremos saber si la di-
ferencia existente entre ambos valores es estadsticamente significativa o no
(N.C. 95%).
t= =3 50
4(1-0,84)(1-0,75)(1-0,70
2
)] '
t (N-2) = t1 23 = 1, 96
Se rechaza la hiptesis nula y podemos establecer que la diferencia entre los
coeficientes es estadsticamente significativa.
c.2) rrK muestras dependientes
Para el caso de K muestras, Woodruff y Feldt (1986) presentaron una serie
de estadsticos de contraste entre los que cabe resaltar, por su sencillez de apli-
cacin y gran precisin, el estadstico UX
2
.
[4.40]
206
dond
u;
K=
N
u=
donde
siendo
y
donde:
n= 1
C=
nt con (N- 2) grados de li-
es de los sujetos en los dos
de 125 sujetos. La co-
a! a 0,70. Los valores del
. Queremos saber si la di-
amente significativa o no
=3,50
que la diferencia entre los
986) presentaron una serie
r, por su sencillez de apli-
[4.40]
LA FIABILIDAD DE LAS PUNTUACIONES 1
donde:
UX
2
=se distribuye aproximadamente igual a X
2
con (K-1) grados de libertad.
K= nmero de muestras o coeficientes.
N= nmero de sujetos de la muestra.
U; = valor de los coeficientes alfa.
u = media de los coeficientes transformados.
S
2
= media aritmtica de las varianzas de cada muestra .
donde:
siendo:
y
donde:
= N(-1)
+ 1
= -f-- (media armnica de las longitudes de los tests)
:_!_
i=l n;
n = nmero de tems de cada test.
C = media de las covarianzas Sk.
207
1 PSICOMETRA
EJEMPLO:
Se aplicaron 3 versiones de un cuestionario de ansiedad a una muestra de
100 sujetos. Los cuestionarios estaban compuestos de A = 50, B = 60 y e= 65
tems respectivamente. Los coeficientes alfa obtenidos fueron: aA = 0,60, a
8
=
0, 70 y a e = 0, 74. Las correlaciones entre las puntuaciones de los sujetos fueron:
rAB = 0,50; rAe = 0,58 y r
8
e = 0,59. Calcular, al N.C. 95%, si existen diferencias
significativas entre los valores de los coeficientes a obtenidos:
u= 11(1-0 60)/j + 11(1-0 70)/j + 11(1-0 74)/j =0 25+0 22+0 21=0 68
/3 ' / 3 ' /3 ' ' ' ' '
3
= 1 1 1 =58, 82
- + - +-
50 60 65
= 1 00(58, 82) = 96 65
58,82-1 '
2
S ~ =
2
= 0,0042
9(96, 65 -1)(1- O, 60)
3
2
S ~ =
2
= 0,0052
9(96, 65 -1)(1- o, 70)
3
2 2
Se = 7j =0,0057
9(96,65 -1)(1- 0,74)
3
5 2= S
2
= 0,0042 + 0,0052 + 0,0057 = 0,0050
i=l k 3
e = 2(0,50)2 =o 0011
AB 11 1 '
9(96, 65 -1)(1- o, 60)1
3
(1- 0,70)
3
208
u
9.2
en E
re m
cior
alp
tima
m ay
m ay,
T(
elerr
caso
riabl,
en el
iedad a una muestra de
r = 50, 8 = 60 y e = 65
tueron: uA = 0,60, ua =
1es de los sujetos fueron:
%, si existen diferencias
nidos:
25 + 0,22 + 0,21 = 0,68
2
= 0, 0050
=0,0011
LA FIABILIDAD DE LAS PUNTUACIONES 1
e = 2(0,58)2 =o oo16
~ X X '
9(96,65-1)(1-0,60)
3
(1 - 0,74)
3
e = 2(o; 59)2 =o oo1 9
BC X X 1
9(96,65-1)(1-0,70)
3
(1-0,74)
3
C = o,oo11+0,0016+0,0019 = O
0015
3(3 -1)
1
2
[(1-0,60fx - 0,68 r [(1 - 0,70fx - 0,68 J [(1-0,74fx -0,68 r
ux = + + =
2
0,0035 0,0035 0,0035
= 131,03 + 189,22 + 224,68 = 544,93
g.!.(n - 1) = 2;
x;9752 = 7,38
x;o2s2 =o,o5
Dado que el valor obtenido est fuera del intervalo podemos afirmar, al N.C.
95%, que existen diferencias estadsticamente significativas entre los distintos va-
lores de alpha y, por lo tanto, rechazar la H
0
.
9.2.2. Casos particulares del coeficiente a
En este punto hacemos referencia a la estimacin de la fiabilidad de un test
en el caso de que los tems que lo componen sean dicotmicos, para lo cual ha-
remos referencia a los estudios de Kuder y Richardson (1937, 1939). Las ecua-
ciones de Kuder-Richardson (1937) representan un caso particular del coeficiente
alpha de Cronbach, en el supuesto de que los tems sean dicotmicos. Esta es-
timacin es una funcin del nmero de tems y sus intercorrelaciones. Cuanto
mayor sea el nmero de tems, y cuanto mayor sea el valor de sus covarianzas,
mayor ser su consistencia interna, y mayor ser la fiabilidad.
Teniendo en cuenta que la ecuacin de Kuder-Richardson se basa en que los
elementos del test son dicotmicos, stos vendrn puntuados con un 1, en el
caso de acierto (o de respuesta favorable en el caso de que se traten de medir va-
riables no cognitivas) y, con un O, en el caso de fallo (o respuesta desfavorable
en el caso de variables no cognitivas).
209
1 PSICOMETRA
Como ya se ha visto, el coeficiente alpha puede expresarse:
a=-n [1- L5J)
n -1 5
2
X
Sabemos, por otra parte, que la varianza de una variable dicotmica cual-
quiera, h, con proporcin de aciertos Ph, y proporcin de errores qh, siendo
qh = 1 - Ph podemos expresarla en los siguientes trminos:
1
con lo que la ecuacin del coeficiente alpha que acabamos de ver puede es-
cribirse:
[4.41]
donde:
n = nmero de elementos del test.
Ph =proporcin de aciertos en el elemento h. ph = fh, igual tambin a la me-
dia del elemento. N
qh = proporcin de errores en el elemento h. qh = 1 - Ph
Phqh =varianza del elemento h.
5; = varianza total del test.
Dicha expresin recibe el nombre de ecuacin de Kuder-Richardson20 (KR20).
Si los tems que componen el test, adems de ser dicotmicos, presentan la
misma dificultad, podemos aplicar la ecuacin de Kuder-Richardson 21 (KR21).
KR = _ n_(1- npq)
21 n - 1 5 2
X
[4.42]
210
expresarse:
variable dicotmica cual-
cin de errores qh, siendo
illinos:
bamos de ver puede es-
[4.41]
~ igual tambin a la me-
N'
der-Richardson20 (KR20).
dicotmicos, presentan la
r-Richardson 21 (KR21 ).
[4.42]
LA FIABILIDAD DE LAS PUNTUACIONES 1
donde:
n = nmero de elementos del test.
npq = suma de las varianzas de los elementos. Al ser iguales las varianzas se
sustituye el signo sumatorio por n veces la misma varianza.
s; = varianza del test.
La expresin anterior se puede simplificar y expresarse en los siguientes tr-
minos:
X- -
KR2, =-n- 1- 2 n
[
- p l
n - 1 Sx
donde:
n = nmero de elementos del test.
s; = varianza del test.
X media de las puntuaciones empricas.
EJEMPLO:
[4.43]
Supongamos un test (A) de fluidez verbal y otro test (8) de comprensin lec-
tora, cuyas puntuaciones aparecen en las siguientes matrices de datos. El test de
fluidez verbal slo admite dos posibles puntuaciones, 1 y O. Calcular el valor
del coeficiente de fiabilidad de ambos tests.
_ Test A . Test B
tems tems
Sujetos A B e D E F Sujetos A B e D E F
1 1 1 1 1 1 1 1 3 4 3 3 4 3
2 1 1 1 o 1 1 2 2 3 2 4 4 2
3 1 o 1 o 1 1 3 4 2 2 3 3 4
4 o 1 o 1 o 1 4 2 1 1 2 1 2
5 o o o o o o 5 1 1 1 2 1 2
6 1 o o o o o 6 o o 1 1 1 1
211
1 PSICOMETRA
Medias de los tems en el Test B:
x, = 2; X
2
= 11 83; X
3
= 1167 ; X
4
= 21 5; X
5
= 2133 y X
6
= 2
1
33
TESTA
4
P
=- =0 67
1 6 1
3
P
=-=0 50
2 6 1
3
P
=- =0 50
3 6 1
2
P
= -=0 33
4 6 1
3
P
=- =0 50
5 6 1
4
P
=-=o 67
6 6 1
XA=3117
4
1
45
TEST B
q, = 1 - o 1 6 7 = o 1 3 3 p,q, = 0167.0133 = 0122
q2 = 1-0150 = 0150
q2 = 1- 0150 = 0150
q4 = 1- 0133 = 0167 p4q4 = 0133.0167 = 0122
q
5
=1-0
1
50 =0
1
50 p
5
q
5
= 0150 0
1
50 = 0
1
25
q6 =1-0167=0133
s,2 = -(xf =
52 = 1 6 + 9 + 4 + 1 + 1 - (1 83)2 = 1 82
2 6 1 1
52= 9+4+4+1+1+1_(167)2 =0 54
3 6 1 1
52 = 9 + 16 + 9 + 4 + 4 + 1 - (2 50)2 =o 92
4 6 1 1
52 = 16 + 16 + 9 + 1 + 1 + 1 - (2 33)2 = 1 90
5 6 1 1
212
(
5
2-_:
6 -
--
r
=O
En el
tendr u
cotmio
Como
inferior al
estrictam1
9.3. (o{
The
-
Los COE
de Heise)
terna de le
dos coefic
El coefi
33 yX
6
=2,33
7 0,33=0,22
50 0,50=0,25
500,50=0,25
33 0, 67=0,22
5
00 50=0,25
' '
670,33 =0,22
LA FIABILIDAD DE LAS PUNTUACIONES 1
52 = 9 + 4 + 16 + 4 + 4 + 1 - (2 33)2 =o 90
6 6 ' '
x =
76
= 12 67 5
8
2
=
117 4
-12 67
2
= 35 14
B 6
1 1
6
1 1
R = KR = _n_(1- LPhqh J=
aa 20 n -1 52
X
0,22+0,25+0,25+0,22+0,25+0,22)=0 82
5 4,45 '
R =a=-n-[
1
_:L5J


bb n-1 5; 5 35,14
=0,94
En el caso de aplicar KR
21
con tems cuya dificultad no es la misma, se ob-
tendr un valor inferior al de KR
20
En el test A, que es el que tiene los tems di-
cotmicos el valor encontrado sera:
KR = _n_ 1- n = 1- ' l
6
=O 80
[
x _ x
2
] [
3 1 7
_ l
21
n-1 5; 5 4, 45 '
Como se puede observar el valor obtenido mediante la frmula KR
21
es algo
inferior al obtenido mediante la KR
20
, lo que indica que los tems del test no son
estrictamente paralelos.
9.3. Coeficientes basados en el anlisis factorial de los tems:
Theta (9) y Omega (!l)
Los coeficientes Theta (8) de Carmines (Carmines y Zeller, 1979) y Omega (Q)
de Heise y Bohrnstedt (1970) constituyen dos indicadores de la consistencia in-
terna de los tems de un test y una aproximacin al coeficiente alpha. Se trata de
dos coeficientes basados en el anlisis factorial de los tems.
El coeficiente e se puede expresar mediante la siguiente frmula:
213
1 PSICOMETRA
e=-n (1-_2_)
n -1 A.
1
[4.44]
donde:
n = nmero de tems del test.
lv
1
=primer autovalor de la matriz factorial; es decir, la varianza explicada por
el primer factor antes de la rotacin.
El coef i ciente e es adems un indicador de la unidimensionalidad de los
tems. Cuanto mayor sea la varianza que explica el primer factor mayor ser el
valor de theta y, por consiguiente, la intercorrelacin entre los tems, lo que im-
plica que stos se distribuyan en torno a una sola dimensin.
El coeficiente n se puede expresar mediante la siguiente frmula:
donde:
n n
"52 -" 52h2
L., L.,
n = 1 - ---'--
1
; -
1
----'-
1
;-
1
--
n n
::cov(X
1
,Xh)
j;J h;J
i"h
2.5} = suma de las varianzas de los tems.
h} = comunalidad estimada del tem j.
2.2.Cov (Xj , Xh) =suma de las covarianzas entre los tems j y h.
[4.45]
Otra forma ms sencilla de expresar el coeficiente n es en funcin de lasco-
rrelaciones entre los tems:
0=1-----
[4.46]
Donde rjh representa la correlacin entre los tems j y h.
En general , y para los mismos datos, se verifica que a:::; e:::; n. La igualdad en-
tre los coefici entes se verifica cuando los tems son paralelos (Carmines y Sller,
1979).
214
E J E ~
En 1
cinco f.
de las
tems e
9.4. El
-
Cronl
sistencia
con desi
test total
coeficier
de la fial
rar este r
test com
coeficier
de los &
es mejor
E
[4.44]
la varianza explicada por
idimensionalidad de los
mer factor mayor ser el
ntre los tems, lo que im-
iente frmula:
[4.45]
tems j y h.
Q es en funcin de lasco-
[4.46]
a ~ e O . . La igualdad en-
el os (Carmines y Sller,
LA FIABILIDAD DE LAS PUNTUACIONES 1
EJEMPLO:
En la siguiente tabla aparecen los valores de la varianza explicada por los
cinco factores obtenidos tras someter a un anlisis factorial a 5 variables. La suma
de las comunalidades es igual a 4.95 y la suma de las correlaciones entre los
tems es igual a 5.1. Calcular el valor de los coeficientes 8 y n.
Factor Varianza explicada
1 3,286
2 1,346
3 0,224
4 0,128
5 0,014
8 = _n_(1 - _2_)= -
5
- (1--
1
-)= 0,869
n-1 A
1
5-1 3,286
n- Lh2
n = 1- ' = 1-
5
-
4
'
95
= o 996
2
~ 5 + 2 o 5,1
1
n + L./Jh
9.4. El coeficiente beta (J3) de Raju
Cronbach (1951) introdujo el coeficiente alfa como una medida de la con-
sistencia interna de un test. En el caso de que un test se divida en varios subtests,
con desigual nmero de tems, y se quiera estimar la consistencia interna del
test total a partir de las puntuaciones totales de los sujetos en los subtests, el
coeficiente alfa presenta el problema de que proporciona un valor infraestimado
de la fiabilidad. El coeficiente f3 propuesto por Raju (Raju, 1977) permite supe-
rar este problema y proporciona una estimacin adecuada de la fiabilidad de un
test compuesto de varios subtests con distinto nmero de tems. Se aplica este
coeficiente cuando se desconocen las puntuaciones de los sujetos en los tems
de los distintos subtests. En el caso de conocer los valores de estas puntuaciones
es mejor emplear el coeficiente a.
El coeficiente f3 viene dado por la expresin:
215
1 PSICOMETRA
donde:
k = nmero de subtests.
s; = varianza del test.
Sj = varianza de cada subtest.
nj = nmero de tems en cada subtest.
N= nmero de tems total de la batera.
EJEMPLO:
[4.47]
Hemos aplicado un test de destreza manual, compuesto de cuatro subtests, a
una muestra de 200 empleados de correos. Los subtests estn compuestos por
A = 18, 8 = 30, C = 45 y O = 55 tems respectivamente. La varianza total del test
es igual a 50 y las varianzas de los respectivos subtests iguales as; = 5, Sb = 7,
S ~ = 9 y ~ = 11. Calcular el valor de los coeficientes a y p.
a= _ 4_ (
1
- 5 + 7 + 9 + 11 )=
0 48
4-1 50
1
~ = 50- (5 + 7 + 9 + 11) =o 50
50[1 - (0,015+0,041+0,092+0,138)]
1
En el caso de que los distintos subtests contengan el mismo nmero de tems, en-
tonces el coeficiente p es igual al coeficiente a. (Vase Apndice al final del tema)
1 O. ESTIMACIN DE LA PUNTUACIN VERDADERA DE LOS
SUJETOS EN El ATRIBUTO DE INTERS
Una vez estudiado el problema de cmo poder calcular la fiabilidad de un
test mediante los procedimientos descritos anteriormente, estamos en condicio-
216
[4.47]
, esto de cuatro subtests, a
estn compuestos por
La varianza total del test
igual es a = 5, Sb = 7,
a
ismo nmero de tems, en-
Apndice al final del tema)
ERDADERA DE LOS
S
lcular la fiabilidad de un
estamos en condicio-
LA FIABILIDAD DE LAS PUNTUACIONES 1
nes de poder abordar el problema de cmo hacer estimaciones acerca del valor
de la puntuacin verdadera de un sujeto en un test y del error que afecta a las pun-
tuaciones empricas obtenidas en el mismo. Desgraciadamente no podemos cal-
cular el valor exacto de la puntuacin verdadera de un sujeto, pero s establecer
un intervalo confidencial dentro del cual se encontrar dicha puntuacin con un
determinado nivel de confianza. Dentro de este apartado veremos tres formas de
llevar a cabo esta estimacin: la primera mediante la desigualdad de Chebychev,
la segunda basada en la distribucin normal de los errores y, la tercera basada en
el modelo de regresin lineal de mnimos cuadrados.
1 0.1. Estimacin mediante la desigualdad de Chebychev
Si no se hace ningn supuesto sobre la distribucin de las puntuaciones em-
pricas o de los errores, se aplica la desigualdad de Chebychev:
[4.48]
donde:
1---; =nivel de confianza utilizado.
K
Se = error tpico de medida.
EJEMPLO:
Habiendo administrado a una muestra de 200 sujetos un test de razonamiento
numrico, se obtuvieron los siguientes resultados: X= 52, Sx = 7 y rxx = 0,73. Es-
timar la puntuacin verdadera de un sujeto que obtuvo en el test una puntuacin
emprica de 65 puntos. Nivel de confianza del 95%.
se = SX ( XX = 7 .j1- o, 73 = 3, 64
1
1--
2
=O, 95; K = 4, 5
K
P{l65- 3,64 . 4,5} 2 o, 95
0,95
P{48,62 81,38} 2 0,95
217
1 PSICOMETRA
Por lo tanto, la puntuacin verdadera se encontrar entre los valores 48,62 y
81,38. Este es, sin embargo, un intervalo confidencial demasiado amplio que
conlleva una estimacin vaga. Esta amplitud exagerada del intervalo confiden-
cial puede ser debida, en primer lugar, a un coeficiente de fiabilidad bajo o, en
segundo lugar, a que el mtodo de Chebychev no considera el tipo de distribu-
cin de las puntuaciones empricas.
1 0.2. Estimacin basada en la distribucin normal de los errores
Este mtodo asume una distribucin normal de los errores de medida (con
media O y varianza S ~ ) y de las puntuaciones empricas condicionadas a un de-
terminado valor de V.
Para la determinacin del intervalo confidencial dentro del que se encontrar
la puntuacin verdadera del sujeto seguiremos los siguientes pasos:
1) Se fija un nivel de confianza y se determina el valor Zc correspondiente
buscndolo en la tabla de distribucin normal. Por ejemplo, para un nivel
de confianza del 95% tendremos un valor Zc igual a 1,96.
2) Calcular el error tpico de medida Se.
se= sX.J1- (XX para puntuaciones directas 0 diferenciales
Sze = .j1- rxXI para puntuaciones tpicas
3) Calcular el error de medida mximo (fmxl que estamos dispuestos a ad-
mitir. Este error de medida se ver afectado tambin por el nivel de con-
fianza adoptado.
4) Calcular el intervalo confidencial en el que se encontrar la puntuacin
verdadera.
IC =X Emx
EJEMPLO:
Habiendo administrado a una muestra de 200 sujetos un test de razonamiento
numrico, se obtuvieron los siguientes resultados, X= 52, Sx = 7 y rxx = 0,73. Es-
timar la puntuacin verdadera (en puntuaciones directas, diferenciales y tpicas)
218
entre los valores 48,62 y
demasiado amplio que
del intervalo confiden-
de fiabilidad bajo o, en
idera el tipo de distribu-
mal de los errores
errores de medida (con
condicionadas a un de-
del que se encontrar
ientes pasos:
lor Zc correspondiente
r ejemplo, para un nivel
a 1 ,96.
renciales
estamos dispuestos a ad-
in por el nivel de con-
contrar la puntuacin
un test de razonamiento
2, Sx = 7 y rxx = 0,73. Es-
diferenciales y tpicas)
LA FIABILIDAD DE LAS PUNTUACIONES 1
de un sujeto que obtuvo en el test una puntuacin emprica directa de 65 pun-
tos. N.C. 95%.
X= 65 ; X= 65- 52= 13 ;
z = 65- 52 = 1 86
X 7 f
N.C.95%:::::} Zc = 1, 96
fmx =Zc Se =1,963,64=7,13
{
72, 13
1 e = X Emx = 65 7,13 ~ ; 57,85 V ~ 72,13 (Puntuaciones
57
,
87
Directas)
{
20, 13
1 e =X Emx = 13 7,13 ~ ; 5,87 ~ V ~ 20,13
5,87
Sz. = ~ 1 - rxx = .J1- 0,73 =O, 52
fmx = Zc Sze = 1, 96 0,52 = 1,02
{
2,88
l.e = Zx fmx = 1,86 1,02 ~
0,84
O, 84 Zv 2, 88 (Puntuaciones Tpicas)
(Puntuaciones
Diferenciales)
Como se puede apreciar, con respecto a la estimacin segn el procedimiento
de Chebychev, el intervalo confidencial se ha reducido sensiblemente.
La principal ventaja que presenta la utilizacin de un intervalo confidencial,
a pesar de las crticas formuladas por Nunnally (1970), es que clarifica el hecho
de que una puntuacin emprica est afectada por un cierto error de medida. Es
decir, si un test presenta un coeficiente de fiabilidad bajo y, consiguientemente,
poca precisin de medida, los intervalos confidenciales son muy amplios. A me-
dida que dichos coeficientes van incrementndose, los valores extremos del in-
tervalo se acotan denotando una aproximacin a la puntuacin verdadera del su-
jeto (Al len y Yen, 1979; Yela, 1984).
219
1 PSICOMETRA
1 0.3. Estimacin basada en el Modelo de Regresin
As como la correlacin entre las puntuaciones verdaderas y los errores de
medida es igual a cero (rve = 0), no sucede lo mismo entre la correlacin de las
puntuaciones empricas de los sujetos y los errores de medida, puesto que dichas
puntuaciones se ven afectadas por un cierto componente de error producin-
dose un sesgo. Esta correlacin vendr expresada, como ya hemos visto, como
( Xe = .J1 - (XX
La correlacin as establecida es siempre igual o mayor de cero. Su valor m-
ximo se alcanzar cuando la fiabilidad del test sea nula (rxx =O) y su valor m-
nimo se alcanzar cuando la fiabilidad del test sea perfecta (rxx = 1 ). En el pri-
mer caso las puntuaciones empricas coincidirn con los errores y, en el segundo
caso, no habr errores y las puntuaciones empricas coincidirn con las verda-
deras.
En cualquier caso, como esa correlacin es siempre positiva, las puntuacio-
nes empricas son siempre sesgadas y, por lo tanto, es ms conveniente estable-
cer el intervalo confidencial no a partir de las puntuaciones empricas (que son
sesgadas) sino a partir de la puntuacin verdadera estimada, que podremos cal-
cular mediante el modelo de regresin lineal segn el criterio de mnimos cua-
drados.
Las ecuaciones de la recta de regresin de Y sobre X vienen expresadas por
las siguientes ecuaciones:
1 - S - S S ( - ) -
Puntuaciones Directas: Y'= (Y- rxy _____!:'_X)+ rxy _____!:'_X= rxy _Y X- X +Y
sx sx sx
, sy
- Puntuaciones Diferenciales: y = rxy- X siendo X= (X- X)
sx
X-X
- Puntuaciones Tpicas: ZY, = rxy z x siendo Zx =-S-
x
Nota: El lector interesado puede encontrar una explicacin ms detallada en los tex-
tos de Introduccin al Anlisis de Datos y Diseos de Investigacin.
A partir de dichas ecuaciones de regresin podemos establecer las ecuacio-
nes correspondientes para estimar el valor de la puntuacin verdadera. Dichas
ecuaciones vendrn expresadas de la siguiente forma:
220
as y los errores de
tre la correlacin de las
ida, puesto que dichas
te de error producin-
ya hemos visto, como
r de cero. Su valor m-
a (rxx =O) y su valor m-
cta (rxx = 1 ). En el pri-
s errores y, en el segundo
incidirn con las verda-
positiva, las puntuacio-
s conveniente estable-
ones empricas (que son
ada, que podremos cal-
criterio de mnimos cua-
X vienen expresadas por
S - ) -
X= r _l'_ (X- X +Y
xy S
X
establecer las ecuacio-
cin verdadera. Dichas
LA FIABILIDAD DE LAS PUNTUACIONES 1
1. Ecuacin de regresin en puntuaciones directas de V sobre X.
[4.49]
S S S - -
Sabemos que, rxv ---". = ---". ---". = rx: = rxx y dado que V = X podemos estable-
cer que: Sx Sx Sx
- -
V' = rxx x +(X - (XX X)
[4.50]
V' = rxx(X - X) + X
2. Ecuacin de regresin en puntuaciones diferenciales.
sv d 1 s v sv s:
COmO rxv = - ten remos que: V = --X = -
2
X = r X
S SS S XX
X X X X
1
V=rxxX
v' = rxx (X- X)
3. Ecuacin de regresin en puntuaciones tpicas.
EJEMPLO:
[4.51]
[4.52]
Con los datos del ejemplo anterior, estimar la puntuacin verdadera de un
sujeto que obtuvo en el test una puntuacin emprica de 65 puntos. N.C. 95%
Puntuaciones directas:
V'= rxx X +(X- rxx X) = 0,73 65 +(52 -0,73 52)= 47,45 + 14,04 = 61,49
Puntuaciones diferenciales:
v' = rxx X= 0,73 (65 - 52) = 9,49
221
1 PSICOMETRA
Puntuaciones tpicas:
65-52
zv' = rxv. z x = .JoJ3. = 0,85 1,86 = 1,58
7
Una vez estimado el valor de la puntuacin verdadera se seguir el esquema
general con el fin de establecer el intervalo confidencial en el que se pueda acep-
tar, a un determinado nivel de confianza, que se encuentra la puntuacin ver-
dadera del sujeto. Los pasos a seguir seran los siguientes:
222
Adoptar un nivel de confianza y determinar el valor zeta crtico (Zc)
Calcular el error tpico de estimacin Svx- Siendo:
Svx = Sx_j1- rxx .fr:: (Puntuaciones directas o diferenciales)
Szvzx = _j1- rxx .fr:: (Puntuaciones tpicas)
Calcular el error mximo de estimacin fmx Siendo fmx = Zc Svx en
puntuaciones directas o diferenciales y Emx = Zc Szvzx en puntuaciones
tpicas.
Establecer el intervalo confidencial a partir de la estimacin puntual ob-
tenida al aplicar las ecuaciones de regresin.
Dicho intervalo viene expresado por: V' Emx' v' fmx' Zv' fmx
Para los datos del ejemplo anterior tenemos:
N.C. 95% => Zc = 1,96
Svx =Sx-J1-rxx .fr:: = 3,09
fmx = zc. se= 1,96. 3,09 = 6,06
' {67,55
IC =V fmx = 61,49 6,06---7
55,43
{
15,55
/.C.=v'fmx =9,49 6,06---7
3,43
En puntuaciones directas
En puntuaciones diferenciales
Szvzx = .j1- rxx Jr:: = .j1- 0,73.JOJ3 = 0,44
de
Si e
6 = 1,58
rase seguir el esquema
en el que se pueda acep-
entra la puntuacin ver-
es:
1l or zeta crtico (Zc).
ferenciales)
do Emx = Zc Svx en
Szvzx en puntuaciones
estimacin puntual ob-
iones directas
ones diferenciales
fmx = Zc SZvZx = 1,96 0,44 = 0,86
{
2,44
f.C.= Zv. Emx = 1,58 0,86
0,72
LA FIABILIDAD DE LAS PUNTUACIONES 1
En puntuaciones tpicas
11. FIABILIDAD DE UNA BATERA DE TESTS
Se trata de calcular la fiabilidad de la batera en funcin de los coeficientes
de fiabilidad, varianzas y covarianzas de los subtests que la van a conformar.
La frmula a utilizar en este caso ser:
Siendo:
s; = varianza del subtest j.
rjj =coeficiente de fiabilidad del subtestj.
5} = varianza de la batera total.
223
1 PSICOMETRA
12. EJERCICIOS DE AUTOEVALUACIN
1. La razn entre la desviacin tpica de los errores y la desviacin tpica de
las puntuaciones empricas es 0,45. Cul es el valor del coeficiente de
fiabi 1 idad?
2. Calcular el coeficiente de fiabilidad de un test sabiendo que la varianza de
las puntuaciones empricas es igual a 36 y el error tpico de medida es 3.
3. Cul es el valor del coeficiente de fiabilidad si la proporcin de varianza
verdadera que hay en la varianza emprica de un test es O, 90?
4. Hemos aplicado un test a un grupo de 100 sujetos. La desviacin tpica de
los errores de medida es 2, lo que significa el 10% de la varianza de las
puntuaciones verdaderas. Calcular el coeficiente de fiabilidad de dicho
test.
5. Hemos aplicado un test de fluidez verbal a un grupo de 150 sujetos. La va-
rianza de las puntuaciones empricas de los sujetos de dicho grupo fue 36
y el coeficiente de fiabilidad 0,85.
Calcular:
224
a) El error tpico de medida del test.
b) El intervalo confidencial dentro del cual podemos afirmar que se en-
contrar la puntuacin diferencial verdadera de un sujeto cuya pun-
tuacin tpica emprica fue de 0,75 (N.C. 99%).
6. El Instituto Nacional de Calidad desea examinar el nivel de conocimien-
tos en el rea de Humanidades de los alumnos al finalizar la educacin
obligatoria. Para ello, construye una prueba de cinco preguntas cortas, ca-
lificadas en una escala de 1 a 5 cada una de ellas; esta prueba se admi-
nistra a una muestra representativa de 2.000 alumnos procedentes de to-
das las comunidades autnomas. En la tabla adjunta se presentan las
respuestas dadas a las preguntas de dicha prueba por los seis primeros
alumnos de la muestra.
Calcular:
a) La fiabilidad de la prueba.
b) Si se aadieran a la prueba 5 preguntas paralelas a las ya existentes, se
obtendra un coeficiente de fiabilidad significativamente diferente al
anterior? La correlacin entre las puntuaciones del test original y del
alargado es 0,85 (N.C. 95%).
~ s y la desviacin tpica de
~ 1 valor del coeficiente de
abiendo que la varianza de
ror tpico de medida es 3.
la proporcin de varianza
n test es O, 90?
. La desviacin tpica de
O% de la varianza de las
te de fiabilidad de dicho
de 150 sujetos. La va-
de dicho grupo fue 36
mos afirmar que se en-
de un sujeto cuya pun-
r el nivel de conocimien-
al finalizar la educacin
neo preguntas cortas, ca-
ll as; esta prueba se admi-
mnos procedentes de to-
adjunta se presentan las
por los seis primeros
as a las ya existentes, se
cativamente diferente al
es del test original y del
LA FIABILIDAD DE LAS PUNTUACIONES 1
e) Estimar la puntuacin verdadera en el test original del alumno nmero
4.
1 3 2 4 3 4
2 2 3 4 3 2
3 5 4 3 4 5
4 2 1 3 2 1
5 3 2 2 1 3
6 4 5 4 5 4
7. Ejercicios conceptuales
A continuacin se ofrecen una serie de enunciados ante los que tendr
que responder si son verdaderos o falsos:
1. Si dos tests son paralelos, las medias de las puntuaciones empricas de-
ben ser iguales
2. El coeficiente de fiabilidad expresa la proporcin de la varianza verda-
dera que hay en la varianza de las puntuaciones empricas.
3. El coeficiente a es un ndice de la estabilidad de las medidas.
4. Un test tiene un nico coeficiente de fiabilidad.
5. En el caso de que un test est formado por tems dicotmicos de igual
nivel de dificultad, el mejor estimador del coeficiente de fiabilidad lo
constituye la ecuacin KR21.
6. Si un test tiene un coeficiente de fiabilidad igual 0,80, el ndice de fia-
bilidad es igual a 0,64.
7. Si se cumple que 5 ~ = 5; el coeficiente de fiabilidad rxx = 1.
8. Para calcular la fiabilidad de un test mediante el mtodo de dos mita-
des, aplicamos el test una sola vez.
9. En la frmula de Spearman-Brown, n indica el nmero de tems del test.
1 O. Se define el error tpico de medida como la desviacin tpica de los
errores de medida.
11. El coeficiente de fiabilidad de un test es igual a cero si 5 ~ =O.
225
1 PSICOMETRA
226
12. El coeficiente de fiabi 1 idad vara entre -1 y 1 .
13. La fiabilidad de un test depende de la longitud del mismo.
14. El valor de a ~ Gv
15. La correlacin entre las puntuaciones empricas y los errores es siem-
pre igual cero.
del mismo.
s y los errores es siem-
LA FIABILIDAD DE LAS PUNTUACIONES 1
13. SOlUCIONES A lOS EJERCICIOS
DE AUTOEVAlUACIN
1.
5
e =o 45
S 1
X
rxx =1- ~ ~ = 1-0,45
2
=1-0120=0180
X
2.
o tambin
5
2
9
rxx = 1 - ~ = 1 - - = 1 - 0 25=0 75
52 36 1 1
X
3.
5
2
=-
2
-=20
V 011 o
5
2
20
rxx =----' =- = 0183
sx 24
5.
a) Se =Sx.J1-rxx =6.J1-0
1
85 =2
1
32
b) N.C. 99% ~ Zc = 2158
27
'xx =- =0
1
75
36
227
1 PSICOMETRA
Z = 0,75-7 X= 0,75 6 = 4,5
svx = seJT: = 2,32..}0,85 = 2,14
V'=rxx X=0,854,5=3,82
fmx = 2, 58 2,14 = 5, 52
3, 82 5, 52 -7-1,70::; V::; 9,34
6.
Alumnos x1 x2 x3 x4 Xs
1
2
3
4
5
6
a)
3 2 4 3 4
2 3 4 3
5 4 3 4
2 1 2 2
3 2 2 1
4 5 4 5
I,sl
[
n l
a= ~ 1 1- ; ~ ~
S ~ = 67/6- (19/6)
2
= 1, 14
S ~ = 59/6-(17/6)
2
= 1, 81
S ~ = 65/6- (19/6)
2
=O, 81
2
5
1
3
4
s = 64/6- (18/6)
2
= 1, 67
S ~ = 71/6- (19/6)
2
= 1, 81
S ~ = 1562/6- (92/6)
2
= 25,22
Preguntas
X
x2
1
x2
2
x;
16 9 4 16
14 4 9 16
21 25 16 9
8 4 1 4
11 9 4 4
22 16 25 16
65
a= _2__(
1
_1,14+1,81+0,81+1,67+1,81]=
0 89
5-1 25, 22 '
228
x
X ~
X2
9 16 256
9 4 196
16 25 441
4 1 64
1 9 121
25 16 484
64 71 1562
7
x;
16
9 16
16 9
4
9 16 25
4 4 1
4 1 9
16 25
16
71
0, 89
X?
256
196
441
64
121
484
1562
b)
e)
LA FIABILIDAD DE LAS PUNTUACIONES 1
Teniendo en cuenta el resultado obtenido, podemos concluir que el test
constituye un buen instrumento para medir el nivel de conocimientos
en el rea de Humanidades.
n = EF 1 El= 1 O 15 = 2
r = 20,89 =0 94
XX 1 + 0,89 l
(, -
2
) - 2
t=

:=TN-
2

t = = 1,1 7 < t 95 4 = 2, 78

. '
No parecen existir diferencias estadsticamente significativas entre las
pruebas de 5 y 1 O preguntas, a ese nivel de confianza.
V' = rxx (X - X) + X
V'= 0,89(8 -15,33) + 15,33 = 8,81
7. Soluciones a los ejercicios conceptuales
1. El enunciado es verdadero.
Teniendo en cuenta que la esperanza matemtica de los errores de me-
dida es cero y que las puntuaciones verdaderas de los sujetos son igua-
les en ambos tests, podemos concluir la existencia de igualdad entre las
medias de las puntuaciones empricas.
2. El enunciado es verdadero.
Se expresa como el cociente entre la varianza de las puntuaciones ver-
daderas y la varianza de las puntuaciones empricas y se puede interpretar
como la proporcin de la varianza de las puntuaciones empricas de los
sujetos que se debe a la varianza verdadera o lo que es lo mismo, la
proporcin de varianza verdadera que hay en la varianza emprica.
229
1 PSICOMETRA
230
3. El enunciado es falso.
El coeficiente a es un estimador de la consistencia interna del test.
4. El enunciado es falso.
El valor del coeficiente de fiabilidad no depende nicamente de las ca-
ractersticas propias del test, sino de otros factores como la variabilidad
de la muestra en la que es aplicado y la longitud del test.
5. El enunciado es verdadero.
6. El enunciado es falso.
rxv = JT:: =.Jo, 80 =O, 89
7. El enunciado es verdadero.
8. El enunciado es verdadero.
9. El enunciado es falso.
((n indica el nmero de veces que hay que alargar o reducir la longi-
tud del test.
1 O. El enunciado es verdadero.
11. El enunciado es falso.
52
rxx = 1, puesto que rxx = 1- --T
sx
12. El enunciado es falso.
El coeficiente de fiabilidad vara entre O y 1. Definimos el coeficiente
de fiabilidad como el cociente entre la varianza de las puntuaciones
verdaderas y la varianza de las puntuaciones empricas. Esta forma de
expresar el coeficiente de fiabilidad nos indica la proporcin de la
varianza verdadera que se puede explicar a partir de la varianza
emprica de las puntuaciones de los sujetos. A medida que dicha
proporcin aumenta, disminuye el error de medida. Si rxx' = 1, el error
es cero lo que implica una fiabilidad perfecta del test. Sin embargo, a
medida que dicha proporcin disminuye se produce un incremento en
el error de medida. En el caso de que rxx' = O, la varianza de los errores
de medida sera igual a la varianza de las puntuaciones empricas.
cia interna del test.
e nicamente de las ca-
res como la variabilidad
d del test.
=1
largar o reducir la longi-
Definimos el coeficiente
nza de las puntuaciones
. empricas. Esta forma de
ica la proporcin de la
a partir de la varianza
. A medida que dicha
ida. Si rxx' = 1, el error
del test. Sin embargo, a
1 roduce un incremento en
la varianza de los errores
tuaciones empricas.
LA FIABILIDAD DE LAS PUNTUACIONES 1
13. El enunciado es verdadero.
Uno de los factores que influye en la fiabilidad de un test es su longi-
tud, es decir, el nmero de tems que lo componen. Cuantos ms tems
representativos del rasgo a medir se utilicen mayor ser la informacin
que obtengamos acerca del atributo que estemos estudiando y, consi-
guientemente, cabe pensar que menor ser el error que cometamos al
pronosticar la puntuacin verdadera de un sujeto. Por lo tanto, la fia-
bilidad del test se incrementar. Ahora bien, llega un momento en que
por ms que se aumente el nmero de tems ya no se produce un au-
mento significativo.
14. El enunciado es verdadero.
El coeficiente alpha puede ser considerado como una estimacin del l-
mite inferior del coeficiente de fiabilidad de un test.
15. El enunciado es falso.
Esta correlacin viene expresada como: rxe = .J1- rxx La correlacin as
establecida es igual o mayor de cero. Su valor mximo se alcanzar
cuando la fiabilidad del test es nula (rxx = O) y su valor mnimo se al-
canzar cuando la fiabilidad del test es perfecta (rxx =1 ).
231
1 PSICOMETRA
14. APNDICE
A continuacin se ofrecen las demostraciones de las frmulas que han ido
apareciendo a lo largo del tema.
4.3
4.5
4.6
4.8
4.9
4.1 o
232
I,ve I,ve 1 I,ve
r =--=----.Como - = O ~ r =0
ve NS S N S S N ve
v e v e
E=X- V
Por definicin, la ecuacin del modelo establece que: X= V+ E. Despe-
jando: E = X- V
E(e) =O
e= X- V, luego la E(e)= E(X)- E(V). Segn el primer supuesto del modelo
sabemos que: E(X) =V, por lo tanto: E(e) =V- E(V) =V- V= O
Dado que la covarianza es, Cov (v:,e) = r ve Sx Se, y, segn el segundo su-
puesto, rve =O podemos inferir que Cov (v:,e) =O
La varianza de una variable que es suma de otras dos es igual a la suma de
las varianzas de cada una de las variables ms el doble de las covarianzas.
s; = S(v+e) = ~ + S ~ + 2Cov(v, e). Partiendo del segundo supuesto del mo-
Cov(v e) .
. delo sabemos que, rve = ' , de donde podemos concluir que el va
sxse
lor de Cov(v:,e) = O. Por lo tantos; = ~ + ~
Cov(X, V) = S ~
La Cov(X, V) = E(XV)-E(X)E(V). Segn el modelo lineal X= V+ e, sustitu-
yendo
4
4.1
as frmulas que han ido
que: X = V + E. Despe-
er supuesto del modelo
)=V-V=O
y, segn el segundo su-
dos es igual a la suma de
doble de las covarianzas.
supuesto del mo-
mos concluir que el va
lineal X= V+ e, sustitu-
4.11
4.12
LA FIABILIDAD DE LAS PUNTUACIONES 1
Cov(X,V) = E((V+e)V)-E(V+e)E(V) = E(VJ2+E(Ve)-E(V)E(V)-E(e)E(V)
Puesto que: E(Ve)-E(e)E(V) = y la = O, podemos esta-
blecer,
Cov(X, V)=E(V
2
)-(E(V))
2

S
r= ---"-
xe S
X
En puntuaciones diferenciales:
r = Ixe = L(v+e)e =:ve+ :e
2
=:ve+ :e
2
xe NSxSe NSxSe NSxSe NSxSe NSxSe
"" "" 2

como --= rveSvSe, y --= s;, podemos establecer que
N N
rxe = rve SvSe + l = Se ya que r ve Sv Se = O, por ser igual a la covarianza
SxSe SxSe Sx
entre las puntuaciones verdaderas y los errores.
Cov (X
1
,X
2
) = Cov (V
1
,V
2
) = f(X
1
,X
2
)- f(X
1
) f(X
2
). Segn el modelo lineal
X= V+ e, sustituyendo en X
1
y X
2
.
Cov (X
1
,X
2
) = f((V
1
+e
1
) (V
2
+e
2
))- f(V
1
+e
1
) f(V
2
+e
2
) = f(V
1
V
2
) + f(V
1
e
2
) +
+ f(e
1
V
2
) + f(e
1
e
2
)- f(V
1
) f(V
2
)- f(V
1
) f(e
2
)- f(e
1
) f(V
2
)- f(e
1
) f(e
2
)
Como: f(V
1
e
2
) - f(V
1
) f(e
2
) - Cov (V
1
,e
2
) = O
f(e
1
V
2
)- f(e
1
) f(V
2
)- Cov (e
1
,V
2
) =O
f(e
1
e
2
) - f(e
1
) f(e
2
) - Cov (e
1
,e
2
) = O
Es decir, no existe covariacin entre las puntuaciones verdaderas y los erro-
res, y tampoco entre los errores entre s, por lo que podemos concluir que:
Cov (X
1
,X
2
) = f(V
1
V
2
) - f(V
1
) f(V
2
) = Cov (V
1
, V
2
)
Si tenemos formas paralelas entonces, Cov (X
1
,X
2
) = Cov (V
1
,V
2
) = Var (V)
233
1 PSICOMETRA
4.13
4.14
4.17
4.18
234
Por definicin sabemos que la correlacin entre las puntuaciones obtenidas
por una muestra de sujetos en dos formas paralelas la podemos expresar
Cov(X, X') S ' 1 . ' (3 1 O) C (X X' ) 5
2
como rxx = . egun a expres1on . : ov , = v .
SxSx
Asmismo, hemos establecido que las varianzas de las puntuaciones em-
pricas en dos tests paralelos son iguales, luego podemos establecer la igual-
dad: Sx = Sx y que Sx Sx = s;. De donde se concluye que rxx = ~ = r}v .
Sx
Como consecuencia de la expresin 4.13, se deduce fcilmente que
rx
1
x
2
= rx
1
x
3
= rx
2
x
3
= .... = rxxk
Sabemos que la correlacin entre dos formas paralelas de un test (X, X')
d
Cov(X,X') S , h . C
pue e expresarse como: rxx = . egun emos v1sto ov (X,X') =
SxSx
= ~ y, por ser formas paralelas, Sx = Sx
Podemos establecer rxx = ~ y que el coeficiente de fiabilidad, dados dos
Sx
o mas tests paralelos, es el mismo para todos puesto que se manti ene
constante tanto el valor de la varianza verdadera como el de la varianza
emprica.
s: 52 52 52
( XX' = 21 puesto que X = V + e tenemos,
sx
as puntuaciones obtenidas
elas la podemos expresar
3.10): Cov (X,X') = S ~ .
de las puntuaciones em-
,demos establecer la igual-
5 ~ 2
luye que rxx' = -
2
= fxv
Sx
uce fcilmente que
ralelas de un test (X, X')
hemos visto Cov (X,X') =
de fiabilidad, dados dos
puesto que se mantiene
como el de la varianza
4.19
4.20
4.21
LA FIABILIDAD DE LAS PUNTUACIONES 1
S
, h . 1 s: d s; - s: s2 s2 s2
egun emos VIStO, rxx' = --2' operan o rxx' = 2 ::::? rxx' X = X - e '
sx sx
despejando 5 ~ tenemos s: = s;- s;rxx' = s;- s;(1- rxx' ) de donde:
se = x ~ 1 - rxx'
2 - L(v- v')2
En puntuaciones diferenciales podemos expresar: Svx - -=---
n
Mediante la ecuacin de regresin en puntuaciones diferenciales v' = rxxx,
Sustituyendo:
S 5
2
Como hemos visto: rxv = y rxx =
5
~ de donde:
SX X
s; + (XXs; - 2rXXSVSX
5
v = s; + (XXs;- 2rXXs; = s;- s;rXX = s;(1- (XX), teniendo
sx
en cuenta que, Sv = Sx .:: sustituyendo en la expresin anterior:
235
1 PSICOMETRA
4.24
236
Por lo general, la puntuacin V' estimada a partir de las ecuaciones de la
recta de regresin no coincide con la puntuacin verdadera del sujeto V.
La diferencia entre la puntuacin verdadera del sujeto (V) y la puntuacin
verdadera estimada (V') es lo que conocemos como el error de estimacin.
Definimos el error tpico de estimacin (5vxl, como la desviacin tpica de
los errores de estimacin.
Segn el modelo, las varianzas en los tests paralelos son iguales por lo que:
5x
1
-x
2
= 2s; - 2rxx' s; = 25;(1- rxx') simplificando y sacando la raz cuadrada:
SX-X2
R = nrxx
xx 1 + (n - 1)rxx
Partimos de la definicin del coeficiente de fiabilidad como cociente entre
la varianza verdadera y la varianza emprica de las puntuaciones de los su-
jetos en un test.
R =
XX 52
nx
A continuacin descomponemos tanto la varianza verdadera como la va-
rianza emprica del test total.
La varianza de las puntuaciones verdaderas, ser igual a la suma de las
n varianzas de las puntuaciones verdaderas ms la suma de las n(n-1 )
covarianzas: = L,.s;a + L,.rvav
6
5va 5v
6
Puesto que partimos del supuesto
de tems paralelos, tanto las varianzas como las covarianzas son iguales,
por lo que la expresin anterior puede formularse como:
= ns; + n(n -1)rv V sv svb' Tambin sabemos que la correlacin rv V = 1
a aba ab 1
ya que es la correlacin entre las puntuaciones verdaderas, y que Sva = 5v
6
,
P
or lo tanto: = ns; + n(n -1)5; .
a a
tir de las ecuaciones de la
)n verdadera del sujeto V.
sujeto (V) y la puntuacin
mo el error de estimacin.
mo la desviacin tpica de
son iguales por lo que:
, sacando la raz cuadrada:
lidad como cociente entre
las puntuaciones de los su-
verdadera como la va-
ser igual a la suma de las
la suma de las n(n-1 )
que partimos del supuesto
covarianzas son iguales,
como:
u e la correlacin r vavb = 1,
verdaderas, y que Sva = 5v
6
,
LA FIABILIDAD DE LAS PUNTUACIONES 1
Sacando factor comn a ns;a, = ns;a (1 + (n - 1)). Simplificando podemos
concluir que la varianza de las puntuaciones verdaderas en el test total
puede expresarse: =
Veamos ahora lo que ocurre en el caso de la varianza emprica, La va-
rianza de las puntuaciones empricas ser igual a la suma de las n va-
rianzas de las puntuaciones empricas ms la suma de las n(n-1 ) cova-
rianzas: s; = L,.s;a + L,.rXaXb sXa sXb" Puesto que partimos del supuesto de
tems paralelos, tanto las varianzas como las covarianzas son iguales entre,
por lo que la expresin anterior puede formularse como = +
+ n(n -1)rXaXb s;a 1 por ser SXa = SXb
Sacando factor comn a ns; 1 = ns; (1 + (n -1)rx Xb ).
a a a
Sustituyendo el valor de la varianza verdadera y la varianza emprica en la
expresin del coeficiente de fiabilidad, tenemos:
2 n52 52
R -
5
nv - Va = n . Si tenemos en cuenta que
XX ns;a (1 + (n -1)rXaXb ) SXa 1 + (n -1)rXaXb
52

= rx x y que las intercorrelaciones entre cada dos o mas tests paralelos


5 a a
X a
son iguales, es decir, rx X = rx Xb =(XXI podemos concluir: Rxx = nrxx
a a a 1 + (n - 1)rxx
Partiendo de lo anterior, cuando se aumenta n veces la longitud del test
la varianza de los errores sera: = ns; + n(n -1)rxx
Un caso particular de esta frmula es cuando se duplica la longitud del test
inicial.
En ocasiones lo que pretendemos es que un test tenga una determinada fia-
bilidad, y lo que nos planteamos es saber cuntos tems tendramos que
aumentar el test para conseguir dicho coeficiente.
El nmero de tems que tenemos que aumentar dicho test lo podemos ha-
llar despejando el trmino n de la ecuacin general de Spearman-Brown.
R = nrxx
xx 1 + (n - 1)rxx
237
1 PSICOMETRA
4.28
238
Una vez conocido el valor de n podemos calcular el nmero de ele-
mentos finales (EF) . EF = El n. La diferencia entre los tems finales y los
tems iniciales nos dar el nmero de elementos que habra que aadir o
disminuir un test para obtener el coeficiente de fiabilidad deseado.
R = 2rxx
XX 1
+ rxx
Supongamos que tenemos una serie de formas paralelas y que juntamos
stas de dos en dos: xa + xb, xe + xd
Puesto que dichos tests son paralelos podemos establecer: rxx = rab = rae =
... = red' es decir, dados dos o mas tests paralelos, las intercorrelaciones
entre cada dos de ellos son iguales.
Por definicin el coeficiente de fiabilidad del test Rxx puede expresarse, en
. . . L(Xa +xb)(xc +xd)
puntuaciones d1ferenc1ales como: R xx = , al ser formas
N s (Xa +xb )s (Xc +xd)
paralelaS, laS deSViaCiOneS tpiCaS Sern igualeS (S(Xa+Xb) = s (Xc+xd) )t p0r 10 que
podemos expresar el denominador como S(xa+xb)' y sustituyendo:
L(Xa + xb)(xc + xd)
R xx = N -----,-- 2--
S (xa +xb) .
Si desarrollamos el primer trmino tendremos:
L(Xa + xb)(xc + xd) = LXaXc + LXaXd + LXbXc + LXbXd
N N N N N
puesto que estos cuatro trminos expresan covarianza, les podemos susti -
tuir por rae Sa Se+ rad S a Sd + rbe Sb Se + rbd Sd Sd y, al ser formas paralelas,
la expresin puede escribirse como: 4S;rxx
Si desarrollamos el trmino S(xa+x
6
, puesto que la varianza de una variable
que es suma de otras dos es igual a la suma de las varianzas de cada una
de las variables ms el doble de las covarianzas:
tl cular el nmero de ele-
los tems finales y los
que habra que aadir o
abilidad deseado.
aralelas y que juntamos
stablecer: rxx = rab = rae =
s, las intercorrelaciones
Rxx puede expresarse, en
)(x + x )
e d 1 al ser formas
J5 (xc+xdl
(Xa+Xb) = 5 (Xc+Xd) )t pOr lO que
y sustituyendo:
ianza, les podemos susti-
y, al ser formas paralelas,
varianza de una variable
as varianzas de cada una
LA FIABILIDAD DE LAS PUNTUACIONES 1
Sustituyendo,
y simplificando,
R = 2rxx
XX 1
+ rxx
Esta misma expresin puede obtenerse a partir de la influencia del aumento
de la longitud de un test sobre la varianza verdadera, la varianza emprica
y la varianza de error.
En primer lugar veamos como se ve afectada la varianza de las puntuacio-
nes empricas de los sujetos, cuando se duplica la longitud del test. Su-
puesto los tems paralelos, las varianzas de las dos mitades son iguales, es
decir, 5 ~ =51, con lo que la varianza total del test puede expresarse como,
5 ~ x
Puesto que, como ya hemos dicho, la varianza de una variable que es suma
de otras dos es igual a la suma de las varianzas de cada una de las varia-
bles ms el doble de las covarianzas, tendremos:
Veamos ahora lo que sucede respecto a la varianza verdadera. La varianza
de la distribucin de las puntuaciones verdaderas, 5 ~ , puede expresarse
2 2 2
como 52V = 5V + 5V + 2rV V 5V 5V
a b ab a b
Las puntuaciones verdaderas en los dos tests paralelos son iguales y la co-
rrelacin r vavb = 1, ya que es la correlacin entre las puntuaciones verda-
deras. Luego:
239
1 PSICOMETRA
4.31
240
Es decir, cuando se duplica la longitud de un test dado, la varianza de las
puntuaciones verdaderas de los sujetos es igual a cuatro veces la varianza
de las puntuaciones verdaderas de cada una de las mitades.
Por ltimo, veamos lo que sucede respecto a la varianza de error. Por ser
tests paralelos, partimos del supuesto de que las varianzas = y que
la correlacin entre los errores reaeb =O. La varianza de error (5
2
e) puede
expresarse en los siguientes trminos: Sie = s;a + s;b + 2reaebsea seb = 2s;,
puesto que la covarianza se anulara al ser la correlacin entre errores igual
a cero.
Dado que el coeficiente de fiabilidad (rxx) es igual al cociente entre la va-
rianza verdadera y la varianza emprica (5; ), tendremos que el coefi-
ciente de fiabilidad, al duplicar la longitud del test viene expresado por:
R _ Siv = = 2rxx
xx Six 25; (1 + rxx ) 1 + rxx
que es precisamente la expresin a la cual habamos llegado anterior-
mente.
a=-n (1- :s; J
n -1 5
2
X
Como ya hemos comentado, la varianza de una variable, suma de n va-
riables, es definida como la suma de las varianzas, ms la suma de las ca-
varianzas, con lo que la varianza total de las puntuaciones empricas de los
sujetos en un test la podemos expresar como:
es decir, suma de las varianzas de cada uno de los elementos ms la de las
covarianzas entre todos ellos.
Si los tems son paralelos, se puede calcular la varianza media y la cova-
rianza media de los items.
;t dado, la varianza de las
a cuatro veces la varianza
las mitades.
varianza de error. Por ser
; varianzas = y que
1nza de error (5
2
e ) puede
2
5
2
+ 2 S S - 25
2
ea + eb reaeb ea eb - et
el acin entre errores igual
Jal al cociente entre la va-
), tendremos que el coefi-
viene expresado por:
bamos llegado anterior-
variable, suma de n va-
as, ms la suma de las co-
aciones empricas de los
os elementos ms la de las
varianza media y la cova-
LA FIABILIDAD DE LAS PUNTUACIONES 1
Ls
2
5
2
5
2 Is:
. = n . , ya que . = --
1 1 1 n
de donde:
n --
= L Sf + n(n - 1)rk Sf
y despejando:
n
52-" 52
X L._ 1
r ----=-
k- (n -1)LSf
En el caso de querer estimar la fiabilidad del test total aplicaremos la ecua-
cin general de Spearman-Brown para el caso de un test de longitud n.
donde n representa el nmero de tems y, rjk representa la correlacin
promedio de las n(n-1) correlaciones entre los tems. Si lo sustituimos por
la expresin anterior:
n
52-" 52
X L._ 1
n . ----=;--:
(n-1)LSf
r" = ----==---'-----5::-2 -- ---; "=-s ----:-2 --
1 + (n - 1) x L._
1
(n-1)LSf
despejando,
a=-n (
1
_Isfl
n -1 5
2
n -1 5
2
X X
241
1 PSICOMETRA
4.33
242
a = & 1 cuando n ---- 00
- (N-3)&+2 (N-3)& 2 N&-3& 2
a= N-1 = N-1 + N-1 = N-1 + N- 1 =
N& 3& 2 & 3& 2
= N-1- N-1 + N-1 = N-1- N -1 +N -1 =
N
& 3& 2 & 3& 2
= ---+--= ---+--
(N / N)-(1 / N) N-1 N-1 1-(1 / n) N-1 N-1
Si n---oo entonces 1/N=O, 3a/N-1=0, 2/N-1=0; de donde pode-
mos deducir que a= &
- Relacin entre la ecuacin de Rulan y la ecuacin de Cuttman-Fianagan
52 . 52-52 .
(xx = 1- p;
1
= x
2
p-I
1
pueStO que la Varianza de Una Variable que eS SU-
s x s x
ma de otras dos es igual a la suma de las varianzas de cada una de las va-
riables ms el doble de las covarianzas, tenemos:
Si desarrollamos ahora la ecuacin de Guttman, tendremos:
(
5
2
+ S
2
) (5
2
- S
2
- S
2
)
rxx = 2 1- p s;
1
= 2 X S ~
1
Puesto que la varianza de una varia-
ble, suma de n variables, es definida como la suma de sus varianzas, ms
la suma de las covarianzas, podemos establecer que s; = S ~ + 5;
2
+ 2rpi Sp5;
de donde
Como puede observarse, en ambos casos, llegamos a la misma expresin
fina l.
): 2
-+--
-1 N -1
v -1 =O; de donde pode-
de Cuttman-Fianagan
de una variable que es su-
zas de cada una de las va-
tendremos:
e la varianza de una varia-
suma de sus varianzas, ms
que s; S ~ + 5,
2
+ 2rpiSpS;
mos a la misma expresin
LA FIABILIDAD DE LAS PUNTUACIONES 1
-Relacin entre a y {3
P=a
Bajo este supuesto podemos establecer que: n = knj, donde:
n = nmero de subtests
2 ( ]2
n n n n 1 k-1
1- I(_j_J =1- I - . ~ =1-k -2 =-
1=1 n
1
=
1
k n
1
k k
Sustituyendo en P,
n n n
s2- :s2 s2- :s2
:s;
X 1
k
X 1
k
~ =
}=1 }=1
1-_E__
= = =a
2 k -1
k -1
52
k -1
52
S -
X X
X k
243
1 PSICOMETRA
15. BIBLIOGRAFA COMPlEMENTARIA
MARTNEZ-ARIAS, R.; HERNNDEZ LLOREDA, Ma J.; HERNNDEZ LLOREDA,
Ma V. (2006). Psicometra. Madrid: Alianza editorial.
MARTNEZ-ARIAS, R.(1995). Psicometra: Teora de los Tests Psicolgicos y Edu-
cativos. Madrid: Editorial Sntesis.
MUIZ, J. (1998, 2002) . Teora Clsica de los Tests. Madrid: Editorial Pirmide.
MUIZ, J. (1996). Psicometra. Madrid: Universitas.
SANTISTEBAN, C.(1990). Psicometra. Teora y prctica en la construccin de
tests. Madrid: Editorial Norma.
244