Академический Документы
Профессиональный Документы
Культура Документы
Precisin
Varianza
LA CONFIABILIDAD
1.
LA CONFIABILIDAD.
Definicin
Magnusson (2005) que los resultados de
un test puedan ser reproducibles bajo
ciertas condiciones.
Magnusson (2005): que los puntajes
obtenidos a travs de una prueba sean los
mismos si se vuelve a medir el mismo rasgo
en condiciones idnticas.
Anastasi y Urbina (1998): Consistencia de
las puntuaciones obtenidas por una persona
cuando se le administra la misma prueba o
un test equivalente.
Prieto y Delgado (2010): la consistencia o
estabilidad de las medidas cuando el
proceso de medicin se repite
Magnusson (2005): Exactitud de la
medida, independientemente de lo que uno
este midiendo lo que ha querido medir. La
exactitud con que un test estima los puntajes
verdaderos
Aragn (2011) menciona que es la
precisin con que un test mide un atributo,
es decir, la ausencia de errores de medicin.
2
2
La
SV
Se
r tt = 2
r tt =1 2
proporcin
de la
St
St
Inconfiabilidad
Magnusson (2005): Dispersin de los valores
obtenidos de repetidas mediciones de la misma
distancia, bajo condiciones similares.
Cuanto mayor es la diferencia entre medidas del
mismo rasgo en repetidas ocasiones, tanto menor
es la confiabilidad
Resultado de la sensibilidad del instrumento a
los factores que no afectan el tamao de las
medidas sistemticamente, pero cambian de una
situacin de medida a otra
El instrumento de medicin es sensible a las
fluctuaciones Intraindividuales y a las diferencias
interindividuales al medir el constructo en
diferentes ocasiones
La proporcin de la
St
Que es
Se
St
A mayor
tica
Puntaje
Obtenido
TCT
X =V + e
Explicacin
= Posicin del sujeto en el
continuo
latente
que
representa al raso.
= Diferencia entre el
puntaje observado y el
puntaje
verdadero.
Se
considera
aleatorio
(al
azar).
Caracterstic
as
Constante
Cambiante
variable
Puntaje de error
Error (
Tipos de error
Sistemtic
Aleatorio
o
Afecta
la
validez
Afecta
la
e
confiabilida
d
Factores Individuales o
Ambientales
Cambian de una ocasin
de medida a otra y en cierto
grado
modifican
la
capacidad de ejecucin del
individuo.
Errores
producidos por factores que
dan como resultado que los
puntajes
individuales
difieran de un test paralelo
a otro, aunque los puntajes
verdaderos
sean
los
mismos.
= 0
La correlacin () entre
los puntajes error en
diferentes aplicaciones del
test es cero para un
nmero
infinito
de
individuos.
Esto
es
razonable si los puntajes
error son considerados
como errores al azar.
= 0
La correlacin () entre los
puntajes verdaderos y los
puntajes error es cero. La
direccin de los errores es
independiente del tamao de
los puntajes verdaderos para
un
nmero
infinito
de
individuos.
EEM
in Explicac Formulan Definici
Xi=X + Z . Se
Puntaje Z
Transformaciones que se pueden hacer a los valores
o puntuaciones de una distribucin normal, con el
propsito de analizar su distancia respecto a la
media, expresndolas en unidades de desviacin
Z=
S e =S x 1r tt
Xi X
Se
Xi=X
. Se
Xi= Z
Intervalos de confianza
Z = Puntaje Z
S x = Desviacin estndar
Caractersticas
1. La magnitud del EEM es una funcin de la magnitud del coeficiente de confiabilidad
2. El coeficiente de confiabilidad puede dar una impresin engaosa de confianza: La magnitud del coeficiente de confiabilidad es afectada por cambios
en la homogeneidad de la muestra, la magnitud del EEM no depende de esto.
Se
Explicacin
Factores intrnsecos del sujeto
Fuentes
Fatiga, motivacin, estado de salud, estado
fsico
Disminuir el error
Control, estandarizacin de la
situacin de la aplicacin
r tt
Aleatorio
Interaccin
con el
evaluador
Condiciones
de la
aplicacin
Calificacin
S 2e(apl)
Adivinacin
S e(g )
Sistemtico
Memoria
S e()
S 2e(mem)
Velocidad
S 2e
control, estandarizacin
Reglas
claras
y
explicitas,
estandarizacin, preparacin de los
evaluadores
Responder al azar
Disminuye
S 2e
e Disminuy
ma sobresti
Caracterstica
s del
Instrumento
2
V
S 2flu
Test paralelos
Instrumentos
de
medidas
equivalentes. Los test paralelos
deben construirse de tal manera que
una aplicacin de dos test de la
misma correlacin entre las dos
distribuciones de puntaje, que la de
dos aplicaciones de uno de los test.
Se basa en la suposicin de que se
puede quitar todas las huellas de la
primera aplicacin en la segunda
ocasin.
Los tems que correspondan entre s
en los test paralelos debern ser
similares
en
CONTENIDO,
INSTRUCCIONES,
TIPO
DE
RESPUESTA y DIFICULTAD, que las
medidas con ambos den los mismos
resultados que el medir dos veces
con uno de ellos
ima. subest
ima. subest
Rasgo
ismo Paralel
Falta de
paralelismo
entre pruebas
Variaciones de
largo alcance
o
Mtodo
Explicacin
Test retest
Aplicar el mismo
instrumento
por
segunda ocasin.
Pruebas
paralelas
Se construyen 2
test tratando de
satisfacer lo mejor
posible
las
condiciones
de
estricto
paralelismo. El rtt
es
llamado
coeficiente
de
equivalencia.
r tt =
coeficiente
de
confiabilidad
Correlacin entre
los resultados de
la misma persona
en 2 aplicaciones
de la prueba.
Correlacin
bivariada.
Correlacin entre
las puntuaciones
de las 2 formas.
Correlacin
bivariada.
Mide
Aplicacin
Depende de
la variable
que
se
pretende
medir y de
los sujetos
examinados
(Etapas
evolutivas).
Estabilidad temporal y
consistencia
de
las
respuestas
a
las
diferentes muestras de
tems.
Paralelismo/Equivalencia
.
corto
o
largo.
Si
hay tiempo
entre
las
aplicacione
s
puede
disminuir
por cambios
en el PV.
Contenido:
= contenido,
= dificultad
S 2e
Fluctuaciones
aleatorias (largo
alcance)
=
reducirse
espuriamente.
Memoria (Corto
alcance)
=
incrementarse
espuriamente.
Varianza
verdadera
Efectos de
aplicacin
Adivinacin
Falta
de
acuerdo entre los
calificadores
o
evaluadores.
Aplicacin
Adivinacin
Calificacin
Ventajas
Calculo
de
confiabilidad
test
Desventajas
la
del
restringido a
cambios al azar
de corto alcance
Practica
produce grados
de mejora
Efectos de la
memoria:
intervalos cortos,
mayor recuerdo,
resultados
no
independientes,
elevada y
falsa.
Facilita
la
aplicacin de la
misma prueba al
mismo Sujeto.
No
afecta
memoria.
Recomendada en
test de velocidad
Efecto
del
primer test sobre
el segundo el
uso de formas
alternas reduce,
pero no elimina
el efecto de la
prctica.
Difcil
construccin de
un
test
equivalente
grado en el que
la naturaleza de
Divisin por
mitades
KuderRichardson
Alpha
de
Cronbach.
Mediante diversos
procedimientos es
posible
obtener
una medida de rtt
a partir de una
nica
aplicacin
de la prueba ya
que al dividirla en
mitades
equivalentes. Se
obtienen
2
puntuaciones de
cada persona.
Un
test
se
encuentra
conformado
por
tantos
test
paralelos
como
tems tenga. Cada
tem es tratado
como
un
test
paralelo.
la magnitud en
que los tems de
un
test
estn
correlacionados
calculando
el
promedio de las
correlaciones
entre los reactivos
que forman un
instrumento
Se
obtienen
mitades paralelas
de una misma
prueba
y
se
calcula
la
correlacin entre
ellas
la
prueba
cambia con la
repeticin.
Este mtodo
tiene
el
inconveniente de
no ser til ante
pruebas
de
velocidad.
No
da
informacin de la
estabilidad
temporal.
Paralelismo
1 Sola
Contenido:
= contenido,
= dificultad
Aplicacin
Adivinacin
Calificacin
Eficiente
en
cuanto a costo y
tiempo
La
correlacin
entre 1 tem y su
tem paralelo da
la rtt de 1 solo
tem
Consistencia Interna
1 sola
Contenido
tem:
= contenido,
= dificultad
Muestreo de
contenido
heterogeneidad
Da la mejor rtt
expresada como
test paralelos al
azar
Requiere de 1
sola aplicacin
No
da
informacin de la
estabilidad
temporal.
la intercorrelacin
entre los distintos
componentes de
un instrumento.
Rango:
Los
valores de este
coeficiente varan
entre 0 a 1,
siendo
los
valores
ms
Unidimensionalidad del
test. consistencia interna
Homogeneidad de los
tems o consistencia
interna del test.
Promedio de rxy de
todos los tems
Es ms estable que el
K-R
La heterogeneidad es
mala
o
buena
1 sola
Contenido
tem:
= contenido,
= dificultad
Adivinacin
Aplicacin
Velocidad
Cantidad de
tem
El muestreo de
contenido
La
heterogeneidad
de la conducta
muestreada.
Es indicador de la
unidimensionalida
d del test, pero se
requiere verificar la
estructura factorial
de la prueba.
Practicidad 1
sola aplicacin.
No
da
informacin de la
estabilidad
temporal.
r tt =
2.rtt
1+rtt
Confiabilida
d
entre
calificadores
o jueces
Magnusson
(2005) reporta que
ste ndice se
refiere al grado en
que los diferentes
tems
de
un
instrumento
covaran
estadsticamente
e indica cmo se
relacionan
entre
s.
Asimismo,
Cervantes (2005)
comenta
que
permite observar
la intercorrelacin
entre los distintos
componentes de
un instrumento, es
decir,
la
estimacin de la
equivalencia
de
los reactivos entre
s.
Grado de acuerdo
o consistencia que
existe entre dos o
ms evaluadores.
cercanos a 1
indicadores de un
alto grado de
consistencia
interna
(Magnusson,
2011). El clculo
de
este
coeficiente
proporciona
informacin
sobre
qu
reactivo
se
comporta de
dependiendo
del
constructo.
Heterogneo CIPersonalidad
Homogneo CalculoParcial
coeficiente
de
correlacin entre
las puntuaciones
asignadas
por
cada experto.
Kappa
Theta
Proporciona informacin
del error como resultado
de la calificacin de la
prueba.
<
homogeneidad <
consistencia
entre reactivo
1 Sola
Aplicacin
Adivinacin
Subjetividad
Calificacin
objetiva del test.
Informacin Adicional:
Alpha de Cronbach
No
da
informacin de la
estabilidad
temporal.
jueces
De acuerdo a Viera y Garrett (2005), a
travs del estadstico Kappa, se puede
medir la confiabilidad entre observadores
en
situaciones
donde
dos
jueces
independientes estn evaluando el mismo
instrumento. En la tabla 1 se puede
apreciar la interpretacin estandarizada de
este ndice estadstico. Los autores
reportan que se puede utilizar un Kappa
por encima de 0,57
Kappa
<0
0,01-0,2
0,21-0,4
0,4-0,6
0,610,80
0,810,99
1
Interpretacin-Grado
acuerdo
Pobre Acuerdo
Escaso acuerdo
Acuerdo justo
Acuerdo Moderado
Acuerdo considerable
Acuerdo casi perfecto
Acuerdo Perfecto
de
Qu pasa con
La confiabilidad de los
puntajes de un test es
una funcin del nmero
de tems que componen
el test.
la confiabilidad se
incrementar al
aumentar el
nmero de test
paralelos
incluidos en el
test total
Errores
Terico
la r tt ?
VARIANZA
VERDADERA
Primero veremos que le
sucede a la varianza de
los puntajes observados
cuando el test se dobla
en longitud, aadiendo
un nmero igual de
nuevos tems. S se
supone que estos tems
son paralelos a los del
test
original,
las
varianzas de las dos
mitades del test son
iguales
VARIANZA
VERDADERA
Los
puntajes
verdaderos en los test
paralelos se supone que
son iguales para cada
individuo. La varianza
verdadera, despus que
se ha doblado el
nmero de tems se
representa
de
la
siguiente manera.
VARIANZA DE ERROR
Cuando se duplica el
nmero de tem tambin
se duplica la varianza
de la distribucin de
puntajes de error
FORMULARIO