Resumen Confiabilidad

Reproduccin
Precisin
Varianza
LA CONFIABILIDAD
1.
LA CONFIABILIDAD.
Definicin
Magnusson (2005) que los resultados de
un test puedan ser reproducibles bajo
ciertas condiciones.
Magnusson (2005): que los puntajes
obtenidos a travs de una prueba sean los
mismos si se vuelve a medir el mismo rasgo
en condiciones idnticas.
Anastasi y Urbina (1998): Consistencia de
las puntuaciones obtenidas por una persona
cuando se le administra la misma prueba o
un test equivalente.
Prieto y Delgado (2010): la consistencia o
estabilidad de las medidas cuando el
proceso de medicin se repite
Magnusson (2005): Exactitud de la
medida, independientemente de lo que uno
este midiendo lo que ha querido medir. La
exactitud con que un test estima los puntajes
verdaderos
Aragn (2011) menciona que es la
precisin con que un test mide un atributo,
es decir, la ausencia de errores de medicin.
2
2
La
SV
Se
r tt = 2
r tt =1 2
proporcin
de la
St
St
Inconfiabilidad
Magnusson (2005): Dispersin de los valores
obtenidos de repetidas mediciones de la misma
distancia, bajo condiciones similares.
Cuanto mayor es la diferencia entre medidas del
mismo rasgo en repetidas ocasiones, tanto menor
es la confiabilidad
Resultado de la sensibilidad del instrumento a
los factores que no afectan el tamao de las
medidas sistemticamente, pero cambian de una
situacin de medida a otra
El instrumento de medicin es sensible a las
fluctuaciones Intraindividuales y a las diferencias
interindividuales al medir el constructo en
diferentes ocasiones
La proporcin de la
St
Que es
Se
St
A mayor
S e , mayor ser la Inconfiabilidad.
TEMA 2. EL ERROR ESTNDAR DE MEDIDA (EEM) E INTERVALO DE CONFIANZA (IC).

Puntaje Obtenido
tica
Hay que asegurar la estabilidad de los datos

derivados de la aplicacin de la prueba.
Buscamos con esto que la medicin sea precisa,
en el sentido de que efectivamente mida la
ubicacin tericamente verdadera de los sujetos
en el constructo de inters.
Es esencial para que los datos proporcionados por

el instrumento puedan utilizarse e interpretarse
de forma adecuada con un grado conocido de
confianza (Magnusson, 2005).
Puntaje
Obtenido
TCT
X =V + e
Explicacin
= Posicin del sujeto en el
continuo
latente
que
representa al raso.
= Diferencia entre el
puntaje observado y el
puntaje
verdadero.
Se
considera
aleatorio
(al
azar).
Caracterstic
as
Constante
Cambiante
variable
Puntaje de error
Error (
Tipos de error
Sistemtic
Aleatorio
o
Afecta
la
validez
Afecta
la
e
confiabilida
d
Factores Individuales o
Ambientales
Cambian de una ocasin
de medida a otra y en cierto
grado
modifican
la
capacidad de ejecucin del
individuo.
Errores
producidos por factores que
dan como resultado que los
puntajes
individuales
difieran de un test paralelo
a otro, aunque los puntajes
verdaderos
sean
los
mismos.
= 0
Propiedades de los errores

= 0
La media () de los puntajes

de error es cero. Esto es cierto
para a) un nmero infinito de
individuos en el mismo test, sin
importar
sus
puntajes
verdaderos.
B)
para
los
puntajes de error de un
individuo en un nmero infinito
de test paralelos
La correlacin () entre
los puntajes error en
diferentes aplicaciones del
test es cero para un
nmero
infinito
de
individuos.
Esto
es
razonable si los puntajes
error son considerados
como errores al azar.
= 0
La correlacin () entre los
puntajes verdaderos y los
puntajes error es cero. La
direccin de los errores es
independiente del tamao de
los puntajes verdaderos para
un
nmero
infinito
de
individuos.
EEM
in Explicac Formulan Definici
Intervalo de confianza (IC) y el Error estndar de medida (EEM)

Intervalos de Confianza (I.C.)
Intervalo de la escala nos permite
conocer donde se puede hallar el
puntaje verdadero del individuo con
algn grado conocido de confianza,
Xi=X + Z . Se
Error estndar de medida (EEM)

Es la desviacin estndar de los puntajes de error
de un individuo para un nmero infinito de test
paralelos. El error estndar de medida se computa
para calcular los intervalos dentro de los cuales se
Puntaje Z
Transformaciones que se pueden hacer a los valores
o puntuaciones de una distribucin normal, con el
propsito de analizar su distancia respecto a la
media, expresndolas en unidades de desviacin
Z=
S e =S x 1r tt
Xi X
Se
Xi=X
. Se
Xi= Z
Intervalos de confianza
S e = Error estndar de Medida (EEM)
Z = Puntaje Z
X = puntaje obtenido, supuesto
S x = Desviacin estndar
Xi= Intervalos de confianza
Caractersticas
1. La magnitud del EEM es una funcin de la magnitud del coeficiente de confiabilidad
2. El coeficiente de confiabilidad puede dar una impresin engaosa de confianza: La magnitud del coeficiente de confiabilidad es afectada por cambios
en la homogeneidad de la muestra, la magnitud del EEM no depende de esto.
TEMA 3. FUENTES DE ERROR ALEATORIO

Fuentes de
error
Sujeto
Evaluado
Se
Explicacin
Factores intrnsecos del sujeto
Fuentes
Fatiga, motivacin, estado de salud, estado
fsico
Disminuir el error
Control, estandarizacin de la
situacin de la aplicacin
r tt
Aleatorio
Interaccin
con el
evaluador
Condiciones
de la
aplicacin
Calificacin
S 2e(apl)
Adivinacin
S e(g )
Sistemtico
Memoria
S e()
S 2e(mem)
Velocidad
S 2e
Si la formulacin de los tems, las

respuestas posibles, los requisitos
de las respuestas, etc. son
ambiguos, hay la posibilidad de que
los individuos no interpreten los
tems de la misma manera de una
ocasin a otra
El efecto que tiene la inevitable
interaccin
entre
los
examinadores y los examinados
sobre
la
ejecucin
y
el
comportamiento de los individuos
examinados (depende de ambas
partes).
Lugar donde se lleva a cabo el
examen
Puede causar reacciones distintas en los

sujetos= mala traduccin, reacciones
ambiguas.
Control, estandarizacin, calidad del

instrumento,
instrucciones
explicitas, aplicaciones, prueba
pilotos.
Interaccin que hay entre las personas que

aplican y los resultados de las pruebas.
Percepcin social.
Rapport, respetar la consigna
Grado de las perturbaciones exteriores,

condiciones ambientales.
control, estandarizacin
Si definimos la objetividad como el

acuerdo entre diferentes jueces, la
carencia de objetividad en la
calificacin producir una varianza
de error
Ocurre en los llamados de eleccin
mltiple, las respuestas se presentan
en forma de opciones, una de las
cuales es correcta. Si un individuo
examinado es incapaz de resolver un
tem, puede adivinar
Ocurre cuando el sujeto por recordar
lo que respondi en la pregunta
anterior, vuelve a responder igual la
respuesta anterior. Introduce el error
Cuando la velocidad de ejecucin del
sujeto afecta el resultado. Cuando la
prueba mide velocidad de ejecucin.
(Ej. Prueba de poder-pruebas de
Se puntu la prueba y no sea sistemtico
Reglas
claras
y
explicitas,
estandarizacin, preparacin de los
evaluadores
Responder al azar
Factor de correccin. Al aplicar el

factor de correccin, los sujetos
deben estar conscientes de esto.
Permite disminuir el error al azar.
Los individuos necesitan recordar la

respuesta dada en la primera ocasin y
repetirla en la segunda, para que nosotros
obtengamos completo acuerdo entre los
Aquellos test sensibles a la velocidad, son
falsamente estables, en ocasiones
incrementa falsamente la confiabilidad.
Pruebas paralelas (controla la

memoria como fuente de varianza),
cambiar orden de los tems, mayor
intervalo entre aplicaciones
Variar orden de los tems, prueba
paralela, mayor intervalo de
aplicacin, debe ser fcil.
= =
Disminuye
S 2e
e Disminuy
ma sobresti
Caracterstica
s del
Instrumento
2
V
S 2flu
Cuando se cree que dos medidas

son paralelas y no lo son. No hay
equivalencia. El efecto a tratar es
Cambios autnticos en el puntaje
verdadero. Cuando hay un cambio
real en el puntaje verdadero
Cuando construimos test para medidas

paralelas, normalmente tratamos de hacer
que los test sean tan semejantes entre s
Subestima la confiabilidad y la calidad del
instrumento para medir con exactitud los
puntajes verdaderos. Esto se define como
Pruebas paralelas: Pruebas que

miden lo mismo (igual en contenido
y dificultad). Hay equivalencia.
Conocimientos del comportamiento
de la variable, pruebas diferentes
diseadas para grupo de edad.
TEMA 4. MTODOS PARA ESTIMAR LA CONFIABILIDAD

MEDICIN DE LA CONFIABILIDAD
El coeficiente de correlacin () para el acuerdo entre medidas repetidas bajo condiciones similares, constituye el valor numrico de la
confiabilidad de los datos que pueden obtenerse en un instrumento dado (Magnusson, 2005).
Coeficiente de Confiabilidad
CARACTERSTICA
DESCRIPCIN
S
Coeficiente
rtt= 0 a 1
Rango
0-1
Signo
Positivo
Coeficiente
Determinacin
Interpretacin
Grados. No es una cuestin
de todo o nada.
Si el instrumento es insensible a los factores debido al
azar, los puntajes del individuo en medidas sucesivas
sern idnticos y sus posiciones en las distribuciones
que podemos construir en cada ocasin de medida
sern las mismas, por lo que la correlacin entre las
distribuciones ser 1.0 (completamente confiable).
RANGOS
MAGNITUD
0,81 A 1
Muy alta
0,61 A 0,80
Alta
0,41 A 0,60
Moderada
0,21 A 0,40
Baja
0,01 A 0,20
Muy baja
Test paralelos
Instrumentos
de
medidas
equivalentes. Los test paralelos
deben construirse de tal manera que
una aplicacin de dos test de la
misma correlacin entre las dos
distribuciones de puntaje, que la de
dos aplicaciones de uno de los test.
Se basa en la suposicin de que se
puede quitar todas las huellas de la
primera aplicacin en la segunda
ocasin.
Los tems que correspondan entre s
en los test paralelos debern ser
similares
en
CONTENIDO,
INSTRUCCIONES,
TIPO
DE
RESPUESTA y DIFICULTAD, que las
medidas con ambos den los mismos
resultados que el medir dos veces
con uno de ellos
Test paralelos al azar

Test
compuesto
de
tems
seleccionados al azar de la misma
poblacin de tem- Correlacin entre
un test dado y un test paralelo.
ima. subest
ima. subest
Rasgo
ismo Paralel
Falta de
paralelismo
entre pruebas
Variaciones de
largo alcance
o
Mtodo
Explicacin
Test retest
Aplicar el mismo
instrumento
por
segunda ocasin.
Pruebas
paralelas
Se construyen 2
test tratando de
satisfacer lo mejor
posible
las
condiciones
de
estricto
paralelismo. El rtt
es
llamado
coeficiente
de
equivalencia.
r tt =
coeficiente
de
confiabilidad
Correlacin entre
los resultados de
la misma persona
en 2 aplicaciones
de la prueba.
Correlacin
bivariada.
Correlacin entre
las puntuaciones
de las 2 formas.
Correlacin
bivariada.
Mide
Aplicacin
Estabilidad temporal del

Puntaje
verdadero.
Predice
el
comportamiento futuro.
Depende de
la variable
que
se
pretende
medir y de
los sujetos
examinados
(Etapas
evolutivas).
Estabilidad temporal y
consistencia
de
las
respuestas
a
las
diferentes muestras de
tems.
Paralelismo/Equivalencia
.
corto
o
largo.
Si
hay tiempo
entre
las
aplicacione
s
puede
disminuir
por cambios
en el PV.
Contenido:
= contenido,
= dificultad
S 2e
Fluctuaciones
aleatorias (largo
alcance)
=
reducirse
espuriamente.
Memoria (Corto
alcance)
=
incrementarse
espuriamente.
Varianza
verdadera
Efectos de
aplicacin
Adivinacin
Falta
de
acuerdo entre los
calificadores
o
evaluadores.
Aplicacin
Adivinacin
Calificacin
Ventajas
Calculo
de
confiabilidad
test
Desventajas
la
del
restringido a
cambios al azar
de corto alcance
Practica
produce grados
de mejora
Efectos de la
memoria:
intervalos cortos,
mayor recuerdo,
resultados
no
independientes,
elevada y
falsa.
Facilita
la
aplicacin de la
misma prueba al
mismo Sujeto.
No
afecta
memoria.
Recomendada en
test de velocidad
Efecto
del
primer test sobre
el segundo el
uso de formas
alternas reduce,
pero no elimina
el efecto de la
prctica.
Difcil
construccin de
un
test
equivalente
grado en el que
la naturaleza de
Divisin por
mitades
KuderRichardson
Alpha
de
Cronbach.
Mediante diversos
procedimientos es
posible
obtener
una medida de rtt
a partir de una
nica
aplicacin
de la prueba ya
que al dividirla en
mitades
equivalentes. Se
obtienen
2
puntuaciones de
cada persona.
Un
test
se
encuentra
conformado
por
tantos
test
paralelos
como
tems tenga. Cada
tem es tratado
como
un
test
paralelo.
la magnitud en
que los tems de
un
test
estn
correlacionados
calculando
el
promedio de las
correlaciones
entre los reactivos
que forman un
instrumento
Se
obtienen
mitades paralelas
de una misma
prueba
y
se
calcula
la
correlacin entre
ellas
la
prueba
cambia con la
repeticin.
Este mtodo
tiene
el
inconveniente de
no ser til ante
pruebas
de
velocidad.
No
da
informacin de la
estabilidad
temporal.
Paralelismo
equivalencia entre las

pruebas. coeficiente de
precisin
1 Sola
Contenido:
= contenido,
= dificultad
Aplicacin
Adivinacin
Calificacin
Eficiente
en
cuanto a costo y
tiempo
La
correlacin
entre 1 tem y su
tem paralelo da
la rtt de 1 solo
tem
Consistencia Interna
1 sola
Contenido
tem:
= contenido,
= dificultad
Muestreo de
contenido
heterogeneidad
Da la mejor rtt
expresada como
test paralelos al
azar
Requiere de 1
sola aplicacin
No
da
informacin de la
estabilidad
temporal.
la intercorrelacin
entre los distintos
componentes de
un instrumento.
Rango:
Los
valores de este
coeficiente varan
entre 0 a 1,
siendo
los
valores
ms
Unidimensionalidad del
test. consistencia interna
Homogeneidad de los
tems o consistencia
interna del test.
Promedio de rxy de
todos los tems
Es ms estable que el
K-R
La heterogeneidad es
mala
o
buena
1 sola
Contenido
tem:
= contenido,
= dificultad
Adivinacin
Aplicacin
Velocidad
Cantidad de
tem
El muestreo de
contenido
La
heterogeneidad
de la conducta
muestreada.
Es indicador de la
unidimensionalida
d del test, pero se
requiere verificar la
estructura factorial
de la prueba.
Practicidad 1
sola aplicacin.
No
da
informacin de la
estabilidad
temporal.
r tt =
2.rtt
1+rtt
Confiabilida
d
entre
calificadores
o jueces
Magnusson
(2005) reporta que
ste ndice se
refiere al grado en
que los diferentes
tems
de
un
instrumento
covaran
estadsticamente
e indica cmo se
relacionan
entre
s.
Asimismo,
Cervantes (2005)
comenta
que
permite observar
la intercorrelacin
entre los distintos
componentes de
un instrumento, es
decir,
la
estimacin de la
equivalencia
de
los reactivos entre
s.
Grado de acuerdo
o consistencia que
existe entre dos o
ms evaluadores.
cercanos a 1
indicadores de un
alto grado de
consistencia
interna
(Magnusson,
2011). El clculo
de
este
coeficiente
proporciona
informacin
sobre
qu
reactivo
se
comporta de
dependiendo
del
constructo.
Heterogneo CIPersonalidad
Homogneo CalculoParcial
coeficiente
de
correlacin entre
las puntuaciones
asignadas
por
cada experto.
Kappa
Theta
Proporciona informacin
del error como resultado
de la calificacin de la
prueba.
<
homogeneidad <
consistencia
entre reactivo
1 Sola
Aplicacin
Adivinacin
Subjetividad
Calificacin
objetiva del test.
Informacin Adicional:
Alpha de Cronbach
Confiabilidad entre calificadores o
No
da
informacin de la
estabilidad
temporal.
Oviedo y Campo (2005) Interpretacin

Valor mnimo aceptable = 0,70. Menor = baja consistencia.
Valor mximo aceptable = 0,90. Mayor =Sobreestimacin.
Aceptable = 0,80-0,90
Oviedo y Campo (2005) expresan que representa una

propiedad inherente del patrn de respuesta de alguna
poblacin estudiada, no es un rasgo de una escala en s misma
por lo que puede variar en funcin al grupo al que se le aplique
el instrumento
Interpretacin
0.81-1 Muy alta
0.61 0.8 alta aceptable
0.41-0.60 moderada inadmisible
0.21 a 0.40 baja
0.01 a 0.20 muy baja 80% de la varianza del test es
varianza de error
Depende del uso. MERCADO

MEDICINA
CLNICO
INVESTIGACIN
jueces
De acuerdo a Viera y Garrett (2005), a
travs del estadstico Kappa, se puede
medir la confiabilidad entre observadores
en
situaciones
donde
dos
jueces
independientes estn evaluando el mismo
instrumento. En la tabla 1 se puede
apreciar la interpretacin estandarizada de
este ndice estadstico. Los autores
reportan que se puede utilizar un Kappa
por encima de 0,57
Kappa
<0
0,01-0,2
0,21-0,4
0,4-0,6
0,610,80
0,810,99
1
Interpretacin-Grado
acuerdo
Pobre Acuerdo
Escaso acuerdo
Acuerdo justo
Acuerdo Moderado
Acuerdo considerable
Acuerdo casi perfecto
Acuerdo Perfecto
0,70 (No mal coeficiente)

0,70 (Terrible) debe ser superior a 0,80
0,70 (terrible). Al tomar decisiones clnicas
debe ser superior a 0,90.
Entre 0,70 y 0,80
de
TEMA 5. LONGITUD DEL TEST Y HOMOGENEIDAD DE LA MUESTRA

Relacin
confiabilidad- longitud
Qu pasa con
La confiabilidad de los
puntajes de un test es
una funcin del nmero
de tems que componen
el test.
la confiabilidad se
incrementar al
aumentar el
nmero de test
paralelos
incluidos en el
test total
Errores
Terico
Esto sucede ya que los errores estn

compuestos por diferentes signos y
magnitudes, cuanto mayor es el nmero
de test paralelos incluidos en el test total,
tanto mayor ser el nmero de errores
que se cancelarn entre s. Esto permitir
que gradualmente nos acerquemos al
puntaje verdadero de un individuo.
Por lo tanto, si se aade

un nmero infinito de
test paralelos, nos
acercamos al puntaje
verdadero de cada
individuo y al valor 1.0
para la confiabilidad de
los puntajes del test
total.
la r tt ?
VARIANZA
VERDADERA
Primero veremos que le
sucede a la varianza de
los puntajes observados
cuando el test se dobla
en longitud, aadiendo
un nmero igual de
nuevos tems. S se
supone que estos tems
son paralelos a los del
test
original,
las
varianzas de las dos
mitades del test son
iguales
VARIANZA
VERDADERA
Los
puntajes
verdaderos en los test
paralelos se supone que
son iguales para cada
individuo. La varianza
verdadera, despus que
se ha doblado el
nmero de tems se
representa
de
la
siguiente manera.
VARIANZA DE ERROR
Cuando se duplica el
nmero de tem tambin
se duplica la varianza
de la distribucin de
puntajes de error
HOMOGENEIDAD DE LA MUESTRA DE PUNTAJES VERDADEROS

HETEROGENEIDAD
El tamao del coeficiente de Solo el tamao
DE LA MUESTRA DE
confiabilidad depende de la
del coeficiente
PUNTAJES
heterogeneidad de la
de confiabilidad
VERDADEROS
muestra de puntajes
es afectado por
> Heterogeneidad > rtt
verdaderos.
diferencias en la
A mayor homogeneidad en homogeneidad
< Heterogeneidad < rtt
la muestra de Individuos
de la muestra.
La 2=
HOMOGENEIDAD DE
2=
LOS REACTIVOS
2=sin
> Homogeneidad > rtt
(independiente de la
< Homogeneidad < rtt
homogeneidad de la
muestra)
FORMULARIO

Resumen Confiabilidad

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Resumen Confiabilidad

Загружено:

Авторское право:

Доступные форматы

Reproduccin

S e , mayor ser la Inconfiabilidad.

TEMA 2. EL ERROR ESTNDAR DE MEDIDA (EEM) E INTERVALO DE CONFIANZA (IC).

Hay que asegurar la estabilidad de los datos

Es esencial para que los datos proporcionados por

Propiedades de los errores

La media () de los puntajes

Intervalo de confianza (IC) y el Error estndar de medida (EEM)

Error estndar de medida (EEM)

S e = Error estndar de Medida (EEM)

X = puntaje obtenido, supuesto

Xi= Intervalos de confianza

TEMA 3. FUENTES DE ERROR ALEATORIO

Si la formulacin de los tems, las

Puede causar reacciones distintas en los

Control, estandarizacin, calidad del

Interaccin que hay entre las personas que

Rapport, respetar la consigna

Grado de las perturbaciones exteriores,

Si definimos la objetividad como el

Se puntu la prueba y no sea sistemtico

Factor de correccin. Al aplicar el

Los individuos necesitan recordar la

Pruebas paralelas (controla la

Cuando se cree que dos medidas

Cuando construimos test para medidas

Pruebas paralelas: Pruebas que

TEMA 4. MTODOS PARA ESTIMAR LA CONFIABILIDAD

Test paralelos al azar

Estabilidad temporal del

equivalencia entre las

Confiabilidad entre calificadores o

Oviedo y Campo (2005) Interpretacin

Oviedo y Campo (2005) expresan que representa una

Depende del uso. MERCADO

0,70 (No mal coeficiente)

TEMA 5. LONGITUD DEL TEST Y HOMOGENEIDAD DE LA MUESTRA

Esto sucede ya que los errores estn

Por lo tanto, si se aade

HOMOGENEIDAD DE LA MUESTRA DE PUNTAJES VERDADEROS

Вам также может понравиться