Вы находитесь на странице: 1из 30

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE PSICOLOGIA

PSICOMETRIA

Mg. Luis Miguel Escurra M.

TURNO DIURNO

2 0 1 8
CAPITULO 6
Temas a tratar

Evidencias de Validez

A) El contenido del test.

B) Los procesos de respuesta.


CAPITULO 6

EVIDENCIAS DE VALIDEZ - I
A) EVIDENCIAS DE VALIDEZ BASADAS
EN EL CONTENIDO.
Aluden a la relevancia y al alcance del contenido
del instrumento. Los procedimientos utilizados
son :

a) Examen sistemático del contenido de la


prueba para determinar si cubre todos esos
contenidos, se trata de demostrar que
realmente es una muestra representativa del
dominio de contenido que se pretende medir.
b) Análisis de la relevancia de los contenidos,
debe incluir todo lo que es esencial o
relevante, sin prejuicio de que también se
incluyan cuestiones colaterales o irrelevantes,
pero sabiendo que lo son y tratándolas como
tales.

En el aporte de evidencias de validez basadas en


el contenido se trata de analizar tanto la
representación como la relevancia del
contenido (Anastasi y Urbina, 1997;
Santisteban, 1990).
Para establecer estas evidencias se requiere un
análisis sistemático del dominio o área de
conducta.

Este análisis deben realizarlo expertos que


verifiquen que los ítems del test cubren todos los
aspectos importantes y que todos y cada uno de
esos aspectos están debidamente
representados, incluyendo la proporción correcta
de ítems.
Las evidencias de validez basadas en el contenido
no se aprecian mediante una lectura más o
menos detallada del test, que incluso puede
hacerla cualquier participante en la prueba,
concluyendo que es válido, pues esto sería sólo
un juicio muy bien, en amplitud y en profundidad,
el constructo del que se quiera realizar la
medición, así como las conexiones con sus
manifestaciones observables.
Sólo un experto, puede determinar si la prueba
presenta evidencias de validez de contenido
porque incluye todos los aspectos relevantes
que deben ser medidos.
Las evidencias se pueden aportar desde el inicio
del proceso de construcción de la prueba
mediante la elección de los ítems adecuados.

Tras un proceso previo de revisión de la literatura


pertinente, se establece la tabla de
especificaciones de la prueba que han de
seguir los especialistas a los que se
encomienda la redacción de los ítems,
precisando las áreas o temas de contenido, los
objetivos o procesos que han de evaluarse y la
importancia relativa de temas y procesos
individuales.
Proceso mediante jueces
Definición del universo de indicadores:

– Ser claros y explícitos en el significado


de los indicadores.

– Si no hay claridad, los jueces no podrán


hacer un buen trabajo.
Identificación de jueces
– Experiencia en investigaciones con el
constructo.
– Diversidad de opiniones en cuanto a su
número.

Contacto y solicitud
– Carta formal: presentación, objetivos,
indicar la manera como deben emitir y
registrar sus valoraciones.
Juicio de expertos
– Recolección en protocolos
– Métodos:
• Clasificación.
• Calificación.

Procesamiento de información
– Elaboración de la base de datos: identificar
juez e ítem.
– Cuantificación mediante índices.
Protocolo para clasificación
A continuación encontrará un listados de ítems que hay sido diseñados para
evaluar tres procesos matemáticos en estudiantes de sexto grado de
primaria:

A: Resolución de problemas
B: Razonamiento y demostración
C: Comunicación Matemática

Luego de revisar cada ítem, indique con un aspa qué proceso considera
usted que está siendo medido por cada uno de los ítems.

A B C
Ítem 01
Ítme 02
Ítem 03

Protocolo para calificación
A continuación encontrará un listados de ítems que hay sido
diseñados para evaluar el proceso de resolución de problemas
matemáticos en estudiantes de sexto grado de primaria:

Luego de revisar cada ítem, indique con un aspa que tan bien está
representando el ítem al proceso señalado.

Resolución de problemas mal regular bien


Ítem 01
Ítme 02
Ítem 03

Índice de acuerdos
Método de clasificación

Es el número de jueces que asigna el ítem a


un área, dividido entre el número total de
jueces.

No hay acuerdo en que valor es el


adecuado. Generalmente se aceptan
valores superiores a 0,80.
Índice de acuerdos

Área
A B C IAA IAB IAC
ítem
01 8 2 0 0,80 0,20 0,00
02 1 8 1 0,10 0,80 0,10
03 0 5 5 0,00 0,50 0,50
04 1 2 7 0,10 0,20 0,70

n: 10 jueces
Coeficiente V de Aiken
Método de Calificación

Cada juez debe evaluar en una escala politómica


(de dos a siete puntos) la representatividad del
ítem para evaluar el indicador.

Se recomiendan por lo menos 10 jueces

Valores de 0 a 1, significación estadística según el


número de jueces y escala de calificación
Coeficiente V de Aiken

S
V
(n(c  1))
Donde:
S = sumatoria de si( el valor más alto menos el mas
bajo)
Si = valor asignado por el juez i
n = número de jueces
c = número de valores en la escala de valoración
Coeficiente V de Aiken
(formula alterna 1)

Donde:
ri = valor que emite cada juez ante un ítem.
b = valor más bajo que se puede asignar en la escala de
valoración.
n = Número de Jueces.
c = Número de valoraciones que se pueden asignar en
la escala de calificación.
Coeficiente V de Aiken
(formula alterna 2)

Donde:
Mj = media aritmética de las calificaciones de los jueces
en la muestra.
l = calificación más baja posible
k = rango de los valores posibles de la escala.
Coeficiente V de Aiken

Ítem V sig
01 1,00 *
02 0,60
03 0,90 *
04 0,40
La validez aparente está muy relacionada con la
validez de contenido, pero no pueden ni deben
confundirse.

No es una validez desde un punto de vista técnico,


pues es el grado en que la medición parece
estar relacionada con un determinado
constructo, según el juicio emitido por un
experto, que en muchos casos suele ser la
persona que aplica el test o quien lo responde, la
validez aparente no aporta pruebas de lo que se
mide, sino de lo que parece que se mide.
B) EVIDENCIAS DE VALIDEZ BASADA EN
LOS PROCESOS DE RESPUESTA

Se refieren a la coincidencia o concordancia


que debe existir entre los procesos
psicológicos que ponen en juego los
sujetos que responden al test y los que
teóricamente se supone que deberían
utilizar.
.
Muchas medidas psicológicas están basadas en
ciertos supuestos teóricos sobre cuáles son los
procesos psicológicos que las personas utilizan
cuando desarrollan el test.

Si esos procesos no fueran los que usan los sujetos


en la prueba cuando responden el test, entonces
la medición puede estar dando puntuaciones que
no son interpretables en el sentido que se
pretendía por parte de quien o quienes están
construyendo el test.
Por ejemplo:

Para estudiar la memoria a corto plazo. Se puede


construir una prueba conformada por listas de
palabras categorizadas, que tras su lectura los
participantes deben recordar.

Para estar seguros que se utiliza la memoria de


corto plazo y no otro proceso, se puede tratar
de analizar el rendimiento en la memoria de
orto plazo en diferentes condiciones de ruido.
Para probarlo se realiza un experimento, de
manera que todos los sujetos deben
realizan las pruebas en las siguientes
condiciones:
A) Presencia de ruido (Leq = 80 dB).
B) Ausencia de ruido (Leq = 35 dB).

A los sujetos se les divide en grupos para


contrabalancear el efecto del orden, tanto
en la presentación de las listas, como en
las condiciones de ruido y de silencio en
las que se administran las pruebas.
A pesar que existen otros factores cognitivos
como la inteligencia, la facilidad para
establecer relaciones, entre otros, que
pueden influir en los resultados
individuales de la prueba, es razonable
asumirlos como una constante, por lo
que suponemos que esas variables
afectan de la misma manera a todos los
grupos, pues la asignación de los
participantes a los grupos de ha hecho
de forma aleatoria.
Los investigadores suponen que en presencia de ruido,
los sujetos deben asignar más recursos atencionales
para mantener el mismo nivel de rendimiento en el
recuerdo de palabras.

Los resultados indican que el número de palabras


recordadas es significativamente mayor en silencio
que en presencia de ruido.

Al analizar las respuestas se puede detectar que los


tiempos empleados por algunos participantes son
sistemáticamente menores en los ensayos que
realizan en presencia de ruido.
La razón podría deberse a que no han
seguido las instrucciones en cuanto a
que cuando completen un ensayo pasen
al siguiente presionando la tecla enter,
pues esos participantes, en lugar de
intentar completar la prueba, acortan
sus tiempos de respuesta porque el
ruido les resulta molesto, siendo ésta la
principal razón por la que dan un menor
número de palabras recordadas en
presencia de ruido.
Por lo tanto, las inferencias que puede hacer el
psicólogo con esos datos no son válidas
en relación con sus propósitos, aunque
podría haberle pasado inadvertidas porque
de alguna manera las propicia el
procedimiento experimental.

¿Podrían estar midiendo, sin proponérselo, la


sensibilidad individual al ruido?
Por lo tanto, en los procedimientos para
establecer las evidencias de validez de
una prueba, y muy especialmente en las
evidencias de validez relacionadas con el
constructo, es necesario incluir
evidencias de validez basada en los
procedimientos y los procesos que
intervienen en la emisión de la respuesta.

Вам также может понравиться