Вы находитесь на странице: 1из 43

Preguntas de

control
Qu es confiabilidad?
Qu procedimiento se usa para estimar el
coeficiente de estabilidad de una prueba?
Cules son los mtodos usados para hallar la
consistencia interna de la prueba?

RECAPITULACINCONFERENCIA
CONFERENCIA
RECAPITULACIN
ANTERIOR
ANTERIOR

Concepto de Confiabilidad:
Hace referencia a la consistencia de las puntuaciones as como a la
estabilidad de los resultados en diferentes evaluaciones.
Tipos de confiabilidad:
Test retest coeficiente de estabilidad
Formas alternas coeficiente de equivalencia
Particin en mitades coeficiente de consistencia interna
Error estndar de medicin:
Otra forma de expresar la confiabilidad de una prueba

En una evaluacin de desempeo, se seleccionan a cuatro


trabajadores que encajan en el puesto solicitado. Hay un quinto
trabajador, no seleccionado, que solicita una revisin de su caso
ante las autoridades de la empresa. Quiere que le digan el por qu
no fue seleccionado. El Gerente de la empresa pide al psiclogo
encargado de la evaluacin que muestre las pruebas
administradas. Ante ello el profesional muestra los protocolos
administrados y manifiesta "el trabajador no califica para el puesto"
Cmo lo concluye Ud.?, le pregunta el Gerente. "Las pruebas
utilizadas para evaluar su capacidad de liderazgo, responsabilidad y
eficiencia en el trabajo as lo demuestran". Es decir, las pruebas
han sido construidas para evaluar esas capacidades y si las
personas puntan bajo quiere decir que no tienen desarrolladas
dichas capacidades. "Una prueba es vlida si mide lo que pretende
medir", desde este punto de vista, el trabajador no posea
adecuadamente desarrolladas estas habilidades.

OBJETIVOS
Analizar los conceptos de validez de una
prueba
Conocer los procedimientos para su
estimacin
Analizar el mtodo de validez de
contenido
Analizar el concepto de validez de facie

CONTENIDOS
Validez: Concepto y clasificacin
Validez de facie. Procedimientos para su
estimacin
Validez de contenido

PRUEBAS
JUSTIFICACIN
TERICA Y TCNICA

VALIDEZ
CONFIABILIDAD

La validez se define como

el grado
grado en
en que
que un
un test
test mide
mide lo
lo que
que
el
pretende medir.
medir.
pretende

Propiedades de la validez.....
Es cuestin de grado o fuerza ms que
del todo o nada. La validez no puede
resumirse en un nico coeficiente o ndice
numrico.
Se valida el uso para el que se destina el
instrumento ms que el instrumento en s.
Si bien existen diferentes tipos de validez,
todas son diferentes aspectos de un nico
concepto que es la validez de constructo.

VALIDEZ

Es la eficacia de una prueba para


representar, describir o pronosticar un
atributo
Sus datos se basan en la evidencia
emprica
El proceso de validacin sirve para validar
la prueba y la teora en que se basa

TIPOS DE VALIDEZ:
De contenido
De criterio
De constructo

Aparente o
de facie

VALIDEZ

Es un proceso que
sirve para evaluar la
Eficacia de una prueba

CONTENIDO

Psic. Carmen Blzquez Quintana

CRITERIO

Psic. Carmen Blzquez Quintana

CONSTRUCTO

Psic. Carmen Blzquez Quintana

Contiene el test una


Muestra representativa del
Comportamiento a
Medir?

Cun efectivo es un
test para la prediccin
De un resultado futuro?

Qu construccin
Psicolgica mide la prueba?
La mide bien?

Validez de contenido....
Expresa el grado en que el contenido de
un
test
constituye
una
muestra
representativa de los elementos del
constructo que pretende evaluar.
El propsito de un estudio de validacin
de contenido es establecer el grado en
que el conjunto de tems del test
representa adecuadamente un dominio de
conductas de inters especfico.

VALIDEZ DE CONTENIDO

TEMS

REPRESENTATIVOS

DEL CONSTRUCTO

RELEVANTES

IMPORTANTES

TABLA DE ESPECIFICACIONES: Psicometra

COMPETENCIAS

Conoce los
trminos bsicos

Normas
N tems

Confiabilidad Validez
N tems
N tems

Explica los
procedimientos
para obtener

Interpreta estos
datos en las
pruebas

N de tems = 40

Mtodos para hallar validez de


contenido....
De jueces
El tem es esencial, til pero no esencial o
no es necesario?
CVR= ne N/2
N/2
CVR: Razn de validez de contenido (0.99)
e
: esencial

Pruebas paralelas

Validez aparente o de facie:


Se refiere no a lo que el test mide sino, a
lo que superficialmente parece medir. No
tiene validez tcnica.
En qu grado el test parece medir lo que
pretende?
Es un juicio referido a lo relevantes que
parecen ser los reactivos de la prueba

Validez referida al criterio....


Cuando el usuario de un test quiere hacer
inferencias del test a la conducta del
sujeto en algn criterio de rendimiento
externo al propio test.
El criterio es una variable o caracterstica
de inters real (rendimiento acadmico,
rendimiento laboral, etc.)

Ejemplo:
VALIDEZDE
DECRITERIO
CRITERIODE
DEUN
UNTEST
TESTDE
DEINTELIGENCIA
INTELIGENCIA
VALIDEZ
C
R
I
T
E

Notasescolares
escolares
Notas

R
I
O

De
rendimiento
acadmico

ELCRITERIO
CRITERIOPUEDE
PUEDESER.
SER.
EL

PRESENTE

CONCURRENTE

Depende del tiempo


FUTURO

PREDICTIVO

GRUPOS
CONTRASTADOS

Pasos para obtener validez de criterio:


1. Identificar un criterio y un mtodo para
medirlo
2. Identificar una muestra de sujetos
3. Administrar el test y calificarlo
4. Obtener datos del criterio (concurrente)
o esperar un tiempo para recoger los
datos (predictiva)
5. Determinar el grado de asociacin entre
puntajes del test y el criterio

Ejemplo:
EPI
Melancola

Respuesta al tratamiento
1 ao

prueba

VALIDEZ PREDICTIVA

EPI
prueba
simultneo

Caractersticas
depresivas

BECK
Encuesta a
familiares
criterios

VALIDEZ CONCURRENTE

Validez predictiva
Cun efectivo es el test para la
Prediccin de un resultado futuro?

La relacin entre las puntuaciones de la prueba y una medida del criterio


obtenido en un momento futuro proporcionan un indicio de la validez
predictiva de la prueba
Es til para los tests de seleccin de personal, de estudiantes
universitarios o seleccin de militares para destinarlos a diferentes
especialidades

Utilizacin de los datos de validez:


Tablas de expectabilidad
Las tablas de expectabilidad expresan la
relacin entre las puntuaciones del sujeto
en el test y su posicin en el criterio
(concurrente o predictivo).

Distribucin de dos variables que muestra la relacin entre las puntuaciones en el


DAT y las calificaciones en retrica (lenguaje)

VALIDEZ CONCURRENTE

ESTIMA LA POSICIN PRESENTE


DE UN INDIVIDUO
EN UN CRITERIO

Se correlacionan los resultados del test y el criterio


medido actualmente. Es til para los tests
diagnsticos
Ejemplo: las puntuaciones de una prueba de
psicodiagnstico fueron validadas con el criterio de:
diagnstico dado por un psiquiatra a los pacientes.

ILUSTRACIN DE VALIDEZ
CONCURRENTE
Test de
Comprensin
verbal

Evaluacin de los
profesores
simultneo

Puntajes en el
test

Notas dadas
Por profesores

r=

Coeficiente de validez concurrente

Cul es el propsito de una tcnica de


evaluacin, ya sea psicomtrica o proyectiva?
En principio, una respuesta adecuada sera: la
tcnica sirve para operacionalizar algn constructo
hipottico.
Por ejemplo, al evaluar la variable de personalidad
Extraversin,
mediante
alguna
tcnica
psicomtrica, lo que estamos haciendo es
operacionalizar mediante un instrumento dicho
constructo hipottico. Puede haber ms de una
forma de operacionalizar dicho constructo y, de
hecho, tanto el EPQ-R como el Neo-Pi-R miden
entre otras dicha variable.
Cabra preguntarse si, en realidad, miden el
mismo constructo.

VALIDEZ DE CONSTRUCTO

Es el principal tipo de validez y


a su vez, la ms difcil de
comprobar.
Su finalidad es comprobar la
hiptesis que se deduce de
la teora.

Constructo
Los atributos psicolgicos y los procesos
mentales son constructos o conceptos
hipotticos que forman parte de las teoras
que intentan explicar la conducta humana.
Ejemplos:
inteligencia, creatividad, extroversinintroversin, etc.

VALIDEZ DE CONSTRUCTO

Comprobar la hiptesis que se deduce de la teora

Anlisis factorial

Identificar
Factor o factores
comunes

Diferencias entre grupos

Correlacin con otras


Medidas del constructo

Matrices multimtodo
mulitrrasgo

Todos a
puntan
a lo mis
mo: A s
i el instr
umento
mide lo
que dice
medir

Edades, sexo
Convergente o
Discriminante

Diferentes mtodos
Diferentes rasgos

Pasos para hallar validez de constructo...


1. Formular hiptesis acerca de las
relaciones entre los elementos del
constructo. Fundamento terico.
2. Seleccionar tems que representen al
constructo
3. Recoger datos del test
4. Establecer consistencia entre los datos

EVIDENCIAS DE LA VALIDEZ DE
CONSTRUCTO
Anlisis factorial
Diferencias entre edades
Correlaciones con otras medidas del
constructo
Matrices multimtodo - multirasgo

Anlisis factorial
Se utiliza cuando el test est dividido en
factores y sirve para medir la validez de
constructo, debido a que desde la teora del
instrumento se plantean los distintos
factores como atributos diferenciados.
El anlisis factorial, se utiliza no solo para
evaluar la validez del instrumento, sino
tambin su construccin

Diferenciacin entre grupos


Se aplica el instrumento a dos o ms
grupos, los cuales debieran diferir en el
atributo que se mide, en razn de alguna
caracterstica que se us para formar los
grupos, y que se podra inferir a partir de la
teora del constructo que mide el
instrumento, que dicha caracterstica estara
relacionada con diferencias predecibles en
el atributo.

Correlaciones con otras medidas del


constructo
Cuando existe otro test ya validado que
mide el mismo constructo, o varios tests,
se puede correlacionar el nuevo con el/los
antiguos, para establecer su validez de
constructo (convergente).
Este procedimiento, depende de que exista,
por lo menos un test, con un constructo
idntico o muy similar, al que se intenta
validar o que sean constructos opuestos
(discriminante).

Las Matrices multimtodo-multirasgo


Para poder aplicar esta tcnica se precisa que
existan como mnimo dos mtodos diferentes
para medir el constructo que se va a validar.
Tambin se necesitan otros constructos que
puedan ser medidos por los mismos mtodos.
Se miden en los sujetos de la muestra los
distintos constructos con mtodos diferentes.
Se calculan las correlaciones entre todas las
medidas y se forma con ellas una matriz que
contendra todos los datos resultantes.

Ejemplo:
En el ejemplo anterior del EPI, lo que importara
en este caso, si tomamos por ejemplo la variable
Neuroticismo no sera tanto si las puntuaciones de
Neuroticismo pueden servir para establecer
predisposicin
para
la
adquisicin
de
determinadas psicopatologas sino lo que se
considerara ms relevante sera establecer si
este factor que mide el test se corresponde
con el constructo Neuroticismo, ubicado en la
teora de la Personalidad de Eysenck, de la
cual se deriva el instrumento al que nos
referimos.

Ejemplo:

Datos (N=5)
X1
Rendim
9
3
6
2
7

X2
X3
Ansied Neurot
3
5
12
15
8
8
9
7
7
6

Correlaciones
RENDIM

ANSIE

NEURO

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N

RENDIM
1
.
5
-.865
.058
5
-.600
.285
5

ANSIE
-.865
.058
5
1
.
5
.853
.066
5

NEURO
-.600
.285
5
.853
.066
5
1
.
5

r12 0 '865

r13 0 '600

r23 0 '853

Conclusiones
Si un instrumento es poco confiable, esto
podra afectar su validez.
Si un instrumento tiene alta confiabilidad,
eso no significa que tenga que ser vlido;
un instrumento puede ser confiable y al
mismo tiempo no ser vlido.

los instrumentos tienen como propsito


operacionalizar constructos, o sea, medir
determinados atributos. La validez tiene que
ver con poder determinar si el instrumento
est midiendo realmente el atributo que dice
medir.
Determinar la validez de un instrumento es
mucho ms difcil que establecer su
confiabilidad.