Taller de Psicometría I

Taller de psicometra I
Jess Eduardo muoz bermejo
Docente: ketty herrera

Psicloga
Universidad de la costa cuc

Facultad de psicologa
Seminario de investigacin
Grupo AN
Barranquilla 2015
Con base en las lecturas ubicadas en la plataforma y consultas personales,

favor contestar las siguientes preguntas:
1. Definicin de confiabilidad
2. Definicin de error de medicin y tipos de error
3. Relacin entre el error de medicin y la confiabilidad.
4. Definicin de coeficiente de confiabilidad y su relacin con la correlacin
5. Tipos de confiabilidad
6. Definicin de validez
7. Tipos de validez
Desarrollo
1. R/ es una facultad psicomtrica que crea referencia a la desercin o ausencia

de errores de medida lo cual se entiende como la diferencia entre el valor
medido y el valor verdadero que interfieren en cualquier instrumento de medida,
este proceso fundamental dentro de un test psicomtrico es el que nos permite
obtener un alto grado de consistencia y estabilidad de las puntuaciones obtenidas
a lo largo de sucesivos procesos de medicin con un mismo instrumento. Cmo se
presenta la confiabilidad de un test psicomtrico? La
confiabilidad se presenta
por medio del coeficiente de confiabilidad) y del error estndar de medida (EEM).
2.R/ El error de medicin se define como la diferencia entre el valor medido y el

valor verdadero. Afectan a cualquier instrumento de medicin y pueden deberse a
distintas causas. Las que se pueden de alguna manera prever, calcular, eliminar
mediante calibraciones y compensaciones, se denominan determinsticos o
sistemticos y se relacionan con la exactitud de las mediciones. Los que no se
pueden prever, pues dependen de causas desconocidas, o estocsticas se
denominan aleatorios y estn relacionados con la precisin del instrumento.
Se clasifican en dos grandes vertientes: errores aleatorios y errores

sistemticos.
Error aleatorio: No se conocen las leyes o mecanismos que lo
causan por su excesiva complejidad o por su pequea influencia en el resultado
final.
Para conocer este tipo de errores primero debemos de realizar un
muestreo de medidas. Con los datos de las sucesivas medidas podemos calcular
su media y la desviacin tpica muestral. Con estos parmetros se puede obtener
la Distribucin normal caracterstica, N[, s], y la podemos acotar para un nivel de
confianza dado.
Las medidas entran dentro de la campana con unos "no"
mrgenes determinados para un nivel de confianza que suele establecerse entre
el 95% y el 98%. Error sistemtico: Permanecen constantes en valor absoluto y
en el signo al medir, una magnitud en las mismas condiciones, y se conocen las
leyes que lo causan. Para determinar un error sistemtico se deben de realizar
una serie de medidas sobre una magnitud Xo, se debe de calcular la media
aritmtica de estas medidas y despus hallar la diferencia entre la media y la
magnitud X0. Error sistemtico = | media - X0 |
3. R/ la falta de confiabilidad de un test psicomtrico esta en relacin con la

intervencin de error. Se considera que el error es cualquier efecto irrelevante
para los fines o resultados de la medicin que influye sobre la falta de
confiabilidad de tal medicin. De tal manera se relacionan ya que si hay muchos
errores en una prueba no existir confiabilidad.
4. R/ es un coeficiente de correlacin entre dos grupos de puntajes e indica el

grado en que los individuos mantienen sus posiciones dentro de un grupo abarca
valores desde 0 a 1 cuanto ms se acerca el coeficiente a 1 ms confiable ser
la prueba
5.R/Es necesario aclarar que la fiabilidad no es una propiedad de los test en s

mismos, sino de las interpretaciones, inferencias o usos especficos que se hagan
a partir de los datos y medidas que estos proporcionan. Asimismo, no puede
hablarse de la fiabilidad en trminos absolutos; s cabra hablar del grado de
fiabilidad que puedan presentar los instrumentos de medida en un contexto de
aplicacin determinado.
A partir de la variabilidad en las puntuaciones encontradas tras una serie de

mediciones repetidas puede determinarse el ndice de precisin, consistencia y
estabilidad de un instrumento. En el supuesto de que el resto de condiciones se
mantengan inalteradas, puede concluirse que, a mayor variabilidad de resultados,

menor fiabilidad del instrumento de medicin.1
No obstante, uno de los principales problemas que se presentan en el campo de la

investigacin en ciencias sociales tiene que ver con la dificultad de conseguir que
las distintas medidas se realicen exactamente en las mismas condiciones. Las
condiciones personales de los sujetos, como la motivacin, la maduracin o el
grado de atencin, pueden variar de una medicin a otra, por lo que resulta
imprescindible establecer un procedimiento estandarizado de medicin que
permita reducir al mnimo las variables extraas que puedan influir en los
resultados finales. Por lo tanto, la fiabilidad hace referencia a la estabilidad y
consistencia de las mediciones en aquellos casos en los que no existen razones
tericas o empricas que nos hagan suponer que la variable que se mide se haya
visto modificada de forma significativa por los sujetos, por lo que se asume su
estabilidad.2
La teora clsica de los tests
En el marco de la teora clsica de los tests, segn el modelo lineal clsico

propuesto por Charles Spearman (1904, 1907, 1913); la puntuacin emprica (X)
que obtiene un sujeto en un test, es la suma de dos componentes: la puntuacin
verdadera (V) y el inevitable error de medida asociado al instrumento.3 Es decir, si
a la puntuacin emprica (obtenida en la prueba) se le elimina el error de medida,
se obtendr la puntuacin verdadera. En este contexto, la fiabilidad hace
referencia a la proporcin de la varianza verdadera, es decir, la parte de la
varianza total que los tems discriminan por lo que tienen en comn.4 Siguiendo
este razonamiento, obtendramos:
\rho_{xx'} = \frac{{\sigma}^2_V}{{\sigma}^2_X} = 1 - \frac{ \sigma^2_E }{

\sigma^2_X }
donde \rho_{xx'} es el smbolo de la fiabilidad de las puntuaciones observadas (X);

y \sigma^2_X, \sigma^2_V, y \sigma^2_E son las varianzas de las puntuaciones
empricas, verdaderas y de error, respectivamente. Dado que no existe modo
alguno de determinar la puntuacin verdadera directamente, existe una serie de
mtodos para realizar una estimacin de la fiabilidad.
Coeficiente de fiabilidad
El coeficiente de fiabilidad ({\rho_{xx'}}) es la correlacin entre las puntuaciones

obtenidas por los sujetos en dos formas paralelas de un test (X y X'). Suponiendo
que las dos formas del test sean realmente paralelas (es decir, midan realmente lo
mismo), las puntuaciones de los sujetos deberan ser iguales en ambas
aplicaciones. As, cuando la correlacin es igual a 1, la fiabilidad es mxima. El
grado en que el coeficiente de fiabilidad se aleje de 1 ser un indicador del grado
de error aleatorio de medida que estaremos cometiendo en la aplicacin de las
pruebas. El coeficiente de fiabilidad no debe confundirse con el ndice de
fiabilidad, que es la correlacin entre las puntuaciones verdaderas y las empricas
({\rho_{xv}}), y se obtiene a partir de la raz cuadrada del coeficiente.
Estimacin emprica del coeficiente de fiabilidad
Desde la Teora Clsica de los Tests (TCT) se han propuesto diferentes

procedimientos para calcular la fiabilidad. Algunos de ellos son los siguientes:
Formas paralelas
Este procedimiento es el que se deriva naturalmente del modelo. Requiere que se

utilicen dos pruebas o instrumentos paralelos, esto es, que midan lo mismo de
forma diferente (por ejemplo, dos tests que con diferentes preguntas midan un
determinado rasgo). Despus se comparan los dos tests, calculando el coeficiente
de correlacin de Pearson. Esta correlacin ser, como hemos visto en el
apartado anterior, el coeficiente de fiabilidad. Si la correlacin es alta, se considera
que hay una buena fiabilidad. Al valor obtenido tambin se le conoce como
coeficiente de equivalencia, en la medida en que supone un indicador del grado de
equivalencia entre las dos formas paralelas de un test.
La dificultad de este procedimiento radica en conseguir que dos instrumentos sean

realmente "paralelos", dada la dificultad que supone realizar dos pruebas que
midan exactamente lo mismo, pero con diferentes tems. No obstante, en
condiciones ideales en las que se pueda garantizar el paralelismo de ambas
formas, este es el mtodo ms recomendable.
Test-retest
Con este mtodo el coeficiente de fiabilidad se calcula pasando mismo test dos
veces a los mismos sujetos. Se pueden pasar inmediatamente, o dejando un
intervalo de tiempo entre el test y el retest. Despus se calcula la correlacin de
Pearson entre las puntuaciones de ambas aplicaciones, y el resultado obtenido
ser el coeficiente de fiabilidad. Se considera un caso especfico de formas
paralelas, dado que evidentemente un test es paralelo a s mismo. Al resultado

obtenido se le denomina coeficiente de estabilidad, al servir de indicador de hasta
qu punto son estables las mediciones realizadas durante la primera aplicacin del
test. Las diferencias en los resultados se atribuyen al grado de consistencia
interna o muestreo de los tems de la prueba en el caso de pasar el retest de
forma inmediata, y se le suman las fluctuaciones en el tiempo en el caso del
intervalo temporal.
Dejar transcurrir un espacio de tiempo excesivo entre ambas aplicaciones puede

suponer una amenaza a la validez interna por las posibles influencias externas a la
que pueden estar expuestos los sujetos durante el intervalo, y que pueden afectar
a su desempeo en la segunda aplicacin. En el extremo opuesto, una aplicacin
demasiado apresurada del retest podra afectar igualmente a la validez interna, en
este caso por los posibles efectos del recuerdo reciente de la primera aplicacin.
La eleccin del intervalo de tiempo adecuado entre ambas aplicaciones depender
en gran medida del tipo de test, ya que en funcin de su formato puede ser ms
sensible al efecto de una u otra amenaza.2
Dos mitades
A diferencia de los anteriores, este mtodo slo requiere una aplicacin del test.
Tras obtener las puntuaciones obtenidas por los sujetos en cada una de las dos
mitades en que se habr dividido, se procede a calcular la correlacin entre las
dos puntuaciones. El resultado obtenido ser un indicador de la covariacin entre
ambas mitades, es decir, de la consistencia interna del test. La principal dificultad
de este sistema es asegurarse de que ambas mitades sean efectivamente
paralelas. Un sistema habitual es dividir el test entre los tems pares y los impares;
no es recomendable dividirlo sin ms por la mitad, dado que muchos tests
muestran un incremento gradual de la dificultad de sus tems.2
Otros mtodos basados en la consistencia interna
Alfa de Cronbach (1951): El coeficiente alfa () es un indicador de la fiabilidad

de un test basado en su grado de consistencia interna. Indica el grado en que los
tems de un test covaran.
Coeficientes de Kuder-Richardson (1937): Se trata de dos frmulas aplicables a
sendos casos particulares de alfa. KR20 se aplica en el caso en que los tems del
test sean dicotmicos, y KR21, en el caso de que adems de ser dicotmicos,
tengan la misma dificultad.
Mtodo de Rulon (1939): Una estimacin de la fiabilidad de un test a partir de

las puntuaciones obtenidas en sus dos mitades. Considera que la diferencia entre
las dos mitades se debe slo al error aleatorio.
Mtodo de Guttman/Flanagan (1945/1937): Otra frmula basada en la
consistencia interna, equivalente a la de Rulon.
Coeficiente beta (): Propuesto por Raju (1977) para calcular la fiabilidad de una
batera compuesta por diversos subtests. En los casos en los que se desea
calcular la fiabilidad de una batera, se trata a los distintos subtests como si fueran
los tems de un nico test y se calcula el coeficiente alfa global. El problema surge
en los casos en los que los distintos subtests no tienen el mismo nmero de tems,
lo que suele ser lo ms frecuente, y que repercute en una infraestimacin del alfa
global. El coeficiente beta permite sortear esta infraestimacin.
Coeficientes theta () y omega (): Basados en el anlisis factorial de los tems,
son indicadores de la consistencia interna similares al coeficiente alfa. El
coeficiente theta fue desarrollado por Carmines y Zeller (1979); y el coeficiente
omega fue desarrollado por Heise y Bohrnstedt (1970).2
6R/) Definicin de validez En trminos estadsticos la validez se define como la

proporcin de la varianza verdadera que es relevante para los fines del examen.
Con el trmino relevante nos referimos a lo que es atribuible a la variable,
caractersticas o dimensin que mide la prueba.
7. R/Tipos de validez
Validez de contenido: Se dice que una prueba o test cumple con las condiciones
de validez de contenido si constituye una muestra adecuada y representativa de
los contenidos y alcance del constructo o dimensin a evaluar. En los casos en los
que la materia objeto de medicin se puede precisar con facilidad, la poblacin de
contenidos que se pretende evaluar est bien definida, por lo que la seleccin de
los tems del test no ofrece mayores dificultades, pudindose recurrir a mtodos
estadsticos de muestreo aleatorio para obtener una muestra representativa de
tems. No obstante, en el campo de la psicologa no siempre es posible disponer
de poblaciones de contenidos bien definidas (por ejemplo, si se pretenden medir
variables psicolgicas clsicas, como la extraversin, la inteligencia o el liderazgo).
En estos casos suele recurrirse a un anlisis racional de tems, consistente en la
evaluacin de los contenidos del test por parte de un grupo de expertos en el rea.
Un caso particular de la validez de contenido es la denominada validez

aparente. Una prueba posee una validez aparente adecuada cuando produce en
los sujetos a los que se aplica la impresin de que efectivamente es una prueba
adecuada. Es un tipo peculiar de validez de contenido, pero que tiene su parte de
importancia al poder influir sobre la motivacin de los participantes, que pueden
mostrar una actitud negativa ante la prueba si no perciben que sta tenga el
sentido que se le supone.3
Validez predictiva: Tambin conocida como validez relativa al criterio o
validez de pronstico, se refiere al grado de eficacia con que se puede predecir
o pronosticar una variable de inters (criterio) a partir de las puntuaciones en un
test. Es frecuente que en los procesos de seleccin de personal se utilicen
instrumentos que pretendan determinar o predecir el rendimiento futuro de los
candidatos al puesto de trabajo basndose en las respuestas obtenidas. Para ello
es necesario que se haya obtenido una evidencia emprica de que los resultados
obtenidos en la prueba correlacionen efectivamente con el rendimiento futuro en el
puesto de trabajo.
Del apoyo de medidas indirectas. Los conceptos de peso o volumen son

suficientemente tangibles como para no resultar susceptibles de interpretaciones
subjetivas al respecto de su significado, pero no ocurre lo mismo en el caso de
variables psicolgicas como el neocriticismo o la introversin. Estos conceptos
precisan del acuerdo o consenso sobre sus significados para poder ser
catalogados como tiles y vlidos desde un punto de vista cientfico.
La validez de constructo: pues, hace referencia a la recogida de evidencias
empricas que garanticen la existencia de un constructo psicolgico en las
condiciones exigibles a cualquier otro modelo o teora cientfica.3 Por todo ello, la
validez de constructo se presenta como una condicin indispensable a la hora de
valorar la eficacia de un instrumento de evaluacin sobre una variable psicolgica
determinada.
Referencias:
http://es.wikipedia.org/wiki/Validez_%28psicometr%C3%ADa%29
Psicometra: Tests Psicomtricos, Confiabilidad y Validez Jaime Aliaga Tovar

Taller de Psicometría I

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Taller de Psicometría I

Загружено:

Авторское право:

Доступные форматы

Taller de psicometra I

Jess Eduardo muoz bermejo

Docente: ketty herrera

Universidad de la costa cuc

Con base en las lecturas ubicadas en la plataforma y consultas personales,

1. R/ es una facultad psicomtrica que crea referencia a la desercin o ausencia

2.R/ El error de medicin se define como la diferencia entre el valor medido y el

Se clasifican en dos grandes vertientes: errores aleatorios y errores

3. R/ la falta de confiabilidad de un test psicomtrico esta en relacin con la

4. R/ es un coeficiente de correlacin entre dos grupos de puntajes e indica el

5.R/Es necesario aclarar que la fiabilidad no es una propiedad de los test en s

A partir de la variabilidad en las puntuaciones encontradas tras una serie de

mantengan inalteradas, puede concluirse que, a mayor variabilidad de resultados,

No obstante, uno de los principales problemas que se presentan en el campo de la

En el marco de la teora clsica de los tests, segn el modelo lineal clsico

\rho_{xx'} = \frac{{\sigma}^2_V}{{\sigma}^2_X} = 1 - \frac{ \sigma^2_E }{

donde \rho_{xx'} es el smbolo de la fiabilidad de las puntuaciones observadas (X);

El coeficiente de fiabilidad ({\rho_{xx'}}) es la correlacin entre las puntuaciones

Desde la Teora Clsica de los Tests (TCT) se han propuesto diferentes

Este procedimiento es el que se deriva naturalmente del modelo. Requiere que se

La dificultad de este procedimiento radica en conseguir que dos instrumentos sean

paralelas, dado que evidentemente un test es paralelo a s mismo. Al resultado

Dejar transcurrir un espacio de tiempo excesivo entre ambas aplicaciones puede

Alfa de Cronbach (1951): El coeficiente alfa () es un indicador de la fiabilidad

Mtodo de Rulon (1939): Una estimacin de la fiabilidad de un test a partir de

6R/) Definicin de validez En trminos estadsticos la validez se define como la

Un caso particular de la validez de contenido es la denominada validez

Del apoyo de medidas indirectas. Los conceptos de peso o volumen son

Psicometra: Tests Psicomtricos, Confiabilidad y Validez Jaime Aliaga Tovar

Вам также может понравиться