Вы находитесь на странице: 1из 10

Pregunta 1 El concepto de confiabilidad. Otras ideas incluidas.

Confiabilidad Todo instrumento vlido necesariamente va a tener un cierto ndice de confiabilidad


1

El criterio de confiabilidad tiene que ver con la consistencia de la herramienta de medicin, la precisin con la que mide la prueba. En teora. La herramienta de medicin perfectamente confiable mide de manera consistente en la misma forma.
2

En el lenguaje de la psicometra, confiabilidad se refiere, en un sentido amplio, al atributo de consistencia en la medicin. Y mientras en la conversacin cotidiana confiabilidad siempre denota algo que es valorado en forma positiva, confiabilidad en el sentido psicomtrico tan solo denota algo que es consistente, no necesariamente consistentemente bueno o malo, sino tan solo consistente. Confiabilidad no es lo mismo que estabilidad: Al determinar la confiabilidad se asume que la pruebe mide una caracterstica relativamente estable, A diferencia de la inestabilidad, la falta de confiabilidad es resultado de errores de medicin producidos por estados internos temporales, como la baja motivacin o la falta de disposicin, o de condiciones externas como un ambiente de pruebe incomodo.
3

Decimos que un test es confiable cuando al aplicarlo dos o ms veces al mismo individuo o grupo en circunstancias similares obtenemos resultados anlogos.
4

Averiguar la confiabilidad de un test equivale por lo tanto, a estimar la intensidad del error inherente al mismo o si se quiere, de su grado de imprecisin, y consiste, en esencia en averiguar la consistencia o estabilidad de notas obtenidas por los mismos individuos al administrarlos el mismo test, o bien al administrarles dos test de apariencia diferente pero que miden lo mismo y en los que sus elementos son equivalentes. La confiabilidad le da soporte al diagnstico e implica fundamentalmente tres conceptos. a. Consistencia: Se refiere al interior o a la lgica del test (ej. Un test no tiene consistencia si el sujeto acierta reactivos delimitados como difciles mientras falla en aquellos considerados fciles) b. Estabilidad: Se refiere a la presencia de estabilidad a travs del tiempo
5

1 2

Notas tomadas en clase COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Cuarta Edicin. Edit. Mc

Graw Hill. Pg. 38.


3

AIKEN, Lewis. Test psicolgicos y evaluacin. Onceava Edicin. Pagina 88. 4 PPT Confiabilidad
5

PPT Confiabilidad

c.

Constancia: Implica resistencia a la modificacin de las puntuaciones sin una intervencin importante en el ambiente del sujeto.
6

Varianza y Error Error: Se refiere al componente de la puntuacin observada en la pruebe de capacidad que no tiene que ver con la capacidad de quien responde la prueba.
7

Cualquier condicin que no sea afn al propsito del test representa una varianza de error; significa desviacin de la realidad, alejarse de la exactitud. Ejemplos: mala administracin de las instrucciones, hoja de tests incompletos, ruidos, etc.
8

Varianza: Una estadstica til para describir fuentes de variabilidad en las puntuaciones de una prueba es la varianza o desviacin estndar al cuadrado. Esta estadstica es til debido a que puede descomponerse en sus componentes. Varianza total: Varianza verdadera + Varianza de error. a. La varianza de las diferencias verdaderas es la varianza verdadera. Incluye aquellas fluctuaciones que estn contempladas en el instrumento. b. La varianza de las fuentes aleatorias irrelevantes (error) es la varianza de error. Provienen del ambiente en su mayora.
9

Relacin entre varianzas y confiabilidad El termino confiabilidad se refiere a la proporcin de la varianza total atribuida a la varianza verdadera, la prueba es ms confiable. Debido a que se supone que las diferencias verdaderas son estables, se presume que producen puntuaciones consistentes en aplicaciones repetidas de la misma prueba al igual que en formas equivalentes de las pruebas pero debido a que la varianza de error puede incrementar o disminuir una puntuacin de prueba en cantidades variables, se vera afectada la consistencia de la puntuacin, y por lo tanto la confiabilidad. Ntese que una fuente sistemtica de error NO afectara la consistencia de la puntuacin. Pregunta 2
10

6 7

PPT de confiabilidad; Notas tomadas en clase COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Cuarta Edicin. Edit. Mc Graw Hill. Pg. 155. 8 PPT Confiabilidad 9 COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Cuarta Edicin. Edit. Mc Graw Hill. Pg. 155. 10 COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Cuarta Edicin. Edit. Mc Graw Hill. Pg. 155.

Fuentes de Varianza de error; construccin de pruebas; administracin de pruebas, etc.) Significacin e interpretacin del coeficiente de correlacin de confiabilidad Fuentes de varianza de error La varianza de error de una prueba se puede ver afectada por diversos factores. Estos incluyen la construccin, administracin, calificacin de la prueba. Construccin de pruebas: Una fuente de varianza durante la construccin de pruebes el muestreo de reactivos o muestro de contenido, un trmino que se refiere a la variacin entre reactivos de una prueba, al igual que la variacin entre reactivos entre pruebas, Considrense dos o ms pruebas diseadas para medir una habilidad, atributo de personalidad o cuerpo de conocimiento especficos. Es seguro que se encuentran diferencias en la forma en que estn redactados los reactivos y diferencias en el contenido exacto del que se ha sacado la muestra. El grado en que la puntuacin de quien responde la prueba es afectada solo por el contenido presentado en la prueba al igual que por la forma en que se hizo el muestreo del contenido (es decir, la formas en que se construy el reactivo) es una fuente de varianza del error
11

Una fuente de varianza durante la construccin de la prueba es el muestreo de reactivos o muestro de contenido. Es importante que en el momento de construir un instrumento se tenga en cuenta la eleccin de tems, los materiales, las respuestas del individuo, la formulacin de las consignas y la cantidad de reactivos del que se compone el instrumento. Un mayor nmero de tems dar puntajes ms confiables.
12

Administracin de pruebas: Las fuentes de varianza de error que ocurren durante la aplicacin de la pruebe pueden influir en la atencin o motivacin de quien responde la prueba; por tanto; sus reacciones ante estas influencias son la fuente de una clase de varianza del error. Ejemplos de influencias adversas que operan durante la aplicacin de una prueba incluyen factores relacionados con el ambiente de la prueba: la temperatura del saln, el nivel de iluminacin y la cantidad de ventilacin y ruido, por ejemplo. Otras fuentes potenciales de varianza de error durante la aplicacin de la prueba incluyen variables de quien responde la prueba como el grado de incomodidad fsica, la cantidad de descanso que tuvo la noche anterior, el grado de ansiedad por la prueba, la extensin de problemas emocionales, apremiantes o el efecto de frmacos. Las variables relacionadas con el examinador que son fuentes potenciales de varianza de error incluyen la
13

presencia o ausencia de un examinador, su apariencia fsica y comportamiento, as como su profesionalismo. Calificacin e interpretacin de pruebas: El advenimiento de la calificacin computarizada y una creciente

dependencia de reactivos objetivos calificables por computadora casi han eliminado la varianza de error causa
11

COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Cuarta Edicin. Edit. Mc Graw Hill. Pg. 155. 12 PPT de confiabilidad 13 COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Cuarta Edicin. Edit. Mc Graw Hill. Pg. 157

por diferencias de los evaluadores en muchas pruebas. Sin embargo, Existen innumerables pruebas que todava requieren una calificacin por un personal capacitado, el ejemplo ms llamativo seran las pruebas proyectivas, aunque la calificacin de ensayos u observaciones conductuales tambin son fundamentalmente subjetivos. Tan pronto como una medida psicolgica usa cualquier cosa que no sean reactivos de tipo objetivo que se pueden someter a una calificacin computarizada confiable, el calificador o el sistema de calificacin se vuelve una fuente de varianza de error. Si la subjetividad est implicada en la calificacin, el calificador puede ser una fuente de varianza de error. En ocasiones las respuestas de un examinado caen en un rea gris. Solo mediante una capacitacin rigurosa podemos pretender disminuir esta fuente de varianza de error.
14

Otras fuentes de error: Ciertos tipos de situaciones de evaluacin se presentan a variedades particulares de error sistemtico y no sistemtico. Por ejemplo, el olvido. Otros estudios sugieren que hay factores que pueden contribuir a un error sistemtico en la forma de reportar gradualmente la perpetracin de abuso. Por ejemplo, en una escala de maltrato de fsico y psicolgico una mujer podra presentar menos abuso debido al temor o diversos factores sociales mientras podr presentar ms abuso si est en cambio estn buscando ayuda.
15

Significacin e interpretacin del coeficiente de correlacin de confiabilidad La confiabilidad de un conjunto de calificaciones en una prueba se expresa como un numero decimal positivo que flucta entre .00 y 1.00 indica una confiabilidad perfecta, y una r de .00 indica una falta absoluta de confiabilidad de la medicin.
16

Que tanto se pueden repetir las mediciones, con la misma forma o formas alternas de una prueba, a lo largo de intervalos cortos? A lo largo de intervalos largos? Estas son algunas de las preguntas que buscamos responder con referencia a un coeficiente de confiabilidad. Si el propsito de determinar la confiabilidad es analizar la varianza de error en sus partes, entonces tendran que calcularse varios coeficientes de confiabilidad. Cada uno de los diversos mtodos para estimar la confiabilidad toma en consideracin los efectos de circunstancias algo diferentes que pueden producir cambios no sistemticos en las puntuaciones. Pregunta 3
18 17

14

COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Cuarta Edicin. Edit. Mc Graw Hill. Pg. 157/158 15 COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Cuarta Edicin. Edit. Mc Graw Hill. Pg. 158 16 AIKEN, Lewis. Test psicolgicos y evaluacin. Onceava Edicin. Pagina 88. 17 COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Cuarta Edicin. Edit. Mc Graw Hill. Pg. 169 18 AIKEN, Lewis. Test psicolgicos y evaluacin. Onceava Edicin. Pagina 88

Tipos de confiabilidad. Test- re test; formas paralelas; divisin en mitades; Kuder Richardson y Coeficiente Alfa. Confiabilidad entre calificadores. Fiabilidad de repeticin del test o fiabilidad del re-test: El mtodo ms obvio para hallar la fiabilidad de un test consiste en repetirlo en una segunda ocasin. El coeficiente de fiabilidad en este caso es simplemente la correlacin entre las puntuaciones obtenidas por los mismos sujetos en las dos aplicaciones del test. La varianza de error corresponde a las fluctuaciones en la actuacin debidas al azar desde una sesin de prueba a otra. Estas variaciones pueden ser debidas en parte a condiciones de examen no controladas o a cambios en la condicin misma del sujeto. La fiabilidad del re test indica hasta qu punto las puntuaciones en un test pueden generalizarse en distintas ocasiones (cuanto ms alta sea la fiabilidad, tanto menos susceptibles son las puntuaciones a los cambios diarios casuales). Desventajas o posibles dificultades de la tcnica: La prctica probablemente originar valores diferentes de mejora en las puntuaciones de re-test de varios sujetos. Si el intervalo entre los tests es bastante corto, los sujetos recordarn muchas de las primeras respuestas. De esta manera, las puntuaciones en las dos 19 aplicaciones del test no se obtienen independientemente y la correlacin entre ellas seria falsamente alta. Fiabilidad de la forma equivalente o paralela: Compara dos formas equivalentes de una prueba que mide el mismo atributo. Las dos formas usan diferentes reactivos; sin embargo, las reglas utilizadas para seleccionar 20 los reactivos de un nivel particular de dificultad son las mismas. La correlacin entre las puntuaciones obtenidas en las dos formas representa el coeficiente de fiabilidad del test. Se advertir que este mide tanto la estabilidad temporal como la consistencia de las respuestas a las diferentes muestras de elementos (o 21 formas del test). Desventajas o posibles dificultades de la tcnica: En primer lugar, si las funciones de la conducta que estamos considerando estn sujetas al efecto de una larga prctica, el uso de formas paralelas reducir este efecto, pero no lo eliminar. Otra cuestin relacionada con estos problemas es el grado en que la naturaleza del test cambiar con la repeticin. Por ltimo, para muchos tests no se dispone todava de formas equivalentes a 22 causa de las dificultades prcticas que existen para su elaboracin. Fiabilidad de la divisin en mitades: La prueba se administra y se divide en mitades que son calificadas por separado. Los resultados de una de las mitades de la prueba se comparan con los resultados de la otra. Para estimar la confiabilidad de la prueba, podra obtener la correlacin entre las dos mitades. Sin embargo, esto sera una sub-estimacin pues cada sub prueba es nicamente de la mitad de extensin que una prueba completa. Para corregir la extensin de las pruebas que son aplicadas en mitades se puede aplicar la frmula 23 de Spearman-Brown. Un procedimiento adecuado para la mayora de los fines es el de hallar las puntuaciones de los elementos pares e impares del test. Si los elementos estaban originariamente dispuestos en un orden de dificultad aproximado, esta divisin proporciona puntuaciones muy aproximadamente equivalentes de las mitades.

19 20

ANASTASI, Anne. Tests Psicolgicos. Tercera edicin. Edit. Aguilar. Pgs. 81, 82, 83. KAPLAN, Robert; SACUZZO, Dennis. Pruebas Psicolgicas. Sexta Edicin. Edit. Thomson Learning. Pg. 109. 21 ANASTASI, Anne. Tests Psicolgicos. Tercera edicin. Edit. Aguilar. Pg. 84 22 ANASTASI, Anne. Tests Psicolgicos. Tercera edicin. Edit. Aguilar. Pg. 85 23 KAPLAN, Robert; SACUZZO, Dennis. Pruebas Psicolgicas. Sexta Edicin. Edit. Thomson Learning. Pgs. 109,110.

Limitaciones de la tcnica: En esta medida no entra la estabilidad temporal de las puntuaciones, puesto que 24 solo requiere una sesin. Las decisiones sobre cmo dividir las pruebas por mitades causan muchos 25 problemas potenciales. Fiabilidad de Kuder-Richardson: Se basa en la consistencia de las respuestas de los sujetos a todos los elementos del test. Esta tcnica, en lugar de basarse en el requisito de dos puntuaciones mitades, lo hace en un examen de la ejecucin de cada elemento. Se puede demostrar matemticamente que el coeficiente de fiabilidad KR20 es, en realidad, la media de todos los coeficientes de divisin en mitades que resulta de las 26 diferentes divisiones de un test. Limitaciones de la tcnica: Esta frmula requiere que se obtenga la proporcin de personas que tuvo cada reactivo correcto. Existen muchos tipos de pruebas, sin embargo, para las que no hay respuestas correctas o 27 incorrectas, como muchas de las escalas de personalidad y de actitudes. Coeficiente Alfa: Puede considerarse como la media de todas las correlaciones posibles al dividir en mitades. El coeficiente alfa puede utilizarse tambin en pruebas con reactivos no dicotmicos. De manera conceptual, este coeficiente se calcula para ayudar a responder preguntas sobre qu tan similares son los conjuntos de 28 reactivos. Medidas de confiabilidad entre evaluadores: es el grado de acuerdo o consistencia que existe entre dos o ms evaluadores (o jueces o calificadores). Si el coeficiente de confiabilidad es muy alto, el futuro usuario de la prueba sabe que las puntuaciones pueden ser derivadas en forma consistente y sistemtica por varios evaluadores con capacitacin suficiente. Quiz la forma ms simple de determinar el grado de consistencia que existe entre evaluadores en cuanto a la calificacin de una prueba sea mediante el clculo de un 29 coeficiente de relacin. A este coeficiente se le denomina coeficiente de confiabilidad entre evaluadores. Pregunta 4 Confiabilidad de las pruebas de velocidad y potencia. Semejanzas y diferencias. Conceptualizacin y ejemplos de tests de velocidad y potencia. Tanto en la elaboracin del test como en la interpretacin de sus puntuaciones, se establece una distincin importante entre la medida de la velocidad de la de potencia. Un test de velocidad pura es aquel en que las diferencias individuales dependen enteramente de la velocidad de la ejecucin. Un test de esta clase est constituido por elementos de una dificultad enormemente baja, todos los cuales pueden ser fcilmente resueltos por los individuos a quienes va dirigido el test. El tiempo lmite es tan escaso que nadie puede realizar todos los elementos. En estas condiciones, la puntuacin de cada persona refleja solamente la velocidad a la que ha trabajado. Un test de potencia pura, por otra parte, tiene un tiempo lmite que permite a todos realizar todos los elementos. La dificultad de los elementos est graduada marcadamente y el test incluye algunos elementos demasiado difciles de resolver, de forma que nadie pueda conseguir una puntuacin perfecta.
24 25

ANASTASI, Anne. Tests Psicolgicos. Tercera edicin. Edit. Aguilar. Pg. 86 KAPLAN, Robert; SACUZZO, Dennis. Pruebas Psicolgicas. Sexta Edicin. Edit. Thomson Learning. Pg. 111 26 ANASTASI, Anne. Tests Psicolgicos. Tercera edicin. Edit. Aguilar. Pg. 87,88,89. 27 KAPLAN, Robert; SACUZZO, Dennis. Pruebas Psicolgicas. Sexta Edicin. Edit. Thomson Learning. Pg. 113 28 COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Sexta Edicin. Edit. Mc Graw Hill. Pg. 139 29 COHEN, Ronald; SWERDLIK, Mark. Pruebas y Evaluacin Psicolgicas. Sexta Edicin. Edit. Mc Graw Hill. Pg. 140

Tipo de Test Velocidad

Semejanzas Estn proyectados para impedir la consecucin de puntuaciones perfectas (con razn de que las puntuaciones perfectas son indeterminadas )

Diferencias Las diferencias individuales en puntuacin se basan en el nmero de elementos que se ha intentado resolver El tipo de procedimiento ms adecuado para determinar la fiabilidad es la tcnica de repeticin del test * Mtodos recomendados: test re-test; formas equivalentes; * divisin en mitades en funcin del tiempo (aplicar las dos mitades con intervalos de tiempo) Tests con sta caracterstica: tests numricos y espaciales; tests de razonamiento; tests que miden constructos relacionados con habilidades cognitivas tales como memoria, atencin, sensopercepcin. Las diferencias individuales en puntuacin se basan en el nmero de errores El tipo de procedimiento ms adecuado para determinar la fiabilidad son los basados en la aplicacin de una sola prueba Mtodos recomendados: divisin en mitades, Kuder Richardson Tests con sta caracterstica: test de significado verbal; tests que miden constructos tales como inteligencia y aptitudes.

Potencia

En la prctica, la distincin entre los tests de velocidad y de potencia es solo de grado, puesto que la mayora de los tests dependen de la potencia y de la velocidad conjuntamente, en proporciones variables. Se necesita conocer en cada test esas proporciones para no solo comprender lo que el test mide, sino tambin para elegir los procedimientos adecuados para valorar su fiabilidad (algunos de los mtodos ms elegidos se mencionan en el cuadro ms arriba). *Los coeficientes de fiabilidad basados en una sola prueba son inaplicables a los tests de velocidad pues en la medida en que las diferencias individuales en las puntuaciones de los tests dependen de la velocidad de la ejecucin, los coeficientes de fiabilidad hallados por estos mtodos seran espuriamente altos. * Si no es factible aplicar por separado las dos mitades, un procedimiento alternativo consiste en dividir el 30 tiempo total en cuartos y hallar una puntuacin para cada uno de los cuatro cuartos. Pregunta 5 Fuentes de Varianza de error en relacin a los coeficientes de confiabilidad Las fuentes de varianza de error incluyen la construccin, administracin, calificacin e interpretacin de la prueba.
31

30 31

ANASTASI, Anne. Tests Psicolgicos. Tercera edicin. Edit. Aguilar. Pgs. 92-96 COHEN Ronald Jay. y Swerdlick Mark E. Pruebas y Evaluacin Psicolgicas. 4ta. edicin. Pg. 155

La relacin entre confiabilidad y error: A mayor confiabilidad, menor probabilidad de error. A menor confiabilidad, mayor probabilidad de error.
32

Si una prueba especfica de desempeo de los empleados es diseada para ser utilizada varias veces en el transcurso del periodo del empleo, sera razonable esperar que la prueba demuestre confiabilidad a lo largo del tiempo. Para una prueba diseada slo para una nica aplicacin, una estimacin de la consistencia interna sera el coeficiente calculado. Si el propsito de determinar la confiabilidad es analizar la varianza de error en sus partes, entonces tendran que calcularse varios coeficientes de confiabilidad. Un coeficiente de confiabilidad individual puede proporcionar un ndice de error de la construccin de la prueba, de la aplicacin de la prueba, de la aplicacin de la prueba o de la calificacin e interpretacin. Un coeficiente de confiabilidad entre evaluadores, proporciona informacin sobre el error como resultado de la calificacin de la prueba.
33

El trmino confiabilidad se refiere a los diversos mtodos que se usan para evaluar diferentes fuentes de error. Algunas veces las diversas fuentes de error ocurren en la misma situacin, por ejemplo el error asociado con el muestreo de reactivos y el error adicional ligado al muestreo de tiempo. Cuando se evala la informacin de confiabilidad, deben tomarse en cuenta todas las fuentes potenciales de error. El acuerdo interobservadores puede ser un problema en medicina bsica as como en estudios conductuales.
34

Pregunta 6 Clasificacin de los tipos de error Cualquier condicin que no sea afn al propsito del test representa una varianza de error; significa desviacin de la realidad, alejarse de la exactitud. As, cuando el examinador trata de mantener uniformes las condiciones de aplicacin del test, controlando ambiente, instrucciones, lmites de tiempo, rapport y otros factores similares, est reduciendo los varianza de error, haciendo ms fiables las puntuaciones. Sin embargo, an dndose las condiciones ptimas ningn test es un instrumento perfectamente fiable, siempre existir la incidencia del error; lo ideal es mantener el error dentro de los mrgenes razonables. En Psicometra existen 4 tipos de errores: a) Error tpico o error standard: Es el resultado acumulativo de las variables extraas que
35

inciden en un test. Es inherente al propio test, por lo tanto no afecta a la confiabilidad del instrumento. b) Error de medicin o de medida: Es el error que se encuentra contemplado en el

instrumento. Aqu se puede discernir las variables que pueden producir el error y este tipo de error si incide sobre la confiabilidad del test. Algunas de las variables que pueden afectar son: condiciones ambientales desfavorables, poca comprensin de la tarea, etc. Este tipo de error no se puede calcular estadsticamente.
32 33

PPT Confiabilidad. Diapositiva N 8 COHEN Ronald Jay. y Swerdlick Mark E. Pruebas y Evaluacin Psicolgicas. 4ta. edicin. Pg. 169 34 Ficha: Captulo 4. Confiabilidad 35 PPT Confiabilidad. Diapositiva N 8

c)

Error de tipo muestral: ocurre cuando la muestra de la conducta es deficiente. Afecta a la

confiabilidad del test. Existen dos tipos de errores muestrales: Muestreo del contenido del test: relacionado con la validez de contenido. El test no

es una buena muestra de los observables del rasgo que se quiere medir. Muestreo del universo de los sujetos: que sirvi para la elaboracin de las normas o

baremos. Ejemplo: cuando comparamos los resultados de un test aplicado en nuestro pas con normas de otro pas. Significa que estamos utilizando baremos inadecuados. d) Error tpico de medicin: la confiabilidad de un test se puede expresar en funcin del error

tpico de medida. Esta medida se adapta particularmente bien a la interpretacin de las puntuaciones individuales. Se calcula fcilmente a partir del coeficiente de confiabilidad dado por el manual del test. El error tpico de medicin y el coeficiente de confiabilidad dado por el manual del test. El error tpico de medicin y el coeficiente de confiabilidad son dos formas alternativas de expresar la confiabilidad del test. Cuando queremos comparar la confiabilidad del test, la mejor forma ser el coeficiente de confiabilidad, pero para interpretar puntuaciones individuales, el error tipo de medida constituye la forma ms apropiada. 6.1. El Error estndar de medicin Conceptos El error estndar de medicin es un ndice del grado en que las puntuaciones individuales de uno varan a lo largo de pruebas que se supone son paralelas. De acuerdo con el modelo de puntuacin verdadera, una puntuacin de prueba obtenida representa un punto en la distribucin de puntuaciones terica que podra haber obtenido quien responde la prueba. El error estndar de medicin nos permite estimar el rango en que es probable que exista la puntuacin verdadera, con un nivel de confianza especfico. No conocemos la puntuacin verdadera para ningn individuo que responda la prueba, as que debemos estimarla. La mejor estimacin disponible respecto a la puntuacin verdadera del individuo en la prueba es la puntuacin de 50 en una prueba de ortografa, y si la prueba tena un error estndar de medicin de 4, entonces usando 50 como el punto estimado podra ser 68% seguros de que la puntuacin verdadera cae dentro de 46 y 54; 95% entre 42 y 58 y 99% entre 38 y 62.
38 37 36

En la prctica, el error estndar de medicin se usa con ms frecuencia en la interpretacin de puntuaciones de prueba individuales.

Relacin con la confiabilidad El error estndar de medicin, como el coeficiente de confiabilidad, es una forma de expresar la confiabilidad de la prueba.

36 37

Ficha de trabajo Psicometra I COHEN Ronald Jay. y Swerdlick Mark E. Pruebas y Evaluacin Psicolgicas. 4ta. edicin. Pg. 179 38 COHEN Ronald Jay. y Swerdlick Mark E. Pruebas y Evaluacin Psicolgicas. 4ta. edicin. Pg. 180

El error estndar de la estimacin es til para establecer lo que se ha llamado intervalo de confianza; es decir, un rango o banda de puntuaciones de prueba que es probable que contengan la puntuacin verdadera. El error estndar de medicin puede ser usado para establecer el intervalo de confianza para una puntuacin particular o para determinar si una puntuacin es diferente de manera significativa de un criterio. El error estndar de medicin no puede emplearse para comparar puntuaciones.
39

39

COHEN Ronald Jay. y Swerdlick Mark E. Pruebas y Evaluacin Psicolgicas. 4ta. edicin. Pg. 181

Вам также может понравиться