0 оценок0% нашли этот документ полезным (0 голосов)
95 просмотров5 страниц
El documento describe cómo se realiza la prueba de Alfa de Cronbach para medir la fiabilidad de una escala de medida. El Alfa de Cronbach calcula la fiabilidad como consistencia interna midiendo la media de las correlaciones entre los ítems de una escala. También se mencionan otros tipos de fiabilidad como la equivalencia, estabilidad y los métodos para medirlos, como las formas paralelas y el test-retest. Finalmente, explica cómo se utiliza el coeficiente Alfa de Cronbach para determinar la fiabilidad de un instrumento de medida.
El documento describe cómo se realiza la prueba de Alfa de Cronbach para medir la fiabilidad de una escala de medida. El Alfa de Cronbach calcula la fiabilidad como consistencia interna midiendo la media de las correlaciones entre los ítems de una escala. También se mencionan otros tipos de fiabilidad como la equivalencia, estabilidad y los métodos para medirlos, como las formas paralelas y el test-retest. Finalmente, explica cómo se utiliza el coeficiente Alfa de Cronbach para determinar la fiabilidad de un instrumento de medida.
El documento describe cómo se realiza la prueba de Alfa de Cronbach para medir la fiabilidad de una escala de medida. El Alfa de Cronbach calcula la fiabilidad como consistencia interna midiendo la media de las correlaciones entre los ítems de una escala. También se mencionan otros tipos de fiabilidad como la equivalencia, estabilidad y los métodos para medirlos, como las formas paralelas y el test-retest. Finalmente, explica cómo se utiliza el coeficiente Alfa de Cronbach para determinar la fiabilidad de un instrumento de medida.
La psicometría es la disciplina que se encarga de medir y cuantificar variables psicológicas de la psique humana, mediante un conjunto de métodos, técnicas y teorías. A esta disciplina pertenece el Alfa de Cronbach (α), un coeficiente utilizado para medir la fiabilidad de una escala de medida o test. La fiabilidad es un concepto que tiene varias definiciones, aunque a grandes rasgos se puede definir como la ausencia de errores de medida en un test, o como la precisión de su medición. En este artículo vamos a conocer las características más relevantes del Alfa de Cronbach, así como sus usos y aplicaciones, y de qué manera se utiliza en estadística. Artículo relacionado: "Prueba de chi-cuadrado (χ²): qué es y cómo se usa en estadística" Alfa de Cronbach: características El Alfa de Cronbach (se representa mediante α) le debe su nombre a Lee Joseph Cronbach, que bautizó este coeficiente así en 1951. L.J. Cronbach fue un psicólogo estadounidense que se hizo conocido por sus trabajos en psicometría. Sin embargo, los orígenes de este coeficiente los encontramos en los trabajos de Hoyt y de Guttman. Este coeficiente consiste en la media de las correlaciones entre las variables que forman parte de la escala, y puede calcularse de dos maneras: a partir de las varianzas (Alfa de Cronbach) o de las correlaciones de los ítems (Alfa de Cronbach estandarizado). Tipos de fiabilidad La fiabilidad de un instrumento de medida tiene varias definiciones o “subtipos”, y por extensión, existen también diferentes métodos para determinarlos. Estos subtipos de fiabilidad son 3, y de manera resumida, estas son sus características: 1. Consistencia interna Es la fiabilidad como consistencia interna. Para calcularla se utiliza el Alfa de Cronbach, que representa la consistencia interna del test, es decir, el grado en que todos los ítems del test covarían entre sí. 2. Equivalencia Implica que dos test sean equivalentes o “iguales”; para calcular este tipo de fiabilidad, se utiliza un método de dos aplicaciones llamado formas paralelas o equivalentes, donde se aplican de forma simultánea dos test. Es decir, el test original (X) y el test diseñado específicamente como equivalente (X’). 3. Estabilidad La fiabilidad también se puede entender como la estabilidad de una medida; para calcularla, se utiliza también un método de dos aplicaciones, en este caso el test-retest. Consiste en aplicar el test original (X), y pasado un lapso de tipo, el mismo test (X). 4. Otros Otro “subtipo” de fiabilidad y que incluiría la 2 y la 3, es aquel que se calcula a partir de un test-retest con formas alternativas; es decir, se aplicaría el test (X), transcurriría un lapso de tiempo y se volvería a aplicar un test (esta vez una forma alternativa del test, el X’). Cálculo del Coeficiente de Fiabilidad Así, hemos visto cómo la fiabilidad de un test o instrumento de medida intenta establece la precisión con la éste realiza sus mediciones. Se trata de un concepto muy asociado al error de medida, ya que, a mayor fiabilidad, menos error de medida. La fiabilidad es un tópico constante en todos los instrumentos de medida. Su estudio trata de establecer la precisión con la que mide cualquier instrumento de medida en general y los test en particular. Cuanto más fiable es un test, con mayor precisión mide y, por lo tanto, menos error de medida se comete El Alfa de Cronbach es un método de cálculo del coeficiente de fiabilidad, que identifica la fiabilidad como consistencia interna. Se denomina así porque analiza hasta qué punto medidas parciales obtenidas con los diferentes ítems son “consistentes” entre sí y por tanto representativas del universo posible de ítems que podrían medir ese constructo. ¿Cuándo utilizarlo? Se utilizará el coeficiente Alfa de Cronbach para calcular la fiabilidad, salvo en casos en los que tengamos un interés expreso en conocer la consistencia entre dos o más partes de un test (por ej. primera mitad y segunda mitad; ítems pares e impares) o cuando queramos conocer otros “subtipos” de fiabilidad (por ejemplo, basados en métodos de dos aplicaciones como el test-retest). Por otro lado, en el caso de que estemos trabajando con ítems valorados dicotómicamente, se utilizarán las fórmulas de Kuder-Richardson (KR –20 y KR -21). Cuando los ítems tengan diferentes índices de dificultad, se utilizará la fórmula KR –20. En el caso de que el índice de dificultad sea igual, utilizaremos KR –21. Referencias bibliográficas: Barbero, M.I. (2010). Psicometría (teoría, formulario y problemas resueltos). Madrid: Sanz y Torres. Martínez, M.A. Hernández, M.J. Hernández, M.V. (2014). Psicometría. Madrid: Alianza. Santisteban, C. (2009). Principios de psicometría. Madrid: síntesis.
¿COMO SE REALIZA LA VALIDEZ POR CONTENIDO?
En términos estadísticos, la validez se define como la proporción de la varianza verdadera que es relevante para los fines del examen. Con el término ‘relevante’ nos referimos a lo que es atribuible a la variable, las características que mide la prueba (1). Pero, ¿sabemos que existen varios tipos de validez? En este sentido, generalmente la validez de un test se define ya sea por medio de: La relación entre sus puntuaciones con alguna medida de criterio externo, o bien. La extensión con la que la prueba mide un rasgo subyacente específico hipotético o «constructo». La validez en términos psicométricos En términos psicométricos, la validez es un concepto que ha pasado por un largo proceso evolutivo. Al principio, Muñiz (1996) adoptó la validez con una posición en concreto. Esta sostenía que «un test es un válido para aquello con lo que correlaciona». Ahora, la validez se entiende como un juicio evaluativo global. En este juicio, la evidencia empírica y los supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones no solo de los ítems, sino también de la forma de responder de las personas, así como del contexto de la evaluación. Entonces, lo que se valida no es la prueba. Lo que se valida en concreto son las inferencias hechas a partir de la misma. Ello tiene dos consecuencias: El responsable de la validez de una prueba ya no es solo su constructor, sino también el usuario. La validez de una prueba no se establece de una vez por todas. Es el resultado del acopio de evidencias y supuestos teóricos que se dan en un proceso evolutivo y continuo. Este comprende todas las cuestiones experimentales, estadísticas y filosóficas por medio de las cuales se evalúan las hipótesis y teorías científicas (3). En este contexto, el concepto validez se refiere a la adecuación, significado y utilidad de las inferencias especificas hechas con las puntuaciones de los test. La validación de un test es el proceso de acumular evidencia para apoyar tales inferencias. Así, la validez es un proceso unitario. Aunque la evidencia puede ser acumulada de muchas formas, la validez se refiere siempre al grado en que esa evidencia apoya las inferencias que se hacen a partir de las puntuaciones (4). Tipos de evidencia En 1954, un comité presidido por L. J. Cronbach estableció por encargo de la Asociación de Psicología Americana (APA) que la validez era de cuatro tipos. Estas son: Validez de contenido. Validez predictiva. Validez concurrente. Validez de constructo. Actualmente se coincide, desde el punto de vista científico, que la única validez admisible es la validez de constructo (Messick, 1995). La validez y sus aspectos Dentro del estudio de la validez, las evidencias están relacionadas con cinco aspectos: El contenido (la relevancia y representatividad del test). El sustantivo (las razones teóricas de la consistencia observada de las respuestas). Estructural (configuración interna del test y dimensionalidad). Generalización (el grado en que las inferencias hechas a partir del test se pueden generalizar a otras poblaciones, situaciones o tareas). Externo (relaciones del test con otros test y constructos). Consecuencia (consecuencias éticas y sociales del test) (3). Así, dentro de esta validez podemos entender otros tipos de validez o estrategias. Como hemos mencionado previamente, estas son la validez de contenido, la validez predictiva, la validez concurrente y la validez de constructo. Tipos de validez: validez de contenido En este tipo de validez se responde a la siguiente pregunta. ¿Los ítems que constituyen el test son realmente una muestra representativa del dominio de contenido o dominio conductual que nos interesa? Para que nos entendamos, un dominio o campo conductual es una agrupación hipotética de todos los ítems posibles que cubren un área psicológica particular. Por ejemplo, un test de vocabulario debe ser una muestra adecuada del dominio de ítem posibles en esta área. En este sentido, la validez de contenido es una «medida» de lo adecuado del muestreo. Se dice «medida» entre comillas, ya que este tipo de validez consiste en una serie de estimaciones u opiniones. Estas estimaciones no proporcionan un índice cuantitativo de validez. (1) Este tipo de validez se asocia sobre todo a los test de rendimiento (test de matemáticas, historia…). Para su determinación, se comparan sistemáticamente las preguntas del test con el dominio conductual del contenido postulado. Por ejemplo, tenemos una lista de 500 palabras que esperamos que los estudiantes de un curso sean capaces de escribir correctamente. Entonces, su rendimiento respecto a estas palabras será importante exclusivamente para probar la habilidad del estudiante para escribir correctamente las 500 palabras. Sin embargo, solo tendrá validez de contenido en la medida en que proporcione una muestra adecuada de las 500 palabras que represente. (1) Si seleccionamos solamente palabras fáciles o difíciles, o palabras que representen únicamente ciertos tipos de faltas de ortografía, estaríamos propensos a obtener una validez de contenido muy baja. Conclusión: ¿cuál es la utilidad de la validez de contenido? En consecuencia, el aspecto clave en la validez de contenido es el muestreo de los ítems. En otras palabras, la validez de contenido es capaz de determinar si la muestra de sus ítems es representativa del universo o dominio conductual de ítem al que supuestamente representa (1). Así pues, la validez de contenido es ese tipo de validez que va unida al propio test y a lo que pretende medir. Por ejemplo, nos permitirá saber si la muestra de los ítem del test es representativa del dominio en matemáticas que queremos evaluar. Se trata, por tanto, de un concepto importante tanto en estadística como en la utilización de pruebas psicológicas o de rendimiento. A modo de conclusión, el estudio de la validez es un análisis sobre una prueba métrica, en nuestro caso, ya que estamos en psicología, psicométrica cuyas conclusiones se refieren al grado en el que dicha prueba mide lo que queremos que mida. Lógicamente, cuanta más validez tenga una prueba, a falta de otros análisis -como el de fiabilidad-, mejor será.