Вы находитесь на странице: 1из 5

NOMBRE Y APELLIDO: GIOVANNA YANARICO BAUTISTA

FECHA DE ENTREGA: 21/AGOSTO/2019

¿CÓMO SE REALIZA LA PRUEBA DE ALFA CRONBACH?


La psicometría es la disciplina que se encarga de medir y cuantificar variables
psicológicas de la psique humana, mediante un conjunto de métodos, técnicas
y teorías. A esta disciplina pertenece el Alfa de Cronbach (α), un coeficiente
utilizado para medir la fiabilidad de una escala de medida o test.
La fiabilidad es un concepto que tiene varias definiciones, aunque a grandes
rasgos se puede definir como la ausencia de errores de medida en un test, o
como la precisión de su medición.
En este artículo vamos a conocer las características más relevantes del Alfa de
Cronbach, así como sus usos y aplicaciones, y de qué manera se utiliza en
estadística.
Artículo relacionado: "Prueba de chi-cuadrado (χ²): qué es y cómo se usa en
estadística"
Alfa de Cronbach: características
El Alfa de Cronbach (se representa mediante α) le debe su nombre a Lee
Joseph Cronbach, que bautizó este coeficiente así en 1951.
L.J. Cronbach fue un psicólogo estadounidense que se hizo conocido por sus
trabajos en psicometría. Sin embargo, los orígenes de este coeficiente los
encontramos en los trabajos de Hoyt y de Guttman.
Este coeficiente consiste en la media de las correlaciones entre las
variables que forman parte de la escala, y puede calcularse de dos maneras:
a partir de las varianzas (Alfa de Cronbach) o de las correlaciones de los ítems
(Alfa de Cronbach estandarizado).
Tipos de fiabilidad
La fiabilidad de un instrumento de medida tiene varias definiciones o “subtipos”,
y por extensión, existen también diferentes métodos para determinarlos. Estos
subtipos de fiabilidad son 3, y de manera resumida, estas son sus
características:
1. Consistencia interna
Es la fiabilidad como consistencia interna. Para calcularla se utiliza el Alfa de
Cronbach, que representa la consistencia interna del test, es decir, el grado en
que todos los ítems del test covarían entre sí.
2. Equivalencia
Implica que dos test sean equivalentes o “iguales”; para calcular este tipo de
fiabilidad, se utiliza un método de dos aplicaciones llamado formas paralelas o
equivalentes, donde se aplican de forma simultánea dos test. Es decir, el
test original (X) y el test diseñado específicamente como equivalente (X’).
3. Estabilidad
La fiabilidad también se puede entender como la estabilidad de una medida;
para calcularla, se utiliza también un método de dos aplicaciones, en este
caso el test-retest. Consiste en aplicar el test original (X), y pasado un lapso
de tipo, el mismo test (X).
4. Otros
Otro “subtipo” de fiabilidad y que incluiría la 2 y la 3, es aquel que se calcula a
partir de un test-retest con formas alternativas; es decir, se aplicaría el test (X),
transcurriría un lapso de tiempo y se volvería a aplicar un test (esta vez una
forma alternativa del test, el X’).
Cálculo del Coeficiente de Fiabilidad
Así, hemos visto cómo la fiabilidad de un test o instrumento de medida intenta
establece la precisión con la éste realiza sus mediciones. Se trata de un
concepto muy asociado al error de medida, ya que, a mayor fiabilidad,
menos error de medida.
La fiabilidad es un tópico constante en todos los instrumentos de medida. Su
estudio trata de establecer la precisión con la que mide cualquier instrumento
de medida en general y los test en particular. Cuanto más fiable es un test, con
mayor precisión mide y, por lo tanto, menos error de medida se comete
El Alfa de Cronbach es un método de cálculo del coeficiente de fiabilidad,
que identifica la fiabilidad como consistencia interna. Se denomina así
porque analiza hasta qué punto medidas parciales obtenidas con los diferentes
ítems son “consistentes” entre sí y por tanto representativas del universo
posible de ítems que podrían medir ese constructo.
¿Cuándo utilizarlo?
Se utilizará el coeficiente Alfa de Cronbach para calcular la fiabilidad, salvo en
casos en los que tengamos un interés expreso en conocer la consistencia entre
dos o más partes de un test (por ej. primera mitad y segunda mitad; ítems
pares e impares) o cuando queramos conocer otros “subtipos” de fiabilidad
(por ejemplo, basados en métodos de dos aplicaciones como el test-retest).
Por otro lado, en el caso de que estemos trabajando con ítems valorados
dicotómicamente, se utilizarán las fórmulas de Kuder-Richardson (KR –20 y
KR -21). Cuando los ítems tengan diferentes índices de dificultad, se utilizará la
fórmula KR –20. En el caso de que el índice de dificultad sea igual, utilizaremos
KR –21.
Referencias bibliográficas:
Barbero, M.I. (2010). Psicometría (teoría, formulario y problemas resueltos).
Madrid: Sanz y Torres.
Martínez, M.A. Hernández, M.J. Hernández, M.V. (2014). Psicometría. Madrid:
Alianza.
Santisteban, C. (2009). Principios de psicometría. Madrid: síntesis.

¿COMO SE REALIZA LA VALIDEZ POR CONTENIDO?


En términos estadísticos, la validez se define como la proporción de la
varianza verdadera que es relevante para los fines del examen. Con el
término ‘relevante’ nos referimos a lo que es atribuible a la variable, las
características que mide la prueba (1). Pero, ¿sabemos que existen
varios tipos de validez?
En este sentido, generalmente la validez de un test se define ya sea por medio
de:
La relación entre sus puntuaciones con alguna medida de criterio externo, o
bien. La extensión con la que la prueba mide un rasgo subyacente específico
hipotético o «constructo».
La validez en términos psicométricos
En términos psicométricos, la validez es un concepto que ha pasado por un
largo proceso evolutivo. Al principio, Muñiz (1996) adoptó la validez con una
posición en concreto. Esta sostenía que «un test es un válido para aquello con
lo que correlaciona».
Ahora, la validez se entiende como un juicio evaluativo global. En este
juicio, la evidencia empírica y los supuestos teóricos respaldan la suficiencia y lo
apropiado de las interpretaciones no solo de los ítems, sino también de la forma
de responder de las personas, así como del contexto de la evaluación.
Entonces, lo que se valida no es la prueba. Lo que se valida en concreto son
las inferencias hechas a partir de la misma. Ello tiene dos consecuencias:
El responsable de la validez de una prueba ya no es solo su constructor, sino
también el usuario.
La validez de una prueba no se establece de una vez por todas. Es el
resultado del acopio de evidencias y supuestos teóricos que se dan en un
proceso evolutivo y continuo. Este comprende todas las cuestiones
experimentales, estadísticas y filosóficas por medio de las cuales se evalúan las
hipótesis y teorías científicas (3).
En este contexto, el concepto validez se refiere a la adecuación, significado y
utilidad de las inferencias especificas hechas con las puntuaciones de los
test. La validación de un test es el proceso de acumular evidencia para apoyar
tales inferencias. Así, la validez es un proceso unitario. Aunque la evidencia
puede ser acumulada de muchas formas, la validez se refiere siempre al grado
en que esa evidencia apoya las inferencias que se hacen a partir de las
puntuaciones (4).
Tipos de evidencia
En 1954, un comité presidido por L. J. Cronbach estableció por encargo de la
Asociación de Psicología Americana (APA) que la validez era de cuatro tipos.
Estas son:
Validez de contenido.
Validez predictiva.
Validez concurrente.
Validez de constructo.
Actualmente se coincide, desde el punto de vista científico, que la única validez
admisible es la validez de constructo (Messick, 1995).
La validez y sus aspectos
Dentro del estudio de la validez, las evidencias están relacionadas con
cinco aspectos:
El contenido (la relevancia y representatividad del test).
El sustantivo (las razones teóricas de la consistencia observada de las
respuestas).
Estructural (configuración interna del test y dimensionalidad).
Generalización (el grado en que las inferencias hechas a partir del test se
pueden generalizar a otras poblaciones, situaciones o tareas).
Externo (relaciones del test con otros test y constructos).
Consecuencia (consecuencias éticas y sociales del test) (3).
Así, dentro de esta validez podemos entender otros tipos de validez o
estrategias. Como hemos mencionado previamente, estas son la validez de
contenido, la validez predictiva, la validez concurrente y la validez de constructo.
Tipos de validez: validez de contenido
En este tipo de validez se responde a la siguiente pregunta. ¿Los ítems que
constituyen el test son realmente una muestra representativa
del dominio de contenido o dominio conductual que nos interesa?
Para que nos entendamos, un dominio o campo conductual es una
agrupación hipotética de todos los ítems posibles que cubren un área
psicológica particular. Por ejemplo, un test de vocabulario debe ser una
muestra adecuada del dominio de ítem posibles en esta área.
En este sentido, la validez de contenido es una «medida» de lo adecuado
del muestreo. Se dice «medida» entre comillas, ya que este tipo de validez
consiste en una serie de estimaciones u opiniones. Estas estimaciones no
proporcionan un índice cuantitativo de validez. (1)
Este tipo de validez se asocia sobre todo a los test de rendimiento (test de
matemáticas, historia…). Para su determinación, se comparan sistemáticamente
las preguntas del test con el dominio conductual del contenido postulado.
Por ejemplo, tenemos una lista de 500 palabras que esperamos que los
estudiantes de un curso sean capaces de escribir correctamente. Entonces, su
rendimiento respecto a estas palabras será importante exclusivamente para
probar la habilidad del estudiante para escribir correctamente las 500 palabras.
Sin embargo, solo tendrá validez de contenido en la medida en que proporcione
una muestra adecuada de las 500 palabras que represente. (1)
Si seleccionamos solamente palabras fáciles o difíciles, o palabras que
representen únicamente ciertos tipos de faltas de ortografía, estaríamos
propensos a obtener una validez de contenido muy baja.
Conclusión: ¿cuál es la utilidad de la validez de contenido?
En consecuencia, el aspecto clave en la validez de contenido es el
muestreo de los ítems. En otras palabras, la validez de contenido es capaz de
determinar si la muestra de sus ítems es representativa del universo o dominio
conductual de ítem al que supuestamente representa (1).
Así pues, la validez de contenido es ese tipo de validez que va unida al propio
test y a lo que pretende medir. Por ejemplo, nos permitirá saber si la muestra
de los ítem del test es representativa del dominio en matemáticas que
queremos evaluar. Se trata, por tanto, de un concepto importante tanto en
estadística como en la utilización de pruebas psicológicas o de rendimiento.
A modo de conclusión, el estudio de la validez es un análisis sobre una prueba
métrica, en nuestro caso, ya que estamos en psicología, psicométrica cuyas
conclusiones se refieren al grado en el que dicha prueba mide lo que queremos
que mida. Lógicamente, cuanta más validez tenga una prueba, a falta de
otros análisis -como el de fiabilidad-, mejor será.

Вам также может понравиться