Академический Документы
Профессиональный Документы
Культура Документы
TEMA 2
LAS FUNCIONES DE LOS INSTRUMENTOS DE
EVALUACIÓN LINGÜÍSTICA
Tabla de contenido
1 OBJETIVOS ................................................................................................................ 2
1 OBJETIVOS
Los resultados específicos del aprendizaje que el estudiante debe alcanzar al final de
este tema son:
1
En adelante, en las citas de la edición de 1999 de las Normas de Evaluación Educativa y Psicológica (en
inglés, Standards of Educational and Psychological Testing), sustituyo los autores de esta obra
(American Educational Research Association, American Psychological Association y National Council
on Measurement in Education, 1999) por Standards.
3
Cronbach (1960) realizó una distinción entre pruebas de actuación máxima y pruebas de
actuación típica:
1. Las pruebas de actuación máxima son utilizadas con el fin de conocer cómo de
bien actúa una persona cuando se le pide que se esfuerce al máximo. La
propiedad distintiva de una prueba de actuación máxima es que se anima a que
el examinando obtenga la máxima puntuación que pueda. El examinando debe
desear hacer la prueba bien y debe comprender qué se considera que es una
buena actuación (Cronbach, 1984, pp. 28-29). Linn y Gronlund (2000, p. 38)
distinguen dos tipos de instrumentos para evaluar la actuación máxima:
4
Los que contratan a un ejecutivo cuyo éxito en el pasado garantiza su capacidad también
desean conocer cómo trabaja normalmente. ¿Supervisa en gran medida, hasta el más
mínimo detalle? ¿O esboza una tarea general y da libertad a sus subordinados? ¿Se
preocupa en la misma medida de la producción, los problemas humanos y las finanzas?
¿Prefiere la planificación a largo plazo o una adaptación rápida?
Para determinar esta conducta típica, se evalúan aspectos como los intereses, las
actitudes, la adaptación y otras propiedades mediante entrevistas, cuestionarios,
registros de anécdotas, escalas de valoración y otros procedimientos
observacionales y autodescriptivos. Ninguno de estos procedimientos permite
una evaluación adecuada de la conducta típica, pero la combinación de varios
instrumentos permite que el evaluador realice juicios bastante precisos acerca de
esa conducta típica.
Las pruebas con elecciones establecidas (fixed-choice tests) incluyen, por ejemplo, las
pruebas con ítems de elecciones múltiples, las pruebas con ítems de verdadero/falso y
las pruebas con actividades de relacionar.
A partir de los años 90 se ha empezado a utilizar un tipo de instrumento de
evaluación bastante diferente de las pruebas con elecciones establecidas, que se basa en
actividades prolongadas y en el análisis de las actuaciones complejas de los estudiantes:
las pruebas de actuación. Fitzpatrick y Morrison (1971, p. 268) definieron una prueba
de actuación (performance test) como
una prueba en la que una situación que funciona como criterio, como un empleo, es
simulada en un grado relativamente elevado… El valor potencial de la prueba de actuación
radica en su gran parecido con la realidad–su mayor relevancia en la determinación del
grado en que el examinando puede realmente realizar las actividades del empleo o de otras
situaciones que funcionan como criterio.
Las pruebas de actuación lingüística obligan a que “los candidatos produzcan una
muestra de lengua, escrita o hablada (por ejemplo, redacciones y entrevistas orales).
Estos procedimientos están diseñados para reproducir la actuación tal como se produce
en contextos reales de comunicación” (Association of Language Testers In Europe
[ALTE] Members, 1998, pp. 198-199).
5
La conducta del componente humano en un sistema puede ser evaluada para varias
finalidades… Las puntuaciones en una prueba de competencia pueden ser utilizadas para
indicar (1) el grado en que un individuo ha realizado una actuación que es considerada un
criterio–por ejemplo, si el hombre A puede realizar satisfactoriamente una comprobación
para el mantenimiento de un determinado tipo de radar, y (2) la ordenación relativa de
6
individuos con respecto a una determinada tarea–por ejemplo, si el hombre monta fusibles
más rápidamente que el hombre C. La diferencia principal entre estos dos usos radica en el
criterio (standard) utilizado como referencia. Las medidas que toman como referencia un
criterio (criterion-referenced measures) dependen de un criterio absoluto de la calidad
mientras que las medidas que toman como referencia un modelo de desarrollo normal
(norm-referenced) dependen de un criterio relativo.
Quizá con los siguientes ejemplos quedará más clara esta distinción. Como profesora de
educación secundaria, enseño inglés a grupos de estudiantes de educación secundaria en
Andalucía utilizando como guía una serie de manuales de inglés, cuyos autores se han
basado en el currículo para el área de lenguas extranjeras (inglés) vigente en este
momentos. Después de cada unidad diseño una prueba y obtengo una puntuación para
cada estudiante independiente de las puntuaciones obtenidas por los otros estudiantes,
a partir de la cual infiero el grado de adquisición que el estudiante posee de los
contenidos que yo he enseñado en esa unidad. Davies et al. (1999, p. 38) definen una
prueba criterial (criterion-referenced test) como
una prueba que examina el nivel de conocimiento de, o la actuación en, un dominio
específico de conductas meta (es decir, el criterio) que se exige que el examinando haya
dominado. El dominio de la prueba es normalmente, pero no necesariamente, un programa
específico de enseñanza…
Las puntuaciones en la prueba indican la capacidad de un candidato en relación al
criterio, es decir, lo que el candidato sabe y no sabe hacer, en lugar de comparar su
actuación con la de otros examinandos de la población correspondiente, como ocurre en las
pruebas con referencia a una norma. A menudo los resultados son comunicados utilizando
escalas descriptivas en lugar de una puntuación numérica 2.
Frente a las pruebas que utilizan un criterio como referencia, existe otro gran tipo de
pruebas, las pruebas que utilizan como referencia un grupo normal. Voy a explicarlo
con un ejemplo tomado del diagnóstico de los trastornos lingüísticos específicos en los
niños: para evaluar el grado de desarrollo lingüístico de un niño que se sospecha que
puede tener un trastorno lingüístico específico, el niño suele realizar, entre otras cosas,
una prueba lingüística. El equipo de evaluación suele concluir que el niño tiene un
trastorno lingüístico si, entre otras cosas, el niño obtiene en esta prueba una puntuación
relativamente baja (por ejemplo, entre 1.5 y 2 desviaciones típicas por debajo de la
media de los alumnos de su misma edad en los estados de Arizona y Nueva York)
(Spaulding, Plante y Farinella, 2006, pág. 61). Lo que quiero resaltar es que el equipo
de evaluación compara la actuación del niño en la prueba con las actuaciones de otros
niños de su misma edad en la misma prueba. Davies et al. (1999, p. 130) definen una
prueba con referencia a una norma (norm-referenced test) como
2
Davies et al. (1999, pp. 37-38) asocian tres conceptos diferentes al término criterio:
1. Una variable externa como un programa, el juicio de un profesor, una actuación en el mundo
real, u otra prueba. El objetivo de una prueba es proporcionar un medio de representar el criterio
ya que normalmente no es posible observar/medir todos los elementos del criterio. La actuación
en la prueba es utilizada para predecir la actuación de una examinando en el criterio.
2. Un nivel aceptable de conocimiento de, o actuación en, un dominio específico de conductas
lingüísticas (por ejemplo, el inglés para los controladores aéreos).
3. Una propiedad a partir de la cual se valora la actuación en la prueba. Una buena actuación en una
tarea de una prueba puede ser descrita en relación a criterios lingüísticos y no lingüísticos. Por
ejemplo, si la tarea es escribir una carta, los criterios lingüísticos pueden incluir la fluidez, la
coherencia y la cohesión, y la precisión gramatical.
7
un tipo de prueba mediante la cual las puntuaciones de un candidato son interpretadas con
referencia a la actuación de los otros candidatos. Por tanto, la calidad de cada actuación no
es juzgada por sí misma, o con referencia a algún criterio externo, sino según la norma
(standard) del grupo en su totalidad. En otras palabras, las pruebas con referencia a una
norma están más interesadas en distribuir a los individuos en un continuo de capacidad, la
curva de capacidad, que en la naturaleza de la actividad que se debe alcanzar, que
constituye el centro de la atención en las pruebas criteriales…
Una prueba que idealmente tiene las siguientes características, aunque las pruebas
lingüísticas llamadas estandarizadas no siempre poseen todas estas características:
tiempo limitado para su realización. Los candidatos más lentos reciben una
puntuación más baja porque no llegan a resolver las últimas preguntas.
Generalmente en este tipo de pruebas la dificultad de las preguntas es tal que
8
Una prueba de potencial es una “prueba cuya duración permite que casi todos
los candidatos puedan terminarla, pero que contiene algunas actividades o ítems
con un grado de dificultad que hace poco probable que la mayoría de los
candidatos responda correctamente a cada ítem” (Association of Language
Testers in Europe Members, 1998, p. 199). Schmeiser y Welch (2006, p. 339)
definen una prueba de potencial como aquélla donde por lo menos el 90% de los
candidatos tienen tiempo para meditar sus respuestas en todos los ítems de la
prueba.
6. Pruebas objetivas y pruebas subjetivas: En una prueba objetiva los
examinandos que tienen la misma competencia obtienen la misma puntuación
(por ejemplo, en una prueba de elecciones múltiples), mientras que en una
prueba subjetiva las puntuaciones están influidas por la opinión o por el juicio
de la persona que puntúa (por ejemplo, en una redacción).
4 REFERENCIAS BIBLIOGRÁFICAS