Вы находитесь на странице: 1из 31

Mónica Añón Roig

Javier Cortés De las Heras


Tipos de evaluación e instrumentos de evaluación

2013

Introducción a los distintos tipos de evaluación e instrumentos


más usuales.

cortes_jav@gva.es
anon_mmo@gva.es

1
Tipos de evaluación en educación
Cuando se pretende hablar de tipos de evaluación, algunos autores suelen
introducir elementos que pueden causar confusión en el lector (p.ej. Chatterji (2003),
introduce como tipos de evaluación toda una serie de instrumentos clasificados según
distintos criterios). En otros manuales se hace referencia a tipos de evaluación más
centrados en ámbitos laborales o de gestión de calidad, en otros se establecen
relaciones de tareas que deben hacer los estudiantes o evaluados, etc.

En definitiva, existe bastante confusión a la hora de delimitar los tipos de


evaluación o al menos sobre qué tipo de evaluación se está hablando y a qué se está
aplicando. Esta breve referencia que se expone en este apartado no pretende tampoco
dar respuesta a todas las incógnitas que surgen a la hora de describir qué tipo de
evaluación hacemos con nuestros estudiantes. La clasificación que se ofrece puede ser
revisada con más profundidad de la que aquí se expone, es discutible y provisional, pero
al menos puede servir como un primer intento de “encajar las cosas”.

Un tipo de evaluación respecto a un criterio de clasificación no impide que se dé


otro tipo de evaluación en otro criterio. De hecho, muchos tipos de evaluación están
altamente asociados, otros son transversales. Por ejemplo, la evaluación sumativa la
podemos utilizar en la evaluación de ejecuciones o en la evaluación mediante pruebas
objetivas; y también la formativa, por qué no.

Los criterios de clasificación de los tipos evaluación que se manejan en este


documento son los siguientes. Según:

1. El agente evaluador.
2. El momento.
3. El propósito.
4. El objeto de evaluación.
5. Los usos e interpretación de la puntuación.
6. La actividad del evaluado.
7. La actividad del evaluador.
8. Los modos de puntaje.

Asimismo, también se podría mencionar como criterio el posicionamiento teórico


de la evaluación que puede incluir la evaluación tradicional y la evaluación auténtica,

2
asimilándola con otros términos como el de evaluación alternativa, ambas frente a la
primera citada. Se expone una definición de evaluación alternativa como descriptor del
Tesauro de la base de Education Resources Infromation Center (ERIC)
(http://www.eric.ed.gov).

(trad.: Estimación del conocimiento o las habilidades por otros medios distintos a
los empleados tradicionalmente, pruebas objetivas, especialmente las pruebas de
elección múltiple estandarizadas). (ERIC Thesaurus, 15/09/2000).

A su vez este término incluye como término más específico el de evaluación


auténtica, asimilada en el tesauro a evaluación basada en ejecuciones. Sin embargo,
algunos autores argumentan el sentido que se le da a este tipo de evaluación yendo más
allá de una evaluación basada en ejecuciones (Chatterji, 2003; Shelley y Howell, 2008,
Wiggins, 1998).

Tabla 1: Clasificación de los tipos de evaluación según criterios.

Criterio
Criterio de clasificación Tipos de evaluación
1. Agente evaluador - Autoevaluación
- Coevaluación
- Heteroevaluación
2. Momento - Evaluación continua
- Evaluación final
3. Propósito - Evaluación sumativa
- Evaluación formativa
- Evaluación de diagnóstico
4. Objeto - Conceptos, principios, hechos
- Procedimientos, Habilidades, Destrezas,
procesos, conductas
- Actitudes, Preferencias, Valores,
Personalidad
- (la agrupación es intencionada)
5. Usos e interpretación de la puntuación - Evaluación referida a la Norma
- Evaluación referida al Criterio
6. Modos de puntaje - Evaluación holística (global).
- Evaluación analítica.
7. Actividad del evaluado - Evaluación escrita (prueba escrita, trabajo,
memoria, informe, ensayo, diario,…)
- Evaluación oral (entrevista, exposición o
presentación,
- Evaluación (cualquier otra) ejecución (role
playing, simulación, juego, discusión en
grupo, actividad física, acción
procedimentada,…)
8. Actividad del evaluador - Observación
- Entrevista
- Pruebas, escalas, cuestionario
- Otras (portfolio, rejilla de constructos
personales, historias de vida, grupo de
discusión,…).

3
1. La evaluación según el agente evaluador:

Hace referencia a quién es la persona que evalúa a otra persona o a sí mismo


respecto a un objeto de evaluación (acción).

Puede distinguirse claramente entre: a) autoevaluación: la que realiza un


individuo sobre su propia acción; b) coevaluación: la que realizan distintos individuos
que realizan la acción u objeto de evaluación entre sí (la evaluación que realiza la clase a
los distintos grupos de la misma clase que exponen un tema, la evaluación por
pares,…); c) heteroevaluación: la más conocida, la que realiza una persona (p.ej.: en el
proceso e/a, el profesor) sobre otra que realiza una acción (prueba, exposición,
ensayo,…).

2. La evaluación según el momento en el que se realiza:

Distingue entre una evaluación realizada a lo largo de todo el proceso de e/a, de


forma frecuente, muchas veces asimilada a la evaluación formativa, ya que ésta última
ha de tener como requisito la continuidad. Sin embargo, la evaluación continua muchas
veces puede no ser formativa. La evaluación final propone un único momento de
evaluación al finalizar un proceso de e/a (puede ser una prueba parcial, a final de curso,
al cabo de tres años) y generalmente no supone retroalimentación de la información para
la mejora del propio aprendizaje. Su característica principal es que etiqueta el proceso
de aprendizaje de alguna manera (pasa/no pasa; apto/ no apto; suspenso / aprobado /
notable /…;…). La evaluación de diagnóstico o diagnóstica, es un tipo de evaluación que
se suele realizar antes de comenzar una intervención (formativa, terapéutica,
reeducativa,…) para detectar fortalezas y debilidades de los evaluados y realizar así las
adaptaciones que sean necesarias para que el proceso de aprendizaje o de
modificación de conductas se adapte a las características de los individuos.
Generalmente tiene un carácter individualizado.

3. Según el propósito:

Se distingue entre: a) evaluación formativa: la que evalúa el proceso de e/a de


forma frecuente e interactiva proporcionando información para la mejora tanto del
aprendizaje como de la enseñanza, por tanto ha de ser necesariamente continua, y b)
evaluación sumativa: mide mediante pruebas (de forma continua o final) con el propósito
de obtener una puntuación del producto de aprendizaje.

4
4. Según el objeto de evaluación:

Este tipo de clasificación va a asociarse inmediatamente a uno u otro tipo


instrumentos de evaluación. Según si se evalúan conceptos, principios o hechos, o bien
procedimientos, destrezas, habilidades, conductas o finalmente actitudes, valores,
personalidad,… (por seguir una clasificación harto conocida). Es decir, según el dominio
u objeto de evaluación, la especificación de la prueba y su desarrollo, los métodos de
puntaje e interpretación, va a tomar un cariz u otro.

En todos los casos (objetos de evaluación), la especificación del dominio antes


de la preparación de la prueba es una fase fundamental, especialmente en las pruebas
referidas al criterio explicadas en el punto sexto de este apartado.

5. Según métodos de puntuación:

Se suelen distinguir dos tipos de evaluación, principalmente usados en la


evaluación de ejecuciones: a) evaluación analítica: basada en las valoraciones o juicios
emitidos sobre las partes de un proceso o producto de aprendizaje de forma individual,
que en suma darían una valoración del conjunto de ese proceso o producto, suelen
utilizarse para la valoración escalas analíticas . b) evaluación holística: basada en el juicio
de un proceso o producto de aprendizaje en su conjunto, suelen utilizarse escalas
holísticas (scoring rubrics) o ejemplos típicos de comparación que describen niveles de
ejecución. Aunque no pertenezca a este criterio de clasificación, la evaluación holística
además tiene una connotación más amplia asimilándose a la evaluación de procesos,
continua y formativa.

6. Según usos e interpretación de la puntuación:

Se encuentran dos tipos evaluación, o más bien pruebas (tests).: a) referidas a la


norma (TRN), en los que la puntuación de un individuo se compara con relación a un
grupo de individuos (grupo normativo) medidos en el atributo que mide el test. Y b)
referidos al criterio (TRC), en los que la puntuación de un individuo se compara con
relación a un dominio de aprendizaje y destrezas. Siguiendo la definición de Shrock y
Coscarelli (2000), en el primer caso un individuo siempre se compara con otro en
términos de puntuación, mientras que en el caso de los TRC, el individuo no se compara
con otros sino con el nivel dado en referencia a unos estándares que especifican el
dominio de aprendizaje o habilidad.

5
7. Según la actividad o modos de respuesta del evaluado:

Las evaluaciones pueden cubrir un amplio espectro, desde ejecuciones escritas


de cualquier tipo, pasando por ejecuciones orales u otras actividades que pueden incluir
actuaciones en escenarios simulados o reales, role-playing, juegos reglados, grupos de
discusión,… Lo importante en este caso es la acción que va a tener que realizar la
persona evaluada. Cuando se hace una búsqueda sobre métodos de evaluación suelen
aparecer clasificaciones basadas en actividades que tienen que realizar los individuos
sujetos a evaluación. No suele mencionarse instrumento o estrategia alguna,
confundiéndolas así con lo que en realidad son modos de respuesta de un individuo
demandados en una evaluación concreta.

8. Según la actividad del evaluador

Se incluyen tres metodologías de evaluación más otros tipos no clasificables


fácilmente. Así, siguiendo a Padilla (2002) podemos distinguir entre el diseño y aplicación
de: a) procedimientos de observación, b) técnicas e instrumentos de encuesta
(entrevista), c) pruebas y escalas y d) otras técnicas (rejilla de constructos personales,
portfolios, historias de vida, grupo de discusión). Este último grupo puede confundirse
con los clasificados según la actividad del evaluado, pero el acento se pone ahora en el
diseño y aplicación de instrumental específico en la utilización de estas técnicas.

6
Instrumentos de evaluación según el modo de respuesta o
presentación
Se van a especificar tres grupos de instrumentos de evaluación:

1. Instrumentos de evaluación basados en respuesta estructurada escrita.


2. Instrumentos de evaluación basados en ejecuciones, distinguiendo entre:
a. Respuesta abierta escrita: ensayos o pruebas de respuesta corta.
b. Evaluación de conductas.
c. Evaluación de productos.
d. Evaluación de entrevistas.
e. Portfolio.
3. Evaluación de actitudes, personalidad, preferencias:
a. Escalas de actitudes
b. Rejilla de constructos personales.

Para cada uno de ellos se presenta una ficha a modo de resumen, con algún
ejemplo. En la ficha se encontrarán los siguientes elementos: descripción, modo de
respuesta, modo de presentación, tipos de ítems, escalas de puntuación, complejidad
de conocimiento evaluable, competencias evaluables, ventajas e inconvenientes.

7
PRUEBAS ESCRITAS DE RESPUESTA ESTRUCTURADA

Descripción

Las pruebas objetivas son también pruebas escritas pero, a diferencia de las anteriores, se basan en el criterio de
objetividad en función de una serie de preguntas con respuesta cerrada.
La principal ventaja frente a las anteriores pruebas es la rapidez con la que se corrigen, la posibilidad de abarcar gran
cantidad de contenidos y tratar de forma estadística los datos para valorar principalmente la dificultad, discriminación y
homogeneidad de los ítems y la fiabilidad de la prueba, desde las dos teorías principales de los tests: Teoría de
Respuesta al Ítem (TRI) o Teoría Clásica (TC).
La principal desventaja de estas pruebas es que difícilmente se va a poder evaluar algo más que no sea el recuerdo
de la información por parte del estudiante, aunque si se cuida la formulación de ítems se puede evaluar el
procesamiento de la información de orden más complejo.

Modos de respuesta
respuesta Escrita Estrategia Prueba

Nivel complejidad Conceptos, principios, Competencias Académicas vinculadas


conocimiento hechos evaluables a un área o asignatura

Modalidad de
Método de enseñanza Lección magistral Clases teóricas
enseñanza

Tipos de ítems o preguntas

Los tipos de ítem que requieren una respuesta estructurada son: respuesta breve, asociación, verdadero-falso,
elección múltiple e interpretativos. Cada uno de ellos tiene unas ventajas e inconvenientes y puede alcanzar la medida
de conocimiento más o menos complejo. Asimismo, para cada uno de ellos se hacen unas recomendaciones u otras
para la mejora de su calidad.

Escalas de puntuación
Escalas sumativas, donde el acierto suele valer 1 punto. Se aplica corrección por azar en los de elección múltiple. La
puntuación obtenida en el test se puede transformar linealmente a cualquier otro tipo de escala numérica. Además
existen otros procedimientos técnicos más complejos para obtención de escalas basadas en la teoría de respuesta al
ítem.

Ventajas Inconvenientes
- Se puede obtener muestras de mucho - La adivinación es una fuente de error.
contenido en un corto período de tiempo. - Es difícil construir ítems técnicamente
- Pueden medir un rango amplio de conductas y efectivos.
habilidades cognitivas. - No se adapta para la medición de ciertas
- Se obtienen puntuaciones objetivas. conductas (procedimentales o sociales).
- Método de puntuación eficiente. - Sólo es posible una respuesta correcta.
- Puede ser diseñado con la intención de tener - Los ítems generalmente miden conceptos
una alta consistencia interna. aislados en lugar de conceptos y habilidades
- Eficaz en la administración a grandes grupos. integrales.

8
Sugerencias de escritura para todo tipo de ítems
Hay cuatro reglas principales que todo ítem que vayamos a escribir debe cumplir:
1. Cada ítem debe ser diseñado para medir sólo el resultado seleccionado del dominio.
2. Los ítems deben provocar las ejecuciones deseadas de la manera más directa posible.
3. Cada ítem debería referirse a una sola cuestión o concepto con una respuesta correcta clara o
mejor opción.
4. Los ítems no deben proporcionar pistas, gramaticales o de cualquier otro tipo, a la persona
que contesta.

Respecto a las sugerencias de procedimiento a la hora de formular ítems se destaca:


a) formulación lingüística: redactar ítems claros, sintéticos y construidos correctamente en el
sentido lingüístico. Igualmente se deben formular en forma de pregunta y en forma positiva.
Utilizar siempre el formato de respuesta correcta o mejor respuesta. Situar toda la información de
un mismo ítem en una misma página, fácilmente abarcable con la mirada.
b) resolución: minimizar el tiempo que necesita el estudiante para la lectura y comprensión del
ítem. Y, en la medida de lo posible, explicitar el tiempo de resolución del mismo.
c) Revisión: disponer de tiempo para realizar la revisión de los ítems en sus diversos aspectos
(formulación, contenido y puntuación).

Respecto a las sugerencias de contenido:


a) formulación: contenidos importantes o significativos, utilizar el tipo de ítem más adecuado
para cada caso, adaptar las cuestiones a los niveles de habilidad de los sujetos y el propósito
del test (p.e.: uso de vocabulario comprensible) y evitar ítems basados en opiniones.
b) Facilidad/dificultad: evitar el conocimiento muy específico, el nivel de dificultad del ítem debe
determinarse según lo que se precise para lograr una congruencia ítem objetivo. En definitiva,
evitar añadir al ítem dificultad irrelevante.

Ejemplo de ítem de respuesta breve:


¿Quién es el autor del libro “Alicia en el País de las Maravillas”?_____________

Respuesta clave: Lewis Carroll

Posibles respuestas: Lewis Carroll (respuesta clave); Charles Dodgeson (correcta porque Lewis
Carroll fue el pseudónimo de Charles Dogseson, aunque no coincide con la respuesta clave);
Charles Dickens (respuesta incorrecta).

9
PRUEBAS ESCRITAS DE RESPUESTA ABIERTA (ENSAYOS)

Descripción
Es un modelo de prueba escrita donde el alumno ha de expresar por escrito una serie de contenidos referidos a un
conjunto de preguntas o texto a comentar. Este tipo de exámenes puede posibilitar la exposición ordenada, además
del recuerdo de la información, de opiniones y puntos de vista más personales.

Se valora no sólo el recuerdo de cierta información relevante que quiera constarse que se ha adquirido, sino también
la capacidad del estudiante de utilizar estrategias de expresión escrita y elaboración de un escrito con información
estructurada, lógica, así como otros aspectos formales: presentación, ortografía, estilo de discurso (fragmentado,
cohesionado,…), uso del vocabulario,…En este tipo de pruebas podemos diferenciar además dos tipos de preguntas:
a) las que requieren una respuesta libre, b) las que requieren una respuesta limitada, en la que se explicitarían los
puntos o contenidos que debería contener la respuesta.

Modos de respuesta Escrita Estrategia Prueba

Nivel complejidad Conceptos, principios, Competencias Académicas vinculadas


conocimiento hechos, actitudes evaluables a un área o asignatura

Modalidad de
Método de enseñanza Lección magistral Clases teóricas
enseñanza

Tipos de ítems o preguntas

Estos ítems requieren que el diseñador del ítem dé una instrucción escrita. A los alumnos evaluados se les
proporciona generalmente un cuaderno de respuestas en el que pueden proporcionar la respuesta a esa instrucción
especificada.
Tanto las respuestas cortas como los ensayos son muy apropiados para medir nivel de pensamiento alto o resolución
de problemas. Este tipo de evaluación sin embargo no es apropiada para evaluar a niños muy pequeños o alumnos
con necesidades educativas en aspectos relacionadas con el lenguaje escrito.

Escalas de puntuación

Analítica / holística

Ventajas Inconvenientes
- No se puede usar para personas que no
- Puede medir pensamiento y procesos dominen la competencia escrita.
complejos (creatividad, resolución de - Consume mucho tiempo en el puntaje.
problemas, organización). - No se pueden obtener evidencias sobre mucho
- Permite sistemas de puntuación analíticos u contenido.
- holísticos. - Sin criterios claros la puntuación puede ser
- Se permite más de una respuesta correcta. excesivamente subjetiva.
- Se puede administrar a grandes grupos. - Se necesita entrenamiento para realizar una
buena valoración.

10
Este ejemplo es para la delimitación de un ejercicio de ensayo.

Habilidades específicas a evaluar:


evaluar
 El estudiante puede analizar las causas y los efectos de hechos históricos
 El estudiante puede proporcionar detalles adicionales para justificar las relaciones causa-
efecto.

Instrucciones:
Instrucciones escribe de 2 a 3 párrafos sobre el siguiente tema histórico. Serás evaluado en
función de tu habilidad para relacionar causas y efectos y sobre la justificación de tu respuesta
con hechos y fuentes históricas. Los puntos los conseguirás por la precisión en hechos, fechas,
nombres de personas implicadas, organizaciones y normas legales que cites. Tienes 90 minutos
para realizar el ejercicio.

Tema:
Tema Identifica los eventos clave que llevaron a la Guerra Civil española. ¿Qué grupos políticos
se vieron más implicados en la Guerra Civil y cómo se implicaron? Justifica tu respuesta.

Ten en cuenta que la longitud de la respuesta esperada, el criterio de puntaje, los contenidos
esperados del ensayo, las condiciones (p.e.: tiempo límite, cuaderno de respuesta) bajo las que
el estudiante debe responder, deben estar especificadas en las instrucciones proporcionadas al
estudiante. La inclusión de un método de puntaje pueden centrar más aún las ejecuciones que
esperamos del estudiante. La estructuración del ejercicio en la manera que lo hemos mostrado
controlará los posibles errores tanto para los examinados cuando respondan, así como para los
evaluadores cuando tengan que valorar el ensayo.

11
EVALUACIÓN DE CONDUCTAS

Descripción

Este método requiere que los estudiantes demuestren conductas o procesos que deben ser directamente observados.
La característica distintiva de este tipo de estrategia de evaluación de ejecuciones es que las conductas, ejecuciones y
demostraciones están presentes y tiene que ser evaluadas mientras ocurren. Conductas motoras, ejecución de una
tarea y habilidades sociales, son ejemplos de lo que se puede valorar.

Otros ejemplos incluyen la valoración de charlas, debates o demostraciones de conductas en entornos reales o
simulados.

Modos de respuesta Diversos Estrategia Observación

Procedimientos Intelectuales, de
Nivel complejidad Competencias
(habilidades y comunicación e
conocimiento destrezas) evaluables interpersonales

Estudio de casos
Modalidad de Estudio y trabajo en
Método de enseñanza Aprendizaje
grupo
cooperativo enseñanza

Tipos de ítems o preguntas

Las preguntas o estímulos, o directrices que se suelen dar suelen ser abiertas. Las observaciones puede seguir un
sistema de categorías estructurado o una observación naturalística. Un anecdotario realizado por el profesor puede ser
una herramienta de observación no estructurada, aunque posteriormente se pueden dar criterios de observación más
cerrados.

La metodología observacional, en definitiva, es compleja y puede darse en múltiples entornos: reales o simulados
(artificiales).

Escalas de puntuación

Analítica / Holística

Ventajas Inconvenientes
- Consume mucho tiempo en la valoración y
puntaje.
- Puede medir pensamiento y procesos - Se limita a los procesos relacionados con el
complejos (creatividad, resolución de producto.
problemas, organización). - No se pueden obtener evidencias sobre mucho
- Permite sistemas de puntuación analíticos u contenido.
holísticos. - Sin criterios claros la puntuación puede ser
- No tiene un límite de tiempo. excesivamente subjetiva.
- Se permite más de una respuesta correcta. - Se necesita entrenamiento para realizar una
buena valoración.
- No se puede realizar en grandes grupos.

12
(NO SE PROPORCIONA EJEMPLO)

13
EVALUACIÓN DE PRODUCTOS

Descripción

Este tipo de evaluación requiere que los estudiantes creen o elaboren un producto, que servirá entonces como base
para ser evaluado (p.ej.: una memoria de investigación o de prácticas). Otros ejemplos incluyen: libros, trabajos
artísticos, informes de laboratorio, artículos, proyectos científicos,…

Atributos como habilidades artísticas, destrezas culinarias, trabajo científico,…,y habilidades relacionadas con la
elaboración o creación de productos suelen ser valoradas. El rasgo más distintivo de este método de evaluación es
que el producto mismo sirve como base para la valoración del constructo de aprendizaje subyacente.

Modos de respuesta Cualquier formato Estrategia Observación producto

Intelectuales, de
Nivel complejidad Competencias
Procedimentales comunicación e
conocimiento evaluables interpersonales

Aprendizaje orientado Modalidad de Tutorías / trabajo


Método de enseñanza a proyectos autónomo o en grupos
enseñanza

Tipos de ítems o preguntas

Las preguntas o estímulos, o directrices que se suelen dar suelen ser abiertas, incluyendo únicamente algunos
criterios o parámetros fijos. Pueden existir ejemplos de productos que requieran de directrices absolutamente
cerradas.

Escalas de puntuación

Analítica / Holística

Ventajas Inconvenientes
- Puede medir pensamiento y procesos
- Consume mucho tiempo en la valoración.
complejos (creatividad, resolución de
- Se limita a los procesos relacionados con el
problemas, organización).
producto.
- Permite sistemas de puntuación analíticos u
- No se pueden obtener evidencias sobre mucho
holísticos.
contenido.
- Requiere de una producción que esté a la vista.
- Sin criterios claros la puntuación puede ser
- Requiere de la aplicación de habilidades para el
excesivamente subjetiva.
desarrollo del producto.
- Se necesita entrenamiento para realizar una
- No tiene un límite de tiempo o espacio, a priori.
buena valoración.
- Se puede administrar a grandes grupos.

14
Ejemplo: Informe Científico (5º de Educación Primaria)

Instrucciones:
Instrucciones
“Escribe un informe donde se comparen dos de los ocho planetas del Sistema Solar. Asegúrate
de incluir en tu informe comparativo la discusión sobre: nombre de los planetas, tiempo que
necesitan para hacer la rotación sobre su eje y alrededor del Sol, dos hechos sobre las lunas de
estos planetas, temperatura media, tamaño de los planetas, distancia media al Sol, el “apodo”
del planeta, y si en el planeta e puede dar la vida, tal como la conocemos. Asegúrate de separar
tus propias opiniones de los hechos. Da razones para apoyar cada opinion dada.
El informe debe ser preciso, claro y de dos páginas.

Se hará en clase en tres clases de una hora (3 horas total) donde podrás reunir la información
sobre los planetas y escribir el informe. Puedes usar los recursos de la clase, el aula de
informática o de tu casa. Todo el trabajo se debe realizar en tiempo de clase y al finalizar cada
una de las tres clases se recogerá el trabajo.

El trabajo valdrá un 50% de la nota final. Usaré los criterios que os proporciono en la lista adjunta
para valorar vuestros trabajos. Revísalos mientras preparas tu trabajo.

Criterios de puntuación (1 punto por cada Sí)


Sí No
Los planetas se identifican por su nombre Presente: _____ _____
Preciso: _____ _____
Se dan los tamaños de los planetas Presente: _____ _____
Preciso: _____ _____
Se dan las temperaturas medias Presente: _____ _____
Preciso: _____ _____
(continúa)

15
EVALUACIÓN DE ENTREVISTAS

Descripción

Es un método en el que el evaluado responde en un diálogo uno a uno, aunque puede darse el formato de entrevistas
grupales, con el examinador. Se ha de demostrar la competencia de habilidades o capacidades a través de las
respuestas a preguntas realizadas durante la entrevista. La entrevista puede adoptar un formato estructurado o libre.
En el formato estructurado el examinador posee un guión de preguntas, tipo cuestionario. También pueden incluirse
estímulos visuales o auditivos que complemente a las preguntas. Un examen oral sería también un ejemplo de
entrevista.

Puede ser de gran ayuda la utilización de procedimientos de grabación.

Modos de respuesta Oral Estrategia Entrevista / cuestionario

Vinculadas al mundo
Nivel complejidad Conocimientos, Competencias profesional, de
conocimiento actitudes evaluables comunicación, de
desarrollo personal

Resolución de Modalidad de
Método de enseñanza problemas
Seminarios / Talleres
enseñanza

Tipos de ítems o preguntas

Las preguntas presentadas oralmente, puede requerir una respuesta cerrada o abierta:
(abierta) ¿Qué papel juega la estadística en el proceso de investigación?
(semi-abierta) ¿Cómo definirías la estadística?
(cerrada) ¿Crees que la estadística trata fundamentalmente sobre el estudio de la incertidumbre?

Escalas de puntuación

Analítica / Holística

Ventajas Inconvenientes
- Es muy costosa en cuanto a tiempo y puntaje.
- No se pueden obtener evidecias sobre mucho
- Es muy apropiada cuando el foco de
contenido.
aprendizaje es la comunicación oral.
- Se limita sólo a los procesos dónde se da la
- Puede medir un amplio rango de conductas
interacción.
cognitivas, sociales, personales y afectivas.
- Sin criterios claros la puntuación puede ser
- Es posible más de una respuesta correcta.
excesivamente subjetiva.
- Permite una puntuación analítica u holística.
- Se necesita entrenamiento para realizar una
buena entrevista.

16
Ejemplo: Entrevista uno a uno para medir el Locus de Control

Preguntas Busca en la respuesta Puntuación


Piensa en un proyecto que hayas reúne mis propios estándares Locus de control interno
finalizado en tu casa de calidad, el tiempo o las metas (Código 1)
que me marqué.
¿Cómo decidiste que habías com- otros (ej.: mi madre) me Locus de control externo
pletado con éxito la tarea? dijeron que estaba bien. (Código 2)

17
PORTAFOLIO

Descripción

Son colecciones de trabajos o registros de conducta que en conjunto proporcionan una imagen global de
competencias en un área de aprendizaje amplia. Se utiliza generalmente en educación como una herramienta de
documentación global en aprendizajes para los que se quiere seguir su proceso y evolución, o para recoger
evidencias sobre habilidades en una materia, arte, etc.
En los portfolios además se incluyen guías para la selección de los contenidos, criterios para juzgar, los trabajos o
reflexiones de los propios estudiantes, investigaciones bibliográficas, elaboraciones multimedia, maquetas, síntesis,…

Modos de respuesta Diversos Estrategia Otras técnicas

De todo tipo,
Conceptuales (hasta el
especialmente las que
Nivel complejidad más alto nivel), Competencias
tienen carga
conocimiento procedimentales y evaluables procedimental y
actitudinales
actitudinal

Contrato de Modalidad de Tutorías, estudio y


Método de enseñanza aprendizaje trabajo autónomo
enseñanza

Tipos de ítems o preguntas

Al ser un instrumento que incluye evidencias de todo tipo mediante el uso de otros instrumentos, los tipos de ítems o
preguntas pueden adoptar cualquier formato de los presentados en esta guía. No obstante, se exponen brevemente
los contenidos básicos que ha de tener un portafolios, con la dificultad de que puede tomar un formato libre (el
estudiante decide qué contenidos incluir como evidencias (Colén, Giné e Imbernon, 2006): a) trabajos sustantivos en
relación con la enseñanza de las temáticas tratadas en la asignatura, b) temas relacionados con el aprendizaje y c)
transferencias personales o profesionales.

Escalas de puntuación

Al ser un instrumento que incluye evidencias de todo tipo mediante el uso de otros instrumentos, las escalas de
puntuación pueden adoptar cualquier formato de los presentados en esta guía, y especialmente los recomendados
para la evaluación de ejecuciones: escalas holísticas o analíticas.

Ventajas Inconvenientes
- Requiere de muestras de trabajo adecuadas.
- Mide la evolución en un período o tiempo determinado
- Requiere un gran número de muestras de
en una materia.
trabajo.
- Es fácilmente integrable en el proceso de enseñanza.
- Difícil de puntuar objetivamente si los criterios
- Puede medir conductas o resultados de aprendizaje
no son claros.
complejos.
- Los estudiantes puede responder con ayuda
- Se puede usar individualmente o adaptarse a grupos.
externa.
- Puede medir procesos complejos de pensamiento.
- Se necesita una buena formación para
- Permite una puntuación analítica u holística.
aplicarlo como instrumento de evaluación.

18
Ejemplo de Estructura de portafolios como instrumento de evaluación, como criterios
predefinidos por el profesor (formato cerrado).

Página principal: Portfolio de área o materia


Instrucciones (para el estudiante)
Propósito
Qué resultados de aprendizaje se van a evaluar, a qué competencias están asociados
Contenido(*)
Se especificarán distintos formatos de muestras de trabajo que se van a evaluar con los
consiguientes criterios de evaluación, temporalización, muestras necesarias y condiciones de
ejecución cada tarea.
Sugerencias
Algunas sugerencias para ayudar al cumplimiento de las tareas.

(*) Dentro del contenido, podemos clasificar las evidencias de aprendizaje (o trabajos):
a) tareas sustantivas de los contenidos de la materia.
b) tareas o trabajos relacionados con el aprendizaje o con los contenidos de la materia.
c) tareas de transferencia o generalización al ámbito personal o profesional.
Si se utiliza un formato mixto de portafolio, el profesor puede dar directrices cerradas para el
apartado a) y dejar la elección libre de contenidos en los apartados b) y c), especialmente en
este último.

19
ESCALA DE ACTITUDES

Descripción

Las escalas de actitudes consisten en ítems de respuesta estructurada donde los individuos seleccionan una de las
opciones de respuestas en el contexto de una afirmación o cuestión. Algunas respuestas pueden ser abiertas, aunque
complica el análisis de la información. No existe una respuesta correcta o incorrecta. En algunos casos un conjunto de
preguntas puede conformar una dimensión o factor, aunque esto requiere de un gran desarrollo técnico de la escala
en el que se comprueba generalmente la validez de constructo.

Entrevista / escala
Modos de respuesta Escrita / oral Presentación (prueba)

Nivel complejidad Competencias Desarrollo y compromiso


Actitudes y valores
conocimiento evaluables profesional y personal

Contratos de
Modalidad de Estudio y trabajo en
Método de enseñanza aprendizaje
grupo
Apje. Cooperativo enseñanza

Tipos de ítems o preguntas


Se presentan diferentes formatos en función de las escalas de puntuación. No obstante se dan una serie de
recomendaciones generales para la escritura de ítems (Chatterji, 2003): a) especificar el dominio y subdominio del
constructo con indicadores observables, b) desarrollar ítems para el cuestionario que estén conectados con los
indicadores del dominio, c) asegurarse que los ítems de observación estén situados concretamente en segmentos de
tiempo, episodios, experiencias o lugares (p.ej. en casa, esta semana, sobre la escuela,…), d) seleccionar una escala
de respuesta, que encaje con la lógica y semántica de las frases de los ítems, e) asegurarse de que los ítems forman
un conjunto homogéneo, dentro del dominio o subdominio y f) incluir bastantes ítems para asegurar la precisión del
instrumento.
En general se dan afirmaciones, en primera persona muchas veces, y se puntúan en función de una escala o se
ordenan o se sitúan en un polo u otro de una dimensión o actitud,…

Escalas (de puntuación)


puntuación)

Escalas Likert (sumativas) , Escalas de Thurstone (diferenciales), Escalas de Guttman (acumulativas), Diferencial
Semántico, Q Sort de Stephenson, Difernecial semántico, Elección de alternativas, Listas de ordenamiento. Se puede
ampliar más información en Morales, Urosa y Blanco (2003).

Ventajas Inconvenientes

- Es difícil conseguir una buena validez de


constructo.
- Se pueden evaluar actitudes de una manera
- Falsificación de las respuestas o deseabilidad
rápida y con bajo coste, especialmente si se
social.
usan procedimientos escritos y no de entrevista.
- Inercia en las respuestas
- El procedimiento de evaluación es sencillo.
- Pueden presentar ambigüedad semántica
fácilmente.

20
Ejemplo de diferencial semántico
¿Qué significado tienen para los profesores la “evaluación alternativa”?
Las evaluaciones alternativas son
1. Buenas ____ ____ ____ ____ ____ ____ ____ Malas
2. Rápidas ____ ____ ____ ____ ____ ____ ____ Lentas
3. Débiles ____ ____ ____ ____ ____ ____ ____ Fuertes
4. Efectivas ____ ____ ____ ____ ____ ____ ____ No efectivas

Ejemplo de escala de Thurstone


Actitud hacia las películas.
Señale si está de acuerdo con las siguientes frases
Las películas son la influencia positiva más poderosa en nuestra vida……………..
Ir al cine es una pérdida de tiempo…………………………………………………….
A veces creo que las películas son algo deseable, otras lo dudo…………………..

Nota: los estímulos ya tienen una puntuación otorgada por un grupo de jueces, puntuación que
no se presenta a la persona que responde. En función de las respuestas que dé la persona
obtendrá una puntuación u otra. En todo caso, la persona que responde sólo ha de señalar la
respuesta con la que esté de acuerdo (sí/no). En otras escalas tipo Thurstone, se pide que
valoren el grado de acuerdo (tipo escala Likert) aunque con una connotación final distinta
modificada por las puntuaciones que los jueces han dado a cada frase o sentencia.

21
REJILLA DE CONSTRUCTOS PERSONALES

Descripción

Es una técnica compleja que parte de la Teoría de los Constructos Personales de G.A. Kelly. Aquí se presenta una
adaptación para su uso en evaluación educativa. Los estudiantes generan su propia matriz de información para
interpretar o valorar un objeto o realidad. La rejilla es individual, y generalmente distinta a la de otro estudiante ya que
se hacen valoraciones sobre un conjunto de elementos, se decide cómo valorar los elementos y qué elementos van a
ser valorados. Consta de cuatro fases: a) elección de elementos (personas, eventos, objetos, profesiones,…), b)
establecimiento de los constructos relevantes para los elementos, c) representación de los datos, d) análisis de
información. Se da un ejemplo en esta ficha de su uso y se remite a Padilla, M.T. (2002, pp. 299-313).

Modos de respuesta Escrita / Oral Presentación Entrevista / Rejilla

Desarrollo y
Nivel complejidad Competencias
Actitudes y valores compromiso
conocimiento evaluables profesional y personal

Aprendizaje Basado en Modalidad de


Método de enseñanza Problemas
Prácticas externas
enseñanza

Tipos de ítems o preguntas

Se expone un ejemplo en la siguiente página.

Escalas de puntuación

Se expone un ejemplo en la siguiente página.

Ventajas Inconvenientes

- La información siempre la proporciona el


individuo.
- Permite una reflexión profunda al estudiante. - Es un procedimiento complejo.
- Es una herramienta potente para proporcionar - Requiere bastante tiempo de análisis
feedback al estudiante y ajustar las necesidades comparado con otras técnicas.
de formación a nivel individual.
- Se puede realizar en pequeños grupos.

22
Tomada de Padilla (2002, p. 310).

Esta rejilla es un ejemplo para la el proceso de decisión vocacional.


Los elementos en esta rejilla son las elecciones profesionales a las que se les da un orden de
elección de 1 (más preferida) a 10 (menos preferida), denominado rango.
El constructo son las características laborales, a las que se les asigna un rango de preferencia.
La rejilla cuenta con un sistema de puntuación (escala tipo Likert) de 1 a 3, Poco probable a Muy
probable).
El estudiante valora cada celda dada por una profesión y una característica. P.ej. diseñador
gráfico es probable que esté remunerado (2), poco probable que exista la promoción (1) o muy
probable que le satisfaga personalmente (3).

Procedimientos de análisis pasan por:


1) Suma de las columnas: proporciona información sobre qué profesión es la que más o
menos características laborables tiene como muy o poco probables, y permite ordenarlas
en función de esta (rangos) (p.ej. la que más en el ejemplo es “Adjunto de
Administración”.
2) Se procede a otros cálculos más complejos, como el de utilidad esperada que resulta de
multiplicar cada característica laboral con una puntuación inversa (la más alta si fue la
primera elegida: es decir que el 1, primera elegida, en el ejemplo valdría 10 puntos
promoción), por cada uno de los valores de la profesión (columna) y sumarlos.

Este tipo de rejillas puede usarse para valorar preferencias, actitudes, valores, características
sobre elementos de formación o acción profesional, personas, contenidos, servicios,…

23
Escalas de puntuación

MATRIZ DE VALORACIÓN O RÚBRICA DE EVALUACIÓN

Descripción

Una Matriz de Valoración o rúbrica es una escala de puntuación, compuesta de un conjunto de criterios específicos y
fundamentales que permiten valorar el aprendizaje, los conocimientos y/o las competencias, logrados por el
estudiante en un trabajo o materia particular.

Con ese fin establece una gradación (niveles) de la calidad de los diferentes criterios con los que se puede desarrollar
un objetivo, una competencia, un contenido o cualquier otro tipo de tarea que se lleve a cabo en el proceso de
aprendizaje.

Finalidad

Facilita la Calificación del desempeño del estudiante en las áreas del currículo (materias o temas) que son complejas,
imprecisas y subjetivas.

Permite al profesor especificar claramente qué espera del estudiante y cuáles son los criterios con los que se van a
calificar un objetivo previamente establecido, un trabajo, una presentación o un reporte escrito, de acuerdo con el tipo
de actividad que desarrolle con los alumnos.

Clasificación
HOLÍSTICA.
• Se evalúa la totalidad del proceso o producto sin juzgar por separado las partes que lo componen.
• Se utilizan cuando pueden aceptarse pequeños errores en alguna de las partes del proceso, sin que ellas alteren
la buena calidad del producto final.
• Son más apropiadas cuando las actividades de desempeño requieren que el estudiante produzca una respuesta
sin que necesariamente haya una respuesta correcta única.
• La Calificación se centra en la calidad, dominio o comprensión generales tanto del contenido específico como de
las habilidades que incluye la evaluación en un proceso unidimensional.

ANALITICA
ANALITICA
• Se evalúa inicialmente, por separado, las diferentes partes del producto o desempeño y luego suma el puntaje de
estas para obtener una calificación total (Moskal, 2000; Nitko, 2001).
• Se prefieren cuando se solicita en los desempeños una respuesta muy enfocada, esto es, para situaciones en las
cuáles hay a lo sumo dos respuestas válidas y la creatividad no es importante en la respuesta.
• El proceso de calificación es más lento, especialmente porque se evalúan individualmente diferentes habilidades
o características que requieren que el maestro examine el producto varias veces. Los estudiantes reciben
retroalimentación en cada uno de los aspectos o características evaluar.

24
Método de puntaje analítico: ejemplo

Objetivo 1.0 (16 puntos)

Sí No

1.1 Selecciona y justifica el uso de un gráfico lineal para representar 1 0


datos

1.3 Identifica una escala de unidades Eje X 1 0


apropiada para
Eje Y 1 0

1.4 Etiquete el gráfico adecuadamente Título 1 0

Variable X 1 0

Variable Y 1 0

Unidades de la escala 1 0

Limpieza 1 0

Ninguno Uno Ambos

1.2 Selecciona los ejes apropiados para las variables 0 1 2

Ninguno 1a5 6-9 10-


10-14

1.5 Representa en el gráfico los valores X Y 0 1 2 3


correctamente

1.6 Conecta los puntos adecuadamente 0 1 2 3

25
Método de puntaje holístico

En este caso, la respuesta es evaluada en su conjunto por el evaluador,


resultando en un juicio global sobre su calidad. Una única puntuación se deriva de este
método.

Ejemplo

Siguiendo los mismos objetivos que el ejemplo anterior, un ejemplo de escala


holística sería:

Valoración Descripción de ejecuciones

4 Opta por un gráfico lineal y justifica su selección. Identifica las unidades de la


escala apropiadamente. Selecciona apropiadamente los ejes para cada variable.
Etiquete correctamente, de manera precisa y claramente. Representa y conecta
de 10 a 14 puntos correctamente. Usa un lenguaje apropiado para describir de
manera precisa las tendencias de los datos. Presentación clara y coherente.

3 Opta por un gráfico lineal aunque no justifica su selección. Dibuja y conecta de 10


a 14 puntos correctamente. Usa un lenguaje apropiado para describir de manera
precisa las tendencias de los datos. Errores menores en: identifica las unidades
de la escala o selecciona los ejes para cada variable o etiquete el gráfico, o
presenta información de manera clara y coherente.

2 Opta por un gráfico lineal aunque no justifica su selección. Dibuja y conecta de 6 a


9 puntos correctamente o comete errores menores en la descripción de tendencia
de los datos. Además puede haber errores menores en: identificar las unidades
de la escala o seleccionar los ejes para cada variable o etiquetar gráfico o
presentar información clara y coherentemente. No justifica el gráfico.

1 Opta por un gráfico lineal. Dibuja y conecta de 1 a 5 puntos correctamente pero


omite o comete errores mayores en la descripción de tendencias de los datos.
Puede haber errores menores en: identificar las unidades de la escala o
seleccionar los ejes para las variables o etiquetar el gráfico, o presentar
información de manera clara y coherente. No justifica o defiende el gráfico.

0 Opta por un gráfico de sectores o circular o cualquier otra técnica gráfica


inapropiada, con una presentación de la información incoherente.

26
LISTA DE COTEJO O VERIFICACIÓN

Descripción

Instrumento de verificación.

Es un listado de aspectos a evaluar (contenidos, - Actúa como un mecanismo de revisión durante el capacidades,
habilidades, proceso de enseñanza-aprendizaje conductas, etc.), al lado de los cuales se puede colocar un puntaje,
una - Puede evaluar cualitativa o cuantitativamente, dependiendo del enfoque que se le quiera asignar. O bien, puede
evaluar con mayor o menor grado de precisión o de profundidad. También es un instrumento que permite intervenir
durante el proceso de enseñanza-aprendizaje, ya que puede señalar estados de avance o tareas pendientes.

Finalidad

• Posee un amplio rango de aplicaciones, y puede ser fácilmente adaptada a la situación requerida.

Ejemplos de LISTA DE COTEJO

Escala: 1. Regular/Necesita mejorar 2. Bien/bien 3. Muy bien/Excelente

27
ESCALAS DE OBSERVACIÓN

Descripción

Es un registro abierto o cerrado de algunos aspectos que se pueden observar directamente en el individuo, cuando
éste realiza la actividad.

Es un registro descriptivo, ya que se dan las pautas o puntos focalizados para observar.

Finalidad

• Permite determinar los procesos que se van a observar desde el inicio hasta la culminación del desempeño.

Ejemplos de ESCALAS DE OBSERVACIÓN

(PÁGINA SIGUIENTE)

28
29
ESCALAS TIPO LIKERT

Descripción

Una escala Likert es una escala compuesta de muchos ítems, no un único ítem
Las características que definen a una escala tipo Likert son:
1. La escala contiene distintos ítems, que miden el mismo rasgo/ actitud, con la misma intensidad.
2. Los niveles de respuesta se organizan horizontalmente.
3. Los niveles de respuesta están asociados a números enteros consecutivos. Cada respuesta tiene su valor.
4. Los niveles de respuesta se asocian así mismo a etiquetas verbales que tienen la connotación de una gradación
más o menos espaciada de forma equitativa.
5. Las etiquetas verbales son bivalentes y simétricas respecto a un centro neutral.

Finalidad

• En el uso de Likert, la escala siempre mide actitudes en términos del nivel de acuerdo/desacuerdo con una
afirmación diana.
• Se utiliza en cuestionarios y es la escala de uso más amplio en encuestas para la investigación,
principalmente en Ciencias sociales.

Ejemplo de ESCALA TIPO LIKERT

30
Referencias bibliográficas
Chatterji, M. (2003). Designing and Using Tools for Educational Assessment.
Boston (MA): Pearson Education

De Miguel Díaz y otros (2006).. Metodologías de eseñanza y aprendizaje para el


desarrollo de competencias. Madrid: Alianza Editorial.

On-line. Alternative Assessment.


ERIC Thesaurus On-

Martín E. y Martínez F. Evaluación de los aprendizajes en el aula: una


conceptualización renovada. Ed. Santillana

Vallejo, P., Urosa Sanz, B. y Blanco Blanco, A. (2003). Construcción de


Morales Vallejo,
Escalas de Actitudes tipo Likert. Madrid: La Muralla.

Padilla, M.T. (2002). Técnicas e instrumentos para el diagnóstico y la evaluación


educativa. Madrid: Editorial CCS.

Shelley, K. y Howell, S.L. (2008). The State of Authentic Assessment. ERIC Report
#ED503679.

Shrock, S. y Coscarelli, W. (2000). Criterion-Referenced test Development:


technical and legal guidelines for corporate training and certification. (2nd Ed.). Silver
Spring (MD): International Society for Performance Improvement.

G (1998). Educative Assessment. Designing Assessments To Inform


Wiggins, G.
and Improve Student Performance. San Francisco (CA): Jossey-Bass Publishers.

PÁGINAS CONSULTADAS
http://hadoc.azc.uam.mx/evaluacion/pregunta.htm

Mano González, M.; M. (2009). La evaluación por competencias :


M.; Moro Cabero, M.
propuesta de un sistema de medida para el grado en Información y Documentación. BiD:
textos universitaris de biblioteconomia i documentació, desembre, núm. 23. URL:
http://bid.ub.edu/23/delamano2.htm , [Consulta:
[Consulta: 21-
21-11-
11-2013].

31

Вам также может понравиться