Вы находитесь на странице: 1из 52

La evaluación en el aula

LA EVALUACIÓN EN EL AULA*

Lorrie A. Shepard
Universidad de Colorado, Campus Boulder

Capítulo 17 de la obra Educational Measurement


(4ª Edición) Editado por Robert L. Brennan
ACE/ Praeger Westport. 2006
pp. 623-646.

*Estoy muy agradecida con Rick Stiggins y Mark Wilson por los alentadores y estimulantes análisis de los borradores de este
capítulo

1
Textos de evaluación

LA EVALUACIÓN EN EL AULA

Coordinación Editorial:
Miguel Á. Aguilar R.
Diana L. Flores Vázquez

Diseño y Formación:
Juan Cristóbal Ramírez Peraza
Irma Tapia Covarrubias

Instituto Nacional para la Evaluación del Educación


José Ma. Velasco 101, Col. San José Insurgentes,
Delegación Benito Juárez, C. P. 03900, México D. F.

Classroom Assesment. Lorrie A. Shepard / Robert Brennan. Educational Measurement


Copyright © 30 de agosto, 2006.
Reproducido con permiso de Greenwood Publishing Group Inc. Westport CT.

Traducción:
Martha Domís para el Instituto Nacional para la Evaluación de la Educación

Impreso en México

2
Contenido

CONTENIDO

Presentación 5
La evaluación en el aula 9
1. Panorama histórico 10
2. Evaluación formativa 17
2.1 Teoría del aprendizaje 17
2.2 Un modelo de la evaluación formativa 19
2.3 La importancia del contenido: seleccion de las tareas de enseñanza
y de evaluación que encarnan objetivos de aprendizaje 21
2.4 Progresiones del aprendizaje 22
2.5 Evaluación del conocimiento previo 24
2.6 Criterios explicativos y el uso de guías de calificación (rúbricas) 25
2.7 Retroalimentaciuón 25
2.8 Enseñar y evaluar para que haya transparencia 26
2.9 Auto-evaluación del estudiante 27
2.10 Evaluación de la docencia 29
3. Evaluación sumativa y calificación 30
3.1 Finalidades de las calificaciones apropiadas a la edad 30
3.2 La investigación en la práctica actual 32
3.3 Importancia del contenido y del formato: qué se valora 33
3.4 La investigación sobre medición, psicología cognitiva
y psicología motivacional 35
3.5 Parámetros para el desarrollo de la competencia 37
4. Evaluaciones externas y en gran escala 38
5. Conclusiones implicaciones para la investigación y la teoría de la medición 40
5.1 Estudios de las herramientos y procesos de evaluación 40
5.2 Estudios del desarrollo del maestro 41
5.3 Nuevas conceptualizaciones de la confiabilidad y la validez 42
Bibliografía 45

3
Textos de evaluación

4
Presentación

PRESENTACIÓN

Con este volumen, el Instituto Nacional para ciones a cargo de los maestros, de manera que la
la Evaluación de la Educación (INEE) inicia combinación de unas y otras contribuya verda-
una nueva serie de publicaciones, que difundirá deramente a avanzar en la dirección que a todos
textos relevantes sobre la evaluación educativa nos interesa: la de la mejora real y profunda de
creados por la pluma de autores externos al Ins- la educación que nuestras escuelas ofrecen a los
tituto, o que no caben dentro de las otras se- niños y niñas de México.
ries que comprende su programa editorial. En el La obra que se presenta es un texto de pri-
caso de obras de autores externos, además de su mera importancia en relación con estos temas, y
interés, se considerará la dificultad de acceder por ello el INEE la pone al alcance de los maes-
a ellas por los lectores mexicanos, debido a no tros de nuestro sistema educativo, y de todas
estar publicadas en español u otras razones. Este las personas interesadas por la calidad educati-
fue el caso de la obra Learning divides, del inves- va. En los párrafos siguientes se desarrollan con
tigador canadiense Jon Douglas Willms, que el mayor amplitud las preocupaciones que nos han
INEE hizo traducir y publicó con el debido per- llevado a difundirla.
miso del editor original, el Instituto de Estadís- En su forma más conocida, la evaluación edu-
ticas de la UNESCO, con el título Las brechas de cativa no es algo reciente. La tarea del maestro,
aprendizaje. en su interacción cotidiana con los alumnos, ha
La obra que se difunde ahora, de la profesora incluido siempre, como una dimensión funda-
Lorrie A. Shepard, de la Universidad de Colora- mental, el evaluar los avances de cada uno. En
do en Boulder, es un texto fundamental sobre las formas tradicionales de enseñanza que preva-
un tema que el INEE considera de gran interés lecieron hasta bien entrado el siglo XIX, cuando
para toda persona interesada en la evaluación, surgieron los sistemas educativos de concepción
especialmente para los que en el momento ac- moderna con los que estamos familiarizados
tual sienten preocupación por el enfoque que –con cobertura que tendía a ser universal y,
se está dando a la evaluación en gran escala en por ello, con muchos alumnos, organizados en
nuestro país. grados de edad y avance similar– la tarea de los
Convencido como lo está del potencial po- maestros era más de evaluación que de docencia.
sitivo de la evaluación en gran escala, el INEE En las escuelitas en que un dómine atendía a una
comparte la preocupación de no pocas perso- docena de chicos de distintas edades y niveles,
nas del medio educativo, en el sentido de que para enseñarles a leer, escribir, contar y rezar, la
ciertos usos de ese tipo de evaluaciones pueden lección magistral estaba ausente; el trabajo del
tener también serias consecuencias negativas. maestro se limitaba fundamentalmente a tomar
Por ello, es de gran importancia reflexionar se- la lección a cada alumno, indicándole, en función
riamente sobre los alcances y limitaciones de di- de su avance, la siguiente tarea.
chas evaluaciones, así como sobre la necesidad La que sí es bastante reciente es la evalua-
de que se fortalezcan paralelamente las evalua- ción en gran escala, la aplicación estandarizada de

5
Textos de evaluación

pruebas a grandes números de alumnos, para cargo de los maestros, insustituibles para eva-
apreciar el nivel de aprendizaje que se alcanza luar de manera detallada todos los aspectos
en el sistema educativo de todo un país, región del currículo y para hacerlo de manera que
o distrito, ante la imposibilidad de agregar las puedan ofrecer a cada alumno la retroalimen-
evaluaciones que hacen los maestros, siempre tación precisa sobre sus puntos fuertes y dé-
ligadas al contexto en que trabaja cada uno. biles, esencial para mejorar el aprendizaje. Es
Con antecedentes que se remontan al final preciso, sin embargo, advertir sobre un riesgo
del siglo XIX, las evaluaciones en gran escala se que no se puede ignorar: el peligro de que las
desarrollaron en los Estados Unidos, durante la pruebas en gran escala produzcan consecuen-
primera mitad del siglo XX, adquirieron impor- cias negativas para la calidad educativa, si se
tancia a lo largo de su segunda mitad y se exten- les comprende y utiliza mal.
dieron a la mayor parte de los países del mundo En efecto: para poder dar resultados con-
en las dos o tres últimas décadas. Además de fiables de los niveles de aprendizaje que al-
evaluaciones nacionales, se desarrollaron pro- canzan muchos miles de alumnos, una prueba
yectos internacionales que hoy atraen poderosa- estandarizada necesariamente tiene que redu-
mente la atención cada vez que se difunden sus cirse a la medición de un número relativamen-
resultados. Las más conocidas son las pruebas te mínimo de temas, y debe hacerlo mediante
del Proyecto para la Evaluación Internacional de preguntas que no pueden atender los aspec-
los Estudiantes (PISA, por sus siglas en inglés), tos más complejos de las competencias que
de la Organización para la Cooperación y el De- pretende desarrollar la escuela. Por ello, hay
sarrollo Económicos (OCDE), cuyo desarrollo que reiterar que las pruebas en gran escala no
comenzó a planearse en 1995, y se aplican cada pueden sustituir el trabajo de evaluación de
tres años desde el 2000. los maestros, el único que puede atender con
Más de tres décadas antes, en 1958, comen- precisión los aspectos más complejos de la en-
zaba a gestarse la Asociación Internacional de señanza y el aprendizaje, y hacerlo de modo
Evaluación del Rendimiento Académico (IEA, que se brinde retroalimentación detallada y
por sus siglas en inglés), con la planeación del oportuna a cada alumno.
Primer Estudio Internacional sobre Matemá- Si no se entienden bien los alcances y límites
ticas que se llevó a cabo en la década de 1960, de los resultados de las pruebas en gran escala,
del que se deriva el Estudio de Tendencias en es fácil que se usen en forma inapropiada. El
Matemáticas y Ciencias (TIMSS) una de las eva- peligro más claro es la tendencia a tomar como
luaciones vigentes más importantes. En México, referente para la tarea docente el contenido de
el desarrollo de pruebas en gran escala para edu- las pruebas y no el de los programas de estudio,
cación básica dio inicio desde la década de 1970, enseñando para las pruebas, por la visibilidad de
y se desarrolló sobre todo a partir de la de 1990, sus resultados. Con ello la tarea de la escuela se
con las pruebas para evaluar el Factor Aprove- empobrece, al descuidar aspectos esenciales que
chamiento Escolar del Programa de Carrera Ma- no evalúan las pruebas en gran escala, como la
gisterial. La tendencia se acentuó en la última expresión escrita y oral, la formación de acti-
década, con las pruebas del Instituto Nacional tudes y valores, la educación artística, e incluso
para la Evaluación de la Educación (INEE), a los niveles cognitivos más complejos de las áreas
partir de 2003, y las pruebas censales de la Se- tradicionalmente cubiertas de Lectura, Mate-
cretaría de Educación Pública, desde 2006. máticas y Ciencias.
Las pruebas en gran escala pueden ser una Otros ejemplos de manejo inapropiado de los
herramienta valiosa para apoyar los esfuerzos resultados de las evaluaciones en gran escala son
de mejora de la calidad educativa, si se las ve la asignación de estímulos a los docentes o la ela-
como un complemento de las evaluaciones a boración de ordenamientos simples de escuelas,

6
Presentación

supuestamente en función de la calidad de unos derá también que las preguntas de opción múl-
y otras, sin tener en cuenta los numerosos facto- tiple son esenciales en las primeras, pero que
res que inciden en los resultados de los alumnos las segundas, las evaluaciones que los maestros
en las pruebas ni tener en cuenta las limitacio- llevan a cabo, pueden utilizar acercamientos di-
nes de éstas. Este tipo de errores, además, pro- ferentes y mejores para evaluar aspectos finos
duce un explicable rechazo de toda evaluación y complejos, los cuales difícilmente se pueden
en gran escala por parte de muchos maestros, atender en gran escala, pero que en el ámbito del
que perciben sus graves consecuencias para la aula es posible emplear. Las preguntas de opción
educación. Por ello, conviene reiterar que la múltiple pueden ser usadas también en el aula,
evaluación en gran escala puede ser muy valio- y son adecuadas para evaluar algunos aspectos
sa para la mejora de la calidad, a condición de del aprendizaje, pero otros deben valorarse de
entenderla y usarla viéndola como complemento formas distintas, como mediante la producción
del trabajo del maestro, y no como sustituto del de textos amplios, la realización de ejercicios en
mismo. Para eso es necesario que los maestros vivo, la observación del trabajo individual y gru-
entiendan bien los alcances y límites de la eva- pal de los alumnos, entre otros.
luación en gran escala, y los de la evaluación que La expresión evaluación en aula (classroom as-
ellos llevan cabo. sessment) se refiere a este tipo de acercamientos.
En México la formación inicial que reciben Es importante que escuelas normales y progra-
muchos maestros no los prepara bien ni para mas de actualización de maestros en servicio
una cosa ni para la otra. Un indicio de ello es la presten la atención que merecen a estos enfo-
solicitud que el INEE suele recibir, de maestros, ques, relativamente recientes y poco conocidos
supervisores y directivos de escuelas normales, en nuestro medio.
para impartir talleres de elaboración de reacti- Para contribuir al desarrollo de estas innova-
vos de opción múltiple, gracias a lo cual se espe- doras ideas, el INEE hizo las gestiones necesa-
ra que mejore la calidad de las evaluaciones que rias para difundir en español el texto siguiente,
deben hacer los maestros. En el Instituto hemos de una de sus principales defensoras. Al invitar
mantenido la posición anterior sobre los alcan- a leerlo y reflexionar detenidamente sobre su
ces y límites de la evaluación en gran escala, y contenido, expreso el deseo de que la evaluación
sobre la necesidad de verla como complemen- educativa en México se desarrolle combinando
taria de la evaluación a cargo de los maestros, el avance técnico de las pruebas en gran escala,
y nos enfrentamos permanentemente con una con un uso de sus resultados que no ignore sus
dificultad considerable para conseguir que esta límites y un avance substancial de la evaluación
postura sea comprendida no sólo por la socie- en aula, a cargo de los maestros. Así, y sólo así, la
dad en general, sino también por las autoridades evaluación podrá contribuir realmente a la me-
educativas y por los maestros, como muestran jora educativa.
las demandas a las que alude el párrafo.
Si se comprenden las características de las Felipe Martínez Rizo
evaluaciones en gran escala y en aula, se enten- Julio de 2008.

7
Textos de evaluación

8
La evaluación en el aula

La evaluación en el aula

El modelo de evaluación en el aula que se explica tivo de la evaluación como parte del proceso de
detalladamente en este trabajo es muy diferente aprendizaje (Black, y Wiliam, 1998; Gipps, 1999;
del modelo de pruebas y mediciones que predo- Shepard, 2000). A principios de la década de los
minó en aulas y escuelas durante el siglo pasado. ochenta, el interés en reformar la práctica de la
En los primeros años del siglo XX, los expertos evaluación se vio acuciado por un uso mayor de
en mediciones creían que podían usarse pruebas pruebas estandarizadas, cuyo propósito era la
nuevas y objetivas para estudiar y mejorar los re- responsabilización*, y por una evidencia cada vez
sultados de la educación, así como para encargar- mayor de que los formatos estrechos de pruebas
se del diagnóstico y la colocación de estudiantes tenían un efecto perjudicial en la calidad de la
de acuerdo con sus necesidades de aprendizaje enseñanza y el aprendizaje de los estudiantes
(Symonds, 1927; Thorndike, 1913). El punto de (Resnick y Resnick, 1992; U.S. Congress, Office of
vista prevaleciente fue que los expertos debían Technology Assessment, 1992). Adelantándose a los
elaborar pruebas estandarizadas que los do- expertos en mediciones, los especialistas en las
centes utilizarían con objeto de incrementar la materias empezaron a desarrollar estrategias de
precisión en su toma de decisiones. Además, los evaluación que se vinculaban más estrechamente
expertos en mediciones empezaron a enseñar a a los objetivos curriculares (Kulm, 1990; Mathe-
los maestros cómo hacer sus propias pruebas si- matical Sciences Education Boarad, 1993; Morrow
guiendo principios científicos de medición. En y Smith, 1990; Valencia y Calfee, 1991). Por otra
aquellos primeros años, se desarrolló un sistema parte, la investigación en psicología cognitiva
para los libros de texto de mediciones con el fin y motivacional aportó tanto la teoría como las
de enseñar a los maestros cuestiones sobre la evidencias, gracias a las cuales se perfiló el cami-
validez y la confiabilidad (utilizando representa- no para los cambios que se necesitaban (Black,
ciones en su mayor parte cuantitativas), la ela- y Wiliam, 1998; Crooks, 1988; Pellegrino, Chu-
boración de pruebas, los formatos y el análisis dowsky y Glaser, 2001). Por último, este nuevo
de reactivos, así como análisis estadísticos de los modelo de evaluación en el aula, se ha hecho
resultados de las pruebas. Este sistema —que manifiesto en un nuevo tipo de libro de texto de
consistía casi exclusivamente en pruebas forma-
les, cuestionarios y calificaciones— ha seguido
*
El concepto del que habla la autora es accountability, que se ha tra-
ducido como responsabilización porque se responsabiliza a escuelas,
siendo el modelo de los libros de texto hasta el directores y maestros del progreso académico de los estudiantes.
día de hoy. Este concepto, en el contexto de la educación, hace referencia al
uso sistemático de datos de evaluación y otro tipo de informa-
En contraste con este modelo técnico y cuan- ción para garantizar que las escuelas vayan en la dirección deseada.
titativo, existe un punto de vista diferente de la Con frecuencia, en los sistemas de responsabilización se incluyen
metas, indicadores de progreso hacia el cumplimiento de esas me-
evaluación en el aula, que se desarrolló a fines tas y análisis de datos, así como procedimientos de información
del siglo XX y que busca lograr que, en mucho prescritos y consecuencias o sanciones. La responsabilización a
menudo incluye el uso de resultados de evaluación y otros datos
mayor medida, el estudiante alcance un entendi- para determinar la eficacia del programa y para tomar decisiones
miento; asimismo, busca obtener el uso forma- sobre recursos, recompensas y consecuencias. (Nota de la traduc-
tora)[N. T.]

9
Textos de evaluación

evaluación fundamentado en la práctica docente ban fallando (U. S. Congress, Office of Technology
(Stiggins, 2001; Taylor y Nolen, 2005). Al señalar Assessment, 1992), elaboraron instrumentos para
la naturaleza fundamental de esta transforma- documentar la necesidad de mejorarlas y esta-
ción, unos cuantos expertos en mediciones han blecer el rumbo para lograrlo. Se pedían pruebas
empezado a preguntar cómo deberían cambiar estandarizadas para que pudieran agregarse re-
las ideas tradicionales de validez y confiabilidad sultados de diversas escuelas y compararlas en-
en el contexto del aula (Brookhart, 2003; Mac- tre sí; y el nuevo tipo de examen objetivo se con-
millan, 2003; Moss, 2003; Smith, 2003). sideró como un remedio para la escandalosa falta
En este capítulo se presenta, tanto la concep- de confiabilidad de los exámenes que hacían los
ción como los fundamentos de la investigación maestros, y que había quedado demostrada en
sobre las estrategias de evaluación en el aula varios estudios anteriores (Thorndike, 1922).
concebidas para ser parte integral de la enseñan- Desde el principio hubo también críticos que
za y el aprendizaje. Comienza con una introduc- se quejaron de que las pruebas objetivas medían
ción histórica para explicar el punto de vista que tan sólo hechos o fragmentos de información en vez de
sostuvieron ciertos teóricos de la medición en el que midieran la capacidad de razonar y la aptitud
pasado sobre la aplicación de pruebas en el aula. para la organización, etcétera, (Wood, 1923). No
Se detiene específicamente en los puntos de vis- obstante, al hablar en nombre del pensamiento
ta presentados en ediciones previas de Educatio- dominante, Wood estableció los argumentos
nal Measurement, obras editadas por Lindquist fundamentales de las ventajas de la medición
(1951), Thorndike (1971) y Linn (1989), respec- objetiva1, los cuales fueron repetidos a lo largo
tivamente. La intención es identificar las ideas de todo el siglo:
que han perdurado, así como las que actualmen- La prueba estandarizada es sumamente
te se impugnan. La parte principal del capítulo exacta no sólo debido a que uno puede ca-
está organizada en tres secciones: 1) Evaluación lificarla objetivamente, sino porque da su-
formativa, 2) Evaluación sumativa y calificación, ficientes muestras del desempeño del exa-
3) Evaluaciones externas y en gran escala. En una minado así como del material sobre el cual
sección de conclusiones, se consideran las impli- se examina. Por otra parte, es lo bastante
caciones de estas ideas transformadoras para el flexible como para que pueda examinar no
campo de la medición educativa. Se propone un sólo información sino también juicio, y la
programa de investigación y se sugieren los cam- evaluación de relaciones, causas y conse-
bios que se necesitan en la conceptualización de cuencias. (p. 162)
la validez y la confiabilidad para los objetivos del No hay tanta oposición entre información
aula. y razonamiento como algunos maestros
quisieran hacernos creer … Los hechos no
1. PANORAMA HISTÓRICO son sólo un aspecto legítimo e indudable
DE LA MEDICIÓN EDUCATIVA del pensamiento… sino que sólo el pensa-
Y LAS AULAS miento puede adquirirlos, conservarlos y
reproducirlos, y sólo puede hacerse esto
El movimiento que pugnaba para que se apli- mediante la organización lógica y sistemá-
caran pruebas de rendimiento escolar —que se tica del material. (p. 162)
inició en 1908 con la publicación por Thorn- Todo estudio experimental del que tenga-
dike y sus alumnos de pruebas de Aritmética y
Escritura— estaba estrechamente relacionado 1
Para ser justos, Wood (1923) argumentó en favor del uso de prue-
bas estandarizadas por su mayor confiabilidad con el fin de com-
con el movimiento de la administración cien- plementar mediciones que utilizaban los exámenes tradicionales
tífica o movimiento de la eficiencia social. Sus de ensayo. Sin embargo, otros usaron posteriormente este mismo
líderes, que consideraban que las escuelas esta- razonamiento para sustituir pruebas de ensayo por pruebas obje-
tivas más confiables.

10
La evaluación en el aula

mos conocimiento, y que se haya realizado con las decisiones rutinarias que se toman en el
hasta ahora, ha mostrado una fuerte rela- aula— no era una distinción evidente en 1951.
ción entre la medición de la información Walter Cook (1951), en su capítulo titulado
en un campo y la inteligencia o la capaci- The Functions of Measurement in the Facilitation of
dad de pensar en el material de ese campo. Learning, defendía el uso de la medición objetiva
(p. 163) para adaptar la enseñanza a las necesidades indi-
Por otra parte, puesto que las pruebas de ren- viduales de aprendizaje. En tanto que reconocía
dimiento se elaboraron en el mismo periodo y que “Los mejores maestros no dejan de seguir
las hicieron los mismos autores de las pruebas constantemente el proceso de verificación del
de Coeficiente Intelectual (CI), ambos tipos de aprendizaje mediante la observación directa de
pruebas llegaron a tener los mismos formatos la conducta y las pruebas informales”, al mismo
de reactivos y los mismos modelos estadísticos tiempo argumentaba en favor del valor de las
cuyas raíces se hundían en la psicología de las pruebas preparadas por expertos porque:
diferencias individuales. 1. Son más concienzudamente analíticas que
Después de la Primera Guerra Mundial, el la mayoría de las que podrían preparar los
uso de pruebas estandarizadas de rendimiento maestros.
aumentó notablemente debido al éxito práctico 2. Hacen que los maestros tomen concien-
y en gran escala de la prueba Army Alpha, al esta- cia de los elementos importantes, las se-
blecimiento de grandes oficinas de investigación cuencias necesarias y las dificultades del
educativa y agencias de investigación coopera- proceso.
tiva, y a la conceptualización de Ralph Tyler en 3. Ahorran tiempo y energía al maestro
el campo de la evaluación educativa, con el pro- para hacer diagnósticos, y le dejan más
pósito de evaluar cuán bien habían logrado sus tiempo y energía para que haga el trabajo
objetivos los programas educativos (Cook, 1941; de corrección.
Madaus y Stufflebeam, 2000; U. S. Congress, 4. Ayudan al alumno a reconocer sus necesi-
Office of Technology Assessment, 1992). dades de aprendizaje al hacer hincapié en
La primera edición de Educational Measure- forma sistemática en sus errores.
ment, libro que se publicó en 1951 y que editó 5. Los procedimientos correctivos se indi-
E. F. Lindquist, reflejó y extendió la idea de que can o proporcionan al maestro y le aho-
las pruebas estandarizadas eran esenciales para rran tiempo, así como también le ayudan
el proceso de evaluación y mejoramiento de la a sistematizar el proceso. (p. 37)
educación. Si bien los autores de los capítulos En el capítulo sobre The Functions of Measurement
de la edición de 1951 dicen que las “funciones in Improving Instruction, que se relaciona con lo
de la medición educativa se relacionan… con anterior, Tyler (1951) observó que “la medición
la facilitación del aprendizaje” (Cook, 1951, p. educativa está concebida, no como un proceso
4), lo que ellos tenían en mente era que esto lo totalmente distinto de la enseñanza, sino más
realizarían pruebas elaboradas fuera del aula. Su bien como una parte integral de ésta” (p. 47).
punto de vista era que había que desarrollar pro- Pese a la similitud entre estas palabras y las con-
gramas de pruebas estandarizadas en los distri- cepciones actuales de la evaluación en el aula, los
tos escolares, que es lo que hoy podría llamarse procesos que Tyler tenía en mente se asumían casi
administración de datos o sistemas manejados totalmente fuera del aula. Si bien algunos de los
con datos. La distinción que se hace en nuestro ejemplos de Tyler tomaban en cuenta la posibili-
informe contemporáneo Knowing What Students dad de que un instructor individual de un curso
Know (Pellegrino et al., 2001) —entre los tipos pudiera recorrer todo el proceso de planeación
de datos de evaluación que se necesitan para de la enseñanza —especificando objetivos, pla-
las políticas en gran escala, en contraposición nificando experiencias de aprendizaje y valoran-

11
Textos de evaluación

do efectos—, Tyler se interesaba sobre todo en Al escribir él solo para la tercera edición, Ni-
que un programa de pruebas de rendimiento en tko (1989) ofreció nuevamente un enfoque sobre
un distrito escolar se “planificara y desarrollara la planificación de la enseñanza que aprovechaba
como parte integral del programa del currículo y una base de investigación cognitiva sumamente
la enseñanza” (p. 64). Los maestros aprenderían sofisticada con el fin de ofrecer pruebas pertinen-
participando en el desarrollo de objetivos y en la tes, desde el punto de vista de la instrucción, para
elaboración de pruebas, y también aprenderían que se utilizaran en el aula. Revisó la literatura
de los datos resultantes. sobre pruebas de diagnóstico que se basaban en
Para la segunda edición, de 1971, Robert Gla- los conocimientos previos requeridos, en habi-
ser, un psicólogo cognitivo, y Anthony Nitro, un lidades y en el dominio de objetivos conductua-
teórico de la medición, escribieron el capítulo les –acercamientos que reflejaban una idea muy
sobre Measurement in Learning and Instruction. Su estrecha de cómo se desarrolla el aprendizaje y
perspectiva formal de planificación de la ense- una representación relativamente empobrecida
ñanza estaba influida por supuestos docentes del dominio de los contenidos. En contraste con
conductistas y de la educación adaptativa por esto, Nitko (1989) también estudió textos emer-
computadora, que gozaban de popularidad en gentes de diagnóstico centrados en el análisis de
la época. Al igual que Tyler y Cook, su visión errores y estructuras de conocimiento de los es-
planteaba la necesidad de pruebas pertinentes tudiantes. Estas últimas categorías le permitieron
para la enseñanza, que se elaborarían fuera del vislumbrar los temas de investigación que serían
aula y se entregarían a los docentes. “A medida fundamentales para la concepción contemporá-
que se desarrolla la enseñanza, la información nea del aprendizaje y la evaluación. Por ejemplo,
para tomar decisiones educativas deben darse al “(la) comprensión que tenga quien diseña prue-
docente, al estudiante y posiblemente a una má- bas sobre el significado y la estructura del cono-
quina” (pp. 626-627). En vista de la complejidad cimiento que un estudiante trae al sistema de
que implica el diseño de pruebas apropiadas, in- enseñanza” podría utilizarse para identificar “la
cluyendo la validación de modelos cuantitativos comprensión cotidiana de palabras y fenómenos
de adaptación de la enseñanza, “parecería ade- […] que no concuerden con la comprensión ca-
más que el agobio de planificar y elaborar tales nónica de los expertos” (p. 461). Es importante
pruebas, de procesar las respuestas y de llevar a señalar que Nitko (1989) también observó que
cabo análisis preliminares de los resultados de “la investigación reciente en psicología educativa
la prueba, debe manejarlo alguien que no sea el indica que las formas en que los estudiantes re-
maestro de la clase.” De nueva cuenta, al igual presentan mentalmente el conocimiento son tan
que Tyler, Glaser y Nitko vieron que estos resul- importantes, para el desarrollo de sus habilida-
tados de las pruebas podrían estar al servicio de des para resolver problemas y para el aprendizaje
la evaluación de programas, al proporcionar una avanzado, como las formas en que manifiestan su
retroalimentación formativa a los responsables conocimiento conductualmente” (p.466). Si bien
del sistema. Sin embargo, a diferencia de Tyler, Nitko (1989) todavía imaginaba un sistema de en-
estaban más interesados en datos de las prue- señanza informal y de evaluación que se elabora-
bas que pudieran usarse en forma permanente ría fuera del aula y se entregaría a los maestros, su
para adaptar la enseñanza a los estudiantes in- punto de vista reflejó un cambio esencial e impor-
dividuales, y creían que su sistema de pruebas tante: quedaron lejos las pruebas de competencia
diseñado externamente podría quedar inclui- del estudiante después de una lección o periodo
do en la enseñanza de un modo perfectamente de instrucción, donde pasaba o reprobaba, y se
consistente. “Si se hacen apropiadas y sutiles, la dio un paso hacia las evaluaciones más ricas de
docencia, la educación y la aplicación de prue- su comprensión y aprovechamiento en un campo
bas se irán diluyendo una en otra”. (p. 646) del conocimiento.

12
La evaluación en el aula

Si bien los primeros volúmenes de Educa- por sentado que sería sencillo “volver a enseñar
tional Measurement tenían poco que decir sobre ciertas cuestiones” (Torgerson, y Adams, 1954).
las pruebas que hacían los docentes o sobre las La estadística y las presentaciones cuantitativas
prácticas de evaluación en el aula, el movimien- de la confiabilidad y la validez fueron sobresa-
to de pruebas estandarizadas y el paradigma de lientes en cuanto a qué necesitaban saber los do-
la evaluación de programas determinaron, no centes. En el prefacio a su texto de Educational
obstante, qué se enseñaba a los docentes acer- Measurement, Travers (1955) señaló que muchos
ca de la evaluación. Los teóricos de la medición, de sus colegas tenían preferencia por los libros
responsables de los cursos de Pruebas y Medicio- de texto sobre medición psicológica porque brin-
nes para maestros, creían que debía enseñarse daban “un alimento intelectual más sólido que
a éstos cómo emular la confección de pruebas los libros sobre medición educativa” (p. vi), en
estandarizadas de rendimiento, así como de qué vista de lo cual aumentó el nivel técnico de su
manera debían usar una diversidad de medicio- libro “para ayudar a fortalecer una debilidad en
nes estandarizadas. Los libros de texto típicos la preparación de los maestros” (p. vi). En una
desde la década de 1940 hasta la de 1990 incluían muestra de treinta libros de texto examinados
los siguientes capítulos: para este análisis histórico, sólo encontré dos
I. Finalidad de la medición y la evaluación que tenían una sección o subsección dedicada
II. Análisis estadístico de los resultados de al uso de la observación en el aula. Encontré un
pruebas texto que menciona el uso de la evaluación para
111. Validez la retroalimentación2. La mayor parte de los tex-
IV. Confiabilidad tos tenían un capítulo sobre la especificación
V. Principios generales de la elaboración de objetivos para la enseñanza; y, si se captara
de pruebas (incluye la especificación el mensaje principal de estos libros, ayudaría a
de los objetivos de la enseñanza) los maestros a volverse más sistemáticos en el
VI. Principios de la elaboración de pruebas uso que hacen de diversos formatos de reacti-
objetivas vos para representar un contenido importante.
VII. Principios de elaboración de pruebas de Sin embargo, sería justo decir que los aspectos
ensayo técnicos de la elaboración de pruebas recibieron
VIII. Análisis de reactivos para pruebas en más atención que las conexiones entre la evalua-
el aula ción y las actividades de la enseñanza.
IX. Asignación de calificaciones y for- El acento que ponen los integrantes de la
ma de reportarlas comunidad de la medición en temas formales
X. Pruebas de CI y aptitud académica y técnicos también puede encontrarse en la li-
XI. Pruebas estandarizadas de rendimiento teratura de investigación sobre la capacitación
XII. Mediciones de intereses y personalidad en medición para los maestros. Esta literatura,
XIII. Interpretación de normas estadísticas que se extiende por varias décadas, se lamenta
para las pruebas constantemente de que los maestros han recibi-
Los libros de texto de medición se centraban do una preparación deficiente para cumplir con
en la elaboración de pruebas formales cuya fina-
lidad era la asignación de calificaciones. Si bien 2
Brown (1981), de manera profética, comentó: “(El) aspecto efi-
varios autores mencionaban la importancia de caz de la retroalimentación es saber si una pregunta se contestó
correctamente o, si se contestó en forma incorrecta, saber dónde
utilizar la información que aportaban las pruebas ocurrió el error y qué necesita hacerse para corregir dicho error.
para modificar la enseñanza, los libros de texto Esta información es suministrada por el señalamiento del maestro
sobre la corrección de la respuesta y/o por sus comentarios, no
daban pocas explicaciones sobre el modo en que por la calificación. Así, una prueba que se corrige, pero que no da
los docentes entenderían los datos con objeto de lugar a una calificación, puede proporcionar tanta retroalimenta-
rediseñar su enseñanza. Algunos autores dieron ción útil a los estudiantes como una que si lleva a una calificación”
(p. 171).

13
Textos de evaluación

sus responsabilidades de medición y evaluación. la gran importancia de las pruebas elaboradas


Históricamente, muchos estudios dieron por por los maestros, las pruebas incluidas en el cu-
sentado que los maestros necesitaban saber lo rrículo, y las interacciones y observaciones in-
que se enseñaba en los cursos de Pruebas y Me- formales para su toma de decisiones cotidiana
diciones, y hablaban de la idoneidad de dicha (Dorr-Bremme, 1983; Salmon-Cox, 1981; Yeh,
preparación según cuántos programas forma- Herman y Rudner, 1981). Gracias a datos de en-
tivos ofrecían tales cursos, cuántos estados los trevistas, Dorr-Bremme (1983) concluyeron que
requerían y cuántos maestros los tomaban (Gos- los maestros actúan como razonadores prácticos
lin, 1967; Noll, 1955; Roeder, 1972; Ward, 1980). y como clínicos, y que orientan sus actividades
Cuando los investigadores intentaron identifi- de evaluación a las tareas prácticas que deben
car en forma directa las habilidades específicas de llevar a cabo en las rutinas cotidianas, tales
que se juzgaban esenciales para los maestros, los como “decidir qué enseñar y cómo enseñarlo a
instrumentos que utilizaron en sus encuestas li- los estudiantes de diferentes niveles de desem-
mitaron desafortunadamente la base de conoci- peño; llevar el registro de cómo progresan los
mientos posibles a los contenidos de los libros alumnos y cómo ellos (los maestros) pueden
de medición. Así, por ejemplo, en el estudio de ajustar su enseñanza apropiadamente y evaluar
mayo de 1964, se pidió a maestros y directores y calificar a los estudiantes en su desempeño”
así como a profesores de universidad y exper- (p. 3). Para estos fines, los maestros se apoyan
tos en pruebas, que clasificaran la importancia en muy buena medida en las pruebas hechas por
de setenta competencias. Treinta y dos de éstas ellos y en las interacciones con los estudiantes y
eran elementos estadísticos que tenían que ver las observaciones que hacen de éstos. Stiggins
con el cálculo y la interpretación de la media, y Conklin (1992) publicaron resultados de una
la mediana y la moda, la desviación estándar, las serie de estudios de campo que documentaban
puntuaciones estándar, las correlaciones y así qué hacen los maestros para evaluar a sus estu-
sucesivamente. Las competencias restantes que diantes, y analizaron qué necesitarían saber los
recibieron clasificaciones más altas, correspon- docentes para hacer bien estas tareas. Stiggins
dieron fielmente a los capítulos de los libros de (1991) concluyó que la capacitación tradicional
texto de medición citados anteriormente. De en medición ha estado crónicamente mal enfocada,
igual manera, en 1973, Goehring utilizó libros de tanto así, que sólo nosotros tenemos la culpa
texto de Pruebas y Medición para generar una lista por la falta de atención dada a la capacitación
de 116 competencias y luego pidió a maestros y en medición en los programas educativos para
directores de escuelas que analizaran su impor- maestros.
tancia relativa. Muy aparte de la literatura sobre medición,
Sólo alguna que otra vez, y relativamente en los expertos en los contenidos de la enseñanza
fecha reciente, han empezado los especialistas empezaron a elaborar alternativas a las pruebas
de medición a fijarse en el contexto del aula para estandarizadas para el aula, movidos por una
tratar de entender las necesidades que tienen aversión a los efectos de las pruebas de rendición
los maestros de obtener competencia en eva- de cuentas o responsabilización, pero también a
luación. En 1973 Fahr y Griffin cuestionaron la causa de profundos cambios en las concepcio-
literatura que, al parecer, hacía de la medición nes del aprendizaje y el aprovechamiento en las
un fin en sí mismo, y sostuvieron en cambio que materias (Shepard, 2000). En lectura, por ejem-
las habilidades deben estar relacionadas direc- plo, los investigadores que trabajaban desde una
tamente con las decisiones de enseñanza que perspectiva emergente del alfabetismo (Clay,
los maestros necesitan tomar. Varios estudios, 1985; Teale y Sulzby, 1986), se dedicaron mucho
centrados inicialmente en cómo se utilizaban más a observar y respaldar las habilidades en de-
en el aula las pruebas estandarizadas, revelaron sarrollo de niños en contextos sociales concre-

14
La evaluación en el aula

tos, más que en habilidades aisladas y descon- do un cambio considerable en la investigación


textualizadas. Clay (1985) inventó estrategias de sobre la enseñanza y el aprendizaje. Debido a
evaluación insertas en el acto de leer, señalando la revolución de la ciencia cognitiva, la investi-
que la investigación había fracasado en demos- gación ya no se centraba solamente en conduc-
trar que el aprendizaje hubiera mejorado por la tas observables, sino que también tomaba en
asignación de estudiantes a grupos de diferente consideración procesos cognitivos internos. En
nivel con base en un diagnóstico asentado en vez de un modelo de aprendizaje en el que los
pruebas de velocidad en lectura o en pruebas maestros transmiten el conocimiento y los estu-
de prerrequisitos, tales como habilidad lingüís- diantes lo absorben, el nuevo modelo de apren-
tica o discriminación visual. Goodman (1985) dizaje sostiene que los estudiantes construyen
reintrodujo el concepto de vigilancia de los niños, activamente conocimiento nuevo. En las obras
un remanente del movimiento de estudios del del National Council of Teachers of Mathematics
niño, que estuvo en boga mucho tiempo antes. (Consejo Nacional de Maestros de Matemáticas
A diferencia de las pruebas estandarizadas que [NCTM], por sus siglas en inglés) Curriculum and
se aplican en un único momento, la vigilancia Evaluation Standards for School Mathematics (1989)
de niños es continua. Legitima la importancia y Everybody Counts, un informe del National Re-
de la observación profesional en el aula y tiene search Council (1989), el aprendizaje de las Mate-
en cuenta experiencias de aprendizaje más ricas máticas se redefinió, más bien, como un proceso
que aquellas que pueden sepultarse sin riesgos en de indagación y de búsqueda de sentido que una
la prueba (Goodman, 1985, p. 14). La reunión de repetición y mímica sin sentido. Para la evaluación
muestras del trabajo de los estudiantes (Teale, esto significaba que se necesitaban problemas
Hiebert y Chittenden, 1987) se convirtió en un más extensos y no rutinarios para atraer a los
recurso valioso, no sólo para alcanzar una com- estudiantes y para evaluar la potencia matemática
prensión del pensamiento de los niños, sino para –definida como la capacidad de usar el conoci-
documentar su progreso a lo largo del tiempo. miento matemático “para razonar y pensar crea-
Se descubrió que la narración de cuentos era tivamente y para formular, resolver y reflexionar
más eficaz, tanto para los fines de la enseñanza críticamente en los problemas” (NCTM, 1989,
como para los de evaluación, que las preguntas p. 205). Además, el discurso del aula se convirtió
tradicionales de comprensión de lectura (Mo- en un punto focal de las reformas en Matemáti-
rrow, 1985), y así sucesivamente. Irónicamente, cas que buscaba proporcionar a los estudiantes
estos investigadores estaban haciendo exacta- la oportunidad de conjeturar y explicar su razo-
mente lo que Tyler había recomendado décadas namiento. Estas nuevas rutinas de enseñanza
antes al clarificar sus objetivos de enseñanza y incrementaron al mismo tiempo la importancia
buscar una representación lo más fiel posible de de las evaluaciones informales e integradas −ob-
estos objetivos en sus planes de evaluación. Con servaciones, preguntas del maestro y escritura
todo, lo que Tyler no previó fueron las limitacio- de un diario− como medios para comprender el
nes de los formatos de las pruebas objetivas, que pensamiento de los estudiantes (Silver y Kenney,
para finales del siglo XX ya no eran adecuadas 1995). En vez de la práctica imperante según la
para corresponder a las nuevas concepciones del cual los maestros ajustaban sus propias pruebas
aprendizaje de las materias (Shepard, 2000). para que emularan tanto la forma como el conte-
En la comunidad de las Matemáticas, la fuer- nido de las pruebas externas de opción múltiple,
za motriz y la dirección para los cambios en la Silver y Kilpatrick (1989) sostuvieron que debía
evaluación fueron paralelos a los que hubo en hacerse un esfuerzo serio para dotar de nuevas ha-
Lectura. En el capítulo sobre Matemáticas del bilidades a los docentes, para que pudieran dar
tercer Handbook of Research on Teaching, Romberg clases con enfoque de resolución de problemas
y Carpenter (1986) observaron que había ocurri- y para evaluar las capacidades y actitudes de sus

15
Textos de evaluación

estudiantes en cuanto a resolución de proble- tiva, diciendo que la evaluación es formativa “sólo
mas, en el contexto de tales clases. cuando la comparación de los niveles reales y los
Pueden narrarse historias parecidas para otras de referencia producen información que luego se
materias, como ciencias y estudios sociales. En usa para modificar la laguna” (p. 53).
cada caso, los reformadores de finales del siglo En la siguiente sección sobre la evaluación
XX estuvieron motivados por la teoría construc- formativa, me explayo sobre la idea del uso de
tivista del aprendizaje y la necesidad de una ense- la evaluación como parte del proceso de apren-
ñanza y una evaluación más auténticas (Resnick y dizaje. La evaluación formativa se define como
Resnick, 1992; Wiggins, 1993). Para la comunidad la evaluación llevada a cabo durante el proceso
dedicada a las mediciones en Estados Unidos, el de enseñanza con el fin de mejorar la enseñanza
impacto de estos cambios se concentró princi- o el aprendizaje. La evaluación formativa pue-
palmente en reformar programas de evaluación de implicar métodos informales, tales como
en gran escala, ya que varios estados iniciaron un la observación y las preguntas orales, o el uso
programa de evaluaciones innovadoras y basadas formativo de medidas más formales como exá-
en el desempeño (Baron y Wolf, 1996). Quizá a menes tradicionales, portafolios y evaluaciones
causa de la gran importancia de las pruebas de del desempeño. También me ocupo de proble-
responsabilización externa3, la comunidad estu- mas de coherencia y de cómo podríamos lograr
diosa de las mediciones mostró lentitud en consi- que las estrategias de evaluación formativas y
derar las implicaciones de estos cambios teóricos sumativas se respaldaran mutuamente. La dis-
para la evaluación en el aula. Se formó un peque- tinción entre la evaluación formativa y la suma-
ño Grupo de Interés Especial dentro de la American tiva es paralela al uso original que Michael Scri-
Educational Research Association; pero, durante los ven (1967) dio a estos términos, en el contexto
años noventa, por ejemplo, la evaluación en el de la evaluación curricular y la evaluación de
aula o temas afines, tales como las formas de asig- programas, para distinguir entre la evaluación
nar calificaciones, dieron cuenta de sólo el 4% de realizada durante el proceso de desarrollo para
las sesiones en las reuniones anuales del National dar información al proceso mismo, en contra-
Council on Measurement in Education (Consejo Na- posición con la evaluación del producto final.
cional de la Medición en Educación). En Gran La evaluación sumativa, que se considera en una
Bretaña, las pruebas estandarizadas tomaron una sección posterior, se refiere a las evaluaciones
dirección muy diferente. El Assessment Reform realizadas al final de una unidad de enseñanza
Group (1999), que empezó en 1989 como un Gru- o curso de estudio, con el propósito de dar ca-
po de Tareas [Task Group] de la British Educational lificaciones o de certificar el aprovechamiento
Research Association, se centró en el vínculo deci- del estudiante. Como veremos, el nuevo mode-
sivo entre la evaluación en el aula y la enseñanza lo de evaluación formativa aspira a hacer que la
y el aprendizaje. El Assessment Reform Group acu- evaluación forme parte integral de la enseñan-
ñó la expresión evaluación para el aprendizaje para za, tal como lo propusieron los primero teóri-
referirse a la evaluación que respalda el proceso cos de la medición. La diferencia importante
de aprendizaje, lo que contrasta con la evaluación es que las estrategias que se explican aquí están
que sólo mide los resultados del aprendizaje. Si- construidas sobre un modelo muy diferente de
guiendo a Sadler (1989), Black y Wiliam (1998) enseñanza y aprendizaje, y no dependen de ins-
hicieron que este aprendizaje se centrara en la trumentos estandarizados que se hayan elabo-
característica definitoria de la evaluación forma- rado fuera del salón de clase.

3
External accountability. Hace referencia a que la sociedad respon-
sabiliza y, también pide una rendición de cuentas a la institución,
a los maestros y/o a los estudiantes mismos. La interna sería la
propia de la institución, los maestros y/o los estudiantes [N. T.]

16
La evaluación en el aula

2. EVALUACIÓN FORMATIVA ción futura debe considerar el aprendizaje y el


desarrollo profesional de los maestros así como
Para que los docentes sean eficaces en reforzar a la eficacia de herramientas específicas de eva-
el aprendizaje de los estudiantes, deben com- luación.
probar constantemente la comprensión que és-
tos vayan logrando. Por otra parte, tienen que 2.1 Teoría del aprendizaje, y coherencia
darles a conocer la importancia de que ellos mis- en el diseño de la evaluación
mos asuman la responsabilidad de reflexionar y
supervisar su propio progreso en el aprendiza- La obra Knowing What Students Know (Pellegrino
je. Un análisis fundamental de Black y Wiliam et al., 2001) fue el resultado de un comité del
(1998), que marcó un hito, descubrió que los es- National Research Council, que se encargó de re-
fuerzos orientados a mejorar la evaluación for- unir los avances hechos tanto en la ciencia cog-
mativa producían beneficios mayores a la mitad nitiva como en la medición. Una premisa central
de una desviación estándar. En otras palabras, que sustenta las recomendaciones de Knowing
la evaluación formativa, eficazmente implemen- What Students Know es que las observaciones e
tada, puede hacer tanto o más para mejorar la interpretaciones de la evaluación deben estar
realización y los logros que cualquiera de las relacionadas con un modelo cognitivo bien es-
intervenciones más poderosas de la enseñanza, tructurado de cómo aprende el estudiante en
como la enseñanza intensiva de Lectura, las cla- cierto campo. Este modelo fundamental debe
ses particulares y otras parecidas. reflejar una comprensión actualizada de cómo
En esta sección, comienzo con un resumen se desarrolla el aprendizaje en un campo, y no
de las teorías contemporáneas del aprendizaje las “creencias tan restrictivas” (Pellegrino et al.,
y luego presento un modelo de evaluación for- 2001, p. 54) en que se basan las evaluaciones del
mativa del que muestro su compatibilidad tan- logro académico que más se utilizan. Un modelo
to con la teoría cognitiva como con la teoría de aprendizaje sirve “como un elemento unifica-
sociocultural del aprendizaje. Luego considero dor, un núcleo que da cohesión al currículo, la en-
varias estrategias y herramientas específicas que señanza y la evaluación” (Pellegrino et al., 2001,
comprenden el modelo general que los docen- p. 54). Por otra parte, los autores de Knowing
tes utilizan como parte de las rutinas cotidianas What Students Know argumentan más adelante
de enseñanza. Estos procesos recursivos de eva- en favor de esta misma coherencia esencial entre
luación son esenciales para una revisión y per- las evaluaciones externas y las que se hacen en
feccionamiento continuos de la enseñanza así clase. Para trabajar conjuntamente y respaldar el
como para mejorar también el aprendizaje del aprendizaje del estudiante, las evaluaciones en
estudiante. ambos niveles de un sistema de evaluación de-
No obstante, antes es necesario hacer una ben apoyarse en modelos compatibles sobre el
advertencia. Las prácticas ideales de evaluación aprendizaje del estudiante, aun cuando los mo-
que aquí se explican y que se basan en la inves- delos referentes al aula pueden ser mucho más
tigación, son consistentes con las prácticas de detallados. En este capítulo, utilizo el concepto
maestros particularmente competentes y exper- de coherencia para hablar acerca de cómo puede
tos, pero no necesariamente reflejan prácticas de hacerse que se respalden mutuamente la evalua-
evaluación típicas. De hecho, la mayoría de los ción formativa y la sumativa dentro del aula.
maestros en servicio tiene solo un conocimiento En el panorama histórico que esbocé en lí-
limitado de estrategias de evaluación formativa, neas anteriores, los cambios en la teoría del
y sigue pensando en la evaluación como un pro- aprendizaje se mencionaron varias veces como la
ceso que sirve principalmente para calificar. Por fuerza motriz de los cambios en la forma en que
consiguiente, la sección final sobre la investiga- conceptualizaron la enseñanza y la evaluación

17
Textos de evaluación

los expertos en las materias. Las concepciones actividad práctica llena de significado. Un indi-
contemporáneas del aprendizaje han transfor- viduo aprende a pensar y a razonar gracias a una
mado nuestra comprensión de cómo ocurre el gran diversidad de apoyos proporcionados por
aprendizaje, pero de manera más fundamental, adultos y pares más conocedores e informados.
han alterado nuestras concepciones de qué es el Este modelo de aprendizaje queda excelente-
aprendizaje, qué significa ser competente en un mente caracterizado como un proceso de induc-
campo y, por consiguiente, cómo buscaríamos ción, o como un modelo del aprendiz, median-
evidencia de esa competencia. La revolución cog- te el cual se permite a los novatos participar y
nitiva fue una rebelión en contra de la psicología hacer contribuciones en un contexto de trabajo
de las diferencias individuales y el conductismo, real, pero a los que se asignan tareas adaptadas
que se había interesado sobre todo en la adquisi- a su nivel particular de competencia. El ejemplo
ción de competencias mediante el reforzamien- paradigmático, desde luego, es la forma como
to de conductas observadas, en lugar de tratar de se adquiere el lenguaje gracias a un proceso de
explicar los procesos mentales básicos. En cam- práctica mediada socialmente (Bruner, 1985).
bio, de acuerdo con la teoría cognitiva, quienes En la teoría sociocultural es fundamental com-
aprenden construyen el conocimiento conec- prender que los productos de la actividad (los
tando nueva información a estructuras previas resultados del aprendizaje) están integrados en
de conocimiento. Los esquemas mentales, en el las prácticas culturales del ambiente donde se
cerebro o la mente, sirven para organizar el co- desarrolla la actividad. De este modo, aprender
nocimiento para que cuando después se necesite a conocer es volverse un adepto que participa en
lo recuperemos y utilicemos en situaciones pro- las maneras de hablar, las representaciones del
blemáticas; y los procesos ejecutivos, llamados conocimiento y el uso de herramientas asocia-
metacognición, permitan monitorear y manejar das con una comunidad de práctica específica.
su propia comprensión y aprendizaje a quienes En otro lado he propuesto una concepción
aprenden. Los cognitivistas hacen hincapié en la del aprendizaje social-constructivista4, que reúne
comprensión conceptual y han demostrado que las teorías cognitiva y sociocultural (Shepard,
la transferencia, esto es el uso del conocimien- 2000). Si bien hay muchos puntos discutibles
to en situaciones nuevas, se hace posible por la no resueltos entre estas dos perspectivas y en
aprehensión de principios generalizados y el uso el interior de ellas, las considero compatibles.
de esquemas gracias a los cuales se reconocen Vygotsky (1978, p. 57) sostenía que “todas las fun-
las similitudes en los distintos tipos de proble- ciones en el desarrollo cultural del niño aparecen
mas. La perspectiva cognitiva predomina en el dos veces: primero, en el nivel social, y luego en
trabajo teórico y empírico presentado en dos el nivel individual; primero entre la gente (interp-
publicaciones significativas del National Research sicológica), y luego dentro del niño (intrapsicológi-
Council, How People Learn (Bransford, Brown, y ca).” Siguiendo la dirección de Vygotsky, pues,
Cocking, 1999) y Knowing What Students Know, podemos usar la investigación sociocultural para
si bien ambas reconocen la influencia del con- entender los procesos sociales que respaldan y
texto social y la aplicabilidad de las perspectivas definen el aprendizaje, y la teoría cognitiva, con
socioculturales o situacionales. el fin de entender los procesos mentales subse-
Un modelo sociocultural del aprendizaje cuentes y recurrentes del individuo. Obsérvese,
surge de un renovado interés en el trabajo de sin embargo, que incluso el razonamiento y las
Vygotsky (1978) y otros psicólogos rusos. Se ocu- reflexiones de una persona aparentemente pri-
pan de la naturaleza social del aprendizaje y en
4
En este capítulo no defino ni uso el término social-constructi-
la idea de que la competencia y la identidad de vismo como la conjunción de las teorías cognitiva y sociocultural,
quienes aprenden se desarrollan por medio de porque algunos autores utilizan el social-constructivismo en forma
una participación mediada socialmente, en una más estrecha para referirse solamente a una variante de la teoría
cognitiva.

18
La evaluación en el aula

vadas, están integradas socialmente, porque el dad del estudiante para defender un argumento?
individuo lleva consigo las formas de razonar, las Luego, la fase de evaluación debe ocurrir durante
expectativas, los criterios, etcétera. de su mun- el proceso de aprendizaje, mientras el estudiante
do social. Más recientemente, en mi trabajo me trabaja en tareas que ejemplifican directamente el
he concentrado en la teoría sociocultural porque objetivo del aprendizaje que se propone alcanzar.
creo que es la teoría más completa. Esta evaluación, que se hace en medio del apren-
dizaje, podría ocurrir por medio de preguntas al
2.2 Un modelo de la evaluación estudiante durante el trabajo grupal, cuando un/
formativa una estudiante explica a la clase cómo resolvió un
problema, o al examinar un trabajo escrito. Final-
Sadler (1989) aportó el modelo más aceptado de mente, en la tercera etapa, para que la evaluación
la evaluación formativa. Este autor indicó que formativa sea de verdadera ayuda para el aprendi-
es insuficiente que los maestros simplemente zaje, debe darse una retroalimentación que pro-
den una retroalimentación respecto de si las res- porcione entendimiento acerca de cómo llenar
puestas son correctas o incorrectas. En vez de una carencia. Por ejemplo, cuando un estudian-
ello, para facilitar el aprendizaje, es igualmente te tiene aún confusión respecto de un concepto
importante que la retroalimentación esté vin- fundamental, ¿existe un método diferente para
culada explícitamente a criterios claros de des- abordar el problema o un conocimiento esencial
empeño y que se proporcione a los estudiantes al que haya que volver? Si el razonamiento en
estrategias de mejoramiento. Este modelo de un trabajo de composición está desarrollado en
evaluación formativa fue explicado más amplia- forma deficiente, ¿cómo puede corregirlo el es-
mente en un reporte reciente de Atkin, Black, tudiante después de tomar primero en conside-
y Coffey (2001) sobre evaluación en ciencias en ración lo que falta en relación con los criterios de
el aula. Estos autores construyen el proceso de evaluación?
evaluación del aprendizaje con estas preguntas Este modelo de evaluación formativa es más
clave: que una etapa de recolección de de datos. Es
un modelo para el aprendizaje que corresponde
• ¿Adónde tratas de ir? directamente a la Zona de Desarrollo Próximo
• ¿Dónde estás ahora? (ZDP) y a la teoría sociocultural del aprendizaje.
• ¿Cómo puedes llegar ahí? Tal como lo visualizó Vygotsky (1978), la Zona
de Desarrollo Próximo es la región, en un conti-
Al responder la pregunta de evaluación (la No. nuo imaginario de aprendizaje, entre lo que un
2, ¿dónde estás ahora?) en relación con el obje- niño puede hacer de manera independiente y lo
tivo de la enseñanza (pregunta No. 1) y dedicán- que ese mismo niño puede hacer si lo ayudan.
dose específicamente a lo que se necesita para Wood, Bruner y Ross (1976) desarrollaron ade-
alcanzar el objetivo (pregunta No.3), el proceso más la idea del andamiaje5 para caracterizar el
de evaluación formativa respalda directamente apoyo, bajo la modalidad de guía, indicaciones
el mejoramiento. y estímulo, que los adultos proporcionan en la
Establecer objetivos claros para el aprendizaje ZDP con objeto de capacitar a quien aprende
por parte del estudiante implica mucho más que a desempeñar a un nivel de logro algo que de
anunciar una finalidad de la enseñanza para que otro modo no habría sido capaz de alcanzar. La
los estudiantes la contemplen. También requiere etapa de evaluación en el modelo de evaluación
la elaboración de los criterios mediante los cua- formativa (¿dónde estás ahora?) proporciona la
les será juzgado el trabajo del estudiante. ¿Cómo
sabrán el maestro y el estudiante que se ha enten- 5
Scaffolding en inglés. Se refiere a la técnica mediante la cual el
dido un concepto? ¿Cómo se evaluará la capaci- maestro modela la tarea o la estrategia deseada del aprendizaje, y
luego traslada gradualmente la responsabilidad a los estudiantes.

19
Textos de evaluación

comprensión que se necesita para un respaldo Yackel (1993) hablan de análisis de toda una cla-
eficaz. Y el modelo formativo completo, que se donde hay andamiaje y donde los estudiantes
comprende el esclarecimiento del objetivo y son capaces no sólo de esclarecer su compren-
la identificación de los medios para llegar ahí, sión de conceptos matemáticos, sino también
puede verse esencialmente como un sinónimo de practicar las normas y formas sociales de ha-
del andamiaje de la enseñanza. En realidad, la blar en esa disciplina. De igual manera, en clases
versión plenamente elaborada de Sadler de la de investigación en Ciencias (Hogan y Pressley,
evaluación formativa requiere que los maestros 1997), los estudiantes aprenden a dar evidencias
y los estudiantes tengan una comprensión y una que sustenten una posición y también a criticar
apropiación compartidas del objetivo de apren- las conclusiones sin fundamento de sus com-
dizaje y, por último, que los estudiantes sean pañeros de clase: una forma valiosa de retroali-
capaces de supervisar su propio mejoramiento. mentación. Semejantes despliegues públicos en
Esto corresponde al objetivo del andamiaje: fo- que se desarrolla el pensamiento crean, asimis-
mentar que quien aprende interiorice este pro- mo, la oportunidad perfecta para la evaluación
ceso y asuma su responsabilidad. formativa.
En el mundo real, los maestros rara vez tienen Idealmente, pues, la evaluación formati-
tiempo para dar sesiones de tutoría individuales va debe quedar perfectamente integrada en la
o de hacer evaluaciones dinámicas que les per- enseñanza. En los párrafos que siguen me ex-
mitieran dedicarse a impartir una enseñanza con playo sobre los elementos específicos del pro-
andamiaje a un estudiante durante un ciclo com- ceso de evaluación formativa, los cuales tienen
pleto de aprendizaje. Y, con seguridad, planear un extenso fundamento de investigación. Co-
la enseñanza para un salón de clases completo mienzo ocupándome del contenido porque la
lleno de estudiantes cuya ZDP es muy variada, evaluación carece de significado si no abarca
es un verdadero reto. No obstante, pueden es- las cosas que más queremos que aprendan los
tablecerse rutinas del aula para garantizar que estudiantes. En seguida considero los avances
los elementos básicos de la evaluación formativa de los estudiantes porque, dentro de los conte-
y del andamiaje estén establecidas y funcionan- nidos de las materias, los maestros deben tener
do en la forma de interacciones de enseñanza también una idea de las progresiones típicas
ordinarias. Por ejemplo, hablar con estudiantes de aprendizaje, con el fin de que sepan en qué
en forma individual es una parte normal de la dirección ayudan a los estudiantes, y también
enseñanza de la escritura, junto con la correc- cómo respaldarlos cuando la comprensión fa-
ción editorial por los compañeros o el ejercicio lla. Más tarde tomo en cuenta aspectos espe-
de la silla del autor, que es una práctica en la que cíficos de las interacciones entre evaluación y
un estudiante comparte algo que ha escrito con enseñanza, cómo tener acceso al conocimien-
toda la clase. Otra estrategia es desarrollar las to previo, cómo hacer explícitos los criterios,
capacidades de los estudiantes para proporcio- proporcionar retroalimentación, etcétera. No
narse retroalimentación unos a otros. Una de las obstante, no hace falta que ninguno de estos
razones por las que el discurso sobre el aula ha procesos interrumpa la enseñanza, sino que
recibido tanta atención en la investigación sobre más bien deben retroalimentar un aprendizaje
la reforma en la enseñanza, es que las pautas de continuo. Aun si uno toma tiempo para un exa-
interacción grupal, especialmente las preguntas men formal, los resultados pueden utilizarse
de los estudiantes y la forma en que explican su para un diagnóstico de la enseñanza con el fin
razonamiento, pueden proveer de andamiaje al de decidir qué conceptos necesitan más análi-
aprendizaje del estudiante, sin que sea necesa- sis y trabajo. Y los estudiantes pueden llegar a
rio que el docente invierta tiempo para atender entender que tales evaluaciones tienen una fi-
a los estudiantes uno por uno. Cobb, Wood, y nalidad de aprendizaje.

20
La evaluación en el aula

2.3. La importancia del contenido: selección allá del dominio de las habilidades y los concep-
de las tareas de enseñanza y de evaluación tos básicos. No es de sorprender que la refor-
que encarnan objetivos de aprendizaje ma de la evaluación fuera una parte igualmente
importante de los movimientos de estándares,
La evaluación no puede impulsar el aprendizaje por la necesidad de alcanzar estos objetivos más
si se basa en tareas o preguntas que distraen la ambiciosos. El término alineación se ha utiliza-
atención de los verdaderos objetivos de la ense- do para especificar la correspondencia deseada
ñanza. Históricamente, las pruebas tradiciona- entre evaluaciones y estándares curriculares.
les a menudo dirigían erradamente la enseñanza Desafortunadamente, el significado de alinea-
cuando se centraban en lo que era más fácil de ción se desvaloriza un tanto cuando los editores
medir en vez de centrarse en lo que era impor- de pruebas muestran que todos su reactivos de
tante aprender. La enseñanza en clase debe ocu- selección múltiple pueden hacerse corresponder
par a los estudiantes en actividades de aprendi- con las categorías de los estándares de conteni-
zaje, las cuales sean lo más directamente posible do de un estado, aun cuando en conjunto sólo
ejemplos de los objetivos reales del aprendizaje. utilizan un estrecho subconjunto de los están-
Si queremos que los estudiantes sean capaces de dares deseados. Anteriormente, he propuesto
leer libros, periódicos y poemas, ellos deben en el término encarnar como una forma de carac-
realidad hacer eso, por lo que no hay que dar- terizar mejor la alineación más completa y real
les materiales abreviados y simulados, excepto que ocurre cuando las tareas, los problemas y los
cuando queramos adaptarlos a su edad. De igual proyectos en los que están ocupados los estu-
modo, en Ciencias, si queremos que los estu- diantes representan toda la gama y profundidad
diantes sean capaces de razonar y usar el cono- de lo que decimos que queremos entiendan y
cimiento científico, entonces debemos darles la tengan capacidad de hacer (Shepard, 2003).
oportunidad de explicarse cómo funcionan las Tal como lo ilustraron Wiggins y McTighe
cosas, realizando investigaciones y elaborando (1998), la elaboración de evaluaciones que mani-
explicaciones con sus propias palabras, para que fiesten objetivos de aprendizaje es esencial para
así conecten sus experiencias con las teorías del una buena enseñanza, y no sólo una cuestión de
libro de texto. La evaluación, entonces, debe medir resultados. En vez de un planeamiento de
realizarse como parte de estas actividades de la enseñanza que se concentre en actividades in-
aprendizaje significativo. Si los estudiantes rea- teresantes, Wiggins y McTighe utilizan un pro-
lizan un proyecto de investigación en Historia ceso de planificación hacia atrás, que empieza con
o muestran a la clase cómo resolvieron un pro- los objetivos de la enseñanza, luego se cuestiona
blema de Matemáticas, entonces la tarea de la ¿cuál será una evidencia convincente o una de-
enseñanza es la labor de la evaluación. mostración de que hubo aprendizaje? y al final
Un rasgo definitorio de las reformas basadas planea actividades que permitirían desarrollar
en estándares ha sido el desarrollo de normas en los estudiantes esa comprensión. Con esta
curriculares que sirven para revigorizar y realzar última como objetivo de la enseñanza, subrayar
qué significa saber y demostrar aprovechamien- la evaluación fuerza a los maestros a explicar en
to en cada disciplina. Por ejemplo, el Curriculum forma muy clara y sin lugar a dudas qué aspecto
and Evaluation Standards for School Mathematics tendría la evidencia de la comprensión, y estas
del NCTM (1989)6 plantea expectativas, hace descripciones del desempeño los mueven a brin-
hincapié en la solución de problemas, la comu- dar oportunidades a los estudiantes para que
nicación, el razonamiento matemático y el esta- desarrollen y practiquen estas habilidades que
blecimiento de conexiones que van mucho más de otro modo podrían haberse perdido si la com-
prensión se hubiese dejado sólo como un objetivo
6
Siglas en inglés del National Council of Teachers of Mathematics, declarado para toda la unidad. Por ejemplo, un
Consejo Nacional de Maestros de Matemáticas. [N. T.]

21
Textos de evaluación

maestro encontraría pruebas de comprensión English Literacy Survey, el cual ejemplifica una
por parte de los estudiantes si éstos pudieran progresión en el aprendizaje, fue diseñado para
explicar su razonamiento o aplicar su conoci- reunir datos básicos sobre la realización y los lo-
miento en un contexto nuevo. Y cada una de gros de estudiantes del tercer y quinto grados en
estas facetas puede desarrollarse aún más para el curso de Lengua, incluyendo Habilidades de
dejar en claro qué es lo que los estudiantes se- lectura, Revisión visual, Audición y Expresión
rían capaces de hacer. Por ejemplo, el criterio de oral y escrita (Masters y Forster, 1997). El pro-
Wiggins y McTighe (1998) para una explicación greso de un estudiante en conseguir el control
que demuestre comprensión incluye dar razones de estructuras y convenciones del lenguaje pue-
creíbles, proporcionar una explicación sistemá- de diagramarse o comunicarse en este continuum,
tica, o utilizar modelos mentales útiles. Si bien el cual proporciona una imagen del crecimiento
es cierto que ser capaz de explicar un concepto individual en contraposición con un telón de
exige mucho más que conocerlo, conocer y ex- fondo de expectativas establecidas normativa-
plicar guardan una estrecha relación entre sí, y mente. A diferencia de los informes de evalua-
el razonamiento y pensamiento que además se ción, que se ven más bien como una lista de ve-
requieren para producir una explicación creíble rificación de objetivos de los diferentes grados,
son exactamente el tipo de esfuerzo mental que los mapas de progreso tienen implicaciones más
hace falta para desarrollar una comprensión más directas para la enseñanza, porque brindan si-
flexible y más profunda. multáneamente una imagen de las fortalezas y
debilidades y una manera de mirar hacia lo que
2.4. Progresiones del aprendizaje viene para cada una de las facetas del campo de
que se trate. Por ejemplo, un estudiante de se-
Las progresiones del aprendizaje o los continuos gundo grado puede estar muy avanzado en el uso
del aprendizaje son importantes para monitorear de la puntuación (mayúsculas y puntos) y dele-
y respaldar el desarrollo a lo largo del tiempo. A trear palabras comunes correctamente (Nivel 3),
diferencia de los estándares, que han recibido pero tal vez necesite ayuda para experimentar e
una gran atención durante la última década, se ir más allá de estructuras repetitivas de oracio-
ha desarrollado relativamente poco y ha habi- nes (Nivel 2).
do mucha menos investigación para explicar las En Australia, los sistemas de evaluación son
progresiones en el aprendizaje. Desde luego que coherentes con las evaluaciones en el aula y en
la mayoría de los maestros tienen cierto senti- gran escala están relativamente bien desarrolla-
do intuitivo de qué sigue, o no serían capaces de dos y vinculados a un mismo mapa de progreso
ayudar a los estudiantes a desempeñarse mejor. (Forster y Masters, 2004). Algo parecido sucede
Sin embargo, incluso los maestros más capaci- en los Países Bajos, donde se elaboran trayecto-
tados podrían sacar provecho de modelos con rias aprendizaje-enseñanza para proporcionar los
mayor desarrollo formal sobre cómo se desplie- conocimientos pedagógicos necesarios para
ga el aprendizaje en un ámbito curricular, y se respaldar el desarrollo del pensamiento del es-
beneficiarían también si conocieran las variacio- tudiante a lo largo del tiempo (Van der Heuvel-
nes y desviaciones naturales del patrón típico. Si Panhuizen, 2001). En Estados Unidos, en cam-
bien las progresiones empíricamente validadas bio, el desarrollo de progresiones de aprendizaje
pueden hacer posible un andamiaje más com- útiles para la enseñanza se ha visto limitado por
prensivo de la enseñanza, las progresiones jamás la forma transversal y a retazos, que con el tiem-
deben interpretarse como algo cerrado o como po han propiciado los sistemas de evaluación en
una secuencia absoluta de requisitos. gran escala. Las evaluaciones estatales y nacio-
El mapa de progreso en escritura que aparece nales, que originalmente se propusieron moni-
en la Figura 17.1, del Australia’s National School torear tendencias en momentos particulares,

22
La evaluación en el aula

centraron la atención en las expectativas del ni- FIGURA 17.1 Mapa de progreso en escritura
vel a alcanzar en ciertos grados fundamentales fundamentado empíricamente
(cuarto año de primaria, segundo de secundaria Revisa escritura para que sea consistente en conte-
nido y estilo.
y tercero de preparatoria). En años más recien- Hace pruebas con distintos reordenamientos de ora-
tes, los estados, que ahora piden más requisitos ciones.
Controla estructuras gramaticales y puntuación en

Nivel 5
para las pruebas individuales, completan los gra- oraciones complejas.
Organiza la escritura en un todo coherente apropiado
dos intermedios e intercalan las expectativas cu- 600 al contexto (por ejemplo: párrafos para textos narrati-
rriculares. No obstante, estas expectativas, es- vos y subtítulos para textos informativos).
Utiliza vocabulario preciso y eficaz.
pecialmente en momentos en que los estándares Se acerca a la ortografía de palabras particularmente
difíciles utilizando modelos y convenciones.
de nivel internacional se han establecido en currí-
culos que nunca se habían implementado antes,
Empieza a adoptar convenciones de formato estruc-
no necesariamente reflejan la trayectoria del de-

Nivel 4
turado para organizar su trabajo (por ejemplo: una ex-
posición introductoria general a un informe).
sarrollo de estudiantes reales. Al mismo tiempo, Maneja una diversidad de formas de oraciones (por
existe el peligro de que depender de promedios 500 ejemplo: oraciones sencillas y complejas).
Utiliza puntuación apropiada la mayor parte del tiempo.
normativos para establecer progresiones, con- Da cuerpo a su escritura con un inicio y un final cla-
gelará las expectativas curriculares pasadas de ros, y posiblemente divide los párrafos.
Utiliza vocabulario apropiado la mayor parte del
moda o establecerá expectativas demasiado ba-
Realización y logros en escritura
tiempo.
Escribe correctamente la mayor parte de las pala-
jas –porque promedian los resultados de una en- bras.
señanza fallida. Por ejemplo, con base en datos
empíricos, la Keymath Diagnostic Arithmetic Test Muestra algunas evidencias de cierta planeación, revi-

Nivel 3
sión y corrección de su propia escritura.
(Connolly, Nachtman, y Pritchett, 1972) utiliza 400 Controla la estructura de oraciones sencillas e intenta
reactivos en la forma de 4 1/2 x 5 como ejemplo utilizar estructuras más complejas.
Intenta variar inicios de oración.
de la Aritmética que, se espera, deben dominar Intenta dar forma a su escrito en lo referente a la es-
tructura (por ejemplo: idea del principio y el fin).
los estudiantes en el grado equivalente al tercero Escribe correctamente muchas de las palabras comu-
de secundaria. nes.
Escribe legiblemente.
Lo que hace falta es un proceso para crear
continuos de aprendizaje que estén basados no 300
sólo en la investigación, sino en un juicio ex-

Nivel 2
perto que incluya la validación de los continuos Usa oraciones sencillas.
Usa una estructura repetitiva de oración.
propuestos en el contexto de un currículo bien Utiliza conjunciones sencillas (por ejemplo, “y”
implementado. Hasta la fecha, algunas de las in- “pero”).
Controla la puntuación común a menudo o todo el
vestigaciones más fundamentadas y más perti- 200 tiempo (por ejemplo, mayúsculas y puntos).
Escribe correctamente casi todo el tiempo palabras
nentes respecto de la enseñanza, se han hecho muy frecuentes.
en las áreas del alfabetismo emergente y de la Escribe de un modo que otros pueden por lo general
entender.
habilidad con los números también emergen-
te, las cuales pueden servir como modelo. Por 100 Utiliza algunas convenciones básicas (por ejemplo,
Nivel 1

ejemplo, en la ortografía prefonémica, los niños escribe de izquierda a derecha y pone espacios entre
las palabras).
escriben primero letras que representan pala- Maneja algunas palabras conocidas, o palabras repre-
sentadas por sus letras iniciales.
bras sin relacionar los sonidos de las letras con Utiliza algunas letras iniciales correctas y otros sonidos.
la palabra deseada. Después dan un paso en su El niño puede volver a leer lo que ha escrito mientras
lo está escribiendo
desarrollo cuando empiezan a escribir letras que
tienen correspondencia con los fonemas más
prominentes en una palabra, y así sucesivamente
Fuente: De Masters, G. y Forster, M. (1997), Mapping Litera-
(Hiebert y Raphael, 1998). De modo parecido, cy Achievement: Results of the 1996 National School English Lit-
las estrategias naturales de los niños para sumar eracy Survey, Canberra, Australia, Department of Employ-
ment, Education, Training and Youth Affairs (DEETYA).
se desarrollan con el tiempo, desde que empie- Reproducido con permiso.

23
Textos de evaluación

zan a contar hasta que usan números (Carpenter 1988) y las técnicas K-W-L7 (Ogle, 1986)− no son
y Moser, 1984), y la investigación sobre la ense- consideradas como evaluaciones como tales ni
ñanza ha demostrado que los maestros se vuel- por maestros ni por estudiantes. Sin embargo,
ven más eficaces cuando se les hace tomar con- sí aportan datos valiosos para corregir la ense-
ciencia de estas estrategias típicas de solución ñanza, como cuando los maestros encuentran
de problemas (Fennema y Franke, 1992). lagunas en un conocimiento que suponen ya asi-
milado o cuando descubren que los estudiantes
2.5. Evaluación del conocimiento previo saben mucho más sobre un tema de lo previsto.
Dada la evidencia obtenida, gracias a la inves-
El conocimiento previo es esencial para el tigación, sobre la necesidad de combatir con-
aprendizaje. De hecho, el proceso del apren- ceptos erróneos cuando se presenten, el reco-
dizaje puede concebirse como lo que hacemos nocimiento explícito de los conceptos erróneos
para conectar e integrar una nueva comprensión evaluados como la razón para las actividades
con el conocimiento existente. El conocimiento posteriores de enseñanza podría ser una manera
previo incluye el aprendizaje formal, como el de de elevar la conciencia de los estudiantes de que
un preescolar que aprende la norma de no cru- la evaluación está al servicio de la finalidad del
zar la calle sin mirar hacia los dos lados, pero aprendizaje.
también incluye una multitud de explicaciones El conocimiento previo es más que un con-
implícitas, las cuales nos enseñamos a nosotros junto de hechos que un estudiante ha acumula-
mismos, sobre cómo funciona el mundo. Estas do en su casa y en grados anteriores. El cono-
intuiciones o teorías que nos enseñamos a noso- cimiento previo también incluye patrones de
tros mismos pueden en ocasiones facilitar nue- lenguaje y formas de pensar que los estudiantes
vo aprendizaje, como cuando las explicaciones desarrollan por medio de sus roles sociales y sus
científicas se dominan fácilmente porque tienen experiencias culturales. Los maestros pueden a
sentido y armonizan con nuestra experiencia pre- veces interpretar mal las diferencias en las prác-
via. Las teorías intuitivas también pueden ser el ticas culturales y considerarlas como evidencia
origen de conceptos erróneos importantes que de un déficit. Por ejemplo, los niños blancos de
obstaculizan el aprendizaje nuevo y son relati- clase media están más acostumbrados a que les
vamente impenetrables al cambio que busca la hagan preguntas descontextualizadas, como ¿qué
enseñanza, a menos que los estudiantes reciban color es éste?, que los niños de otros grupos socia-
una forma estructurada de trabajo que les per- les (Heath, 1983). Las reglas implícitas de inte-
mita resolver las inconsistencias entre sus intui- racción pueden hacer que a los maestros se les
ciones y otras evidencias. dificulte advertir las fortalezas de los estudian-
Las estrategias eficaces de enseñanza se ba- tes fuera de su propio grupo social, a menos que
san en el conocimiento previo de los estudiantes dispongan de medios para sacar esas fortalezas
como recurso. Por otra parte, al usarse rutinas de una manera que tenga sentido culturalmen-
de activación del conocimiento al principio te. Por ejemplo, Moll, Amanti, Neff y González
de nuevas lecciones y unidades de estudio, los (1992) utilizan el concepto fondos de conocimiento
maestros ayudan a los estudiantes a desarrollar
el hábito de preguntarse (cuando se enfrentan 7
Instructional conversations son charlas en las que se exploran ideas
a un nuevo aprendizaje o a una tarea en la que más que respuestas a preguntas de exámenes que se evaluarán.
Técnicas KWL:
tengan que resolver un problema) de lo que ya sé, K Representa la ayuda que se da a los estudiantes para que recuer-
¿qué puede ayudarme a resolver esto? Muchas acti- den lo que Saben [know, en inglés] sobre la materia.
W – Representa la ayuda que se da a los estudiantes para que de-
vidades de conocimiento previo −como las con- terminen lo que Quieren [want, en inglés] aprender.
versaciones instruccionales (Tharp y Gallimore, L - Representa la ayuda que se da a los estudiantes para que identi-
fiquen lo que Aprenden [learn, en inglés] al leer. [N. T.]

24
La evaluación en el aula

para referirse al conocimiento que reciben en la retroalimentación facilita el aprendizaje. Sin


casa los niños de familias pobres, y que se basa retroalimentación —sobre errores conceptua-
en la agricultura, la carpintería, la medicina, la les o retrocesos ineficaces— es probable que
religión, el cuidado infantil y las actividades re- el que aprende persista en cometer los mismos
lacionadas con el manejo del presupuesto, que errores. En un extenso meta-análisis de 131 es-
pueden usarse para reforzar el conocimiento es- tudios controlados, Kluger y DeNisi (1996) die-
colar. ron a conocer un tamaño de efecto [effect size] o
ganancia de 0.4 gracias a la retroalimentación.
2.6. Criterios explícitos y el uso de guías También reconocieron una variación significati-
de calificación (rúbricas) va en el estudio con aproximadamente un tercio
de los estudios que mostraron efectos negativos.
El modelo de evaluación formativa requiere que Al intentar identificar las características de re-
el maestro y el estudiante tengan una compren- troalimentación más asociadas con los efectos
sión compartida de los objetivos del aprendizaje. positivos, Kluger y DeNisi descubrieron que es
En la teoría cognitiva, las metas deben definirse más probable estimular el aprendizaje cuando la
explícitamente y ser visibles para los estudian- retroalimentación se enfoca en ciertos aspectos
tes. En la teoría sociocultural, una comprensión de la tarea y destaca los objetivos de aprendizaje.
del objetivo se construye conjuntamente mien- Este importante hallazgo proveniente de la lite-
tras el estudiante recibe ayuda para mejorar su ratura sobre la retroalimentación, es consisten-
desempeño. Cuando los maestros ayudan a los te con mi argumento anterior para las guías de
estudiantes a entender e internalizar los están- calificación [rubrics], las cuales permiten juzgar
dares de excelencia de una disciplina —es decir, el desempeño en relación con criterios bien de-
aquello que hace que un trabajo de historia o finidos (en vez de juzgar a un estudiante compa-
una explicación matemática sean buenos— les rándolo con otros), y se armoniza con los descu-
ayudan a desarrollar la conciencia metacognitiva brimientos de la literatura sobre motivaciones
de aquello a lo que necesitan prestar atención que analizaré posteriormente en el contexto de
mientras escriben o resuelven un problema. las prácticas de calificación.
Ciertamente, aprender las normas y formas de De acuerdo con evidencias de la investiga-
una disciplina es parte del aprendizaje de ésta, y ción, es un error hacer elogios falsos, tratan-
no sólo un medio para sistematizar o justificar la do de motivar a los estudiantes y aumentar su
calificación. Por otra parte, no es probable que autoestima. Al mismo tiempo, la retroalimen-
los estudiantes lleguen a entender qué significan tación negativa directa, sin consideraciones,
los estándares de excelencia simplemente por- puede minar el aprendizaje y la disposición del
que el maestro coloque en la pared las guías de estudiante a esforzarse más. Por consiguiente,
calificación [scoring rubrics], aunque éstas pueden una comprensión de las consecuencias motiva-
ser un punto de referencia útil. Más bien, los es- cionales de la retroalimentación es tan impor-
tudiantes desarrollan la comprensión de las ex- tante como conocer sus propósitos cognitivos.
pectativas por medio de la retroalimentación y El modelo de evaluación formativa, consistente
de las autoevaluaciones, gracias a las cuales los con la literatura cognitiva, demuestra que la re-
criterios se vinculan directamente a sus propios troalimentación es especialmente eficaz cuando
esfuerzos de aprendizaje. dirige su atención a cualidades particulares del
trabajo del estudiante en relación con criterios
2.7. Retroalimentación establecidos y proporciona una guía sobre qué
hacer para mejorar. Además, los maestros deben
Uno de los hallazgos más antiguos de la inves- establecer un clima de confianza y desarrollar
tigación psicológica (Thorndike, 1931) es que normas en clase que posibiliten la crítica cons-

25
Textos de evaluación

tructiva. Esto significa estratégicamente que la de reagrupar (o pedir prestado) de memoria en


retroalimentación debe ocurrir durante el pro- aritmética de segundo grado a las soluciones a
ceso de aprendizaje (y no al final, cuando ya se problemas del tipo inserta y a ver si pega en los
terminó el aprendizaje de ese tema); maestro y cursos de física en la universidad8. En cambio,
alumnos deben tener una comprensión compar- la investigación sobre expertos y novatos y los
tida de que la finalidad de la retroalimentación estudios de transferencia nos demuestran que es
es facilitar el aprendizaje; y puede significar que más probable que haya transferencia cuando el
la calificación debe quedar en suspenso durante aprendizaje inicial se centra en la comprensión
la etapa formativa. de principios fundamentales, cuando se consi-
Para que haya una retroalimentación eficaz, deran explícitamente las relaciones de causa y
es necesario que los maestros sean capaces de efecto y sus razones, y cuando los principios de
analizar el trabajo del estudiante e identificar aplicación están presentes en forma directa.
los patrones de errores y las lagunas que más Dar clases para que haya transferencia re-
atención requieren (no cualquier error posible). quiere que la enseñanza inicial se centre en la
En un estudio de intervención, Elawar y Corno comprensión. También significa trabajar osten-
(1985) descubrieron que los maestros mejoraban siblemente para ampliar la comprensión de los
extraordinariamente la eficacia de la retroali- estudiantes. Por ejemplo, debe ser algo común
mentación cuando se concentraban en estas —tan pronto como se vea que los estudiantes
preguntas: “¿Cuál es el error principal? ¿Cuál es han dominado un nuevo tipo de problema o una
la razón probable de que el estudiante cometie- manera de resolver un problema— que los maes-
ra este error? ¿Cómo puedo guiar al estudiante tros hagan una nueva pregunta relacionada con
para que evite el error en un futuro?” (p. 166). ese conocimiento pero lo amplíe. El problema
Los maestros también deben entender la teo- inicial y las aplicaciones de seguimiento en la
ría de cómo la retroalimentación incrementa el Figura 17.2 provienen de Connected Mathematics
aprendizaje para que ellos puedan desarrollar ru- (Lappan, Fey, Fitzgerald, Friel y Phillips, 1998).
tinas en el aula que comprueben la comprensión Éstas son tareas ejemplares en varios sentidos.
de los estudiantes y aseguren que no los dejan En primer lugar, ilustran que las buenas tareas
solos para que persistan en los malos hábitos o de evaluación pueden ser intercambiables con
los conceptos erróneos. las buenas tareas de enseñanza. Segundo, la in-
vestigación completa de la que se han extraído
2.8. Enseñar y evaluar para que haya estos problemas ayuda claramente a desarrollar
transferencia un entendimiento del principio fundamental de
equivalencia, al pedir a los estudiantes que esta-
La transferencia se refiere a la capacidad de utili- blezcan relaciones entre representaciones tabu-
zar nuestro conocimiento en contextos nuevos. lares, gráficas y algebraicas. Tercero, los proble-
La transferencia es obviamente una meta del mas de aplicación pueden pensarse como tareas
aprendizaje. ¿De qué sirve el conocimiento si no de cuasi-transferencia que pueden utilizarse
podemos acceder a él o no podemos aplicarlo?
Sin embargo, los estudios de la capacidad de los 8
Plug and chug es la expresión original en inglés: En los cursos
introductorios de física en la universidad, los estudiantes empie-
estudiantes para utilizar información pertinente zan a resolver un problema recurriendo a la solución algebraica y
incluso de una lección reciente en la que hubo numérica, es decir buscan ecuaciones y las manipulan, insertan-
do números en las ecuaciones hasta encontrar una combinación
aciertos son notoriamente decepcionantes. La que produzca una respuesta. Rara vez utilizan su conocimiento
transferencia se ve inhibida cuando los estu- conceptual de física para analizar cualitativamente la situación
del problema, ni tampoco planean sistemáticamente una solución
diantes aprenden de memoria y se someten a antes de que empiecen con sus manipulaciones numéricas y alge-
rutinas mecánicas para resolver problemas sin braicas de las ecuaciones. Cuando llegan a una respuesta, general-
pensar. Los ejemplos son numerosos, y van des- mente se muestran satisfechos y rara vez verifican si la respuesta
tiene sentido. [N. T.]

26
La evaluación en el aula

para estar seguros de que los estudiantes pueden auto-supervisión del desempeño, que es la fina-
generalizar lo que han aprendido en la investi- lidad del andamiaje de la enseñanza así como el
gación. Sin embargo, los estudiantes tendrán objetivo del modelo de evaluación formativa de
que pensar un poco sobre las características úni- Sadler (1989). El proceso de auto-evaluación se
cas de la nueva tarea. No pueden simplemente basa en las ventajas metacognitivas de los cri-
aplicar la regla del Problema 1 de memoria a las terios explícitos, pues se pide a los estudiantes
Aplicaciones 1 y 2. que piensen y apliquen criterios en el contexto
Una de las razones por la cual los expertos de su propio trabajo. Al hacerlo así, los estudian-
tienen mejores habilidades de transferencia que tes se explican y llegan a entender qué significan
los novatos, es porque son capaces de recono- los criterios de un modo más profundo que si
cer peculiaridades de los problemas que son las sólo leyeran una lista de ellos. En términos más
mismas y diferentes a las de problemas resueltos generales, este tipo de práctica asistida de me-
con anterioridad. Por consiguiente, es importan- tacognición —es decir, la práctica en la cual los
te que los estudiantes aprendan a pensar espe- estudiantes aprenden estrategias para supervisar
cíficamente sobre cómo pueden utilizar lo que su propio aprendizaje— ayuda a desarrollar las
ya saben. En este sentido, enseñar para manejar capacidades metacognitivas de los estudiantes.
estrategias de transferencia, especialmente de Al mismo tiempo, la auto-crítica puede incre-
transferencia lejana, también tiene correspon- mentar la responsabilidad del estudiante ante su
dencia con las técnicas de conocimiento previo. propio aprendizaje y hacer que la relación entre
el maestro y él sea de más colaboración. Esto no
2.9. Auto-evaluación del estudiante significa que los maestros renuncien a su res-
ponsabilidad, sino que al compartirla, consiguen
Hacer que los estudiantes se ocupen en criticar que el estudiante tenga mayor posesión, menos
su propio trabajo es útil tanto desde el punto desconfianza y más reconocimiento de que las
de vista cognitivo como desde el motivacional. expectativas no son caprichosas ni que están
En esencia el hábito de auto-evaluarse lleva a la fuera de su alcance.

FIGURA 17.2 Una tarea inicial de evaluación y de enseñanza y tareas de aplicación


de transferencia cercana

Problema 1
En este problema, explorarás esta pregunta: Si una piscina cuadrada tiene lados de L pies de longitud, ¿cuántos azulejos se
necesitan para formar el borde?

1 pie

L 1 pie
azulejo del borde

L
A. Dibuja en un papel cuadriculado para que te formes una idea de cuántos azulejos se necesitan para los bordes de piscinas
cuadradas con lados de longitud 1, 2, 3, 4, 6 y 10 pies. Registra tus resultados en una tabla.
B. Escribe una ecuación para el número de azulejos (N) que hacen falta para formar un borde de una piscina cuadrada con lados
de longitud de (L) pies.
C. Trata de escribir por lo menos una ecuación más para la cantidad de azulejos que hacen falta para el borde de la piscina.
¿Cómo podrías convencer a alguien de que tus expresiones para la cantidad de azulejos son equivalentes?

27
Textos de evaluación

Aplicaciones
1 a. ¿Cuántos azulejos cuadrados de 1 pie se necesitan para formar el borde de una piscina que mide 10 pies de largo y 5 de ancho?
b. Anota una expresión para la cantidad de azulejos del borde que se necesitan para una piscina que mide L pies de largo y A pies
de ancho.

L
c. Anota una expresión diferente para la cantidad de azulejos que se necesitan. Explica por qué tus expresiones son equivalentes.

2 Una tina cuadrada tiene lados de longitud de L pies. Se crea un borde al colocar azulejos
cuadrados que miden 1 pie de cada lado a lo largo de los bordes de la tina y azulejos
triangulares en las esquinas. Los azulejos triangulares se hicieron cortando azulejos
cuadrados a la mitad

a. Si la tina tiene lados de una longitud de 7 pies, ¿Cuántos azulejos cuadrados


se necesitan para hacer el borde? L
b. Escribe dos ecuaciones para la cantidad de azulejos cuadrados (C )
que hacen falta para hacer este tipo de borde para una tina cuadrada con lados
de longitud de L pies.
L

Fuente: De Connected Mathematics, Say It with Symbols: Algebraic Reasoning © 1998 Universidad del Estado de Michigan, Glenda Lappan,
James T. Fey, William M. Fitzgerald, Susan N. Friel, y Elizabeth Difanis Phillips, publicado por Pearson Education Inc., publicado como
Pearson Prentice Hall. Se ha usado con permiso.

En estudios de caso de dos localidades aus- aprendieron a usar los criterios de la investiga-
tralianas e inglesas, Klenowski (1995) descu- ción científica para evaluar su propio trabajo.
brió que los estudiantes que participaron en Como parte del protocolo, los estudiantes del
una auto-evaluación se interesaron más en los grupo experimental tuvieron que escribir una
criterios y en la retroalimentación sustantiva exposición razonada cada vez que se auto-eva-
que en su calificación misma. Los estudiantes luaban, señalando los rasgos distintivos de su
también manifestaron que debían ser más ho- trabajo que respaldaban sus valoraciones. Ade-
nestos respecto de su propio trabajo, así como más, los estudiantes utilizaron los criterios para
también tendrían que ser honestos con otros dar retroalimentación a sus compañeros de cla-
estudiantes y estar preparados para defender se cuando se presentaron proyectos en clase en
sus opiniones tomando en cuenta la evidencia. forma oral. En comparación con el grupo con-
Los datos de Klenowski (1995) respaldan la ase- trol, los estudiantes que habían participado en
veración previa de Wiggins (1992) de que hacer la auto-evaluación presentaron proyectos que
que los estudiantes analicen su propio trabajo fueron valorados mucho más por sus maestros
hace que se apropien del proceso de evaluación (con base en los criterios compartidos). Por
y “hace posible llevar a los estudiantes a niveles otro lado, estudiantes que al inicio tenían rea-
más altos porque los criterios son claros y ra- lización y logros deficientes mostraron mejoras
zonables” (p. 30). En un estudio experimental notables en una medición de comprensión con-
de White y Frederiksen (2000), los estudiantes ceptual.

28
La evaluación en el aula

Como parte de las reformas curriculares, los tenerse y dedicar un tiempo al concepto erróneo
expertos en contenido de diversas materias han que subyace a éste. Mientras que la evaluación
desarrollado reformas en la evaluación para in- formativa se centra en qué puede hacer el estu-
tegrarlas mejor en la evaluación y la enseñanza. diante para mejorar, la evaluación paralela de la
Algunas de estas estrategias, en particular, sir- docencia pregunta si los estudiantes han tenido
ven para hacer que las autoevaluaciones y las una oportunidad adecuada para aprender.
evaluaciones por pares formen parte normal de Los maestros que reflexionan sobre su prác-
la enseñanza en el aula. Por ejemplo, la técnica tica utilizan datos en forma sistemática para
de la silla del autor es una práctica de enseñanza hacer juicios sobre los aspectos específicos de
de lectoescritura en la que los estudiantes apren- las estrategias docentes que quizá estén obsta-
den explícitamente las normas para escuchar y culizando el aprendizaje. Buscan explicaciones
dar retroalimentación a sus compañeros de clase del éxito o el fracaso en el aprendizaje, y se fijan
respecto de un escrito (Routman, 2000). Hablar especialmente en las decisiones de su enseñan-
con los estudiantes puede también ser un medio za que pudieran ser la causa. Por ejemplo, ¿hay
para ver si están desarrollando la capacidad de ciertas tareas que parecen hacer que los estu-
auto-evaluarse. Tanto el estudio de Klenowski diantes piensen mucho, porque son muy intere-
como el de White y Frederiksen, ya menciona- santes y dan lugar a múltiples soluciones? ¿Hay
dos, significaron un paso en la auto-evaluación, algunas actividades que interesan a la mayoría
la cual llegó a formar parte de la enseñanza nor- de los niños pero que dejan a las niñas clavadas
mal. Es importante mencionar que la finalidad en sus asientos? ¿Batallan con las tareas escolares
de involucrar a los estudiantes en autoevaluacio- los chicos que aprenden dos lenguas, si no hay
nes no es llegar a una calificación, sino que ellos tiempo suficiente para hablar de su conocimien-
obtengan una mayor comprensión, la cual puede to pertinente de datos esenciales o para esclare-
utilizarse para nuevos aprendizajes. cer expectativas? En una revisión ya clásica de su
propia enseñanza, Mazur (1997) descubrió que
2.10 Evaluación de la docencia los estudiantes podían resolver problemas como
el número 2 de la Figura 17.3, pero no problemas
El modelo de evaluación formativa se centra en como el número 1. Su extenso análisis de por qué
el aprendizaje del estudiante. Un uso igualmente los estudiantes podrían resolver problemas algo-
importante de la evaluación en el aula es la eva- rítmicos pero no conceptuales y qué hacía él que
luación y el perfeccionamiento de la docencia. A estimulaba la búsqueda de recetas (incluyendo
la par que los maestros reúnen evidencia acerca la forma de sus exámenes) llevó a Mazur a reexa-
de la comprensión del estudiante, también to- minar su manera de enseñar para enfocarse en
man en consideración cuáles prácticas docentes estrategias de aprendizaje más activas.
funcionan y cuáles no, y qué nuevas estrategias Cuando los maestros utilizan datos de eva-
hacen falta. El Assessment Standards for School Ma- luación para modificar su enseñanza, también
thematics del NCTM (1995) identificó tres tipos dan un ejemplo importante a los estudiantes. Tal
de decisiones docentes, las cuales fueron infor- como sostuve con anterioridad, “si queremos
madas a través de datos de evaluación: las deci- desarrollar una comunidad de estudiosos —en la
siones de momento a momento, la planeación a que los estudiantes busquen en forma natural re-
corto plazo y la planeación a largo plazo. Cuan- troalimentación y critiquen su propio trabajo—
do la evaluación y la enseñanza están eficazmen- entonces es razonable que los maestros modelen
te entrelazadas, entonces las ideas de evaluación el mismo compromiso de usar datos en forma
pueden usarse en tiempo real para ajustar la en- sistemática, ya que esto se aplica a su propio pa-
señanza. Por ejemplo, si varios estudiantes co- pel en el proceso de enseñanza y aprendizaje”.
meten el mismo tipo de error, puede ser útil de- (Shepard, 2000, p. 12)

29
Textos de evaluación

3. EVALUACIÓN SUMATIVA formativas y sumativas de evaluación alcancen


Y CALIFICACIÓN coherencia y que se respalden mutuamente.

La evaluación sumativa y la calificación consti- 3.1. Finalidades de las calificaciones


tuyen una seria amenaza para los objetivos de apropiadas a la edad
aprendizaje declarados por la evaluación forma-
tiva. De acuerdo con descubrimientos de la lite- Los libros de texto de medición y de psicolo-
ratura motivacional y de estudios de maestros gía educativa dan por sentado que calificar es
y estudiantes, las prácticas de las calificaciones algo que los maestros deben hacer. Son pocas
pueden minar el proceso de aprendizaje de va- las razones que se ofrecen, excepto que las po-
rias maneras. En primer lugar, las pruebas y las líticas escolares exigen que los maestros den
tareas calificadas comunican lo que es importan- calificaciones, a menudo con especificaciones
te aprender. Si estas mediciones divergen de las detalladas en cuanto a la información reque-
metas del aprendizaje que se valora, entonces los rida en las boletas. De igual manera, tengo la
estudiantes concentran su atención y esfuerzo certeza de que los maestros deben dar califi-
sólo en la porción calificada del currículo. Segun- caciones principalmente porque los padres las
do, el uso de calificaciones como premio o como desean. Sin embargo, indico que no ha habi-
castigo puede socavar la motivación intrínseca do estudios sistemáticos de los efectos de las
de aprender. Tercero, a aquellos estudiantes para prácticas de calificación sobre la realización y
quienes los criterios de las calificaciones les pa- los logros del estudiante. Además, sé que exis-
recen fuera de su alcance, éstas pueden reducir ten tres públicos importantes para las califica-
su esfuerzo y su ulterior aprendizaje. Cuarto, la ciones: los padres, los usuarios externos, tales
naturaleza comparativa de las prácticas tradi- como empleadores y funcionarios de servicios
cionales de calificación puede reducir la buena de admisión a las universidades, y los estudian-
voluntad de los estudiantes de ayudar a otros o tes mismos. Los estudiantes se convierten en
de aprender de los demás. el público principal de las calificaciones, por-
En esta sección, considero qué finalidades se que lo que se les dirá a los demás acerca de sus
persiguen al calificar y resumo la investigación logros, llega a desempeñar un papel muy im-
que se ha realizado sobre las prácticas actuales. portante en las interacciones del aprendizaje.
Luego, después de examinar los hallazgos empí- No obstante, si los estudiantes fueran el único
ricos pertinentes de la literatura sobre la psicolo- público, no queda claro que las calificaciones
gía cognitiva de la medición y sobre la psicología por sí mismas añadirían información útil. Más
motivacional, hago un bosquejo de las prácticas bien, lo que maestros y estudiantes necesitan
de calificación de las que se espera sean no sólo más son evaluaciones sumativas que sirvan para
válidas para comunicar logros sino que conduz- verificar la consecución de logros importantes
can al aprendizaje del estudiante. Si están cons- en la adquisición de competencias por parte de
truidas sobre el mismo modelo fundamental de los estudiantes, y las cuales se relacionen con
desarrollar competencia en un campo del cono- los mismos continuos de desempeño que se
cimiento, entonces es posible que las prácticas utilicen en la evaluación formativa.

30
La evaluación en el aula

FIGURA 17.3 Pregunta conceptual (arriba) y convencional (abajo) sobre el tema


de circuitos eléctricos

1. Un circuito en serie consta de tres focos de luz idénticos conectados a una batería como
se muestra aquí. Cuando el interruptor I está cerrado, ¿aumentan, disminuyen o permanecen
iguales los siguientes?
A B C

(a) Las intensidades de los focos A y B


(b) La intensidad del foco C
(c) La corriente que se extrae de la batería
(d) La caída de voltaje entre un foco y otro
(d) La potencia disipada en el circuito

5. Para el circuito que se muestra, calcula (a) la corriente en la resistencia de 2-Ω y (b) la dife-
rencia potencial entre los puntos P y Q.

4Ω
12 V

2Ω Q

P
6Ω

8V

Fuente: De Mazur, Eric, Peer instruction: a user’s manual, 1ª edición, © 1997. Reimpreso con permiso de Pearson education, Inc., Upper
Saddle River, NJ.

31
Textos de evaluación

Los principios sobre lo apropiado de las cali- tandarizadas, de las que sólo el 43% y el 14% de
ficaciones en función de la edad, indican que las ellos, respectivamente, consideraron que eran
calificaciones deberían ser mucho menos impor- muy útiles. En datos de entrevistas, los padres
tantes en la vida del aula en la escuela primaria, explicaron que hablar con el maestro les pareció
de lo que son para los estudiantes de secundaria lo más valioso porque les daba un conocimiento
y preparatoria. Cuando los estudiantes llegan a de primera mano de las fortalezas y debilidades
la secundaria, hay una expectativa mayor de que específicas de su hijo en el contexto del currícu-
las calificaciones tengan significado para un pú- lo del aula. Una generalización adicional de esta
blico externo. Por ejemplo, una calificación alta investigación tiene implicaciones significativas
en Lengua y Literatura debería implicar que el para las prácticas de calificación. Los padres
estudiante puede escribir una composición bien quieren comparaciones normativas. No obstan-
organizada; y un promedio de calificaciones de te, parecen estar deseosos de tener maestros que
nueve debe significar que un alumno del último les digan cómo va su hijo en lo que respecta a las
año de preparatoria está bien preparado para el expectativas que debe responder según el grado,
trabajo universitario. Una finalidad básica del más que exigir una prueba referida a una norma.
movimiento de estándares ha sido, en realidad, Esta sustitución de estándares de nivel de grado
la de asegurar este tipo de comprensión compar- por comparaciones referidas a una norma, es im-
tida sobre el significado de las calificaciones. En portante en el contexto de reportes basados en
cambio, es mucho más difícil llevar a cabo eva- estándares y, como veremos, a causa de las con-
luaciones formales de niños pequeños y mucho secuencias desmotivadoras de las prácticas de
menos necesario. Los principios articulados por calificación referidas a las normas estadísticas.
la National Association for the Education of Young
Children [Asociación Nacional para la Educa- 3.2. La investigación en la práctica actual
ción de Niños Pequeños, NAEYC por sus siglas
en inglés] hacen hincapié en que las evaluaciones Brookhart (1994) identificó 19 estudios publi-
de niños pequeños deben basarse en la observa- cados en los diez años anteriores al trabajo que
ción realizada durante las actividades ordinarias realizó sobre las prácticas docentes de califica-
del aula, y deben usarse con fines formativos y ción. Los métodos de estudio fueron variables
para comunicárselas a los padres. La NAEYC y abarcaron desde exámenes a maestros hasta
concluyó que para los niños en los primeros estudios de caso. Con el respaldo de resultados
grados “El método de presentar informes a los muy consistentes entre los estudios, Brookhart
padres no (debe) depender de las calificaciones (1994) identificó las siguientes generalizaciones:
con letras o números, sino que más bien (debe) • Los maestros tratan afanosamente de ser
proporcionar una información más significativa justos con los estudiantes, y en esto se in-
y descriptiva de manera narrativa” (p. 15). cluye, informarles sobre cuáles serán los
La evidencia respecto de qué tipo de infor- componentes de una calificación.
mación les parece útil a los padres de familia es • Las mediciones de rendimiento o desem-
limitada. En uno de los estudios, sorprenden- peño, especialmente las pruebas, son los
temente, los padres de algunos niños de tercer componentes más importantes para las
año consideraron que lo más valioso era hablar calificaciones, pero el esfuerzo y la capa-
con el maestro sobre el progreso de su hijo; el cidad también suelen tomarse en consi-
77% dijo que esto les parecía muy útil (Shepard y deración.
Bliem, 1995). Lo siguiente más útil fue ver mues- • En las prácticas de calificación hay un
tras calificadas del trabajo de mi hijo. El 60% de los efecto del nivel de grado. Los maestros de
padres refirieron que esto fue muy beneficioso primaria utilizan evidencia y observación
en contraposición con las boletas y pruebas es- más informales. En el nivel Secundaria,

32
La evaluación en el aula

las mediciones de rendimiento con prue- cer una calificación; los hábitos de trabajo están
bas de lápiz y papel y otras actividades estrechamente relacionados con la retroalimen-
escritas constituyen una porción mucho tación que los estudiantes necesitan respecto
mayor de la calificación. de cómo mejorar, y la participación es esencial
• Hay una variación individual entre las para la relación del estudiante con el maestro
prácticas de calificación por parte de los como instructor. Si bien es decisivo entender los
docentes. Diferentes maestros perciben puntos de vista de los maestros y las realidades
el significado y la finalidad de las califica- prácticas del aula, las creencias intuitivas de los
ciones en forma diferente, y consideran maestros acerca de qué es justo y qué motiva a
de manera diferente los factores de des- los estudiantes tal vez no cuente con el respaldo
empeño positivo o negativo. de la investigación. También debemos tomar en
Las prácticas identificadas en los hallazgos 1 y consideración si los maestros utilizan califica-
3 —que los maestros tratan de ser justos y co- ciones de esfuerzo para controlar la conducta de
munican sus criterios de calificación y que usan los estudiantes, que no es lo mismo que crear un
evidencia más informal en los grados de niveles ambiente de aprendizaje que los motive. En un
inferiores— son consistentes con los estánda- estudio de caso de los métodos de evaluación de
res profesionales basados en la investigación. los maestros (Lorsbach, Tobin, Briscoe y Lamas-
Sin embargo, el uso de factores de esfuerzo y ter, 1992), un hallazgo de gran importancia fue el
capacidad para ajustar las calificaciones de des- que “las tareas y los sistemas de totalizar notas
empeño es contrario a las recomendaciones de con frecuencia recompensan el haber completa-
los expertos en medición y de los reformadores do las tareas y la motivación para aprender, y no
que se basan en los estándares. En un estudio tanto lo que se sabe” (p. 310). Aparentemente los
de 143 maestros de escuelas primarias y secun- maestros se desempeñaban dentro de la metáfo-
darias del Medio Oeste, Cizek, Fitzgerald y ra de la escuela es trabajo (Marshall, 1988), creando
Rachor (1995/1996) descubrieron de modo pa- un elaborado sistema para estar informados del
recido que el 52% dijo que tomaban en cuenta trabajo del estudiante, pero sin evaluar la calidad
la capacidad del estudiante individual y el 42% o el contenido de ese trabajo.
dijo que consideraban el esfuerzo del estudiante
al asignar calificaciones. Cizek et al. observaron 3.3. Importancia del contenido
que los maestros se sirven de un conjunto varia- y del formato: qué se valora
do de factores distintos al desempeño en formas
que crean un sesgo de buenos resultados, lo que les El contenido de las pruebas −qué se evalúa y
ayuda a elevar las calificaciones de los estudian- cómo se evalúa− y el contenido de las tareas que
tes. Los expertos dan argumentos en contra de se evalúan para un grado, comunican los obje-
considerar el esfuerzo, la capacidad y la actitud tivos de la enseñanza a los estudiantes y hacen
cuando se califica, porque minan la validez de las que centren su atención y esfuerzo (obsérvese,
calificaciones como indicadores de desempeño. sin embargo, que tan sólo dar puntos a tareas
Además, estos factores no pueden medirse con no garantiza que pongan atención, si la calidad
precisión, crean desigualdades, invitan a los es- del trabajo nunca se examina; véase Lorsbach et
tudiantes a fingir y confunden a la mayoría o a al., 1992). Anteriormente abordé la cuestión del
todos los públicos acerca del significado de las contenido de la evaluación, en el contexto de la
calificaciones. evaluación formativa, y volví a revisarlo cuando
Al tratar de explicar la gran brecha entre la examiné el efecto de las pruebas externas en la
teoría y la práctica, Brookhart (1994) presenta enseñanza y el aprendizaje en el aula.
varios argumentos en nombre de los maestros: Históricamente, los maestros, especialmen-
el esfuerzo se considera como una parte de mere- te en el nivel secundario, se han atenido a las

33
Textos de evaluación

pruebas formales con vistas a la calificación, y a los estudiantes en tareas auténticas con el fin
han usado predominantemente en sus pruebas de desarrollar, usar y extender su conocimiento.
preguntas de bajo nivel. Fleming and Cham- Un trabajo más significativo dirigido a la com-
bers (1983) analizaron 8 mil 800 preguntas de prensión conceptual no sólo proporciona mejo-
pruebas desde la primaria hasta la secundaria y res datos de evaluación acerca de cuán bien se
descubrieron que casi el 80% de ellas tenían el desempeñan los estudiantes, sino que también
nivel del conocimiento en la taxonomía de Bloom tiene beneficios cognitivos y motivacionales.
(1956). Se descubrieron resultados parecidos una Por ejemplo, Crooks (1988) revisó estudios que
década después. En un estudio nacionalmente examinaban el vínculo entre el formato de eva-
representativo, Madaus, West, Harmon, Lomax luación y las estrategias para estudiar de los es-
y Viator (1992) encontraron que el 53% de los tudiantes universitarios. Numerosos estudios
maestros de matemáticas en secundaria y pre- corroboraron los primeros hallazgos de Marton
paratoria y el 73% en primaria manifestaron que y Saljo (1976) de que la aproximación de los estu-
usaban pruebas del libro de texto al menos una diantes a las tareas de aprendizaje podría catego-
vez al mes. Cuando los analizaron Madaus et al. rizarse como aproximaciones profundas o superfi-
(1992), sólo 3% de los reactivos en las pruebas ciales. Las profundas implicaban una búsqueda
finales contenidas en el texto examinaban co- activa de significado, principios fundamentales
nocimiento conceptual de alto nivel y alrededor y estructuras que relacionaran diferentes con-
del 5% examinaban habilidades de pensamiento ceptos. Las aproximaciones superficiales se con-
de alto nivel. El restante 95% de los reactivos centraban principalmente en la memorización
examinaban información, cálculos y uso de algo- de hechos aislados sin buscar conexiones entre
ritmos y fórmulas en problemas de rutina, pare- estos hechos. Si bien hay otros factores que in-
cidos a los que esos estudiantes habían trabajado fluyen en la tendencia de los estudiantes a usar
en el texto. Un porcentaje más alto de maestros aproximaciones profundas o superficiales, es-
comunicaron que hacían sus propias pruebas, pecialmente interés o motivación, en todos los
pero cuando éstas fueron examinadas en estu- estudios, su percepción de lo que exigían las eva-
dios de campo, Madaus et al. (1992) descubrieron luaciones que esperaban, tuvieron una evidente
que eran adaptaciones que se parecían mucho a influencia en la elección de su estrategia.
las pruebas del libro de texto. Más recientemen- Los expertos en asignaturas valoran concep-
te, Cizek et al. (1995/1996) dieron a conocer un tualmente las tareas docentes ricas porque cap-
importante hallazgo: era más probable que los tan lo más importante para que los estudiantes
maestros novatos elaboraran sus propias evalua- aprendan. Los cognitivistas prefieren tareas es-
ciones que los experimentados, quienes tenían timulantes porque hacen que los estudiantes ra-
la tendencia a atenerse a las pruebas preparadas zonen y favorzcan la generalización si las tareas
comercialmente. Este hallazgo podía obedecer de transferencia se usan como parte normal de la
al hecho de que los maestros que empiezan tie- enseñanza. Las tareas auténticas que requieren
nen más conocimiento de los materiales basados un pensamiento de más alto nivel y una activa
en las reformas y los tipos de problemas y mayor solución de problemas también incrementan la
acceso a los mismos. motivación del estudiante porque son intrínse-
Como ya he subrayado con anterioridad, la camente más interesantes que la memorización
naturaleza del logro en cada una de las discipli- o la aplicación de procedimientos sencillos (Sti-
nas no puede ser representada adecuadamente pek, 1998). Por ejemplo, Mitchell (1993) descu-
por preguntas de bajo nivel en las que sólo se brió que las creencias de los estudiantes acerca
recuerda la información. La reforma de la eva- de la importancia en el mundo real de lo que
luación ha sido parte integral de la reforma aprenden era algo que predecía poderosamente
educativa a causa de la necesidad de involucrar su interés y placer en la clase de Matemáticas.

34
La evaluación en el aula

Además, las tareas estimulantes aumentan la mo- el maestro, el estudiante y la comunidad (Pelle-
tivación intrínseca al intensificar el sentimiento grino, Baxter, y Glaser, 1999). Como dije antes,
de competencia en los estudiantes. Newmann brindar a los estudiantes una comprensión cla-
(1992), por ejemplo, descubrió que los estudian- ra de los objetivos hace que éstos sean más al-
tes califican con los puntajes más altos de inte- canzables. Y ayudar a los chicos a aprender el
rés a las clases que los hacen pensar mucho y los significado de los criterios en el contexto de su
hacen participar activamente en el pensamiento propio trabajo les ayuda a desarrollar la concien-
y el aprendizaje. cia metacognitiva sobre qué necesitan para me-
jorar. La teoría cognitiva no lleva a predecir que
3.4. La investigación sobre medición, dejar de hacer evaluaciones sumativas mejoraría
psicología cognitiva y psicología motivacional el aprendizaje. De hecho, desde una perspectiva
cognitiva, el mejor sistema sería aquel en el que
A la mayoría de los maestros les disgusta eva- las evaluaciones sumativa y formativa estuvieran
luar a sus estudiantes y darles una calificación mutuamente alineadas con objetivos de apren-
(Brookhart, 1993; Nava y Loyd, 1992). En vista dizaje orientados conceptualmente, y en el que
de los efectos de distorsión de las prácticas de las evaluaciones sumativas se utilizaran como
calificación examinados en líneas anteriores, y momentos importantes de logro (quizá reco-
de los efectos motivacionales negativos de las nocidos por la familia y los amigos) después de
calificaciones que he considerado, sería fácil ver felices periodos de aprendizaje reforzados por la
las calificaciones tan sólo como un mandato des- evaluación formativa.
encaminado y opresivo. Sin embargo, hay cierta La evidencia más abrumadora que demuestra
evidencia de beneficios cognitivos positivos de los efectos negativos de las prácticas docentes
las evaluaciones sumativas que hay que tomar en y de calificación proviene de la literatura moti-
consideración junto con los hallazgos de la lite- vacional. En una revisión comprehensiva de la
ratura motivacional. Lo que es más importante, investigación sobre la motivación en los niños,
los estudiantes parecen estudiar y aprender más Wigfield, Eceles, y Rodríguez (1998) relatan el
si esperan que les hagan una prueba. Como lo hecho impresionante de que muchos aspectos
resumió Crooks (1988), las ventajas de poner de la organización en el aula tienen efectos ne-
pruebas pueden explicarse por tres factores. gativos tan generalizados que la creencia de los
Primero, hacer pruebas de seguimiento hace niños en su competencia, sus metas de realiza-
que los estudiantes revisen y vuelvan a aprender, ción y logros, su interés en las materias escolares
lo que opera como una forma limitada de prác- y su motivación intrínseca para aprender, dismi-
tica distribuida. Segundo, la experiencia misma nuyen conforme los estudiantes van cursando
de presentar pruebas pone a los estudiantes a los años de la primaria hasta llegar a segundo de
procesar mentalmente el contenido, si bien esto secundaria. Con respecto a las prácticas de cali-
depende mucho de la calidad de las preguntas en ficación, los problemas más importantes tienen
la prueba. Tercero, como ya he observado antes, que ver con el papel de las calificaciones como
para bien o para mal, la prueba dirige la atención recompensas (o castigos), las orientaciones de
a los temas y las habilidades que se examinan, los estudiantes hacia las metas de desempeño
lo cual tiene implicaciones para los esfuerzos de o aprendizaje, y el uso de estándares normati-
estudio de los alumnos. vos de evaluación contrapuestos a estándares de
La teoría cognitiva también indica que los evaluación de la maestría o dominio en una ma-
estudiantes obtienen beneficios si se les da la teria. Todos estos factores, junto con otros tales
oportunidad de demostrar competencia y de como el locus de control9 de los estudiantes y sus
trabajar por el aumento de su aprovechamien-
to, definido mediante criterios compartidos por
9
Dimensión utilizada en la teoría de la atribución que se relaciona
con la percepción de un competidor de la causa del éxito o fracaso.

35
Textos de evaluación

sentimientos de competencia interaccionan de estrategias de solución. Una orientación de


maneras complejas. Aquí resumo solamente los maestría también se ha denominado una orien-
patrones más significativos y consistentes. tación de tarea por teorías afines. En cambio,
El uso de calificaciones como recompensa los estudiantes con una orientación de metas de
contribuye a lo que Lave y Wenger (1991) llama- desempeño están motivados extrínsecamente.
ron la “comercialización del aprendizaje” (p. 112). Están más bien interesados en verse competen-
Cuando no se da un valor cultural al incremen- tes que en serlo y tenderán a evitar situaciones
to de la habilidad y la participación de alguien en las que pudieran parecer incompetentes. Las
en un esfuerzo, la única razón para participar es teorías relacionadas indican que la orientación
obtener un conocimiento superficial que puede del desempeño es provocada por ambientes que
exhibirse para que lo evalúen. En revisiones de fomentan el ego. Cuando encaran una tarea di-
estudios experimentales, los investigadores des- fícil, los estudiantes orientados al desempeño
cubrieron que el uso de recompensas externas harán con frecuencia comentarios sobre su falta
puede minar realmente el interés intrínseco de de capacidad, actuarán con aburrimiento o an-
los estudiantes en una tarea (Deci y Ryan, 1985; siedad, y exhibirán un marcado deterioro en su
Lepper, 1983). Como lo resumió Stipek (1996), desempeño. Dweck llamó a estas conductas im-
las recompensas funcionan para disminuir la potencia aprendida. A causa de su miedo a la eva-
motivación intrínseca cuando se perciben como luación, los estudiantes en esta categoría quizá
un control y cuando no están directamente rela- traten de ocultar al maestro su falta de enten-
cionadas con un desempeño exitoso. Consisten- dimiento.
tes con los hallazgos positivos de la investigación Es importante hacer notar que la orientación
sobre la retroalimentación, las recompensas o las a metas de maestría o de desempeño no son
alabanzas que transmiten una información posi- atributos fijos del estudiante; pueden crearse o
tiva sobre la competencia tienen más probabili- producirse en diferentes grados por el ambiente
dades de incrementar la motivación intrínseca. de aprendizaje y se han provocado experimen-
Los descubrimientos respecto de los efectos talmente (Elliot y Dweck, 1988). Por ejemplo,
de las recompensas están estrechamente rela- en un estudio de estudiantes universitarios,
cionados con la investigación sobre el tipo de dos grupos desarrollaron niveles muy diferen-
metas que se proponen alcanzar los estudian- tes de comprensión conceptual según si sabían
tes. Dweck (1986) distingue entre aquellos con que les harían una prueba al final del estudio o
metas de maestría y aquellos con metas de desem- que necesitarían dar clases a otros sobre el ma-
peño. Estas disposiciones son independientes de terial (Benware y Deci, 1984). Los estudiantes
las capacidades académicas de los estudiantes. tienen más probabilidades de desarrollar una
Aquellos que tienen metas de maestría están in- orientación de aprendizaje cuando los maestros
trínsecamente motivados, buscan tareas estimu- destacan el esfuerzo, el aprendizaje y el trabajo
lantes y disfrutan las oportunidades de desarro- duro, en vez del desempeño y la obtención de la
llar nuevas competencias. Es menos probable respuesta correcta, cuando los errores se tratan
que tengan miedo a la evaluación porque ven al como una parte normal del aprendizaje, y cuan-
maestro como un recurso. Cuando los estudian- do la evaluación del progreso se ve acompañada
tes con una orientación de maestría se enfrentan de oportunidades de mejorar (Ames, 1992; Sti-
a una tarea difícil, es probable que persistan, que pek, 1996).
mantengan una actitud positiva y que busquen Tal vez las consecuencias negativas más se-
rias de las prácticas tradicionales de calificación
El locus de control puede ser interno (es decir, basado en las propias
características del competidor, tales como capacidad o esfuerzo) o
provienen del uso de comparaciones normati-
externos (esto es, debido a factores tales como la suerte, fuera del vas. Como ha indicado Ames (1984), las estruc-
control del competidor). turas de clase competitivas hacen que adquieran

36
La evaluación en el aula

importancia las comparaciones sociales y los jui- aprendido. Las evaluaciones sumativas pueden
cios sobre la capacidad. En una serie de estudios, pensarse como momentos importantes conti-
Butler (1987, 1988), Butler y Nisan (1986) descu- nuos de aprendizaje que apuntalan la evaluación
brieron que las calificaciones que se distribuían formativa.
normativamente daban como resultado un inte- Las evaluaciones sumativa y formativa tie-
rés menor, menos ganas de persistir y un desem- nen finalidades diferentes. Una hace posible el
peño más bajo en comparación con los estudian- aprendizaje y, la otra, ilustra la realización y los
tes que habían recibido una retroalimentación logros. En vista de los conocidos efectos negati-
sustantiva. En un estudio clásico, Harackiewicz, vos de la calificación, una pregunta crucial sería
Abrahams y Wageman (1987) descubrieron que la siguiente: ¿cuán a menudo deberíamos recu-
la evaluación que se basaba en normas sociales rrir a la evaluación sumativa? Los especialistas
reducía el interés en una tarea, en tanto que la en medición defienden la calificación frecuente
evaluación basada en lograr un nivel predetermi- de trabajos escolares para reunir suficientes da-
nado incrementaba el interés. La conclusión ge- tos con objeto de asegurar la confiabilidad. Los
neral de Stipek (1996) respecto de esta literatura cognitivistas consideran que los estudiantes de-
fue que la evaluación, especialmente la de tareas ben tener práctica con los criterios que se usa-
difíciles, tiende a minar el interés intrínseco. Sin rán para evaluar desempeños culminantes. Sin
embargo, la excepción que identificó es digna embargo, el modelo de evaluación formativa y
de atención y anticipa mis recomendaciones en la investigación sobre la motivación sostienen
cuanto a las prácticas de calificación: que la calificación podría socavar la orientación
No obstante, la evaluación sustantiva que de aprendizaje de los estudiantes. Por lo tanto,
proporciona información sobre competen- para conseguir que la evaluación formativa sea
cias y una guía para esfuerzos futuros, y la realmente para el aprendizaje, tal vez los maes-
evaluación que está basada en la maestría o tros necesiten posponer otorgar calificaciones,
más bien el dominio que en las normas so- o usarlas sólo cuando el estudiante se auto-eva-
ciales, no tienen, al parecer, estos efectos ne- lúe, y como calificaciones hipotéticas que ayuden
gativos y pueden incluso aumentar el interés a los estudiantes a permanecer centrados en la
intrínseco en las tareas académicas. (Stipek, retroalimentación sustantiva. Pero lo cierto es
1996, p. 99) que los maestros deben evitar interrumpir y
juzgar como si ya estuviera terminada la calidad
3.5. Parámetros para el desarrollo del aprendizaje que aún está en marcha. Desde
de la competencia luego que la cuestión de la confiabilidad es im-
portante, y no debe calificarse a los estudiantes
Para que se respalden mutuamente, las evalua- con base solamente en una o dos pruebas for-
ciones sumativa y formativa deben estar alinea- males aisladas. Sin embargo, si las evaluaciones
das conceptualmente. Deben ser plenamente sumativas están contenidas en las progresiones
capaces de representar objetivos de aprendi- del aprendizaje, entonces la confiabilidad de los
zaje importantes, y deben usar la misma gama eventos calificados está respaldada por otras evi-
extensa de tareas y de tipos de problemas para dencias de cada competencia en proceso de de-
representar la comprensión de los estudiantes. sarrollo del estudiante a lo largo de ese continuo
Sin embargo, las evaluaciones sumativas no de- fundamental.
ben ser meras repeticiones de tareas formativas Las evaluaciones sumativas y las calificaciones
previas, sino que deben ser la culminación de que se basan en ellas deben representar realización
desempeños que inviten a los estudiantes a ex- y logros. Consistente con el resumen que hice de
hibir su maestría y a utilizar su conocimiento en Stipek (1996), en líneas anteriores, acerca de la
formas que generalicen y extiendan lo que han investigación sobre motivación; la evaluación del

37
Textos de evaluación

desempeño debe basarse en estándares de maes- respuesta a las preguntas de los hacedores de po-
tría o dominio más que en normas sociales. Las líticas a cierta distancia del aula. No obstante, en
calificaciones basadas en el desempeño se alinea- una era de rendición de cuentas basada en prue-
rán en forma más transparente a la retroalimen- bas de alto impacto (high-stakes accountability), las
tación con los mismos estándares utilizados para pruebas externas pueden tener también profun-
la evaluación formativa, y se comunicarán mejor dos efectos en las prácticas del aula. Idealmente,
a públicos externos. Cuando los maestros hacen una evaluación externa que estuviera bien ali-
ajustes a las calificaciones para tomar en cuenta neada con objetivos de aprendizaje ricos desde
el esfuerzo y el mejoramiento, con frecuencia res- un punto de vista conceptual, tendría impactos
ponden a cuestiones de justicia. ¿Es justo juzgar a positivos en la enseñanza si ilustrara metas sig-
los estudiantes de capacidades diferentes con los nificativas de aprendizaje, pues proporcionaría
mismos criterios? ¿Y no ocurre que los estudian- una retroalimentación útil a los maestros sobre
tes de menores capacidades probablemente dejen las fortalezas y las debilidades curriculares, y
de hacer esfuerzos si los estándares están fuera de asimismo verificaría logros de estudiantes indi-
su alcance? En aulas heterogéneas, calificar desde viduales. Los autores de Knowing What Students
el punto de vista de los estándares de maestría o Know (Pellegrino et al., 2001) imaginaron para el
dominio requerirá de otros sistemas de respaldo futuro un sistema de evaluación más equilibrado
para los estudiantes de diferentes capacidades, in- y coherente, en el cual la evaluación formativa de
cluyendo estrategias tales como: diferente ritmo la clase recibiría igual atención que las pruebas
de aprendizaje y tiempo diferente para las evalua- de alto impacto y en la que las evaluaciones en
ciones importantes, identificación de metas inter- el aula y las externas estarían vinculadas de una
medias y alcanzables, y andamiaje diferencial. Si se manera coherente al mismo modelo fundamen-
toma con seriedad, el compromiso de que las cali- tal de aprendizaje.
ficaciones representen desempeño significaría su- Actualmente, la idealización de Knowing
primir los diversos elementos de la calificación por What Students Know no se ha realizado. En rea-
condescendencia, tales como puntos extra, puntos lidad, un extenso cuerpo de la literatura al res-
por entregar fichas y borradores de trabajos, pun- pecto ha documentado los efectos negativos en
tos por entregar tareas que jamás se califican y así la enseñanza y el aprendizaje (Heubert y Hauser,
sucesivamente. Los efectos de las tareas que ayu- 1999; Pedulla et al., 2003; Pellegrino et al., 2001;
dan a los estudiantes a aprender deben evaluarse U.S. Congress, Office of Technology Assessment,
en última instancia en evaluaciones culminantes 1992), causados principalmente por los efectos
donde el aprendizaje será manifiesto. Al mismo de distorsión que ejerce el enseñar para la prue-
tiempo, estarían permitidas otras formas de ayu- ba, con formatos limitados y una representación
dar a los estudiantes a suavizar sus preocupaciones muy poco adecuada de los objetivos de aprendi-
sobre las calificaciones, si en cada caso les dieran la zaje significativos.
oportunidad de que ellos demostraran su maestría. En un tratamiento más extenso tanto de los
Entre éstas estarían las tareas o pruebas de reem- efectos positivos como de los negativos de las
plazo o descartar las calificaciones de exámenes pruebas de alto impacto (Shepard, Hammerness,
cuando se verifica el aprendizaje mediante evalua- Darling-Hammond y Rust, 2005), mis coautores
ciones posteriores. y yo concluimos que existen dos factores que pa-
recen intervenir en la forma en que las pruebas
4. EVALUACIONES EXTERNAS externas remodelan el currículo. El primero es
Y EN GRAN ESCALA cuán idóneo es el contenido de las pruebas para
captar los objetivos del aprendizaje, y el segun-
Las evaluaciones nacionales, estatales y distrita- do, es la capacidad del docente para mantener
les se utilizan para reunir datos con el fin de dar en el aula la enseñanza concentrada en el verda-

38
La evaluación en el aula

dero aprendizaje. Con base en estas lecciones de Si estamos de acuerdo con la idea de que los
la literatura que investiga cómo se enseña para la estudiantes deben estar conscientes de su pro-
prueba, identificamos estrategias que ayudan a pio progreso en el aprendizaje, también tiene
mantener enfocada la atención de los estudian- sentido ayudarles a entender la relación entre
tes en el aprendizaje, las cuales son consistentes el conocimiento que se requiere para las prue-
con la visión de la evaluación formativa de la cul- bas y cómo se compara esto con las formas en
tura en el aula. Así, además de la coherencia de que usan su conocimiento en otros ambientes.
contenido entre las pruebas internas y las exter- Por ejemplo, Calkins, Montgomery y Santman
nas, buscamos preservar una coherencia filosó- (1998) proponen que enseñemos a los niños
fica entre las actitudes hacia el aprendizaje y la cómo leer las pruebas, igual que les enseñamos
evaluación, las cuales son transmitidas durante a dominar las características de cualquier otro
las clases normales, y la actitud que uno adopta género. “Si nuestros pequeños están acostum-
hacia el aprendizaje cuando se prepara para las brados a reunirse en la alfombra a leer juntos
pruebas externas. un texto, que quizá es más largo de lo normal, y
Para protegerse de los efectos de un currículo luego a hablar de las estrategias para abordarlo
guiado por la aplicación de pruebas, los maestros o para manejar las dificultades que plantea, ¿por
en forma individual, o preferentemente equipos qué no pueden hacer lo mismo con el extracto
de maestros, deben elaborar una exposición de una prueba estandarizada de lectura?” (p.
razonada con el fin de ubicar el conocimiento 71). De igual manera, en el estudio de McNeil
y las habilidades relacionadas con las pruebas (1988), maestros experimentados de escuelas
dentro de los límites más amplios de los currí- magnet10 buscaron la forma de contrarrestar el
culos reales. Llamamos a esta técnica mapeo del enfoque de fragmentos y hechos que tenían las
campo. Si comienzan con el marco de referencia pruebas y ayudaron a sus alumnos a llevar dos
del currículo estatal o los estándares nacionales conjuntos de notas, uno para el conocimiento
de contenido, los maestros pueden dibujar un real y otro para el conocimiento que necesi-
diagrama de Venn o construir una tabla para tarían para la prueba. Si bien los estudiantes,
ilustrar cuál subparte del currículo deseado es especialmente los de primaria, merecen tener
abarcado por la prueba y cuál no. Muchas prue- algo de práctica con formatos de pruebas que
bas elaboradas comercialmente abarcan la parte les piden hacer ejercicios de respuesta abierta
más fácil de medir de cada elemento del con- (Matemáticas), o redactar párrafos a partir de
tenido de un campo, pero esto no significa que una instrucción general, para que no se descon-
se represente el campo adecuadamente. Señalar cierten ante tareas poco familiares, tal práctica
lo que se ha dejado fuera ayuda a esclarecer las debe darse en el contexto de los objetivos de
limitaciones de la prueba como guía curricular. la enseñanza con los que estas tareas se rela-
Con base en este análisis explícito, los maestros cionan. Y en vista de lo que sabemos sobre la
pueden entonces planear conscientemente uni- falta de transferencia cuando sólo se utiliza un
dades de estudio y distribución del tiempo de tipo de problema, los maestros pueden trabajar
enseñanza en formas que mantengan la atención para asegurarse de que haya una comprensión
al contenido de las pruebas en su lugar propor- más sólida si se concentran en los principios
cional. Por consiguiente, no se permitiría que las fundamentales y si continúan pidiendo a sus
pruebas de habilidades básicas y de bajo nivel, alumnos que hagan extensiones y aplicaciones
que representan sólo una subparte de los están- de lo aprendido.
dares de contenido deseados, tuvieran tanta in-
10
Las magnet schools son escuelas públicas que atraen a estudiantes
fluencia en la enseñanza dentro del aula como de otro vecindario para reducir o eliminar el desequilibrio racial.
las evaluaciones basadas en conceptos, que son Estas escuelas dan una importancia especial al logro académico o
más estimulantes. a un campo en particular, como Ciencias, Matemáticas, Artes o
Ciencias de la computación. [N. T.]

39
Textos de evaluación

Buena parte de este consejo, sobre cómo 5. CONCLUSIONES:


mantener nuestra integridad profesional ante las IMPLICACIONES
presiones de las pruebas de alto impacto, tie- PARA LA INVESTIGACIÓN
ne que ver con la actitud y la posición que uno Y LA TEORÍA DE LA MEDICIÓN
adopte. La idea fundamental es poner atención
en la prueba sólo en la medida en que ésta se re- Ralph Tyler es un icono en la historia de la me-
lacione con el currículo, más que detenerse en la dición educativa. Empecé este capítulo con un
prueba y dejar que ésta se convierta en el centro análisis histórico porque yo quería abordar explí-
de la planeación de la enseñanza. Tal posición citamente la tensión entre mi constante creen-
permite a los maestros utilizar los resultados cia en la visión de Tyler —de que la medición
de las pruebas para hacer sólo las mejoras apro- educativa debe ser parte integral de la enseñan-
piadas y necesarias en el currículo y la enseñan- za— y mi necesidad de cuestionar su herencia
za. Como lo señaló Wiggins (1998), los buenos involuntaria: el persistente modelo de pruebas y
maestros tienen la capacidad de auto-evaluarse, mediciones para la evaluación en el aula, fundado
pero aún así hay puntos ciegos y una carencia de principalmente en pruebas objetivas elaboradas
referentes externos. La mayoría de los maestros externamente. La otra visión de la evaluación
con un buen conocimiento de los estándares en el aula presentada en este capítulo es radical-
de contenido (puesto que la prueba se refiere a mente diferente de la imagen de la aplicación de
ellos), y con una idea bastante clara de lo que sus pruebas en el salón de clase presentada en vo-
alumnos saben, pueden predecir cómo saldrán lúmenes anteriores de Educational Measurement,
éstos. Por lo tanto, las aportaciones más impor- y en libros de texto sobre medición. Ésta otra
tantes de los resultados de las pruebas externas visión se centra en conceptualizaciones mucho
pueden a menudo venir de los que resultan sor- más ricas sobre el aprendizaje del estudiante en
presivos, ya que los maestros se ven llevados a el contexto de actividades significativas y resalta
preguntarse cosas como éstas: ¿por qué no fue- el uso formativo de la evaluación para mejorar el
ron capaces mis alumnos de resolver este pro- aprendizaje.
blema (o de realizar esta tarea)? ¿Cómo debo El nuevo modelo idealizado está bien fundado
cambiar mi enseñanza para ayudarles a resolver en las teorías cognitivas y socioculturales contem-
problemas de este tipo? ¿Por qué no supe lo que poráneas del aprendizaje y en la teoría de la moti-
ellos no sabían? Además, aun cuando los resulta- vación, pero en cierto sentido todavía es experi-
dos concuerden con sus predicciones, los maes- mental, ya que no se ha puesto en marcha en gran
tros pueden evaluar la idoneidad de sus propios escala. Queda mucho por aprender sobre qué nue-
esfuerzos si examinan las relativas fortalezas y vas ideas y adaptaciones adicionales se necesitarán
debilidades de los elementos curriculares. Por para hacer que tal visión funcione en la práctica.
ejemplo, ¿se desempeñan los estudiantes igual- Concluyo reflexionando sobre cuatro temas esen-
mente bien en las habilidades de pensamiento ciales para la investigación futura: (1) estudios de
de orden más elevado que en las habilidades las herramientas y los procesos de evaluación, (2)
básicas? Cuando los maestros tienen un cono- desarrollo de las progresiones del aprendizaje, (3)
cimiento profesional bien desarrollado sobre estudios del desarrollo del maestro, y (4) nuevas
cómo encaja la información basada en pruebas conceptualizaciones de confiabilidad y la validez.
en un marco de referencia más amplio de obje-
tivos curriculares enriquecidos, se hace posible 5.1. Estudios de las herramientas y los pro-
prestar atención a una comprensión provenien- cesos de evaluación
te de los resultados de exámenes, sin temor a
reducir y distorsionar el currículo, tan bien do- En Knowing What Students Know, Pellegrino et
cumentados en la literatura. al. (2001) sostuvieron que las interpretaciones

40
La evaluación en el aula

y las prácticas de evaluación deben basarse en nes a los maestros y estudiantes, y qué otros es-
un modelo bien concebido de aprendizaje del tímulos proporcionan para que se hagan avances
estudiante. Lo mismo puede decirse respecto en el aprendizaje? ¿Cómo puede hacerse que las
de la importancia del modelo teórico que sirve ocasiones de la evaluación y las estrategias para
de fundamento a los estudios de investigación. realizarla se adapten a las rutinas de enseñanza?
Cuando Black y Wiliam (1998) emprendieron (Ejemplos de estas estrategias son sobre todo los
su voluminosa revisión de la investigación sobre portafolios, las discusiones entre estudiantes y
la evaluación formativa en el aula, citaron estu- la explicación a la clase de las soluciones a pro-
dios fundamentales, meta-análisis y revisiones blemas.) ¿Pueden introducirse con muchísimo
que representaban mucho más de mil estudios. cuidado los procesos derivados de la teoría del
Con todo, muchos de los estudios citados son aprendizaje —evaluación del conocimiento pre-
inadecuados para nuestros propósitos, porque vio, retroalimentación, conciencia metacogniti-
se derivan de modelos de aprendizaje muy in- va, auto-evaluación, etcétera— como un medio
suficientes para la teoría contemporánea. Por para incrementar el aprendizaje y la motivación
ejemplo, una gran mayoría de los estudios sobre del estudiante? ¿En qué condiciones y para quién
retroalimentación se conceptualizaron desde son eficaces estas estrategias? ¿Pueden hacerse
una perspectiva conductista y dependían de pre- coherentes, y que se respalden mutuamente la
pruebas y post-pruebas que se parecían mucho a evaluación formativa y la sumativa? Cuando son
los materiales de enseñanza. En la literatura mo- coherentes, ¿se incrementan el aprendizaje y la
tivacional, la recomendación de evitar tareas es- motivación del estudiante? Las extrapolaciones
timulantes tal vez no se sostenga en un ambiente especulativas de la investigación y la teoría exis-
basado en criterios más que en uno que remita tentes también deben someterse a prueba ex-
a normas, o cuando la cultura del aula respalda plícitamente. Por ejemplo, si se pospusieran las
a los estudiantes para que desarrollen una orien- calificaciones, ¿aumentaría esto la eficacia de la
tación hacia el aprendizaje. Se necesitan nuevos evaluación formativa, es decir, se vería estimula-
estudios que reflejen modelos constructivistas y da la orientación al aprendizaje y aumentarían la
socioculturales del aprendizaje asistido. realización y los logros?
Unos cuantos estudios citados en el capítulo
ilustran cómo puede introducirse y estudiarse 5.2. Estudios del desarrollo del maestro
una práctica específica de evaluación, consis-
tente con la teoría social-constructivista. Por Los estudios de una variable por vez o de una
ejemplo, Elawar y Corno (1985) crearon una característica de la evaluación por vez son úti-
intervención para ayudar a los maestros a que les para los fines de la investigación, porque nos
se concentraran en conseguir que la retroali- ayudan a concentrarnos en los efectos de una es-
mentación fuera útil para el mejoramiento de trategia específica y en las formas mediante las
los estudiantes. White y Frederiksen (2000) y cuales esas prácticas de evaluación en particular
Klenowski (1995) examinaron el efecto de la respaldan el aprendizaje del estudiante. Además,
auto-evaluación en el aprendizaje del estudian- estos estudios me parecen ejemplos útiles de
te y sus actitudes respecto a las calificaciones, cómo puede ocurrir el cambio: es decir, cómo
el conocimiento de los criterios, etc. Se nece- es posible que los maestros a quienes les gusta la
sitan más estudios como éstos. Deben diseñar- teoría de la evaluación formativa den los pasos
se para que respondan a preguntas de inves- iniciales para modificar su práctica. En última
tigación tales como las siguientes: ¿cuán bien instancia la meta es hacer un paradigma com-
captan objetivos importantes de aprendizaje pleto y un cambio cultural (Shepard, 2000). Sin
las evaluaciones incorporadas en la enseñanza? duda, si uno adopta una técnica de evaluación for-
¿Qué conocimientos aportan tales evaluacio- mativa sin un cambio filosófico correspondiente,

41
Textos de evaluación

los esfuerzos se verán socavados o acabarán por la comunidad en la que participan (Lave y Wen-
ser inútiles, ya que persistirán las actitudes tra- ger, 1991). Para que los docentes hagan cambios
dicionales, como la de quienes en su desempeño significativos en las creencias pedagógicas y en
académico sólo les importa la calificación. Sin las prácticas concomitantes, ellos mismos nece-
embargo, sabemos gracias a la investigación so- sitarán experimentar y reflexionar sobre nuevos
bre la reforma educativa y el cambio del docente procedimientos en el contexto de sus propias
que es imposible instaurar una reforma integral. aulas (Putnam y Borko, 2000). Los estudios de
Por lo tanto, es bastante práctico tomar en con- investigación realizados en el contexto de la
sideración argumentos teóricos y luego adoptar práctica deben prestar atención a cuestiones ta-
una estrategia específica de evaluación, como el les como las siguientes: ¿qué condiciones, creen-
punto focal para la transformación lenta y con- cias previas o apoyos hacen posible o frustran
cienzuda en la práctica, junto con un acompa- el uso de la evaluación tal como uno la quiere
ñamiento constante y la reflexión para tener en hacer? ¿Cómo influye el conocimiento de la ma-
cuenta las inevitables repercusiones teóricas y teria que tiene un maestro sobre sus creencias
prácticas. La estrategia de la intervención única y sobre la implementación de prácticas eficaces
de evaluación podría ser una capacitación espe- de evaluación formativa? ¿Cómo pueden quedar
cial para dar retroalimentación enfocada al me- integradas las prácticas de evaluación formati-
joramiento; documentar los fondos del mismo va con otras reformas curriculares o con otros
conocimiento de los estudiantes; examinar el cambios culturales dirigidos a desarrollar una
trabajo de los alumnos en equipos de grado; in- comunidad de personas que aprenden, los cua-
troducir la auto-evaluación, y así sucesivamente. les también se basan en un modelo sociocultural
En un estudio notable realizado en Inglaterra en del aprendizaje? ¿Cómo debe uno dedicarse a las
el que el avance promedio de los alumnos de un cuestiones en torno a la calificación y a las eva-
grupo fue del orden de un tercio de una desvia- luaciones externas, con objeto de ayudar y no de
ción estándar, Black y Wiliam (2004) familiari- obstaculizar los esfuerzos de la evaluación for-
zaron a los maestros con la teoría de la evalua- mativa? ¿Cómo influyen en la renegociación de
ción formativa y luego los invitaron a desarrollar los objetivos de la evaluación formativa el con-
sus propios planes, seleccionando estrategias de texto escolar y el contrato social implícito (Pe-
la literatura, tales como preguntas abundantes, rrenoud, 1991) que los estudiantes llevan consigo
marcar el trabajo escolar sólo con comentarios, en lo que se refiere a las calificaciones?
compartir criterios con los alumnos e implantar
la auto-evaluación y la evaluación por pares dada 5.3. Nuevas conceptualizaciones
por los estudiantes. de la confiabilidad y la validez
La investigación sobre el aprendizaje y desa-
rrollo profesional de los maestros nos propor- Mi preámbulo histórico describió el campo de
ciona varios principios generales para respaldar la medición como reacio a distanciarse de una
el cambio. En esencia, nosotros (los que pro- visión tradicional de las pruebas en el aula, que
movemos el cambio) necesitamos tratar a los se concentraban en la evaluación sumativa. La
maestros en la medida en que son personas que llegada del siglo XXI, sin embargo, ha visto
aprenden, de la misma manera como les pedi- cambios notables. La publicación de Knowing
mos que traten a sus estudiantes. Necesitamos What Students Know (Pellegrino et al., 2001) fue
tener un modelo bien concebido de la práctica un verdadero parteaguas. Un segundo aconteci-
profesional ideal hacia la que los conducimos, y miento muy relevante fue la publicación de un
al mismo tiempo debemos estar conscientes de número especial de Educational Measurement: Is-
que los maestros harán contribuciones y tam- sues and Practice sobre “cambiando la manera en
bién modificarán las herramientas y prácticas de que los teóricos de la medición piensan sobre

42
La evaluación en el aula

las evaluaciones en el aula” (Brookhart, 2003). para una carta de recomendación, o formativa,
Al frente de este movimiento, Brookhart (2003) como cuando un maestro adapta la retroalimen-
sostiene que los avances en la teoría de la confia- tación para ayudar a un estudiante a mejorar el
bilidad y la validez han sido forjados en el con- trabajo que ha escrito.
texto de programas de evaluación en gran escala. Así como la evaluación formativa quizás no
En atención a la necesidad de que evaluación y necesite que se dé a conocer una calificación fija,
enseñanza se integren en el aula, como he seña- también es el caso que los coeficientes de co-
lado en este capítulo, Brookhart (2003) ha dado rrelación rara vez pueden ser los indicadores
argumentos en el sentido de que la forma de apropiados de la confiabilidad. En las aulas,
concebir confiabilidad y validez en el aula debe dar sentido a los datos de observación y a las
ser también fundamentalmente diferente. muestras del trabajo de los alumnos significa
Un principio básico de la teoría de la medi- buscar patrones, comprobar evidencia contra-
ción ha sido siempre que la confiabilidad y la dictoria y comparar la descripción emergente
validez dependen del uso de pruebas. En el con- en contraposición con modelos del desarrollo
texto del aula, no es necesario que la confiabi- de las competencias. Al igual que otros autores,
lidad de cualquier evaluación cumpla el mismo estoy en favor de un enfoque interpretativista
criterio de estabilidad que una medición utili- del análisis y la síntesis de datos (Gipps, 1999;
zada para determinar la graduación del bachille- Graue, 1993; Moss, 1996, 2003; Shepard, 2001).
rato o el ingreso a la universidad. Debido a que En mi propio caso, veo una fuerte conexión en-
la evaluación formativa en las aulas es constan- tre el uso de métodos cuantitativos de investi-
te, una percepción errónea de las habilidades o gación, de prácticas de evaluación formativa, y
el conocimiento de un estudiante puede un día mi preparación para el trabajo clínico, cuando
corregirse con nueva información y al siguiente utilizo observaciones para formar una hipótesis
con una demostración de su aprovechamiento tentativa, cuando reúno información adicional
(Shepard, 2000). Lo que es más importante, los para confirmar o revisar, y cuando planeo una
conceptos de andamiaje y evaluación dinámica intervención (que en sí misma es una hipótesis
(Lidz, 1987), fundamentados en la zona de de- de trabajo). En efecto, hace un tiempo, Geertz
sarrollo próximo de Vygotsky, tienen la finali- (1973) estableció una analogía entre la inferen-
dad de cambiar el nivel de aprovechamiento del cia clínica como la que se usa en medicina y la
estudiante en el mismo proceso de evaluación. forma en que los teóricos culturales diagnostican
Moss (2003), en el número especial de Educatio- el significado fundamental del discurso social,
nal Measurement: Issues and Practice, sostiene que, queriendo decir con ello que usan una teoría ate-
como docente, “No tengo necesidad de sacar rrizada (grounded) para generar interpretaciones
y garantizar interpretaciones fijas de las capa- convincentes, o generalizaciones que tienen un
cidades de los estudiantes, sino que más bien poder explicativo más allá de las descripciones
mi trabajo es ayudarles a hacer que esas inter- gruesas. Obsérvese que verificar si existen patro-
pretaciones se vuelvan obsoletas” (p. 16). Smith nes y justificar que ciertas interpretaciones par-
(2003), también en el número especial, propuso ticulares están fundamentadas borra los límites
que quizás la suficiencia de la información sería el entre la confiabilidad y la validez, como Smith
criterio más apropiado para la confiabilidad en (2003) tuvo que reconocer en su argumento en
el contexto del aula. “¿Tengo a la mano la infor- favor de la suficiencia de la información como
mación suficiente para tomar una decisión ra- la forma de definir la confiabilidad concerniente
zonable respecto de este estudiante en relación a los propósitos del aula. De hecho, la línea de
con este campo de contenido?” (p. 30). Como interrogación que Smith (2003) propone para
observó Moss, el criterio sería diferente depen- evaluar la confiabilidad corresponde de cerca al
diendo de si la decisión fuera sumativa, como proceso interpretativo de evidencia que Moss

43
Textos de evaluación

(2003) ofrece como criterio de validez. En vista tudiante. Como señala Moss (2003), la validez en
de que esta última es el concepto más incluyen- los contextos del aula alude principalmente a las
te, prefiero usar el término validez para referir- consecuencias, a qué tan bien las interpretaciones
me al proceso de fundamentar interpretaciones, de las evaluaciones informan a las decisiones do-
y limitar el uso del término confiabilidad a las centes y cuánto ayudan a hacer que los estudiantes
exigencias de consistencia más estrechas, tales avancen a lo largo de una trayectoria de competen-
como los acuerdos entre varios jueces al utilizar cia creciente. Para trazar un plan de investigación
guías de calificación (rubrics). con objeto de desarrollar una teoría de la validez
Brookhart (2003), Moss (2003) y Smith apropiada para la evaluación en el aula, uno nece-
(2003) han comenzado a especular sobre cómo sita solamente retomar los temas importantes del
tendrá que reformularse la teoría de la confiabi- capítulo. Para que se respalden mutuamente, la
lidad y la validez para que tengan sentido en los evaluación formativa y la sumativa deben alinearse
propósitos del aula, pero es tan sólo el inicio de desde el punto de vista conceptual. Deben incor-
un esfuerzo mayor de reconceptualización. Será porar objetivos de aprendizaje importantes, que se
necesario modificar muchos viejos conceptos o sirvan de una amplia gama de tareas y tipos de pro-
incluso ir en contra de ellos. Por ejemplo, sabe- blemas para captar las comprensiones de los estu-
mos que la diferencia entre dos calificaciones diantes. Las investigaciones sobre la validez deben
cuantitativas, es por lo general mucho menos examinar lo bien que diversas herramientas de
confiable que cualquiera de las dos calculada por evaluación representan el conocimiento, las habi-
sí sola. No obstante, si fuéramos a tomar con lidades y las actitudes de los estudiantes así como
seriedad la recomendación de Knowing What sus identidades en proceso de desarrollo, con fines
Students Know, de representar el progreso del es- sumativos, y cuán bien soportan acercamientos
tudiante a lo largo de continuos de aprendizaje profundos y de dominio del aprendizaje, cuan-
bien desarrollados, las calificaciones de diferencia o do se usan formativamente. Los estudios de vali-
las mediciones del progreso podrían ser suma- dez deben, asimismo, consagrarse a revisar si los
mente confiables, porque la medición de creci- procesos de evaluación funcionan como se desea.
miento basada en el aula tendría el respaldo de Por ejemplo, ¿utilizan los estudiantes una retroali-
todos los datos que se reunieran a lo largo del mentación sustantiva para mejorar su trabajo? El
proceso, y no dependería solamente de los dos programa de investigación esbozado líneas arriba
extremos. Un programa de investigación que es- para examinar los efectos de las herramientas y
tudiara la confiabilidad para los propósitos del los procesos de evaluación es, en realidad, un pro-
aula debería empezar por examinar el tipo y el grama de investigación sobre la validez. La mayor
grado de consistencia requerido para respaldar comprensión que se alcance gracias a la investiga-
las decisiones en el aula. ción que pone a prueba el modelo de evaluación
La validez es el sitio apropiado para empezar formativa, su relación con la teoría del aprendizaje,
o terminar cualquier intento de medición educa- etcétera, ayudará asimismo a iluminar una nueva
tiva. En las aulas, la evaluación formativa es válida comprensión de la teoría de la validez, necesaria
si contribuye al progreso del aprendizaje del es- para la evaluación en el aula.

44
La evaluación en el aula

Bibliografía Brookhart, S. M. (1993). Teachers’ grading prac-


tices: Meaning and values. Journal of Edu-
Ames, C. (1984). Competitive, cooperative, and cational Measurement, 30, 123-142.
individualistic goal structures: A cogniti- Brookhart, S. M. (1994). Teachers’ grading:
ve-motivational analysis. En R. E. Ames Practice and theory. Applied Measurement
y C. Ames (Eds.). Research on motivation in in Education, 7 (4), 279-301.
education, 1, 177-207. Nueva York: Acade- Brookhart, S. M. (2003) Developing measure-
mic Press. ment theory for classroom assessment
Ames, C. (1992). Classrooms: Goals, structures, purposes and uses. Educational Measure-
and student motivation. Journal of Educa- ment: Issues and Practice, 22 (4), 5-12.
tional Psychology, 84, 261-271. Brown, F. G. (1981). Measuring classroom achie-
Assessment Reform Group. (1999). Assessment vement. Nueva York: Holt, Rinchart y
for learning: Beyond the black box. University Winston.
of Cambridge School of Education: Cam- Bruner, J.S. (1985). Vygotsky: A historical and
bridge. conceptual perspective. En J. V. Wersch
Atkin, J. M., Black, P., y Coffey, J. (2001). Classro- y Center for Psychosocial Studies (Eds.),
om assessment and the National Science Educa- Culture, communication, and cognition:
tion Standards. Washington, DC: National Vygotskian perspectives, pp. 21-34. Nueva
Academy Press. York: Cambridge University.
Baron, J. B., y Wolf, D. P. (Eds.). (1996). Perfor- Butler, R. (1987). Task-involving and ego-invol-
mance-based student assessment: Challenges and ving properties of evaluation: Effects of
Possibilities, Ninety-fifth Yearbook of the Natio- different feedback conditions on moti-
nal Society for the Study of Education. Parte 1. vational perceptions, interest and perfor-
Chicago: University of Chicago Press. mance. Journal of Educational Psychology,
Benware, C., y Deci, E. (1984). Quality of lear- 79, 474-482.
ning with an active versus passive motiva- Butler, R. (1988). Enhancing and undermining
tional set. American Educational Research intrinsic motivation: The effects of task-
Journal, 21, 755-765. involving and ego-involving evaluation on
Black, P., y William, D. (1998). Assessment and interest and performance. British Journal
classroom learning. Assessment in Education: of Educational Psychology, 58, 1-14.
Principles, Policy, and Practice, 5(1), 7-74. Butler, R., y Nisan, M. (1986). Effects of no fee-
Black, P., y William, D. (2004). The formative dback, task-related comments, and grades
purpose: Assessment must first promo- on intrinsic motivation and performan-
te learning. En M. Wilson (Ed.), Towards ce. Journal of Educational Psychology, 78,
coherence between classroom assessment and 210-216.
accountability: 103º Yearbook of the National Calkins, L., Montgomery, K., y Santman, D.
Society for the Study of Education. Parte 2, (1998). A teacher’s guide to standardized rea-
pp. 20-50. Chicago: University of Chicago ding tests: Knowledge is power, Portsmouth,
Press. NH: Heinemann.
Bloom, B. S. (Ed.). (1956). Taxonomy of educational Carpenter, T. P., y Moser, J. M. (1984). The
objectives: The classification of educational goals. acquisition of addition and subtraction
Nueva York: David McKay Company. concepts in grades one through three. Jo-
Bransford, J. D., Brown, A. L., y Cocking, R. R. urnal for Research in Mathematics Education.
(1999). How people learn: Brain, mind, expe- 15 (3), 179-202.
rience, and school. Washington, DC: Natio- Cizek, G. J., Fitzgerald, S. M., y Rachor, R. E.
nal Academies Press. (1995/1996). Teachers’ assessment prac-

45
Textos de evaluación

tices: Preparation, isolation, and the kit- Farr, R., y Griffin, M. (1973). Measurement
chen sink. Educational Assessment, 3 (2), gaps in teacher education. Journal of Re-
159-179. search and Development in Education, 7 (1),
Clay, M. M. (1985). The early detection of reading 19-28.
difficulties. Auckland, Nueva Zelanda: Hei- Fennema, E., y Franke, M. L. (1992). Teachers’
nemann. knowledge and its impact. En D. A.
Cobb, P., Wood, T., y Yackel, E. (1993). Discour- Grouws (Ed.), Handbook of research on ma-
se, mathematical thinking, and classroom thematics teaching and learning, pp. 147-164.
practice. En E. A. Forman, N. Minick, y Nueva York: Macmillan.
C. A. Stone (Eds.), Contexts for learning: Fleming, M., y Chambers, B. (1983). Teacher-
Sociocultural dynamics in children’s develo- made tests: Windows on the classroom.
pment, pp. 91-119. Nueva York: Oxford New Directions for Testing and Measurement:
University Press. Testing in the Schools, 19, 29-38.
Connolly, A., Nachtman, W., y Pritchett, M. Forster, M., y Masters, G. (2004). Bridging the
(1972). Keymath diagnostic arithmetic test. conceptual gap between classroom as-
Circle Pines, MN: American Guidance sessment and system accountability. En
Service. M. Wilson (Ed.), Towards coherence between
Cook, W. W. (1941). Achievement tests. En W. classroom assessment and accountability: 103º
S. Monroe (Ed.), Encyclopedia of educational Yearbook of the National Society for the Stu-
research, pp. 1283-1301. Nueva York: Mac- dy of Education, parte 2, pp. 51-73. Chicago:
millan. University of Chicago Press.
Cook, W. W. (1951). The functions of measure- Geertz, C. (1973). The interpretation of cultures.
ment in the facilitation of learning. In E. Nueva York: Basic Books.
F. Lindquist (Ed.), Educational Measure- Gipps, C. V. (1999). Socio-cultural aspects of as-
ment, pp. 3-46. Washington, DC: Ameri- sessment. En P.D. Pearson y A. Iran-Nejad
can Council of Education. (Eds.), Review of research in education, 24,
Crooks, T. J. (1988). The impact of classroom 355-392. Washington, DC: American Edu-
evaluation practices on students. Review cational Research Association.
of Educational Research, 58 (4), 428-481. Glaser, R., y Nitko, A. J. (1971). Measurement in
Deci, E., y Ryan, R. (1985). Intrinsic motivation learning and instruction. En R. L. Thorn-
and self-determination in human behavior. dike (Ed.), Educational measurement, 2a ed.,
Nueva York: Plenum. pp. 625-670. Washington, DC: American
Dorr-Bremme, D. W. (1983). Assessing students: Council on Education.
Teachers’ routine practices and reasoning. Goehring, H. J., Jr. (1973). Course competencies
Evaluation Comment, 6 (4), 1-12. for undergraduate courses in educational
Dweek, C. (1986). Motivational processes affec- tests and measurement. The Teacher Edu-
ting learning. American Psychologist, 41, cator, 9, 11-20.
1040-1048. Goodman, Y. M. (1985). Kidwatching: Ob-
Elawar, M. C., y Corno, L. (1985). A factorial ex- serving children in the classroom. En
periment in teachers’ written feedback on A. Jaggar y M. T. Smith-Burke (Eds.),
student homework: Changing teacher be- Observing the language learner, pp. 9-18.
havior a little rather than a lot. Journal of Newark, DE: International Reading As-
Educational Psychology, 77, 162-173. sociation and National Council of Tea-
Elliot, E., y Dweck, C. (1988). Goals: An approach chers of English.
to motivation and achievement. Journal of Goslin, D. A. (1967). Teachers and testing. Nueva
Personality and Social Psychology, 54, 5-12. York: Russell Sage.

46
La evaluación en el aula

Graue, M. E. (1993). Integrating theory and prac- Lepper, M. (1983). Extrinsic reward and intrinsic
tice through instructional assessment. motivation: Implications for the classro-
Educational Assessment, 1, 293-309. om. En J. Levine y M. Wang (Eds.), Teacher
Harackiewicz, J., Abrahams, S., y Wageman, R. and student perceptions: Implications for lear-
(1987). Performance evaluation and intrin- ning, pp. 281-317. Hillsdale, NJ: Lawrence
sic motivation: The effects of evaluative Erlbaum.
focus, rewards, and achievement orienta- Lidz, C. S. (1987). Dynamic assessment: An interac-
tion. Journal of Personality and Social Psycho- tional approach to evaluating learning poten-
logy, 53, 1015-1023. tial. Nueva York: Guilford Press.
Heath, S. B. (1983). Ways with words: Language, Lindquist, E. F. (Ed.). (1951). Educational measure-
life, and work in communities and classrooms. ment. Washington, DC: American Council
Cambridge: Cambridge University Press. on Education.
Heubert, J., y Hauser, R. (Eds.). (1999). High- Linn, R. L. (Ed.). (1989). Educational measurement,
stakes: Testing for tracking, promotion, and 3a ed. Nueva York: American Council on
graduation. Washington, DC: National Education y Macmillan.
Academy Press. Lorsbach, A. W., Tobin, K., Briscoe, C., y La-
Hiebert, E. H., y Raphael, T. E. (1998). Early lite- Master, S. U. (1992). An interpretation
racy instruction. Fort Worth, TX: Harcourt of assessment methods in middle school
Brace College Publishers. science. International Journal of Science
Hogan, K., y Pressley, M. (1997). Scaffolding Education, 14 (3), 305-317.
scientific competencies within classroom Madaus, G. F., y Stufflebeam, D. L. (2000). Pro-
communities of inquiry. En K. Hogan y M. gram evaluation: A historical overview.
Pressley (Eds.), Scaffolding student learning: En D. L. Stufflebeam, G. F. Madaus, y
Instructional approaches and issues, pp. 74-107. T. Kellaghan (Eds.), Evaluation models:
Cambridge, MA: Brookline Books. Viewpoints on educational and human services
Klenowski, V. (1995). Student self-evaluation evaluation, 2a ed., pp. 3-18. Boston: Kluwer
process in student-centered teaching and Academic.
learning contexts of Australia and En- Madaus, G. F., West, M. M., Harmon, M. C.,
gland. Assessment in education, 2, 145-163. Lomax, R. G., y Viator, K. A. (1992, Octo-
Kluger, A. N., y DeNisi, A. (1996). The effect of ber). The influence of testing on teaching math
feedback interventions on performance: and science in grades 4-12: Executive summary.
A historical review, a meta-analysis, and a Chestnut Hill, MA: Boston College, Cen-
preliminary feedback intervention theory. ter for the Study of Testing, Evaluation,
Psychological Bulletin, 119, 254-284. and Educational Policy.
Kulm, G. (Ed.). (1990). Assessing higher order Marshall, H. H. (1988). Work or learning: Impli-
thinking in mathematics. Washington, DC: cations of classroom metaphors. Educatio-
American Association for the Advance- nal Researcher, 17 (9), 9-16.
ment of Science. Marton, F. y Saljo, R. (1976). On qualitative di-
Lappan, G., Fey, J. T., Fitzgerald, W. M., Friel, S. fferences in learning: 1. Outcome and pro-
N., y Phillips, E. D. (1998). Connected ma- cess. British Journal of Educational Psycholo-
thematics, say it with symbols: Algebraic rea- gy, 46, 4-11.
soning. Student Ed. Menlo Park, CA: Dale Masters, G., y Forster, M. (1997). Mapping literacy
Seymour Publications. achievement: Results of the 1996 National School
Lave, J., y Wenger, E. (1991). Situated learning: Le- English Literacy Survey. Camberra, Australia:
gitimate peripheral participation. Cambrid- Department of Employment, Education,
ge: Cambridge University Press. Training and Youth Affairs (DEETYA).

47
Textos de evaluación

Mathematical Sciences Education Board. (1993). serving children ages 3 through 8. Washing-
Measuring what counts: A conceptual guide for ton, DC: National Association for the
mathematics assessment. Washington, DC: Education of Young Children.
National Academy Press. National Council of Teachers of Mathematics.
Mayo, S. T. (1964, February). What experts think (1989). Curriculum and evaluation standards
teachers ought to know about educational mea- for school mathematics. Reston, VA: Autora.
surement. Ponencia presentada en la re- National Council of Teachers of Mathematics.
union anual del National Council on Mea- (1995). Assessment Standards for School Ma-
surement in Education, Chicago. thematics. Reston, VA: Autora.
Mazur, E. (1997). Peer instruction: A user’s manual. National Research Council. (1989). Everybody
Upper Saddle River, NJ: Prentice Hall. counts: A report to the nation on the future of
McMillan, J. H. (2003). Understanding and im- mathematics education. Washington, DC:
proving teachers’ classroom assessment National Academy Press.
decision making: Implications for theory Nava, F. J. G., y Loyd, B. H. (abril de 1992). An
and practice. Educational Measurement: Is- investigation of achievement and non-achie-
sues and Practice, 22 (4), 34-43. vement criteria in elementary and secondary
McNeil, L. M. (1988). Contradictions of control: school grading. Ponencia presentada en la
School structure and school knowledge. Nueva reunion anual de la American Educational
York: Routledge. Research Association: San Francisco.
Mitchell, M. (1993). Situational interest: Its Newmann, F. (1992). Higher order thinking and
multifaceted structure in the secondary prospects for classroom thoughtfulness.
school mathematics classroom. Journal of En F. Newmann (Ed.), Student engage-
Educational Psychology, 85, 424-436. ment and achievement in American secondary
Moll, L.C., Amanti, C., Neff, D., y González, N. schools, pp. 62-91. Nueva York: Teachers
(1992). Funds of knowledge for teaching: College Press.
Using a qualitative approach to connect Nitko, A. J. (1989). Designing tests that are in-
homes and classrooms. Theory Into Practi- tegrated with instruction. En R. L. Linn
ce, 31 (2), 132-141. (Ed.), Educational measurement, 3ra ed., pp.
Morrow, L. M. (1985). Retelling stories: Strate- 447-474. Nueva York: American Council
gies for improving children’s comprehen- on Education y Macmillan.
sion, concept of story structure, and oral Noll, V. H. (1955). Requirements in educational
language complexity. Elementary School Jo- measurement for prospective teachers.
urnal, 85, 647-661. School and Society, 80, 88-90.
Morrow, L. M., y Smith, J. K. (1990). Assessment Ogle, D. M. (1986). K-W-L: A teaching model
for instruction in early literacy. Englewood that develops active reading of expository
Cliffs, NJ: Prentice Hall. text. The Reading Teacher, 39 (6), 564-570.
Moss, P. A. (1996). Enlarging the dialogue in Pedulla, J. J., Abrams, L. M., Madaus, G. F., Rus-
educational measurement: Voices from sell, M. K., Ramos, M. A., y Miao, J. (2003).
interpretive research traditions. Educatio- Perceived effects of state-mandated testing pro-
nal Researcher, 25, 20-28, 43. grams on teaching and learning: Findings from
Moss, P. A. (2003). Reconceptualizing validity for a national survey of teachers. Boston: Boston
classroom assessment. Educational Measu- College, National Board on Educational
rement: Issues and Practice, 22 (4), 13-25. Testing and Public Policy.
National Association for the Education of Young Pellegrino, J. W., Baxter, G. P., y Glaser, R.
Children. (1990). Guidelines for appropriate (1999). Addressing the “Two Disciplines”
curriculum content and assessment in programs problem: Linking theories of cognition

48
La evaluación en el aula

and learning with assessment and instruc- Seriven (Eds.), Perspectives of curriculum
tional practice. En P. D. Pearson y A. Iran- evaluation, pp. 39-83. Chicago: Rand Mc-
Nejad (Eds.), Review of research in education, Nally.
24, 307-353. Washington, DC: American Shepard, L. A. (2000). The role of assessment in
Educational Research Association. a learning culture. Educational Researcher;
Pellegrino, J. W., Chudowsky, N., y Glaser, R. 29 (7), 4-14.
(2001). Knowing what students know: The Shepard, L. A. (2001) The role of classroom as-
science and design of educational assessment. sessment in teaching and learning. En V.
Washington, DC: National Academy Richardson (Ed.), Handbook of research on
Press. teaching, 4a ed., pp. 1066-1101. Washing-
Perrenoud, P. (1991). Towards a pragmatic appro- ton, DC: American Educational Research
ach to formative evaluation. En P. Weston Association.
(Ed.), Assessment of pupils’ achievement: Mo- Shepard, L. A. (2003). Reconsidering large-scale
tivation and school success, pp. 77-101. Ams- assessment to heighten its relevance to
terdam: Swets and Zeitlinger. learning. En J. M. Atkin y J. E. Coffey
Putnam, R. T., y Borko, H. (2000). What do new (Eds.) Everyday assessment in the science clas-
views of knowledge and thinking have to sroom, pp. 121-146. Arlington, VA: NSTA
say about research on teacher learning? Press.
Educational Researcher, 29 (1), 4-15. Shepard, L. A., y Bliem, C. L. (1995). Parents’
Resnick, L. B., y Resnick, D. P. (1992). Assessing thinking about standardized tests and
the thinking curriculum: New tools for performance assessments. Educational Re-
education reform. En B. R. Gifford y M. searcher, 24 (8), 25-32.
C. O’Connor (Eds.), Changing assessments: Shepard, L., Hammerness, K., Darling-Ham-
Alternative views of aptitude, achievement, mond, L., y Rust, F. (2005). Assessment. En
and instruction, pp. 37-75. Boston: Kluwer L. Darling-Hammond y J. Bransford (Eds.),
Academic. Preparing teachers for a changing world: What
Roeder, H. H. (1972). Are today’s teachers pre- teachers should learn and be able to do, pp.
pared to use tests? Peabody Journal of Edu- 275-326. San Francisco: Jossey-Bass.
cation, 59, 239-40. Silver, E. A., y Kenney, P. A. (1995). Sources of
Romberg, T., y Carpenter, T. (1986). Research assessment information for instructional
on teaching and learning mathematics: guidance in mathematics. En T. A. Rom-
Two disciplines of scientific inquiry. En berg (Ed.), Reform in school mathematics and
M. Wittrock (Ed.), Handbook of research on authentic assessment, pp. 38-86. Albany, NY:
learning, 3a ed., pp. 850-873. Nueva York: State University of New York Press.
Macmillan. Silver, E. A., y Kilpatrick, J. (1989). Testing ma-
Routman, R. (2000). Conversations: Strategies thematical problem solving. En R. Char-
for teaching, learning and evaluating. Ports- les y E. Silver (Eds.), Teaching and assessing
mouth, NH: Heinemann. mathematical problem solving, pp. 178-186.
Sadler, R. (1989). Formative assessment and the Hillsdale, NJ: Lawrence Erlbaum.
design of instructional assessments. Ins- Smith, J. K. (2003). Reconsidering reliability in
tructional Science, 18, 119-144. classroom assessment and grading. Educa-
Salmon-Cox, L. (1981). Teachers and standardi- tional measurement: Issues and Practice, 22 (4),
zed achievement tests: What’s really ha- 26-33.
ppening? Phi Delta Kappan, 69(9), 631-634. Stiggins, R. J. (1991). Relevant classroom as-
Seriven, M. (1967). The methodology of evalua- sessment training for teachers. Educational
tion. En R. A. Tyler, R. M. Gagne, y M. Measurement: Issues and Practice, 10 (1), 7-12.

49
Textos de evaluación

Stiggins, R. J. (2001). Student-involved classroom teacher with implications for corrective proce-
assessment, 3a ed. Upper Saddle River, NJ: dures. Nueva York: Dryden Press.
Prentice Hall. Travers, R. M. W. (1955). Educational measurement.
Stiggins, R. J., y Conklin, N. F. (1992). In teachers’ Nueva York: Macmillan.
hands: Investigating the practices of classro- Tyler, R. W. (1951). The functions of measure-
om assessment. Albany: State University of ment in improving instruction. In E. F.
New York Press. Lindquist (Ed.), Educational measurement,
Stipek, D. J. (1996). Motivation and instruction. pp. 47-67. Washington, DC: American
En D. C. Berliner y R. C. Calfee (Eds.), Council on Education.
Handbook of educational psychology, pp. U. S. Congress, Office of Technology Assessment.
85-113. Nueva York: Simon & Schuster (1992). Testing in American schools: Asking the
Macmillan. right questions (OTA-SET-519). Washington,
Stipek, D. (1998). Motivation to learn: From theory DC: U.S. Government Printing Office.
to practice, 3a ed.,. Boston: Allyn & Bacon. Valencia, S. W., y Calfee, R. C. (1991) The de-
Symonds, P. M. (1927). Measurement in secondary velopment and use of literacy portfo-
education. Nueva York: Macmillan. lios for students, classes, and teachers.
Taylor, C. S., y Nolen, S. B. (2005). Classroom Applied Measurement in Education, 4,
assessment: Supporting teaching and learning 333-346.
in real classrooms. Upper Saddle River, NJ: Van den Heuvel-Panhuizen, M. (2001). A lear-
Pearson Education. ning-teaching trajectory description as a
Teale, W. H., Hiebert, E. y Chittenden, E. (1987). hold for mathematics teaching in primary
Assessing young children’s literacy develo- schools in the Netherlands. En M. Tzeka-
pment. The Reading Teacher, 40, 772-777. ki (Ed.), Didactics of mathematics and infor-
Teale, W. H., y Sulzby, E. (Eds.). (1986). Emergent matics in education. 5a Conferencia Panheléni-
literacy: Writing and reading. Norwood, NJ: ca con Participación Internacional, pp. 21-36.
Ablex. Thessaloniki: Universidad Aristóteles de
Tharp, R. G., y Gallimore, R. (1988). Rousing Thessaloniki, Universidad de Macedonia,
minds to life: Teaching, learning, and schooling Instituto Pedagógico.
in social context. Nueva York: Cambridge Vygotsky, L. S. (1978). Mind in society: The develo-
University Press. pment of higher psychological processes. Cam-
Thorndike, E. L. (1913). Introduction to the theory bridge, MA: Harvard University Press.
of mental and social measurements. Nueva Ward, J. G. (1980). Teachers and testing: A sur-
York: Teachers College, Universidad de vey of knowledge and attitudes. En L.
Columbia. M. Rudner (Ed.), Testing in our schools, pp.
Thorndike, E. L. (1922). Measurement in educa- 15-24. Washington, DC: National Institu-
tion. En Twenty-first yearbook of the Natio- te of Education.
nal Society for the Study of Education. Parte White, B. Y., y Frederiksen, J. R. (2000). Me-
1, pp. 1-9. Bloomington, IL: Public School tacognitive facilitation: An approach to
Publishing. making scientific inquiry accessible to
Thorndike, E. L. (1931). Human learning. Nueva all. En J. Minstrell y E. van Zee (Eds.), In-
York: Century. quiring into inquiry learning and teaching in
Thorndike, E. L. (1971). Educational measurement, science, pp. 33-370. Washington, DC: Ame-
2a ed. Washington, DC: American Council rican Association for the Advancement of
on Education. Science.
Torgerson, T. L., y Adams, G. S. (1954). Measure- Wigheld, A., Eccles, J. S., y Rodríguez, D. (1998).
ment and evaluation for the elementary-school The development of children’s motivation

50
La evaluación en el aula

in school contexts. En P. D. Pearson y A. Wiggins, G., y McTighe, J. (1998). Understanding by


Iran-Nejad (Eds.), Review of Research in Edu- design. Alexandria, VA: Association for Su-
cation, 23, 73-118. Washington, DC: Ameri- pervision and Curriculum Development.
can Educational Research Association. Wood B. D. (1923). Measurement in higher edu-
Wiggins, G. (1992). Creating tests worth taking. cation. Yonkerson-Hudson, Nueva York:
Educational Leadership, 49, 26-33. Banco Mundial.
Wiggins, G. (1993). Assessment: Authenticity, Wood, D., Bruner, J. S., y Ross, G. (1976). The role
context, and validity. Phi Delta Kappan, 74, of tutoring in problem-solving. Journal of
200-214. Child Psychology and Psychiatry, 17, 89-100.
Wiggins, G. (1998). Educative assessment: Desig- Yeh, J. P., Herman, J. L., y Rudner, L. M. (1981).
ning assessments to inform and improve stu- Teachers and testing: A survey of test use (CSE
dent performance. San Francisco: Jossey- Report No. 166). Los Ángeles: UCLA,
Bass. Center for the Study of Evaluation.

51
Textos de evaluación

52