Articulo Evaluacion PDF

EL FUTURO DE LA EVALUACIN EDUCATIVA
Felipe Martnez Rizo

Currculo: licenciado en Ciencias Sociales. Profesor-investgador del Departamento de Edu-
cacin, Centro de Ciencias Sociales y Humanidades, Universidad Autnoma de Aguascalien-
tes. Sus lneas de investgacin incluyen la educacin superior y la bsica, en temas de cali-
dad, planeacin, evaluacin y desigualdad.
Recibido: 11 de septembre de 2012. Aceptado para su publicacin: 10 de di-
ciembre de 2012.
Como citar este artculo: Martnez, F. (enero-junio, 2013). El futuro de la eva-
luacin educatva. Sinctca, 40. Recuperado de htp://www.sinectca.iteso.
mx/artculo/?id=40_el_futuro_de_la_evaluacion_educatva
Resumen
Despus de precisar la nocin de evaluacin, y acotarla en relacin con la que
tene como objeto la calidad de los sistemas de educacin bsica, el artculo re-
visa la situacin que prevalece en Mxico y Amrica Latna en lo que se refere a
cinco tpos partculares de evaluacin: pruebas de aprendizaje, indicadores es-
tadstcos, evaluaciones de docentes, evaluaciones de escuelas y evaluaciones
de insttuciones de educacin superior. Luego, se esbozan dos escenarios que
se podrn presentar en el futuro: el que se podra esperar en el caso de que
la situacin y las tendencias que prevalecen en la actualidad no se modifquen
sustancialmente, y otro deseable, en el caso de que se corrijan los defectos que
se identfcan en la actualidad y se potencien los puntos positvos.
Palabras clave: evaluacin educatva, Mxico, tendencias.
Abstract
The paper specifes the noton of evaluaton & assessment, in relaton to the
quality of educaton systems at the elementary and middle levels. The situa-
ton in Mexico and Latn America is reviewed in regard to fve specifc types of
evaluaton: learning tests, statstcal indicators, evaluatons of teachers, eva-
luatons of schools and of higher educaton insttutons. Finally two future sce-
narios are outlined: one which could be expected if trends currently prevailing
are not substantally altered; another one if negatve aspects are corrected and
positve are enhanced.
Keywords: educatonal evaluaton, assessment, Mexico, trends.
Introduccin
E
ste trabajo se plantea tres preguntas estrechamente relacionadas: cul es
la situacin actual de la evaluacin educatva en Mxico y, de manera ms
amplia, en Amrica Latna? Qu retos debe enfrentar? Hacia dnde parece
dirigirse y hacia dnde sera deseable que se dirigiera? Antes de tratar de responder
tan complejas cuestones, es necesario delimitar bien nuestro objeto de inters.
La evaluacin se puede defnir como el juicio de valor que resulta de contrastar
el resultado de la medicin de una realidad emprica con un parmetro normat-
vo previamente defnido (INEE, 2006, p. 18). Esta defnicin se aplica a cualquier
objeto, e implica la nocin de calidad, pues siempre se evala la calidad de algo.
2 Martnez. El futuro de la evaluacin educatva
Sinctca 40 www.sinectca.iteso.mx
En nuestro caso se tratar de la evaluacin de la calidad educatva, pero todava
son necesarias precisiones adicionales, ya que es frecuente que la nocin se iden-
tfque con la que tene por objeto el aprendizaje que alcanzan los estudiantes,
cuando en realidad se puede referir a otros evaluandos, como los docentes, las
escuelas o el sistema educatvo mismo. En este trabajo, la nocin se entender
referida a este ltmo objeto. Se abordar, pues, la evaluacin de la calidad de los
sistemas educatvos y, en partcular, de educacin bsica.
Ahora bien, un sistema educatvo es un conjunto de muchos elementos: alum-
nos, docentes y escuelas, pero tambin planes y programas de estudio, libros de
texto y materiales didctcos, directores de plantel, supervisores, autoridades y,
adems, normas, reglamentos, poltcas, organizacin, etctera.
Es importante distnguir evaluaciones que buscan llegar a juicios sobre indivi-
duos (sean stos alumnos, docentes, centros escolares u otros), en contraste con
las que buscan alcanzar conclusiones sobre un sistema educatvo en conjunto. En
el caso de evaluaciones de aprendizaje, unas sirven para dar resultados de cada
alumno, sea para decidir si pasa al grado siguiente o debe repetr el mismo curso;
sea para tener elementos para ajustar sus esfuerzos para mejorar el aprendizaje
ulterior. Otras evaluaciones, en cambio, sirven para informar sobre la situacin
promedio del aprendizaje de los alumnos de cierto nivel, y para sustentar decisio-
nes de poltca que afecten al conjunto del sistema educatvo.
En el primer caso, es necesario aplicar las pruebas a todos los alumnos (censo),
mientras que en el segundo basta con hacerlo a una muestra representatva, lo
que permite usar instrumentos que midan aspectos ms complejos.
El nivel de aprendizaje es, sin duda, un aspecto fundamental de la calidad de un
sistema educatvo, pero no el nico. Si una parte de los nios que deberan asistr
a determinados grados est fuera de la escuela, el sistema educatvo no podr
considerarse de buena calidad, aunque los que s asistan tengan buenos niveles
de aprendizaje. Tampoco podr considerarse bueno un sistema educatvo cuyas
escuelas ofrezcan un currculo obsoleto o irrelevante, que no d a los alumnos lo
que necesitarn para una vida adulta plena; ni uno en el que algunos alumnos al-
cancen buenos resultados, pero muchos no, o uno que no cuente con los recursos
bsicos para operar adecuadamente.
Para evaluar cada una de las dimensiones anteriores de la calidad de un siste-
ma educatvo se necesitan distntos acercamientos. Las pruebas de aprendizaje
slo sirven para evaluar ese aspecto, pero para otros se debern manejar indica-
dores basados en estadstcas; o bien, se requerirn estudios especiales, a veces
de gran complejidad, como los que son necesarios para la evaluacin de docentes.
En este artculo se revisar primero la situacin actual de la evaluacin edu-
catva en Mxico y Amrica Latna en lo que se refere a varias de esas modalida-
des (pruebas de aprendizaje, indicadores estadstcos, evaluaciones de docentes,
evaluaciones de escuelas y evaluaciones de insttuciones de educacin superior),
tratando de identfcar puntos fuertes y dbiles. En seguida, y en relacin con los
mismos puntos ya considerados, se esbozarn dos escenarios que se podrn pre-
sentar en el futuro: el que se podra esperar en el caso de que la situacin y las
tendencias que prevalecen en la actualidad no se modifquen sustancialmente, y
otro deseable, en el caso de que se corrijan los defectos que se identfcan en la
actualidad y se potencien los puntos positvos.
Las evaluaciones en Mxico y Amrica Latina en 2012
Pruebas de aprendizaje
Al inicio de los aos noventa, la experiencia de Mxico en pruebas estandarizadas
se reduca a exmenes de ingreso a normal, el IDANIS (Instrumento de Diagnstco
para Aspirantes de Nuevo Ingreso a Secundaria) y el Estudio de Evaluacin de Pri-
maria que la Secretara de Educacin Pblica (SEP) comenz a aplicar en la dcada
de 1970. En los noventa, esas actvidades recibieron un fuerte impulso debido a la
conjuncin de varios elementos (Martnez Rizo y Santos del Real, 2009):
La frma del Acuerdo Nacional para la Modernizacin de la Educacin
Bsica (ANMEB, 1992) entre las autoridades y el Sindicato Nacional de
Trabajadores de la Educacin (SNTE), que incluy el inicio del programa
de estmulos de Carrera Magisterial. Para asignar esos estmulos, se de-
cidi tomar en cuenta, entre otros aspectos, el aprendizaje alcanzado
por los alumnos de los maestros que aspiraban a recibir los apoyos, por
lo que fue necesario aplicar pruebas de rendimiento a nmeros conside-
rables de chicos. La primera aplicacin fue en 1993 e involucr a ms de
cuatro millones de alumnos. Esas evaluaciones del llamado Factor de
Aprovechamiento Escolar se siguieron aplicando hasta 2005, cuando el
nmero de alumnos evaluados se acerc a ocho millones.
En 1991, el gobierno mexicano, con apoyo del Banco Mundial, puso
en marcha un programa compensatorio en benefcio de cuatro estados:
el Programa para Abatr el Rezago Educatvo (PARE), cuya evaluacin in-
cluy la aplicacin de pruebas de aprendizaje. Luego, contnuaron otros
programas compensatorios, siempre con evaluaciones que incluan apli-
car pruebas de rendimiento.
El ingreso de Mxico a la OCDE, en 1994, incluy el inters por part-
cipar en el proyecto PISA, de la OCDE, cuya primera aplicacin fue en el
ao 2000. Por la misma poca, comenz la partcipacin en otros proyec-
tos de evaluacin educatva de alcance internacional: en 1995, el Tercer
Estudio Internacional de Matemtcas y Ciencias (TIMSS); en 1996, el pri-
mer estudio del Laboratorio Latnoamericano de Evaluacin de la Calidad
Educatva (LLECE).
A partr de la reforma curricular de principios de la dcada, en 1996 co-
menz un trabajo de defnicin de estndares curriculares, junto con el
desarrollo de instrumentos de evaluacin del aprendizaje alcanzado por
los alumnos en relacin con esos estndares. Esos instrumentos se deno-
minaron Pruebas de Estndares Nacionales, y se aplicaron por primera
vez en 1998. Hasta 2004 se aplicaron cada ao a muestras nacionales de
alumnos de primaria y, desde 2000, tambin de la secundaria bsica. Las
pruebas fueron acompaadas por cuestonarios sobre el contexto de la
enseanza y el hogar.
Adems, se sigui aplicando el IDANIS y se desarrollaron pruebas para pre-
miar a alumnos destacados en el marco de las Olimpiadas del Conocimiento.
En la primera dcada del siglo XXI se dieron nuevos pasos con la creacin, en agos-
to de 2002, del Insttuto Nacional para la Evaluacin de la Educacin (INEE), como
instancia dotada de autonoma tcnica.
Tras constatar la existencia de serias fallas tcnicas de las Pruebas de Estnda-
res Nacionales aplicadas de 1998 a 2003, en 2004 el INEE decidi emprender el
desarrollo de nuevos instrumentos que cubrieran de manera ms amplia las reas
del currculo con pruebas de diseo matricial aplicadas a muestras representatvas
de alumnos en un ciclo de cuatro aos (un ao se evaluara a los alumnos de 3 de
secundaria, otro a los de 6 de primaria, uno ms a los de 3 de primaria, y otro a
los de 3 de preescolar).
Las primeras de estas nuevas pruebas (Exmenes de la Calidad y el Logro Educa-
tvo, EXCALE) se aplicaron en 2005. Ese mismo ao, con apoyo tcnico del INEE, la
SEP decidi emprender el desarrollo de otras pruebas nuevas, que se denominaron
Exmenes Nacionales del Logro Educatvo en Centros Escolares (ENLACE) y se utliza-
ron por primera vez en 2006. La aplicacin, sin embargo, no fue como se haba pla-
neado, ya que en lugar de usar un ciclo multanual similar al de las pruebas EXCALE,
se decidi aplicarlas anualmente a los cuatro ltmos grados de primaria y el ltmo
de secundaria bsica. Tampoco dejaron de emplearse todas las otras pruebas que se
pretenda susttuir con las nuevas (Martnez Rizo y Santos del Real, 2009).
Durante la administracin federal 2007-2012, el trabajo del INEE sigui mejo-
rando su calidad tcnica con el desarrollo de pruebas de respuesta abierta para
evaluar expresin escrita y niveles cognitvos complejos; pruebas de ejecucin
para nios de preescolar; mtodos complejos de muestreo; modelos estadstcos
sofstcados para el anlisis de los resultados, como los modelos lineales jerrqui-
cos y los de ecuaciones estructurales, adems de los de respuesta al tem. En el
mbito internacional, la partcipacin en PISA fue cada vez ms actva, tanto en la
preparacin de las pruebas como en cuanto al anlisis de los resultados.
En cuanto a las pruebas ENLACE, desde los primeros resultados prevaleci la
tendencia a interpretarlos simplistamente, y usarlos para hacer ordenamientos
de escuelas, supuestamente segn su calidad, con base slo en los resultados de
los alumnos, sin tener en cuenta las condiciones de la escuela, el nmero de los
alumnos evaluados, entre otros aspectos. Estas tendencias se acentuaron tras las
aplicaciones de 2007 y 2008, al grado que las pruebas ENLACE, con las de la OCDE,
se volvieron el referente bsico de la poltca educatva. Su propsito formatvo
inicial se ha desvirtuado por usos que las hicieron de gran impacto, lo que hace
que surjan prctcas negatvas de preparacin para las pruebas y reduccin del
currculo en funcin de su contenido. Han comenzado incluso a aparecer pruebas
preparatorias a nivel estatal (ENLACE intermedio) (Martnez Rizo y Santos del Real,
2009; Martnez Rizo y Blanco, 2010).
En Amrica Latna, las pruebas en gran escala son tambin omnipresentes y
tenen un peso cada vez mayor en las poltcas. Hace tres dcadas, ningn pas de
la regin tena pruebas censales o muestrales que dieran resultados sobre el siste-
ma educatvo en conjunto. Chile fue el primer pas de la regin que estableci un
sistema nacional, y en la dcada de 1980 algunos pases, como Mxico, avanzaron
tmidamente en esa direccin (Martnez Rizo, 2010a; Ferrer, 2006; UNESCO, 2008;
Wolf, 2004). No obstante, fue a partr de 1990 cuando tales sistemas surgieron en
la mayora de los pases de la regin (como ocurri en Europa, cfr. AEAEAC, 2009),
aunque muchas veces sin contnuidad, dependiendo de asesora y recursos exter-
nos y con serias limitaciones tcnicas. Un rasgo ms era la escasa difusin de los
resultados y el limitado uso que se haca de ellos.
En 2010, casi todos los pases contaban ya con evaluaciones muestrales en edu-
cacin bsica y, en diversa forma, Argentna, Brasil, Chile, Colombia, Costa Rica, la
Repblica Dominicana, Ecuador, El Salvador, Guatemala, Mxico y Uruguay tenen
o han tenido aplicaciones con carcter censal. La partcipacin en evaluaciones
internacionales aument tambin con las del LLECE, las de la IEA y las de PISA
(Martnez Rizo, 2010a).
Pese a su dbil tradicin psicomtrica, en varios pases el sistema de evaluacin
se consolida tcnica y organizacionalmente. Tambin hay riesgos: por una parte,
la tradicional falta de contnuidad que suele acompaar a los cambios poltcos;
por otra, la aparicin de efectos perversos para la calidad, que se explican por el
concurso de varios factores: desconocimiento de los alcances y lmites reales de
las pruebas por parte de los tomadores de decisiones; presin de los medios de
comunicacin que privilegian interpretaciones simplistas y escandalosas; peso de
sectores privados que desconocen las circunstancias de las escuelas pblicas y
esperan demasiado de las privadas, entre otros.
Un aspecto partcular es el excesivo peso que se da a las pruebas censales que,
por sus caracterstcas, y contra lo que suele pensarse, dan resultados menos pre-
cisos que buenas pruebas muestrales. La razn de esta aparente paradoja es que
el error no derivado del muestreo tende a aumentar cuando lo hace el tamao de
la aplicacin, que es cada vez ms difcil controlar, de suerte que puede ser bastan-
te mayor al error de muestreo, que se puede estmar con precisin.
Ejemplos de lo anterior es, en Mxico, el peso abrumador de ENLACE frente a
la poca atencin que se presta a las pruebas del INEE; en Brasil, donde la PROVA
Brasil (censal) desplaza al SAEB (muestral); en Per, donde un valioso trabajo de
pruebas muestrales ha dejado el lugar a pruebas censales hechas en forma apresu-
rada; en la Repblica Dominicana, donde desde los aos 1990 se daba gran valor a
los resultados de pruebas censales que tena serias defciencias, slo recientemente
reconocidas. En Colombia el ICFES maneja pruebas censales e insiste en la necesidad
de no hacer usos de alto impacto y evitar la difusin de ordenamientos de escuelas,
postura que debe enfrentar fuertes presiones en contrario (Martnez Rizo, 2010a).
La experiencia latnoamericana, al igual que la mexicana, muestra que la proli-
feracin de pruebas, sobre todo de tpo censal y su excesivo peso en las poltcas
debido a su alto impacto, trae ya consecuencias negatvas serias:
Banalizacin del debate pblico sobre la calidad educatva, reducido a
superfciales debates de ordenamientos discutbles.
Mercadotecnia engaosa de las escuelas, sobre todo de sostenimiento
privado, que buscan atraer alumnos basadas en esos ordenamientos.
Empobrecimiento del currculo, por la tendencia a ensear para las
pruebas y descuidar aspectos fundamentales que no sern evaluados.
Cansancio y desaliento en escuelas que, pese a su esfuerzo, no consiguen
resultados comparables con planteles de condiciones ms favorables.
Rechazo de los alumnos ante una educacin centrada en prepararlos
para la prueba.
Empobrecimiento de las poltcas pblicas, que tenden a buscar solu-
ciones fciles a problemas complejos y descuidan aspectos fundamenta-
les, en partcular la equidad (Martnez Rizo, 2010b).
Indicadores
El sistema educatvo mexicano, como los de los pases de Amrica Latna y otros,
producen regularmente datos estadstcos sobre aspectos bsicos (como nmero
de escuelas, alumnos y maestros) y estadstcas sociales que incluyen aspectos
educatvos, como analfabetsmo y escolaridad. Con esos datos se construyen des-
de hace dcadas indicadores elementales, como las tasas brutas de cobertura o
los aos promedio de escolaridad de la poblacin adulta. Tanto las estadstcas
como los indicadores tradicionales, sin embargo, adolecan de serias fallas tcni-
cas, que han comenzado a corregirse en pocas muy recientes.
Al constatar las defciencias de las estadstcas educatvas tradicionales, en la
dcada de 1980 la OCDE comenz el desarrollo del sistema de indicadores INES
(Indicators of Natonal Educaton Systems), que desde 1991 produce anualmente
el volumen denominado Educaton at a Glance. La Unin Europea impuls por
la misma poca un sistema para los pases que la integran, y en 1999 la UNESCO
estableci el Insttuto de Estadstca. Los tres esfuerzos se conjuntan ahora para
producir estadstcas de mejor calidad, con el sistema UEO (UNESCO, Unin Euro-
pea, OCDE) (Martnez Rizo, en prensa).
En Mxico, desde 2002, el INEE comenz a desarrollar un sistema de indica-
dores que inicialmente cubra slo los niveles de educacin preescolar, primaria
y secundaria, y a partr de 2009 incluy tambin la media superior. El sistema se
distngue por su solidez conceptual y metodolgica; tene en cuenta la perspectva
del derecho a la educacin y procura el desarrollo de indicadores complejos que
den cuenta cada vez mejor de las diferentes dimensiones de la calidad.
En 2005, el INEE inici un trabajo con la Unidad de Planeacin y Evaluacin de
la Poltca Educatva (UPEPE) de la SEP para producir en conjunto un sistema de
indicadores, lo que dio lugar a la publicacin de un primer anuario conjunto (INEE-
SEP, 2006). A partr de 2007, ese esfuerzo no tuvo contnuidad.
Posteriormente, los trabajos relatvos a indicadores han incluido un esfuerzo
conjunto con el Consejo Nacional de Evaluacin de la Poltca de Desarrollo Social
(Coneval) para la medicin multdimensional de la pobreza; el INEE es la instancia
a cargo de la dimensin de educacin.
En Amrica Latna, adems de los avances promovidos por la UNESCO a travs de
su Insttuto de Estadstca, especialmente en relacin con el programa de Educacin
para Todos (Educaton for All, EFA), deben mencionarse al menos otros tres esfuerzos:
El Proyecto Regional de Indicadores Educatvos (PRIE), promovido por
la Cumbre de las Amricas de 1998 y coordinado por la Ofcina Regional
de la UNESCO para Amrica Latna y el Caribe (OREALC), en colabora-
cin con el Ministerio de Educacin de Chile y luego con la SEP mexicana
(PRIE, 2003 y 2011).
El proyecto Sistema de Informacin de Tendencias Educatvas en Am-
rica Latna (SITEAL) de la ofcina de Buenos Aires del Insttuto Internacio-
nal de Planeamiento Educatvo (IIPE) de la UNESCO (SITEAL, s.f.).
Y el proyecto Metas 2021 de la Organizacin de Estados Iberoameri-
canos (OEI), que incluye un sistema de indicadores para monitorear los
avances de los pases de la regin (OEI, 2010 y 2011).
Evaluacin de docentes
Con variantes, los salarios de los docentes representan con mucho el rengln ms
importante del gasto en todos los sistemas educatvos, debido a que la educacin
es un servicio intensivo en mano de obra califcada en el que, al menos hasta aho-
ra, el trabajo de los docentes no puede ser susttuido por el de una mquina.
En general, hay sistemas de evaluacin del trabajo docente, pero suele haber
gran insatsfaccin al respecto, porque se basan simplemente en la escolaridad y
antgedad en el servicio de los maestros, as como en evaluaciones hechas por
directores y supervisores, elementos que no parecen los mejores para distnguir
los buenos docentes de los que no lo son.
Tal insatsfaccin es justfcada, sin duda, aunque no se debe olvidar que el uso
de esos criterios fue un avance respecto a prctcas anteriores. La escala nica de
salarios (single-salary schedule), establecida a principios del siglo XX en Estados
Unidos, buscaba erradicar la prctca de pagar al maestro segn el nivel educatvo
en que trabajara (en primaria menos que en secundaria); segn su gnero (a los
maestros ms que a las maestras); y pertenencia a minoras tnicas: a los blancos
ms que a otros grupos (Prostk, 1996). En la Nueva Espaa, los requisitos para ser
admitdo en el gremio de los maestros eran primero demostrar pureza de sangre
y ser cristano viejo, y slo despus dominar los conocimientos bsicos de lectu-
ra, escritura y aritmtca (Martnez Rizo, 2011).
El inters por tener formas de estudiar y evaluar la efectvidad docente con ma-
yor validez y confabilidad que la que permiten los sistemas vigentes est llevando
a desarrollar sistemas que incluyen evaluaciones estandarizadas de conocimien-
tos, pero adems portafolios de evidencias de la prctca y observacin directa de
sta. La creciente disponibilidad de resultados de pruebas de aprendizaje que se
aplican censalmente est llevando tambin a utlizar los resultados de los alumnos
como indicador de la competencia del docente, si bien los expertos coinciden en
sealar que las tcnicas disponibles distan mucho todava de tener la precisin
y confabilidad necesarias para sustentar decisiones importantes sobre maestros
individuales (Martnez Rizo, 2011).
En Amrica Latna destaca Chile, con el Sistema de Evaluacin del Desempeo
Profesional Docente (SEDPD), cuyo desarrollo comenz en 2003, con la defnicin
de los estndares del Marco para la Buena Enseanza. El trabajo tcnico est a
cargo del Centro de Medicin de la Universidad Catlica de Chile (MIDE-UC), con
el Centro de Perfeccionamiento, Experimentacin e Investgaciones Pedaggicas
(CPEIP) del Ministerio de Educacin de ese pas.
Se usan cuatro instrumentos: una autoevaluacin; una entrevista por un eva-
luador par; un informe de referencia de terceros (el director y el jefe de la Uni-
dad Tcnico Profesional de la escuela); y un portafolio de desempeo pedaggico.
Cada uno tene pautas precisas aplicadas por personal califcado. El cuidadoso
trabajo de diseo y validacin de los instrumentos del SEDPD hace de l un caso
ejemplar en la regin, que se compara favorablemente con los sistemas anlogos
de los sistemas educatvos ms desarrollados (Manzi, Gonzlez y Sun, 2011).
En Mxico, a partr del ANMEB de 1992, el sistema escalafonario se modifc
con el esquema de estmulos de Carrera Magisterial que, adems de escolaridad,
antgedad y la evaluacin del director y el colectvo docente, inclua los factores
de preparacin profesional y aprovechamiento escolar. En 2008, tras la frma de
la Alianza por la Calidad de la Educacin por la SEP y el SNTE, se anunci que el
acceso de los aspirantes a las plazas de maestro de educacin bsica dejara de
ser decidido discrecionalmente para dejar lugar a concursos de oposicin, que
comenzaron a implementarse en forma desigual segn las entdades. En 2011 se
dieron dos pasos ms: la modifcacin del peso de los factores considerados en
Carrera Magisterial, en los que el factor aprovechamiento escolar, ahora basado
en los resultados de las pruebas ENLACE, pas a tener el 50% del total, y el esta-
blecimiento de la llamada Evaluacin universal, que se implement por primera
vez en 2012, con muchas irregularidades.
A solicitud de la SEP, en 2010 la OCDE entreg a Mxico un documento con
recomendaciones para implementar un nuevo sistema de evaluacin de maestros
con rasgos similares al de Chile, pero tal recomendacin no ha sido atendida. El
reto de contar con un buen sistema en este campo sigue presente.
Evaluacin de escuelas
De manera similar a lo que ocurre con la evaluacin de docentes, la valoracin de
la calidad de los centros escolares no se puede basar solamente en los resultados
que obtenen los estudiantes en pruebas de rendimiento porque, adems de las
limitaciones que tenen esos instrumentos, hay muchos factores que inciden en la
calidad y, sobre todo, esa nocin tene otras dimensiones importantes, adems del
aprendizaje de los alumnos. Por ello, la evaluacin de centros escolares implica el
uso de una gama de herramientas, incluyendo portafolios de evidencias, estudios
de los recursos de la escuela y de los procesos que tenen lugar en ella, como el
trabajo en equipo del colectvo docente con el liderazgo del director, que produ-
cen cierto clima y la partcipacin de los padres de familia.
Tradicionalmente, la funcin de los supervisores o inspectores escolares inclu-
ye de alguna manera la evaluacin de las escuelas a su cargo, pero esa funcin se
realizaba en forma poco sistemtca. En las ltmas dcadas se han desarrollado
modelos para ese propsito, unos derivados de los estudios de escuelas efcaces y
otros en el marco de programas de acreditacin o certfcacin de calidad, a veces
relacionados con la familia de normas ISO.
En Mxico, la SEP promovi trabajos de esta naturaleza utlizando modelos de
Espaa y Escocia. En el INEE se han realizado tambin estudios de evaluacin en
gran escala de recursos y procesos de las escuelas (Martnez Rizo, 2002).
El futuro de las evaluaciones
Pruebas de aprendizaje
El uso de pruebas en gran escala para evaluar el nivel de aprendizaje que logran
alcanzar los alumnos de diferentes grados y niveles de la educacin bsica es, pro-
bablemente, un elemento que se volver permanente, tanto en Mxico como en
toda Amrica Latna y en el mundo.
Lleva a pensar lo anterior la creciente disponibilidad de la tecnologa necesaria
para realizar los complejos operatvos que implican dichas pruebas, tanto en lo
relatvo a los conocimientos psicomtricos necesarios como en cuanto a lo que
se requiere para la aplicacin de las pruebas, la captura de los resultados y su
procesamiento y anlisis. Es previsible que en un futuro no lejano ser usual la
aplicacin en lnea en lugar de mediante lpiz y papel, lo que, adems de reducir
de manera notable los costos, en principio permitr manejar pruebas de mejor
calidad, en partcular para la evaluacin de niveles cognitvos complejos.
Los riesgos de malos usos de este tpo de evaluaciones, sin embargo, estn
presentes y no son menores, por el desconocimiento de las cuestones tcnicas
por parte de muchos tomadores de decisiones, junto a la presencia de intereses
ajenos a lo que tendra que ver estrictamente con la mejora de la calidad educa-
tva en el sentdo ms completo de la expresin, incluyendo las dimensiones de
relevancia y equidad.
Por lo anterior, es posible considerar dos futuros posibles: uno que prolongara
los aspectos negatvos actualmente presentes en el uso de pruebas estandarizadas,
y otro que, adems de aprovechar el potencial de la tecnologa, en partcular de la
informtca, enriquecera la visin de los alcances y lmites de las evaluaciones en
gran escala, vindolas no como susttuto del maestro, sino como complemento de
la tarea de unos docentes profesionales, cuyo trabajo es irremplazable tanto para
promover el desarrollo cognitvo e integral de los alumnos como para evaluar de
manera integral tambin su desempeo, en especial con un enfoque formatvo.
Indicadores
En este mbito puede mantenerse durante cierto tempo la situacin que prevale-
ce en muchos pases, en el sentdo de contar con estadstcas que tenen limitacio-
nes claras y con indicadores elementales basados en ellas. Los avances en el plano
internacional, sin embargo, junto con la creciente disponibilidad de capacidades
tcnicas y de infraestructura, hacen previsible que, en el mediano plazo, en todos
los pases se producirn avances importantes, gracias a los cuales la calidad de las
estadstcas mejorar sustancialmente, y ser posible desarrollar indicadores de
segunda generacin. En Mxico, el trabajo del INEE y el del Coneval hacen pensar
que la perspectva ms optmista se puede hacer realidad en corto plazo.
Evaluacin de docentes y de escuelas
La tecnologa necesaria para poner en marcha sistemas avanzados de evaluacin
de docentes est disponible, pero implica tempos largos y una gran capacidad
organizatva, adems de superar obstculos de carcter poltco. Por ello, parece
probable que los insatsfactorios sistemas que prevalecen en la mayor parte de los
pases de la regin latnoamericana, incluido Mxico, no se modifcarn de mane-
ra sustancial en el corto plazo. Sera de esperar que se multpliquen experiencias
positvas en sistemas educatvos de dimensiones no muy grandes, como los de
algunos pases o regiones de pases grandes. La generalizacin de sistemas avan-
zados llevar seguramente ms de una dcada. Algo similar parece probable en lo
relatvo a evaluacin de escuelas.
Conclusin
En Mxico y, al parecer, en otros pases de la regin, en muchos sectores sociales
prevalece una gran preocupacin por la calidad educatva, y sin duda hay motvos
para ello, aunque tambin abundan lecturas de los datos disponibles que destacan
de manera unilateral los puntos dbiles e ignoran tanto los fuertes, que tambin
existen, como los elementos contextuales e histricos que deben considerarse
para poner en perspectva unos y otros.
Las visiones negatvas de la situacin educatva suelen tener una idea tambin
demasiado simple de la evaluacin y de lo que habra que hacer para conseguir
que la calidad educatva mejore. Muchos crtcos no tenen conciencia de lo difcil
que es alcanzar buenos resultados con alumnos de origen social desfavorable, y
es frecuente que vean con simpata estrategias simplistas, como pensar que las
fallas de la escuela pblica se podran corregir con facilidad en escuelas privadas
como las que atenden a sus hijos, e ignoran que menos de diez por ciento de los
mexicanos asisten a ellas. Por eso, hay opiniones de que bastar con aplicar prue-
bas masivamente y tomar medidas correctvas simples para que la calidad de la
educacin mejore de modo sustancial.
En otras palabras, las estrategias simplistas de mejora parten de un supuesto
falso: hacer buena educacin en cualquier contexto es fcil:
Los sistemas de rendicin de cuentas basados en pruebas se basan en la
creencia de que la educacin pblica puede mejorar gracias a una estra-
tegia sencilla: haga que todos los alumnos presenten pruebas estandari-
zadas de rendimiento, y asocie consecuencias fuertes a las pruebas, en
la forma de premios cuando los resultados suben y sanciones cuando no
ocurra as (Hamilton, Stecher y Klein, 2002).
La evaluacin educatva con pruebas estandarizadas, sistemas de indicadores u
otros instrumentos puede contribuir a que la calidad mejore, pero ello no se
produce automtcamente, ya que en algunos casos la evaluacin puede tener
consecuencias contraproducentes. Lo indispensable para que la calidad mejore
es un trabajo intenso y bien orientado por parte de maestros y escuelas, con apo-
yo del resto de la sociedad. Para ello, ayudan muchas cosas, incluyendo buenas
evaluaciones. Lo que no hace falta es un uso de los resultados que desorienta a
tomadores de decisiones y sociedad, lleva a unos a jactarse de logros dudosos y a
otros, entre los que se cuentan personas serias y comprometdas, a perder incluso
la poca esperanza que an tenan (Martnez Rizo, 2012).
Referencias bibliogrficas
Agencia Ejecutva en el mbito Educatvo, Audiovisual y Cultural (AEAEAC) (2009).
Pruebas nacionales de evaluacin del alumnado en Europa: objetvos, organiza-
cin y utlizacin de los resultados. EURYDICE-EACEA-Ministerio de Educacin.
Ferrer, G. (2006). Educatonal Assessment Systems in Latn America: Current Practce
and Future Challenges. Washington: Programa de Promocin de la Reforma Edu-
catva en Amrica Latna y el Caribe, PREAL.
Hamilton, L., Stecher, B. & Klein, S. (Eds.) (2002). Making sense of test-based accoun-
tability in educaton. Santa Mnica, CA: Rand Corporaton.
INEE (2006). Plan Maestro de Desarrollo 2007-2014. Mxico.
INEE-SEP (2006). Sistema de Indicadores Educatvos de los Estados Unidos Mexicanos.
Conjunto bsico para el ciclo 2005-2005. Mxico.
Manzi, J., Gonzlez, R. y Sun, Y. (2011). La evaluacin docente en Chile. Santago: MI-
DE-Universidad Catlica.
Martnez Rizo, F. (en prensa). Los indicadores y su construccin: qu esperar y qu
cuidar. En Roca, E. y Kisilevsky, M. (Coords.). Indicadores, metas y poltcas educa-
tvas. Madrid: OEI-Santllana.
_____ (2012). Usos y abusos de la evaluacin educatva. Experiencias de Mxico. En
Gaviria, J. L. (Ed.). Liber Amicorum Arturo de la Orden. Madrid.
_____ (2011, octubre). La evaluacin del profesorado. Presentada en VII Jornadas de
Cooperacin Educatva Iberoamericana sobre Educacin. Mxico.
_____ (2010a). Assessment in the context of educatonal policy: Latn American Cou-
ntries. En Paterson, P., Baker, E. & McGaw, B. (Eds.). Internatonal Encyclopedia of
Educaton (3rd Ed.). Oxford-New York: Elsevier.
_____ (2010b, agosto). Usos y abusos de la evaluacin. Este Pas (232), 24-27.
_____ (2007). Marco conceptual y metodolgico. En Propuesta y experiencias para de-
sarrollar un sistema nacional de indicadores educatvos (pp. 59-88). Mxico: INEE.
_____ (2002). Anexos 1 y 2. Revisin de literatura y bibliografa. En Varios. La calidad
de la educacin en Mxico: perspectvas, anlisis y evaluacin (pp. 305-454). M-
xico: Miguel ngel Porra-SEP.
Martnez Rizo, F. y Blanco, E. (2010). La evaluacin educatva. Experiencias, avances y
desafos. En Arnaut, A. y Giorguli, S. (Eds.). Educacin. Los grandes problemas de
Mxico, vol. V (pp. 89-123). Mxico: El Colegio de Mxico.
Martnez Rizo, F. y Santos del Real, A. (2009). Consideraciones sobre la evaluacin
educatva. En de Alba, A. (Ed.). Qu dice la investgacin educatva? (pp. 265-
304). Mxico: COMIE.
OEI (2010). Metas 2021. La educacin que queremos para la generacin de los bicen-
tenarios. Madrid: Organizacin de Estados Iberoamericanos.
_____ (2011). 2011. Miradas sobre la educacin en Iberoamrica. Madrid: Organiza-
cin de Estados Iberoamericanos.
PRIE (2003). La experiencia del Proyecto Regional de Indicadores Educatvos 2000-
2003. Santago: Ministerio de Educacin-OREALC.
_____ (2011). Panorama Educatvo 2010: desafos pendientes. Mxico: SEP-OREALC-OEA.
Prostk, J. (1996). History of teacher pay and incentves reform. Journal of School Lea-
dership, 6 (3), 265-289.
SITEAL (s.f.). Boletn de difusin. Recuperado de htp://www.siteal.iipe-oei.org/sites/
default/fles/gacetlla_siteal.pdf
UNESCO (2008). Educaton for All. Global Monitoring Report 2008. Pars. Natonal
learning assessments by regin and country (pp. 208-220); Latn America and the
Caribbean (pp. 214-215).
Wolf, L. (2004). Educatonal Assessments in Latn America: The State of the Art.
Applied Psychology: An Internatonal Review, 53 (2), 192-214.
Copyright of Sinctica is the property of Instituto Tecnologico y de Estudios Superiores de Occidente A.C. and
its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's
express written permission. However, users may print, download, or email articles for individual use.

Articulo Evaluacion PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Articulo Evaluacion PDF

Загружено:

Авторское право:

Доступные форматы

EL FUTURO DE LA EVALUACIN EDUCATIVA

Felipe Martnez Rizo

Вам также может понравиться