Вы находитесь на странице: 1из 14

FELIPE MARTÍNEZ RIZO*

El sistema nacional de evaluación de méxico


MÉXICO

Introducción que la explosión demográfica trajo consigo, en


la segunda mitad del siglo XX, los maestros
En este trabajo se presenta primero un panorama
utilizaban ampliamente pruebas de tipo objetivo
del desarrollo de la evaluación educativa en
que, aunque eran técnicamente rudimentarias,
México hasta fines del siglo XX; después, se
eran también homogéneas. Se difundió la noción
informa sobre los avances que han tenido lugar
elemental de evaluación referida a la norma
desde el año 2001 al 2006; luego, se presentan
estadística, con la expresión de calificar por
los proyectos en curso para integrar los diversos
curva. En una escala en la que la nota mínima es
esfuerzos de evaluación en un verdadero
5 y la máxima 10, eso hacía que en cada grupo
sistema nacional. En la conclusión, y a partir de
hubiera una media cercana a 8, con menos notas
la experiencia del país, se esbozan los rasgos
de 9 y 7 y muy pocas de 6 y 10.
de un sistema de evaluación deseable para un
país como México.
Precedida por trabajos realizados en
instituciones de educación superior, en la
Se desarrolla con mayor amplitud lo relativo a la
década de 1970 comenzó a surgir la aplicación
educación básica, con menos información sobre
de pruebas estandarizadas en gran escala en
la evaluación de la educación superior y la que
educación básica. La Secretaría de Educación
en México se denomina media superior (alumnos
Pública (SEP) desarrolló evaluaciones de este
de 15 a 17 años). Se incluyen reflexiones sobre la
tipo para el ingreso de alumnos a secundaria y
difusión y uso de resultados, por considerar que
luego para valorar el aprendizaje de los alumnos
la evaluación no constituye un fin en sí misma,
de primaria mediante pruebas estandarizadas,
sino que cobra sentido en la medida en que
aplicadas a muestras nacionales de alumnos.
contribuya a la mejora de la calidad educativa.
Los resultados, sin embargo, no se difundían
y se usaban poco para retroalimentar la toma
1. La evaluación educativa en México de decisiones. Las evaluaciones tenían también
hasta 2000 serias deficiencias técnicas que impedían
Como ocurre en otros sistemas educativos, en asegurar la comparabilidad de versiones y
México la evaluación del aprendizaje alcanzado la estabilidad de escalas; por ello no podían
por los alumnos ha sido una práctica a cargo hacerse en forma consistente comparaciones
de cada maestro. Cuando el sistema educativo de subsistemas estatales u otros y, menos aún,
comenzó a experimentar el vertiginoso crecimiento análisis longitudinales.

*
Director General del Instituto Nacional para la Evaluación de la Educación - México
1
Este texto se basa en documentos anteriores del autor, cuyas referencias pueden verse al final (Martínez Rizo 2003, 2005a,
2005b y 2005c), así como en un trabajo preparado por Banegas y Blanco, por parte del INEE, para la VI Reunión Ministerial
del Grupo E-9 (Monterrey, México, del 13 al 15 de febrero de 2006).

X1
A partir de 1992, y en el marco de un importante licenciatura y posgrado, así como de egreso
proceso de descentralización del sistema de licenciatura. En 1991 habían surgido los
nacional de educación básica, el desarrollo Comités Interinstitucionales de Evaluación de la
de sistemas de evaluación en gran escala Educación Superior (CIEES), para la evaluación
se fortaleció. Inicialmente se desarrollaron de programas e instituciones; a ellos siguieron
pruebas de aprendizaje para evaluar los diversas agencias acreditadoras especializadas
programas compensatorios que comenzaron y, a fines del 2000, el Consejo para la Acreditación
a implementarse con apoyo de organismos de la Educación Superior, COPAES.
financieros internacionales; luego, este tipo
de evaluaciones se extendió a otros ámbitos Pese a los avances alcanzados hasta fines del
del sistema educativo. Comenzaron también a siglo pasado, los resultados de las evaluaciones
hacerse evaluaciones cualitativas, se impulsó seguían sin difundirse y las limitaciones técnicas
la creación de Áreas de Evaluación en las de instrumentos y procesos persistían.
secretarías de educación de las 32 entidades
federativas del país y se constituyó un
mecanismo de colaboración entre ellas. 2. De 2001 a 2006: avances de la SEP
e inicio de actividades del INEE
En 1993 se estableció el programa de estímulos
En los primeros años del siglo XXI el desarrollo
económicos para maestros llamado Carrera
de la evaluación educativa continuó. La Dirección
Magisterial, en cuyo marco comenzaron a General de Evaluación de Políticas de la SEP
desarrollarse instrumentos para evaluar tanto continuó manejando los proyectos anteriormente
a los propios docentes como a sus alumnos, mencionados y a desarrollar uno más, llamado
en números muy grandes: en la actualidad, evaluación diagnóstica, que busca ofrecer
se aplican anualmente pruebas a unos ocho instrumentos de buena calidad a las escuelas y
millones de alumnos y alrededor de medio los docentes de todo el país para que se hagan
millón de maestros. En 1998 comenzaron a aplicaciones masivas no controladas, cuyos
aplicarse anualmente otras pruebas (Estándares resultados puedan contrastarse con los de
Nacionales de Lectura y Matemáticas) a muestrasnacionalescontroladas.LaSEPcomenzó
muestras de alumnos de primaria y secundaria también a ampliar la difusión de resultados. En el
de todo el país, con propósitos de evaluación marco del importante Programa de Escuelas de
del sistema como tal. Calidad comenzó a desarrollarse un ambicioso
proyecto de evaluación cualitativa y algunos
En la segunda mitad de la última década del siglo estados fortalecieron sus propias evaluaciones y
XX comenzaron también a fortalecerse los sistemas comenzaron a difundir resultados.
de evaluación de algunos estados de la República
y dio inicio la participación de México en proyectos Por otra parte, con base en un anteproyecto
internacionales de evaluación, con las pruebas elaborado desde la segunda mitad de 2000,
del Tercer Estudio Internacional de Matemáticas en agosto de 2002 se creó el Instituto Nacional
y Ciencias (TIMSS) en 1995; las del Laboratorio para la Evaluación de la Educación (INEE), con la
Latinoamericano de Evaluación de la Calidad tarea de asumir las evaluaciones cuyo propósito
Educativa (LLECE) en 1997; y las del Programa es valorar la calidad del sistema educativo
para la Evaluación Internacional de Estudiantes como tal, por lo que pasaron a su ámbito de
(PISA) de la Organización para la Cooperación y el acción las anteriores pruebas de Estándares
Desarrollo Económico (OCDE) en 2000. Nacionales. Al INEE corresponde también lo
relativo a la participación de México en proyectos
En educación superior, en 1994 se creó el internacionales de evaluación educativa.
Centro Nacional para la Evaluación de la
Educación Superior, CENEVAL, que hace El INEE difundió un primer informe a fines de 2003,
pruebas de ingreso a educación media superior, con resultados de las pruebas de Estándares

X2
PANEL: Sistemas nacionales de evaluación: lo que se ha ganado de la experiencia

de lectura y matemáticas aplicadas en junio de A partir de la experiencia de su primer año de


ese año a muestras nacionales de alumnos de trabajo, el INEE se propuso desarrollar, a lo
los grados 30, 50 y 60 de primaria y 10, 20 y 30 de largo de los tres años siguientes, varias tareas
secundaria (70, 80 y 90). Tanto el desarrollo como precisas:
la aplicación de los instrumentos habían sido
hechos todavía por la SEP, cubriendo en total a • Desarrollar una nueva generación de pruebas
para la evaluación del sistema nacional
unos 300,000 alumnos.
de educación básica de manera válida y
confiable.
Además de presentar los resultados de dichas
aplicaciones, y un conjunto de indicadores del • Hacer un Plan de Desarrollo que defina las
contexto y los recursos de las escuelas, el primer evaluaciones a realizar a mediano plazo.
informe del INEE incluyó un riguroso análisis • Impulsar de manera decisiva la difusión de
de la calidad de los instrumentos utilizados en resultados para su uso por diversos actores:
el pasado, detectando sus debilidades, que autoridades, maestros y sociedad.
impedían la comparación de los resultados de
2003 con los obtenidos en las aplicaciones de • Promover la integración de los diversos esfuerzos
los años anteriores. Además de problemas con de evaluación existentes en un auténtico
la confiabilidad de los instrumentos, el hecho sistema nacional de evaluación educativa, que
no constituya una nueva y pesada estructura,
de que las pruebas fueran elaboradas con un
pero sí incluya una normatividad básica común
enfoque normativo y sin una clara alineación al
y mecanismos eficientes de coordinación y
currículo impedía hacer juicios sólidos sobre el
control de calidad.
nivel de rendimiento alcanzado por los alumnos
del sistema educativo nacional.
En 2004 se aplicaron, por última vez, instrumentos
desarrollados con la metodología anterior, y los
El INEE señaló también que, para la evaluación
resultados de esa aplicación se difundieron a
del sistema educativo como tal, no era
fines del mismo año, junto con los resultados de
necesaria la aplicación de un gran número de
PISA 2003. El informe nacional de estos últimos
pruebas en seis grados cada año, sino que
se difundió al mismo tiempo que los resultados
era más adecuado un enfoque parsimonioso,
internacionales, el seis de diciembre de 2004.
con ciclos adecuados de evaluaciones en
grados y áreas curriculares clave, con muestras Al mismo tiempo, se avanzó en las cuatro
representativas del sistema nacional y sus direcciones apuntadas:
principales subsistemas. El Instituto señaló,
además, la necesidad de racionalizar y articular • Se desarrollaron instrumentos nuevos para
el gran número de evaluaciones existente, que la evaluación de lectura y matemáticas de
representan un esfuerzo muy grande y ofrecen 60 de primaria y 3° de secundaria, con una
resultados de dudoso valor. metodología rigurosa e involucrando a decenas
de maestros, especialistas en contenidos y
Las legítimas demandas de diversos actores por expertos en psicometría. Estas pruebas se
tener información confiable sobre la educación, han llamado Exámenes de la calidad y el logro
y el escaso conocimiento de aspectos técnicos, educativo (Excale).
llevaron a una proliferación de proyectos de • Se preparó y aprobó un Plan Maestro de
evaluación cuyo diseño no siempre es el apropiado Desarrollo, que precisa los proyectos de
para el propósito perseguido. Es frecuente que el evaluación a desarrollar hasta 2016, y define
propósito mismo no esté claro, o que se quiera usar de manera explícita los criterios de calidad
un instrumento elaborado con cierto propósito, a utilizar y los mecanismos de control que
para otros para los que no resulta adecuado. garantizarán que se respeten.

X3
• Se sistematizaron los esfuerzos de difusión de en la forma de un acuerdo secretarial, un
resultados iniciados desde 2003, incluyendo decreto presidencial o una ley.
presentaciones a las más altas autoridades del
país y de las 32 entidades federativas, así como
a la sociedad en general, en especial a través
de los medios de comunicación, para cuyo
3. Balance a principios de 2006 y
personal se llevan a cabo sistemáticamente perspectivas para el futuro
actividades de capacitación.
3.1. Cantidad y calidad de las
• Para atender la legítima demanda de la sociedad
evaluaciones nacionales
de conocer resultados escuela por escuela, lo
que escapa a su ámbito de competencia, el En términos cuantitativos, las actividades
INEE comenzó a apoyar a algunas entidades relacionadas con evaluación educativa que se
para la difusión de resultados propios llegando han realizado en México anualmente en la última
hasta ese nivel de desagregación. década son muy numerosas. Además de las
estadísticas educativas que todo director de
• El trabajo para conseguir la integración del escuela debe llenar al inicio y fin de cada ciclo
Sistema Nacional de Evaluación incluyeron escolar, la Dirección General de Evaluación de la
la elaboración de un documento de Política SEP ha elaborado y aplicado cada año diversas
Nacional de Evaluación y múltiples gestiones pruebas a poblaciones que van de varios miles a
ante los responsables de diversos proyectos, siete u ocho millones de alumnos. Las evaluaciones
las autoridades educativas de las entidades cualitativas del Programa de Escuelas de Calidad
federativas y los legisladores. y otras implican muchos miles de horas hombre
cada año. Sin desconocer los avances respecto
En 2005 los esfuerzos en las cuatro líneas de a la situación prevaleciente hace 15 años,
trabajo continuaron: hay todavía de deficiencias técnicas, dada la
ausencia de una tradición mexicana en el campo
• Se aplicaron por primera vez las pruebas Excale de la evaluación y de limitaciones derivadas de
hechas en 2004, y se desarrollaron otras para cuestiones burocráticas.
la evaluación de lectura, matemáticas, ciencias
naturales y ciencias sociales en 30 de primaria, La creación del INEE no significó un aumento en la
a aplicarse en 2006. Se hizo además una cantidad de las evaluaciones. Como se ha dicho,
aplicación especial de las pruebas aplicadas en el nuevo Instituto retomó uno de los proyectos
el año 2000 para poder hacer una comparación previamente existentes y redujo tanto el número
de los resultados de ese año con los obtenidos de grados evaluados como la frecuencia de las
con los mismos instrumentos en 2005. evaluaciones. En cambio, el INEE emprendió
• Se cumplió la primera etapa anual del Plan un importante esfuerzo de mejora técnica, que
Maestro de Desarrollo. a principios de 2006 ha llevado ya a la primera
aplicación de una nueva generación de pruebas
• Continuó el trabajo de difusión de resultados. de calidad claramente mejor a las que se habían
En diciembre se presentaron los resultados desarrollado previamente.
de las evaluaciones de 2005 al Presidente de
la República, el Secretario de Educación y 3.2. La participación de México
los secretarios de las entidades federativas. en evaluaciones internacionales
Prácticamente todos los diarios, estaciones de
La decisión tomada por México, a mediados
radio y de televisión importantes de la capital
de la década de 1990, de comenzar a
del país entrevistaron a los directivos del INEE.
participar en evaluaciones internacionales, fue
• Quedó terminado el proyecto para integrar un paso correcto en la dirección de fortalecer
formalmente el Sistema Nacional de Evaluación la evaluación. La ventaja más obvia es que
Educativa, estando pendiente su aprobación nuestro país puede comparar su situación

X4
PANEL: Sistemas nacionales de evaluación: lo que se ha ganado de la experiencia

con la de otros. Además, y dado que esas aula hasta el sistema nacional. Esta deficiencia
evaluaciones son hechas por grupos que explica la pobreza de la cultura de la evaluación
reúnen a destacados especialistas, una que se observa tanto entre alumnos y maestros
participación activa puede ser un vía muy como entre directivos escolares, padres de
eficiente de capacitación y aprovechamiento familia, medios de comunicación y los diversos
de la experiencia acumulada sobre el tema. sectores sociales, e incluso entre tomadores de
decisiones de alto nivel.
México ha participado en las pruebas del
TIMSS, del LLECE y PISA. La participación de La no difusión contribuye, además, a que la calidad
México en esos ejercicios, sin embargo, ha de las evaluaciones no mejore, ya que ni siquiera
tenido deficiencias importantes, que redujeron se detectan sus deficiencias. Una consecuencia
sus beneficios potenciales. Hasta 2003, la más, que se deriva de las anteriores y, a su vez,
participación mexicana no incluyó intervenir en las refuerza, es la ausencia de programas para
la planeación de las evaluaciones, como pueden formar especialistas en evaluación.
hacer todos los países involucrados.
Una buena difusión no puede reducirse a poner
las bases de datos y los análisis que se hagan
La limitada participación se manifestó
de los resultados de las evaluaciones al alcance
también en la ausencia de análisis propios
del público, por ejemplo por medio de una página
de los resultados obtenidos por los alumnos
web. Es necesario tener en cuenta las necesidades
mexicanos en esos ejercicios, con lo que dejaba
y posibilidades específicas de los diversos
de obtenerse el beneficio de permitir que se
destinatarios y usuarios potenciales que son, al
sacaran de ellas conclusiones y experiencias
menos, las autoridades a nivel nacional y de las
útiles para mejorar la calidad de la educación
entidades federativas; las de nivel medio, como
nacional.
jefes de sector y supervisores; los directores de
escuela y los maestros, así como las instituciones
A partir de 2003 la situación comenzó a en que se preparan éstos; los investigadores y
cambiar, al considerarse que la participación estudiosos; los padres de familia; y la sociedad
de México no debía ser de simple operador en general, para llegar a la cual tienen un lugar
de pruebas desarrolladas en otros lugares. especial los medios de comunicación.
Además del reducido impacto en el sistema
educativo de una participación limitada en Hasta finales de la década de los 90 las
evaluaciones internacionales, el desarrollo evaluaciones hechas en el sistema educativo
de la capacidad técnica nacional gracias a mexicano se mantuvieron como material
la interacción con los especialistas de otros reservado a unos cuantos altos funcionarios, lo
países, tampoco se da. Tanto en lo que se que significó también un uso muy reducido para
refiere a la aplicación de PISA en 2006, como la toma de decisiones. A partir de 1999 la situación
a la de LLECE, la participación de México es comenzó a cambiar, lo que ha sido notorio a partir
ahora muy activa. de 2003, gracias en especial al trabajo del INEE,
tanto en dirección de las autoridades como de la
3.3. La difusión de los sociedad.
resultados de las evaluaciones
Como la evaluación es un medio para la mejora En el primer sentido, destacan las presentaciones
de la calidad, debe reiterarse la importancia de ya mencionadas de informes de los resultados de
la escasa difusión de resultados que prevaleció evaluaciones anuales a las autoridades educativas
hasta hace poco y, en consecuencia, su casi nula nacionales y de las entidades federativas. En lo
utilización para la toma de decisiones desde el relativo a la sociedad en general, sobresalen los

X5
esfuerzos, también ya mencionados, por involucrar enfocados expresamente a la formulación o
a los medios de comunicación, con talleres reformulación de políticas.
especiales para periodistas y un acercamiento
sistemático con ellos, que se ha visto reflejado en Para subsanar esta deficiencia, y además de
una cobertura cada vez más amplia y, al parecer, elaborar los informes anuales a los que se ha
también más objetiva. hecho mención, el INEE ha promovido, desde
2004, la elaboración de informes similares
La difusión más difícil es la que se refiere a los en cada una de las entidades federativas,
maestros, a quienes no basta dar resultados aprovechando no sólo los resultados de las
globales y análisis generales, sino que evaluaciones del propio Instituto, sino también
requieren materiales que les permitan utilizar los los de otros proyectos de evaluación de la SEP,
resultados de las evaluaciones para mejorar su sus indicadores y estadísticas educativas, y
propio trabajo docente. Los primeros esfuerzos los datos del contexto socioeconómico que
del INEE en este sentido comienzan a difundirse pueden encontrarse en las bases de datos
solamente a fines de 2005, en la forma de una y las publicaciones del Instituto Nacional de
obra titulada PISA para docentes. La evaluación Estadística, Geografía e Informática (INEGI) y
como oportunidad de aprendizaje. otras fuentes. Para impulsar la preparación de
tales informes se organizaron talleres para el
Se editaron 250,000 ejemplares de esa obra, personal de las entidades y se ha conseguido
que se han hecho llegar a todas las escuelas que en 30 de las 32 existentes se elaboren.
de enseñanza media básica y superior del
país, además de ponerse en la página web del En 2005 comenzaron a verse casos de decisiones
INEE. El libro presenta las unidades de reactivos de política educativa a nivel nacional basadas
liberadas de PISA 2000 y 2003, con resultados en los resultados de las evaluaciones del INEE.
nacionales e internacionales que permiten El primer ejemplo fue un programa especial de
al docente contrastar los resultados de sus apoyo a las escuelas telesecundarias, lanzado
propios alumnos con los de grupos de interés; a principios de 2005, con una partida especial
se incluyen además ejemplos de análisis de de 500 millones de pesos.
reactivos desde una perspectiva pedagógica,
para ilustrar las implicaciones que deberían tener Al recibir los resultados de las evaluaciones
los resultados de PISA sobre el trabajo docente. de este último año, en diciembre de 2005, el
El INEE pretende continuar trabajando en esa Presidente de la República anunció un nuevo
dirección, difundiendo anualmente materiales programa de apoyo, esta vez para el conjunto
para docentes derivados de las pruebas Excale. de las secundarias, con recursos especiales por
seis mil millones de pesos.
3.4. El análisis de los
resultados Se anunció también que se emprendería una
y su utilización para la toma de revisión en profundidad del modelo de cursos
decisiones comunitarios, modalidad de servicios educativos
Hasta 2003, además de las fallas técnicas y la falta que mostró resultados insatisfactorios en la
de difusión ya mencionadas, la información derivada evaluación comparativa 2000-2005 hecha por el
de los trabajos de evaluación (pruebas, series de INEE, y que atiende al sector de la población que
indicadores, estudios cualitativos de escuelas, tiene condiciones de vida más desfavorables, ya
proyectos internacionales) no era procesada e que se trata de quienes viven en el gran número
integrada para formar un todo coherente, que fuera de localidades de menos de 250 habitantes.
base sólida para tomar decisiones. Tanto a nivel
nacional como, todavía más, en el ámbito de las 3.5. Balance y prospectiva
entidades federativas, había muy pocos análisis Una apreciación global de la situación de la
de resultados de estadísticas y evaluaciones evaluación educativa en México hasta principios

X6
PANEL: Sistemas nacionales de evaluación: lo que se ha ganado de la experiencia

del siglo XXI, distingue dos grandes etapas, a explore explicaciones y utilice ampliamente los
las que puede añadirse una más, que no es resultados para sustentar decisiones de mejora
otra que la que se considera deseable para el en todos los niveles del sistema.
futuro.
En la segunda etapa, que comprende el primer
En la primera etapa, que comprende desde lustro del siglo XXI, la situación ha comenzado
la década de 1970 hasta fines del siglo XX o a cambiar, tanto en lo relativo a los aspectos
principios del XXI, el INEE sostiene que, con técnicos (calidad de los instrumentos y los análisis
cierta crudeza, puede afirmarse que en México de resultados), como en cuanto a la difusión y uso
hay muchas actividades relacionadas con la de éstos y también a la capacitación del personal
evaluación educativa pero no hay una verdadera dedicado a la evaluación y a la articulación de los
evaluación, en el sentido de un conjunto de diversos esfuerzos evaluativos en un verdadero
juicios de valor objetivos y mesurados sobre el sistema. La tercera etapa se concibe como una
estado del sistema educativo, que integre los en que todos los aspectos se habrán desarrollado
datos derivados de mediciones y estadísticas, cualitativamente en la forma deseable. La
los contraste con parámetros pertinentes, situación se resume en este cuadro:

Tres etapas en la evaluación nacional


Calidad de los Calidad de los Difusión y uso de Capacitación Articulación
ETAPAS instrumentos análisis los resultados del personal del sistema

Noción de calidad Inexistentes o Difusión casi nula. Baja competencia Evaluaciones no


restringida. escasos. No se utilizan los del personal de articuladas.
Poca atención a Cuando los hay, resultados para evaluación, tanto a No hay un sistema
ETAPA I factores contexto. solamente diseñar políticas o nivel federal y con de indicadores
(Hasta 2000) Escalas simples. descriptivos, con mejorar prácticas mayor razón en a nivel nacional.
Resultados no técnicas primarias. pedagógicas. las entidades. Poca colaboración
comparables en entre actores.
el tiempo.

Noción de calidad Descriptivos y Difusión amplia. Profesionalización Colaboración


multi-dimensional, asociativos. Interpretación en progreso en frecuente entre
trasciende pruebas. Se identifican superficial. el nivel federal. SEP-INEE-AEE.
ETAPA II Planeación factores asociados. Uso ocasional para Acciones de Sistematización
(2000-2005) sistemática. decisiones. capacitación para incipiente de
Atención al contexto. Uso limitado a nivel las entidades. evaluaciones y de
Escalas complejas. de escuelas. sistema nacional
de indicadores.

ETAPA III
(futuro deseable) Además de II: Complejos-varios. Difusión amplia y Profesionalización Sistema integrado
Marcos teóricos Adecuados al objeto adecuada a las alta en el nivel y eficiente.
sólidos-explícitos. (multinivel, necesidades de federal y estatal. Sistema nacional
Resultados que se longitudinal). todos los actores. Capacitación de de indicadores
pueden comparar A cargo de los Uso en todos los directores y complejo y dinámico.
en el tiempo. organismos de niveles para mejorar maestros para uso Colaboración
evaluación y de la calidad de la de evaluaciones y permanente.
investigadores educación. autoevaluaciones. independientes.

X7
Por la importancia de la difusión y uso de los tercera etapa, que se visualiza como deseable.
resultados, en un cuadro más se presenta con En el cuadro se distinguen los distintos
mayor detalle la situación prevaleciente en las públicos destinatarios de la difusión, que son
dos etapas transcurridas, hasta fines del siglo a la vez actores para usos específicos de los
XX y en el primer lustro del XXI, así como en la resultados.

Tres etapas en la difusión y el uso de las evaluaciones en México


ETAPAS Autoridades Supervisores, Sociedad
Educativas Directores y Familias en general
nacionales y estatales Maestros
ETAPA I Difusión muy limitada. No se difunden No se difunden No se difunden
(Hasta 2000) No se usan resultados resultados. resultados. resultados.
para tomar decisiones.

ETAPA II
(2000-2005) Difusión amplia. Difusión limitada. Difusión limitada. Difusión amplia.
Resultados informan Evaluación no se utiliza Primeras iniciativas a Resultados, en
decisiones de política sistemáticamente para nivel de las entidades. ocasiones, se
en algunos casos. mejorar las prácticas interpretan de forma
pedagógicas. incorrecta o sesgada.

ETAPA III
(futuro deseable) Difusión amplia. Difusión amplia. Difusión amplia. Difusión amplia.
Resultados son un Evaluación retroalimenta Los resultados permiten Resultados generan
insumo fundamental de manera permanente rendir cuentas a las un debate público
para formular políticas las prácticas pedagógicas. familias y participar en informado y
y tomar decisiones. los procesos escolares. responsable.

Conclusión: hacia un sistema deseable necesaria, aunque no suficiente, de mejores


niveles de desarrollo económico y social.
de evaluación educativa
El amplio consenso que rodea la idea de que la
Algunas personas preocupadas por la educación
evaluación es importante, no debe hacer perder
tienen una visión simplista tanto de las causas
de vista que no cualquier evaluación es positiva
de la situación como de la forma de valorarla y
para la educación. Mal concebida o realizada, la
corregirla. Los diagnósticos simplistas no toman
evaluación puede ser irrelevante, en el mejor de
en cuenta los factores de las escuelas y su contexto
los casos, o incluso destructiva. Los sistemas
educativos no necesitan evaluaciones de que influyen en la calidad; los medios simplistas
cualquier tipo, aunque sean destructivas, sino de valorar ésta se reducen a la aplicación de
unas adecuadas, que contribuyan efectivamente pruebas de rendimiento, sin distinguir su enfoque
a que la calidad educativa mejore. y nivel técnico; y las estrategias para remediar la
situación se reducen a proponer que se asignen
La preocupación por la calidad de la educación recursos a las escuelas en función de los
es justificada. En los países en vías de desarrollo resultados de sus alumnos en las pruebas.
los resultados educativos tienen niveles
inferiores a los de países más avanzados, lo cual En realidad, los aspectos de la calidad educativa
es explicable, pero no puede dejar indiferente, y los factores que la explican son complejos,
ya que un mejor nivel educativo es condición por lo que una valoración adecuada de ellos no

X8
PANEL: Sistemas nacionales de evaluación: lo que se ha ganado de la experiencia

puede alcanzarse con un solo acercamiento. compleja noción. Un concepto pobre de calidad
Las estrategias de mejora deben ser complejas puede traer consigo consecuencias graves, al
también, y los resultados sólo podrán observarse poner el énfasis en unos aspectos en detrimento
en el mediano y largo plazo, como fruto de de otros.
esfuerzos serios y sostenidos.
Hay, por ejemplo, quienes oponen cobertura
Como consecuencia de comprensiones educativa, como algo meramente cuantitativo,
superficiales, en muchos países se observa una a calidad educativa, refiriendo este concepto
proliferación de pruebas con las que se pretende al aprendizaje de los alumnos. Se dice: en el
valorar la calidad de las escuelas, aunque los pasado ha prevalecido el interés por la cantidad
instrumentos no hayan sido diseñados de (cobertura); ahora debe preocuparnos la
manera apropiada para tal propósito y aunque, calidad. En realidad un sistema educativo no
en muchos casos, adolezcan de deficiencias puede considerarse de buena calidad si atiende
técnicas. Aparecen, entonces, dos tipos de sólo a una fracción de la demanda, aunque
reacciones: los maestros se ven impulsados a consiga que sus alumnos tengan alto nivel de
orientar su trabajo pedagógico en función de aprendizaje. En el mundo actual, al menos en
los contenidos de las pruebas, ya que serán los niveles obligatorios, un sistema educativo
el medio privilegiado para valorar su trabajo; sólo podrá considerarse bueno si consigue altos
por otra parte, entre los mismos maestros niveles de aprendizaje de todos los alumnos
y entre los estudiosos de la educación, es de cada cohorte o, al menos, de una muy alta
frecuente un rechazo absoluto a las pruebas, proporción de ellos.
por considerarlas intrínsecamente inadecuadas
para valorar correctamente la calidad. Aplicada a un sistema educativo, la noción
de calidad implica, al menos, los aspectos
La tesis central de esta conclusión es que de pertinencia y relevancia, eficacia interna
la evaluación que necesitan los sistemas y externa, impacto, eficiencia y equidad.
educativos no puede reducirse a pruebas, Concebida en esta forma amplia la noción, se
aunque debe incluirlas, a condición de que sostiene que un sistema educativo es de buena
sean de buena calidad y se usen de manera calidad si:
parsimoniosa, pero que debe haber indicadores
de otras dimensiones de la calidad, que utilicen • Establece un currículo adecuado a las
datos numéricos sobre aspectos más fácilmente circunstancias de la vida de los alumnos
cuantificables, como la cobertura, junto con (pertinencia) y a las necesidades de la
acercamientos cualitativos, apropiados a la sociedad (relevancia).
naturaleza de los sujetos y de los procesos
pedagógicos. Así, y sólo así, la evaluación será • Logra que la más alta proporción de
una herramienta que contribuya efectivamente destinatarios acceda a la escuela, permanezca
al mejoramiento de las escuelas, y que sea en ella hasta el final del trayecto y egrese
apreciada como tal por los maestros, los alcanzando los objetivos de aprendizaje
estudiosos y, en general, todas las personas establecidos en los tiempos previstos para
preocupadas por la educación. ello. (Eficacia interna).
• Consigue que los aprendizajes sean asimilados
en forma duradera y se traduzcan en una vida
La calidad educativa adulta más plena, no sólo en lo económico,
Para que pueda haber buena evaluación de la sino también en lo cívico y lo cultural, con lo
calidad educativa, la primera condición es que que la educación será fructífera para sociedad
se parta de un concepto adecuado de esta e individuos. (Eficacia externa e impacto).

X9
• Cuenta con recursos humanos y materiales mediante diseños sólidos; el uso de enfoques
suficientes, y los usa de la mejor manera diversos y complementarios en modelos
posible, evitando derroches y gastos e instrumentos; la selección cuidadosa de
innecesarios. (Eficiencia). muestras representativas; rigurosos procesos
de recolección de datos; y análisis cuidadosos
• Tiene en cuenta la desigual situación de
de los datos obtenidos.
alumnos y familias, las comunidades y las
escuelas, y ofrece apoyos especiales a • Pertinencia de los referentes que se definan
quienes lo requieren, para que los objetivos como parámetros para contrastar con ellos los
educativos sean alcanzados por el mayor resultados de la medición, de manera que las
número posible de estudiantes. (Equidad). comparaciones tengan sentido. Los referentes
se definen normativamente, no se derivan de los
datos empíricos. Pueden ser óptimos: ideales
Evaluación y medición con que se compara una situación; promedios
Para tener buenas evaluaciones no basta partir de los individuos que se evalúa; y mínimos,
de un concepto rico de calidad educativa. Es con los menores valores aceptables. Cada uno
necesario tener también un concepto adecuado arroja cierta luz sobre lo evaluado y ninguno
de evaluación, lo que no siempre se da, ya que es suficiente. Convendrá usar los tres tipos de
suele haber concepciones limitadas al respecto. parámetro, para una mejor apreciación.
Si se aplican pruebas para medir el aprendizaje, • Mesura de los juicios de valor derivados de
por ejemplo, suele pensarse que se ha evaluado, contrastar mediciones y parámetros, que
cuando en realidad sólo se ha medido. Evaluar exige evitarán excesos triunfalistas o derrotistas y
algo más: comparar el resultado de la medición tendrán siempre en cuenta el valor de equidad,
con un punto de referencia que establezca lo que considerando el contexto de los alumnos y las
se debería saber, para llegar a un juicio sobre lo escuelas.
adecuado o inadecuado del aprendizaje.
• Amplitud, oportunidad y transparencia de la
difusión de resultados, que deberá llegar a los
El concepto de evaluación que se propone es
sectores involucrados en versiones adecuadas
más amplio. Establece que la evaluación es el
a las características de cada uno.
juicio de valor que resulta de contrastar el resultado
de la medición de una realidad empírica con un
parámetro normativo previamente definido. nido
La evaluación educativa necesaria: un
Una buena evaluación no debe caracterizarse decálogo de características
solamente por cualidades técnicas como Para que la evaluación sirva realmente para mejorar
confiabilidad y validez. Estas dos características la calidad deberá tener los rasgos definidos en
son indispensables en toda buena medición, el punto anterior: atender todas las dimensiones
y como evaluar implica medir, la evaluación de la calidad educativa; ser técnicamente sólida
también las requiere. Pero como evaluar va más con acercamientos variados y complementarios;
allá de medir, una buena evaluación implica usar referentes pertinentes; culminar en juicios
también otras características: mesurados y contextualizados; y difundirse amplia,
• Carácter comprensivo de la conceptualización oportuna y transparentemente. De manera más
sustente, que deberá atender todas las
que la sustente, precisa, se postula que la evaluación educativa
dimensiones de la calidad educativa, y no sólo que necesitamos deberá ser:
algunas, como el nivel de aprendizaje. Es por
ello que un sistema de evaluación no puede I. Constructiva, porque:
limitarse a pruebas de rendimiento.
• No deberá tener otro propósito que la mejora
• Alto nivel técnico de las mediciones en que se de la calidad, en función de la cual deberá
base,, para garantizar su confiabilidad y validez,
base diseñarse y realizarse.

X 10
PANEL: Sistemas nacionales de evaluación: lo que se ha ganado de la experiencia

• Cada evaluación tendrá un propósito la naturaleza de los datos disponibles.


específico -como certificar las competencias IV. Válida, en el sentido más amplio del término:
adquiridas en un programa, la selección
• Se basará en un concepto rico de calidad,
de alumnos para otro, o la asignación de
que incluya resultados de aprendizaje, pero
estímulos- pero todos deberán concebirse
también otras dimensiones de calidad, como
en función de la mejora de la calidad.
la relevancia de los currículos; la cobertura
• La evaluación del rendimiento de los alumnos, del sistema y las tasas de terminación; el
en especial, deberá verse como parte del impacto de la educación en la vida adulta;
proceso docente, como una oportunidad la disponibilidad de recursos suficientes
de aprendizaje en sí misma, y no como un y su utilización eficiente; la existencia de
elemento extraño y amenazante. procesos de gestión ordenados tanto en el
sistema en conjunto como en sus demás
• En educación básica, las evaluaciones de
niveles, hasta la escuela singular y el aula.
rendimiento tendrán, fundamentalmente,
propósitos formativos, buscando que • En cuanto a los resultados de aprendizaje,
ofrezcan retroalimentación sobre el avance no se limitará a los que pueden medir las
de los alumnos para la aplicación oportuna de pruebas estandarizadas más simples,
medidas remediales; el uso de la repetición entendiendo que el currículo no debe
de grado como estrategia correctiva será supeditarse a la evaluación y estimulando a
excepcional. los maestros a atender los aspectos difíciles
de evaluar en forma estandarizada, como
II. Sistémica, ya que: las habilidades cognitivas superiores y las
dimensiones actitudinales y valorales.
• Incluirá evaluaciones de los alumnos, pero
también de docentes y directores, así como de • Será conciente de sus límites y actuará de
planteles, programas y políticas educativas. manera congruente con ello. No se usarán
evaluaciones diseñadas con un propósito,
• Utilizará pruebas de rendimiento, pero
para otro diferente para el que no sean
también estadísticas e indicadores de todas
apropiadas. Si se usan resultados de
las dimensiones de la calidad.
pruebas de rendimiento de alumnos como
• Será realizada por diversas instancias, elemento para la evaluación de escuelas, por
articuladas en un conjunto que forme un ejemplo, las pruebas empleadas deberán
verdadero sistema de evaluación. ser sensibles a la instrucción.
• Contrastará los resultados de las mediciones
III. Confiable por su calidad técnica, ya que:
con parámetros pertinentes. En lo relativo
• Se basará en diseños adecuados al a niveles de rendimiento se basará en
propósito que se persiga. estándares curriculares claros. Podrá usar
• Empleará instrumentos y procedimientos comparaciones con países avanzados,
debidamente validados, congruentes perspectiva que se complementa con
también con su propósito, sea que se otras, como las comparaciones con países
trate de pruebas estandarizadas o de similares.
otros instrumentos, como cuestionarios, • Empleará el pasado como referente mínimo
indicadores, observaciones en aula u otros. y el futuro como óptimo, valorando si se
• Cuando sea el caso, asegurará la alcanzan o no las metas fijadas en cierto
representatividad de las muestras empleadas. horizonte temporal.

• Analizará cuidadosamente los resultados, • Será prudente para tomar decisiones con
empleando metodologías apropiadas según base en la evaluación, evitando que las

X 11
medidas de alto impacto se tomen sin VII. Accesible para diversos públicos interesados
sustento adecuado, que nunca consistirá en la educación, porque:
sólo en resultados de evaluación en gran • Sus resultados se difundirán de manera
escala, sino que deberá complementarse amplia, oportuna e inteligible.
con evaluaciones micro, a cargo de
instancias cercanas a la situación. • La difusión se concebirá como parte
integral de la tarea de evaluar, con enfoques
apropiados para que sea pertinente para
V. Validada externamente también, de manera
cada público.
que:
• A las autoridades se darán resultados
• La evaluación interna se complementará
globales sobre aspectos satisfactorios
con controles externos, sin subordinar
o deficientes del sistema educativo, con
los propósitos educativos al interés de la
elementos que ayuden a interpretarlos
instancia externa.
incluyendo, en la medida en que lo permita la
• La evaluación que hace cada maestro de información, explicaciones de las situaciones
sus alumnos se complementará y validará detectadas.
con la del equipo docente y el director, así
• A la sociedad en general se darán también
como con las evaluaciones en gran escala a
resultados e interpretaciones generales,
cargo de instancias externas.
claras pero no simplistas.
• La evaluación de cada plantel a cargo
• A maestros, directores y supervisores,
de su director, se enriquecerá con la de
además de resultados generales, deberá
supervisores y autoridades locales, y en su
darse información más detallada sobre
caso con la de instancias externas.
aquellos aspectos del sistema educativo que
• Las evaluaciones que hagan las entidades dependen de su trabajo, para retroalimentar
subnacionales podrán compararse y validarse las prácticas docentes y las de gestión en
gracias a las evaluaciones nacionales. el nivel escolar, que es donde, en última
instancia, se da o no se da la calidad.
• Las evaluaciones nacionales se enriquecerán
con la participación en proyectos • A los investigadores y estudiosos de la
internacionales, en forma activa y en función educación deberá ofrecerse acceso a las
de las necesidades de cada país. bases de datos y a toda la información
metodológica y técnica, que les permita
VI. Útil
Útil,, porque será aprovechada por cada actor replicar análisis previos y hacer otros, así
para sustentar decisiones apropiadas: como emprender estudios que aporten
elementos adicionales tanto descriptivos
• Por las autoridades, para la definición de
como explicativos.
políticas.
• Será valiosa para construir consensos entre
• Por los maestros, para retroalimentar sus
actores con puntos de vista no coincidentes,
prácticas docentes.
que podrán acercarse más fácilmente si hay
• Por los alumnos mismos, para orientar mejor información creíble para todos.
su propio trabajo, cuando permite resultados
a nivel individual. VIII. Parsimoniosa, porque se verá a sí misma
• Por los padres de familia y la sociedad, para como medio y no como fin, por lo cual:
sustentar sus exigencias de rendición de • Será respetuosa del trabajo de todos los
cuentas y orientar sus esfuerzos de apoyo. actores, usándose tanto cuanto contribuya
• En todos los casos, porque aportará a la mejora de la calidad.
elementos para comprender mejor las • La evaluación de aprendizajes, en particular,
causas de las situaciones detectadas. no se verá como sustituto de la labor del

X 12
PANEL: Sistemas nacionales de evaluación: lo que se ha ganado de la experiencia

maestro sino como complemento de ella, idea derrotista de que no hay nada positivo en el
entendiendo que evaluaciones macro y pasado no es buen antecedente para avanzar.
micro deben apoyarse mutuamente.
El único punto de partida correcto para iniciar
• Las evaluaciones externas tratarán de
un proceso de mejora es el que reconoce con
interferir lo menos posible en el trabajo
objetividad logros y limitaciones, teniendo en
cotidiano de maestros y escuelas.
cuenta que un sistema educativo de calidad
es, finalmente, el que siempre mejora respecto
IX. Eficiente, porque:
a sí mismo, sin idealizar el pasado y con metas
• Buscará optimizar los recursos de que se ambiciosas pero realistas para el futuro.
pueda disponer.
• Las evaluaciones en gran escala En efecto: una vez conocidos los resultados
generalmente se basarán en muestras de de las evaluaciones, las autoridades y los
escuelas y alumnos, y se aplicarán en ciclos, maestros deberán sacar las conclusiones
para cubrir paulatinamente áreas curriculares pertinentes para mantener y mejorar los puntos
y grados clave. La decisión de llevar a cabo fuertes y corregir los deficientes. Conviene
evaluaciones censales se tomará sopesando precisar que las decisiones no corresponden a
cuidadosamente costos y beneficios. los evaluadores, sino a la autoridad, desde los
niveles de decisión más altos hasta el director
• Concebirá su propio desarrollo como tarea
de escuela y el maestro. La sociedad, por su
de largo plazo, por lo que deberá comenzar
parte, tendrá la última palabra en cualquier
con elementos como indicadores básicos
sistema democrático, y por ello la evaluación es
y aplicaciones muestrales de pruebas en
herramienta indispensable para el ejercicio del
grados y áreas curriculares clave.
derecho a la rendición de cuentas.

X. Legítima
Legítima,, finalmente, porque habrá ganado
Por otra parte, hay que señalar un riesgo que
credibilidad y respeto gracias a:
trae consigo efectos contraproducentes: el
• La calidad técnica de su trabajo. de tomar decisiones que ofrezcan resultados
espectaculares, que pretenden corregir en poco
• La independencia y seriedad de las
tiempo deficiencias ancestrales.
instancias que la lleven a cabo.
• La utilidad de sus resultados para los Establecer metas inalcanzables condena de
diferentes actores, incluyendo a las antemano a la frustración y se basa en un
autoridades educativas, pero también a los supuesto falso: que hacer buena enseñanza
maestros y la sociedad en general. con cualquier grupo de alumnos y en cualquier
contexto fácil. Si así fuera, el que los resultados
sean bajos sólo podría ser el resultado de una
Consideraciones finales gran negligencia y mejorar debería ser sencillo.
Para tener un sistema educativo de buena calidad Si se entiende, al contrario, que los bajos
es requisito necesario, aunque no suficiente, resultados educativos son el producto de un
tener sistemas de evaluación muy buenos complejo entramado de factores, se entenderá
también. Una evaluación deficiente no es útil para también que la mejora requiere de tiempos
que la calidad mejore: lleva fácilmente a juicios largos y estrategias complejas.
excesivos, triunfalistas o derrotistas: ni unos ni
otros son base sólida para definir estrategias de Aún si se diseñan estrategias integrales de
mejora. El triunfalismo lleva a la continuidad de mejora, que tomen en cuenta los diversos
lo existente, cuyas fallas no se detectan. Y una factores e involucren a los actores relevantes,

X 13
el tiempo necesario para que los esfuerzos den limitarlos a la aplicación masiva de pruebas de
frutos es largo. Si esto no se tiene presente es rendimiento de dudosa calidad. Esta manera de
fácil cometer errores graves de voluntarismo, ver las cosas sobreestima las posibilidades de
pensando que cualquier meta puede alcanzarse la evaluación en gran escala y pierde de vista
en poco tiempo, por ambiciosa que sea, si se que el maestro es y será la pieza clave en la
hace el esfuerzo necesario. búsqueda de la mejora educativa.

Señalar la complejidad y lentitud de los Un buen sistema de evaluación reforzará la


procesos de mejora educativa no implica una profesionalización del maestro y el papel de los
postura fatalista. Al fijar metas para la educación padres de familia de varias maneras: aportando
hay que apuntar alto, pero teniendo claro que materiales que apoyen el uso inteligente de
mejorar en profundidad la educación sólo podrá resultados; complementando las evaluaciones
conseguirse mediante estrategias integrales que externas con otras que utilicen instrumentos
tengan metas ambiciosas, sin olvidar que los similares y sean aplicados cada escuela; y
caminos, por largos que sean, se recorren paso capacitando a las autoridades, los directores,
a paso. No hay que olvidar que, en educación, maestros y padres para que aprovechen
una década es corto plazo. los resultados de las evaluaciones para
retroalimentar su trabajo y conozcan el nivel de
Por último, deberá evitarse un riesgo que acecha aprendizaje que cada alumno ha alcanzado,
a los sistemas de evaluación contemporáneos: para mejorarlo.

Referencias bibliográficas
• BANEGAS GONZÁLEZ, ISRAEL, y E. BLANCO BOSCO (2006). Políticas y sistemas de evaluación
desafíos México. Instituto Nacional para la Evaluación de
educativa en México. Avances, logros y desafíos.
la Educación.
• MARTÍNEZ RIZO, FELIPE (2005a). “La evaluación educativa en la actualidad. Una perspectiva
latinoamericana”. Ponencia magistral presentada en las Jornadas de Cooperación Educativa con
Iberoamérica.. Cartagena, Colombia, noviembre 21.
Iberoamérica
• MARTÍNEZ RIZO, FELIPE (2005b). “La evaluación educativa: ¿oportunidad o peligro?” Presentación
en el VIII Congreso Nacional de Investigación Educativa.
Educativa Hermosillo, México, octubre 31.
• MARTÍNEZ RIZO, FELIPE (2005c). Sobre la difusión de resultados por escuela. Cuadernos de
Investigación,, N° 17. México, Instituto Nacional para la Evaluación de la Educación.
Investigación
• MARTÍNEZ RIZO, FELIPE et al. (2003). La calidad de la educación básica en México, 2003. México.
Instituto Nacional para la Evaluación de la Educación.

X 14

Вам также может понравиться