Вы находитесь на странице: 1из 10

Revista Mexicana de Investigacin Educativa

ISSN: 1405-6666
revista@comie.org.mx
Consejo Mexicano de Investigacin Educativa,
A.C.
Mxico

Garca Garduo, Jos Mara


El avance de la evaluacin en Mxico y sus antecedentes
Revista Mexicana de Investigacin Educativa, vol. 10, nm. 27, octubre-diciembre, 2005, pp. 12751283
Consejo Mexicano de Investigacin Educativa, A.C.
Distrito Federal, Mxico

Disponible en: http://www.redalyc.org/articulo.oa?id=14002721

Cmo citar el artculo


Nmero completo
Ms informacin del artculo
Pgina de la revista en redalyc.org

Sistema de Informacin Cientfica


Red de Revistas Cientficas de Amrica Latina, el Caribe, Espaa y Portugal
Proyecto acadmico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto

EL AVANCE DE LA EVALUACIN
EN MXICO Y SUS ANTECEDENTES
JOS MARA GARCA GARDUO

n primer lugar, agradezco al COMIE , particularmente a Eduardo de la


Garza, el haberme invitado a participar como comentarista en la primera seccin temtica de la RMIE dedicada a la evaluacin. Antes de hablar sobre el artculo de Elisa Fernndez y Edna Luna (2004), al cual debo
la invitacin, quisiera que se me consintiese comenzar con la presentacin
sucinta del panorama de la evaluacin, en particular de dos de las reas
que aborda esta seccin temtica, evaluacin de programas y de la docencia, y hacer un somero balance de las mismas dimensiones sobre su avance
en Mxico; posteriormente comentar el tema y artculo de Fernndez y
Luna.
Hoy en da en el sector educativo, y en otros ms, es muy comn hablar
de la evaluacin. El desarrollo de la evaluacin ha sido producto de dos
disciplinas que, posteriormente, convergieron en el camino: la psicologa
y la educacin. A la psicologa, en particular a la psicometra, se le debe el
desarrollo de los primeros tests de rendimiento como el Stanford Achievement
Test en 1923. Sin duda los psiclogos como Edward L. Thorndike tuvieron mucho que ver en ese desarrollo. Sin embargo, es poco conocido que
a Ralph Tyler se le debe la creacin del trmino evaluacin y, posteriormente el de assessmen t, para referirse a la estimacin del desempeo escolar, y que este gran educador e investigador fue el primero que dise
pruebas de rendimiento basadas en los objetivos del curso, tal y como se
conocen el da de hoy (Cordero y Garca Garduo, 2004), a principios de
la dcada de los treinta. La distincin entre assessment y evaluacin es muy
fina y, en ocasiones, hasta confusa. Por assessment los estadunidenses en-

Jos Mara Garca Garduo, Universidad Autnoma del Estado de Hidalgo. CE: josemariagarduno@yahoo.com.mx

Revista Mexicana de Investigacin Educativa

1275

Garca

tienden la evaluacin sistemtica, usualmente a travs de pruebas del desempeo escolar; en cambio, evaluacin es un trmino ms amplio.
Tyler es considerado el padre de la evaluacin educativa en todos los
sentidos. No slo acu el trmino de evaluacin y cre la metodologa
para construir pruebas objetivas de rendimiento, a principios de la dcada
de los treinta, sino que tambin ide el primer mtodo para evaluar programas educativos a raz del estudio curricular ms grande que se haya
realizado en Estados Unidos: El estudio de los ocho aos (1933-1941) del
cual Tyler, junto con sus discpula y asistente Hilda Taba, fue el coordinador de evaluacin de ese gran proyecto (Ridings, 1981). La evaluacin de
programas se inspir en los mismos principios del mtodo tyleriano para
disear tests de rendimiento: evaluar en qu medida se han logrado los
objetivos; estos mtodos para valorar el aprendizaje y los programas estuvieron sin cuestionarse por ms de 20 aos. El cuestionamiento comenz
en 1963 con la publicacin de un artculo de Lee Cronbach (otro discpulo de Tyler) sobre el mejoramiento de los cursos a travs de la evaluacin.
Fue este gran psiclogo el primero en hablar sobre la evaluacin formativa,
sin usar ese trmino (Cronbach, 1983).
Posteriormente, a raz de la Guerra contra la pobreza y el Acta de educacin elemental, promulgadas en 1965 por el Gobierno Federal estadounidense, surge la necesidad de rendir cuentas sobre los miles de millones de
dlares destinados a la educacin y a otros programas sociales. Para llevar
a cabo la tarea se contrataron especialistas en evaluacin que determinaran la utilidad de los programas (Stufflebeam y Shinkfield, 1987). Estos
especialistas pronto se dieron cuenta que el mtodo tyleriano no provea
de toda la informacin necesaria sobre la marcha y utilidad de los mismos.
Entre 1966 y 1971 surgen las principales aportaciones terico-metodolgicas
sobre la evaluacin de programas que han dado pie al desarrollo de otras
modelos y variantes metodolgicas: el modelo CIPP (contexto, insumo proceso
y producto) de Stufflebeam, el orientado al consumidor de Scriven, el de
la figura de Stake (de inspiracin Tyleriana) y posteriormente su mtodo
cualitativo llamado evaluacin respondente. Este ltimo fue el primer modelo cualtitativo basado en el estudio de casos.
En la presentacin a la seccin temtica que comentamos, De la Garza
(2004a) analiza los orgenes de los modelos naturalistas de evaluacin en
Inglaterra en los setenta. El autor provee de informacin poco conocida
sobre los orgenes de la tradicin naturalista. Stake fue participante de las
1276

Consejo Mexicano de Investigacin Educativa

El avance de la evaluacin en Mxico y sus antecedentes

conferencias que describe De la Garza; los trabajos de Parlett y Hamilton,


creadores del modelo de evaluacin iluminativa y participantes en esa conferencia, fueron muy importantes para fundamentar su modelo de evaluacin respondente.
A partir de la dcada de los setenta la evaluacin empez una etapa de
profesionalizacin vertiginosa. En 1975 los evaluadores ms connotados
comenzaron a planear la construccin de estndares de evaluacin que guiarn
la prctica profesional; para ello fue creado el Comit Conjunto de Evaluacin Educativa que public en 1981 los primeros estndares de evaluacin de programas. En 1994 sali a la luz la segunda edicin de los estndares
(Joint Committee on Standars for Educational Evaluation, 1994), se dividen en cuatro grandes reas: utilidad, viabilidad, propiedad (tica) y precisin (mtodo) de la evaluacin. El estndar ms peculiar de la evaluacin,
y que la hace diferente de la investigacin, es que la evaluacin debe ser
til. Para realizar ese propsito es necesario que, adems de entregar informes oportunos, el evaluador debe considerar las necesidades y expectativas del cliente y los grupos interesados en la evaluacin. Cuando se hace
sin que el evaluador se involucre con esos aspectos, considerando solamente o en gran medida las creencias y expectativas del evaluador, se le
denomina evaluacin de caja negra (black box evaluation). El Comit Conjunto
recomienda que el proceso de metaevaluacin, evaluacin de la evaluacin, se lleve a cabo bajo los estndares citados.
Podra decirse que las obras de Tyler, Scriven, Stufflebeam y Stake han
sido las cumbre que han cobijado, inspirado y desarrollado el campo toricometodolgico de la evaluacin de programas. Todos ellos, con excepcin de
Tyler, estn vivos y activos dentro del campo. Recientemente Scriven fue
invitado por el Centro de Evaluacin de la Universidad de Western Michigan,
hasta hace poco dirigido por Daniel Stufflebleam, a dirigir el Journal of
Multidisciplinary Evaluation. Parece ser que dedicarse a la evaluacin est
asociado con longevidad y productividad intelectual. Para comprobarlo es
slo cuestin de mirar la actividad de esos padres (vivos) de la evaluacin.
La evaluacin de la docencia

Al igual que la evaluacin de programas, la de la docencia comenz y se


desarroll en Estados Unidos, pero han seguido caminos paralelos que
raramente se han entroncado. Herman Remmers de la Universidad de
Indiana, cre el primer cuestionario de evaluacin de la docencia ( CEDA )
Revista Mexicana de Investigacin Educativa

1277

Garca

en 1927 (Centra, 1993). Remmers y su equipo fueron, prcticamente los


nicos que investigaron sobre el tema durante los siguientes 25 aos.
El uso de los CEDA comenz a popularizarse a partir de finales de la
dcada de los sesenta. En un principio, las instituciones universitarias de
ese pas promovan la aplicacin voluntaria, posteriormente se hizo obligatoria. Hoy en da ms de 90% de las instituciones estadunidenses evalan la docencia por medio de esos cuestionarios (Seldin, 1993). El uso de
los CEDA ha promovido el desarrollo de la investigacin, principalmente
en Estados Unidos y Canad. Al respecto, se pueden distinguir al menos
cuatro fases en el desarrollo: la primera corresponde a la poca de Remmers;
la investigacin fue escasa y poco sistemtica; la segunda la podramos
situar en la dcada de los setenta donde la mayora estuvo dedicada a determinar la validez y confiabilidad de los CEDA ; la tercera puede situarse
en los ochenta; aqu los investigadores estuvieron ms preocupados por
relacionar los resultados de los CEDA con caractersticas de los alumnos, la
disciplina y el profesor (Garca Garduo, 2000). A partir de los noventa,
despus de haber sido uno de los temas ms estudiados de la educacin
superior en dcadas anteriores, el inters de los investigadores comenz a
disminuir, pero algunos siguen elaborando sobre el tema. Otros, como
Herbert Marsh, probablemente el investigador ms importante desde los
ochenta, estn cambiando de objeto de investigacin. Sus intereses recientes tienen que ver con el desarrollo del autoconcepto y su relacin con
constructor de la motivacin.
El desarrollo de la evaluacin en Mxico: un proceso interrumpido

El trabajo de Martnez Rizo (2001) presenta un panorama muy completo


del desarrollo de la evaluacin del aprendizaje y de las pruebas en el medio
internacional y en Mxico. De acuerdo con este autor, el nacimiento de la
evaluacin educativa y concretamente de la del aprendizaje en Mxico comenz muy temprano, en 1936, con el Instituto Nacional de Psicopedagoga.
Sin embargo, a decir del autor es en la dcada de los noventa con el lanzamiento del Examen de Habilidades y Conocimientos Basicos ( EXHCOBA ),
la creacin del CENEVAL en 1994 y el rea de evaluacin de la SEP en 1995,
que se ha atendido de manera sistemtica la evaluacin del aprendizaje.
Puede colegirse que uno de los grandes problemas que se han tenido en
el pas y que ha impedido el desarrollo de la evaluacin y la continuidad
en los proyectos y programas es, por ejemplo, que en la evaluacin del
1278

Consejo Mexicano de Investigacin Educativa

El avance de la evaluacin en Mxico y sus antecedentes

aprendizaje los registros formales son escasos o inexistentes salvo por los
testimonios sobre el gran salto hacia delante que se tuvo durante la segunda mitad de la dcada de los setenta, con la creacin de la Direccin
General de Evaluacin del SEP , encabezada por Ral Taln. En esa Direccin se form un grupo, la mayora de jvenes psiclogos egresados de la
UNAM y de la UIA , que se dedic a elaboracin cientfica de pruebas de
rendimiento. Ese equipo, entre los que se cuentan ngel Lpez y Mestas,
Mara del Rayo Jimnez, Carlos Garca Camacho, Enoch Tamariz, Armando Vsquez, Mara Garca y Graciela Galindo, tradujeron artculos
sobre el tema, desarrollaron manuales de elaboracin de reactivos y de
anlisis de tems; construyeron y aplicaron pruebas de rendimiento a muestras
nacionales. Sin embargo, el trabajo del grupo, el tiempo y el dinero invertido ha quedado perdido en algn archivo muerto de la SEP . La historia
comenz nuevamente a partir de la dcada de los noventa. A pesar de todo
ello, es en la evaluacin del aprendizaje donde Mxico tiene los avances
importantes en esta materia. Existen tres instituciones importantes dedicadas al cultivo de la disciplina: el Instituto de Investigacin y Desarrollo
Educativo de la UABC ( IIDE ), el CENEVAL y el INEE .
En materia de evaluacin de programas podra afirmarse que, en comparacin con el desarrollo internacional y con el de otros pases de la regin, es una de las reas que en Mxico ha tenido menos desarrollo, a
pesar de que se public en espaol uno de lo primeros textos dedicados al
tema, me refiero a la obra de Carol Weiss (1975): Investigacin evaluativa .
Ese nivel escaso de desarrollo se manifiesta, por ejemplo, en que la mayora de los trabajos de evaluacin publicados se basan en el modelo de
caja negra; que poco se preocupa de la utilidad de la evaluacin y toma en
cuenta los intereses de los usuarios del programa; bsicamente, se lleva a
cabo bajo la orientacin tyleriana de los objetivos. Asimismo, no adopta
los mtodos y estndares derivados de los enfoques ms importantes de la
evaluacin de programas, o emplea trminos como evaluaciones cuantitativas o cualitativas, cuando en el escenario internacional se ha dejado de
emplear esa terminologa, la cual fue derivada de la pugna entre lo cualitativo versus lo cuantitativo acaecida en las dcadas de los setenta y ochenta.
En el campo de la evaluacin, esa pugna concluy a principios de los noventa. De acuerdo con los estndares del Comit Conjunto (Joint Committee,
1994), los informes de evaluacin deben incluir tanto informacin cuantitativa como cualitativa.
Revista Mexicana de Investigacin Educativa

1279

Garca

En materia de la profesionalizacin de la evaluacin, algunos pases de la


regin muestran avances ms notables que Mxico, por ejemplo, en 1989 se
cre la Asociacin Centroamericana de Evaluacin, con sede en Costa Rica.
En el 2002 se crearon organizaciones profesionales de evaluacin en Brasil
Colombia y Per (Chianca y Youker, 2004). En Mxico, a pesar del dinero
y esfuerzo dedicado no se ha formado ninguna asociacin profesional.
Evaluacin de la docencia

La excepcin ha sido la evaluacin de la docencia . En esta rea Mxico ha


hecho progresos notables. El uso de los cuestionarios comenz casi a la par
en que inici su uso sistemtico en Estados Unidos, a finales de la dcada
de los sesenta. El introductor en Mxico fue el padre Ernesto Meneses
Morales, sj, de la Universidad Iberoamericana. En 1971, en la UIA se crea
el primer cuestionario mexicano de evaluacin docente. En esa dcada en
la UNAM se hacen varios trabajos de investigacin sobre el tema. Durante
la segunda mitad de los ochenta ciertas universidades pblicas y privadas
comenzaron a emplear CEDA de manera sistemtica en la evaluacin de las
tareas docentes. En 1984 Arias Galicia public, por primera vez, las caractersticas psicomtricas de un instrumento de evaluacin docente.
A partir de los noventa, a la luz de los programas de estmulo, los cuestionarios de evaluacin comenzaron a ser un tema comn y aceptado dentro de las universidades pblicas. A mediados de esta poca se crea el Grupo
Interinstitucional de la Evaluacin de la Docencia, al que pertenecen dos
de las autoras de la seccin temtica publicados en este nmero. En este
grupo, que se form bajo el liderazgo de acadmicos de la UNAM , estn
involucradas, segn la numeralia de Eduardo Garza (2004b), ocho instituciones de educacin superior (seis pblicas y dos privadas).
Durante los ocho aos de vida, el Grupo Interinstitucional de Evaluacin de la Docencia ha producido una cantidad notable de libros, tesis,
nmeros temticos y artculos sueltos, adems de haber realizado varias reuniones
internacionales sobre el tema. Al respeto se est preparando un artculo de
investigacin que analiza el desarrollo y produccin de este grupo.
Uno de los dos trabajos de este grupo presentado en el reciente nmero
que comentamos de la RMIE es el de Elisa Fernndez y Edna Luna. Las
autoras buscaron indagar cules son los componentes de la docencia que
los profesores de los programas del rea de ingeniera y tecnologa consideran relevantes de integrar al cuestionario de evaluacin de la docencia
1280

Consejo Mexicano de Investigacin Educativa

El avance de la evaluacin en Mxico y sus antecedentes

por los alumnos. Si slo nos atuviramos al objetivo del trabajo se podra
concluir, errneamente, que la investigacin es simple y que no vale mucho la pena invertir tiempo y recursos en llevar a cabo una investigacin
de tal naturaleza. Sin embargo, el tema es valioso por s mismo.
A pesar de la popularidad creciente de los cuestionarios de evaluacin,
y segn lo informado en diversas investigaciones producidas por el grupo
mencionado (Arbes, 2004; Gilio, 2000; Loredo y Grijalva, 2000), el docente no ha sido, en la mayora de los casos, un partcipe activo en el
proceso de evaluacin de su desempeo. Para llevar a cabo el trabajo las
autoras siguieron una metodologa original y vlida, pues ya haba sido
probada en otros estudios de una de las autoras del artculo (Luna, 2002).
Los resultados de su investigacin confirman los hallazgos internacionales (Cashin, 1990) y nacionales (Garca Garduo, 2003): las disciplinas
le otorgan un peso diferente a ciertos aspectos de la evaluacin docente.
Asimismo, que los profesores universitarios aceptan y consideran justo y
necesario ser parte activa en este proceso de evaluacin. Por otro lado, el
estudio seala la importancia de los profesores en el mejoramiento de este
tipo de instrumentos. La retroalimentacin que dieron nos muestra que
en la enseanza de las ingenieras es importante la solucin de problemas
y que la enseanza en reas que integran el plan de estudios puede se diferente. Adems, que los aspectos a evaluar sobre el desempeo docente varan de acuerdo con el tipo de curso y el nivel en que se encuentre situado
dentro del plan de estudios.
El estudio de las autoras puede ser til para iniciar una discusin sistemtica sobre la posibilidad de que los CEDA incluyan aspectos generales
aplicados a toda la poblacin universitaria y una seccin propia para cada
disciplina o rea de conocimiento. Cules seran las limitaciones y bondades de tener un cuestionario que incluyera aspectos generales para evaluar la docencia de toda la institucin y que adems incluyera otros reactivos
dirigidos a satisfacer las necesidades de evaluacin especficas de las diferentes disciplinas o carreras? Esta estrategia es conocida como el mtodo
de cafetera , creada en la Universidad de Indiana en Estados Unidos. El
nombre es una analoga de la manera en que el comensal elige los alimentos en una cafetera de autoservicio; de la misma forma se escogen los reactivos
del cuestionario para evaluar al docente.
Podemos apreciar que en Mxico la investigacin sobre la evaluacin
de la docencia ha hecho progresos notables que sealan un desarrollo imRevista Mexicana de Investigacin Educativa

1281

Garca

portante y propio. Los programas de estmulo salarial y el Grupo Interinstitucional de Evaluacin de la Docencia han sido las piedras de toque
para tal desarrollo.
Finalmente, puede concluirse que el desarrollo del campo de la evaluacin en Mxico ha sido, de alguna manera, ahistrico. Poco ha servido lo
que se hizo antes de la dcada de los noventa para la nueva etapa que
comenz en esos mismos aos. Para favorecer su desarrollo y continuidad
convendra pensar en la creacin de una gran asociacin mexicana de evaluacin. Esta asociacin podra crear una revista de mayor alcance que las
actuales, que difundiera los avances de la disciplina y los hallazgos producidos. Asimismo el INEE y el CENEVAL bien podran auspiciar la formacin de una asociacin profesional para superar el aislamiento y promover
el desarrollo de la disciplina en Mxico, como est ocurriendo en otros
pases de la regin.
Referencias
Arbes, Ma. I. (2004). Evaluacin de la docencia: Una propuesta alternativa que considera la participacin de los profesores, Revista Mexicana de Investigacin Educativa,
9, nm. 23, pp. 863-890.
Cashin, W. E. (1990). Students do Rate Different Academic Fields Differently, en Theall
y Franklin (eds.), Student Ratings of Instruction, New Directions for Teaching and Learning,
nm. 43, San Francisco: Jossey-Bass, pp. 113-121.
Chianca, Th. y Youker B. (2004). La evaluacin en Amrica Latina y el caribe: Visin
general de los desarrollos recientes, publicado originalmente en ingls en noviembre
de 2004 en el primer nmero del Journal of Multidisciplinary Evaluation, y disponible
en web:http://evaluation.wmich.edu/jmde/.
Centra, J. A. (1993). Reflective faculty evaluation, San Francisco: Jossey-Bass.
Cordero, G. y Garca Garduo, J. M. (2004). The Tylerian curriculum model and the
reconceptualists. Interview with Ralph W. Tyler (1902-1994), Revista Electrnica de
Investigacin Educativa, 6 (2), disponible en http://redie.uabc.mx/vol6no2/contenido-cordero.html.
De la Garza, E. (2004a). La evaluacin educativa, Revista Mexicana de Investigacin
Educativa, 9, nm. 23, pp. 807-816.
De la Garza, E. (2004b). Evaluacin de la docencia en la educacin superior, resea,
Revista Mexicana de Investigacin Educativa, 9, nm. 23, pp. 933-946.
Fernndez, E. y Luna, E. (2004). Evaluacin de la docencia en el contexto disciplinario:
La opinin de los profesores en el caso de la ingeniera y tecnologa, Revista Mexicana
de Investigacin Educativa, 9, nm. 23, pp. 891-911.
Garca Garduo, J. M. (2000). Las dimensiones de la efectividad docente, validez y
confiabilidad de los cuestionarios de evaluacin de la docencia: sntesis de investi-

1282

Consejo Mexicano de Investigacin Educativa

El avance de la evaluacin en Mxico y sus antecedentes

gacin internacional, en Rueda y Daz-Barriga (compiladores), Evaluacin de la


docencia , Mxico: Paids, pp. 41-62.
Garca Garduo, J. M. (2003). Profesores universitarios y su efectividad docente. Un
estudio comparativo entre Mxico y Estados Unidos, en Perfiles Educativos, 25 (100),
pp. 42-55.
Gilio, Ma. C (2000). La evaluacin docente desde una perspectiva participativa: el caso
de la licenciatura en Qumica de la Universidad Autnoma de Quertaro, en Rueda y
Daz Barriga (coords.) Evaluacin de la docencia, Mxico: Paids, pp. 85-101.
Joint Committee on Standards for Educational Evaluation (1994). The program Evaluation
Standards (2a ed.). Thousand Oaks, CA: Sage. Existe traduccin al espaol: Comit
Conjunto de Estndares para la Evaluacin Educativa (1998). Estndares para la evaluacin de programas, Bilbao: Ediciones Mensajero.
Loredo, J. y Grijalva, O. (2000). Propuesta de un instrumento de evaluacin de la docencia para estudios de posgrado. Quertaro, en Rueda y Daz Barriga, Evaluacin de
la docencia, Mxico: Paids, pp. 103-131.
Luna, E. (2002). La participacin de los docentes y estudiantes en la evaluacin de la docencia, Mxico: Universidad Autnoma de Baja California/Plaza y Valds.
Ridings, J. (1981). An interview with Ralph Tyler, Occasional papers, nm. 13, noviembre, disponible en http://www.wmich.edu/evalctr/pubs/ ops/
Martnez Rizo, F. (2001). Evaluacin educativa y pruebas estandarizadas. Elementos
para enriquecer el debate, Revista de la Educacin Superior, 30 (120), pp. 71-85,
disponible en: www.anuies.mx/principal/servicios/publicaciones/revsup/rres120/
men5.htm.
Seldin, P. (1993 ). The Use and Abuse of Student Ratings of Professors,The Chronicle of
Higher Education, vol. 39, julio 21, p. 40.
Stufflebam, D. y Shinkfield, A. (1987). Evaluacin sistemtica, Barcelona: Paids.
Weiss, C. (1975). Investigacin evaluativa , Mxico: Trillas.

Revista Mexicana de Investigacin Educativa

1283

Вам также может понравиться