Вы находитесь на странице: 1из 5

1.

Precedentes: Antes de los tests y de la medicin


Desde la antigedad se han venido creando y usando procedimientos
instructivos en los que los profesores utilizaban referentes implcitos, sin
una teora explcita de evaluacin, para valo-rar y, sobre todo, diferenciar y
seleccionar a es-tudiantes. Dubois (1970) y Coffman (1971) citan los
procedimientos que se empleaban en la China imperial, hace ms de tres
mil aos, para seleccionar a los altos funcionarios. Otros auto-res como
Sundbery (1977) hablan de pasajes evaluadores en la Biblia, mientras
Blanco (1994) se refiere a los exmenes de los profe-sores griegos y
romanos. Pero segn McRey-nold (1975), el tratado ms importante de
eva-luacin de la antigedad es el Tetrabiblos, que se atribuye a Ptolomeo.
Tambin Cicern y San Agustn introducen en sus escritos concep-tos y
planteamientos evaluadores.
En la Edad Media se introducen los exme-nes en los medios universitarios
con carcter ms formal. Hay que recordar los famosos exmenes orales
pblicos en presencia de tri-bunal, aunque slo llegaban a los mismos los
que contaban con el visto bueno de sus profe-sores, con lo que la
posibilidad de fracaso era prcticamente inexistente. En el Renacimiento
se siguen utilizando procedimientos selectivos y Huarte de San Juan, en su
Examen de inge-nios para las ciencias, defiende la observacin como
procedimiento bsico de la evaluacin (Rodrguez y otros, 1995).
En el siglo XVIII, a medida que aumenta la demanda y el acceso a la
educacin, se acenta la necesidad de comprobacin de los mritos
individuales y las instituciones educativas van elaborando e introduciendo
normas sobre la utilizacin de exmenes escritos (Gil, 1992).

2. Los tests psicomtricos


En el contexto anterior, a finales del siglo XIX, se despierta un gran
inters por la medicin cien-tfica de las conductas humanas. Esto es algo
que se enmarca en el movimiento renovador de la metodologa de las
ciencias humanas, al asumir el positivismo de las ciencias fsico-naturales.
En este sentido, la evaluacin recibe las mismas influencias que otras
disciplinas pedaggicas relacionadas con procesos de medicin, como la
pedagoga experimental y la diferencial (Cabrera, 1986).
La actividad evaluativa se ver condicionada de forma decisiva por
diversos factores que con-fluyen en dicho momento, tales como:
a) El florecimiento de las corrientes filosfi-cas positivistas y empricas,
que apoyaban a la observacin, la experimentacin, los datos y los
hechos como fuentes del conocimiento verdadero. Aparece la exigencia
del rigor cien-tfico y de la objetividad en la medida de la conducta
humana (Planchard, 1960) y se po-tencian las pruebas escritas como
medio para combatir la subjetividad de los exmenes ora-les (Ahman y
Cook, 1967).

b) La influencia de las teoras evolucionistas y los trabajos de Darwin,


Galton y Cattel, apo-yando la medicin de las caractersticas de los
individuos y las diferencias entre ellos.

3. El nacimiento de la verdadera evalua-cin educativa:


La gran reforma tyleriana
Antes de que llegara la revolucin promovida por Ralph W. Tyler, en Francia
se inicia en los aos veinte una corriente independiente cono-cida como
docimologa (Pieron, 1968 y 1969; Bonboir, 1972), que supone un primer
acerca-miento a la verdadera evaluacin educativa. Se criticaba, sobre
todo, el divorcio entre lo ense-ado y las metas de la instruccin. La
evalua-cin se dejaba, en ltimo trmino, en manos de una interpretacin
totalmente personal del pro-fesor. Como solucin se propona: a) elaboracin de taxonomas para formular objetivos, b) diversificacin de fuentes
de informacin, exmenes, expedientes acadmicos, tcnicas de repesca y
tests, c) unificacin de criterios de correccin a partir del acuerdo entre los
correc-tores de las pruebas y d) revisin de los juicios de valoracin
mediante procedimientos tales como la doble correccin, o la media de
distin-tos correctores. Como puede verse, se trata de criterios en buena
medida vigentes actualmente y, en algn caso, incluso avanzados.
Pero quien es tradicionalmente considerado como el padre de la evaluacin
educativa es Tyler (Joint Committee, 1981), por ser el pri-mero en dar una
visin metdica de la misma, superando desde el conductismo, muy en
boga en el momento, la mera evaluacin psicolgica. Entre 1932 y 1940, en
su famoso Eight-Year Study of Secondary Education para la Progres-sive
Education Association, publicado dos aos despus (Smith y Tyler, 1942),
plantea la nece-sidad de una evaluacin cientfica que sirva para
perfeccionar la calidad de la educacin. La obra de sntesis la publica unos
aos des-pus (Tyler, 1950), exponiendo de manera cla-ra su idea de
curriculum, e integrando en l su mtodo sistemtico de evaluacin
educativa, como el proceso surgido para determinar e Revista ELectrnica
de Investigacin y EValuacin Educativa [ www.uv.es/RELIEVE ] pag. 14

4. El desarrollo de los sesenta


Los aos sesenta traern nuevos aires a la evaluacin
otras cosas porque se empez a prestar inters por
llamadas de atencin de Tyler, relacionadas con la
programas y el valor in-trnseco de la evaluacin para
educacin.

educativa, entre
algunas de las
eficacia de los
la mejora de la

En esa poca surge un cierto conflicto entre la sociedad americana y su


sistema educativo, sobre todo porque los rusos iban por delante en la
carrera especial, tras el lanzamiento del Sputnik por la URSS en 1957.

Aparece un cier-to desencanto con la escuela pblica y crece la presin por


la rendicin de cuentas (MacDo-nald, 1976; Stenhouse, 1984). En 1958 se
pro-mulga una nueva ley de defensa educativa que proporciona muchos
programas y medios para evaluarlos. En 1964 se establece el Acta de
educacin primaria y secundaria (ESEA) y se crea el National Study
Comitte on Evaluation, crendose una nueva evaluacin no slo de
alumnos, sino orientada a incidir en los pro-gramas y en la prctica
educativa global (Ma-teo y otros, 1993; Rodrguez y otros, 1995).
Para mejorar la situacin y retomar la hege-mona cientfica y educativa,
fueron muchos los millones de dlares que desde los fondos pblicos se
destinaron a subvencionar nuevos programas educativos e iniciativas del
personal de las escuelas pblicas americanas encamina-das a mejorar la
calidad de la enseanza. (Po-pham, 1983; Rutman y Mowbray, 1983; Weiss,
1983). Este movimiento se vio tambin poten-ciado por el desarrollo de
nuevos medio Revista ELectrnica de Investigacin y EValuacin Educativa [
www.uv.es/RELIEVE ] pag. 16

5. Desde los aos setenta: La consolida-cin de la


investigacin evaluativa
Si con algo se podra caracterizar las aporta-ciones tericas que nos ofrecen
los especialis-tas durante los aos setenta es con la prolifera-cin de toda
clase de modelos evaluativos que inundan el mercado bibliogrfico,
modelos de evaluacin que expresan la propia ptica del autor que los
propone sobre qu es y cmo de-be conducirse un proceso evaluativo. Se
trata, por tanto, de una poca caracterizada por la pluralidad conceptual y
metodolgica. Guba y Lincoln (1982) nos hablan de ms de cuarenta
modelos propuestos en estos aos, y Mateo Revista ELectrnica de
Investigacin y EValuacin Educativa [ www.uv.es/RELIEVE ] pag. 20
(1986) se refiere a la eclosin de modelos. Estos enriquecern
considerablemente el vocabulario evaluativo, sin embargo, compartimos la
idea de Popham (1980) de que algunos son demasiado complicados y otros
utilizan una jerga bastante confusa.
Algunos autores como Guba y Lincoln (1982), Prez (1983) y en alguna
medida House (1989), tienden a clasificar estos modelos en dos grandes
grupos, cuantitativos y cualitativos, pero nosotros pensamos con Nevo
(1983) y Cabrera (1986) que la situacin es mucho ms rica en matices.
Es cierto que esas dos tendencias se observan hoy en las propuestas
evaluativas, y que algunos modelos pueden ser representativos de ellas,
pero los diferentes modelos, considerados particular-mente, se diferencian
ms por destacar o enfati-zar alguno o algunos de los componentes del
proceso evaluativo y por la particular interpreta-cin que a este proceso le
dan. Es desde esta perspectiva, a nuestro entender, como los dife-rentes
modelos deben ser vistos, y valorar as sus respectivas aportaciones en los

terrenos concep-tual y metodolgico (Worthen y Sanders,


Stufflebeam y Shinkfield, 1987; Arnal y otros, 1992; Scriven, 1994).

1973;

Tambin son varios los autores (Lewy, 1976; Popham, 1980; Cronbach,
1982; Anderson y Ball, 1983; De la Orden, 1985) los que conside-ran los
modelos no como excluyentes, sino ms bien como complementarios y que
el estudio de los mismos (al menos aquellos que han resultado ser ms
prcticos) llevar al evaluador a adoptar una visin ms amplia y
comprensiva de su tra-bajo. Nosotros, en algn momento nos hemos
atrevido a hablar de enfoques modlicos, ms que de modelos, puesto que
es cada evaluador el que termina construyendo su propio modelo en cada
investigacin evaluativa, en funcin del tipo de trabajo y las circunstancias
(Escudero, 1993).
En este movimiento de propuestas de modelos de evaluacin cabe
distinguir dos pocas con marcadas diferencias conceptuales y metodolgicas. En una primera poca, las propuestas segu-an la lnea expuesta por
Tyler en su planteamien-to, que ha venido a llamarse de Consecucin de
Metas. Adems de los ya citados de Stake y Metfessell y Michael, que
corresponden a los ltimos aos sesenta, en esta poca destacan la
propuesta de Hammond (1983) y el Modelo de Discrepancia de Provus
(1971). Para estos au-tores los objetivos propuestos siguen siendo el criterio
fundamental de valoracin, pero enfati-zan la necesidad de aportar datos
sobre la con-gruencia o discrepancia entre las pautas de ins-truccin
diseadas y la ejecucin de las mismas en la realidad del aula.

6. La cuarta generacin segn Guba y Lincoln


A finales de los ochenta, tras todo este desarrollo antes descrito, Guba y
Lincoln (1989) ofrecen una alternativa evaluadora, ofrecen una alternativa
evaluadora, que denomi-nan cuarta generacin, pretendiendo superar lo
que segn estos autores son deficiencias de las tres generaciones
anteriores, tales como una vi-sin gestora de la evaluacin, una escasa
aten-cin al pluralismo de valores y un excesivo ape-go al paradigma
positivista. La alternativa de Guba y Lincoln la denominan respondente y
constructivista, integrando de alguna manera el enfoque respondente
propuesto en primer lugar por Stake (1975), y la epistemologa postmoderna del constructivismo (Russell y Willinsky, 1997). Las demandas, las
preocupaciones y los asuntos de los implicados o responsables (stakeholders) sirven como foco organizativo de la evaluacin (como base para
determinar qu in-formacin se necesita), que se lleva a cabo dentro de los
planteamientos metodolgicos del para-digma constructivista.

7. El nuevo impulso alrededor de Stuf-flebeam


Para terminar este recorrido analtico-histrico desde los primeros
intentos de medi-cin educativa hasta la actual investigacin evaluativa en

educacin,
queremos
recoger
las
recomendaciones
que
ms
recientemente nos viene ofreciendo una de las figuras seeras de este
campo en la segunda mitad del siglo XX. Revista ELectrnica de
Investigacin y EValuacin Educativa [ www.uv.es/RELIEVE ] pag. 26 Nos estamos
refiriendo a Daniel L. Stufflebeam, proponente del modelo CIPP (el ms
utilizado) a finales de los sesenta, desde 1975 a 1988 presi-dente del Joint
Committee on Standars for Edu-cational Evaluation y actual director del
Eva-luation Center de la Western Michigan Univer-sity (sede del Joint
Committee) y del CREATE (Center for Research on Educational Accountability and Teacher Evaluation), centro auspiciado y financiado por el
Departamento de Educacin del gobierno americano.
Recogiendo estas recomendaciones (Stuffle-beam, 1994, 1998, 1999,
2000 y 2001), en las que se han ido integrando ideas de diversos evaluadores tambin notables, no slo ofrecemos una de las ltimas
aportaciones a la actual con-cepcin de la investigacin evaluativa en
educa-cin, sino que completamos en buena medida la visin del
panorama actual, rico y plural, tras analizar la cuarta generacin de Guba
y Lincoln.
Se parte de los cuatro principios del Joint Committee (1981 y 1988), esto es,
de la idea de que cualquier buen trabajo de investigacin eva-luativa debe
ser: a) til, esto es, proporcionar informacin a tiempo e influir, b) factible,
esto es, debe suponer un esfuerzo razonable y debe ser polticamente
viable, c) apropiada, adecua-da, legtima, esto es, tica y justa con los
impli-cados, y d) segura y precisa a la hora de ofrecer informacin y juicios
sobre el objeto de la eva-luacin. Adems, la evaluacin se ve como una
transdisciplina, pues es aplicable a muchas disciplinas diferentes y a
muchos objetos diver-sos (Scriven, 1994).

Вам также может понравиться