Вы находитесь на странице: 1из 13

Cmo evalan los profesores Captulo 1: Porque me evaluaron mal, yo evalo peor.

Es posible que alguno de los que lea este trabajo se haya encontrado con algn docente durante su vida como estudiante que le haya dicho: "El 100 es para Dios y el 90 para m con lo que quera sealar que no exista un trabajo perfecto y que lo que ms se aproximaba era su propio conocimiento. Tal vez tena buenas intenciones pero hay que recordar que "el infierno est lleno de gente que tena buenas intenciones". Desgraciadamente an hay profesores que de buena fe y tratando de mostrarse exigentes, continan con el 100 para Dios y el 90 para ellos. Si el 100 era para Dios, entonces no estaba al alcance de los estudiantes e igual suceda con el 90, entonces la pregunta adecuada desde el punto de vista psicopedaggico es: Por qu no quitar ambas notas, ya que no pueden alcanzarse? Sera ms justo evaluar del 1 al 89, o tal vez al 80, ya que no tiene sentido, que exista una escala inalcanzable. Es como si en un tiro al blanco, se pusiera como condicin hacer 5 blancos y slo se le repartieran tres cartuchos a los tiradores o en una carrera, dijeran que el primer lugar es "para Dios"... Lo justo y correcto es que si la escala es del 1 al 100, todos los estudiantes puedan acceder a cualquier calificacin entre esos extremos. No sera ni justo ni honesto. Y desde luego no tiene sentido que porque a algn docente lo hayan evaluado as por desconocimiento o hasta por maldad, se tome venganza con uno de sus estudiantes, que nada tiene que ver con lo que a l le pas. Se debe evaluar a los estudiantes como uno quisiera que lo hubieran evaluado en su momento.

Captulo 2: Vean "lo bien" que evaluamos los docentes.


Es as en realidad? Cuando en una escala del 0 al 100 un estudiante obtiene 67 debe "saber" mucho ms que el que obtuvo 51. El que obtenga 80 ms que el de 60. En la educacin se emplea como regla la escala del 1 al 100, cosa que es conocida por estudiantes y profesores, los que sin embargo seguramente no se han puesto a reflexionar en lo que eso implica. Habra que decir en primer lugar que cuando se utiliza la escala del 1 al 100, ello implica que se puede discriminar entre el 1 y el 10 y ms an entre el 1 y el 2, por situar un par de ejemplos. Al utilizar una escala del 1 al 100 y por supuesto asignar puntuaciones dentro de la misma, se declara, se quiera o no, que se puede apreciar un punto, puesto que algunos obtienen 51, otros 52, otros 53, etc. Si alguien obtuvo 69 y otro 72 fue porque se pudo discriminar punto a punto en esa escala. Es curioso como los docentes pueden discriminar una centsima de conocimientos o habilidades, o capacidades, etc. del estudiante! Resulta curioso, porque ningn psiclogo ha podido discriminar hasta el presente, despus de largos estudios con determinadas personas, que una de ellas tiene una centsima ms de habilidad o capacidad que la otra en alguna cosa especfica. Podra algn psiclogo o algn otro profesional decir que Juan es una centsima ms hbil que Pedro en matemticas o que tiene una centsima ms de hbitos de lectura?. Nadie podra hacerlo, pero los docentes lo hacemos todos los das y ms an, algunos docentes no estn conformes con esa escala y califican con dcimas, o sea 51,3, 54,6, etc. De hecho ellos no evalan a las centsimas, sino a las milsimas. Ya no estn diciendo que Juan es una centsima ms hbil que Pedro, sino que es una milsima... Cualquier cientfico puede y debe admirarse de la precisin de las mediciones que realizan los docentes!

Captulo 3: No es lo mismo medir que evaluar.


Medir es comparar algo con un patrn. Cuando se dice que una tela mide 4 metros se ha hecho una medicin, al comparar la longitud de la tela con el patrn metro. Igual ocurre cuando se plantea que un termo tiene una capacidad de un litro, aunque en este caso, la medicin la efectu el fabricante. En ambos casos se han realizado mediciones. Evaluar es emitir un juicio de valor. La evaluacin puede apoyarse o no en mediciones pero siempre se apoya en una comparacin. Sin embargo cuando se dice que Alina es ms bella que Luisa, lo que se hace es una evaluacin, ya que se emite un juicio de valor, porque no se ha empleado un "velocmetro" ni nada por el estilo. Sin embargo, si Alina hubiera sido la ganadora de un concurso de belleza en el que tambin hubiese estado Luisa, entonces es probable que se hubieran hecho mediciones, como si conoce o no la historia de nuestro pas, si sabe desenvolverse en situaciones difciles y otras. En ese caso se trata de una evaluacin que se apoya en mediciones, pero nadie pudiera decir que Alina es 34% ms bella que Luisa 15% ms fea que Elena. Si se miden las alturas de dos personas, se puede, al compararlas, decir que una es ms alta que la otra. En ese caso la comparacin ha permitido hacer una evaluacin acerca de la altura de las mismas, ya que incluso con la medicin aislada de cada una de ellas no se hubiera podido emitir un juicio de valor. Es decir, que una medicin aislada sin que exista comparacin, no garantiza una correcta evaluacin. Igual ocurre si alguien dice: Juan es bueno. Est emitiendo un juicio de valor, est haciendo una evaluacin, pero ser correcta desde el punto de vista social? Para ello habra que conocer el "patrn" de bondad que tiene la sociedad y efectuar una comparacin con la que se atribuye a Juan. De otra forma pudiera ser muy subjetivo el juicio de valor y carecer de valor social. El docente, sin embargo, por costumbre heredada, somete al estudiante a una prueba, cuenta los puntos que obtuvo a partir de una escala dada (se trata de una medicin), por ejemplo, 51 y directamente emite su juicio de valor: ests aprobado. De la misma forma si hubiera obtenido 50, le habra dicho: ests reprobado. O sea, en estos casos la medicin coincide con la evaluacin.

En general, puede decirse que los docentes utilizan la medicin para evaluar y casi siempre los resultados de la medicin coinciden con los de la evaluacin o de hecho se asume que medir es evaluar.

Captulo 4: Midiendo magnitudes fsicas e intelectuales.


Continuando con la diferencia entre medir y evaluar hay que sealar varios puntos: Al decir que un estudiante tiene 51 y otro 53 en la asignatura X, comnmente se dice que el segundo sabe ms que el primero, lo que ya se ha cuestionado. Continuando con ese razonamiento se llega a que el que mejores notas obtenga en la carrera debe ser el que mejor desempeo profesional tenga, lo que en la gran mayora de casos ha sido refutado por la prctica Si por ejemplo existe una materia Clculo 1 y otra Clculo 2 que la continua, el que obtenga malas notas en la primera debe obtener malas tambin en la segunda y el que obtenga buenas notas en la primera, debera obtenerlas tambin en la segunda, por tener muy buena base, como regla general. Es lo que se conoce como las precedencias. Investigaciones llevadas a cabo por los autores en varios pases, demuestran que esa lgica no se cumple en la prctica. Cuando se hacen mediciones, por ejemplo, con una pesa, se puede decir que un saco de papas pesa 98 Kg, o que una persona, Juan, pesa 51 Kg. Igualmente se puede al medir con un metro, decir que una pared mide 2m. de alto, pero no se puede decir que Juan es 90 veces ms inteligente que Pedro o que es 50 veces ms hbil en una tarea dada. En general es posible medir con precisin cualquier magnitud fsica, como la presin, la temperatura, la humedad, la altura, etc., sin embargo, no ocurre lo mismo cuando se pretende medir magnitudes intelectuales, como la habilidad de lectura, la capacidad de abstraccin, la competencia de... etc. Con las magnitudes intelectuales la comparacin con un patrn absoluto falla, porque ste no existe. No puede hablarse de una habilidad, capacidad, hbito, etc., que sea absoluto para cualquier ser humano. Nadie es 78% hbil en matemticas, posee un 90% de capacidad de anlisis o tiene un 89% de capacidad de abstraccin, ya que estas magnitudes slo pueden medirse relativamente, de acuerdo a determinados parmetros que no son iguales para todas las personas. Si por ejemplo se supone que un examen o prueba, es capaz de medir si un estudiante de tercer grado, domina la redaccin a su nivel, esa medicin slo es vlida para grupos de estudiantes, con caractersticas similares, muy parecidas, ya que para otro nivel, en otro pas, etc., no tendra sentido esa medicin. Por otro lado, si dicho estudiante obtiene 50 puntos, qu quiere decir eso?, qu domina

la mitad de lo que deba? y si ese mismo estudiante hubiera obtenido 52 puntos, qu quiere decir eso?, qu representan esos dos puntos de ms?. Como se puede apreciar, el asunto es bien complejo. Si en otro ejemplo, se prepara un examen para determinar si un grupo de estudiantes de medicina es capaz de identificar, nombrar y ubicar los huesos de un ser humano y un estudiante dado obtiene 50 puntos, quiere esto decir que puede identificar, nombrar y ubicar el 50 % de los huesos?, o que puede identificar el 100 %, nombrar el 20% ... etc.?. Evidentemente por la medicin, que equivale a la calificacin, no hay forma de saberlo, pues se necesitara ms informacin.

Captulo 5: Se necesita mucha o poca precisin al evaluar el aprendizaje?


La temperatura del cuerpo humano vara en el orden de los grados centgrados, de nada servira medir las milsimas de grado de variacin, ya que no sera de utilidad, como tampoco tendra utilidad el que un comerciante al vender por ejemplo papas, pretendiera pesar hasta el orden de las centsimas de Kg, tal precisin sera completamente irrelevante. Al pretender medir habilidades, competencias, capacidades, etc., como se ha visto, tampoco sera de utilidad buscar una gran precisin, porque la medicin es relativa y en realidad buscar una precisin grande, sera parecido a lo planteado en los ejemplos con la temperatura del cuerpo humano o las papas. Por otro lado se ha considerado que el instrumento de medicin educativa que se emplee, est libre de errores, que mide perfectamente lo que debe medir, lo cual no es difcil demostrar que no es as y por otro lado existe tambin un determinado error inherente al que mide, en este caso el docente, luego ahora se podra preguntar si al emplear en una medicin educativa, una escala del 1 al 20 se apreciaran 5 dcimas? O en el caso de que fuera del 1 al 5, apreciaramos 2 dcimas? Evidentemente no es posible apreciar dcimas, centsimas o milsimas de "conocimiento" o de dominio de habilidades, etc. De ah que seguramente se est de acuerdo, en que lo que conviene es la escala con la menor precisin, pues la medicin y los instrumentos que se emplean, ya conllevan en s un error grande.

Captulo 6: Qu se debe medir en las pruebas o exmenes?


La evaluacin, tiene una importancia extrema, ya que prcticamente no existe proceso alguno que se pueda desarrollar sin que sea evaluado de ah que la evaluacin del aprendizaje es una de las ms importantes y difciles, ya que se trata de evaluar el comportamiento humano, de determinar si se han desarrollado competencias, habilidades, capacidades, etc. El docente bien pudiera preguntarse si de verdad las pruebas y exmenes miden lo que realmente deben medir. Por supuesto que lo anterior obligara a que estuvieran perfectamente definidas las competencias que deben lograr los estudiantes, as como los objetivos que se persiguen en cada materia y en la carrera, como se seal en el tema anterior, lo que como se sabe no es tan completo como se quisiera. Hay muchos elementos "empricos" que denotan los problemas que se tienen en la actualidad: El estudiante que mejor nota obtenga en la materia, es el que ms sabe? El que mejores notas obtenga en su carrera, es el ms capaz profesionalmente? Por qu no se cumplen las precedencias en la prctica real, no tendr que ver con esto la forma de evaluar? Desde luego hoy en da se tendra que preguntar adems, si se evala el dominio de un grupo de conocimientos o si se debe evaluar si el estudiante ha aprendido a aprender.

Captulo 7:

Fiabilidad y Validez

Los conceptos de fiabilidad y validez son aplicables a cualquier instrumento, por lo que son aplicables tambin a los instrumentos que emplea el docente. Fiabilidad, confiabilidad o precisin denotan la cualidad de un instrumento que permite que cualquier investigador obtenga la misma lectura, bajo las mismas condiciones. Si un instrumento tiene fiabilidad o es fiable (o preciso) cualquier observador hara la misma determinacin. Por ejemplo, si un reloj es fiable, cualquiera que mire la hora dira lo mismo o si un voltmetro fuera fiable, cualquiera que midiera ese voltaje, con el mismo instrumento, leera lo mismo. Si un examen es fiable, cualquier docente que lo calificara, le otorgara la misma calificacin. Si Juan viendo la hora en un reloj dice son las 9 y Pedro simultneamente al verlo dice son las 9 y cinco, el instrumento, reloj, no es completamente fiable, por lo que puede decirse que existen grados de fiabilidad y que tal instrumento es ms o menos fiable que otro similar. Si un tcnico apreciara 110 volts al medir un voltaje y otro empleando el mismo instrumento 115, ese instrumento tampoco sera completamente fiable. Si un docente califica y otorga una calificacin de 51 y otro de 60, el instrumento utilizado, el examen, no es completamente fiable. La validez o exactitud definen que el instrumento mide aquello para lo que fue diseado. O sea, que un reloj es vlido o exacto cuando da las 9 a.m. y coincide con la lectura segn los patrones internacionales utilizados, o cuando un voltmetro mide 110 volts y de acuerdo al patrn volt, existen 110 y cuando un docente en un examen coloca una pregunta para conocer si un estudiante sabe o no el concepto de volumen, la pregunta es vlida si mide justamente ese concepto. Si al ver la hora en el reloj aparece que son las 9 a.m. y al preguntar instantneamente a un observatorio indican que son las 9 y 2 minutos, el reloj no es completamente vlido o exacto. Si al medir el voltaje con dos voltmetros arrojan lecturas diferentes, alguno o ambos no son tan exactos. Si al verificar una pregunta utilizada en una prueba o examen se comprueba que pueden existir diferentes interpretaciones entonces por lo tanto no mide exactamente aquello para lo cual fue diseado, no mide lo que tiene que medir.

Captulo 8: Ms fiable o ms vlido?


Hasta aqu se ha sealado que tanto en la fiabilidad como en la validez existen grados y seguramente se ha podido observar que estn muy relacionados ambos conceptos. En la Figura 1 se muestra ms claramente esa relacin estrecha y que puede confundir entre dichos conceptos. En el primer caso el reloj ofrece una lectura que para algunos pude ser 3:10, para otros 3:09 3:08. En el segundo caso quizs la duda estuviera entre 3:07 y 3:09 mientras que en el tercero no hay la menor duda que se trata de las 3:08. Pudiera decirse entonces que la primera es la menos fiable de las tres y la ltima la ms fiable. Pero el que sea fiable no quiere decir que tenga validez, ya que pudiera ser que el primero sea un reloj hecho con gran calidad, costoso y por lo tanto seguramente exacto o vlido, mientras que el ltimo sea un reloj barato, de dudosa calidad y por lo tanto poco exacto, con poca validez. Segn lo anterior, no existe una relacin directa entre fiabilidad y validez, pudiendo darse el caso de que un instrumento sea el ms fiable o confiable y a la vez el menos vlido y viceversa.

Captulo 9: Resumen (primera parte).


Hasta aqu se han analizado algunas de las dificultades ms frecuentes que enfrentan los docentes y los estudiantes durante la evaluacin del aprendizaje y que tienen que ver con criterios subjetivos o con algunos aspectos tericos. No son las nicas, pero ocasionan problemas muy graves, que ponen en peligro el proceso completo de aprendizaje. A continuacin un resumen de lo visto: Lo justo y correcto es que todos los estudiantes puedan acceder a cualquier calificacin entre los extremos de la escala seleccionada, si es del 1 al 100, deben poder alcanzar cualquier nota entre dichos valores. No sera ni justo ni honesto, que porque a algn docente lo hayan evaluado mal por desconocimiento o hasta por maldad, se tome venganza con sus estudiantes, que nada tiene que ver con lo que a l le pas. Se debe evaluar a los estudiantes como uno quisiera que lo hubieran evaluado en su momento. 4. Cuando en la escala del 0 al 100 un estudiante obtiene 67, debe "saber" mucho ms que el que obtuvo 51. El que obtenga 80 ms que el de 60. La realidad demuestra que no es as, las notas en general no representan los conocimientos. 5. En el caso de la escala del 1 al 100, resulta curioso como los docentes pueden discriminar una centsima de conocimientos o habilidades, o capacidades, etc., del estudiante, porque ningn psiclogo ha podido discriminar hasta el presente, despus de largos estudios con determinadas personas, que una de ellas tiene una centsima ms de habilidad o capacidad que otra en alguna cosa especfica. 6. Si el docente utiliza la escala del 1 al 100 y califica con dcimas, o sea 51,3, 54,6, etc. De hecho no evala slo hasta las centsimas, sino tambin a las milsimas. Ya no estn diciendo que Juan es una centsima ms hbil que Pedro, sino que es una milsima... Se debe tener bien clara la diferencia entre medir y evaluar: Medir es comparar algo con un patrn, mientras que evaluar es emitir un juicio de valor. La evaluacin puede apoyarse o no en mediciones, pero siempre se apoya en una comparacin.

Por otro lado una medicin aislada, sin que exista comparacin, no garantiza una correcta evaluacin. En general, puede decirse que los docentes utilizan la medicin para evaluar y casi siempre los resultados de la medicin coinciden con los de la evaluacin o de hecho se asume que medir es evaluar.

Captulo 10: Resumen (segunda parte).


Continuamos con algunas de las dificultades ms frecuentes que enfrentan los docentes y los estudiantes durante la evaluacin del aprendizaje. Se puede medir con precisin cualquier magnitud fsica, como la presin, la temperatura, la humedad, la altura, etc., sin embargo, no ocurre lo mismo cuando se pretende medir magnitudes intelectuales, como la habilidad de lectura, la capacidad de abstraccin, la competencia de... etc. Con las magnitudes intelectuales la comparacin con un patrn absoluto falla, porque ste no existe. No puede hablarse de una habilidad, capacidad, hbito, etc., que sea absoluto para cualquier ser humano. No es lo mismo medir magnitudes fsicas que intelectuales. La precisin que puede alcanzarse en estas ltimas es pequea relativamente. Al seleccionar una escala de evaluacin, conviene la escala con la menor precisin, pues las mediciones y los instrumentos que se emplean, ya conllevan en s errores grandes. El docente bien pudiera preguntarse si de verdad las pruebas y exmenes miden lo que realmente deben medir, de ah la importancia de la validez, por otro lado interesa la fiabilidad, ya que en igualdad de condiciones, un instrumento es fiable si diferentes observadores obtienen el mismo registro. 14. Si un docente califica y otorga una calificacin dada y otro una bien diferente, el instrumento utilizado, el examen, no es completamente fiable. 15. Si al verificar una pregunta utilizada en una prueba o examen se comprueba que pueden existir diferentes interpretaciones, entonces no mide exactamente aquello para lo cual fue diseado, no mide lo que tiene que medir. 16. No existe una relacin directa entre fiabilidad y validez, pudiendo darse el caso de que un instrumento sea el ms fiable o confiable y a la vez el menos vlido y viceversa. Bibliografa propuesta: "La evaluacin del aprendizaje desde una ptica constructivista." Elizabeth Rodas Salazar y Gustavo Hernndez del Forn. Editorial TALIZ. La Paz. Bolivia. 2003.

Вам также может понравиться