Академический Документы
Профессиональный Документы
Культура Документы
Resumen
Se muestran los resultados de la investigacin para la construccin y validacin de una prueba previamente diseada
en pro de medir conocimientos en el rea de matemtica, desde una perspectiva clsica de la medicin se llevo a cabo
el proceso de validacin por jueces, anlisis de tems y consistencia interna de dicha prueba, lo anterior por considerar
la evaluacin dentro del aula en la formacin bsica como un proceso de relevancia en un contexto social donde perma-
nentemente se busca seleccionar, jerarquizar y diagnosticar mediante pruebas objetivas. Posterior al pilotaje llevado a
cabo en un colegio privado en la ciudad de Bogot con 131 estudiantes se encontraron falencias en las caractersticas
tcnicas de los tems y por ende en el nivel de conabilidad de la prueba, ello da muestra de la poca formacin de los
docentes para este tipo de procedimiento llevando a preguntarse respecto de la abilidad de la evaluacin realizada.
Palabras Clave: evaluacin, prueba objetiva, conocimiento matemtico.
1
Investigacin realizada en la especializacin de Medicin y Evaluacin en Ciencias Sociales.
2
Mg. En investigacin Educativa. Especialista en Medicin y Evaluacin en Ciencias Sociales. Licenciada en Fsica. Coordina-
dora de Desarrollo Cientco. Coorporacin Universitaria Iberoamericana.
Es tal el impacto social que incluso la evaluacin de Al hablar de evaluacin en la educacin bsica se-
las competencias bsicas en las reas de lenguaje y cundaria al interior del aula se deben operacionalizar
matemticas ocupa un lugar prominente en el plan los componentes tanto conceptuales como proce-
de desarrollo del gobierno colombiano, ya que se dimentales de manera tal que se puedan valorar las
reconoce la necesidad inaplazable que tienen los fortalezas y debilidades de los estudiantes en el rea
ciudadanos de informarse de si mismos sobre las especca, en este caso en el rea de matemticas,
debilidades y fortalezas en estas dos reas (Barn, exponiendo al sujeto a una situacin problema
Rojas, Salazar, 2003). que permita al docente determinar el grado de
profundidad alcanzado con respecto a un criterio
Lo anterior surge del reconocimiento de la mate- previamente establecido (Barn et al, 2003b).
mtica como un ente globalizador de pensamiento
lgico formal, dicho nivel de pensamiento permite Dichas situaciones problema pueden aplicarse tanto
evidenciar destrezas y habilidades surgidas en de forma grupal como individual, y pueden variar
diferentes culturas como respuesta a diferentes en su forma, desde talleres, laboratorios, revisiones
necesidades sociales como contar, medir, localizar bibliografcas, construccin de proyectos hasta
e inclusive jugar, lo que hace ver su practicidad no evaluaciones de tipo objetivo que pueden ser orales
solo en un contexto acadmico sino tambin en un o escritas de lpiz y papel, siendo estas ltimas el
contexto cotidiano. inters principal de este estudio.
Por lo tanto al realizar una evaluacin por compe- Segn Herrera (2003), las pruebas de carcter objetivo
tencias se busca trascender la perspectiva que la son tradicionalmente instrumentos usados en la
considera como la simple memorizacin de deni- evaluacin de conocimientos y habilidades. Gene-
ciones y ejecucin de procedimientos o dominios de ralmente estn constituidas por preguntas cerradas
clculo para llegar a valorar la destreza en el uso de y cumplen con las siguientes caractersticas:
este conocimiento en procesos de interpretacin,
representacin y explicacin de su entorno social 1. La calificacin no depende del evaluador,
(Barn et al, 2003a). dado que dichas condiciones de asignacin de
puntajes estn previamente estandarizadas,
Se brindan a partir de lo anteriormente expuesto 2. Existe un control mximo de las condiciones
los elementos a tener en cuenta en la construccin de aplicacin, que reduce la influencia de
de una prueba tendiente a medir el conocimiento variables extraas que pudiesen contaminar
dentro del rea, la cual debe contener elementos los resultados,
de: comprensin de conceptos, formas de repre- 3. El proceso de diseo y construccin de la
sentacin y uso de lenguaje matemtico, conside- prueba contempla una serie de pasos orga-
rados tanto en su componente conceptual como nizados de manera sistemtica y que implica
procedimental, utilizando para ello la formulacin trabajo interdisciplinario, tanto de expertos
y resolucin de situaciones problemas alejadas de conceptuales como de expertos en tcnicas
una base memorstica y de desarrollo de algorit- de medicin.
A este respecto cabe mencionar que en el contexto se contemplan las fases de: conceptualizacin,
colombiano se han implementado evaluaciones de construccin de reactivos, validacin, anlisis de
este tipo de forma masiva, ejemplo de ellos son las conabilidad y por ltimo la estandarizacin.
pruebas SABER aplicadas por la Secretaria de Edu-
cacin Nacional y los exmenes de estado ICFES, La fase de conceptualizacin inicia estableciendo
en asocio con el Ministerio de Educacin Nacional la nalidad de la prueba en donde se especca el
(MEN) y las instituciones de escolares del pas. constructo a medir la poblacin y los objetivos del
instrumento, por medio de la denicin conceptual
Bajo este panorama se hace necesaria la proyeccin de y operacional.
este tipo de procedimientos de evaluacin al interior
del aula, buscando hacer un seguimiento constante La fase de construccin de reactivos incluye el
de los estudiantes y potencializando de esta forma, plan de prueba en donde se construye la tabla de
las competencias pertinentes para su desempeo especicaciones y se elige el formato de la prueba,
tanto en las pruebas masivas, como en situaciones es decir, tipo de tems y estructura.
de carcter evaluativo de su cotidianidad.
Al nal de esta fase se lleva a cabo el anlisis de tems
En el ambiente educativo, especcamente el ni- en donde se observan parmetros como ndice de
vel de educacin bsica formal, los docentes de dicultad e ndice de discriminacin, retomando
forma un tanto emprica, construyen sus propias los parmetros establecidos para la aceptacin de
pruebas de evaluacin, que son aplicadas, pero tems planteados por Guilford (1975), donde el
nunca son sometidas a procesos de validacin y rango aceptable para el ndice de dicultad oscila
estandarizacin que permitan hacer inferencias de entre 0.2 y 0.85. Y en el caso de la discriminacin
carcter slido y cientco; desde el mismo proceso retomando al mismo autor se asume un ndice
de construccin se carece del apoyo de elementos mnimo de 0.3
de carcter terico y tcnico proporcionados por
la teora de la medicin y evaluacin, resultado de Y tambin se puede hacer un anlisis de ujo de
la carencia en formacin especca en esta rea, opciones con el n de identicar la calidad de los
dentro de los programas de licenciatura y formacin distractores de dichos tems. Retomando a Haladyna
en pedagoga. (1994) y Downingl (1993) (citados por Rodrguez,
et al, 2005). Se tendr en cuenta el criterio de
De acuerdo a la panormica anteriormente pre- porcentaje de respuesta:
sentada se hace necesario llevar a cabo procesos
de construccin, validacin y estandarizacin de Poco razonables: si son respondidos por menos
las pruebas aplicadas en el aula de clase, siguiendo del 5% de los sujetos.
rigurosamente los lineamientos tradicionales de la
medicin y evaluacin. No discriminan: si son elegidos en igual proporcin
por quienes tienen puntajes altos y por quienes
El aporte del presente estudio es entonces llevar tienen puntajes bajos.
a cabo la validacin de una prueba en el rea de
matemticas, por dos razones fundamentales: pri- No claros: si varan a lo largo de los distintos rangos
mero por considerar esta rea como fundamental de puntajes de la prueba.
acorde con lo expuesto anteriormente y segundo
pretende servir de modelo metodolgico en proce- Indeseables: si imitan el comportamiento de la cla-
sos similares desde diversas reas de la educacin ve, es decir aumentan su frecuencia de respuesta a
bsica formal. medida que aumentan los puntajes de la prueba.
La fase de validacin contempla la recoleccin de
Dentro del proceso de construccin de una prueba diferentes tipos de evidencia acorde con la nalidad
El grado de integracin de un tem se puede des- Para la fase de validacin por jueces se cont con
cubrir investigando la relacin que existe entre las la participacin de 10 jueces expertos en el rea de
respuestas que los sujetos emiten para el total de matemticas, quienes contaban mnimo con titulo
tems. Lo que se investiga es la relacin que existe de pre-grado en Licenciatura en matemticas.
entre el valor de escala que nos proporcionara un
tem dado y el valor de escala que nos proporciona- Para la fase de pilotaje se cont con la participacin
ran todos los tems (Cohen y Swerdilk,2001). Una de 131 estudiantes pertenecientes al grado dcimo
relacin baja o negativa ser una indicacin de que del C.A.C.S , 73 hombres y 58 mujeres con edades
el tem no esta bien integrado, por el contrario una comprendidas entre los 14 y 17 aos.
relacin moderada o alta es una indicacin de que
la integracin del tem es aceptable o excelente. Para la fase de validacin por jueces se utiliz un
formato que pretenda evaluar la claridad y perti-
Posterior al anlisis tem-test es relevante realizar el nencia de cada uno de los 20 tems incluidos en
anlisis tem-tem para vericar la relacin existente la prueba inicial.
entre los reactivos que componen el instrumento
de medicin (Cohen y Swerdilk, 2001). Para la fase de anlisis de tems y anlisis de con-
sistencia se aplico la prueba piloto ajustada con
El procedimiento es relevante ya que permite una base en los ajustes de los jueces expertos.
estimacin inicial del grado de consistencia que
puede tener una prueba dado que entre mayor sean El presente estudio se llevo a cabo mediante las
los ndices de correlacin entre los reactivos, mayor siguientes fases:
ser la probabilidad de tener un instrumento con
una adecuada consistencia o estructura interna FASE DE CONSTRUCCIN: Pese a iniciar la in-
(Cohen y Swerdilk, 2001). vestigacin con una prueba ya construida por un
grupo de docentes del rea de matemticas del
El procedimiento siempre debe realizarse despus colegio, se realiz el proceso de validacin por
del anlisis tem-test, es decir, se hace despus jueces y anlisis de tems correspondientes a la
de la depuracin de los reactivos iniciales del fase de construccin.
instrumento.
VALIDACIN POR JUECES: Se organizaron cada
En la fase de estandarizacin se determinan las uno de los 20 tems originales de la prueba en un
normas generales tanto de aplicacin como de cali- cuadernillo de validacin por jueces, con el n de
cacin e interpretacin de la informacin obtenida determinar la pertinencia y la claridad de los tems
en el instrumento o prueba elaborada. por medio de la RAZN DE VALIDEZ DE CON-
TENIDO (CVR) de cada uno de los tems. ANLISIS DE CONFIABILIDAD: con los datos
AJUSTES INICIALES: Con base en el nivel de acuerdo obtenidos en el pilotaje y dado que no era posible
de los jueces se eliminaron los tems con niveles de llevar a cabo un mtodo de doble aplicacin, se
valoresnopermisiblesdeCVR, acordeconloscriterios decidio realizar un anlisis de consistencia inter-
de Lawshe (1975), (citado por Cohen, 2001). na implementando los mtodos de: divisin por
mitades, KR-20, Rulkon y Guttmann. Se utilizo el
PILOTAJE: Se aplico la prueba a los 131 estudiantes paquete estadstico SPSS 10.0
de grado dcimo del C.A.C.S. previamente divididos
en 4 grupos correspondientes a los cuatro cursos RESULTADOS
del nivel, Las condiciones de aplicacin se igualaron
en tiempos (90 minutos), espacios (saln de clases) Anlisis de tems
y herramientas de ayuda (calculadora). Las caractersticas evaluadas en los tems son su
dicultad y su discriminacin.
ANLISIS DE REACTIVOS: Basados en el anlisis
clsico se llevo a cabo el anlisis tem tem, ndice de Se retomaran los parmetros establecidos para
dicultad, ndice de discriminacin, tem prueba, la aceptacin de tems planteados por Guilford
de cada uno de los 17 tems piloteados. (1975), donde el rango aceptable para el ndice de
TABLA 1. Descriptivos de los parmetros de dicultad y discriminacin con mtodos de la TCT, para cada uno de
los 20 tems
CORR. BISERIAL
ITEM No. DIFICULTAD
PUNTUAL
1 .409 .41
2 .63 .16
3 .23 .25
4 .36 .37
5 .77 .34
6 .16 .38
7 .77 .29
8 .37 .37
9 .81 .29
10 .86 .53
11 .91 .12
12 .63 .41
13 .68 .30
14 .83 .39
15 .44 .40
16 .60 .38
17 .51 .46
18 .40 .32
19 .28 .17
20 .14 .13
dicultad oscila entre 0.2 y 0.85. Y en el caso de adecuadas y por no discriminar los tems 2, 3, 7,
la discriminacin retomando al mismo autor se 9, 11, 19 y 20.
asume un ndice mnimo de 0.3.
Como resultado del anlisis del ujo de alternativas
Acorde con los parmetros de Guilford (Citado se enuncian en la tabla 2, los tems que se entraron
por Rodrguez, Casa, Medina, 2005). los tems 6, a considerar por presentar un comportamiento
10, 11 y 20 presentan ndices de dicultades no no adecuado.
Con respecto al anlisis tem test al utilizar el coeciente de Pearson se obtuvieron los siguientes resul-
tados:
Lo anterior permite observar que de 20 tems que Posterior a este anlisis tem test o tem prueba
comprenden la prueba piloteada solamente los tems se procede a realizar el anlisis tem-tem con el
9, 10, 12, 14 y 17 se relacionan adecuadamente con n de iniciar el proceso de recoleccin de eviden-
el puntaje total de la prueba y el resto de tems no cia que permita establecer como se relacionan los
estn bien integrados a la prueba, especialmente el tems entre si. Los resultados se muestran en la
tem 20 que arroja una correlacin negativa. tabla 4.
TABLA 4.
item1 Item2 item3 item4 item5 item6 item7 item8 item9 item10 item11 item12 item13 item14 item15 item16 item17 item18 item19 item20
item 1 1,000 0,278 0,039 -0,059 0,174 0,183 0,084 0,113 0,232 0,134 0,013 0,510 0,094 0,083 0,134 0,012 0,167 0,052 0,012 -0,164
item 2 0,278 1,000 0,235 -0,143 0,132 -0,072 0,068 -0,036 0,149 -0,092 0,031 -0,027 0,030 0,071 0,013 -0,010 0,045 0,049 -0,030 -0,176
item 3 0,039 0,235 1,000 -0,081 0,109 0,007 0,004 0,133 0,076 0,084 -0,086 0,032 0,123 0,138 0,208 -0,073 0,002 0,102 0,061 -0,103
item 4 -0,059 -0,143 -0,081 1,000 0,064 -0,025 0,146 -0,099 -0,057 0,137 0,024 0,065 -0,021 0,151 -0,006 0,043 0,096 0,122 0,065 0,238
item 5 0,174 0,132 0,109 0,064 1,000 0,053 0,175 0,114 0,208 0,155 0,004 0,120 0,076 0,124 -0,009 -0,001 -0,042 -0,119 -0,077 -0,259
item 6 0,183 -0,072 0,007 -0,025 0,053 1,000 -0,105 0,151 0,018 0,020 0,097 0,185 0,067 0,039 0,144 0,113 0,102 0,022 0,126 -0,097
item 7 0,084 0,068 0,004 0,146 0,175 -0,105 1,000 -0,035 0,168 0,132 -0,134 -0,003 0,305 0,116 0,049 -0,105 0,086 0,055 -0,006 0,019
item 8 0,113 -0,036 0,133 -0,099 0,114 0,151 -0,035 1,000 0,191 0,071 0,085 0,294 0,138 0,056 0,049 0,131 0,049 0,015 0,067 -0,184
item 9 0,232 0,149 0,076 -0,057 0,208 0,018 0,168 0,191 1,000 0,203 0,186 0,212 0,187 0,153 -0,056 0,066 0,235 0,084 0,113 0,130
item 10 0,134 -0,092 0,084 0,137 0,155 0,025 0,132 0,071 0,203 1,000 0,047 0,191 0,050 0,492 0,121 0,177 0,208 0,197 -0,036 0,153
item 11 0,013 0,031 -0,086 0,024 0,004 0,097 -0,134 0,085 0,186 0,047 1,000 0,112 0,043 0,016 0,238 0,162 0,140 -0,067 0,033 -0,172
item 12 0,051 -0,027 0,032 0,065 0,120 0,185 -0,003 0,294 0,212 0,191 0,112 1,000 0,093 0,249 -0,017 0,122 0,176 0,058 0,101 -0,014
item 13 0,094 0,030 0,123 -0,021 0,076 0,067 0,350 0,138 0,187 0,050 0,043 0,093 1,000 0,066 0,215 0,067 0,050 -0,025 0,067 0,008
item1 Item2 item3 item4 item5 item6 item7 item8 item9 item10 item11 item12 item13 item14 item15 item16 item17 item18 item19 item20
item 14 0,083 0,071 0,138 0,151 0,124 0,039 0,116 0,056 0,153 0,492 0,016 0,249 0,066 1,000 0,066 0,061 0,168 0,316 0,039 0,088
item 15 0,134 0,013 0,208 -0,006 -0,009 0,144 0,049 0,049 -0,056 0,121 0,238 -0,017 0,215 0,066 1,000 0,144 0,133 -0,139 0,102 -0,041
item 16 0,012 -0,010 -0,073 0,043 -0,001 0,113 -0,105 0,131 0,066 0,177 0,162 0,122 0,067 0,061 0,144 1,000 0,113 -0,014 0,072 0,031
item 17 0,167 0,045 0,002 0,096 -0,042 0,102 0,086 0,049 0,235 0,208 0,140 0,176 0,050 0,168 0,133 0,113 1,000 0,186 0,186 0,008
item 18 0,052 0,049 0,102 0,122 -0,119 0,022 0,055 0,015 0,084 0,197 -0,067 0,058 -0,025 0,316 -0,139 -0,014 0,186 1,000 0,163 0,123
item 19 0,012 -0,030 0,061 0,065 -0,077 0,126 -0,006 0,067 0,113 -0,036 0,033 0,101 0,067 0,039 0,102 0,072 0,186 0,163 1,000 0,031
item 20 -0,164 -0,176 -0,103 0,238 -0,259 -0,097 0,019 -0,184 -0,130 0,153 -0,172 -0,015 0,008 0,088 -0,041 0,031 0,008 0,123 0,031 1,000
La tabla 4 permite observar las correlaciones entre En cuanto a la construccin de la prueba; en los
los tems que mantienen concordancia con los anlisis tem-prueba e tem tem se observan
resultados anteriores, ya que son muy dbiles, a correlaciones muy bajas que indican la falta de
excepcin de los tems 9, 10, 12, 14 y 17 se evidencia relacin de los tems entre s y de los tems con la
un comportamiento disgregado de los elementos prueba. Puesto que las pruebas utilizadas no atien-
que constituyen la prueba. den al proceso y criterios para la construccin de
la misma, a saber: conceptualizacin, construccin
Continuando con el proceso de anlisis de la prueba de reactivos, validacin, anlisis de conabilidad y
se presentan los coecientes de consistencia in- estandarizacin. La prueba present dicultades
terna utilizados como evidencia de consistencia y desde el mismo proceso de construccin de los
conabilidad en la prueba. Se aplico el mtodo de tems evidenciado esto en el comportamiento poco
divisin por mitades, alfa de Cronbach, coeciente deseable de 18 de los 20 tems que presentaban
alfa estandarizado y coecientes y . dicultades tanto en las clave como en los dis-
tractores. Se observaron niveles de dicultad que
A partir de los diferentes mtodos se obtuvieron tendan a los extremos y un nmero importante
valores de consistencia muy bajos para una prue- de tems que no discriminan. A este respecto es
ba de conocimientos, siendo el menor 0.54 y el importante apuntar que se observo una gran can-
mayor 0.64. tidad de datos perdidos o preguntas sin responder
lo que pudo afectar la representatividad de estos
DISCUSIN dos parmetros.
Los resultados permiten conrmar la problemtica En cuanto a los resultados obtenidos, se demuestra
expuesta respecto de las dicultades en el diseo el olvido o poca importancia que se da a la observa-
y construccin de pruebas de conocimiento mate- cin y medicin de las competencias matemticas;
mtico validas al interior del aula de clase. Ya que las respuestas obtenidas no dan referencia del nivel
como queda expuesto en la presente investigacin de anlisis, razonamiento o uso de los conceptos
las pruebas realizadas no permiten y no son usa- en la resolucin de problemas matemticos, de
das en la toma de decisiones, no determinan los otra parte, para el estudiante es poco importante
aspectos a mejorar y no son usadas por los maes- el rol de la matemtica en su hacer cotidiano, la
tros para denir y orientar acciones tendientes prueba se convierte as en un simple examen a
a elevar la calidad de los procesos educativos, es responder.
decir, no cumplen con los criterios necesarios para
ser considerada una evaluacin valida. Lo anterior En cuanto al anlisis de conabilidad, se eligi uti-
debido a la falta de capacitacin al respecto por lizar el anlisis de consistencia interna debido a las
parte de los docentes. dicultades para llevar a cabo una doble aplicacin
REFERENCIAS