Вы находитесь на странице: 1из 11

CONSTRUCCIN Y VALIDACIN DE UNA PRUEBA

PARA MEDIR CONOCIMIENTOS MATEMTICOS1


Patricia Lpez Obando2
Fecha de recepcin: Junio 2009
Fecha de aceptacin: Agosto 2009

Resumen
Se muestran los resultados de la investigacin para la construccin y validacin de una prueba previamente diseada
en pro de medir conocimientos en el rea de matemtica, desde una perspectiva clsica de la medicin se llevo a cabo
el proceso de validacin por jueces, anlisis de tems y consistencia interna de dicha prueba, lo anterior por considerar
la evaluacin dentro del aula en la formacin bsica como un proceso de relevancia en un contexto social donde perma-
nentemente se busca seleccionar, jerarquizar y diagnosticar mediante pruebas objetivas. Posterior al pilotaje llevado a
cabo en un colegio privado en la ciudad de Bogot con 131 estudiantes se encontraron falencias en las caractersticas
tcnicas de los tems y por ende en el nivel de conabilidad de la prueba, ello da muestra de la poca formacin de los
docentes para este tipo de procedimiento llevando a preguntarse respecto de la abilidad de la evaluacin realizada.
Palabras Clave: evaluacin, prueba objetiva, conocimiento matemtico.

CONSTRUCTION AND VALIDATION OF A TEST TO MEASURE MATHEMATICAL


KNOWLEDGE
Abstract
This article shows the research ndings for the construction and validation of a test previously designed in behalf of
measuring knowledge in the area of mathematics, from a classical perspective of the measurement himself I accomplish
the process of validation for judges, analysis of items and internal consistency of happiness try, the above to regard
the evaluation within the classroom in basic training as a process worthy of consideration in a social context where
permanently it is tried to select, to hierarchies and to diagnose by means of objective tests. Posterior they found to
the testing accomplished at a private school at the city from Bogot with 131 students fallacies in the characteristic
techniques of items and as a consequence in the level of reliability of the test, it gives the few sign formation of
teachers for this procedural type taking to ask oneself in respect of the reliability of the realized evaluation.
Key words: evaluation, objective test, mathematical knowledge

INTRODUCCIN de un sujeto en un contexto determinado, utilizan-


do herramientas conceptuales y procedimentales
La evaluacin es una de las acciones que constan- adquiridas a travs del proceso de formacin.
temente se realiza en la institucin escolar, los
resultados obtenidos permiten tomar decisiones Al evaluar por competencias se deben revisar los des-
con base en dos elementos: 1. determinar los as- empeos de los estudiantes, es decir, es una medicin
pectos que hay que mejorar y 2. denir y orientar indirecta a partir de las actuaciones determinadas y
las acciones que permitan elevar la calidad de la esperadas de acuerdo al nivel manejado. Estos desem-
propuesta educativa (Instituto Colombiano Para el peos estn directamente relacionados con el rea a
Fomento de la Educacin Superior ICFES, 2001). evaluar, se evidencian las caractersticas en el manejo
El evaluar por competencias supone la recoleccin de la informacin y su aplicacin en situaciones pro-
de evidencia que permita determinar el saber hacer blema denidas en el rea de conocimiento.

1
Investigacin realizada en la especializacin de Medicin y Evaluacin en Ciencias Sociales.
2
Mg. En investigacin Educativa. Especialista en Medicin y Evaluacin en Ciencias Sociales. Licenciada en Fsica. Coordina-
dora de Desarrollo Cientco. Coorporacin Universitaria Iberoamericana.

Horiz. Pedaggico. Volumen 11. N 1. 2009 / pgs. 29-37 29


Segn Rico (citado por Gonzlez 2000, p. 21) La mos bsicos, para llegar a un verdadero anlisis
evaluacin es el enjuiciamiento sistemtico de la previo a la aplicacin de los mismos. Es imposible
vala o el mrito de un objeto. Esta denicin se desconectar los componentes conceptual y procedi-
centra en el trmino valor e implica que la evaluacin mental ya que estos se alimentan mutuamente, por
siempre supone un juicio. Lo anterior pone de ma- ejemplo, se reconoce la potencia de las estructuras
niesto la relevancia de la evaluacin en un contexto conceptuales para seleccionar un procedimiento
social ya que al ser un juicio permite seleccionar, adecuado en una situacin especca con cierto
jerarquizar, diagnosticar y medir procesos. nivel de complejidad (Barn et al, 2001).

Es tal el impacto social que incluso la evaluacin de Al hablar de evaluacin en la educacin bsica se-
las competencias bsicas en las reas de lenguaje y cundaria al interior del aula se deben operacionalizar
matemticas ocupa un lugar prominente en el plan los componentes tanto conceptuales como proce-
de desarrollo del gobierno colombiano, ya que se dimentales de manera tal que se puedan valorar las
reconoce la necesidad inaplazable que tienen los fortalezas y debilidades de los estudiantes en el rea
ciudadanos de informarse de si mismos sobre las especca, en este caso en el rea de matemticas,
debilidades y fortalezas en estas dos reas (Barn, exponiendo al sujeto a una situacin problema
Rojas, Salazar, 2003). que permita al docente determinar el grado de
profundidad alcanzado con respecto a un criterio
Lo anterior surge del reconocimiento de la mate- previamente establecido (Barn et al, 2003b).
mtica como un ente globalizador de pensamiento
lgico formal, dicho nivel de pensamiento permite Dichas situaciones problema pueden aplicarse tanto
evidenciar destrezas y habilidades surgidas en de forma grupal como individual, y pueden variar
diferentes culturas como respuesta a diferentes en su forma, desde talleres, laboratorios, revisiones
necesidades sociales como contar, medir, localizar bibliografcas, construccin de proyectos hasta
e inclusive jugar, lo que hace ver su practicidad no evaluaciones de tipo objetivo que pueden ser orales
solo en un contexto acadmico sino tambin en un o escritas de lpiz y papel, siendo estas ltimas el
contexto cotidiano. inters principal de este estudio.

Por lo tanto al realizar una evaluacin por compe- Segn Herrera (2003), las pruebas de carcter objetivo
tencias se busca trascender la perspectiva que la son tradicionalmente instrumentos usados en la
considera como la simple memorizacin de deni- evaluacin de conocimientos y habilidades. Gene-
ciones y ejecucin de procedimientos o dominios de ralmente estn constituidas por preguntas cerradas
clculo para llegar a valorar la destreza en el uso de y cumplen con las siguientes caractersticas:
este conocimiento en procesos de interpretacin,
representacin y explicacin de su entorno social 1. La calificacin no depende del evaluador,
(Barn et al, 2003a). dado que dichas condiciones de asignacin de
puntajes estn previamente estandarizadas,
Se brindan a partir de lo anteriormente expuesto 2. Existe un control mximo de las condiciones
los elementos a tener en cuenta en la construccin de aplicacin, que reduce la influencia de
de una prueba tendiente a medir el conocimiento variables extraas que pudiesen contaminar
dentro del rea, la cual debe contener elementos los resultados,
de: comprensin de conceptos, formas de repre- 3. El proceso de diseo y construccin de la
sentacin y uso de lenguaje matemtico, conside- prueba contempla una serie de pasos orga-
rados tanto en su componente conceptual como nizados de manera sistemtica y que implica
procedimental, utilizando para ello la formulacin trabajo interdisciplinario, tanto de expertos
y resolucin de situaciones problemas alejadas de conceptuales como de expertos en tcnicas
una base memorstica y de desarrollo de algorit- de medicin.

Horiz. Pedaggico. Volumen 11. N 1. 2009 / pgs. 29-37 30


Patricia Lpez Obando

A este respecto cabe mencionar que en el contexto se contemplan las fases de: conceptualizacin,
colombiano se han implementado evaluaciones de construccin de reactivos, validacin, anlisis de
este tipo de forma masiva, ejemplo de ellos son las conabilidad y por ltimo la estandarizacin.
pruebas SABER aplicadas por la Secretaria de Edu-
cacin Nacional y los exmenes de estado ICFES, La fase de conceptualizacin inicia estableciendo
en asocio con el Ministerio de Educacin Nacional la nalidad de la prueba en donde se especca el
(MEN) y las instituciones de escolares del pas. constructo a medir la poblacin y los objetivos del
instrumento, por medio de la denicin conceptual
Bajo este panorama se hace necesaria la proyeccin de y operacional.
este tipo de procedimientos de evaluacin al interior
del aula, buscando hacer un seguimiento constante La fase de construccin de reactivos incluye el
de los estudiantes y potencializando de esta forma, plan de prueba en donde se construye la tabla de
las competencias pertinentes para su desempeo especicaciones y se elige el formato de la prueba,
tanto en las pruebas masivas, como en situaciones es decir, tipo de tems y estructura.
de carcter evaluativo de su cotidianidad.
Al nal de esta fase se lleva a cabo el anlisis de tems
En el ambiente educativo, especcamente el ni- en donde se observan parmetros como ndice de
vel de educacin bsica formal, los docentes de dicultad e ndice de discriminacin, retomando
forma un tanto emprica, construyen sus propias los parmetros establecidos para la aceptacin de
pruebas de evaluacin, que son aplicadas, pero tems planteados por Guilford (1975), donde el
nunca son sometidas a procesos de validacin y rango aceptable para el ndice de dicultad oscila
estandarizacin que permitan hacer inferencias de entre 0.2 y 0.85. Y en el caso de la discriminacin
carcter slido y cientco; desde el mismo proceso retomando al mismo autor se asume un ndice
de construccin se carece del apoyo de elementos mnimo de 0.3
de carcter terico y tcnico proporcionados por
la teora de la medicin y evaluacin, resultado de Y tambin se puede hacer un anlisis de ujo de
la carencia en formacin especca en esta rea, opciones con el n de identicar la calidad de los
dentro de los programas de licenciatura y formacin distractores de dichos tems. Retomando a Haladyna
en pedagoga. (1994) y Downingl (1993) (citados por Rodrguez,
et al, 2005). Se tendr en cuenta el criterio de
De acuerdo a la panormica anteriormente pre- porcentaje de respuesta:
sentada se hace necesario llevar a cabo procesos
de construccin, validacin y estandarizacin de Poco razonables: si son respondidos por menos
las pruebas aplicadas en el aula de clase, siguiendo del 5% de los sujetos.
rigurosamente los lineamientos tradicionales de la
medicin y evaluacin. No discriminan: si son elegidos en igual proporcin
por quienes tienen puntajes altos y por quienes
El aporte del presente estudio es entonces llevar tienen puntajes bajos.
a cabo la validacin de una prueba en el rea de
matemticas, por dos razones fundamentales: pri- No claros: si varan a lo largo de los distintos rangos
mero por considerar esta rea como fundamental de puntajes de la prueba.
acorde con lo expuesto anteriormente y segundo
pretende servir de modelo metodolgico en proce- Indeseables: si imitan el comportamiento de la cla-
sos similares desde diversas reas de la educacin ve, es decir aumentan su frecuencia de respuesta a
bsica formal. medida que aumentan los puntajes de la prueba.
La fase de validacin contempla la recoleccin de
Dentro del proceso de construccin de una prueba diferentes tipos de evidencia acorde con la nalidad

Horiz. Pedaggico. Volumen 11. N 1. 2009 / pgs. 29-37 31


Patricia Lpez Obando

de la prueba, se encuentra aqu evidencia de validez


por jueces expertos, anlisis factorial, evidencia MTODO
convergente, divergente, entre otros.
Se utiliz el instrumento construido en el colegio
El anlisis de conabilidad se puede realizar desde Agustiniano Ciudad Salitre (C.A.C.S) de la ciudad de
una ptica interna o externa de acuerdo con las Bogot.Dichoinstrumentoestdirigidoaestudiantes
posibilidades de la investigacin. En caso de poder de grado dcimo de educacin bsica formal y tiene
hacer procedimiento con doble aplicacin se puede comoobjetivogeneralevaluarelniveldeconocimiento
utilizar el mtodo de test -retest o pruebas paralelas, en trigonometra, acorde con el plan de estudios del
pero en caso contrario se lleva a cabo un proceso de nivel. Es necesario aclarar que este estudio retom el
consistencia interna utilizando divisin por mitades instrumento ya construido por los docentes a cargo
o coecientes alfa, KR-20 entre otros. de esta rea en dicha institucin educativa.

El grado de integracin de un tem se puede des- Para la fase de validacin por jueces se cont con
cubrir investigando la relacin que existe entre las la participacin de 10 jueces expertos en el rea de
respuestas que los sujetos emiten para el total de matemticas, quienes contaban mnimo con titulo
tems. Lo que se investiga es la relacin que existe de pre-grado en Licenciatura en matemticas.
entre el valor de escala que nos proporcionara un
tem dado y el valor de escala que nos proporciona- Para la fase de pilotaje se cont con la participacin
ran todos los tems (Cohen y Swerdilk,2001). Una de 131 estudiantes pertenecientes al grado dcimo
relacin baja o negativa ser una indicacin de que del C.A.C.S , 73 hombres y 58 mujeres con edades
el tem no esta bien integrado, por el contrario una comprendidas entre los 14 y 17 aos.
relacin moderada o alta es una indicacin de que
la integracin del tem es aceptable o excelente. Para la fase de validacin por jueces se utiliz un
formato que pretenda evaluar la claridad y perti-
Posterior al anlisis tem-test es relevante realizar el nencia de cada uno de los 20 tems incluidos en
anlisis tem-tem para vericar la relacin existente la prueba inicial.
entre los reactivos que componen el instrumento
de medicin (Cohen y Swerdilk, 2001). Para la fase de anlisis de tems y anlisis de con-
sistencia se aplico la prueba piloto ajustada con
El procedimiento es relevante ya que permite una base en los ajustes de los jueces expertos.
estimacin inicial del grado de consistencia que
puede tener una prueba dado que entre mayor sean El presente estudio se llevo a cabo mediante las
los ndices de correlacin entre los reactivos, mayor siguientes fases:
ser la probabilidad de tener un instrumento con
una adecuada consistencia o estructura interna FASE DE CONSTRUCCIN: Pese a iniciar la in-
(Cohen y Swerdilk, 2001). vestigacin con una prueba ya construida por un
grupo de docentes del rea de matemticas del
El procedimiento siempre debe realizarse despus colegio, se realiz el proceso de validacin por
del anlisis tem-test, es decir, se hace despus jueces y anlisis de tems correspondientes a la
de la depuracin de los reactivos iniciales del fase de construccin.
instrumento.
VALIDACIN POR JUECES: Se organizaron cada
En la fase de estandarizacin se determinan las uno de los 20 tems originales de la prueba en un
normas generales tanto de aplicacin como de cali- cuadernillo de validacin por jueces, con el n de
cacin e interpretacin de la informacin obtenida determinar la pertinencia y la claridad de los tems
en el instrumento o prueba elaborada. por medio de la RAZN DE VALIDEZ DE CON-

Horiz. Pedaggico. Volumen 11. N 1. 2009 / pgs. 29-37 32


Patricia Lpez Obando

TENIDO (CVR) de cada uno de los tems. ANLISIS DE CONFIABILIDAD: con los datos
AJUSTES INICIALES: Con base en el nivel de acuerdo obtenidos en el pilotaje y dado que no era posible
de los jueces se eliminaron los tems con niveles de llevar a cabo un mtodo de doble aplicacin, se
valoresnopermisiblesdeCVR, acordeconloscriterios decidio realizar un anlisis de consistencia inter-
de Lawshe (1975), (citado por Cohen, 2001). na implementando los mtodos de: divisin por
mitades, KR-20, Rulkon y Guttmann. Se utilizo el
PILOTAJE: Se aplico la prueba a los 131 estudiantes paquete estadstico SPSS 10.0
de grado dcimo del C.A.C.S. previamente divididos
en 4 grupos correspondientes a los cuatro cursos RESULTADOS
del nivel, Las condiciones de aplicacin se igualaron
en tiempos (90 minutos), espacios (saln de clases) Anlisis de tems
y herramientas de ayuda (calculadora). Las caractersticas evaluadas en los tems son su
dicultad y su discriminacin.
ANLISIS DE REACTIVOS: Basados en el anlisis
clsico se llevo a cabo el anlisis tem tem, ndice de Se retomaran los parmetros establecidos para
dicultad, ndice de discriminacin, tem prueba, la aceptacin de tems planteados por Guilford
de cada uno de los 17 tems piloteados. (1975), donde el rango aceptable para el ndice de

TABLA 1. Descriptivos de los parmetros de dicultad y discriminacin con mtodos de la TCT, para cada uno de
los 20 tems

CORR. BISERIAL
ITEM No. DIFICULTAD
PUNTUAL
1 .409 .41
2 .63 .16
3 .23 .25
4 .36 .37
5 .77 .34
6 .16 .38
7 .77 .29
8 .37 .37
9 .81 .29
10 .86 .53
11 .91 .12
12 .63 .41
13 .68 .30
14 .83 .39
15 .44 .40
16 .60 .38
17 .51 .46
18 .40 .32
19 .28 .17
20 .14 .13

Horiz. Pedaggico. Volumen 11. N 1. 2009 / pgs. 29-37 33


Patricia Lpez Obando

dicultad oscila entre 0.2 y 0.85. Y en el caso de adecuadas y por no discriminar los tems 2, 3, 7,
la discriminacin retomando al mismo autor se 9, 11, 19 y 20.
asume un ndice mnimo de 0.3.
Como resultado del anlisis del ujo de alternativas
Acorde con los parmetros de Guilford (Citado se enuncian en la tabla 2, los tems que se entraron
por Rodrguez, Casa, Medina, 2005). los tems 6, a considerar por presentar un comportamiento
10, 11 y 20 presentan ndices de dicultades no no adecuado.

TABLA 2. Comportamiento de la clave y los distractores de los tems de la prueba.

ITEM # ANLISIS DE ALTERNATIVAS


La clave a es contestada por la mayora, sin embargo la opcin d se comporta en forma muy
1
similar y adems la opcin c solamente es elegida por 2 sujetos
La clave no resulta atractiva para los sujetos, ya que solo es elegida por el 16% , mientras
3
que el distractor c es elegido por el 18 % de los individuos
La clave presenta la frecuencia de respuesta ms baja, mientras que el distractor a fue el
6
que ms eligieron los sujetos
7 La clave es demasiada obvia ya que es elegida por el 71% de la poblacin
8 La clave presenta un comportamiento muy similar al distractor d
9 La clave es demasiada obvia ya que es elegida por el 81% de la poblacin
El distractor a es demasiado obvio ya que no tuvo frecuencia de respuesta y la clave es de-
10
masiado obvia al ser elegida por el 87% de los sujetos.
El distractor c es demasiado obvio ya que no tuvo frecuencia de respuesta y la clave es de-
11
masiado obvia al ser elegida por el 89% de los sujetos.
El distractor d es demasiado obvio ya que solo un sujeto lo eligi, la clave presenta un com-
12
portamiento adecuado.
13 El distractor a es demasiado obvio ya que no tuvo frecuencia de respuesta.
14 La clave es demasiada obvia ya que es elegida por el 81% de la poblacin
La clave a tiene un comportamiento muy similar al distractor b, mientras que los distractores c
15
y d son muy obvios al presentar frecuencias de respuestas muy bajas.
16 El distractor b es demasiado obvio al ser contestado nicamente por 2 sujetos.
17 El distractor b es demasiado obvio al ser contestado nicamente por 1 sujeto.
19 El distractor a presenta mayor frecuencia de respuesta en comparacin con la clave
El distractor d atrae mayor atencin al ser elegido por el 33%, mientras que la clave es elegida
20
por el 9% de los sujetos

Horiz. Pedaggico. Volumen 11. N 1. 2009 / pgs. 29-37 34


Patricia Lpez Obando

Con respecto al anlisis tem test al utilizar el coeciente de Pearson se obtuvieron los siguientes resul-
tados:

TABLA 3. ndices de correlacin tem- Prueba

TEM TOTAL TEM TOTAL


TEM TEM
CORRELATION CORRELATION
1 .2654 11 .1348
2 .0874 12 3097
3 .1689 13 .2596
4 .0837 14 .3827
5 .1655 15 .1959
6 .1664 16 .1643
7 .1741 17 .3227
8 .2069 18 .1695
9 .3567 19 .1664
10 .3867 20 -.0962

Lo anterior permite observar que de 20 tems que Posterior a este anlisis tem test o tem prueba
comprenden la prueba piloteada solamente los tems se procede a realizar el anlisis tem-tem con el
9, 10, 12, 14 y 17 se relacionan adecuadamente con n de iniciar el proceso de recoleccin de eviden-
el puntaje total de la prueba y el resto de tems no cia que permita establecer como se relacionan los
estn bien integrados a la prueba, especialmente el tems entre si. Los resultados se muestran en la
tem 20 que arroja una correlacin negativa. tabla 4.

TABLA 4.

item1 Item2 item3 item4 item5 item6 item7 item8 item9 item10 item11 item12 item13 item14 item15 item16 item17 item18 item19 item20

item 1 1,000 0,278 0,039 -0,059 0,174 0,183 0,084 0,113 0,232 0,134 0,013 0,510 0,094 0,083 0,134 0,012 0,167 0,052 0,012 -0,164

item 2 0,278 1,000 0,235 -0,143 0,132 -0,072 0,068 -0,036 0,149 -0,092 0,031 -0,027 0,030 0,071 0,013 -0,010 0,045 0,049 -0,030 -0,176

item 3 0,039 0,235 1,000 -0,081 0,109 0,007 0,004 0,133 0,076 0,084 -0,086 0,032 0,123 0,138 0,208 -0,073 0,002 0,102 0,061 -0,103

item 4 -0,059 -0,143 -0,081 1,000 0,064 -0,025 0,146 -0,099 -0,057 0,137 0,024 0,065 -0,021 0,151 -0,006 0,043 0,096 0,122 0,065 0,238

item 5 0,174 0,132 0,109 0,064 1,000 0,053 0,175 0,114 0,208 0,155 0,004 0,120 0,076 0,124 -0,009 -0,001 -0,042 -0,119 -0,077 -0,259

item 6 0,183 -0,072 0,007 -0,025 0,053 1,000 -0,105 0,151 0,018 0,020 0,097 0,185 0,067 0,039 0,144 0,113 0,102 0,022 0,126 -0,097

item 7 0,084 0,068 0,004 0,146 0,175 -0,105 1,000 -0,035 0,168 0,132 -0,134 -0,003 0,305 0,116 0,049 -0,105 0,086 0,055 -0,006 0,019

item 8 0,113 -0,036 0,133 -0,099 0,114 0,151 -0,035 1,000 0,191 0,071 0,085 0,294 0,138 0,056 0,049 0,131 0,049 0,015 0,067 -0,184

item 9 0,232 0,149 0,076 -0,057 0,208 0,018 0,168 0,191 1,000 0,203 0,186 0,212 0,187 0,153 -0,056 0,066 0,235 0,084 0,113 0,130

item 10 0,134 -0,092 0,084 0,137 0,155 0,025 0,132 0,071 0,203 1,000 0,047 0,191 0,050 0,492 0,121 0,177 0,208 0,197 -0,036 0,153

item 11 0,013 0,031 -0,086 0,024 0,004 0,097 -0,134 0,085 0,186 0,047 1,000 0,112 0,043 0,016 0,238 0,162 0,140 -0,067 0,033 -0,172

item 12 0,051 -0,027 0,032 0,065 0,120 0,185 -0,003 0,294 0,212 0,191 0,112 1,000 0,093 0,249 -0,017 0,122 0,176 0,058 0,101 -0,014

item 13 0,094 0,030 0,123 -0,021 0,076 0,067 0,350 0,138 0,187 0,050 0,043 0,093 1,000 0,066 0,215 0,067 0,050 -0,025 0,067 0,008

Horiz. Pedaggico. Volumen 11. N 1. 2009 / pgs. 29-37 35


Patricia Lpez Obando

item1 Item2 item3 item4 item5 item6 item7 item8 item9 item10 item11 item12 item13 item14 item15 item16 item17 item18 item19 item20

item 14 0,083 0,071 0,138 0,151 0,124 0,039 0,116 0,056 0,153 0,492 0,016 0,249 0,066 1,000 0,066 0,061 0,168 0,316 0,039 0,088

item 15 0,134 0,013 0,208 -0,006 -0,009 0,144 0,049 0,049 -0,056 0,121 0,238 -0,017 0,215 0,066 1,000 0,144 0,133 -0,139 0,102 -0,041

item 16 0,012 -0,010 -0,073 0,043 -0,001 0,113 -0,105 0,131 0,066 0,177 0,162 0,122 0,067 0,061 0,144 1,000 0,113 -0,014 0,072 0,031

item 17 0,167 0,045 0,002 0,096 -0,042 0,102 0,086 0,049 0,235 0,208 0,140 0,176 0,050 0,168 0,133 0,113 1,000 0,186 0,186 0,008

item 18 0,052 0,049 0,102 0,122 -0,119 0,022 0,055 0,015 0,084 0,197 -0,067 0,058 -0,025 0,316 -0,139 -0,014 0,186 1,000 0,163 0,123

item 19 0,012 -0,030 0,061 0,065 -0,077 0,126 -0,006 0,067 0,113 -0,036 0,033 0,101 0,067 0,039 0,102 0,072 0,186 0,163 1,000 0,031

item 20 -0,164 -0,176 -0,103 0,238 -0,259 -0,097 0,019 -0,184 -0,130 0,153 -0,172 -0,015 0,008 0,088 -0,041 0,031 0,008 0,123 0,031 1,000

La tabla 4 permite observar las correlaciones entre En cuanto a la construccin de la prueba; en los
los tems que mantienen concordancia con los anlisis tem-prueba e tem tem se observan
resultados anteriores, ya que son muy dbiles, a correlaciones muy bajas que indican la falta de
excepcin de los tems 9, 10, 12, 14 y 17 se evidencia relacin de los tems entre s y de los tems con la
un comportamiento disgregado de los elementos prueba. Puesto que las pruebas utilizadas no atien-
que constituyen la prueba. den al proceso y criterios para la construccin de
la misma, a saber: conceptualizacin, construccin
Continuando con el proceso de anlisis de la prueba de reactivos, validacin, anlisis de conabilidad y
se presentan los coecientes de consistencia in- estandarizacin. La prueba present dicultades
terna utilizados como evidencia de consistencia y desde el mismo proceso de construccin de los
conabilidad en la prueba. Se aplico el mtodo de tems evidenciado esto en el comportamiento poco
divisin por mitades, alfa de Cronbach, coeciente deseable de 18 de los 20 tems que presentaban
alfa estandarizado y coecientes y . dicultades tanto en las clave como en los dis-
tractores. Se observaron niveles de dicultad que
A partir de los diferentes mtodos se obtuvieron tendan a los extremos y un nmero importante
valores de consistencia muy bajos para una prue- de tems que no discriminan. A este respecto es
ba de conocimientos, siendo el menor 0.54 y el importante apuntar que se observo una gran can-
mayor 0.64. tidad de datos perdidos o preguntas sin responder
lo que pudo afectar la representatividad de estos
DISCUSIN dos parmetros.

Los resultados permiten conrmar la problemtica En cuanto a los resultados obtenidos, se demuestra
expuesta respecto de las dicultades en el diseo el olvido o poca importancia que se da a la observa-
y construccin de pruebas de conocimiento mate- cin y medicin de las competencias matemticas;
mtico validas al interior del aula de clase. Ya que las respuestas obtenidas no dan referencia del nivel
como queda expuesto en la presente investigacin de anlisis, razonamiento o uso de los conceptos
las pruebas realizadas no permiten y no son usa- en la resolucin de problemas matemticos, de
das en la toma de decisiones, no determinan los otra parte, para el estudiante es poco importante
aspectos a mejorar y no son usadas por los maes- el rol de la matemtica en su hacer cotidiano, la
tros para denir y orientar acciones tendientes prueba se convierte as en un simple examen a
a elevar la calidad de los procesos educativos, es responder.
decir, no cumplen con los criterios necesarios para
ser considerada una evaluacin valida. Lo anterior En cuanto al anlisis de conabilidad, se eligi uti-
debido a la falta de capacitacin al respecto por lizar el anlisis de consistencia interna debido a las
parte de los docentes. dicultades para llevar a cabo una doble aplicacin

Horiz. Pedaggico. Volumen 11. N 1. 2009 / pgs. 29-37 36


Patricia Lpez Obando

de la prueba; por el mtodo de divisin de mitades


se obtuvo un valor de 0.54, el alfa de Cronbach
arrojo un valor de 0.06037, el alfa estandarizado
es de 0.62, Coeciente es de 0.60 y el coeciente
un valor de 0.64; lo que permite deducir que la
prueba no es consistente, es decir, no mide de forma
correcta el rasgo para el cual se construyo, adems
de no controlar la inuencia del error implcita en
todo proceso de medicin.

En el momento de dar inicio al trabajo de validacin


no se encontr denicin conceptual y operacional
del constructo a medir, as como tampoco una ta-
bla de especicaciones que permitiera asegurar la
calidad en el proceso de construccin de los tems
y de la prueba en s, por lo tanto los resultados
encontrados ratican que esta prueba no cuenta
con los requerimientos tcnicos exigidos por la
medicin para poder ser utilizada en un ambiente
educativo con nes de evaluacin, lo que pone de
maniesto dos situaciones:

1. Se estn desarrollando procesos de evaluacin


errneos al interior del aula; en tanto no dan
cuenta del proceso y adquisicin de compe-
tencias y no se convierten en criterios para
la toma de decisiones, restringiendose a la
medicin de conceptos gregarios y fuente de
simples noticaciones para maestro, alumno
y padres de familia, y

2. Es necesaria la formacin docente respecto de


la elaboracin de pruebas validas para evaluar
conocimiento; la gran mayora de maestros no
cuenta con la preparacin conceptual como para
asumir la evaluacin en todo su proceso, o por
otra parte teniendo la preparacin para ello,
no cuenta con el tiempo que permita la rigu-
rosidad para realizarla. Finalmente responde
a las necesidades del momento; el registro de
notas y los procesos institucionales.

Lo anterior podra ser objeto de una nueva in-


vestigacin, no menos exhaustiva e interesante

Horiz. Pedaggico. Volumen 11. N 1. 2009 / pgs. 29-37 37


Patricia Lpez Obando

pues cules son las razones qu llevan a


un maestro consciente de los criterios y
procesos necesarios para realizar un
proceso real de evaluacin a obviarlos y no
realizarla? Nmero de estudiantes a cargo,
tiempo de preparacin y ejecucin, cabe
anotar aqu, que la presente investigacin
aunque esta realizada en el rea de
matemticas, da cuenta de las dicultades
en todas las reas del conocimiento y
podra aplicarse igualmente en todas ellas.
De hecho en la institucin educativa
aplicada recibi la atencin de todos los
maestros, quienes expresaban la necesidad
de iniciar un proceso tanto de diagnstico
como de aplicacin y nalmente de
preparacin de los docentes en la
realizacin de pruebas vlidas.

REFERENCIAS

Barn C., Rojas P., Salazar C. (2003a).


Matemticas escolares: aportes para orientar
procesos de inno- vacin. Bogot: ICFES
Instituto Colombiano Para el Fomento de la
Educacin Superior ICFES.
Barn C., Rojas P., Salazar C. (2003b). Evaluar
para Transformar: Una mirada a los
fundamentos e instrumentos de matemticas
2002 - 2003. Bogot: ICFES Instituto
Colombiano para el Fomento de la Educacin
Superior ICFES.
Cohen, R., Swerdilk,M.(2001). Pruebas y
Evaluacin Psicolgica. Introduccin a las
pruebas y a la Medicin. Mexico: Mc Graw
Hill.
Gonzlez S., (2000). Acerca de la evaluacin en
ma- temticas. En revista Educacin y Cultura.
Instituto Colombiano para el Fomento de la
Educa- cin Superior (2003) Evaluar para
transformar
aportes de las pruebas saber al trabajo en
el aula- Colombia. Bogot: ICFES.
Instituto Colombiano para el Fomento de la
Educacin Superior (2006).Prueba de
matemtica. Recupe- rado en
http://www.icfes.gov.co. Colombia.
Rodrguez, O., Casa, P., Medina, Y. (2005).
Anlisis psicomtrico de los exmenes de
evaluacin de la
calidaddelaeducacinsuperior(Ecaes)enColombi
a. Revista Avances Horiz.
en medicin, 3, Volumen
Pedaggico. 153- 11. N 1. 2009 / pgs. 29-37 38
Patricia Lpez Obando

Horiz. Pedaggico. Volumen 11. N 1. 2009 / pgs. 29-37 39

Вам также может понравиться