PUERTO PRITU, SEPTIEMBRE DE 2014. VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS Y LOS PROCESOS DE EVALUACIN El rigor y la calidad para evaluar el aprendizaje dependen, fundamentalmente, de cmo se aborde la validez y la confiabilidad, cualidades esenciales que deben estar presentes en el desarrollo del proceso de recoger y analizar la informacin conducente a garantizar una mayor confianza sobre las conclusiones emitidas, de manera individual y compartida, por el evaluador. Tanto la validez como la confiabilidad se conjugan para coadyuvar al evaluador a ser objetivo en el proceso de describir la realidad derivada de un aprendizaje especfico, el cual est inmerso en un discurso privado y que pretende ser pblico a travs de la comunicacin. La validez y la confiabilidad se abordan desde diferentes perspectivas, dependiendo de la aproximacin epistemolgica considerada. Validez Cuantitativa y Cualitativa La concepcin de validez est referida a la firmeza o seguridad de algn acto y las condiciones necesarias para su permanencia, vigencia y autenticidad. En el caso de la evaluacin del aprendizaje, ella se asocia a cun seguro est el evaluador al calificar o cualificar el aprendizaje que se alcanza sobre determinado conocimiento y si se corresponde con la realidad en la cual se desarroll ese aprendizaje. Validez Cuantitativa La validez cuantitativa, bajo la perspectiva de la teora positivista, se orienta fundamentalmente hacia las tcnicas e instrumentos de medicin elaborados por el evaluador, supuestos desarrollados a partir de las teoras planteadas por el filsofo francs Auguste Comte (1798-1857). En esa perspectiva, la validez asociada a la evaluacin del aprendizaje se concibe en trminos de: (a) precisar el rasgo del aprendizaje del evaluado que se pretende medir, como aprendizaje a travs de pruebas o tests, (b) predecir algn rasgo del aprendizaje adicional a lo que se pretende medir, y (c) medir lo que se dice medir de cierto rasgo (Comte, 1896). Este tipo de evaluacin presenta diferentes interpretaciones de validez, referidas a pruebas o tests, establecidas en los Estndares para Tests y Manuales para Educacin y Psicologa (American Psychological Association APA-, 1985): a. Validez de contenido: juicio lgico sobre la correspondencia que existe entre el rasgo del aprendizaje del evaluado y lo que se incluye en la prueba, recurriendo a expertos para valorar la adecuacin de cada tem al rasgo a evaluar. b. Validez de criterio: eficacia de la prueba para comparar un rasgo en cuestin con alguna o algunas variables externas, midindola a travs de anlisis correlacional o de regresin entre las puntuaciones obtenidas en la prueba y en otras basadas en el criterio. c. Validez de constructo: basada en la integracin de cualquier evidencia que fundamenta la interpretacin o significado de las puntuaciones de la prueba o test, medida a travs del anlisis correlacional y de covarianza intertem. Estas categoras, establecidas por la APA, fueron resumidas en 1985 a partir de cinco tipos de validez sealados por esta misma Asociacin en 1954 (validez de contenido, validez de criterio, validez predictiva, validez concurrente y validez de constructo); apuntando hacia la concepcin nica de validez, referida a la pertinencia, significado y utilidad de las inferencias especficas derivadas de las pruebas o tests, coincidiendo, desde este punto vista, con Anastasi en 1982 y con Cronbach en 1984. Por su parte, Campbell y Stanley (1972) distinguen dos tipos de consideraciones para la validez cuantitativa asociada a la evaluacin del aprendizaje: la validez interna y la externa. a. Validez interna: concebida como la mnima imprescindible sin la cual es imposible interpretar alguna evaluacin. Algunas variables externas que pueden generar efectos que se confundiran con el del estmulo del aprendizaje son: (a) la historia (acontecimientos especficos ocurridos entre mediciones sucesivas para evaluar el logro de un objetivo instruccional); (b) la maduracin (procesos internos del evaluado como cansancio, desmotivacin, desinters, etctera); (c) la administracin de tests (influjo que la administracin de una prueba o test ejerce sobre los resultados de otro posterior); (d) la instrumentacin (cambios en los instrumentos de medicin o en los evaluadores que pueden producir variaciones en las mediciones que se obtengan); (e) la mortalidad (diferencia en la prdida de evaluadores). b. Validez externa: la cual plantea la interrogante sobre la posibilidad de generalizacin. Los factores que amenazan esta validez son: (a) el efecto reactivo o de interaccin de las pruebas o tests (aumento o disminucin de la sensibilidad o la calidad de la reaccin del evaluado al estmulo de un aprendizaje); (b) el efecto de interaccin (sesgo de seleccin de tcnicas e instrumentos de evaluacin y el tipo especfico de aprendizaje); (c) efectos reactivos de la evaluacin (impedimentos para hacer extensiva las tcnicas e instrumentos para evaluar un aprendizaje en otros aprendizajes); y (d) las interferencias de las evaluaciones mltiples (efectos que se producen cuando al evaluado le aplican evaluaciones mltiples y sucesivas, persistiendo aqullos de procesos y resultados de evaluaciones anteriores). Validez Cualitativa La validez, bajo el enfoque cualitativo, concierne a la exactitud con que las conclusiones representen efectivamente la realidad emprica y si los constructos diseados representan categoras reales de la experiencia humana (Hansen, citado en Prez, 1994: 80). En otras palabras, ella es una forma de estimar el grado de correspondencia entre el aprendizaje susceptible de ser evaluado y el proceso de evaluar ese aprendizaje atribuido al evaluado. Agregado a esto, la credibilidad, asociada a la validez, est condicionada a la estrecha relacin del evaluador con el evaluado y con el contexto sociocultural donde se realiza la evaluacin, tomando en consideracin sus caractersticas ms relevantes. Tomando en consideracin el enfoque cualitativo, existen las siguientes estrategias para asegurar la validez en materia de evaluacin: a. Triangulacin: consiste en recoger informacin desde diferentes puntos de vista, realizando comparaciones mltiples de una misma evaluacin y combinando metodologas en su anlisis; pudiendo existir, segn Denzin (1979: 140), las siguientes modalidades: (a) triangulacin de tiempo (informacin recogida en diferentes momentos para su contrastacin); (b) triangulacin de espacio (tcnicas transculturales); (c) niveles combinados de triangulacin (anlisis del nivel individual, del nivel interactivo o grupal, y del nivel de colectividades, organizacional, cultural o social); (d) triangulacin terica (empleo de diferentes perspectivas coincidentes en una misma evaluacin); (e) triangulacin del evaluador (verificacin intersubjetiva entre varios evaluadores, a travs del contraste de la informacin); y (f) triangulacin metodolgica (coleccin de tcnicas o mtodos diferentes, utilizados sobre el evaluado). b. Saturacin: Segn Hopkins (1985), ella consiste en reunir las pruebas y evidencias suficientes para garantizar la credibilidad de la evaluacin; lo cual se logra repitiendo la evaluacin o revisando el proceso involucrado. c. Validez respondente o negociacin: se desarrolla contrastando los resultados obtenidos por el evaluador con los del evaluado, as como contrastando su interpretacin. Goetz y LeCompte (1988), por su parte, plantean dos tipos de validez asociados a la evaluacin del aprendizaje: a. Validez interna: consiste en conocer si el evaluador observa realmente lo que cree observar. Las variables que amenazan esta validez seran las mismas descritas por Campbell y Stanley (1979), slo que su tratamiento es diferente debido a que la evaluacin se realiza en escenarios no sujetos a mediciones cuantitativas ni a esquemas rgidos preestablecidos. En el caso de la historia y la maduracin, el evaluador debe determinar la informacin que se mantiene estable en el tiempo as como la mutable. Para conocer los cambios, recurre a la replicacin y comparacin sistemtica de la evaluacin. Sobre la influencia del evaluador, ste debe controlar los factores personales en el proceso de recoger la informacin, la cual debe ser lo menos visible posible, sin prejuicios ni posturas preestablecidas. La seleccin y regresin las controla el evaluador a travs de un inventario de subgrupos, acontecimientos y escenarios. La mortalidad, debida a la disminucin en nmero de otros evaluadores, es un proceso posible en estos escenarios, para lo cual el evaluador debe identificar sus efectos. b. Validez externa: est referida a constatar si los constructos y postulados abstractos creados, perfeccionados o comprobados por el evaluador son aplicables a los del evaluado. Ella depende de la identificacin y descripcin de las caractersticas ms importantes del evaluador y de las evaluaciones, de tal manera que puedan ser comparadas con otras posteriores de tipo similar, para lo cual quizs sea necesario conocer exhaustivamente sus atributos. Para contrarrestar esto, es recomendable desarrollar la evaluacin, si es posible, en mltiples escenarios. El efecto de seleccin se minimiza determinando el grado de ajuste entre las categoras diseadas y la realidad del evaluador y la del evaluado. El efecto de escenario y de la historia, como amenazas al efectuar interpretaciones intergrupales de constructos, disminuyen en la medida que la dinmica interactiva y las experiencias histricas se identifican con la mayor claridad. Confiabilidad Cuantitativa y Cualitativa La confiabilidad consiste en la esperanza firme que se tiene sobre algn acto, as como su presuncin en eventos futuros. En el caso de la evaluacin del aprendizaje, esta confiabilidad refiere al esfuerzo del evaluador para asegurar la pertinencia y permanencia tanto del procedimiento como de las estrategias y mtodos utilizados para evaluar el aprendizaje. Confiabilidad Cuantitativa La concepcin de confiabilidad de la evaluacin del aprendizaje, bajo el enfoque cuantitativo, hace referencia a la estabilidad o consistencia interna en las tcnicas e instrumentos; y reside en establecer la medida en que se puede replicar la evaluacin: una exigencia al evaluador para que, utilizando otros mtodos y estrategias, llegue a idnticos resultados. La prueba y el test alcanzan un elevado coeficiente de confiabilidad si los errores de medida se minimizan; es decir, cuando toda medida de confiabilidad indica qu proporcin de la varianza total de las puntuaciones es varianza de error. Existen tres tipos de confiabilidad en la evaluacin cuantitativa: (a) la repeticin de la prueba con tiempo suficiente para que el evaluado olvide los temes, calculando el coeficiente de correlacin que permite conocer el grado de confiabilidad de dicha prueba; (b) las formas paralelas, tcnica similar a la anterior pero con pruebas no idnticas sino con temes equivalentes; y (c) divisin en mitades, con el cual se calcula un coeficiente de consistencia interna, mediante la correlacin entre las puntuaciones de ambas mitades. Confiabilidad Cualitativa La confiabilidad, bajo la perspectiva cualitativa, es un proceso emprico para verificar el grado de similitud entre el contexto del evaluador y el contexto del evaluado. Es relativa y depende totalmente del grado de superposicin o apareamiento de sus caractersticas ms sobresalientes. A su vez, depende enteramente de la descripcin detallada que realice el evaluador sobre el tiempo, lugar y cultura donde ocurre la evaluacin, para poder as transferir juicios hacia otros evaluadores. Segn Goetz y LeCompte (1988), existen dos tipos de confiabilidad para la evaluacin: a. Confiabilidad interna: consiste en conocer la congruencia existente entre las inferencias relativas al aprendizaje, derivadas stas de los constructos elaborados por el evaluado sobre un aprendizaje, para lo cual es fundamental la descripcin y composicin de los acontecimientos sin tomar en cuenta su frecuencia. Usualmente se utilizan las siguientes tcnicas e instrumentos: (a) descriptores de bajo nivel inferencial (narraciones y relatos concretos, minuciosos y precisos, incluyendo datos discrepantes); (b) varios evaluadores (equipos de evaluadores abocados a la evaluacin de un mismo aprendizaje), (c) revisin por otros evaluadores (corroboracin de los hallazgos por parte de otros evaluadores); y (d) datos registrados automticamente (registros de video, audio, fotografas, etc.) b. Confiabilidad externa: consiste en establecer condiciones empricas en el proceso de evaluacin que puedan ser replicadas por otros evaluadores, no significando esto que los hallazgos sean replicables, debido a que el flujo de informacin depende del contexto sociocultural donde ocurre la evaluacin. El evaluador aumenta la confiabilidad externa de la evaluacin dando respuesta a cuatro aspectos: (a) status del evaluado (rol social del evaluado frente al aprendizaje y su evaluacin); (b) seleccin de la evaluacin (caracterizacin de las tcnicas e instrumentos que permitan la replicabilidad de la evaluacin); (c) situaciones y condiciones sociales (contexto fsico, social e interpersonal donde se recoge la informacin relativa a la evaluacin); (d) premisas y constructos analticos (especificacin adecuada de los constructos, conceptos y definiciones que caracterizan la evaluacin); y (e) mtodos y estrategias de recogida y anlisis de informacin (presentacin difana de la estrategia y metodologa de evaluacin).