Вы находитесь на странице: 1из 32

Extracto de : Mejorando el aprendizaje de los

estudiantes con tcnicas efectivas de aprendizaje:


directivas prometedoras desde la Psicologa Cognitiva
y Educacional

John Dunlosky, Katherine Rawson, Elizabeth Marsh, Mitchell J Nathan & Daniel T, Willingham
Psychological Science in the Public Interest, 2013, 14(1):4-58.

NOTA: Este texto es un extracto de la traduccin realizada por el grupo docente del artculo
orignial. En el extracto hemos conservado la introduccin, la discusin general y las secciones
correspondientes a la tcnica de Pruebas de Prctica y Subrayado, sobre las que versarn las
preguntas del cuestionario. Dejamos a disposicin la traduccin completa del artculo y el
original en ingls. (Juan Valle Lisboa, 2017).

Introduccin
Si se dispusiera de tcnicas sencillas que los profesores y los estudiantes pudieran utilizar para
mejorar el aprendizaje y el rendimiento de los estudiantes, se sorprendera si no se les informara
sobre estas tcnicas y si muchos estudiantes no las usaran? Qu pasa si los estudiantes en su
lugar estn adoptando tcnicas de aprendizaje ineficaces que socavan su logro, o al menos no lo
mejoran? No deberan dejar de usar estas tcnicas y empezar a usar las que son eficaces? Los
psiclogos han estado desarrollando y evaluando la eficacia de las tcnicas para el estudio y la
instruccin por ms de 100 aos. Sin embargo, algunas tcnicas eficaces estn subutilizadas
-muchos profesores no aprenden acerca de ellas y, por lo tanto, muchos estudiantes no las usan, a
pesar de las evidencias que sugieren que las tcnicas podran beneficiar al estudiante con poco
esfuerzo adicional. Adems, algunas tcnicas de aprendizaje que son populares y utilizadas con
frecuencia por los estudiantes son relativamente ineficaces. Una potencial razn para la
desconexin entre la investigacin sobre la eficacia de las tcnicas de aprendizaje y su uso en la
prctica educativa es que debido a que hay tantas tcnicas disponibles sera difcil para los
educadores examinar las investigaciones pertinentes para decidir cules muestran una eficacia
promisoria y podran ser implementadas por los estudiantes (Pressley, Goodchild, Fleet,
Zajchowski, & Evans, 1989).

Para hacer frente a este desafo, exploramos la eficacia de 10 tcnicas de aprendizaje


(enumeradas en la Tabla 1) que los estudiantes podran utilizar para mejorar su xito en una
amplia variedad de dominios de contenido 1. Las tcnicas de aprendizaje que consideramos aqu
fueron seleccionadas sobre la base de los siguientes criterios. Seleccionamos algunas tcnicas (p.
ej., autodiagnstico, prctica distribuida) porque una evaluacin inicial de la literatura indic que
podran mejorar el xito del estudiante en una amplia gama de condiciones. Se incluyeron otras
tcnicas (por ejemplo, releer y destacar) porque los estudiantes reportan usarlas con frecuencia.
Adems, los estudiantes son responsables de regular una cantidad creciente de su aprendizaje a
medida que progresan desde primaria hasta el ciclo bsico y de secundaria a la universidad. Los
estudiantes que continan su educacin toda la vida tambin necesitan seguir regulando su
propio aprendizaje, ya sea en el contexto de la educacin de postgrado, el lugar de trabajo, el
desarrollo de nuevos pasatiempos o actividades recreativas.
Por lo tanto, limitamos nuestras opciones a las tcnicas que podran ser implementadas por los
estudiantes sin asistencia (por ejemplo, sin requerir tecnologas avanzadas o materiales extensos
que tendran que ser preparados por un maestro). Puede que se requiera algn entrenamiento para
que los estudiantes aprendan a usar una tcnica con fidelidad, pero en principio, los estudiantes
deben ser capaces de usar las tcnicas sin supervisin. Tambin elegimos tcnicas para las cuales
se dispona de suficiente evidencia emprica para apoyar al menos una evaluacin preliminar de
la eficacia potencial. Por supuesto, no pudimos revisar todas las tcnicas que cumplen estos
criterios, dada la naturaleza profunda de nuestras revisiones, y estos criterios excluyeron algunas
tcnicas que muestran muchas promesas, como las tcnicas que son impulsadas por tecnologas
avanzadas. Debido a que los maestros tienen ms probabilidades de aprender sobre estas tcnicas
en las clases de psicologa educativa, examinamos cmo algunos libros de texto sobre psicologa
educativa los cubran (Ormrod, 2008, Santrock, 2008, Slavin, 2009, Snowman, McCown y
Biehler, 2009, Sternberg & Williams, 2010, Woolfolk, 2007).

Tabla 1. Tcnicas de aprendizaje


Tcnica Descripcin
1. Interrogacin elaborativa Se genera una explicacin de por qu un hecho o afirmacin es verdadero
2. Auto-explicacin Se explica cmo la nueva informacin se relaciona con informacin ya
conocida, o se explican los pasos tomados durante la resolucin de
problemas
3. Resumen Se escriben resmenes (de distintas extensiones) de los textos a aprender
4. Iluminado / Subrayado Se marcan porciones potencialmente importantes de los materiales a
aprender mientras se lee
5.Memoria mnemnica con palabras Se usan palabras clave e imgenes para asociar materiales orales
clave
6. Imgenes del texto Se intentan formar imgenes mentales del text mientras se lee o escucha
7. Relectura Se reestudia el texto nuevamente luego de la lectura inicial
8. Pruebas de prctica Auto-evaluacin o exmenes de prctica sobre el material a aprender
9. Prctica distribuida Se implementa un cronograma de prctica que distribuye temporalmente
las actividades de estudio
10. Prctica espaciada Se implementa un cronograma de prctica que mezcla distintos tipos de
problemas, o un cronograma de estudio que mezcla distintos tipos de
material dentro de una misma sesin de estudio
Nota. Ver texto por una descripcin detallada de cada tcnica de aprendizaje y ejemplos relevantes de su uso.

Tabla 2. Ejemplos de las cuatro categoras de variables para la generalizacin


Materiales Condiciones de aprendizaje Caractersticas de los Tareas de criterio
estudiantesa
Vocabulario Cantidad de prctica (dosis) Edad Recordacin guiada
Equivalentes de Prctica de libro abierto o libro Conocimiento previo de la Recordacin libre
traduccin cerrado materia
Contenido de clase Lectura vs. Escucha Capacidad de la memoria Reconocimiento
de trabajo
Definiciones cientficas Aprendizaje incidental vs. Habilidad verbal Resolucin de problemas
intencional
Textos narrativos Instruccin directa Intereses Argumentacin
Textos expositivos Aprendizaje por descubrimiento Inteligencia fluida Escritura de ensayos
Conceptos Tiempo entre relecturasb Motivacin Creacin de portfolios
matemticos
Mapas Tipo de pruebas de prcticac Logros previso Pruebas de logros
Diagramas Aprendizaje individual vs. grupal Eficacia personal Cuestionarios de clase
a. Algunas de estas caractersticas estn ms basadas en estados temporales (por ejemplo la motivacin) y otras en
rasgos menos estables (por ejemplo, inteligencia fluida); esta distincin es relevante para la maleabilidad de las
caractersticas, pero una discusin de esta dimensin est por fuera de los objetivos del presente artculo
b. La condicin de aprendizaje es especfica de la relectura
c. La condicin de aprendizaje es especfica de la prueba de prctica

A pesar de la promesa de algunas de las tcnicas, muchos de estos libros de texto no


proporcionaron cobertura suficiente, lo que incluira revisiones actualizadas de su eficacia y
anlisis de su generalizacin y limitaciones potenciales. Por lo tanto, para todas las tcnicas de
aprendizaje enumeradas en la Tabla 1, revisamos la literatura para identificar la generalizabilidad
de sus beneficios en cuatro categoras de variables: materiales, condiciones de aprendizaje,
caractersticas del estudiante y tareas de criterio. La eleccin de estas categoras se inspir en el
modelo de Jenkins (1979) (para un ejemplo de su uso en contextos educativos, vase Marsh &
Butler, en prensa), y ejemplos de cada categora se presentan en la Tabla 2. Los materiales se
refieren al contenido especfico que se espera que los estudiantes aprendan, recuerden o
comprendan. Las condiciones de aprendizaje se refieren a aspectos del contexto en los que los
estudiantes estn interactuando con los materiales a ser aprendidos. Estas condiciones incluyen
aspectos del propio entorno de aprendizaje (por ejemplo, ruido frente a quietud en un aula), pero
en gran parte pertenecen a la forma en que se implementa una tcnica de aprendizaje. Por
ejemplo, una tcnica podra utilizarse slo una vez o muchas veces (una variable denominada
dosis) cuando los estudiantes estn estudiando, o se podra usar una tcnica cuando los
estudiantes estuvieran leyendo o escuchando los materiales aprendidos.
Cualquier nmero de caractersticas del estudiante tambin podra influir en la eficacia de una
tcnica de aprendizaje dada. Por ejemplo, en comparacin con los estudiantes ms avanzados, los
estudiantes ms jvenes en los primeros grados pueden no beneficiarse de una tcnica. Las
capacidades cognitivas bsicas de los estudiantes, como la capacidad de memoria de trabajo o la
inteligencia fluida general, tambin pueden influir en la eficacia de una tcnica dada. En un
contexto educativo, el conocimiento del dominio se refiere al conocimiento vlido y relevante
que un estudiante trae a una leccin. El conocimiento del dominio puede ser requerido para que
los estudiantes utilicen algunas de las tcnicas de aprendizaje enumeradas en la Tabla 1. Por
ejemplo, el uso de imgenes mientras lee textos requiere que los estudiantes conozcan los objetos
e ideas a los que se refieren las palabras para que puedan producir imgenes internas de los
mismos. Los estudiantes con algn conocimiento de dominio sobre un tema tambin pueden
encontrar ms fcil el uso de la auto-explicacin y la interrogacin elaborativa, que son dos
tcnicas que implican contestar a preguntas de "por qu" sobre un concepto particular (por
ejemplo, "Por qu partculas de hielo se elevan dentro de un nube?"). El conocimiento del
dominio puede mejorar los beneficios de sumarizar y destacar tambin. Sin embargo, aunque
algunos conocimientos del dominio beneficiarn a estudiantes mientras que comienzan a
aprender nuevo contenido dentro de un dominio dado, no es un requisito previo para utilizar la
mayor parte de las tcnicas de aprendizaje.
El grado en que la eficacia de cada tcnica de aprendizaje se obtiene a travs de largos intervalos
de retencin y se generaliza a travs de diferentes tareas de criterio es de importancia crtica.
Nuestras revisiones y recomendaciones se basan en pruebas que normalmente se relacionan con
el rendimiento objetivo de los estudiantes en cualquier nmero de tareas de criterio. Las tareas de
criterio (Tabla 2, columna ms a la derecha) varan con respecto a los tipos especficos de
conocimiento que utilizan. Algunas tareas estn destinadas a aprovechar la memoria de los
estudiantes para obtener informacin (por ejemplo, "Qu es el condicionamiento operante?"),
otras son en gran parte para aprovechar la comprensin de los estudiantes (por ejemplo,
"Explicar la diferencia entre el condicionamiento clsico y el condicionamiento operante" ), y
todava otras estn destinados a aprovechar la aplicacin de los conocimientos de los estudiantes
(por ejemplo, "Cmo aplicaras el condicionamiento operante para entrenar a un perro a
sentarse?"). De hecho, Bloom y sus colegas dividieron los objetivos de aprendizaje en seis
categoras, desde la memoria (o conocimiento) y la comprensin de los hechos hasta su
aplicacin, anlisis, sntesis y evaluacin (BS Bloom, Engelhart, Furst, Hill y Krathwohl, 1956,
para una taxonoma actualizada, vase LW Anderson & Krathwohl, 2001).

Al analizar cmo influyen las tcnicas en el desempeo de los criterios, hacemos hincapi en
investigaciones que han ido ms all de demostrar una mejor memoria para el material objetivo,
midiendo la comprensin, aplicacin y transferencia de conocimiento de los estudiantes. Ntese,
sin embargo, que si bien la adquisicin de conocimiento factual no se considera el nico o ltimo
objetivo de la escolarizacin, consideramos sin reparors que los esfuerzos para mejorar la
retencin del conocimiento por parte de los estudiantes son esenciales para alcanzar otros
objetivos de instruccin; si uno no recuerda ideas, hechos o conceptos bsicos, aplicarlos puede
resultar difcil, sino imposible. Los estudiantes que han olvidado los principios de lgebra no
podrn aplicarlos para resolver problemas o utilizarlos como base para el aprendizaje de clculo
(o fsica, economa u otros dominios relacionados), y los estudiantes que no recuerdan qu es el
condicionamiento operante probablemente tendr dificultades para aplicarlo para resolver
problemas de comportamiento. No estamos defendiendo que los estudiantes pasen su tiempo
robticamente memorizando hechos; en cambio, estamos reconociendo la importante interaccin
entre, por un lado, la memoria de un concepto y, por otro, la capacidad de comprenderlo y
aplicarlo.
Un objetivo de esta monografa es alentar a los estudiantes a usar la tcnica o tcnicas de
aprendizaje apropiadas para lograr un objetivo de instruccin dado. Algunas tcnicas de
aprendizaje se centran principalmente en reforzar la memoria de los estudiantes para los hechos
(por ejemplo, la palabra clave mnemnica), otros se centran ms en mejorar la comprensin (por
ejemplo, auto-explicacin), y otros pueden mejorar la memoria y la comprensin (por ejemplo,
exmenes de prctica). As, nuestra revisin de cada tcnica de aprendizaje describe cmo puede
usarse, su efectividad para producir retencin y comprensin a largo plazo y su amplitud de
eficacia entre las categoras de variables enumeradas en la Tabla 2.

Revisin de las Tcnicas de Aprendizaje


En las siguientes series de revisiones, consideramos la evidencia disponible para la eficacia de
cada una de las tcnicas de aprendizaje. Cada revisin comienza con una breve descripcin de la
tcnica y una discusin sobre por qu se espera que mejore el aprendizaje del estudiante. A
continuacin, consideramos la generalizacin (con respecto a las condiciones de aprendizaje, los
materiales, las caractersticas de los estudiantes y las tareas de criterio), resaltamos cualquier
investigacin sobre la tcnica que se haya llevado a cabo en contextos educativos representativos
y abordamos cualquier problema identificado para implementar la tcnica. En consecuencia, las
revisiones son en gran medida modulares: cada una de las 10 revisiones se organiza en torno a
estos temas (con encabezados correspondientes) para que los lectores puedan identificar
fcilmente la informacin ms relevante sin necesariamente tener que leer la monografa en su
totalidad. Al final de cada revisin, ofrecemos una evaluacin global para cada tcnica en
trminos de su utilidad relativamente baja, moderada o alta. Los estudiantes y maestros que no lo
estn haciendo deben considerar el uso de tcnicas designadas como de alta utilidad, porque los
efectos de estas tcnicas son robustos y generalizan ampliamente. Algunas tcnicas podran
haber sido designadas como utilidad baja o utilidad moderada por cualquier nmero de razones.
Por ejemplo, una tcnica podra haber sido designada como de baja utilidad porque sus efectos se
limitan a un pequeo subconjunto de materiales que los estudiantes necesitan aprender; La
tcnica puede ser til en algunos casos y adoptada en contextos apropiados, pero, en relacin con
las otras tcnicas, sera considerada de baja utilidad debido a su generalizacin limitada. Una
tcnica tambin podra recibir una calificacin de utilidad baja o moderada si se mostraba
prometedora, pero no haba evidencia suficiente para apoyar la confianza en la asignacin de una
evaluacin de utilidad ms alta. En estos casos, alentamos a los investigadores a seguir
explorando estas tcnicas en entornos educativos, pero los estudiantes y los profesores pueden
querer tener cuidado antes de adoptarlas ampliamente.
Lo ms importante, es que dado que cada evaluacin de la utilidad podra haber sido asignada
por una variedad de razones, discutimos la justificacin para una evaluacin dada al final de cada
revisin. Finalmente, nuestra intencin fue realizar revisiones exhaustivas de la literatura sobre
cada tcnica de aprendizaje. Para las tcnicas que se han revisado ampliamente (por ejemplo, la
prctica distribuida), sin embargo, nos basamos en revisiones anteriores y las complementamos
con cualquier investigacin que apareci despus de haber sido publicadas. Para muchas de las
tcnicas de aprendizaje, se han publicado demasiados artculos para citarlos a todos; Por lo tanto,
en nuestra discusin de la mayora de las tcnicas, citamos un subconjunto de artculos
relevantes.

VARIAS SECCIONES OMITIDAS


4 Resaltar y subrayar

Cualquier educador que haya examinado los materiales del curso de los estudiantes est
familiarizado con la visin de un libro de texto marcado y multicolor. Las evaluaciones ms
sistemticas de libros de texto reales y otros materiales de estudio han apoyado la afirmacin de
que resaltar y subrayar son comportamientos comunes (por ejemplo, Bell & Limber, 2010;
Lonka, Lindblom-Ylnne, & Maury, 1994; Nist & Kirby, 1989). Cuando se pregunta a los
estudiantes sobre lo que hacen al estudiar, suelen reportar subrayar, iluminar o marcar el material
de otra manera mientras tratan de aprenderlo (por ejemplo, Cioffi, 1986; Gurung, Weidert, &
Jeske, 2010). Tratamos estas tcnicas como equivalentes, ya que, conceptualmente, deberan
funcionar de la misma manera (y al menos un estudio no encontr diferencias entre ellas, Fowler
y Barker, 1974, Experimento 2). Las tcnicas tpicamente atraen a los estudiantes porque son
simples de usar, no implican entrenamiento y no requieren que los estudiantes inviertan mucho
tiempo ms all de lo que ya es requerido para leer el material. La pregunta que hacemos aqu es,
una tcnica tan fcil de usar realmente ayudar a los estudiantes a aprender? No se consideran
los estudios en los que el marcado activo del texto se apare con otras tcnicas comunes, como la
toma de notas (por ejemplo, Arnold, 1942, LB Brown y Smiley, 1978, Mathews, 1938). Aunque
muchos estudiantes reportan combinar mltiples tcnicas (por ejemplo, L. Annis y Davis, 1978,
Wade, Trathen, & Schraw, 1990), cada tcnica debe ser evaluada independientemente para
descubrir cules son cruciales para el xito.
4.1 Descripcin general del resaltado y el subrayado y por qu deben funcionar. Como
introduccin a los temas relevantes, comenzamos con la descripcin de un experimento
prototpico. Fowler y Barker (1974, Exp. 1) tuvieron estudiantes que leen artculos (alrededor de
8.000 palabras) sobre el aburrimiento y la vida urbana de (las revistas) Scientific American y
Science. Los estudiantes fueron asignados a uno de tres grupos: un grupo de control, en el que
slo leen los artculos; un grupo de destacado-activo, en el que fueron libres para resaltar tanto
de los textos como quisieran; un grupo pasivo-destacando, en el cual leyeron los textos marcados
que haban sido destacados por los participantes que participaron en el grupo destacado activo.
Todos recibieron una hora para estudiar los textos (el tiempo en la tarea fue igualado entre los
grupos); Los estudiantes en la condicin de resaltado activo fueron indicados para marcar
material particularmente importante. Todos los sujetos regresaron al laboratorio una semana
despus y se les permiti revisar sus materiales originales durante 10 minutos antes de tomar una
prueba de eleccin mltiple de 54 tems. En general, los grupos destacados no superaron al grupo
control en la prueba final, resultado que, lamentablemente, se ha repetido en gran parte de la
literatura (por ejemplo, Hoon, 1974; Idstein y Jenkins, 1972; Stordahl y Christensen, 1956). Sin
embargo, los resultados de anlisis ms detallados del desempeo en los dos grupos resaltantes
son informativos acerca de los efectos que podran tener en el procesamiento cognitivo. En
primer lugar, dentro del grupo de resaltado activo, el desempeo fue mejor en los tems de la
prueba para los cuales el texto relevante haba sido resaltado (ver Blanchard y Mikkelson, 1987;
L. L. Johnson, 1988 para resultados similares). En segundo lugar, este beneficio para la
informacin destacada fue mayor para los marcadores activos (que seleccionaron lo que resaltar)
que para los marcadores pasivos (que vieron la misma informacin resaltada, pero no la
seleccionaron). En tercer lugar, este beneficio para la informacin destacada fue acompaado por
un pequeo costo en las preguntas de los exmenes de la prueba de informacin que no se haban
destacado. Para explicar estos hallazgos, los investigadores a menudo sealan un fenmeno
cognitivo bsico conocido como el efecto aislamiento, por el cual un elemento semnticamente o
fonolgicamente nico en una lista es mucho mejor recordado que sus contrapartes menos
distintivas (vase Hunt, 1995, para una descripcin de este trabajo ). Por ejemplo, si los
estudiantes estn estudiando una lista de palabras categricamente relacionadas (por ejemplo,
"escritorio", "cama", "silla", "mesa") y una palabra de otra categora (por ejemplo, "vaca"), Los
estudiantes ms tarde sern ms propensos a recordarlo de lo que lo haran si hubiera sido
estudiado en una lista de palabras categricamente relacionadas (por ejemplo, "cabra", "cerdo",
"caballo", "pollo"). La analoga con el resaltado es que una oracin resaltada, subrayada o
mayscula "saldr" del texto de la misma manera que la palabra "vaca" sera si estuviera aislada
en una lista de palabras para tipos de muebles. De acuerdo con esta expectativa, varios estudios
han demostrado que la lectura de un texto marcado promueve ms tarde la memoria del material
marcado: Es ms probable que los estudiantes recuerden cosas que el experimentador destac o
subray en el texto (por ejemplo, Cashen & Leicht, 1970; Crouse & Idstein, 1972, Hartley,
Bartlett y Branthwaite, 1980, Klare, Mabry, & Gustafson, 1955, vase Lorch, 1989 para una
revisin).
La seleccin activa de la informacin debera beneficiar a la memoria ms que simplemente leer
el texto marcado (dado que el primero capitalizara los beneficios de la generacin de
informacin, Slamecka y Graf, 1978, y procesamiento activo en general, Faw & Waller, 1976).
El texto marcado atrae la atencin del lector, pero se requiere procesamiento adicional si el lector
tiene que decidir qu material es ms importante. Tales decisiones requieren que el lector piense
sobre el significado del texto y cmo sus diferentes piezas se relacionan entre s (es decir,
procesamiento organizacional, Hunt & Worthen, 2006). En el experimento Fowler y Barker
(1974), este beneficio se reflej en la mayor ventaja de la informacin resaltada entre los
marcadores activos que entre los receptores pasivos del mismo texto resaltado. Sin embargo, el
resaltado activo no siempre es mejor que recibir material que ya ha sido resaltado por un
experimentador (por ejemplo, Nist & Hogrebe, 1987), probablemente porque los
experimentadores suelen ser mejores que los estudiantes al resaltar las partes ms importantes de
un texto. De manera ms general, es probable que la calidad del resaltado sea crucial para ayudar
a los estudiantes a aprender (por ejemplo, Wollen, Cone, Britcher y Mindemann, 1985), pero
desafortunadamente muchos estudios no han contenido ninguna medida de la cantidad o la
adecuacin de los estudiantes resaltando. Los estudios que han examinado la cantidad de texto
marcado han encontrado gran variabilidad en lo que los estudiantes realmente marcan, con
algunos estudiantes marcando casi nada y otros marcando casi todo (por ejemplo, Idstein y
Jenkins, 1972). Algunos datos intrigantes vinieron del grupo que destacaba activamente en
Fowler y Barker (1974). El rendimiento de la prueba se correlacion negativamente (r = -29) con
la cantidad de texto que se haba destacado en el grupo de resaltado activo, aunque este resultado
no fue significativo dado el pequeo tamao de la muestra (n = 19). Marcar demasiado texto es
probable que tenga mltiples consecuencias. En primer lugar, el marcado excesivo reduce el
grado en que el texto marcado se distingue de otro texto, y es menos probable que las personas
recuerden el texto marcado si no es distintivo (Lorch, Lorch y Klusewitz, 1995). En segundo
lugar, es probable que tome menos procesamiento para marcar un montn de texto que para
destacar los detalles ms importantes. En consonancia con esta ltima idea, los beneficios del
marcado de texto pueden ser ms probables cuando los experimentadores imponen lmites
explcitos a la cantidad de texto que los estudiantes pueden marcar. Por ejemplo, Rickards y
August (1975) encontraron que los estudiantes limitados a subrayar una sola oracin por prrafo
ms tarde recordaron ms de un texto cientfico que un grupo de control sin subrayar. Del mismo
modo, L. L. Johnson (1988) encontr que marcar una oracin por prrafo ayudaba a los
estudiantes universitarios en una clase de lectura a recordar la informacin subrayada, aunque no
se tradujo en un beneficio general.
4.2 En qu medida son generales los efectos del resaltado y el subrayado? Hemos esbozado
mecanismos hipotticos por los cuales el resaltado podra ayudar a la memoria, y caractersticas
particulares de destacar que seran necesarias para que estos mecanismos fueran efectivos (por
ejemplo, resaltando slo material importante). Sin embargo, la mayora de los estudios no han
mostrado ningn beneficio de resaltar (como se suele utilizar) por encima del beneficio de la
simple lectura, por lo que la cuestin relativa a la generalidad de los beneficios de destacar es en
gran medida discutible. Debido a que la investigacin sobre el alumbrado no ha sido
particularmente alentadora, pocas investigaciones han evaluado sistemticamente los factores
que podran moderar la eficacia de la tcnica; por ejemplo, no podramos incluir una subseccin
de las Condiciones de Aprendizaje (4.2a) por falta de evidencia relevante. En la medida en que la
literatura lo permita, esbozamos las condiciones conocidas para moderar la efectividad del
resaltado. Tambin describimos cmo nuestra conclusin acerca de la ineficacia relativa de esta
tcnica se mantiene en una amplia gama de situaciones.

4.2b Caractersticas del estudiante. Destacar no ha podido ayudar a los estudiantes de base de
la Fuerza Area (Stordahl & Christensen, 1956), a los nios (eg, Rickards & Denner, 1979) y a
los estudiantes de recuperacin (es decir, los estudiantes que obtuvieron un promedio de 390 en
la seccin verbal SAT; & Hogrebe, 1987), as como sub-graduados prototpicos (por ejemplo,
Todd & Kessler, 1971). Es posible que estos grupos se esforzaron por resaltar slo el texto
pertinente, dado que otros estudios han sugerido que la mayora de los estudiantes subrayan el
texto. Los resultados de un estudio con aviadores sugirieron que el conocimiento previo podra
moderar la efectividad de la iluminacin. En particular, los aviadores leyeron un pasaje sobre los
motores de los aviones que no estaban marcados (condicin de control) o tenan informacin
clave subrayada (Klare et al., 1955). Los experimentadores tuvieron acceso a las puntuaciones
medias de aptitud mecnica de los participantes y vincularon el desempeo en el experimento a
esas puntuaciones. El texto marcado era ms til para los aviadores que haban recibido altas
puntuaciones. Este estudio incluy textos premarcados y no examin lo que los participantes
habran subrayado por su cuenta, pero parece probable que los estudiantes con poco
conocimiento de un tema tendran dificultades para identificar qu partes de un texto eran ms o
menos importantes (y por lo tanto se beneficiaran menos del resaltado activo que los estudiantes
con conocimientos). Otra posibilidad interesante ha venido de un estudio en el cual los
experimentadores motivaron extrnsecamente a los participantes prometindoles que los aquellos
participantes con puntajes mximos en un examen recibiran U$ 5 (Fass & Schumacher, 1978).
Los participantes leen un texto sobre enzimas; A la mitad de los participantes se les dijo que
subrayaran palabras clave y frases. Todos los participantes tomaron una prueba de 15 preguntas.
Un beneficio de subrayar se observ entre los estudiantes que podran ganar la bonificacin de $
5, pero no entre los estudiantes en un grupo de control. Por lo tanto, aunque los resultados de este
nico estudio necesitan ser replicados, parece que algunos estudiantes pueden tener la capacidad
de resaltar con eficacia, pero no siempre lo hacen.

4.2c Materiales. Conclusiones similares sobre el marcado del texto han venido de estudios
usando una variedad de materiales de texto diferentes sobre temas tan diversos como la
aerodinmica, las escuelas griegas antiguas, la agresin y Tanzania, que varan en longitud de
unas cuantas palabras a unos cuantos miles. Todd y Kessler (1971) manipularon la longitud del
texto (todos los materiales eran relativamente cortos, con longitudes de 44, 140 o 256 palabras) y
encontraron que el subrayado era ineficaz, independientemente de la longitud del texto. Fass y
Schumacher (1978) manipularon si un texto sobre enzimas era fcil o difcil de leer; La versin
fcil estaba en un nivel de lectura del sptimo grado, mientras que la versin difcil era en el
nivel de la escuela secundaria y contena oraciones ms largas. Una mayor diferencia entre el
resaltado y los grupos de control se encontr para el rendimiento en las pruebas de eleccin
mltiple para el texto difcil en contraposicin al texto fcil.

4.2d Tareas de criterio. Se ha observado una falta de beneficio de destacar en las pruebas
inmediatas y tardas, con retrasos que van desde 1 semana a 1 mes. Se han examinado una
variedad de medidas dependientes, incluyendo el recuerdo libre, las preguntas de opcin mltiple
de contenido, las preguntas de opcin mltiple de comprensin y las pruebas de finalizacin de
la oracin. Tal vez lo ms preocupante son los resultados de un estudio que sugiere que subrayar
puede ser perjudicial para la posterior capacidad de hacer inferencias. Peterson (1992) hizo que
estudiantes avanzados de educacin leyeran un captulo de 10.000 palabras de un libro de texto
de historia; Dos grupos subrayaron mientras estudiaban durante 90 minutos, mientras que a un
tercer grupo slo se le permiti leer el captulo. Una semana ms tarde, a todos los grupos se les
permiti revisar el material durante 15 minutos antes de realizar un examen (los dos grupos de
subrayados difirieron si revisaban una copia limpia del texto original o una que contena su
subrayado). Todo el mundo recibi la misma prueba dos meses despus, sin tener otra
oportunidad de revisar el texto. La prueba de eleccin mltiple consisti en 20 tems que
analizaron hechos (y podran estar vinculados a referencias especficas en el texto) y 20 tems
que requeran inferencias (que tendran que basarse en conexiones a travs del texto y no podan
estar vinculadas a aspectos especficos, Informacin subrayada). Los tres grupos se
desempearon de manera similar en las preguntas de hecho, pero los estudiantes que haban
subrayado (y revisado sus textos marcados) estaban en desventaja en las preguntas de inferencia.
Este patrn de resultados requiere replicacin y extensin, pero una posible explicacin es que el
subrayado estndar llama la atencin ms a los conceptos individuales (que apoyan la memoria
de los hechos) que a las conexiones a travs de los conceptos (como lo requieren las preguntas de
inferencia) . En consonancia con esta idea, en otro estudio, los subrayados que esperaban que una
prueba final estuviera en un formato de opcin mltiple obtuviesen puntajes ms altos que los
subrayados que esperaban que fuera en un formato de respuesta corta (Kulhavy, Dyer y Silver,
1975), independientemente del formato real de las preguntas de la prueba final. La informacin
subrayada puede alinearse naturalmente con el tipo de informacin que los estudiantes esperan
en los exmenes de eleccin mltiple (por ejemplo, S. R. Schmidt, 1988), pero los estudiantes
pueden estar menos seguros de qu subrayar al estudiar para una prueba de respuesta corta.

4.3 Efectos en contextos educativos representativos. Como se alude al principio de esta seccin,
las encuestas de libros de texto reales y otros materiales estudiantiles han apoyado la frecuencia
de destacar y subrayar en contextos educativos (por ejemplo, Bell & Limber, 2010; Lonka et al.,
1994). Menos claras son las consecuencias de tales comportamientos del mundo real. Los
estudios en el aula han examinado si las marcas proporcionadas por el instructor afectan el
rendimiento del examen. Por ejemplo, Cashen y Leicht (1970) hicieron que los estudiantes de
psicologa leyeran artculos cientficos sobre el aprendizaje de los animales, el suicidio y los
conflictos grupales, cada uno de los cuales contena cinco estados crticos que fueron subrayados
en rojo para la mitad de los estudiantes. Los artculos estaban relacionados con el contenido de
los cursos pero no estaban cubiertos en las conferencias. Las puntuaciones de los exmenes en
los tems relacionados con las declaraciones crticas fueron mayores cuando las declaraciones se
haban subrayado en rojo que cuando no. Curiosamente, los estudiantes en la condicin de
subrayado tambin obtuvieron mejores calificaciones en las preguntas del examen sobre la
informacin que estaba en oraciones adyacentes a las declaraciones crticas (en contraposicin a
puntuar peor en preguntas sobre informacin no subordinada). El beneficio de los tems
subrayados se replic en otra clase de psicologa (Leicht & Cashen, 1972), aunque los efectos
fueron ms dbiles. Sin embargo, no est claro si los resultados de cualquiera de estos estudios se
generalizaran a una situacin en la que los estudiantes estuvieran a cargo de su propio resaltado,
porque probablemente marcaran ms de cinco declaraciones en un artculo (y por lo tanto
mostrara menos discriminacin entre informacin importante y trivial).

4.4 Cuestiones de aplicacin. Los estudiantes ya estn familiarizados y adoptan espontneamente


la tcnica de destacar. El problema es que la forma en que la tcnica se implementa tpicamente
no es efectiva. Mientras que la tcnica tal y como se usa normalmente no suele ser perjudicial
para el aprendizaje (pero vea Peterson, 1992, para una posible excepcin), puede ser
problemtica en la medida en que impide que los estudiantes se involucren en otras estrategias
ms productivas. Una posibilidad que debe explorarse es si los estudiantes pueden ser entrenados
para resaltar ms efectivamente. Hemos localizado tres estudios centrados en la formacin de los
estudiantes a destacar. En dos de estos casos, la capacitacin involucr una o ms sesiones en las
que los estudiantes practicaron la lectura de textos para buscar ideas principales antes de marcar
cualquier texto. Los estudiantes recibieron retroalimentacin sobre los textos de prctica antes de
marcar (y ser probados) el texto de destino, y entrenar el rendimiento mejorado (por ejemplo,
Amer, 1994, Hayati & Shariatifar, 2009). En el tercer caso, los estudiantes recibieron
informacin sobre su capacidad para subrayar el contenido ms importante de un texto.
Crticamente, los estudiantes fueron instruidos para subrayar lo menos posible. En una
condicin, los estudiantes incluso perdieron puntos por subrayar material extrao (Glover,
Zimmer, Filbeck, & Plake, 1980). Los procedimientos de entrenamiento en los tres casos
involucraron retroalimentacin, y todos ellos tuvieron alguna salvaguarda contra el uso excesivo
de la tcnica. Dado el entusiasmo de los estudiantes por la iluminacin y el subrayado (o tal vez
el entusiasmo excesivo, dado que los estudiantes no siempre usan la tcnica correctamente),
descubrir maneras a prueba de fallos para asegurar que esta tcnica se utilice eficazmente podra
ser ms fcil que convencer a los estudiantes a abandonarlas completamente en favor de otras
tcnicas.
4.5 Resaltar y subrayar: Evaluacin general. Sobre la base de la evidencia disponible,
calificamos de subrayado y subrayado como de baja utilidad. En la mayora de las situaciones
que se han examinado y con la mayora de los participantes, destacar hace poco para aumentar el
rendimiento. Puede ayudar cuando los estudiantes tienen el conocimiento necesario para resaltar
ms eficazmente, o cuando los textos son difciles, pero puede daar el desempeo en tareas de
nivel superior que requieren inferencia. La investigacin futura debe estar dirigida a ensear a
los estudiantes cmo resaltar de manera efectiva, dado que es probable que los estudiantes
continen usando esta tcnica popular a pesar de su relativa ineficacia.

VARIAS SECCIONES OMITIDAS

8 Pruebas de prctica
Es probable que muchos estudiantes consideren que la prueba es una necesidad indeseable de
educacin, y sospechamos que la mayora de los estudiantes preferiran tomar el menor nmero
posible de pruebas. Este punto de vista de la prueba es comprensible, ya que la mayor parte de la
experiencia de los estudiantes con pruebas involucra evaluaciones sumativas de alto riesgo que
se administran para evaluar el aprendizaje. Este punto de vista de las pruebas tambin es
lamentable, ya que eclipsa el hecho de que las pruebas tambin mejoran el aprendizaje. Desde el
estudio seminal de Abbott (1909), ms de 100 aos de investigacin han arrojado varios cientos
de experimentos que demuestran que la prctica de pruebas mejora el aprendizaje y la retencin
(para reseas recientes, vase Rawson & Dunlosky, 2011; Roediger & Butler, 2011; Roediger,
Putnam & Smith, 2011). Incluso en 1906, Edward Thorndike recomend que "el recuerdo activo
de un hecho desde adentro es, por regla general, mejor que su impresin desde fuera" (pgina
123, Thorndike, 1906). El siglo de investigacin sobre las pruebas de prctica desde entonces ha
apoyado la recomendacin de Thorndike, demostrando la amplia generalizacin de los beneficios
de las pruebas de prctica.
Tenga en cuenta que usamos el trmino prueba de prctica aqu (a) para distinguir las pruebas
que se completan como una prctica de bajas consecuencias o sin consecuencias o actividad de
aprendizaje fuera de la clase, de las evaluaciones sumativas administradas por un instructor en
clase y ( B) abarcar cualquier forma de pruebas prcticas que los estudiantes puedan realizar por
s mismos. Por ejemplo, los exmenes prcticos pueden incluir la prctica de recordar la
informacin del objetivo mediante el uso de tarjetas instantneas reales o virtuales, completar los
problemas de prctica o las preguntas incluidas al final de los captulos de libros de texto o
completar exmenes incluidos en los materiales complementarios electrnicos que cada vez ms
acompaan a los libros de texto.
8.1 Descripcin general de las pruebas de prctica y por qu debera funcionar. Como
ejemplo ilustrativo del poder de la prueba, Runquist (1983) present a estudiantes de pregrado
una lista de pares de palabras para el estudio inicial. Despus de un breve intervalo durante el
cual los participantes completaron las tareas de relleno, la mitad de las parejas de palabras fueron
evaluadas presentando solamente una de ellas como pista y la otra mitad no. Los participantes
completaron una prueba de recuento final para todos los pares, ya sea 10 minutos o 1 semana
despus. El resultado de la prueba final fue mejor para los pares que fueron probados en la
prctica que los pares que no lo fueron (53% versus 36% despus de 10 minutos, 35% versus 4%
despus de 1 semana). Considerando que este estudio ilustra el mtodo de comparar el
rendimiento entre las condiciones que no implican y una prueba de prctica, muchos otros
estudios han comparado una condicin de prueba de prctica con condiciones ms estrictas que
implican presentaciones adicionales de la informacin a ser aprendido. Por ejemplo, Roediger y
Karpicke (2006b) presentaron a los estudiantes de pregrado un breve texto expositivo para el
estudio inicial seguido bien por un segundo ensayo del estudio o por un examen de recuperacin
libre de prctica. Una semana despus, el recuerdo libre fue considerablemente mejor entre el
grupo que haba tomado la prueba de prctica que entre el grupo que haba re-estudiado (56%
versus 42%). Como otra demostracin particularmente convincente de la potencia de las pruebas
en comparacin con el reestudio, Karpicke y Roediger (2008) presentaron a los estudiantes de
pregrado con traducciones Swuahili- Ingls para ciclos de estudio y prctica. Despus del primer
retiro correcto, los tems se presentaron solamente en ciclos posteriores de estudio sin ms
pruebas, o solamente en ciclos de prueba subsiguientes sin estudio adicional. El rendimiento en
una prueba final una semana despus fue sustancialmente mayor despus de las pruebas
continuas (80%) que despus del estudio continuo (36%).
Por qu las pruebas de prctica mejoran el aprendizaje? Mientras que una gran cantidad de
estudios han establecido la generalidad de los efectos de las pruebas, las teoras acerca de por
qu mejora el aprendizaje se han quedado atrs. Sin embargo, las descripciones tericas estn
emergiendo cada vez ms para explicar dos tipos diferentes de efectos de prueba, que se
denominan efectos directos y efectos mediados de la prueba (Roediger & Karpicke, 2006a). Los
efectos directos se refieren a los cambios en el aprendizaje que surgen del acto de tomar una
prueba en s, mientras que los efectos mediados se refieren a los cambios en el aprendizaje que
surgen de una influencia de la prueba en la cantidad o tipo de codificacin que tiene lugar
despus de la prueba (pej, durante una oportunidad de reestudio subsiguiente).
Con respecto a los efectos directos de las pruebas de prctica, Carpenter (2009) propuso
recientemente que las pruebas pueden mejorar la retencin al desencadenar procesos de
recuperacin elaborativa. El intento de recuperar informacin de destino implica una bsqueda
de memoria a largo plazo que active la informacin relacionada, y esta informacin activada
puede ser codificada junto con el objetivo recuperado, formando un trazado elaborado que
proporciona mltiples vas para facilitar el acceso posterior a ese informacin. En apoyo de este
relato, Carpenter (2011) hizo que los estudiantes estudiaran parejas de palabras dbilmente
relacionadas (por ejemplo, "madre" - "nio") seguidas ya sea por un estudio adicional o una
prueba de recuperacin de prctica. En una prueba final posterior, la recuperacin de la palabra
objetivo se realiz a travs de una palabra previamente no representada pero fuertemente
relacionada (por ejemplo, "padre"). La probabilidad fue mayor despus de una prueba de prctica
que despus del reestudio, presumiblemente porque la prueba de prctica aument la
probabilidad de que la informacin relacionada fuese activada y codificada junto con la diana
durante el aprendizaje.
En cuanto a los efectos mediados de las pruebas de la prctica, Pyc y Rawson (2010, 2012b)
propusieron un relato similar, segn el cual las pruebas prcticas facilitan la codificacin de
mediadores ms eficaces (es decir, informacin elaborativa que conecta las seales y los
objetivos). Pyc y Rawson (2010) presentaron a los estudiantes con traducciones Swahili-Ingls
en un bloque de estudio inicial, el cual fue seguido por tres bloques de ensayos de reestudio. Para
la mitad de los participantes, cada ensayo de reestudio fue precedido por la prctica de recordad
con claves (se da una palabra y se trata de recordad la otra). A todos los alumnos se les pidi que
generaran e informaran de un mediador de palabras clave durante cada ensayo de reestudio
(NdeT, una palabra intermedia). Cuando se probaron 1 semana ms tarde, en comparacin con
los estudiantes que slo haban reestudiado, los estudiantes que haban participado en la prctica
de recuerdo con clave eran ms propensos a recordar a sus mediadores cuando se los evalu con
la palabra clave y eran ms propensos a recordar el objetivo cuando se los evalua con su
mediador. Evidencia reciente tambin sugiere que las pruebas de prctica pueden mejorar la
forma en que los estudiantes organizan mentalmente la informacin y lo bien que procesan los
aspectos idiosincrsicos de los tems individuales, lo que en conjunto puede respaldar una mejor
retencin y desempeo de las pruebas (Hunt, 1995, 2006). Zaromb y Roediger (2010)
presentaron a los estudiantes con listas que consistan en palabras de diferentes categoras
taxonmicas (por ejemplo, verduras y ropa), ya sea para ocho bloques de ensayos de estudio o
para cuatro bloques de ensayos de estudio con cada ensayo seguido de un examen de libre
prctica. Replicando los efectos bsicos de la prueba, el recuerdo libre final 2 das despus fue
mayor cuando los tems haban recibido pruebas de prctica (39%) que cuando slo haban sido
estudiados (17%). Es importante destacar que la condicin de la prueba de la prctica tambin
super la condicin del estudio en las medidas secundarias, principalmente aprovechando el
procesamiento organizacional y procesamiento idiosincrsico.

8.2 Cun generales son los efectos de los exmenes prcticos? Dado el volumen de la
investigacin sobre los efectos de la prueba, una revisin exhaustiva de la literatura est ms all
del alcance de este artculo. Por lo tanto, nuestra sntesis se basa principalmente en estudios de
los ltimos 10 aos (que incluyen ms de 120 artculos), que creemos que representan el estado
actual del campo. La mayora de estos estudios compararon las condiciones que implicaban
pruebas de la prctica con condiciones que no implicaban pruebas de la prctica o que
implicaban solamente el reestudio. Sin embargo, tambin consideramos el trabajo ms reciente
enfrentando diferentes condiciones de pruebas de prctica entre s para explorar cuando las
pruebas de prctica funcionan mejor.

8.2a Condiciones de aprendizaje. La mayora de las investigaciones sobre la prueba de prctica


ha utilizado formatos de prueba que implican recordar la informacin de destino de la memoria,
pero algunos estudios tambin han demostrado los efectos de prueba con otras pruebas basadas
en el recuerdo, como la recuperacin libre, preguntas de respuestas cortas y preguntas de rellenar
el blanco.. Un nmero creciente de estudios que utilizan pruebas de prctica de opcin mltiple
tambin han reportado efectos de pruebas. A travs de estos formatos, la mayora de las
investigaciones previas han involucrado pruebas de la prctica que aprovechan la memoria para
la informacin presentada explcitamente. Sin embargo, varios estudios tambin han demostrado
efectos de pruebas para pruebas de prctica que abarcan a la comprensin, incluyendo la
aplicacin de respuestas cortas y preguntas basadas en la inferencia de opcin mltiple (por
ejemplo, Agarwal y Roediger, 2011). Los efectos de las pruebas tambin se han demostrado en
un estudio en el que la prctica implicaba predecir (versus estudiar) los valores de entrada-salida
en una tarea de aprendizaje de funcin inductiva (Kang, McDaniel y Pashler, 2011) y un estudio
en el que los participantes practicaron (Reestudiados) procedimientos de reanimacin (Kromann,
Jensen, & Ringsted, 2009). Algunas investigaciones han demostrado efectos de prueba incluso
cuando las pruebas de prctica son de libro abierto (Agarwal et al., 2008; Weinstein, McDermott,
& Roediger, 2010).
Es importante sealar que las pruebas de prctica pueden beneficiar el aprendizaje incluso
cuando el formato de la prueba de prctica no coincide con el formato de la prueba de criterio.
Por ejemplo, la investigacin ha demostrado efectos de formato cruzado de las pruebas de la
prctica de opcin mltiple en el recuerdo subsecuente de la gua (Fazio, Agarwal, Marsh, &
Roediger, 2010, Marsh, Agarwal y Roediger, 2009) (McDaniel, Howard, & Einstein, 2009), y la
prctica de recordacin libre en el posterior recuerdo y reconocimiento gratuitos (Carpenter,
Pashler & Vul, 2006; Vaughn & Rawson, 2011 ). Aunque varios formatos de prctica-prueba
funcionan, algunos funcionan mejor que otros. Glover (1989) present a los estudiantes un breve
texto expositivo para el estudio inicial y luego manipul el formato de la prueba de prctica
(recuerdo libre, rellenar el espacio en blanco, o reconocimiento) y el formato de la prueba final
(recuperacin libre, rellenar blancos o reconocimiento). En los tres formatos de prueba final, el
rendimiento fue mayor despus de la prctica de recordar libremente que seguir la prctica de
llenado en blanco, que a su vez fue mayor que el rendimiento despus de la prctica de
reconocimiento. De manera similar, Carpenter y DeLosh (2006) encontraron que la prctica del
recuerdo libre superaba la prctica de reconocimiento y reconocimiento de las pistas,
independientemente de que la prueba final estuviera en un formato de recuerdo libre, recuerdo o
reconocimiento, y Hinze & Wiley (2011) encontraron que el desempeo en una prueba final de
eleccin mltiple era mejor despus de recordar los prrafos que despus de la prctica de
llenado en blanco. Se necesitan ms trabajos para respaldar conclusiones prescriptivas slidas,
pero la evidencia disponible sugiere que las pruebas de prctica que requieren ms respuestas
generativas (por ejemplo, recuerdo o respuesta corta) son ms eficaces que las pruebas de
prctica que requieren menos respuestas generativas (p. En blanco o reconocimiento).
Adems del formato de prueba de prctica, otras dos condiciones de aprendizaje que influyen
fuertemente en los beneficios de las pruebas de prctica son la dosificacin y el momento. Con
respecto a la dosificacin, la conclusin ms simple es que ms es mejor. Algunos estudios que
apoyan esta conclusin han manipulado el nmero de exmenes prcticos y el rendimiento de la
prueba final ha sido consistentemente mejor despus de mltiples pruebas de prctica que
despus de un solo examen prctico (por ejemplo, Karpicke y Roediger, 2007a, 2010; Logan y
Balota, 2008; Pavlik y Anderson, 2005). En otros estudios, los experimentadores han variado el
nmero de pruebas de prctica para manipular el nivel de xito logrado durante la prctica. Por
ejemplo, Vaughn y Rawson (2011) observaron un desempeo significativamente mayor en la
prueba final cuando los estudiantes se involucraron en la prctica de recordar hasta que los
objetos objetivo fueron recordados de cuatro a cinco veces frente a una sola vez. Varios otros
estudios han demostrado que el rendimiento de la prueba final mejora a medida que aumenta el
nmero de respuestas correctas durante la prctica (por ejemplo, Karpicke y Roediger, 2007b,
2008; Pyc & Rawson, 2009, 2012a; Rawson & Dunlosky, 2011), aunque con
retornos que disminuyen a medida que se alcanzan niveles de criterio ms altos. Considerando
que estos estudios han implicado la manipulacin de la dosis en una sesin de prctica, otros
estudios que han manipulado el nmero de sesiones de prctica tambin han encontrado que ms
es mejor (Bahrick, Bahrick, Bahrick, & Bahrick, 1993; Morris & Fritz, 2002, Rawson y
Dunlosky, 2011).
Sin embargo, el beneficio de las pruebas de prctica repetidas a su vez depende del momento de
las mismas. Varios estudios han aumentado el nmero de pruebas presentadas en sucesin
inmediata dentro de una sesin y han encontrado efectos mnimos o inexistentes, en contraste
con los considerables beneficios observados cuando las pruebas repetidas estn espaciadas (por
ejemplo, Carpenter & DeLosh, 2005, Cull, 2000; Glover, 1989, Karpicke y Bauernschmidt,
2011). Con respecto a los intervalos de tiempo que intervienen con el espaciamiento, ms largo
es mejor. Las repetidas pruebas de prctica producen mayores beneficios cuando los retrasos
entre los ensayos dentro de una sesin son ms largos y no ms cortos (por ejemplo, Pashler,
Zarow y Triplett, 2003; Pavlik y Anderson, 2005; Pyc & Rawson, 2009, 2012b), en diferentes
sesiones de prctica en lugar de todas en la misma sesin (p. Ej., Bahrick y Hall, 2005, Kornell,
2009; Rohrer, 2009; Rohrer & Taylor, 2006) y cuando los intervalos entre sesiones de prctica
son ms largos que cortos (Bahrick et al., 1993, Carpenter, Pashler y Cepeda, 2009), aunque el
retraso ptimo entre las sesiones puede depender del intervalo de retencin (vase Cepeda et al.,
2009; Cepeda, Vul, Rohrer, Wixted y Pashler, 2008). Discutiremos los efectos de retraso en la
seccin de Prcticas Distribuidas ms adelante..

8.2b Caractersticas del estudiante. Una gran mayora de los estudios han involucrado a
estudiantes universitarios como participantes, pero los efectos de las pruebas tambin se han
demostrado en participantes de edades muy diversas. Los estudios que involucran muestras no-
universitarias han diferido algo en el tipo, la dosificacin o el momento de las pruebas de la
prctica involucradas, pero se ha demostrado algn tipo de efecto de prueba con los nios de
preescolar y kindergarten (Fritz, Morris, Nolan y Singleton, 2007, Kratochwill, , Y Conzemius,
1977), los estudiantes de la escuela primaria (Atkinson y Paulson, 1972, Bouwmeester y
Verkoeijen, 2011, Fishman, Keller y Atkinson, 1968, Gates, 1917, Metcalfe y Kornell, 2007,
Metcalfe, Kornell y Finn, 2009 (Myers, 1914), Rea y Modigliani, 1985, Rohrer, Taylor y Sholar,
2010, Spitzer, 1939), los estudiantes de ciclo bsico de secundaria (Carpenter et al., 2009,
Glover, 1989, McDaniel, Agarwal, Huelser, McDermott y Roediger, 2011, Metales, Kornell y
Son, 2007, Sones y Stroud, 1940), estudiantes de secundaria avanzados (Duchastel, 1981,
Duchastel y Nungester, 2009; Nungester & Duchastel, 1982), y estudiantes ms avanzados,
como estudiantes de medicina de 3 y 4 ao (Krommann et al., 2009; Rees, 1986; Schmidmaier
et al., 2011). En el otro extremo del continuo, los efectos de las pruebas tambin se han
demostrado con los estudiantes de mediana edad y con los adultos mayores (Balota, Duchek,
Sergent-Marshall y Roediger, 2006; Bis- hara & Jacoby, 2008; Logan & Balota, 2008 , Maddox,
Balota, Coane y Duchek, 2011, Sumowski, Chiaravalloti, & DeLuca, 2010, Tse, Balota, &
Roediger, 2010). En contraste con el rango relativamente amplio de edades cubiertas en la
literatura de efectos de prueba, una investigacin sorprendentemente mnima ha examinado los
efectos de las pruebas como una funcin de las diferencias individuales en el conocimiento o la
capacidad. Carroll, Campbell-Ratcliffe, Murnane y Perfect (2007) le presentaron a estudiantes de
primer ao y avanzados de psicologa dos pasajes de un libro de psicologa anormal. Los
estudiantes completaron una prueba de prctica de respuesta corta en uno de los pasajes y luego
hicieron una prueba final en ambos pasajes, ya sea 15 minutos o 1 da despus. Ambos grupos
mostraron efectos de prueba similares en ambos puntos de tiempo (con un 33% y un 38% de
precisin mejor, respectivamente, en el material que se haba ensayado en comparacin con el
material que no lo haba hecho). Aunque estos resultados iniciales constituyen una evidencia
alentadora de que los efectos de la prueba pueden ser robustos en todos los niveles de
conocimiento, es necesario trabajar ms antes de que se puedan sacar conclusiones fuertes acerca
de hasta qu punto el nivel de conocimiento modera los efectos de las pruebas.
Del mismo modo, una investigacin mnima ha examinado los efectos de las pruebas en funcin
de los niveles de capacidad acadmicamente relevantes. En un estudio de Spitzer (1939), 3.605
estudiantes de sexto grado de 91 escuelas elementales diferentes leyeron un breve texto y
realizaron una prueba inmediata, para proporcionar una medida de referencia de la capacidad de
comprensin de lectura. En los grupos de inters aqu, todos los estudiantes leyeron un texto
experimental, la mitad completaron una prueba de opcin mltiple de prctica, y luego
completaron una prueba de opcin mltiple, ya sea 1 o 7 das despus. Spitzer inform el
rendimiento final de la prueba para el texto experimental por separado para los tercios superior e
inferior de los estudiantes en la medida de lnea de base.

Fig. 7. Precisin promedio en un test final administrado 1 da o una semana luego de una
sesin de aprendizaje, que o bien incluy o bien no un ensayo de prueba, para los
estudiantes del tercio superior y el inferior de los puntajes obtenidos en una preuba de lnea
de base de la habilidad en Spitzer (1939). Las barras de error representan los errores
estndar.
Como se muestra en la Figura 7, tomar el examen de prctica benefici a ambos grupos de
estudiantes. Dicho esto, el efecto de prueba pareca ser algo mayor para los lectores de mayor
capacidad que para los lectores de menor capacidad (con aproximadamente un 20%, frente al
12%, mejoras en la precisin), aunque Spitzer no inform las estadsticas inferenciales
pertinentes.
Finalmente, la evidencia de los estudios que involucran poblaciones de pacientes es al menos
sugerente con respecto a la generalidad de los efectos de la prueba a travs de diferentes niveles
de capacidad de aprendizaje. Por ejemplo, Balota et al. (2006) descubrieron que las pruebas
prcticas espaciadas mejoraron la retencin en intervalos de tiempo cortos no slo para adultos
jvenes y adultos mayores sanos, sino tambin para adultos mayores con enfermedad de
Alzheimer. Del mismo modo, Sumowski et al. (2010) encontraron que una prueba de prctica
produjo efectos de prueba ms grandes para los subgrupos de pacientes con esclerosis mltiple (d
= 0,95 vs d = 0,54, respectivamente, con agrupamiento basado en el rendimiento) En una medida
basal de la memoria). En suma, varios estudios han sugerido que las pruebas de prctica pueden
beneficiar a los individuos con diferentes niveles de conocimiento o capacidad, pero la medida
en que la magnitud del beneficio depende de estos factores sigue siendo una cuestin abierta.

8.2c Materiales. Muchos de los estudios que han demostrado efectos de prueba han involucrado
materiales verbales relativamente simples, incluyendo listas de palabras y pares de palabras
asociadas. Sin embargo, la mayora de los conjuntos de materiales utilizados han tenido cierta
relevancia educativa. Una considerable mayora de los estudios que utilizan materiales asociados
han incluido traducciones en el extranjero (incluyendo chino, iupiaq, japons, lituano, espaol y
swahili) o palabras de vocabulario emparejadas con sinnimos. Otros estudios han ampliado los
efectos de los ttulos de libros apareados y nombres de autor, nombres y rostros, objetos y
nombres, e imgenes y traducciones en el extranjero (por ejemplo, Barcroft, 2007, Carpenter &
Vul, 2011, Morris & Fritz, 2002, Rohrer, 2009 ). Un nmero considerable de estudios tambin ha
mostrado efectos de prueba para informacin factual, incluyendo hechos de trivia y preguntas de
conocimiento general (por ejemplo, Butler, Karpicke y Roediger, 2008; TA Smith y Kimball,
2010) y hechos extrados de unidades de aula en ciencia , historia y psicologa (por ejemplo, Car-
penter et al., 2009, McDaniel et al., 2011, McDaniel, Wildman y Anderson, 2012).
Investigaciones anteriores mostraron que las pruebas de prctica ayudaron a los nios a aprender
hechos de multiplicacin y listas de ortografa (Atkinson y Paulson, 1972, Fishman et al., 1968;
Rea & Modigliani, 1985), y estudios recientes han reportado un mejor aprendizaje de
definiciones de palabras de vocabulario (Metcalfe et al. Al., 2007) y definiciones de conceptos de
trmino clave a partir del material de la clase (Rawson & Dunlosky, 2011). Un nmero cada vez
mayor de estudios ha mostrado beneficios para aprender de materiales de texto de diversas
longitudes (de 160 palabras a 2000 palabras o ms), de diversos gneros de texto (por ejemplo,
entradas de enciclopedia, artculos de revistas cientficas, pasajes de libros de texto) (P. Ej.,
Economa de la Guerra Civil, ecolocacin de murcilagos, nutrias marinas, teora del big bang,
fsiles, exploracin del rtico, tucanes).
Las pruebas de prctica han mejorado el aprendizaje a partir de conferencias en video y de
animaciones narradas sobre temas como el desarrollo de adultos, relmpagos, neuroanatoma e
historia del arte (Butler y Roediger, 2007; Vojdanoska, Cranney y Newell, 2010). Aunque gran
parte del trabajo sobre los efectos de la prueba ha utilizado materiales verbales, tambin se ha
demostrado que las pruebas prcticas respaldan el aprendizaje de materiales que incluyen
informacin visual o espacial, incluyendo el aprendizaje de caractersticas y localizaciones en
mapas (Carpenter y Pashler, 2007; Rohrer et al., 2010), identificando aves (Jacoby, Wahlheim, &
Coane, 2010), nombrando objetos (Helder y Shaughnessy, 2008; Morris & Fritz, 2002),
aprendiendo localizaciones espaciales de objetos (Sommer, Schoell, & Bchel, 2008),
aprendiendo smbolos (Coppens, Verkoeijen, & Rikers, 2011) e identificando partes
representadas de una flor (Glover, 1989). Por ltimo, el trabajo reciente ha extendido los efectos
de la prueba al aprendizaje no declarativo, incluyendo el aprendizaje de habilidades de
resucitacin (Kromann et al., 2009) y el aprendizaje inductivo de las funciones de insumo-
producto (Kang, McDaniel et al., 2011).

8.2d Tareas de criterio. A pesar de que la recuperacin de la informacin a partir pistas es la


medida de criterio ms comnmente usada, los efectos de la prueba tambin se han demostrado
con otras formas de pruebas de memoria, incluyendo la recuperacin libre, el reconocimiento y
el llenado de espacios en blanco as como preguntas de opcin mltiple que requieren de
memoria para obtener informacin explcitamente indicada en el material de texto.
En cuanto a la transferencia, el mtodo ms usado en la investigacin de efectos de pruebas ha
implicado el uso de las mismas preguntas que se basan en la misma informacin de destino (por
ejemplo, las mismas indicaciones de recuperacin o preguntas de opcin mltiple) en pruebas
prcticas y pruebas de criterio. Sin embargo, como se describe en la subseccin sobre las
condiciones de aprendizaje (8.2a), muchos estudios tambin han mostrado efectos de prueba
cuando se evala la misma informacin objetivo utilizando diferentes formatos de prueba para
pruebas de prctica y de criterio. Adems, un nmero creciente de estudios han demostrado que
la prctica de ensayar un subconjunto de informacin influye en la memoria para informacin
relacionada pero no probada (JCK Chan, 2009, 2010; JCK Chan, McDermott y Roediger, 2006;
Cranney et al 2009) aunque los beneficios no siempre se han acumulado en la informacin
relacionada (vase Carroll et al., 2007, Duchastel, 1981).
Aunque la mayor parte de la investigacin ha consistido en pruebas basadas en la memoria y en
medidas de criterio, varios estudios recientes tambin han presentado resultados alentadores
sobre la medida en que las pruebas de prctica pueden beneficiar la comprensin. Los efectos
positivos se han demostrado en las pruebas de criterio que requieren inferencias o la aplicacin
de informacin previamente aprendida (Agarwal & Roediger, 2011; Butler, 2010; Foos & Fisher,
1988; CI Johnson & Mayer, 2009; Karpicke & Blunt, 2011; McDaniel et al., 2009), incluyendo
pruebas de criterio que utilizaron diferentes preguntas o diferentes formatos de prueba que los
utilizados durante la prctica. Por ejemplo, Karpicke y Blunt (2011) encontraron que practicar la
libre recuperacin del material de texto facilitaba el desempeo en una prueba de criterio
subsiguiente que inclua preguntas de respuesta corta basadas en la inferencia, as como en una
prueba de cartografa de conceptos. De hecho, el desempeo del mapa conceptual fue mejor
despus de la prctica de recordar libremente durante el estudio que despus de la cartografa
conceptual durante el estudio. Del mismo modo, Butler (2010) present a los estudiantes textos
expositivos para el estudio inicial, que fueron seguidos por estudios repetidos o por pruebas
repetidas de respuesta corta (con retroalimentacin) aprovechando los hechos y conceptos clave
de los textos. Una semana despus, el desempeo en las nuevas preguntas de respuesta corta
basadas en la inferencia, basndose en los hechos y conceptos claves, fue mejor despus de las
pruebas de prctica que despus del reestudio (vase la figura 8).

Fig. 8. Precisin en los test finales que consistan en preguntas que evalan la transferencia basada en inferencias,
basados en conceptos o hechos clave, administrada una semana despus de una sesin de aprendizaje que
involucraba ya sea pruebas de prctica o re-estudio, en Butler (2010). Las barras de error representan el error
estndar.

Los resultados de un experimento de seguimiento son particularmente sorprendentes, dado que la


prueba de criterio implicaba una transferencia excesiva, en que las preguntas requeran los
conceptos de un dominio para ser aplicado en un dominio novedoso (por ejemplo, los estudiantes
tenan que aplicar informacin de las alas de murcilago para hacer inferencias sobre el
desarrollo de nuevos tipos de aeronaves). Por ltimo, estudios recientes tambin han mostrado
efectos de pruebas que implican otras formas de transferencia. Jacoby et al. (2010) presentaron a
los alumnos con imgenes de aves y sus Familias para el estudio inicial, lo que se sigui por un
estudio adicional de las parejas de dibujos o por pruebas prcticas en las que a los alumnos se le
mostraron aves en cada fotografa e intentaron recuperar la familia apropiada antes de que se le
muestre la respuesta correcta. La prueba de criterio subsiguiente incluy a las mismas familias de
aves, pero incluy nuevas imgenes de aves de esas familias. Los estudiantes fueron ms
precisos en la clasificacin de las nuevas aves despus de la prctica de la prueba que despus de
el re-estudio slo. De manera similar, Kang, McDaniel y Pashler (2011) examinaron el
aprendizaje inductivo de una funcin bajo condiciones en las que los alumnos estudiaron pares
de valores de entrada-salida o predijeron la salida para un valor de entrada dado antes de mostrar
la salida correcta. El grupo de prediccin super al grupo de solo estudio en una prueba de
criterio para pares entrenados y pares de extrapolacin no entrenados.
Adems de establecer los efectos de la prueba a travs de una serie de medidas de resultado, los
estudios tambin han demostrado efectos de prueba a travs de muchos intervalos de retencin.
De hecho, a diferencia de las literaturas de otras tcnicas de aprendizaje, la investigacin
contempornea sobre los efectos de la prueba ha utilizado realmente intervalos cortos de
retencin con menos frecuencia que los intervalos de retencin ms largos. Aunque un buen
nmero de estudios han demostrado los efectos de la prueba despus de cortos retrasos (0-20
minutos), la gran mayora de las investigaciones recientes han implicado retrasos de al menos 1
da y el intervalo de retencin ms utilizado es de 1 semana.

La preferencia por utilizar intervalos de retencin ms largos puede deberse en parte a los
resultados de varios estudios que informan que los efectos de la prueba son mayores cuando se
administran las pruebas finales despus de retrasos ms prolongados (JCK Chan, 2009; CI
Johnson & Mayer , 2009, Kornell, Bjork y Garcia, 2011, Roediger y Karpicke, 2006b, Runquist,
1983, Schmidmaier et al., 2011, Toppino y Cohen, 2009, Wenger, Thompson y Bartling, 1980,
Wheeler, Ewers y Buonanno , 2003). Es impresionante que se hayan observado efectos de prueba
despus de intervalos an ms largos, incluyendo intervalos de 2 a 4 semanas (por ejemplo,
Bahrick & Hall, 2005, Butler y Roediger, 2007, Carpenter, Pashler, Wixted y Vul, 2008,
Kromann Et al., 2009, Rohrer, 2009), de 2 a 4 meses (McDaniel, Anderson, Derbish y
Morrisette, 2007, Morris y Fritz, 2002; Rawson y Dunlosky, 2011), de 5 a 8 meses (McDaniel Et
al., 2011, Rees, 1986), 9-11 meses (Carpenter et al., 2009) e incluso de 1 a 5 aos (Bahrick et al.,
1993). Estos hallazgos son una gran noticia para estudiantes y educadores, dado que una meta
educativa clave es el conocimiento duradero y no slo mejoras temporales en el aprendizaje.

8.3 Efectos en contextos educativos representativos. Como se describi anteriormente, gran


parte de la investigacin sobre los efectos de la prueba ha involucrado materiales, tareas y
intervalos de retencin educativos relevantes. Adems, varios estudios han reportado efectos de
pruebas usando materiales de aula autnticos (es decir, materiales tomados de clases en las que
los estudiantes participantes fueron matriculados, Carpenter et al, 2009, Cranney et al., 2009,
McDaniel et al Rawson y Dunlosky, 2011, Rees, 1986, Vojdanoska et al., 2010). Mientras que las
medidas de criterio en estos estudios implicaron pruebas inventadas por el experimentador o los
cuestionarios de preguntas sin concecuencias, la investigacin tambin ha demostrado los efectos
de la prueba de la prctica en las evaluaciones sumativas reales del curso (Balch, 1998; Lyle y
Crawford, 2011, McDaniel Et al., 2011, McDaniel et al., 2012). Por ejemplo, un estudio de
McDaniel et al. (2012) involucr a los estudiantes matriculados en un curso de psicologa en
lnea sobre el cerebro y el comportamiento. Cada semana, los estudiantes pueden ganar puntos de
curso completando una actividad de prctica en lnea hasta cuatro veces. En la actividad en lnea,
se present cierta informacin para las pruebas de prctica con retroalimentacin, se present
alguna informacin para el estudio y no se present ninguna informacin. Los exmenes
posteriores de la unidad incluyeron preguntas que se haban presentado durante las pruebas de
prctica y tambin nuevas preguntas relacionadas centradas en diferentes aspectos de los
conceptos practicados. Como se muestra en la Figura 9, los grados en los exmenes de la unidad
fueron ms altos para informacin que haba sido probada en la prctica que para informacin
reexaminada o informacin no prctica, tanto para preguntas repetidas como para nuevas
preguntas relacionadas.

Fig. 9. Puntajes en exmenes de curso cubriendo tems que fueron presentados en las pruebas de prctica, en el re-
estudio o no presentados durante las actividades de aprendizaje online que los estudiantes completaron para obtener
puntos en el curso. El examen del curso incluy algunas preguntas que haban sido presentadas durante las pruebas
de prctica as como nuevas preguntas que se basan en la misma inforamcin. Por simplicidad los resultados aqu
reportados colapsan dos experimentos reportados en McDaniel, Wildman, and Anderson (2012).

8.4 Cuestiones de aplicacin. Las pruebas de prctica parecen ser relativamente razonables con
respecto a las demandas de tiempo. La mayora de la investigacin ha demostrado los efectos de
la prctica de pruebas cuando la cantidad de tiempo asignado para la prctica de pruebas es
modesto y se equipara con el tiempo asignado para re-estudiar. Otro mrito de las pruebas de
prctica es que se puede implementar con un entrenamiento mnimo. Los estudiantes pueden
participar en auto-pruebas basadas en el recuerdo de una manera relativamente directa. Por
ejemplo, los estudiantes pueden autocomprobarse mediante la creacin de tarjetas flashcards
(tambin est disponible un software libre y de bajo costo para hacer flashcards) o usando el
sistema de toma de notas Cornell (que implica dejar una columna en blanco al tomar notas en
clase y entrar Trminos clave o preguntas en l poco despus de tomar notas para usar para la
auto-prueba al revisar las notas en un momento posterior, para ms detalles, vase Pauk & Ross,
2010). Las formas ms estructuradas de exmenes prcticos (p. Ej., Exmenes de respuesta
mltiple, de respuesta corta y de llenado en blanco) a menudo estn disponibles para los
estudiantes a travs de problemas de prctica o preguntas incluidas al final de los captulos del
libro o en el suplemento electrnico, materiales que acompaan a muchos libros de texto.
Dicho esto, los estudiantes probablemente se beneficiaran de alguna instruccin bsica sobre
cmo utilizar con mayor eficacia las pruebas de prctica, ya que los beneficios de la prueba
dependen del tipo de prueba, dosis y tiempo. Como se ha descrito anteriormente, la prueba de la
prctica es particularmente ventajosa cuando se trata de recuperacin y se contina hasta que los
elementos se responden correctamente ms de una vez dentro y entre sesiones de prctica y con
intervalos ms largos en comparacin con intervalos ms cortos entre ensayos o sesiones. En
cuanto a la eficacia de la prctica de pruebas en relacin con otras tcnicas de aprendizaje,
algunos estudios han demostrado los beneficios de las pruebas de prctica de cartografa de
conceptos, toma de notas, y el uso de imgenes (Fritz et al., 2007, McDaniel et al. , 2009,
Neuschatz, Preston, Toglia, y Neuschatz, 2005), pero las comparaciones ms frecuentes han
consistido en la comparacin de pruebas de prctica contra el re-estudio sin gua.
El resultado ms frecuente es que las pruebas de prctica superan al reestudio, aunque este efecto
depende en cierta medida de la medida en que los exmenes de prctica vayan acompaados de
retroalimentacin que incluya la presentacin de la respuesta correcta. Aunque muchos estudios
han demostrado que las pruebas solo superan el re-estudio, algunos estudios no han logrado
encontrar esta ventaja (en la mayora de estos casos, la precisin en la prueba de prctica ha sido
relativamente baja). En contraste, la ventaja de las pruebas de prctica con la retroalimentacin
sobre el estudio es extremadamente robusto. Las pruebas de prctica con retroalimentacin
tambin superan sistemticamente las pruebas de prctica por s solas.
Otra razn para recomendar la implementacin del feed-back con las pruebas de prctica es que
protege contra los errores de perseverancia cuando los estudiantes responden incorrectamente en
una prueba de prctica. Por ejemplo, Butler y Roediger (2008) encontraron que una prueba de
prctica de eleccin mltiple aument las intrusiones de falsas alternativas en una prueba de
recuperacin de la prueba final cuando no se proporcion retroalimentacin, mientras que no se
observ este aumento cuando se dio la retroalimentacin. Afortunadamente, el efecto correctivo
de la retroalimentacin no requiere que se presente inmediatamente despus de la prueba de
prctica. Metcalfe et al. (2009) encontraron que el rendimiento de la prueba final para las
respuestas inicialmente incorrectas era realmente mejor cuando la retroalimentacin se haba
retrasado que cuando haba sido inmediata. Tambin es alentador la evidencia que sugiere que la
retroalimentacin es particularmente eficaz para corregir errores de alta confianza (por ejemplo,
Butterfield & Metcalfe, 2001).
Por ltimo, observamos que los efectos de los errores de las pruebas de la prctica en el
desempeo subsiguiente tienden a ser relativamente pequeos, a menudo no se obtienen y son
fuertemente menospreciados por los beneficios positivos de las pruebas (por ejemplo, Fazio et
al., 2010, Kang, Pashler, et al., 2011, Roediger y Marsh, 2005). Por lo tanto, las preocupaciones
potenciales acerca de los errores no constituyen un problema serio para la implementacin,
particularmente cuando se proporciona retroalimentacin. Por ltimo, aunque nos hemos
centrado en el uso de las pruebas de la prctica por parte de los estudiantes, de acuerdo con el
propsito de esta monografa, observamos brevemente que los instructores tambin pueden
apoyar el aprendizaje de los estudiantes aumentando el uso de pruebas de prctica de bajo o
ningn impacto en la calificacin en el aula. Varios estudios tambin han reportado resultados
positivos de la administracin de evaluaciones sumativas que son ms cortas y ms frecuentes
que largas y menos frecuentes (por ejemplo, un examen por semana en lugar de slo dos o tres
exmenes por semestre), no slo para los resultados del aprendizaje, pero tambin en las
calificaciones de los estudiantes de factores tales como la satisfaccin del curso y la preferencia
por las pruebas ms frecuentes (por ejemplo, Keirs, 1934, Kika, McLaughlin, y Dixon, 1992;
Leeming, 2002, para una revisin, vase Bangert-Drowns, Kulik, Kulik, 1991).
8.5 Pruebas de prctica: Evaluacin general. Sobre la base de la evidencia descrita
anteriormente, clasificamos las pruebas prcticas como de alta utilidad. Los efectos de las
pruebas se han demostrado a travs de una impresionante gama de formatos de prueba de
prctica, tipos de material, edades de aprendizaje, medidas de resultado y intervalos de retencin.
Por lo tanto, las pruebas de prctica tienen una amplia aplicabilidad. Las pruebas de prctica no
son particularmente intensivas en tiempo con relacin a otras tcnicas, y se pueden implementar
con un entrenamiento mnimo. Por ltimo, varios estudios han proporcionado pruebas de la
eficacia de las pruebas de prctica en contextos educativos representativos. Con respecto a las
recomendaciones para la investigacin futura, una brecha identificada en la literatura se refiere a
la medida en que los beneficios de las pruebas de prctica dependen de las caractersticas de los
alumnos, tales como el conocimiento previo o la capacidad. Explorar las diferencias individuales
en los efectos de la prueba se alineara bien con el objetivo de identificar la mayor generalizacin
de los beneficios de las pruebas de la prctica. Por otra parte, la investigacin dirigida a
identificar ms a fondo las causas de la prctica de los efectos de la prueba puede proporcionar
ms informacin sobre la maximizacin de estos efectos.

VARIAS SECCIONES OMITIDAS

Comentarios de clausura: Utilidad relativa de las tcnicas de


aprendizaje
Nuestro objetivo era proporcionar revisiones que fueran lo suficientemente extensas como para
permitir que cualquier persona interesada en usar una tcnica particular juzgara su utilidad para
sus propias metas de instruccin o de aprendizaje. Tambin nos dimos cuenta de que ofrecer
algunas calificaciones generales (y las razones detrs de ellas) podra ser til para los lectores
interesados en obtener rpidamente una visin general sobre qu tcnica puede funcionar mejor.
Para ello, hemos proporcionado una evaluacin de cmo se comport cada tcnica con respecto a
la generalizacin de sus beneficios a travs de las cuatro categoras de variables enumeradas en
la Tabla 2, las cuestiones de implementacin y las evidencias para su efectividad del trabajo en
contextos educativos representativos (Vase la Tabla 4).

Tabla 4. Evaluacin de utilidad y puntuacin de generalizabilidad de cada tcnica de


aprendizaje

Tareas de Dificultades al Contextos


Tcnica Utilidad Aprendiz Materiales criterio implementar educacionales

Interrogacin
elaborativa Moderada P-I P I P I

Auto-explicacin Moderada P-I P P-I Q I

Resumen Baja Q P-I Q Q I

Iluminado /
Subrayado Baja Q Q N P N

Memoria
mnemnica con
palabras clave Baja Q Q Q-I Q Q-I

Imgenes del
texto Baja Q Q Q-I P I

Relectura Baja I P Q-I P I

Examinacin de
prctica Alta P-I P P P P

Prctica
distribuida Alta P-I P P-I P P-I

Prctica
espaciada Moderada I Q P-I P P-I
Nota. Un indicador positivo (P) muestra que la evidencia disponible demuestra eficacia de la tcnica de aprendizaje
respecto a una determinada variable o dificultad. Un indicador negativo (N) muestra que la tcnica es principalmente
ineficiente para una determinada variable. Un indicador calificado (Q) indica que la tcnica mostr resultados
positivos en algunas condiciones (o en algunos grupos) pero no en otros. Un indicador insuficiente (I) indica que la
evidencia disponible es insuficiente para determinar definitivamente su utilidad para uno o ms factores de una
variable o dificultad.

Nuestra meta para estas evaluaciones era indicar tanto (a) si existen evidencias suficientes para
apoyar conclusiones sobre la generalizabilidad de una tcnica, cuestiones para su
implementacin, o su eficacia en contextos educativos y, si existen pruebas suficientes ( B) si
indica que la tcnica funciona. Por ejemplo, las pruebas de prctica recibieron una evaluacin de
Positivo (P) para tareas de criterio. Esta calificacin indica que hemos encontrado suficiente
evidencia para concluir que las pruebas de prctica benefician el desempeo estudiantil a travs
de una amplia gama de tareas de criterio y intervalos de retencin. Por supuesto, esto no significa
que el trabajo adicional en esta rea (es decir, pruebas con diferentes tareas de criterio) no sera
valioso, pero la extensin de la evidencia es lo suficientemente prometedora como para
recomendarla a los maestros y estudiantes. Una calificacin negativa (N) indica que la evidencia
disponible demuestra que la tcnica de aprendizaje no beneficia el desempeo para la categora o
problema en particular. Por ejemplo, a pesar de su popularidad, destacar no aument el
rendimiento a travs de una variedad de tareas de criterio, por lo que recibi una calificacin de
N para esta variable. Una calificacin calificada (Q) indica que tanto la evidencia positiva como
la negativa han sido reportadas con respecto a una categora o asunto particular. Por ejemplo, la
palabra clave mnemnica recibi una calificacin Q de los materiales, porque la evidencia indica
que esta tcnica funciona para el aprendizaje de materiales que son amigables con las imgenes,
pero no funciona bien para materiales que no se pueden imaginar fcilmente. Una calificacin de
Insuficiente (I) indica que no se dispone de pruebas suficientes para sacar conclusiones sobre los
efectos de una tcnica dada para una categora o problema en particular. Por ejemplo, la
interrogacin elaborativa recibi una calificacin I para las tareas de criterio, porque actualmente
no sabemos si sus efectos son duraderos en intervalos de retencin educativos relevantes.
Cualquier celda en la Tabla 4 con una calificacin I destaca la necesidad de ms investigacin
sistemtica.
Finalmente, algunas celdas incluyen ms de una clasificacin. En estos casos, existe suficiente
evidencia para evaluar una tcnica en una dimensin de una categora o problema, pero no hay
evidencia suficiente para alguna otra dimensin. Por ejemplo, la autoexplicacin recibi una
calificacin de PI para las tareas de criterio porque la evidencia disponible es positiva en una
dimensin (generalizable en una serie de tareas de criterio) pero es insuficiente en otra dimensin
clave (si el beneficio de la autoexplicacin generaliza a travs de intervalos de retencin ms
largos). Como otro ejemplo, la relectura recibi una calificacin de QI para las tareas de criterio,
porque la evidencia de la efectividad de esta tcnica durante largos intervalos de retencin est
calificada (es decir, en algunas condiciones de aprendizaje, no produce un efecto para intervalos
de retencin ms largos) y es insuficiente la evidencia disponible que es relevante para
documentar su efectividad a travs de diferentes tipos de tareas de criterio (por ejemplo, la
relectura aumenta el rendimiento en las tareas de recuperacin, pero se sabe poco sobre sus
beneficios para la comprensin). Cuando las tcnicas tienen calificaciones mltiples para una o
ms variables, los lectores necesitarn consultar las revisiones para ms detalles.

Por ltimo, hemos utilizado estas calificaciones para desarrollar una evaluacin general de
utilidad para cada una de las tcnicas de aprendizaje. Las evaluaciones de la utilidad reflejan en
gran medida la manera en que los beneficios de cada tcnica de aprendizaje se generalizan a
travs de las diferentes categoras de variables (por ejemplo, para cuntas variables la tcnica
recibi una calificacin P). Por ejemplo, la palabra clave mnemnica y el uso de imgenes para
el aprendizaje de texto se clasific bajo en utilidad en parte porque sus efectos se limitan a
materiales que son susceptibles de imgenes y porque pueden no funcionar bien para estudiantes
de todas las edades. An as, algunos maestros pueden decidir que los beneficios de las tcnicas
con calificaciones de baja utilidad coinciden con sus metas de instruccin para sus estudiantes.
Por lo tanto, aunque ofrecemos estas evaluaciones fciles de usar de cada tcnica de aprendizaje,
tambin alentamos a los maestros y estudiantes interesados a leer cuidadosamente cada revisin
para tomar decisiones informadas sobre las tcnicas que mejor satisfagan sus metas de
instruccin y aprendizaje.

Implicaciones para la investigacin sobre tcnicas de aprendizaje


Un objetivo principal de esta monografa fue desarrollar recomendaciones basadas en la
evidencia para profesores y estudiantes sobre la utilidad relativa de varias tcnicas de
aprendizaje. Un objetivo relacionado era identificar reas que no han sido investigadas y que
requerirn ms investigacin antes de que se puedan hacer recomendaciones basadas en la
evidencia para su uso en educacin. Algunas de estas brechas son inmediatamente evidentes al
inspeccionar la Tabla 4. Para resaltar algunas, todava no sabemos hasta qu punto muchas de las
tcnicas de aprendizaje beneficiarn a los estudiantes de varias edades, habilidades y niveles de
conocimiento previo. Del mismo modo, con pocas excepciones (por ejemplo, pruebas de prctica
y prctica distribuida), el grado en que muchas de las tcnicas apoyan el aprendizaje duradero
(por ejemplo, durante varias semanas) es en gran parte desconocido, en parte porque las
investigaciones de estas tcnicas tienen tpicamente la prctica y la prueba de criterio en la
misma sesin (para una discusin de las limitaciones de esta investigacin de sesin nica, vase
Rawson y Dunlosky, 2011). Finalmente, se han evaluado pocas tcnicas en contextos educativos
representativos. Esta evaluacin (junto con la Tabla 4) sugiere dos direcciones para la
investigacin futura que podran tener implicaciones inmediatas para la educacin. Primero, se
necesita ms investigacin para explorar completamente el grado en que los beneficios de
algunas tcnicas generalizan a las variables enumeradas en la Tabla 2.
Particularmente importantes sern las investigaciones que evalen el grado en que las
interacciones entre las variables limitan o magnifican los beneficios de una tcnica dada. En
segundo lugar, el beneficio de la mayora de las tcnicas en entornos representativos de la
educacin debe ser ms ampliamente explorado. Las versiones fciles de usar de las tcnicas ms
prometedoras deben ser desarrolladas y evaluadas en investigaciones controladas llevadas a cabo
en contextos educativos representativos. Idealmente, las medidas de criterio incluiran pruebas de
alto riesgo, tales como el desempeo en exmenes dentro de la clase y en las pruebas de logro.
Nos damos cuenta de que estos esfuerzos de investigacin pueden ser laboriosos y costosos, pero
conducirlos ser crucial para recomendar cambios educativos que tengan una probabilidad
razonable de mejorar el aprendizaje y el logro de los estudiantes.

Implicaciones para los estudiantes, los maestros y el rendimiento estudiantil


Pressley y colaboradores (Pressley, 1986; Pressley, Goodchild, et al., 1989) desarrollaron un
modelo de buen usuario de estrategias, segn el cual ser un sofisticado usuario de estrategia
implica "conocer tcnicas que logran importantes objetivos de vida (es decir, estrategias), saber
cundo y cmo usar esos mtodos y utilizae esos mtodos en combinacin con una rica red de
conocimientos no estratgicos que uno posee sobre el mundo "(pg 302). Sin embargo, Pressley,
Goodchild, et al. (1989) tambin sealaron que "muchos estudiantes estn comprometidos con
estrategias ineficaces. Adems, no hay suficiente evaluacin profesional de las tcnicas que se
recomiendan en la literatura, con muchas estrategias sobrevendidas por los proponentes "(p.
Estamos de acuerdo y esperamos que las revisiones actuales tengan un impacto positivo con
respecto al fomento de una mayor evaluacin cientfica de las tcnicas.
Con respecto al compromiso de los estudiantes con estrategias ineficaces, encuestas recientes
han indicado que los estudiantes con mayor frecuencia apoyan el uso de la relectura y el
resaltado, dos estrategias que encontramos que tienen una utilidad relativamente baja. Sin
embargo, algunos estudiantes reportan usar pruebas de prctica, y estos estudiantes parecen
beneficiarse de su uso. Por ejemplo, Gurung (2005) hizo que los estudiantes universitarios
describieran las estrategias que usaron para preparar los exmenes de la clase en un curso de
psicologa introductoria. La frecuencia de uso de pruebas de prctica de los estudiantes se
correlacion significativamente con su rendimiento en un examen final (vase tambin Hartwig y
Dunlosky, 2012). Dado que las pruebas de prctica son relativamente fciles de usar, los
estudiantes que no utilizan actualmente esta tcnica deben ser capaces de incorporarla en su
rutina de estudio.

Por qu no muchos estudiantes consistentemente utilizan tcnicas efectivas? Una posibilidad es


que a los estudiantes no se les indique qu tcnicas son efectivas o cmo usarlas efectivamente
durante la educacin formal. Parte del problema puede ser que no se informe a los profesores
sobre la eficacia de las diversas tcnicas de aprendizaje. Dado que los maestros aprenderan muy
probablemente sobre estas tcnicas en las clases de psicologa educativa, es revelador que la
mayora de las tcnicas no reciben cobertura suficiente en los libros de texto de la psicologa
educativa. Examinamos seis libros de texto (citados en la Introduccin) y, excepto los
mnemnicos basados en imgenes (por ejemplo, la palabra clave mnemnica), ninguna de las
tcnicas fue cubierta por todos los libros. Adems, en el subconjunto de libros de texto que
describan una o ms de estas tcnicas, la cobertura en la mayora de los casos era relativamente
mnima, con una breve descripcin de una tcnica dada y relativamente poca orientacin sobre
su uso, efectividad y limitaciones. Por lo tanto, es poco probable que muchos profesores
obtengan una introduccin suficiente a las tcnicas que funcionan mejor y cmo entrenar a los
estudiantes a utilizarlos.
Un segundo problema puede ser que se le da una prima a la enseanza de los contenidos de los
estudiantes y las habilidades de pensamiento crtico, mientras que se dedica menos tiempo
enseando a los estudiantes a desarrollar tcnicas y estrategias efectivas para guiar el
aprendizaje. Como seala McNamara (2010), "hay una asuncin abrumadora en nuestro sistema
educativo de que lo ms importante para entregar a los estudiantes es el contenido" (pg 341,
cursiva en original).
Una preocupacin aqu es que los estudiantes que obtienen buenos resultados en grados
anteriores, en los que el aprendizaje est ampliamente supervisado, pueden tener dificultades ms
adelante, cuando se espera que regulen gran parte de su propio aprendizaje, como en la escuela
secundaria o la universidad. Ensear a los estudiantes a usar estas tcnicas no tomara mucho
tiempo lejos de ensear el contenido y sera probablemente ms beneficioso si el uso de las
tcnicas fue enseado consistentemente a travs de varias reas de contenido, de modo que los
estudiantes pudieran experimentar ampliamente sus efectos sobre el aprendizaje y las
calificaciones.
Incluso aqu, sin embargo, las recomendaciones sobre cmo entrenar a los estudiantes para que
usen las tcnicas ms efectivas se beneficiaran de ms investigaciones. Una cuestin clave se
refiere a la edad ms temprana en que una tcnica dada podra (o debera) ser enseada. Los
maestros pueden esperar que los estudiantes de la escuela primaria sean capaces de usar muchas
de las tcnicas, pero incluso estos estudiantes pueden necesitar alguna gua sobre cmo
implementarlos ms efectivamente. Ciertamente, identificar la edad en la que los estudiantes
tienen la capacidad de auto-regulacin para usar efectivamente una tcnica (y la cantidad de
entrenamiento que necesitaran para hacerlo) es un objetivo importante para la investigacin
futura. Otro problema es la frecuencia con la que los estudiantes tendrn que ser reciclados o se
les debe hacer recordar como usar las tcnicas para asegurarse de que los estudiantes continuarn
usndolos cuando no se les indique que lo hagan. Teniendo en cuenta la promesa de algunas de
las tcnicas de aprendizaje, la investigacin sobre el desarrollo profesional que implica la
capacitacin de los profesores para ayudar a los estudiantes a utilizar las tcnicas sera valiosa.

Ms all de la formacin de los estudiantes a utilizar estas tcnicas, los profesores tambin
podran incorporar algunos de ellos en sus planes de leccin. Por ejemplo, al comenzar una
nueva seccin de una unidad, un profesor podra comenzar con una prueba de prctica (con
retroalimentacin) sobre las ideas ms importantes de la seccin anterior. Cuando los estudiantes
estn practicando problemas de una unidad en matemticas, los problemas recientemente
estudiados podran ser entrelazados con problemas relacionados de unidades anteriores. Los
profesores tambin podran aprovechar la prctica distribuida re-presentando los conceptos y
actividades ms importantes a lo largo de varias clases. Al introducir conceptos claves o hechos
en clase, los maestros pueden involucrar a los estudiantes en preguntas explicativas al instarles a
considerar cmo la informacin es nueva para ellos, cmo se relaciona con lo que ya saben, o
por qu puede ser cierto. Incluso las tareas pueden ser diseadas para aprovechar muchas de
estas tcnicas. En estos ejemplos (y en otros proporcionados en las subsecciones de Temas para
la Implementacin), los maestros podran implementar una tcnica para ayudar a los estudiantes
a aprender, sin importar si los estudiantes son conscientes de que una tcnica particular est
siendo usada.
Nos damos cuenta de que muchos factores son responsables cada vez que un estudiante no
consigue avanzar en la escuela (Hattie, 2009) y por lo tanto, un cambio a cualquier factor puede
tener un efecto relativamente limitado en el aprendizaje y el logro del estudiante. Las tcnicas de
aprendizaje descritas en esta monografa no sern una panacea para mejorar el logro de todos los
estudiantes y, quiz obviamente, slo beneficiarn a los estudiantes motivados y capaces de
usarlos. Sin embargo, cuando se usan adecuadamente, sospechamos que producirn ganancias
significativas en el desempeo en el aula, en las pruebas de logro y en muchas tareas que se
encuentran a lo largo de la vida. Es obvio que muchos estudiantes no estn usando tcnicas de
aprendizaje eficaces pero podran usar las tcnicas ms efectivas sin mucho esfuerzo, por lo que
los maestros deberan ser animados a capacitar ms consistentemente (y explcitamente) a los
estudiantes para que usen tcnicas de aprendizaje. metas de aprendizaje.