Вы находитесь на странице: 1из 6

TEXTO N 10

PROGRAMAS DE REFORZAMIENTO
Compilado y adaptado de: Domjan, M.
Grau.J.W Principios de aprendizaje y
conducta.THOMSO.2007 pg: 163- 168

TEXTO N 10

PROGRAMAS DE REFORZAMIENTO

Un programa de reforzamiento es un programa, o regla, que determina cmo y cuando !a ocurrencia de


una respuesta ir seguida de un reforzador. El programa puede establecerse en infinidad de formas. La
entrega de un reforzador puede depender de la ocurrencia de cierto numero de respuestas, del paso del
tiempo, de la presencia de ciertos estmulos, de la ocurrencia de otras respuestas del animal, o de
cualquier otra circunstancia. La tarea de catalogar los electos conductuales producidos por varios de los
posibles programas de forzamiento puede parecer difcil, pero la investigacin ha demostrado que resulta
bastante manejable. Los programas de reforzamiento que incluyen relaciones similares entre los estmulos,
las respuestas y los reforzadores normalmente producen patrones similares de conducta. La tasa exacta
de respuesta puede diferir de una situacin a otra, pero el patrn de resultados es altamente predecible.
Esta regularidad ha convertido el estudio de los programas de reforzamiento en un terreno tan interesante
como fructfero.
Los programas de reforzamiento influyen tanto en la forma de aprender una respuesta instrumental
como en la forma en que se mantiene por el reforzamiento. Tradicionalmente sin embargo, los que han
investigado los efectos de los programas se han interesado fundamentalmente en el mantenimiento de la
conducta. Los programas de reforzamiento se investigan normalmente en cajas de Skinner que permiten
una observacin continua de la conducta, por lo que pueden observarse y analizarse realmente los
cambios en la tasa de respuesta (Ferster y Skinner, 1957). Raramente ha interesado cmo se moldea y
condiciona inicialmente la respuesta operante. Por tanto, las investigaciones sobre los programas de reforzamiento han proporcionado gran cantidad de informacin sobre los factores que controlan el
mantenimiento de la conducta y su realizacin continuada ms que su adquisicinoriginal.
Los programas de reforzamiento han demostrado su importancia entre los empresarios que tienen que
asegurar la continuidad del trabajo de sus empleados una vez que stos lo han aprendido Incluso los
profesores a menudo estn interesados en alentar la ocurrencia de respuestas nuevas. Muchos
estudiantes que fracasan enpuestas ya aprendidas ms que en ensenar otras la escuela saben hacer
deberes y estudiar, pero simplemente no lo hacen. Los programas de reforzamiento pueden utilizarse para
motivar que la conducta de estudio se d de forma mas frecuente.
El estudio de los programas de reforzamiento es fundamental para la comprensin de la conducta
instrumental debido a lo que nos dicen sobre el proceso de forzamiento y a que sirven como una lnea de
base til para el estudio de otros procesos conductuales (Lattal y Neet, 1996, p 214). La influencia de las
drogas, los cambios en la motivacin y otras manipulaciones, a menudo dependen del programa de
reforzamiento que funciona en ese momento. Esto hace que la comprensin de la ejecucin en los programas
resulte necesaria para el estudio de otras cuestiones en la teora de la conducta y la neurociencia conductual.
Debido a su profunda importancia, Zeiler (1984) denomin a los programas de reforzamiento el gigante durmiente" del anlisis de la conducta.

PROGRAM AS SIMPLES DE REFORZAMIENT0 INTERMITENTE


Los procesos que organizan y dirigen la ejecucin instrumental se activan de difer por los distintos
programas de reforzamiento. En los programas "simples", un so termina qu ocurrencia de la respuesta
instrumental se refuerza.
Programas de razn
La caracterstica definitoria de un programa de razn es que el reforzamiento depende slo del nmero de
respuestas que el organismo realiza. Un programa de razn slo requiere contar el nmero de respuestas
que han ocurrido y entregar el reforzador cada vez que se alcance el nmero requerido. Si este nmero es
uno, cada ocurrencia de la respuesta instrumental provocar la entrega del reforzador. Este tipo de programa
se denomina tcnicamente reforzamiento continuo (abreviado RFC).
El reforzamiento continuo no suele suceder fuera del laboratorio porque el mundo no es perfecto.
Presionar el botn de un ascensor normalmente lo activa, pero los ascensores a veces no funcionan, por lo
que no sucede nada cuando se presiona el botn. Otras formas de conducta instrumental tambin pueden
producir reforzamiento ocasional. Las situaciones en las que la respuesta se refuerza slo alguna vez
involucran un reforzamiento parcial o intermitente.

Razn fija. Consideremos, por ejemplo, la entrega de un reforzador despus de cada dcima respuesta de
presin de palanca en un estudio con ratas de laboratorio. En un programa como ste, hay una razn fija
entre el nmero de respuestas que la rata realiza y el nmero de reforzadores que consigue. (Siempre se

dan 10 respuestas por cada reforzador). Y esto convierte al procedimiento en un programa de razn fija.
Especficamente, el procedimiento podra denominarse programa de reforzamiento de razn fija 10 (abreviado
RF 10).
Los programas de razn fija se dan en la vida cotidiana siempre que es necesario un nmero fijo de
respuestas para conseguir el reforzamiento. Una persona que siempre tiene que visitar el mismo nmero de
casas para completar su ruta est trabajando mediante un programa de razn fija. Comprobar la asistencia a
clase leyendo la lista incluye un programa de razn fija, establecido por el nmero de estudiantes del listado
de clase. El trabajo en cadena de las fbricas suele establecerse a travs de un programa de razn fija: se
paga a los trabajadores por el nmero de piezas que unen. Realizar una llamada telefnica involucra un
programa de razn fija: se tiene que marcar un nmero fijo de dgitos para llevar a cabo cada llamada.
Un programa de reforzamiento continuo constituye tambin un programa de razn fija. El reforzamiento
continuo es una razn fija de una respuesta por reforzador. En un programa de reforzamiento continuo, los
organismos suelen responder a una tasa constante pero moderada. Slo se dan pausas breves e
impredecibles. En un programa de RFC, una paloma, por ejemplo, al principio picotear.de forma constante
una tecla para conseguir comida y luego lo har ms lentamente a medida que sacie su apetito.
Se da un patrn de respuesta muy diferente cuando se encuentra en funcionamiento un programa de
reforzamiento intermitente de razn fija. No es probable que se realice una pausa en medio de la accin de
marcar un nmero de telfono, pero se puede tardar un tiempo antes de realizar la llamada. ste es el patrn
tpico de los programas de razn fija. Se da una tasa constante y alta una vez que la conducta se ha iniciado,
pero se puede tardar un tiempo antes de comenzar el nmero requerido de respuestas. Estas caractersticas
de la respuesta se muestran con claridad en un registro acumulativo de la conducta.
Un registro acumulativo es una forma especial de representar la forma de repetirse una respuesta a lo largo
del tiempo. Muestra el nmero total (o acumulativo) de respuestas que han ocurrido hasta un momento
determinado en el tiempo. Antes de que los ordenadores se convirtieran en algo comn, los registros
acumulativos se obtenan con la utilizacin de un registro en papel (vase la Fi-

Figura 6.1La construccin de un registro acumulativo mediante un registrador acumulativo para el registro continuo de
la conducta. El papel se desplaza hacia la izquierda a una velocidad constante. Cada respuesta hace que la pluma se
desplace sobre el papel una unidad hacia arriba. No se dieron respuestas entre los puntos A y B. Ocurri una tasa
moderada de respuesta entre los puntos ByC.y ocurri una tasa rpida entre los puntos C y D. En el punto E, la pluma
volvi al principio de la hoja.

<nira 6 1). El registrador consista en un tambor giratorio que mova el papel fuera del registrador a
unavelocidad constante. Una pluma se apoyaba en la superficie del papel. Si no se producan respuestas, la
pluma permaneca estacionaria y realizaba una lnea horizontal a medida que el papel se desplazaba. Si el
sujeto realizaba una respuesta de presin de palanca, la pluma se desplazaba hacia arriba una unidad sobre
el papel. Dado que cada respuesta de presin de palanca hacia que la pluma se desplazase hacia arriba en
el papel, la distancia vertical total recorrida por Sa pluma representaba el nmero acumulado (o total) de
respuestas que ei sujeto realizaba. Debido a que el papel se mova a una velocidad constante, la distancia
horizontal en el registro acumulativo proporcionaba una medida de la cantidad de tiempo que haba
transcurrido durante la sesin. La pendiente de la lnea trazada por el registro acumulativo representaba la
tasa de respuesta del sujeto.
El registro acumulativo proporciona una representacin visual completa de cundo y con que frecuencia
responde el sujeto durante la sesin. En el registro de la Figura 6.1, por ejemplo el sujeto no ejecut la
respuesta entre los puntos A y B, y se dio una rasa baja de respuesta entre los puntos B v C. Las respuestas
se dieron de forma ms frecuente entre los puntos C y D, pero el sujeto realiz una pausa en D. Cuando se

reanudaron las respuestas, la pluma alcanz el lmite de la hoja (en el punto E) y automticamente volvi a la
parte inferior para el registro de nuevas respuestas.
La Figura 6.2 muestra el registro acumulativo de una paloma cuya respuesta se haba estabilizado de
acuerdo con un programa de reforzamiento que requera 120 picotazos para cada entrega del reforzador (un
programa de RF 120). Cada entrega de comida se indica mediante las pequeas marcas hacia abajo de la
pluma registradora. El pjaro dej de responder despus de cada entrega de comida; cuando reanud el
picoteo, responda a una tasa alta y estable. La tasa cero de respuesta que se observa justo despus del
reforzamiento se denomina pausa posreforzamiento.La tasa de respuesta alta y estable que completa cada
requerimiento de la razn se denomina carrera de la razn.
Si el requerimiento de la razn se incrementa un poco (de una RF 120 a una RF 150, por ejemplo), la tasa de
respuesta puede permanecer igual durante la carrera de la razn. Con mayores requerimientos de tasa,
tienden a ocurrir pausas posreforzamiento ms largas (por ejemplo, Barn y Herpolsheimer, 1999; Felton y
Lyon, 1966). Si el requerimiento de la razn sufre un incremento sbito y significativo (de RF 120 a RF 500,
por ejemplo), es probable que el animal realice una pausa peridica cada vez que complete la razn requerida
(por ejemplo Mat- ford y Branch, 1998). Este efecto se denomina tensin de la razn.En casos extremos, la
tensin de

Figura 6.2 Muestras de registros acumulativos de diferentes palomas que picoteaban una tecla de respuesta
de acuerdo con cuatro programas simples de reforzamienrocon comida: razn fija 120, razn variable 360,
intervalo fijo 4 minutos e intervalo variable 2 minutos. (Tomado de Schcdules of Reinforcement, de C. B.
Ferster y B. F. Skinner, 1957, Appleron-Cenrury-Crofts.)

dela razn puede ser tan grande que ei animal deje completamente de responder. Al utilizar programas de
razn, el investigador debe tener cuidado de no aumentar la razn requerida (o, de forma ms general, la
dificultad de una tarea) demasiado rpido, debido a que puede darse la tensin de la razn y el organismo
desistir por completo.

A pesar de que la pausa que ocurre antes de la carrera de la razn en los programas de razn fija se ha
denominado histricamente pausaposreforzamiento, la investigacin ha mostrado que la longitud de esta
pausa est controlada por el requerimiento de la razn subsiguiente (por ejemplo, Barn y Herpolsheimer,
1999). Si se abandona antes de empezar una tarea de razn como lavar el coche, es porque no se est lo
bastante preparado para acometer el trabajo, no porque se est "descansando" desde la ltima vez que se
realiz dicho trabajo. Por tanto, la pausa posreforzamiento podra recibir la etiqueta ms apropiada de pausa
pre-razn.
Razn variable.En un programa de razn fija, se requiere un nmero predecible de respuestas por cada
reforzador. Esta predictibilidad puede eliminarse mediante la variacin en el nmero de respuestas requerido
para el reforzamiento de una ocasin a la siguiente. Este tipo de procedimiento todava es un programa de
razn, porque ef reforzamiento an depende del nmero de respuestas que realiza el organismo. Un
procedimiento en el que se necesita un nmero de respuestas distinto para la entrega de cada recompensa
se denomina procedimiento de razn variable (abreviado RV). Los investigadores pueden, por ejemplo,
entrenar a una paloma para realizar 10 respuestas para conseguir la primera recompensa, 13 para conseguir
la segunda recompensa, 7 para la prxima, y as sucesivamente. El valor numrico del programa de razn variable indica el nmero medio de respuestas requerido para conseguir el reforzador. En consecuencia, en este
caso el procedimiento sera un programa de razn variable 10 (abreviado, RV 10).
Los programas de razn variable se encuentran en la vida cotidiana siempre y cuando se requiera una
cantidad impredecible de esfuerzo para obtener un reforzador. Por ejemplo, cada vez que un conserje entra
en una habitacin mientras realiza su ronda, sabe que en dicha estancia ser necesaria cierra cantidad de
limpieza, pero no exactamente cunta. Los jugadores empedernidos que juegan con una mquina tragaperras

estn respondiendo de acuerdo a un programa de RV. Tienen que jugar a la mquina para ganar, pero nunca
saben cuntas jugadas producirn la combinacin ganadora. Los programas de razn variable tambin suelen
darse en los deportes. Siempre se necesita un cierto nmero de golpes para finalizar un hoyo en el golf, pero,
en principio, los jugadores no pueden estar seguros de cuntos golpes necesitarn para lograrlo.
Debido a que el nmero de respuestas necesario para conseguir el reforzamiento no es predecible, las
pausas predecibles en la tasa de respuesta son menos probables con los programas de RVque con los
programas de RF. Los organismos suelen responder a una tasa claramente estable en los programas de RV.
La Figura 6.2 muestra un registro acumulativo de una paloma cuya conducta de picoteo estaba mantenida por
un programa de reforzamiento de RV 360. Advirtase que aunque el programa de RV 360 requera, en
promedio, muchos ms picotazos por cada reforzador que el programa de RF 120, el programa de RV 360
mantuvo un patrn de respuesta mucho ms estable.
Aunque pueden darse pausas posreforzamiento en los programas de razn variable (vanse Blakely y
Schlinger, 1988; Schlinger, Blakely y Kaczor, 1990), stas son ms largas y prominentes con los programas
de razn fija. La rasa global de respuesta en los programas de RF y RVes similar siempre y cuando, como
promedio, se requieran nmeros similares de respuestas. Sin embargo, la tasa global de respuesta tiende a
distribuirse en un patrn de pausa-carrera con los programas de RF, mientras que se observa un patrn ms
estable de respuesta con los programas de RV (por ejemplo, Crossman, Bonem y Phelps, 1987). (Para
anlisis adicionales de los programas de razn, vase Bizo y Killeen, 1997.)
Programas de intervalo
En los programas de razn, el reforzamiento depende slo de! nmero de respuestas que el organismo ha
realizado. En los programas de intervalo,las respuestas son reforzadas slo si ocurren cuando ha transcurrido
una cierta cantidad de tiempo.
Intervalo fijo. En un programa simple de intervalo, una respuesta se refuerza slo si se da despus de que
haya transcurrido un tiempo desde la ltima entrega del reforzador. En un programa de intervalo fijo(abreviado
IF), el tiempo establecido no vara de una ocasin a la siguiente. Los programas de intervalo fijo se dan en
situaciones donde se requiere una cantidad fija de tiempo para dispensar el reforzador. Por ejemplo, el lavado
de la ropa en una lavadora tarda cierto tiempo. No importa cuntas veces se abra la lavadora antes del
transcurso del tiempo necesario para completar el ciclo; esto no se reforzar con la topa limpia. Una vez que
el ciclo finaliza, el reforzador est disponible, y se puede sacar la ropa limpia en cualquier momento.
Se pueden establecer contingencias semejantes en el laboratorio. Consideremos, por ejemplo, un
programa de intervalo fijo de 4 minutos (IF 4 min) para el picoteo en palomas. En este programa un pjaro
sera reforzado por el primer picotazo que realizase tras haber transcurrido 4 minutos desde la ltima entrega
de comida (o desde el comienzo del programa). Debido a que los picotazos realizados antes de los 4 minutos
despus de cada entrega de comida nunca se refuerzan, los sujetos aprenden a esperar para responder al
final del IF (vase la Figura 6.2) A medida que el tiempo para ta disponibilidad del prximo reforzador se
acerca, la tasa de respuesta aumenta. Este aumento en la tasa de respuesta se manifiesta como una
aceleracin en el registro acumulativo hacia el fina! del IF. El patrn de respuesta que se desarrolla con los
programas de reforzamiento de IF se denomina por consenso e! Festn del intervalo fijo.
La ejecucin en un programa de IF refleja la precisin del sujeto para contar el tiempo. Si e! sujeto fuese
totalmente incapaz de contar el tiempo, respondera de igual forma a lo largo de todo el ciclo del IF. La pausa
posreforzamiento y la aceleracin posterior hacia el final del intervalo reflejan una habilidad rudimentaria para
contar e! tiempo. Cmo podra mejorarse esta habilidad? La experiencia comn sugiere que la existencia de
algn tipo de reloj facilitara en gran medida los juicios sobre los intervalos temporales. Lo mismo ocurre con
las palomas en un programa de IF. En un estudio, el reloj consista en un punto de luz que creca en una hendidura a medida que el tiempo pasaba durante el ciclo del IF. La introduccin de este estmulo reloj
increment la duracin de la pausa posreforzamiento y provoc que la respuesta se desplazase ms cerca
de! final del ciclo de! IF (Ferster ySkinner. 1957). Como se esperaba, el estmulo reloj increment la eficacia
de la ejecucin en el programa de IF.
Es importante darse cuenta de que un programa de IF no garantiza que el reforzador se proporcionar en
algn momento a lo largo del intervalo de tiempo. Las palomas en un programa de IF 4 minutos no reciben
automticamente acceso al grano cada 4 minutos. Se requieren respuestas instrumentales para conseguir el
reforzador en los programas de intervalo del mismo modo que en los programas de razn. El intervalo
determina slo cundo el reforzador est disponible, no cundo se entrega. Para recibir el reforzador una vez
que est disponible, el sujeto todava tiene que realizar la respuesta instrumental. (Para anlisis recientes de
la ejecucin en IF, vanse Barn y Leinerweber, 1994; Hoyert, 1992; Lejeune y Wearden, 1991; Machado,
1997b; Wynne, Staddon y Delius, 1996).
La programacin de los exmenes en los cursos universitarios tiene importantes semejanzas con el
programa bsico de IF. Normalmente, cada curso tiene slo dos o tres exmenes, que se distribuyen de

forma homognea. Puede haber slo un examen parcial y otro final. Un programa de este tipo favorece una
pauta de estudio muy parecida a !o que se observa con un programa de IF en el laboratorio. Los estudiantes
dedican poco tiempo a estudiar al principio del cuatrimestre o justo despus del examen parcial. En lugar de
ello, empiezan a estudiar ms o menos una semana antes del examen, y la tasa de estudio se incrementa
rpidamente a medida que se aproxima el da del examen.
Intervalo variable.En los programas de intervalo fijo, las respuestas se refuerzan si ocurren despus de que
haya transcurrido una cantidad fija de tiempo desde la administracin del reforzador previo (o desde el
comienzo del programa). Los programas de intervalo tambin pueden ser impredecibles. En un programa de
intervalo variable(abreviado IV), las respuestas se refuerzan si se dan tras haber transcurrido un intervalo
variable desde la administracin del reforzador previo (o desde el comienzo del programa).
Los programas de intervalo variable se hallan en situaciones donde se requiere una cantidad de tiempo
impredecible para preparar o dispensar el reforzador. Un mecnico que no dice cuando tendr a punto el
coche impone un programa de IV. El coche no estar listo durante algn tiempo, por lo que los intentos por
recuperarlo no sern reforzados. El tiempo que tiene que pasar antes de que el coche est listo es
impredecible.