Resumen Tema 7 Tutor

TEMA 7: CONTROL AVERSIVO EN EL CONDICIONAMIENTO OPERANTE
Vamos a centrarnos en el efecto de la estimulacin aversiva (primaria o

secundaria) en la conducta operante, por lo que abordaremos los
procedimientos de reforzamiento negativo y castigo. Adems, se
reflexionar sobre algunos aspectos relacionados con la supresin de la
conducta operante, como ciertos efectos paradjicos o mtodos
alternativos al castigo, as como en la influencia de la estimulacin
aversiva en la conducta de eleccin.
1. ESTIMULACIN AVERSIVA EN EL CONDICIONAMIENTO OPERANTE
1.1. Procedimientos de condicionamiento operante
Recordamos los cuatro tipos de procedimientos:
NOMBRE DEL
CONTINGENCIA
PROCEDIMIENTO RESPUESTA-CONSECUENCIAS
RESULTADOS
Reforzamiento
positivo
(recompensa)
Positivo: La respuesta produce un Reforzamiento o

estmulo apetitivo
incremento en la
tasa de respuesta.
Castigo (castigo
positivo)
Positivo: La respuesta produce un Supresin o

estmulo aversivo
disminucin de la
tasa de respuesta
Reforzamiento
negativo (escape
o evitacin)
Negativo: la respuesta elimina o Reforzamiento o

previene la ocurrencia de un incremento en la
estmulo aversivo.
tasa de respuesta.
Entrenamiento
Negativo: la respuesta elimina la Supresin o
de omisin (RDO) ocurrencia de un hecho agradable disminucin de la
o reforzador apetitivo.
tasa de respuesta
1.2. Castigo, escape y evitacin

Los procedimientos de reforzamiento negativo (escape-evitacin) y de
castigo presentan ciertas caractersticas en comn pero tambin
importantes diferencias.
Mediante el reforzamiento negativo aumentamos la probabilidad

de la operante mientras que con el castigo la reducimos. Sin
embargo, en ambos casos la conducta del sujeto es modelada para
reducir al mximo su exposicin a la estimulacin aversiva (se suele
denominar evitacin activa a la conducta reforzada
negativamente y evitacin pasiva a la castigada positivamente).
1.3. Procedimientos condicionamiento operante y estados emocionales.
Los estmulos elicitadores provocan en los sujetos estados

emocionales, estados que pueden asociarse al resto de los eventos
antecedentes (convirtindolos en ECs). Los eventos presentes durante el
refuerzo, nos hacen sentir bien, y por las mismas razones, no nos gustan
los eventos presentes durante el castigo.
Existen diferentes teoras que
EIs-ECs
Emociones
intentan explicar el efecto en la
EIs apetitivos
ALEGRA
conducta de los procedimientos de
EIs aversivos
MIEDO
castigo, es de especial relevancia la
ECs excitatorios ESPERANZA
Teora de la respuesta emocional
(apetitivos)
condicionada (Estes y Skinner
ECs excitatorios ANSIEDAD
(1941):
se
basa
en
las
(aversivos)
observaciones del procedimiento
ECs inhibitorios TRISTEZA
de supresin condicionada.
(apetitivos)
La idea bsica es que un EC
ECs inhibitorios ALIVIO
excitatorio aversivo provoca ciertas
(aversivos)
respuestas emocionales (como la
paralizacin) por el hecho de estar emparejadas con una descarga
(incompatibles con la respuesta de presin de palanca). No obstante, a
diferencia del experimento de Supresin Condicionada, los procedimientos
de castigo no suelen incluir un EC explcito que seale la administracin
de la descarga. Estes sugiri que cumplen esta funcin los diversos estmulos
(visuales, tctiles y propioceptivos) que el sujeto experimenta antes de dar la
respuesta castigada, como la visin de la palanca y/o de los discriminativos
(luces, sonidos, etc.).
La estimulacin aversiva producida por la respuesta es mucho ms eficaz

para suprimir la conducta que la aversiva independiente de la respuesta.
2. CONDUCTA DE EVITACIN
(Schlosberg, 1934; Brogden, Lipman y Culler, 1938) exploraron una

caracterstica del estudio de Bechterev que lo diferenciaba radicalmente de las
preparaciones habituales de condicionamiento clsico: que el EI no aparezca
si se presenta la RI. Replicas del experimento original de Bechterev
aadiendo un grupo control en el que el EI se presentaba en todos los
ensayos independientemente de la respuesta del sujeto. Tanto la
velocidad de adquisicin como el nivel de ejecucin de la supuesta RC
eran mucho mayores en el grupo experimental (en el que se poda evitar la
descarga) que en el control. Estaban ante dos tipos de conductas diferentes y
marc el inicio de una lnea de investigacin (en el marco del condicionamiento
operante) cuyos principales mtodos y hallazgos se describirn a continuacin.
GE: (luz (EC)-descarda (EI)-levantar el dedo de la placa ( RI)
EC-EIRI // ECRI (grupo evitacin)
GC: (luz (EC)-descarda (EI)-levantar el dedo de la placa ( RI)
EC-EIRI // ECRIEI
2.1. Procedimientos de evitacin
2.1.1. Evitacin discriminada (o sealada): debido a la existencia de claves
que sealan el acontecimiento aversivo, frecuentemente una descarga. Cada
ensayo se inicia con la presentacin de un evento neutro (que suele ser un
tono o una luz) al que se le denomina seal (discriminativo positivo).
Depende de lo que haga el sujeto (dos posibilidades):
A) Si el sujeto no emite la respuesta requerida para la evitacin

durante el intervalo entre la seal y el EI aversivo, se presenta el EI
y se mantiene hasta que la emite, despus de lo cual tanto la seal
como el EI cesan. Se considerara un ensayo de escape, (suprime la
descarga elctrica en curso). Predominan al principio del entrenamiento.
B) Si el sujeto emite la respuesta requerida antes de que se
presente el EI aversivo, la seal cesa y se omite el EI en ese ensayo.
Se considerara un ensayo de evitacin con xito. Predominan al final.
Se barajan tres elementos: la seal de aviso, la respuesta operante y la

consecuencia aversiva. Relaciones bsicas de contingencia que se producen
entre ellos, as como la interdependencia de tales relaciones:
Seal de aviso (EC) Respuesta Instrumental (RI)Consecuencias (EI)
1) Contingencia Respuesta-Seal de aviso: dar la respuesta operante
conlleva la desaparicin de la seal de aviso, lo que convierte su
relacin en una contingencia de escape. RIdesaparece EC(escape)
2) Contingencia Respuesta-Consecuencia. Inicialmente contingencia de
escape, cuando el entrenamiento avanza contingencia de evitacin.
3) Contingencia Seal de aviso-Consecuencia. Cuando consigue evitar
con su respuesta la descarga, aparece nicamente la seal de aviso,
pero no la consecuencia. ECRINo descarga (Evitacin)
Un efecto muy robusto de la conducta de evitacin discriminada en
situaciones de laboratorio es la elevada cantidad de ensayos que
requiere.
Todas las investigaciones apuntan a que la eleccin de la operante
que se pretende reforzar determina el tiempo necesario para
adquirirlacunto ms se asemeje a la respuesta elicitada
especfica de la especie mayor es la velocidad de aprendizaje.
Se proponen diferentes teoras para explicar el efecto que el entrenamiento
de evitacin discriminada tiene sobre los individuos. Destacamos:
- La Teora Bifactorial de Mowrer: motivada por la preocupacin acerca
de la paradoja: una conducta pudiera estar reforzada por la ausencia de
un evento. Estn implicados dos procesos interdependientes: el
condicionamiento clsico de miedo al EC y el reforzamiento
operante de la respuesta de evitacin a travs de la reduccin del
miedo (interaccin entre dos procesos clsico y operante).
1) EC (seal) EI (deacarga) RC miedo (o ansiedad)
2) EC (seal) R evitacin (escape del miedo generado por EC
impidiendo el EI y provocando que el EC se extinga (al no aparecer el EI).
3) Una vez se extingue el EC deja de emitir la respuesta, volviendo a
presentarse el EI (lo que nos lleva de nuevo al punto 1).
-
Hiptesis de Schoenfeld: el miedo como una variable intermediaria en

el aprendizaje de la evitacin es innecesaria. La seal adquiere, por
condicionamiento clsico, funciones de consecuencia aversiva
secundaria o condicionada; lo que emiten es una respuesta de
escape reforzada por la retirada de la seal de aviso (no considera
necesario aludir al efecto emocional en proceso).
2.1.2. Evitacin no discriminada de operante libre de Sidman

La descarga se programa para que ocurra peridicamente, sin
aviso, (cada 10 segundos, por ejemplo). El resultado es que los
individuos aprenden a evitar las descargas aun cuando no exista
un estmulo de aviso (al presentar las descargas en intervalos
temporales fijos los estmulos internos pueden adquirir esa
funcin). Dos intervalos de tiempo:
1) Intervalo E-E, Er-Er, o Reloj choque-choque: es el intervalo entre las
descargas en ausencia de una respuesta.
2) Intervalo R-E, R-Er, o Reloj respuesta-choque: que es el intervalo entre
la respuesta y la descarga programada, es decir, el perodo de seguridad.
Permite que las respuestas de evitacin se den en cualquier momento,
ya que, ocurran cuando ocurran, reinician el intervalo R-EI (evitacin de
operante libre). Diferencias respecto a la evitacin discriminada:
1.
Implican generalmente perodos mucho ms largos de
entrenamiento que los experimentos de evitacin discriminada.
2. Con frecuencia, aun despus de un entrenamiento extenso, los
animales no aprenden nunca a evitar todas las descargas.
3. Los sujetos a menudo se diferencian enormemente en la forma de
responder ante el mismo procedimiento de evitacin de operante libre.
Entre las hiptesis explicativas del fenmeno de la evitacin de
operante libre vamos a destacar:
-
Hiptesis Propioceptiva de Sidman (1953): el papel de la seal de

aviso (no existente) lo ocupa la propia conducta del individuo. Todas
las conductas que realiza (excepto la respuesta instrumental) quedan
asociadas a la aplicacin de la descarga, en el futuro, sufrir una
ansiedad comparable a la del sujeto al que, en un procedimiento de
evitacin discriminada, se le presentara la seal de aviso (luz, tono,...).
La nica manera que tendra de escapar de esa ansiedad es
emitiendo la operante reforzada.
Hiptesis Interoceptivo-temporal Anger (1963). Sera el paso del

tiempo (a travs de la interiorizacin los dos intervalos) el que
producira la ansiedad que conduce al sujeto a responder.
Hiptesis de la Seal de Seguridad (Dinsmoor, 2001): los estmulos

asociados a los periodos de seguridad provocados por la respuesta
de evitacin (fundamentalmente los que son resultado de la
retroalimentacin de desplazarse hacia una zona de la caja, saltar a una
plataforma o pulsar una palanca) se convierten en estmulos
condicionados inhibitorios aversivos por su contingencia negativa
con la descarga.
2.1.3. La evitacin de descarga aleatoria de Herrnstein-Hineline

Ratas en caja de Skinner que contaba con una palanca y dos
mquinas dispensadoras de descargas (A y B) conectadas al suelo
de rejilla metlica de la caja. Las descargas de cada mquina eran
intensas, breves y programadas en perodos de tiempo irregulares. La
nica diferencia entre ambas es que la frecuencia (nmero de choques
por unidad de tiempo) de las descargas producidas por A era mayor que
las producidas por B. Al principio se conectaba la maquina A, una
presin de la palanca la desconectaba y conectaba la B, que se
mantena activa hasta dispensar una descarga, entonces se volva a
conectar A.
La mquina A sera como un registro E-E de Sidman, mientras

que la B sera como un registro R-E, excepto que las descargas
se dan a intervalos variables en ambos casos. Todo lo que se
poda hacer era cambiar las condiciones para decrecer la tasa total
de descargas (mantener una frecuencia baja de administracin de
descargas).
Los resultados obtenidos por estos autores mostraron un aumento
de la probabilidad de emisin de la presin de la palanca
(conducta de evitacin).
Herrnstein (1969) explic el reforzamiento de la conducta de
evitacin como el debido a la reduccin de su frecuencia total o
densidad, entendida sta como una contingencia molar negativa
entre las tasas de respuesta y de consecuencias aversivas.
2.2. Variables que afectan al reforzamiento negativo

Cuanto mayor es la intensidad de la estimulacin aversiva, mayor es la
velocidad de adquisicin de la conducta reforzada negativamente.
La habituacin (en los EI) y la extincin (en los EC) pueden tambin
reducir la efectividad de las consecuencias aversivas, tanto para la adquisicin
de conductas (evitacin/escape) como para su supresin (castigo).
Adems de la intensidad existen otros parmetros que determinan el
reforzamiento negativo:
En el procedimiento de evitacin libre de Sidman la tasa de

respuestas est determinada por los intervalos E-E y R-E.
Cuanto mayor es la frecuencia de las descargas en ausencia de
respuestas (menor intervalo E-E) y mayores sean los perodos de
seguridad (mayor intervalo R-E), mayor ser la probabilidad de que el
animal aprenda la respuesta de evitacin.
En la evitacin de descarga aleatoria esta relacin tambin se

da, no obstante, hay que tener en cuenta que, dada la naturaleza del
procedimiento, la evitacin no ser nunca absoluta.
3. CASTIGO
Thorndike (1911): reforzamiento positivo (fortalece la conducta) y castigo (la
debilita) implican procesos simtricamente opuestos.
Teora de la respuesta emocional condicionada (REC), propuesta de
Estes (1944), ya comentada.
Teora de las respuestas competitivas reforzadas negativamente
(Dinsmoor, 1954): explica el castigo en trminos de la adquisicin de
respuestas de evitacin incompatibles con la respuesta castigada. La supresin
de la conducta no se considera un reflejo del debilitamiento de la respuesta
castigada, ms bien, se explica en trminos del fortalecimiento de aquellas
respuestas competitivas que evitan eficazmente la estimulacin aversiva.
3.1. Variables que afectan al castigo: consiste en presentar un estmulo
aversivo contingentemente despus de una respuesta especfica. El resultado
esperable del procedimiento es la supresin (reduccin de su probabilidad de
emisin) de la respuesta en cuestin.
* Premack, (1971): El reforzamiento no es absoluto sino relativo. Si
tras establecer una jerarqua de preferencias, en funcin de la frecuencia
en la ocurrencia de diferentes respuestas, hacemos contingente la
emisin de una conducta menos preferida con el acceso a otra ms
preferida, la primera es reforzada. Pero si forzamos al sujeto a emitir
una respuesta tras la emisin de una ms preferida, el efecto es el
contrario: la que se emiti en primer lugar ve reducida su
probabilidad de emisin en el futuro, es decir, es castigada.
La mayora de la investigacin sobre el castigo se ha realizado siguiendo
este esquema (adquisicin de alguna operante mediante refuerzo positivo para
luego superponer una contingencia de castigo-descarga), lo que implica que: a)
no parten de la concepcin relativista de Premack, b) los resultados son
la suma del efecto del castigo y del reforzamiento (ya que se aplican
simultneamente). Variables de las que depende la efectividad del castigo para
suprimir la conducta:
a) Intensidad del estmulo aversivo: cuanto ms intensa sea la
estimulacin aversiva, ms eficaz resultar para suprimir las
respuestas (puede hacerlo totalmente (Appel, 1961). Cuando esto pasa
y la respuesta se suprime por completo, puede darse un fenmeno
paradjico: que la conducta reaparezca ms tarde.
+ Skinner (1953): castigo no es un mtodo eficaz para suprimir la

respuesta.
+ Masserman (1946) comprob con gatos que las conductas
suprimidas con castigo podan seguir sin aparecer incluso 20
meses despus de aplicar el procedimiento.
b) Inmediatez y demora del estmulo aversivo: la alta contigidad es
un elemento favorecedor (el aumento del intervalo R-Er produce una
menor supresin de la conducta (Cohen, 1968).
+ (Estes, 1944; Hunt y Brady, 1955): encuentra que los
resultados son muy parecidos independientemente de si el castigo
se aplica de manera demorada o inmediatamente tras la
respuesta.
+ Azrin (1956): ha matizado estos datos, esto se debe a una
exposicin a las contingencias demasiado breve (con el tiempo
suficiente, el castigo demorado suprima en menor medida la
conducta).
c) Cambios graduales en la intensidad del estmulo aversivo. Un factor
muy importante del castigo es la forma en que se introduce la
consecuencia aversiva. Se producir mucha menos supresin de la
conducta si se utiliza inicialmente un castigo suave, y se va
incrementando gradualmente la intensidad de la descarga a lo largo
del entrenamiento.
d) Experiencia previa. Si la fase de reforzamiento previo fue muy larga y el
volumen de reforzamiento muy grande, los efectos del castigo sern
menores.
e) Efectos discriminativos del estmulo aversivo. Si la respuesta se
castiga en presencia de un estmulo discriminativo, pero no cuando
el estmulo est ausente, a esto se le llama Castigo Discriminativo
(y al discriminativo estmulo delta o discriminativo negativo). Con una
exposicin continuada al discriminativo, los efectos supresores del
castigo se limitan a la presencia de dicho estmulo.
f) Programa de castigo: el castigo puede tambin administrarse
intermitentemente (los programas de castigo continuos son ms
efectivos que los intermitentes (Zimmerman y Fester, 1963).
g) Programa de reforzamiento compuesto: toda tcnica de castigo es
una tcnica mixta, ya que castigar una conducta requiere que esa
conducta haya sido reforzada o est siendo reforzada a la vez. As,
podemos encontrarnos estos tres casos:
+ Castigo sobre lneas-base apetitivas: aqu actan simultneamente
el castigo y el reforzamiento positivo sobre la misma respuesta.
+ Castigo sobre lneas-base defensivas: concurren el castigo y el

reforzamiento negativo (escape/evitacin).
+ Castigo sobre lneas-base de extincin: se castiga una respuesta
que previamente ha sido reforzada, pero que en el momento de aplicar
el castigo est siendo extinguida.
La eficacia del castigo se ver reducida por la eficacia relativa del
procedimiento con el que est compitiendo (en el caso del reforzamiento
positivo y negativo) o aumentada por la eficacia de proceso de extincin
de la misma conducta.
h) Existencia de una conducta alternativa reforzada: la tener una fuente
alternativa de reforzamiento aumenta enormemente la supresin de las
respuestas producida por el castigo (Herman y Azrin, 1964).
i) Manipulaciones motivacionales: la eficacia para suprimir una conducta
es mayor si se reduce la motivacin para realizar esa respuesta
(Dinsmoor, 1952), para una conducta reforzada con comida, se ha
comprobado que no slo la supresin es mayor si los animales se
encuentran al 85% de su peso que si estn al 60% (Azrin, Holz y Hake,
1963), sino que incluso cuando se aumenta su motivacin (nivel de
privacin) la operante suprimida no reaparece (Masserman, 1946).
3.2. EFICACIA RELATIVA DEL CASTIGO PARA SUPRIMIR LA CONDUCTA
Pierce y Cheney (2008): slo podemos hablar de castigo cuando
efectivamente la consecuencia suprime la conducta (lo que implica que, por
definicin, siempre funciona). Ojo: Nio-reprimenda-puede asociarla a mayor
atencin y repetirla: reforzamiento positivo, no castigo.
El uso del castigo conlleva ventajas y desventajas que hay que valorar
antes de su puesta en prctica como tcnica para la supresin:
+ Provoca una reduccin de la conducta a corto y largo plazo, pero, sobre
todo, con un alto grado de inmediatez. Adems, el recondicionamiento de la
conducta es mucho ms lento y difcil que el condicionamiento de esa misma
conducta si no ha sido anteriormente castigada.
+ Genera una serie de efectos colaterales que pueden no ser deseables
(ansiedad, agresin, neurosis o una redistribucin no prevista de la conducta
del sujeto (aumentando la tasa de ciertos comportamientos y bajando la de
otros, que no han sido sometidos al castigo).
Con el uso extendido del castigo, se corre un riesgo

considerable de ampliar los estmulos generadores de ansiedad
para el sujeto (lugar, sujeto que aplica, generalizacin a otros
estmulos), con el desarrollo de trastornos del comportamiento.
Agresin elicitada: cuando se sita a dos organismos juntos y

se les aplica estimulacin aversiva suelen atacarse entre ellos,
(Azrin y otros 1963). Cuando la presencia de un organismo (el
domador, el adiestrador) correlaciona con la presentacin de
estimulacin aversiva, la agresin dirigida hacia l puede verse
reforzada como conducta de escape/evitacin si llega a suprimir
dicha estimulacin.
3.3. Fenmenos paradjicos en el castigo (efecto diferente al esperado)

3.3.1. La conducta masoquista: el castigo puede convertirse en una seal,
o estmulo discriminativo, para la disponibilidad del reforzamiento
positivo). Ejemplo: nio-travesura-reprimenda, acto seguido muestras de
cario del padre arrepentido (aumento en lugar de disminucin).
+ Otra forma: mediante el contracondicionamiento de la
consecuencia aversiva. (ejemplo: Descargas de poca intensidad (EI)
con mucha comida, para ir poco a poco aumentando las descargas y
disminuyendo la comida descargas EC excitatorio apetitivo).
3.3.2. Crculo vicioso: si se entrena una conducta de escape (saltar al otro
compartimento de la caja lanzadera) ante un evento aversivo (una descarga,
por ejemplo), el propio evento adquiere funciones discriminativas positivas para
esa conducta (aumenta las probabilidades de emisin de dicha conducta).
3.4. Otras estrategias de supresin de la conducta: supresin de la
conducta operante que no requieren del uso del castigo, eludiendo de esta
forma los posibles efectos colaterales descritos en los apartados anteriores:
3.4.1. Entrenamiento de omisin: consiste en establecer una contingencia
negativa entre una determinada respuesta y la administracin de un reforzador.
(la probabilidad de que se presente un reforzador es menor si el sujeto
emite la respuesta que si no la emite-disminuye la tasa de respuestas).
- Tambin podemos observar cierta similitud entre el Entrenamiento de
Omisin y la Evitacin de Sidman: en ambos, el signo de la contingencia es
negativo y puede hablarse de intervalos consecuencia- consecuencia (E-E,
nos indica la frecuencia con la que se van a presentar las consecuencias
cuando el sujeto no emite la respuesta) y respuesta-consecuencia (R-E, nos
indica el tiempo que va a transcurrir entre que el sujeto emite la respuesta y el
retraso aadido en la presentacin de la prxima consecuencia). En estos
procedimiento no se despliegan seales de aviso y la respuesta, se emita en el
momento en que se emita, retrasa la aparicin del reforzador.
* Para que se produzca aprendizaje, los intervalos de presentacin
de la consecuencia en ausencia de respuestas (intervalos E-E)
deben ser de menor duracin que los de entrega de la
consecuencia tras la respuesta del sujeto (intervalos R-E).
* Otro factor para una mayor eficacia del procedimiento es el ajuste

paramtrico en funcin de la ejecucin (se debe empezar por valores
pequeos del intervalo R-E, para, paulatinamente y teniendo en cuenta
la ejecucin del sujeto, ir aumentado el criterio de pausa).
* El entrenamiento de omisin tiene como efecto inmediato sobre la
tasa de conducta un mantenimiento residual de la respuesta que
acaba por desaparecer a largo plazo, dando lugar a la total eliminacin
de la conducta y a una extrema resistencia al recondicionamiento.
3.4.2. Modificacin de la fuerza de conductas alternativas: cualquier
comportamiento es una conducta de eleccin: elegimos pulsar o no pulsar,
movernos o quedarnos quietos Siempre estamos eligiendo.
* Incluso un programa (RF) puede interpretarse como un programa
concurrente en el que la respuesta de pulsar la tecla es reforzada
positivamente por la presentacin de comida, y la de no pulsar es
reforzada negativamente por la evitacin del esfuerzo. Sabemos
que si aumentamos mucho la razn el sujeto deja de responder
(aumento del reforzamiento negativo de la conducta alternativa (no
pulsar), ya que hemos incrementado el nivel de esfuerzo, el valor de la
consecuencia aversiva del otro componente
* Este razonamiento puede extenderse a cualquier situacin, cualquier
modificacin que convierta a la alternativa en ms atractiva
reducir la probabilidad de emisin de la conducta objetivo.
* Otra forma de suprimir una determinada conducta relacionada con
lo anterior es fortaleciendo alguna respuesta cuya emisin sea
incompatible con la anterior. Podemos suprimir la conducta de
levantarse del asiento durante una clase aplicando un procedimiento de
castigo (cada vez que se levanta se le reprende), pero podemos obtener
el mismo efecto reforzando la conducta de estar sentado.
3.4.3. Extincin: de la propia operante: romper la contingencia positiva
respuesta-consecuencia (en las conductas reforzadas positivamente) o la
contingencia negativa respuesta-consecuencia (en las reforzadas
negativamente, entrenamiento de evitacin/escape) en presencia de los
respectivos discriminativos resultar en un descenso de la operante
(frente a estos discriminativos), la extincin no implica un desaprendizaje.
3.4.4. Modificaciones motivacionales: la emisin de las conductas operantes
dependen del estado motivacional (grado de privacin asociado con el
reforzador), historia de reforzamiento y castigo del sujeto y de la
estimulacin presente (discriminativos positivos y negativos) en ese
momento, todos eventos anteriores a la propia emisin de la respuesta. Para
reducir la tasa de una operante:
* Saciedad: Con reforzadores primarios (EI), es posible suprimir una

conducta sin aplicar el castigo mediante la manipulacin de variables
relacionadas con la motivacin (saciar al sujeto-reduciendo as su
emisin). Con el reforzadores secundarios (EC), saciando al sujeto
respecto al reforzador primario del que depende.
* Tambin podemos reducir la tasa de una operante mantenida con
un reforzador primario devalundolo dicho. Si asociamos de forma
pavloviana un reforzador primario (EI, comida, por ejemplo) con otro
estmulo de signo contrario (aversivo), provocaremos un descenso en la
probabilidad de emisin de las conductas reforzadas con dicho estmulo.
* La capacidad reforzante de un reforzador secundario tambin
puede anularse (y, por tanto, reducir la tasa de la respuesta en la
que influye) a travs de otros mtodos: la extincin y el
contracondicionamiento.
* Muchas conductas son mantenidas con reforzadores secundarios
generalizados. El dinero emparejado con multitud de reforzadores
primarios (comida, agua, etc.), secundarios (ropa, transporte, etc.) e
incluso otros secundarios generalizados (seguridad, estatus, poder, etc.)
son muy resistentes a la saciedad y a la extincin.
* Una estrategia con la que s podemos disminuir la tasa de una
operante sin la presentacin de estimulacin aversiva
(independientemente de que el reforzador sea primario, secundario o
generalizado) es con la reduccin de la intensidad del reforzador.
Contraste conductual negativo.
4. PROGRAMAS CONCURRENTES Y ESTIMULACIN AVERSIVA
4.1. Conducta de eleccin: La investigacin de laboratorio principalmente
mediante los programas de reforzamiento concurrentes.
* (Herrnstein, 1961): nmero de respuestas en funcin del nmero
de refuerzos (ley de igualacin).
(B1/B2) = (r1/r2)
// B (elecciones) r (valor del reforzador) 1 y 2
(alternativas y sumatorio). Extensible a magnitud y calidad.
Obtuvo un alto apoyo emprico (Catania, 1963; Stubbs y Pliskoff,

1969; Schneider, 1973), pero tambin empez a comprobarse la
validez de dicha ley con otros tipos de procedimientos.
4.1.1. Eleccin y reforzamiento negativo:

Baum (1973) ajuste de la Ley de Igualacin a la conducta controlada por
escape, usando descargas como evento aversivo y el tiempo de estancia en
una localizacin de la caja como conducta de eleccin.
El experimento consisti en reforzar con 2 de tiempo fuera y la

desactivacin de una descarga de 7-mA a 4 palomas por
situarse en el punto A o en el B de la caja. Reforzamiento bajo un
programa IV diferente que fue varindose: 0.5-8, 0.5-4, 1-2, 2-2,
4-2, 8-2, 8-1, 8-0.5 . Se comprob que la reduccin de la tasa de
refuerzo negativo funcionaba de la misma forma que la reduccin de
reforzamiento positivo (slo en dos de las 4 palomas).
Hutton, Gardner y Lewis (1978) entrenaron a tres palomas a responder

a dos teclas mediante reforzamiento positivo, para despus mantener esa
respuesta en un programa concurrente, primero sin y luego con periodos
de descarga. La fase experimental empez con un programa concurrente IV1IV1 de 1 minuto sin descarga como reforzador, y luego continu a travs de 8
condiciones en las que se variaba la frecuencia de reforzamiento de cada
alternativa (0.33, 0.11, 0.33, 1.00, 3.00, 9.00, 3.00). Los resultados mostraron
un importante ajuste a la Ley de Igualacin en funcin de la frecuencia relativa
de reforzamiento negativo de cada alternativa (no fue perfecto, ya que se
observ cierta infraigualacin, probablemente por la baja discriminabilidad entre
pequeas diferencias en las frecuencias.
La replicacin de estos resultados con ratas conlleva una problemtica
aadida para conseguir que el sujeto emita alguna operante mientras es
expuesto a la descarga, ya que la respuesta tpica de esta especie frente a
este tipo de estmulos es la parlisis.
Logue y De Villiers (1978): entrenaron a tres ratas para

responder a dos palancas mediante varios programas de
reforzamiento positivo concurrente IV-IV. Tras esto incluyeron la
presentacin de descargas durante el intervalo (en el programa
de reforzamiento positivo) haciendo contingente el escape total
con la presin de la palanca (que antes no tiene efecto en ese
periodo). Una vez consiguieron un comportamiento estable fueron
reduciendo gradualmente el tiempo de escape de 30 a 15. La fase
experimental (a la que slo llegaron 2 de las 3 ratas tras casi tres
meses) consisti en exponer a los sujetos al mismo procedimiento
variando el tiempo de escape para cada alternativa: 60-60, 40-120,
120-40, 210-35, 120-40, 60-60, 40-120, 35-210. Los resultados
mostraron un buen ajuste de las elecciones en funcin de la
frecuencia de escape.
4.1.2. Eleccin y castigo: los sujetos son capaces de ajustar su eleccin a

ciertas caractersticas del castigo.
* Holz (1968) comprob que, aunque la tasa de respuesta general
decrece (una vez se ha adquirido por reforzamiento positivo), la tasa
relativa se ajusta a la frecuencia relativa de castigo en cada

alternativa.
* Deluty (1976): entren a tres ratas a presionar la palanca mediante
una consecucin de programas concurrentes IR-IR (Intervalo aleatorio,
similar al IF pero con un grado de probabilidad del refuerzo), pasando de
15-15 a 30-30, 1-1 y terminando en 1.5-1.5, intervalo que se sigui
usando para mantener la respuesta. Tras este entrenamiento se aadi
a cada alternativa otro programa IR pero de castigo. De esta manera,
cada alternativa ofreca la misma frecuencia de reforzamiento pero
diferente de castigo. Los resultados mostraron que el incremento de
la tasa relativa de castigo en una alternativa reduca la tasa relativa
con la que era elegida. Se encontraron efectos muy similares
usando programas mltiples en lugar de programas concurrentes
(Tullis y Walter, 1968).
4.2. Conducta auto-controlada y conducta impulsiva: se ha concebido
tradicionalmente como la eleccin de la alternativa con mayor valor relativo
de reforzamiento pero ms demorada. Se considera comportarse de manera
impulsiva la eleccin de la alternativa con un reforzamiento de menor
valor relativo pero ms inmediato.
El uso o no de estimulacin aversiva no afecta a la conceptualizacin de
ambos comportamientos, siempre que los componentes del programa apliquen
un procedimiento de reforzamiento. Se han encontrando una mayor
proporcin de elecciones impulsivas.
Cuando el procedimiento usado es de castigo: Se considerara una
respuesta impulsiva la eleccin del castigo con mayor valor (intensidad o
duracin) pero ms demorado, mientras que elegir el castigo ms leve e
inmediato se considerara un comportamiento auto-controlado.
(Mischel y Grusec, 1967). Deluty (1978): conducta de cuatro ratas

expuestas a una situacin de autocontrol que involucraba
procedimientos de castigo. En el primer experimento mantuvo
constante la intensidad de la descarga (0.3 mA) y su duracin (1.0)
para ambas alternativas variando su demora de aparicin: 30-30,
30-40, 40-30, 50-5, 5-50, 20-5, 5-20, 20-10, y 10-20.
No se encontr ajuste a la Ley de Igualacin en ningn caso, los
sujetos siempre eligieron la alternativa ms demorada
(impulsiva). En el segundo experimento, sin embargo, se manipul
la duracin de la descarga (1-1, 1-2, 2-1, 0.5-2, 2-0.5, 0.53, 3-0.5, 2-3, 3-2), los sujetos eligieron de manera
consistente las alternativas con menor duracin de descarga,
adems, se observ una considerable infraigualacin. En el
tercer y ltimo experimento se manipul tanto la demora como la
duracin de la descarga (estudio de autocontrol). La alternativa 1

ofreca siempre 1 de descarga, mientras que la 2 ofreca 2. Los
sujetos fueron expuestos a las siguientes secuencias de duracin de
demora:A. 10-20, 20-30, 5-15, 30-40, 2-12, 40-50.B. 1020, 20-40, 5-10, 30-60.Los resultados mostraron como la
preferencia por la alternativa 1 (1 de descarga) iba aumentando
en funcin del aumento de la demora. Es decir, cunto mayor
era la demora mayor era el nmero de elecciones autocontroladas.

Resumen Tema 7 Tutor

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Resumen Tema 7 Tutor

Загружено:

Авторское право:

Доступные форматы

TEMA 7: CONTROL AVERSIVO EN EL CONDICIONAMIENTO OPERANTE

Vamos a centrarnos en el efecto de la estimulacin aversiva (primaria o

Positivo: La respuesta produce un Reforzamiento o

Positivo: La respuesta produce un Supresin o

Negativo: la respuesta elimina o Reforzamiento o

1.2. Castigo, escape y evitacin

Mediante el reforzamiento negativo aumentamos la probabilidad

1.3. Procedimientos condicionamiento operante y estados emocionales.

Los estmulos elicitadores provocan en los sujetos estados

La estimulacin aversiva producida por la respuesta es mucho ms eficaz

(Schlosberg, 1934; Brogden, Lipman y Culler, 1938) exploraron una

A) Si el sujeto no emite la respuesta requerida para la evitacin

Se barajan tres elementos: la seal de aviso, la respuesta operante y la

Hiptesis de Schoenfeld: el miedo como una variable intermediaria en

2.1.2. Evitacin no discriminada de operante libre de Sidman

Hiptesis Propioceptiva de Sidman (1953): el papel de la seal de

Hiptesis Interoceptivo-temporal Anger (1963). Sera el paso del

Hiptesis de la Seal de Seguridad (Dinsmoor, 2001): los estmulos

2.1.3. La evitacin de descarga aleatoria de Herrnstein-Hineline

La mquina A sera como un registro E-E de Sidman, mientras

2.2. Variables que afectan al reforzamiento negativo

En el procedimiento de evitacin libre de Sidman la tasa de

En la evitacin de descarga aleatoria esta relacin tambin se

+ Skinner (1953): castigo no es un mtodo eficaz para suprimir la

+ Castigo sobre lneas-base defensivas: concurren el castigo y el

Con el uso extendido del castigo, se corre un riesgo

Agresin elicitada: cuando se sita a dos organismos juntos y

3.3. Fenmenos paradjicos en el castigo (efecto diferente al esperado)

* Otro factor para una mayor eficacia del procedimiento es el ajuste

* Saciedad: Con reforzadores primarios (EI), es posible suprimir una

Obtuvo un alto apoyo emprico (Catania, 1963; Stubbs y Pliskoff,

4.1.1. Eleccin y reforzamiento negativo:

El experimento consisti en reforzar con 2 de tiempo fuera y la

Hutton, Gardner y Lewis (1978) entrenaron a tres palomas a responder

Logue y De Villiers (1978): entrenaron a tres ratas para

4.1.2. Eleccin y castigo: los sujetos son capaces de ajustar su eleccin a

relativa se ajusta a la frecuencia relativa de castigo en cada

(Mischel y Grusec, 1967). Deluty (1978): conducta de cuatro ratas

duracin de la descarga (estudio de autocontrol). La alternativa 1

Вам также может понравиться