Вы находитесь на странице: 1из 11

Aprendizaje de Relaciones entre

Conducta y sus Consecuencias:

SEMANA 5





















[ APRENDIZAJE ]

Condicionamiento Operante

5. APRENDIZAJE DE RELACIONES ENTRE CONDUCTA Y SUS


CONSECUENCIAS: CONDICIONAMIENTO OPERANTE

Este tipo de condicionamiento permite analizar las situaciones en las cuales los estmulos a los
que el organismo se enfrenta son producto directo de su conducta, descrita como dirigida a
metas. El condicionamiento operante se centra fundamentalmente en el aprendizaje de las
relaciones que se establecen entre la actividad del sujeto y las consecuencias derivadas del
propio comportamiento; de esta manera, la conducta que sucede debido a que ha sucedido
previamente como instrumento para producir ciertas consecuencias recibe el nombre de
conducta instrumental.
El principio bsico del condicionamiento operante (o aprendizaje instrumental) es que los actos
que son reforzados tienden a repetirse. En este condicionamiento el aprendiz opera
activamente sobre el ambiente. Por lo tanto, el condicionamiento operante se refiere sobre
todo al aprendizaje de respuestas voluntarias. Por ejemplo, alzar la mano en clase para obtener
la atencin del docente es una respuesta operante aprendida, que se refuerza al conseguir la
atencin del maestro.
Objetivos
o Conocer los estudios que sirvieron de punto de partida para la formulacin del
condicionamiento operante y su importancia en la actualidad.
o Comprender la explicacin funcional de un reforzador.
o Conocer los principales procedimientos del condicionamiento operante.
o Diferenciar los conceptos de contigidad y contingencia e identificar el papel que
cumplen en el condicionamiento.
Los estudios de habituacin, sensibilizacin y condicionamiento clsico se vinculan con los
anlisis de los mecanismos de la conducta elicitada. Los experimentos de habituacin,
sensibilizacin y condicionamiento clsico emplean procedimientos donde el organismo no
ejerce control sobre los estmulos a los que se expone.
El condicionamiento clsico se interesa en la conducta involuntaria que de manera poco
variable sigue a un evento en particular, pero la mayor parte de nuestra conducta no es
desencadenada por eventos externos sino que es voluntaria. En otras ocasiones muy similares
las conductas se clasifican como conductas operantes, es decir que son aprendidas y estn


[ POLITCNICO GRANCOLOMBIANO]

diseadas para operar en el ambiente con el objetivo de obtener una recompensa o evitar un
castigo, ya no son reflejos desencadenados por estmulos biolgicamente importantes; a esto se
le denomina condicionamiento operante.
El condicionamiento operante es un proceso que requiere la manipulacin de las consecuencias
de una respuesta, de manera que se incremente o reduzca la probabilidad de dicha respuesta.
La manipulacin de las consecuencias dentro de un proceso de condicionamiento operante
incluye el uso del refuerzo, el cual puede considerarse como cualquier clase de condicin que
satisface. La introduccin o presencia continua del refuerzo va a depender de si es contingente
con la ejecucin de la respuesta deseada por parte del organismo (Wittig, 1984).
Los anlisis tericos y de laboratorio del condicionamiento instrumental inician formalmente
con el trabajo de Thorndike. Su intencin original se centr en estudiar la inteligencia animal,
analiz la cuestin plateada por Darwin sobre las capacidades intelectuales humanas que
estaban presentes en los animales mediante la investigacin emprica. Para llevarlo a cabo
dise una serie de cajas problema, donde introduca un gato hambriento con algo de comida
fuera de la vista del animal. La tarea consista en aprender a salir de la caja para obtener la
comida.
La cuidadosa aproximacin emprica de Thorndike fue un avance significativo de la inteligencia
animal, tambin interpret los resultados de sus estudios como el reflejo del aprendizaje de
una asociacin ER. A medida que la asociacin o conexin entre las claves de la caja y las
respuestas exitosas se hacan ms fuertes, el gato llegaba a realizar la tarea de manera ms
rpida. La consecuencia de la respuesta exitosa fortaleca la asociacin entre estmulos de la
caja y esa respuesta.
Thorndike formul la ley del efecto. Indica que si una respuesta en presencia de un estmulo es
seguida por un suceso satisfactorio, la asociacin ER se fortalece; si es seguida por un suceso
molesto, se debilita. Esta ley implica un aprendizaje ER. Thorndike emple 15 cajas problema
distintas en sus investigaciones que requeran de diferentes manipulaciones para que el gato
lograra salir. Algunos llegaron a ser estndar (Domjan, 2007). La consecuencia molesta permite
fortalecer o debilitar la asociacin, es decir que la ley del efecto de Thorndike implica un
aprendizaje ER.
Procedimientos del condicionamiento operante (Domjan, 2007)
En las diferentes situaciones del condicionamiento operante, el sujeto debe ejecutar una
respuesta que produce una consecuencia. Es as como una consecuencia placentera recibe el
nombre de estmulo apetitivo; una consecuencia molesta, estmulo aversivo. La respuesta


[ APRENDIZAJE ]

instrumental puede proporcionar el estmulo consecuente; en este caso se dice que generan un
efecto llamado contingencia positiva entre la respuesta y su estmulo consecuente. De forma
alterna, la respuesta instrumental puede eliminar un estmulo consecuente, un efecto llamado
contingencia negativa entre la respuesta y su consecuencia.
La contingencia es entonces la relacin entre la respuesta y la consecuencia: a mayor
contingencia mayor efecto de la consecuencia sobre la conducta, ya sea un castigo o un
reforzador. La contingencia en el condicionamiento operante tiene como requisito que un
organismo presente una respuesta apropiada antes de que se entregue el refuerzo, esta
dependencia de la presentacin del refuerzo por la emisin de una respuesta recibe el nombre
de contingencia.
Reforzamiento positivo, constituye un procedimiento donde la respuesta instrumental
aproxima o desencadena un estmulo apetitivo; si se presenta la respuesta, el estmulo apetitivo
se presenta, mientras que si no se da la respuesta el estmulo apetitivo no se presenta y se dara
paso a una contingencia positiva. El reforzamiento positivo genera un incremento en la tasa de
respuesta. Entregar a una rata algo de comida cada vez que presiona la palanca de respuesta,
pero no cuando no presione la palanca.
Castigo. En este procedimiento la respuesta instrumental produce o aproxima al estmulo
aversivo, se presenta una contingencia positiva entre la respuesta instrumental y el estmulo
consecuente; el resultado ser un estmulo aversivo produciendo un decremento en la
respuesta instrumental.
Reforzamiento negativo. Los procedimientos involucran una contingencia negativa entre la
respuesta instrumental y el suceso ambiental. Es un procedimiento en el que la respuesta
instrumental termina o previene la entrega del estmulo aversivo. Se presentan dos
procedimientos del reforzamiento negativo:
1. Escape: El estmulo aversivo se presenta pero puede ser retirado por la respuesta
instrumental. Se puede escapar de un sonido molesto de la radio apagndola. La
presencia del estmulo aversivo establece la ocasin para que se ocurra la respuesta
instrumental que ser reforzada por la terminacin del estmulo aversivo.

2. Evitacin: Es la programacin de un estmulo aversivo para presentarlo en algn
momento futuro. La respuesta instrumental previene la entrega futura del estmulo
aversivo.


[ POLITCNICO GRANCOLOMBIANO]

Tanto en el castigo como en el reforzamiento negativo disminuyen la probabilidad de que


repitamos la conducta, la diferencia est en que el reforzamiento de cualquier tipo fortalece
(refuerza) la conducta; el reforzamiento negativo fortalece la respuesta al quitar algo
desagradable del ambiente, mientras que para el caso del castigo, este agrega algo
desagradable al ambiente, por lo que tiende a debilitar la conducta.
Entrenamiento de omisin. Es un procedimiento que incluye una contingencia negativa entre la
respuesta instrumental y un suceso ambiental. La respuesta instrumental previene la
presentacin del estmulo apetitivo o placentero, es un mtodo empleado para disuadir la
conducta humana, ya que no implica la presentacin del estmulo aversivo. Por ejemplo, decirle
a un nio que se vaya a su habitacin luego de haberse portado mal. El nio no est recibiendo
ningn estmulo aversivo, en su lugar se le estn retirando fuentes de reforzamiento positivo,
como jugar con alguien de la casa o ver televisin.
Por lo tanto, el resultado de un procedimiento ya sea un incremento o decremento de la tasa de
respuesta va a depender de la contingencia respuesta-consecuencia, al igual que para la
naturaleza de la consecuencia.
El siguiente cuadro describe los procedimientos del condicionamiento instrumental, son
procedimientos que se diferencian por el tipo de estmulo (apetitivo o aversivo) que son
controlados por la respuesta instrumental, y si la respuesta produce o elimina el estmulo.


[ APRENDIZAJE ]

Imagen tomada de humanidadyciencia.blogspot.com

Elementos del condicionamiento instrumental


La naturaleza de la conducta instrumental es que se encuentra controlada por sus
consecuencias. El condicionamiento instrumental est integrado por tres elementos claves: una
respuesta, una consecuencia y una relacin o contingencia, entre la respuesta y la consecuencia.
La respuesta instrumental: El resultado de los procesos del condicionamiento clsico son
dependientes en parte de la naturaleza de la respuesta que se est condicionando. Unas
respuestas pueden ser condicionadas ms fcilmente que otras.
Variabilidad conductual versus estereotipia: Thorndike y Skinner sealaron que el
reforzamiento incrementa la probabilidad de que la respuesta se repita en el futuro; fue as
como se alent la creencia de que los procedimientos de condicionamiento instrumental
generaban repeticiones de la misma respuesta, que producan uniformidad o estereotipia en la
conducta, teniendo en cuenta que eso no significa que el condicionamiento instrumental no
pueda verse tambin involucrado en la produccin de respuestas creativas o variables. Los
organismos pueden aprender a obtener refuerzo en situaciones donde deben hacer algo nuevo.
La variacin de la respuesta va a ser la base para el condicionamiento instrumental.
Relevancia o pertinencia: en el condicionamiento instrumental, Thorndike propuso el trmino
pertinencia, con el objetivo de explicar los fallos en el entrenamiento del bostezo y rascado.
Ciertas respuestas se corresponden de forma natural con el reforzador debido a la historia
evolutiva del animal.
Otros procedimientos
Procedimiento de ensayo discreto, el sujeto puede realizar la respuesta instrumental solo
durante perodos especficos determinados por el desplazamiento del sujeto dentro de una
cmara experimental o por la presentacin del estmulo.
La tasa de respuesta como medida de la conducta operante: Las medidas de latencia de la
respuesta y de la velocidad que se emplea normalmente en procedimientos de ensayo discreto
no permiten que se repita la respuesta. Skinner propuso que la tasa de ocurrencia de una
conducta operante (por ejemplo, frecuencia por minuto) se emplean como medida de la
probabilidad de respuesta.
Procedimientos de operante libre: permite la ejecucin repetida de la respuesta instrumental
una y otra vez sin restricciones. Para estudiar dicho procedimiento se utiliz la caja de Skinner,
que consista en una pequea cmara que contiene una palanca y un mecanismo que


[ POLITCNICO GRANCOLOMBIANO]

proporciona un reforzador. Una respuesta oponente (presionar la palanca, abrir la puerta), se


define como el efecto que produce en el ambiente cualquier secuencia de movimientos, es decir
que presione la palanca hasta abajo o abra la puerta.
Entrenamiento y moldeamiento: en este proceso hay pasos preliminares para establecer la
conducta de presin de la palanca. En primer lugar, los animales deben aprender cundo est
disponible la comida en el comedero. Esto comprende un condicionamiento clsico. Despus de
varios emparejamientos del sonido del dispensador con la entrega de la comida, la comida llega
a elicitar una respuesta de seguimiento de signo: el animal se dirige al comedero y recoge la
bolita de comida. Esta fase recibe el nombre de entrenamiento al comedero.
Posteriormente el organismo est preparado para aprender la respuesta instrumental requerida.
Si la respuesta no es algo que el animal ya realiza, nunca suceder por s misma. Para favorecer
la adquisicin de una nueva respuesta operante, inicialmente, la comida se entrega si el animal
realiza cualquier cosa remotamente relacionada con la respuesta deseada. Cuando la respuesta
de alzamiento de la palanca se ha establecido, la comida se entrega solo si la rata realiza la
respuesta de alzamiento sobre la palanca de respuesta. Una vez el alzamiento de la palanca ha
sido establecido, la bolita de comida puede entregarse si realmente la rata presiona la palanca.
En conclusin es el moldeamiento sucesivo de respuestas hasta llegar a la respuesta deseada.
Esta secuencia de pasos se denomina moldeamiento, que incluye el reforzamiento de
aproximaciones sucesivas.
Moldeamiento y nueva conducta: construccin o sntesis de una nueva unidad conductual a
partir de componentes de respuesta preexistentes que ya se encuentran en el repertorio del
sujeto. El moldeamiento aprovecha la variabilidad inherente de la conducta. Sin esta
variabilidad, los procedimientos de moldeamiento no tendrn xito, el moldeamiento puede
generar nuevas formas de respuesta nunca antes realizadas por el organismo.
Extincin: el EC se presenta de manera repetida, sin presencia del EI, si el organismo est
condicionado para que se aproxime a un EC para alimentarse; las presentaciones repetidas del
EC sin alimento generaran una prdida de la respuesta condicionada de aproximacin.
La desaparicin de la RC se lleva a cabo mediante la extincin. La prdida de la conducta no
ocurre a causa del olvido, se desencadena una extincin por las presentaciones repetidas del EC,
mientras que el olvido slo podra reducir la fuerza de la RC originada por el paso del tiempo.
El fenmeno de la extincin forma parte de la definicin de aprendizaje, debido a que implica
un cambio en la conducta (perdida de responsividad), producto de la experiencia
(presentaciones repetidas). Un estmulo extinto no inhibe las respuestas condicionadas que se


[ APRENDIZAJE ]

producen por un estmulo condicionado efectivo en una prueba de sumacin; los


procedimientos de extincin se enfocan en la supresin de la conducta con la ayuda de
diferentes mecanismos de la inhibicin condicionada.
Sistemas de conducta del condicionamiento
El reforzador instrumental: Diferentes aspectos del reforzador indican los efectos sobre el
aprendizaje y la ejecucin de la conducta instrumental.
a) Cantidad y naturaleza del reforzador: En un estudio sistemtico, Hutt (1954, intent
separar los efectos de la cantidad y naturaleza del reforzador alimenticio lquido
mediante la variacin sistemtica de ambos rasgos. Los incrementos en la calidad y
cantidad desencadenaban mayor tasa de respuestas.
b) Cambios en la naturaleza y cantidad del reforzador: Se seala la posibilidad de que la
efectividad de un reforzador dependa no solo de sus propiedades sino tambin de cmo
el reforzador se compara con otros que el individuo haya experimentado. La eficacia de
un EI en el condicionamiento clsico depende de cmo se compara el EI con las
expectativas del individuo teniendo en cuenta la experiencia previa. Si el EI es mayor de
lo esperado, desencadena un condicionamiento excitatorio, si el EI es menor produce un
condicionamiento inhibitorio; de esta manera, en el condicionamiento operante se
identifican los efectos de una cantidad o tipo de reforzador y su relacin con la
naturaleza de los reforzadores que el individuo ha experimentado previamente.
La relacin respuestareforzador: En ocasiones se produce una estrecha relacin entre la
conducta y sus consecuencias (por ejemplo, introducir dinero en una mquina dispensadora
para obtener un alimento), en otras, por el contrario no hay una relacin entre la conducta y la
consecuencia (llevar una camiseta roja al examen y obtener una buena nota); la nota no guarda
relacin con la camiseta roja, algo que tambin se puede dar de manera probabilstica.
Se presentan dos formas de relacin entre la respuesta y un reforzador:
1. Relacin temporal: Hace referencia al tiempo que transcurre entre la respuesta y el
reforzador. Un tipo de contigidad temporal, se refiere a la entrega del reforzador
inmediatamente despus de la respuesta.
2. Relacin causal o contingencia respuestareforzador: Indica que la respuesta
instrumental es necesaria y suficiente para la ocurrencia del reforzador. Los factores
temporales y causales son independientes entre ellos.


[ POLITCNICO GRANCOLOMBIANO]

Dentro de los efectos de la contigidad temporal, el reforzamiento inmediato prima sobre el


reforzamiento demorado, ya que los psiclogos del aprendizaje han sealado que el
condicionamiento instrumental debe proporcionar el reforzador inmediatamente despus de la
ocurrencia de la respuesta instrumental.
La contingencia respuestareforzador: Los estudios de demora del reforzador dejan ver que
no es suficiente una relacin causal perfecta entre la respuesta y el reforzador para
desencadenar una respuesta instrumental fuerte. El condicionamiento no se lleva a cabo si el
reforzamiento se demora demasiado tiempo.
Skinner, en uno de sus experimentos con palomas, gener un debate acerca del papel de la
contigidad frente a la contingencia en el aprendizaje instrumental. l situ una paloma en una
cmara experimental independiente y mont el equipo para entregar en 15 segundos una
unidad determinada de comida, independiente de lo que estuvieron haciendo las palomas. Las
aves parecen estar respondiendo como si la conducta controlara la entrega del reforzador; a
este evento Skinner lo denomin conducta supersticiosa (conducta que se incrementa en
frecuencia debido a emparejamientos accidentales de la entrega de un reforzador con
ocurrencias de la conducta).
El comportamiento supersticioso en ciertas circunstancias indica que el refuerzo seguir
despus de una determinada respuesta, aunque no haya relacin de contingencia entre la
respuesta y el refuerzo. Esta respuesta se llama refuerzo no contingente y puede dar como
resultado el establecimiento del comportamiento supersticioso. Es decir que el sujeto considera
que al hacer determinada respuesta obtiene un refuerzo.
La conducta supersticiosa se apoya en la idea del reforzamiento accidental, donde la entrega de
un reforzador coincide con una respuesta particular aun si esta respuesta no es responsable de
la presentacin del reforzador. Tambin recibe el nombre de reforzamiento adventicio.

Efectos de la controlabilidad de los reforzadores
Una contingencia fuerte entre una respuesta instrumental y un reforzador, esencialmente
significa que la respuesta controla el reforzador. Con una contingencia fuerte, que el reforzador
suceda depende de si ha ocurrido la respuesta instrumental. El hallazgo ms importante fue que
la exposicin a una descarga incontrolable dificultaba el aprendizaje posterior. Este fenmeno
fue denominado efecto de indefensin aprendida.


[ APRENDIZAJE ]


Indefensin aprendida
Qu sucede si un animal experimenta la exposicin aleatoria a estmulos dolorosos o aversivos
sobre los que no tiene control? Se puede ver en un experimento clsico realizado en dos partes
por Selogman y Maier (1967). (Ver imagen)


Imagen tomada cwx.prenhall.com


Los perros que previamente pudieron evitar las descargas aprendieron con rapidez a evitarlas
saltando una valla al encenderse una luz de advertencia. Otros perros, que no haban podido
evitar la serie original de descargas, no aprendieron a saltar la valla en respuesta a la luz (Morris
y Maisto, 2009, p.207). Esta capacidad para evitar o escapar de estmulos desagradables o
aversivos, que ocurre como producto de la exposicin previa a estmulos dolorosos inevitables
recibe el nombre de desamparo aprendido.
De esta manera, si un organismo ha sido expuesto a un estmulo aversivo incontrolable, la
ejecucin posterior, en circunstancias donde en algunas ocasiones se puede generar control,
revela inhabilidad de parte del organismo para aprender o ejecutar la respuesta control.

10


[ POLITCNICO GRANCOLOMBIANO]


Contigidad y contingencia
Los organismos son sensibles a la contigidad tanto como a la contingencia entre una respuesta
instrumental y un reforzador. Generalmente ambos aspectos de la relacin entre la respuesta y
el reforzador actan en conjunto para producir el aprendizaje.
Los dos factores permiten entender los efectos del reforzamiento en la respuesta instrumental.
La relacin causal (contingencia), indica que el reforzador es entregado solo despus de la
ocurrencia de la respuesta instrumental especificada. Controla la relacin de contigidad para
que otras actividades no interfieran entre la respuesta especificada y el reforzador, y as
intervenir en el condicionamiento de la respuesta crtica.

BIBLIOGRAFA
Domjan, M. (2007). Principios de aprendizaje y conducta. Madrid: Thomson
Morris, CH; Maisto, A. (2009). Psicologa. Mxico: Prentice Hall
Wittig, A (1984). Teora y problemas de psicologa del aprendizaje. Mxico: Mc Graw Hill.









[ APRENDIZAJE ]

11

Вам также может понравиться