Вы находитесь на странице: 1из 7

1

TEMA 15. PRINCIPIOS DEL CONDICIONAMIENTO INSTRUMENTAL.


Los estudios sobre habituacin, sensibilizacin y CClsico se refieren a los mecanismos
por los cuales los estmulos elicitan respuestas y, por tanto, el animal no tiene control sobre
su conducta. Ahora estudiaremos las circunstancias que son el resultado de la conducta.
C.Instrumental: Respuestas que sirven como instrumento para producir
consecuencias.
o Gobernada principalmente por los hechos que produce = dirigida a una meta.
o Supone una gran proporcin de toda la conducta animal y humana.
o Es voluntaria, emitida ms que elicitada (Skinner, 1953).
Inicio con el trabajo de Thordinke intentando estudiar la inteligencia animal (1898) con
las cajas problema donde un animal deba aprender a escapar de la caja para conseguir la
comida que estaba fuera. Interpret que los resultados de sus estudios reflejaban el
aprendizaje de una asociacin.
De toda la variedad de Rs, eventualmente alguna de esas Rs producan la apertura de la
caja = asociacin entre los Es del interior de la caja y las Rs de escape. Las consecuencias de
las respuestas con xito (escapar) fortalecan la asociacin. As, formul la LEY DEL EFECTO:
si una respuesta ejecutada en respuesta de un estmulo tiene consecuencias satisfactorias, la
asociacin E-R se fortalece. Si la R va seguida de un hecho molesto, la asociacin E-R se
debilita.

ENFOQUES MODERNOS
Algunos procedimientos son similares a los de Thordinke: ensayos discretos= solamente
pueden realizar la conducta instrumental 1 vez en cada colocacin en el aparato.
Operante libre= puede realizar la conducta instrumental libremente (repetidamente) en la
cmara experimental.

MTODOS DE ENSAYOS DISCRETOS


Uso del laberinto (finales s.XX, Small, psiclogo americano): ley un artculo en la revista
scientific american que hablaba de las madrigueras que construan las ratas y empez a
usar labertintos con ratas (corredor).

Tiempo del recorrido: tiempo que tarda en recorrer el laberinto y alcanzar la caja meta.
Velocidad del recorrido: dividir longitud de recorrido entre tiempo de recorrido.
Latencia de tiempo de carrera: tiempo que tarda en abandonar la caja de salida y empezar
a moverse por el corredor. Las latencias se acortan conforme progresa el entrenamiento.

*Laberinto en T: tiene 2 cajas meta y se usa para estudiar las conductas de eleccin
instrumental. Si ninguna de las 2 alternativas es apetitosa puede tener latencia larga.

MTODOS DE OPERANTE LIBRE (Skinner, 1938)


Skinner propuso el concepto de operante como forma de dividir la conducta en unidades
significativas y medibles. Anlisis de laboratorio de una forma de conducta que fuera

representativa de toda la actividad que produce continuamente de forma natural. CAJA DE


SKINNER: cuando presiona la palanca cae una bola de comida.
1) Fase preliminar: entrenamiento al comedero: se ensea el momento en que la comida
est disponible en el cuenco. Emparejamiento del sonido del aparato con el suministro de
la bolita de comida. As, el sonido de caer la bolita en el cuenco hace de EC.
2) Moldeamiento por aproximaciones sucesivas: al principio se le refuerza por acercarse
a la palanca, despus por olerla, despus por tocarla, etc.
Ventajas operante libre:
Permiten una observacin continua de la conducta a lo largo del tiempo.
Las medidas de latencia y velocidad de respuesta proporcionan informacin sobre la
probabilidad de repeticin de respuesta (cosa que no ocurre con los ensayos discretos). Si
la tasa de respuesta es alta, la probabilidad de respuesta es alta.
Skinner ide un instrumento de registro de datos: registrador acumulativo = tambor
rotatorio que saca el papel del registrador de manera constante. Si no se dan conductas, el
lpiz no se mueve y marca lnea horizontal. Proporciona una informacin visual completa
de cundo y con qu frecuencia responde el animal.
Lnea base del operante libre: tasa inicial de respuestas, antes de que se produzca una
manipulacin experimental. Ej.: alta tasa de respuestas de oler y baja tasa de respuestas
de presionar la palanca. Se usa para valorar los cambios despus del condicionamiento
(por ejemplo, el moldeamiento por aproximaciones sucesivas para presionar la palanca).

PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL


REFORZAMIENTO POSITIVO O ENTRENAMIENTO DE RECOMPENSA
CONTINGENCIA POSITIVA ENTRE RESPUESTA INSTRUMENTAL Y CONSECUENCIA APETITIVA =
aumento de la tasa de respuesta.
Si emite la R, hay consecuencia apetitiva.
Si no emite la R, no hay consecuencia apetitiva.
CASTIGO POSITIVO
CONTINGENCIA POSITIVA ENTRE RESPUESTA INSTRUMENTAL Y CONSECUENCIA AVERSIVA =
disminucin de la tasa de respuesta.
Si emite la R, hay consecuencia aversiva.
Si no emite la R, no hay consecuencia aversiva.
REFORZAMIENTO NEGATIVO: ESCAPE/EVITACION
CONTINGENCIA NEGATIVA ENTRE LA RESPUESTA INSTRUMENTAL Y CONSECUENCIA AVERSIVA
= aumento en la tasa de respuesta.
La R impide la presentacin de una consecuencia aversiva que aparece
frecuentemente (E aversivo + contingencia negativa).
Existen 2 tipos de Reforzamiento negativo:
ESCAPE: el estmulo aversivo es presentado continuamente pero puede ser interrumpido
por la presentacin de la respuesta instrumental.

Ej: los prisioneros pueden escapar de la crcel fugndose, podemos escapar del ruido
desagradable de una cancin desenchufando la radio, etc.
EVITACION: el estmulo aversivo se programa para ser presentado en el futuro y la
respuesta instrumental impide la presentacin del mismo. Prevenir algo malo.
CASTIGO, ENTRENAMIENTO DE OMISION O REFORZAMIENTO DE OTRAS CONDUCTAS
CONTINGENCIA NEGATIVA ENTRE LA RESPUESTA INSTRUMENTAL Y CONSECUENCIA APETITIVA.
La R impide la presentacin de una consecuencia apetitiva que aparece frecuentemente
(Consecuencia positiva + contingencia negativa).

Si da la R instrumental, no se da la consecuencia apetitiva.


Si no da la R instrumental, se da la consecuencia apetitiva.

EJ.: retirada del carnet de conducir, mandar a un nio a su habitacin


A veces tambin se llama REFORZAMIENTO DIFERENCIAL DE OTRA CONDUCTA (RDO): recibe
la consecuencia positiva siempre que la conducta que realice sea otra respuesta que la
especificada en el procedimiento. Consiste en el reforzamiento de otra conducta.
Tanto el reforzamiento positivo como el negativo suponen un fortalecimiento de la
conducta
Tanto el castigo como el reforzamiento negativo usan consecuencias aversivas pero
cambia la contingencia.

ELEMENTOS FUNDAMENTALES DEL C.INSTRUMENTAL.


-

RESPUESTA INSTRUMENTAL.
- REFORZADOR.
CONTINGENCIA (RELACION RESPUESTA-REFORZADOR).

RESPUESTA INSTRUMENTAL
-

Ensayos discretos.
Operante libre (mediante aproximaciones sucesivas).
Limitaciones de la R instrumental:

Pertinencia (Thordinke): ciertas Rs tienen una relacin natural con ciertos


reforzamientos a causa de la historia evolutiva del sujeto. Es importante considerar la
tendencia de respuestas del sujeto de forma natural a la hora de disear los procesos de
condicionamiento.
Ej.: tirar de una cuerda tiene relacin natural con liberarse de un encierro en la cajaproblema / rascarse o bostezar no tienen esa relacin natural con la liberacin de la cajaproblema, por lo que no persistieron como respuestas intensas cuando fueron reforzadas.
Ej.: Shinicky Suzuki, violinista japons ensea sin aprender msica en partituras porque
ninguna de esas tareas se aproxima a las tendencias naturales de respuesta de los nios.
Los nios encuentran mucho ms fcil asociar el sonido de una nota con una posicin
concreta de los dedos en el violn.

Compar esta caracterstica de aprendizaje con la forma en que los nios aprenden el
lenguaje de forma natural, primero aprenden el significado de las palabras por el odo
(no por la lectura).
Empiezan escuchando grabaciones y tienen que imitar el sonido colocando el arco
sobre el violn hasta imitar el mismo sonido.
Mtodo muy famoso en todo el mundo.

Presencia de una Estimulacion de apoyo a la respuesta instrumental: no se puede


subir una escalera sin escalera, no se puede abrazar sin nadie a quien abrazar, no se
puede rascar sin picor (solucin: estimulacin cutnea que provoque picor).

Nivel operante: tasa de aparicin de una respuesta antes de que se introduzca el


condicionamiento instrumental. Si la respuesta tiene un nivel operante bajo, es difcil
poder reforzarla porque aparece poco y, as, la baja frecuencia de reforzamiento puede ser
la responsable de la falta de aumento de la conducta.

Intrusin de respuestas incompatibles, clsicamente condicionadas, en el


transcurso del C.Instrumental. Interaccin C.Clsico y C.Instrumental.
Ej.: cuando se refuerza a los animales con comida por recoger una moneda o introducirla
por una ranura, stos experimental algo ms que el emparejamiento de respuestas
instrumentales concretas con el reforzamiento de la comida. En este caso, las monedas
tambin se estn emparejando con el reforzamiento de comida y esto origina C.Clsico de
los estmulos de las monedas. Una vez que la moneda se condiciona a la comida, llega a
provocar RC relacionadas con la comida de agarrar y manipular el objeto seal de comida.
La respuesta instrumental de depositar la moneda en la ranura se desbarata con la
aparicin de RC clsicamente condicionadas.

REFORZADOR: Cantidad y calidad del reforzador: C.Instrumental aumenta conforme


aumenta la cantidad y calidad del reforzador o castigador.
CRESPI (1942), CONTRASTE CONDUCTUAL SUCESIVO: POSITIVO Y NEGATIVO
Contraste conductual sucesivo positivo (elacin): elevada respuesta por una recompensa
favorable resultado de una consecuencia anterior con una consecuencia menos atractiva.
Los sujetos responden ms a un premio favorable si previamente han recibido un premio
menos favorable que si no han tenido esta experiencia. Alegra de un premio pequeo a un
premio grande = facilita el C. Instrumental.
Contraste conductual sucesivo negativo (depresion): respuesta disminuida por una
recompensa desfavorable debido a una experiencia anterior con una recompensa mejor.
Los sujetos responden menos a un premio desfavorable si han recibido previamente un
mejor premio que si no han tenido esta experiencia anterior. El premio desfavorable
parece especialmente malo al compararlo con el premio mejor = frustracin explicada con
la teora de la frustracin de Abram Ansel: la frustracin se produce cuando recibe un
premio peor al que esperaba.
- Frustracin primaria: encuentro con menos cantidad o calidad de premio que el
esperado. Se considera un EI que provoca respuestas innatas que lleva a evitar la caja
de meta y a disminuir la carrera.
*Si siempre reciben premios pequeos, nunca se les cambia a premio grande, no hay
frustracin.

Contraste conductual simultneo: tambin se producen efectos de contraste si se


producen cambios frecuentes entre una condicin favorable y una desfavorable. En cada
condicin, la recompensa se asocia a cada Ediscriminativo.

CONTINGENCIA

Contigidad temporal:
Mejor aprendizaje cuando no hay demora en el reforzamiento.
TCNICAS QUE FACILITAN EL APRENDIZAJE CON REFORZAMIENTO DEMORADO:
REFORZADOR 2 O CONDICIONADO: un EC que ha sido previamente asociado con el
reforzador.
PROCEDIMIENTO DE MARCADO (LIEBERMAN): marcar la R instrumental para hacerla
distinguible de otras actividades.

Contingencia R Instrumental-Reforzador (Er): relacin predictiva R instrumental


y reforzador.
Contingencia positiva perfecta: se entrega el reforzador despus de cada aparicin de
la RInstrumental pero nunca se entrega en ausencia de R: P (Er+ / R) = 1.0 y P (Er+ /
no R) = 0.
Contingencia negativa: el reforzador tiene ms probabilidades de darse cuando no hay
R instrumental: P (Er+ / noR) > P (Er+ / R).
Contingencia 0: el reforzador tiene la misma probabilidad de aparecer con R
instrumental que sin R instrumental: P (Er+ / R) = P (Er+ / no R).
Los estudios sobre demora en el reforzamiento muestran una contingencia perfecta
ER+-R. el retraso en la aparicin del reforzador despus de la R no cambiaba el hecho de
que el reforzamiento dependiera totalmente de la ejecucin previa de la R. pero aun
dependiendo totalmente del reforzamiento de R anteriores, resulta habitual que el
condicionamiento no se d si el reforzamiento se retrasa demasiado. Quiere esto decir
que la contingencia no es importante?
Skinner fue el primero en investigar si el condicionamiento es posible en ausencia de
una contingencia positiva Er+-R. coloco a palomas en cmaras experimentales separadas
y le suministraba comida cada 15 seg. Independientemente de sus respuestas. A Skinner
le pareca que las palomas respondan como si su conducta estuviera controlada por la
entrega del reforzador cuando en realidad los premios se entregaban independientemente
de su conducta. Lo denomin conducta supersticiosa, basndose en la idea de
condicionamiento accidental o adventicio. Los animales siempre estn haciendo algo
aunque no se les pida ninguna respuesta. Cualquier R que d antes de la entrega de un
reforzador, se fortalece = emparejamiento accidental = demostr que la contingencia
positiva no es necesaria para el C.Instrumental.

Esta idea de Skinner est cuestionada porque la entrega de comida era cada 15 seg.,
por lo que era predecible = provocada por la predictibilidad, no por el condicionamiento
adventicio.

Estudios sobre la capacidad de control sobre los reforzadores


Una contingencia fuerte Er+/R significa que la R controla el Er+.
Seligman, Overmier y Maier (1967) sobre indefensin aprendida: la exposicin a una
descarga incontrolable altera el posterior aprendizaje.
Fase 1:
Grupo restringido: no estresado, no recibe descarga elctrica.
Grupo escape: descarga elctrica de las que puede escapar presionando un panel.
Grupo acoplado: descarga incontrolable, no pueden escapar de ella.
Fase 2: entrenamiento escape/evitacin en una nueva caja-lanzadera. Las descargas se
presentan peridicamente precedidas de una seal. Los animales pueden evitar la descarga
saltando por una barra. Peores resultados en el grupo C (descarga incontrolable en fase 1).
-

Grupo restringido = aprendizaje de evitacin rpido.


Grupo escape = aprendizaje de evitacin rpido.
Grupo acoplado = aprendizaje de evitacin lento.

Seligman y sus colaboradores explicaron estos resultados basndose en la contingencia


Er+/R. durante la exposicin a descargas incontrolables, los animales aprenden que las
descargas son independientes de la conducta y que no hay nada que ellos puedan hacer para
controlar las descargas (expectativa adquirida de contingencia = 0). En ensayos posteriores
de condicionamiento instrumental, esta expectativa interfiere con el aprendizaje de que la
conducta puede controlar las presentaciones de un reforzador. Los animales tienen que hacer
2 cosas:
-

Abandonar su expectativa de falta de control sobre los reforzadores.


Aprender que ahora se requiere una respuesta concreta para obtener reforzamiento.

HIPTESIS DE LA INDEFENSION APRENDIDA: los animales aprenden que las descargas son
independientes de su conducta y generan expectativas de ausencia de control futuro, lo
que debilita su habilidad para aprender una nueva R instrumental.
Otras hiptesis:
DFICIT DE ACTIVIDAD: los animales aprenden a ser inactivos durante la descarga en la fase
de exposicin.

DFICIT ATENCIONAL: la descarga inescapable provoca que presten menos atencin a sus
acciones por lo que tendrn mayor dificultad para asociar sus acciones con los reforzadores
en el escape-evitacion.

Вам также может понравиться