Вы находитесь на странице: 1из 4

CONCEPTOS CLAVE TEMA 5

Reforzamiento continuo: te doy el premio cada vez que ejecutas la respuesta. Es menos resistente a la extincin por
el efecto de sobreentrenamiento: como te dan el reforzador cada vez, te das cuenta enseguida cuando empieza la
extincin porque dejan de drtelo.

Reforzamiento parcial o intermitente: no se da el permio en todas las respuestas. puede ser:

PROGRAMAS DE RAZON: el reforzador se da despues de un determinado nmero de respuestas. Cuanto antes


cumplas con el requisito de razn que te piden, antes consigues el premio.

Razon fija RF: siempre es el mismo nmero de Razon variable RV: el nmero que te piden vara en
respuestas torno a un promedio

PROGRAMAS DE INTERVALO: el reforzador se da en la primera respuesta que hay despues de un intervalo de


tiempo determinado. Antes de ese tiempo, el sujeto puede responder si quiere, pero el premio an no est
disponible asi que no consigue nada

Intervalo fijo IF: siempre es el mismo tiempo el que Intervalo variable IV: el tiempo que pasa vara en torno
tiene que pasar a un promedio.
Los programas parciales son los ms resistentes a la extincin, sigues haciendo las respuestas ms tiempo, por si en
la siguiente te toca el premio. (como en las tragaperras)
Ejecucin tpica en los programas parciales:

RV: tasas de respuesta altas y estables. En los programas VARIABLES las tasas de respuesta son
IV: tasas de respuesta estables, aunque ms bajas que muy estables, como cada vez te piden un requisito
en RV diferente, mantienes un ritmo constante.

RF: pausa postreforzamiento, y despus un aumento Los programas fijos se caracterizan por una pausa
alto y estable de las respuestas (carrera de razn)postreforzamiento: el animal para justo despues de
conseguir el premio. Cuanto mayor es el requisito que
IF: pausa postreforzamiento y despues un aumento
piden, mayor es la pausa. Adems viene determinada
progresivo de la tasa de respuesta segn avanza el
por el programa que vs a empezar, no por el que has
tiempo (festoneado)
terminado (es como si descansas para prepararte)

Siempre hay ms respuestas en programas de razn que de intervalo.


Eso pasa porque en los programas de razn la tasa de reforzamiento (los premios que consigues) depende
de tu tasa de respuesta (del n de respuestas que das)
Si el requisito de la razn es muy alto, puede que al bicho no le compense contestar. Si te pido trabajar
mucho y te pago todo, pues no contestas. Entonces hay que bajar el requisito o subir el premio. A esto se le
llama tensin de la razn.
En programas de intervalo, el tiempo comienza a contar para el siguiente desde el momento en que
consigues el reforzador
En los programas de intervalo, la tasa de respuesta no influye directamente en la tasa de reforzamiento. Por
muchas respuestas que tu des, hasta que no pase el tiempo que te marcan no hay premio.

TER es el tiempo entre respuestas. Puede ser largo, si las doy separadas, o corto si las doy seguidas.
Si quiero que tu des pocas respuestas puedo marcarte un tiempo determiando y reforzar solo las respuestas que
estn por encima de ese limte, as consigo que las separes. A esto se le llama reforzamiento tasas bajas (RDB)
En cambio si quiero que des muchas respuestas, marco el tiempo y refuerzo solo las respuestas que se den antes de
ese limite, asi consigo que lo hagas seguido. Se llama reforzamiento tasas altas (RDA).
TER LARGO = RDB = pocas repuestas = relacionado con programas IV
TER CORTO = RDA = muchas respuestas = relacionado con programas de razn (sobre todo RV)
PROGRAMAS COMPUESTOS: pueden ser secuenciales o simultneos.

PROGRAMAS SECUENCIALES: primero uno, luego otro


MIXTO: dos o ms programas bsicos que se alternan, al azar, cada cierto tiempo que fijamos de antemano. Es
independiente de la conducta del sujeto: si termina en ese tiempo los programas conseguir premio, si no los
termina pues no consigue. Sea como sea, cuando llega el tiempo determinado el programa cambio.
MULTIPLE: es exactamente igual que el mixto, pero con un Ed (estimulo discriminativo) que anuncia el cambio de
programa. Habitualmente es una luz que se enciende y mantiene encendida en el 2 programa.
(el mixto y el mltiple tambin se llaman programas alternantes)
TNDEM: Aqu los programas siempre llevan el mismo orden, para empezar el 2 el sujeto tiene que terminar el 1.
Es como un juego de pantallas, acabar la primera te da la opcin de la segunda y asi todos los que sean. El
reforzador se consigue cuando se cumplen todos los programas, sean los que sean.
ENCADENADO: igual que el tandem pero con un Ed que anuncia el cambio de programa.

Esquema secuenciales SIN ED CON ED


ALTERNANTES MIXTO MULTIPLE
SECUENCIALES TANDEM ENCADENADO

PROGRAMAS SIMULTNEOS: a la vez


Programas concurrentes: tienen dos programas de reforzamiento a la vez funcionando en dos palancas, se puede
cambiar de uno a otro sin problema. El sujeto es el que elige cmo repartir las respuestas (se explica con conductas
de eleccin como la ley de igualacin
Programas combinados: aqu hay un programa de razn y otro de intervalo, pueden funcionar de 3 formas:
Programa alternativo: se refuerza cada vez que se cumple con un programa o con el otro.
Programa conjuntivo: se refuerza cada vez que se cumple con ambos programas, da igual lo que tardes. Si
acabas uno primero, tienes que cumplir tambin con el otro para conseguir el premio.
Programa entrelazado: un programa viene determinado por otro tienes que acabar la razn en un tiempo
determinado por ejemplo, 20 respuestas en 30 segundos.

CONDUCTA DE ELECCIN
LEY DE IGUALACIN
(ATENCIN: estos con conceptos clave para recordad a la hora de resolver las preguntas. Si no has estudiado la ley
de igualacin, lo ms probable es que todo esto te suene a chino. Aqu no hay explicaciones, pero hay otro pdf
maravilloso que explica todo esto. Cuando ya se ha estudiado esto son solo cosillas trampa que recordar)
La ley de igualacin dice que se iguala la tasa relativa de respuestas (es decir, el porcentaje de respuestas que das)
en funcin de la tasa relativa de reforzamiento (es decir, el porcentaje de reforzadores que te da cada una) de cada
palanca. Si una palanca te da el 070 (70%) del premio, quiere decir que la otra te da el 030 (30%). Segn la ley de
igualacin, a la primera palanca le responder un 070 y a la segunda un 030

En programas de razon, solo nos quedamos con la palanca ms beneficiosa. La tasa de respuestas sera 1 (el 100%)
en esa, y 0 en la perjudicial.
En programas de intervalo es realmente dnde repartimos las respuestas. Si no nos dan la tasa de reforzamiento:
Si los intervalos son uno el triple del otro (30-90; 20-60; 5-15 etc.) las tasas son 075 (el ms beneficioso) y 025.
Como el beneficioso me da el triple de reforzadores, se espera que le de el triple de respuestas que al otro.
Si los intervalos son uno el doble del otro (30-60;10-20; 5-10 etc.) las tasas son 066 (el ms beneficioso) y 033.
Como el beneficioso me da el doble de reforzadores, se espera que le de el doble de respuestas que al otro.
Estos ejemplos, dnde las tasas de respuesta son iguales que las de reforzamiento, son de igualacin
Se puede dar sobreigualacin si se responde ms tasa de respuesta que de reforamiento en la beneficiosa.
Se puede dar infraigualacin si se responde menos tasa de respuesta que de reforamiento en la beneficiosa.
TRAMPA: en los datos del enunciado, pueden darnos la menos beneficiosa!!! Cuidado!!!!
Ejemplo:

Palanca A: IV30 Palanca B: IV90


Tasas de reforzamiento 075 025

Tasas de respuesta si hay IGUALACIN 075 025

Tasas de respuesta si hay SOBREIGUALACIN 0,85 0,15

Tasas de respuesta si hay INFRAIGUALACIN 0,60 0,40

Dar ms respuestas a una palanca es necesariamente dar menos a otra, para saber cmo se llama lo que pasa
igualmente solo nos tenemos que fijar en la beneficiosa.
El trmino igualacin temporal se refiere a lo mismo, pero con el concepto de que igualas el tiempo que pasas en
una de las opciones a los premios que consigues de ellas. Funciona igual, cunta ms tasa de reforzamiento ms
tiempo dedicaras.

IMPULSIVIDAD Y AUTOCONTROL:
El comportamiento impulsivo es la preferencia por la eleccin del premio pequeo y inmediato. Es el
comportamiento tpico en elecciones directas.
El comportamiento autocontrolado es la preferencia por la eleccin del premio grande y demorado. Es tipico en
elecciones de programas encadenados, dnde para conseguir ambos premios hay que esperar un poco. ya que voy
a esperar, al menos es por el premio grande
El valor del reforzador, viene determinado tanto por su magnitud como por su demora. Si aumenta la magnitud
aumenta su valor; pero si aumenta la demora disminuye su valor.
En un caso de programa concurrente en el que lo beneficioso es en principio una eleccin impulsiva, el aadir una
demora constante a la entrega de ambos reforzadores, hace que el comportamiento impulsivo se vuelva
autocontrolado.
NATURALEZA DE ASOCIACIN INSTRUMENTAL:
HULL Y THORNDIKE: son defensores del esquema E-R, en el que el estmulo ambiental elicita la respuesta.
Hull introduce el concepto de motivacin, imprescindible para que se ejecute una conducta. La motivacin viene
dada por una necesidad biolgica, y dicha necesidad se ver reducida al conseguir el reforzador
TOLMAN: Defiende la asociacin E-E. Lo relevante es que distingue aprendizaje de ejecucin: tu puedes saber algo
pero no querer o tener que hacerlo. Los reforzadores no son necesarios para el aprendizaje pero si para la ejecucin.
SKINNER: Le da un poco igual la asociacin que se de, lo que importa es que el estmulo ambiental es una seal para
hacer la conducta, siendo moduladores entre respuestas y reforzadores.

TEORA DE PROBABILIDAD DIFERENCIAL DE PREMACK:


Una actividad favorita puede reforzar a otra menos favorita. cul es la favorita? La que tiene ms probabilidad de
ocurrencia (vamos, la que ms haces libremente). Para que una actividad sirva de reforzador:
Tiene que ser la favorita (puede que cambie de una a otra, usamos la favorita en cada momento)
Debe estar restringida

TEORA DE LA PRIVACIN DE RESPUESTA


Para que una actividad refuerce a otra basta con que est restringida, sea o no la favorita. El punto de bienestar es
el nivel al que en libertad haces una actividad, si yo te lo restrinjo por debajo de ese nivel, tu vas a esforzarte para
recuperarlo.
En la hipotesis de privacin de respuesta la relacin entre la tasa de respuesta y la tasa de reforzamiento tiene forma
bitnica, de U invertida.

Вам также может понравиться