You are on page 1of 5

Clase 2

Teoras de conducta aversiva Zanuto

Libro: Learning and Behavior, de Mazur


2 teoras: En la primera si dejamos de dar el reforzador positivo la conducta se extingue En la segunda si dejamos de dar el reforzador negativo la conducta no se extingue. (En los sucesivos ensayos al encender la luz el animal cruza, aunque ya no haya shock) Problema que Mowrer y su gente queran solucionar. Aprende a evitar. Y continuar evitando. Escapa del estmulo condicionado. Mowrer: Lo que refuerza no es el EC porque desaparece. Un tornero cobra por tornear, dejo de pagarle y no trabaja ms. En caso del EC negativo no se extingue, perdura. Lo que perdura es el miedo. La expectativa (Yo: ser memoria prospectiva?) El shock genera cambios en los circuitos neuronales, y por ello el aprendizaje persiste. Los estmulos se van apareando, se pueden aparear gran cantidad de estmulos, y le damos la chance de que aprenda a evitar. Modulacin de la respuesta aversiva. Hay dos tipos de estrategias: Apetitivo: reforzador positivo, comida. Aversivo: reforzador negativo, un shock Se hicieron tres teoras para explicar porque se sigue evitando el negativo a pesar de que ya no se presentaba. Y porqu es distinto del apetitivo. Tendrn mecanismos distintos? El sistema lmbico est relacionado con esto.

El estudio que hicieron es as:

Fase 1: luz y shock, inescapable


Fase 2: luz y tono, sin shock, (no es inescapable porque shock no hay) Fase 3: luz y tono, aument la cantidad de respuestas correctas Fase 4: ruido y tono, aument la cantidad de respuestas correctas 1) Luz, shock inescapable: cuando hay luz viene el shock despus de 10 segundos. 2)Luz tono, sin aplicar el shock 3) Ruido (EI), pero la puertita est abierta, el animal puede cruzar, va aprendiendo a cruzar (se saca un % de respuestas correctas)

4) antes de que aprenda a dar el 100% de respuestas correctas corto el experimento y veo que hace el animal cuando asocio luz con ruido: se ve que el % de respuestas correctas es ms alto Cuando asocio el tono con el ruido el % es menor. Cuando asocio el tono, es menor. En las fases 3 y 4 no se hacen muchos ensayos para ver que hace el animal, pero no intento condicionarlo nuevamente. Mowrer: La respuesta de evitacin es reforzada por la disminucin del miedo. Puedo hacer que el % de respuestas correctas suba o baje segn el miedo del animal. Por qu puedo hablar de miedo en este experimento? Si el miedo no se menciona. (Yo: creo que es porque se trata de una emocin) cunado se aparean distintos estmulos modulados en situaciones distintas, es posible cambiar el % de respuestas. Los estmulos incondicionados son siempre los apetitivos o los aversivos.

Se hicieron otros experimentos:


Se transfiere el control el EC 1 a un EC2, tiene 4 fases.

1: aprende evitacin L Sh
2: respuesta evitacin es bloqueada, se presenta un EC2 Se permite cruzar a otro lado mientras la respuesta de evitacin es provocada.

Fase 1: EC1 L y Sh: aprende evitacin


Fase 2: El animal no puede hacer la respuesta de evitacin, no puede cerrar la puerta, se bloquea la puerta; le enseamos que con el EC1 (L) no hay shock, le extinguimos lo que aprendi en la fase anterior; mir, lo que ahora implica shock es un tono, EC2 T (Tono) hay shock. Fase 3: Que pasa con un Tono? (nunca ense evitacin con el tono, pero el animal cruza; es el miedo lo que est controlando si el animal cruza o no) Fase4: Que pasa con una luz? (el animal no cruza, porque aprendi que la luz ya no es seguida de un shock, porque se lo extingu) A futuro vamos a demostrar que a pesar de que el animal tenga miedo, las cosas no son exactamente as. Lo que hace las asociaciones no es exactamente el miedo, aunque miedo haya.

Otro estudio:
Hay veces que el animal aprende sin que haya algo que los explique desde el ambiente, entra en lo que se llama indefensin aprendida. (ejemplo represin muy alto de los maestros, deja de aprender) Hacer mucha presin obre algo se asocia a un castigo discriminado, es tanto que se deben reforzar las dems conductas. Sino, si el castigo es generalizado hay indefensin aprendida. Fase 1: respuesta shock, deja de hacer nada Fase 2: se le abre la puerta, con shock, pero el perro sigue sin hacer nada Fase 3: lo llevaba a upa y lo pona en lugar seguro Fase 4: se le dan las mismas condiciones que en la segunda, pero el animal aprende. Otro experimento: Experimento en apoyo de la teora de un factor: la evitacin del shock es lo que serva como reforzador. El animal siempre recibe Sh, pero con protocolos cambian si aprieta una palanca recibe un sh cada 2 segundos, si no aprieta recibe sh al azar, pero recibe s o s. Cuando palanquea cambia de protocolo. No hay EC, el animal no puede estimar cuando viene un Sh: la teora de los 2 factores esta mal. El animal aprende lo menos aversivo.

Otro estudio: Palanca rica: Palanquear 10 veces para un queso Palanca pobre: Palanquear 1 vez y esperar 100 segundos para recibir un queso. Cuando aprendi: aumenta la de diez, luego sigue palanqueando El animal va a dar en la rica y cada tanto va a palanquear en la pobre. Extingue primero el que reciba comida ms fcil.

Otro: Recuperacin espontnea Un animal extingue en 20 ensayos, por ejemplo. Pongo el animal luego de 5 minutos y luego de 2 y 5 horas. Una comida por cada palanqueo. Cada uno es otro animal, que se ponen a distintas horas. A los 5 min. Vuelve a presentar respuestas. Con las horas comienza a subir la cantidad de respuestas. A os 5 minutos un poco, a dos horas ms y a las 5 ms.

Prediccin del refuerzo


CS: estmulo condicionado (luz, sonido, etc.) US: estmulo incondicionado (comida, agua, shock) R: respuesta Se producen asociaciones entre los CS y los US, y en funcin de aprender la asociacin sabe cual es la respuesta que se tiene que hacer.

Para observar esto es necesario observar los circuitos neurales que sostienen. Pueden haber mltiples CS (CS1Cn); as tambin mltiples R (R1Rn). Ela animal recibe distintos CS y va a producir mltiples R. CS- Cortezas (sensoriales, orbitofrontal, amgdala, PFDL) US- Cortezas (sensoriales, lmbico, orbitofrontal, PFDL) La memoria que interesa es la que permite que las cortezas puedan llevar a cabo la tarea.

VTA: Dopamina; El rea tegmental ventral (recibe info de las mem a corto plazo). Desde aqu va a la CPFDL. Las vas fueron descubiertas por neuroanatomistas. Computa la prediccin. LC: Cuando uno est aprendiendo una regla se activa; cuando uno la aprendi est menos activo. Se puede medir la dilatacin de la pupila (cuando est aprendiendo), cuando ya aprendi se contrae. Rafe: serotonina SN Pars compacta. Para explicar tareas simples slo necesitamos la VTA. Cada vez que se presenta el refuerzo se dispara la VTA Shultz explic que puede tratarse de la prediccin del CS. El dopaminrgico computa el CS y el error de prediccin (cuadro cuando esperaba que le dieran jugo la VTA deja de descargar, en el dibujo se ve como una parte ms blanca, que significa que hay menos disparos neurales por la VTA, luego del espacio blanco vuelve a la normalidad)

Rescorla y Wagner: encontraron una regla para ver como se dan respuestas condicionadas; aqu se incluyen las mem de los CS y de los US. Nos interesa la mem a corto plazo en la corteza orbitofrontal en cuanto a la consecucin del refuerzo. Desde la sustancia nigra pars compacta a los ganglios de la base. IMITACIN: Puede verse como una respuesta operante, la imitacin ocurre si es reforzado para imitar. Implica hacer algo si siento que algo se va a ganar. BANDURA: solo la expectativa del refuerzo es suficiente para la imitacin. No es imprescindible la aparicin del reforzador. Premios y castigos y modelo a imitar. Agresin: se ensea que por mtodos violentos se tiene ms poder. Por lo tanto los nios se tornan ms agresivos. Es preferible poder condicionar algo que me parece importante o conseguir algo que puede ser negativo.

..