Академический Документы
Профессиональный Документы
Культура Документы
- Aprendizaje y Conducta
1.- Antecedentes Histricos
* Los inicios del estudio del aprendizaje tienen su raiz en los estudios de Ren Descartes. * Propone su dualismo cartesiano, segn el cual hay 2 tipos de conducta: 1) La Conducta Involuntaria Respuestas automticas a los estmulos externos, mediadas por un mecanismo llamado reflejo 2) La Conducta Voluntaria No requiere la intervencin de estmulos externos, se debe a la voluntad consciente de actuar. * La glndula pineal hace de intermediaria para los estmulos con la mente consciente en la conducta voluntaria, la conducta involuntaria no pasa por la glndula pineal sino que va directamente a los msculos. 1.1- Desarrollo Histrico del Estudio de la Mente - Innatismo (Descartes) * Nacemos con ideas innatas acerca de ciertas cosas, es la Postura Nativista. - Empirismo (John Locke) * Todas las ideas son aprendidas directa o indirectamente a travs de experiencias post-natales. * Modelo adoptado por filsofos britnicos de los S. 17-19, los Empristas Britnicos - Hedonismo (Thomas Hobbes) * Refuta la nocin de Descartes de que la mente no opera de forma predecible y ordenada. * La ley se conforma a leyes y siempre trata de buscar el placer y bienestar, y evitar el dolor. - Concepto de Asociacin * Concepto de gran importancia para el empirismo britnico para explicar como funciona la mente. * Las sensaciones simples se combinan hasta formar ideas complejas por medio de asociaciones. 1.2- Leyes de Asociacin + Leyes Primarias * De origen aristotlico, son dos contigidad por un lado, y similitud y contraste. - Contigidad * La ms importante en el estudio de las asociaciones. * Si dos eventos ocurren juntos en el espacio y/o el tiempo de forma repetida, quedarn asociados. - Similitud y Contraste * Dos ideas se asocian si son similares en algun aspecto, o quiz si tienen alguna caracterstica contraria. * Ej. dos objetos que son rojos, o uno que es rojo y el otro azul. + Leyes Secundarias * Originadas por Thomas Brown (1778-1820) * La formacin de una asociacin se debe a mltiples factores, incluyendo la intensidad de las sensaciones, y la frecuencia y la recencia con las que los dos objetos/ideas/sensaciones se dan conjuntamente. * Adems la formacin de una asociacin entre dos eventos depende del nmero de asociaciones anteriores en las que cada uno de los dos estaba involucrado, y la similitud de aquellas con la actual. * Poco estudiadas por los empiristas britnicos hasta que el psiclogo alemn Herman Ebbinghaus (18501909) invent las slabas sin sentido. + Slabas sin sentido * Combinaciones de 3 letras despojadas de cualquier significado pudiera influir en como se reacciona a ellas. * La fuerza de la asociacin mejoraba con el entrenamiento y la cercana de dichas silabas en la lista. 1
1.3- Desarrollo Histrico de los Reflejos * Descartes tena nociones primitivas sobre los nervios, como que la informacin que va de los organos sensoriales al cerebro y los mensajes motores a los msculos viajaban por los mismos nervios. * Ms tarde Charles Bell y Franois Magendie demostraron la diferenciacin de fibras nerviosas sensoriales y motoras/musculares. * En 1669 John Swamerdamm demostr que la irritacin mecnica de un nervio para producir una contraccin muscular. * Posteriormente , Francis Glisson demostr que las contracciones musculares no se debian a que los msculos se hincharan de gas. * I.M. Sechenov (1829-1905) propuso que los estmulos no siempre elicitan respuestas reflejas de forma directa, sino que pueden liberar respuestas inhibidas cuya fuerza no corresponde a la intensidad del estmulo. * Segn Sechenov, la conducta voluntaria y los pensamientos estn en realidad elicitados (generados) por estmulos dbiles y apenas visibles. * El trabajo de Sechenov no tuvo en cuenta la posibilidad de modificar la respuesta ante un estmulo. * Ivn Pavlov (1849-1936) demostr experimentalmente que no todos los reflejos son innatos, sino que se pueden crear nuevos complejos estmulo-reflejo mediante mecanismos asociativos.
3.-Definicin de Aprendizaje
* Segn Domjan el aprendizaje es un cambio duradero en los mecanismos de conducta que implica estmulos y/o respuestas especficas y que es resultado de la experiencia previas con stos y otros similares 2
3.1- Distincin entre Aprendizaje y Ejecucin * La definicin de Domjan atribuye el aprendizaje a un cambio en los mecanismos de conducta, y no a un cambio directo de la conducta, esto es debido a que stos ltimos pueden no ser consecuencia del aprendizaje * Ejecucin: Se refiere a las acciones de un organismo en un momento concreto, que depende de muchas cosas, como la motivacin, capacidad sensoriales, etc y tambin el aprendizaje. 3.2- El Aprendizaje y Otras Fuentes del Cambio Conductual * Existen cambios de conducta tan breves que no se pueden considerar aprendizaje: - Fatiga * El esfuerzo fsico debilita gradualmente la fuerza de una respuesta - Cambio de las Condiciones Estimulares * Encender las luces a mitad de una pelcula en el cine obtiene gran respuesta de los espectadores - Estado Fisiolgico o Motivacional * El hambre y la sed provocan respuestas que no se ven en otros momentos - Maduracin * Un nio crece y alcanza una estantera a la que no llegaba, es debido a un cambio fisiolgico. 3.3- Diferentes Tipos de Mecanismos Causales * Existen 4 tipos de causas descritos por Aristteles - Causa Eficiente * Experiencia anterior con estmulos y/o respuestas especficas que produce el cambio en la conducta caracterstico del aprendizaje. - Causa Material * Hace referencia a los cambios fsicos en el sistema nervioso que median en el aprendizaje - Causa Formal * Las teoras o modelos de aprendizaje, que pueden expresarse en modelos matemticos o computacionales - Causa Final * Del comportamiento o proceso biolgico es como ste contribuye al xito reproductivo del organismo. * Se mide a partir del nmero de descendientes del organismo.
* Un presupuesto fundamental es que los fenmenos estudiados son el resultado de procesos ms elementales y que estos procesos funcionan de forma similarmente independiente de donde se encuentren. * Darwin, Pavlov o C. Lloyd Morgan tenian sta perspectiva, creyendo en la existencia de leyes universales para todas las especies, pero tambin afirmaban que podan existir diferencias, ej. en el ritmo de aprendizaje + Implicaciones Metodolgicas de la Perspectiva de Proceso General * La principal implicacin metodolgica es que se pueden descubrir los principios del aprendizaje estudiando a cualquier especie o sistema de respuesta que demuestre aprendizaje. * Esta implicacin llev a una estandarizacin de los paradigmas experimentales en la comunidad cientfica + Demostracin de la Generalidad de los Procesos de Aprendizaje * Es importante que la adopcin de sta perspectiva no prueba la generalidad de los procesos de aprendizaje * Una teora general no puede verificarse empricamente utilizando unos pocos paradigmas experimentales estandarizados , y la generalidad debe probarse realizando estudios en distintas especies y situaciones.
* Russel y Burch (1959) formularon las 3 R de la investigacin con animales - Reemplazamiento del uso de animales para otras tcnicas de estudio. - Reduccin del nmero de animales usados mediante tcnicas estadsticas - Refinamiento de los procesos y procedimientos para causar menos sufrimiento. + Alternativas Propuestas - Tcnicas Observacionales * Inutiles, los estudios de aprendizaje requieren manipulaciones experimentales de la experiencia pasada. - Uso de Plantas * Al carecer de sistema nervioso no se puede estudiar su aprendizaje - Cultivo de Tejidos * El funcionamiento de stos mecanismos solo puede estudiarse en el organismo intacto - Simulaciones Informticas * La preparacin de un programa informtico de simulacin requiere un conocimiento profundo del fenmeno que se pretende simular, previo. * Como establecieron Conn y Parker en 1998, los ordenadores se pueden usar para procesar datos ya conocidos, no para explorar lo desconocido.
+ Secuencia de Busqueda de Comida de la Ardilla * Modo de Busqueda General: La ardilla se mueve buscando cualquier fuente de alimentacin * Modo de Busqueda Focalizada: Al encontrar un nogal la ardilla pasar a buscar solo nueces en l. * Modo Consumatorio: Obtencin fsica de la nuez, roer y masticar.
3.2- Teora del Proceso Dual de Habituacin y sensibilizacin * Formulada por Groves y Thompson (1970), presupone que los incrementos y disminuciones de la tendencia a responder a un estmulo son producto de procesos neurales diferentes. * El proceso de habituacin provoca la disminucin en la tendencia a responder, la sensibilizacin viceversa * Pero ambos procesos estn relacionados y pueden estar activos al mismo tiempo ante un mismo estmulo. * As pues un aumento o disminucin de la respuesta viene dado por la suma neta resultante de el proceso simultneo de sensibilizacin y habituacin. * Segn Groves y Thompson el proceso de habituacin tiene lugar en el sistema E-R (estmulo-respuesta) * El proceso de sensibilizacin tiene lugar en el sistema de estado, que abarca otras partes del sistema nerv. + Implicacines de la Teora del Proceso Dual * El sistema E-R se activa siempre que un estmulo elicita una respuesta ya que es el circuito neuronal que lleva los impulsos desde la entrada sensorial a la salida conductual. * El sistema de estado slo interviene en circunstancias especiales (ciertos eventos externos pueden aumentar el estado de alerta y sensibilizarnos a otros estmulos, por ejemplo)
2.3- Condicionamiento Palpebral y el Engrama * Un engrama es una estructura de interconexin neuronal estable, que tiene como efecto la activaci de una red de neuronas, generando una programacin originada inconscientemente en el sistema nervioso central. * Richard Thompson busc la localizacin de los engramas durante casi cuatro decadas, empezando por el hipocampo que demostr ser innecesario para al aprendizaje condicionado. * Finalmente descubrieron que el origen y activacin de los engramas se encuentra en el cerebelo. * Si la seal llega al cerebelo a travs de las fibras trepadoras es un estmulo incondicionado * Si la seal llega al cerebelo a travs de las fibras musgosas es un estmulo condicionado 2.4- Seguimiento del Signo * Tambin conocido como automoldeamiento, este paradigma daba a entender que el condicionamiento no solo se daba en sistemas de respuesta reflejos. * Ej. los animales se ven atraidos por estmulos que sealan la disponibilidad de alimento. + Comprobacin del seguimiento del signo en laboratorio * En una caja con palomas se proporcion un EC en forma de tecla que se iluminaba durante 8 segundos antes de suministrar comida (EI). * Como resultado al encenderse la tecla las palomas se dedicaban a picotearla. * Incluso separando la EC y EI, y retirando la comida al poco de aparecer, las palomas perdan un tiempo precioso picoteando la tecla, demostrando una atraccin irresistible condicionada a una seal de comida. 2.5- Aprendizaje de Aversin al Sabor * La aversin a un sabor puede producirse si la ingestin de este nuevo sabor va seguida de enfermedad, o malestar u otras consecuencias negativas. Y viceversa para desarrollar preferencias de sabores. * Este condicionamiento es independiente de los procesos racionales (ej. saber que no va a ponerte enfermo) * Ej. Los pacientes de cancer desarrollaban aversin a las comidas ingeridas previamente a una sesin de quimioterapia. * Con animales se suele usar una comida con sabor distintivo (EC) y una droga independiente que causa malestar (EI) + Caractersticas de la Aversin al Sabor * Un nico emparejamiento de EC y EI puede generar la aversin (igual que con aprendizaje del miedo, pero no igual que el condicionamiento palpebral, salival o de seguimiento del signo que requieren ms) * Se puede producir la aversin aunque la enfermedad o malestar se presente horas despues de haber comido, en lo que se llama aprendizaje demorado. * Aunque como demuestran experimentos con ratas, la cercania del EC y EI est relacionado con la intensidad de la aversin.
11
+ 5 Procedimientos Comunes de Condicionamiento Clsico - Condicionamiento de Demora Corta El EI se presenta al poco tiempo de aparecer el EC y sin que el EC se retire. - Condicionamiento de Demora Larga El EC se presenta durante un periodo largo y antes de retirarse se presenta el EI. - Condicionamiento de Huella El EC se presenta primero, termina, y tras el intervalo de huella intermedio se presenta el EI. - Condicionamiento Simultneo El EC y el EI se presentan simultneamente - Condicionamiento hacia Atrs Inverso. Se presenta el EI y luego el EC. 3.2- Medida de las Respuestas Condicionadas - Ensayo de Prueba Ensayo en que se presenta el EC sin el EI. Lo que permite medir la respuesta condicionada previa, lo cual es fundamental para evaluar el aprendizaje en pruebas Hacia Atrs y Simultneas. - Magnitud Cantidad o intensidad de conducta que tiene lugar - Fuerza de la Respuesta Medida por la frecuencia con la que el EC provoca la respuesta condicionada, relacionada con la probabilidad - Latencia Cantidad de tiempo que pasa entre el principio del EC y la aparicin de la respuesta condicionada. 3.3- Procedimientos de Control sobre el Condicionamiento Clsico * Los procedimientos de control de el condicionamiento clsico son ms complejos que los de la habituacin y la sensibilizacin que consisten unicamente en la ausencia o presencia de un estmulo. - Pseudocondicionamiento * Casos en que la mera exposicin al EI da lugar a respuestas similar a la respuesta condicionada, que se puede confundir con un condicionamiento sin que ste exista. * Para distinguir un condicionamiento real se requieren procedimientos de control - Control Aleatorio * Procedimiento por el cual el EI y EC se presentan en momentos aleatorios. * Un aspecto negativo es que este tipo de control puede dar lugar a aprendizaje asociativo. - Control Desenparejado Explcito * El EI y el EC se presentan lo suficientemente separados como para evitar su asociacin. 3.4- Eficacia de los Procedimientos Tpicos de Condicionamiento * Se intent medir y averiguar cual de los 5 procedimientos de condicionamiento clsico daba ms muestras de efecto y aprendizaje. Simultneo: muestran poco condicionamiento en los que el intervalo EC-EI es 0. Demora Corta: facilita la respuesta condicionada Demora Larga: Disminuye la respuesta condicionada. De Huella: cuanto mayor el intervalo de huella, menor el condicionamiento Hacia Atrs: Resultados ambiguos y contradictorios, tanto condicionamiento excitatorio como inhibitorio * As pues el condicionamiento es ms efectivo cuando el EC es buena seal de que el EI aparecer pronto * En general se produce mejor condicionamiento cuando el intervalo EC-EI es corto. 12
+ Hipotesis de Codificacin Temporal * El sujeto no solo aprende a relacionar EC y EI, sino que dependiendo del procedimiento utilizado tambin relacionar el EC con el tiempo que tardar en aparecer el EI.
14
+ Condicionamiento Superior * A partir de un condicionamiento normal, ej. de los perros de Pavlov, creamos condicionamiento al aparejar un segundo EC con el primero, en este caso una luz con un el tono de la campanilla. + Condicionamiento Superior del Miedo * Los miedos irracionales a menudo se desarrollan por condicionamiento de orden superior. - Contracondicionamiento * Dos estmulos pueden ser asociados el uno al otro aunque ambos eliciten inicialmente respuestas intensas. * La respuesta que un animal da a un EC se invierte o contrarresta emparejando el estmulo a un EI que provoca la reaccin opuesta. - Precondicionamiento Sensorial * Se pueden aprender asociaciones entre estmulos que tan solo elicitan una breve respuesta de orientacin antes del condicionamiento. Suelen coincidir en el sentido usado. * P.ej. si estamos acostumbrados a los sabores de canela y vainilla juntos en los helados, si desarrollamos una aversin a la canela es muy probable que tambin rechacemos la vainilla.
16
2.3- EC como Determinante del RC * Visto ya en el experimento con palomas, comida o agua y EC de boton luminoso. * En otro a la rata sujeto se mostraba otra rata sujeto como EC antes de darle comida EI, pero la rata sujeto posteriormente trataba de socializarse con la rata EC en lugar de mostrar respuesta al EI, esto se debera a la naturaleza particular del EI (que ya tiene otros significados para la rata sujeto) 2.4- Conducta Condicionada y Sistemas de Conducta * Un sistema de conducta consiste en una serie de modos de respuesta, cada uno de ellos con sus propios estmulos y respuestas relevantes, dispuestos en determinado orden secuencial espacial/temporal * Esta teora asume que la presentacin de un EI activa el sistema de conducta (formado por uno o varios EC) para ese EI. *Ej. presentacin de estmulo sexual (EI) a la codorniz macho activa conducta de busqueda general (EC), conducta de busqueda focal (EC) y conducta consumatoria (EI) * La forma de la RC depende del intervalo EC-EI, dandole a EC un lugar en la secuencia de respuestas del sistema de conducta (aunque EC no sustituye ni compensa EI sino a un punto en el sistema de conducta) 2.5- Aprendizaje E-R vs Aprendizaje E-E * Aprendizaje E-R: Establece una nueva conexin entre EC y la RC. * Aprendizaje E-E: Ms moderno. El individuo aprende una asociacin entre EC y EI, haciendo que el sujeto responda al EC porque ste evoca al EI (y no porque tenga poder para elicitar directamente la RC) * Esto se comprueba mediante tcnicas de devaluacin del EI, consistente en reducir el atractivo de el EI, habitualmente mediante aversin o saciedad(reduciendo el atractivo del EI tambin lo hace el EC).
17
+Aplicacin del Efecto Bloqueo * Al final de la primera fase VA = * En la segunda fase no hay condicionamiento para el estmulo B, ya que el EI es predecible por la presencia de el estmulo A. EI = (-VA+B) = 0 + Prdida de Valor Asociativo a Pesar del Emparejamiento con EI * El modelo Rescola-Wagner predice que los estmulos perdern valor asociativo si se presentan juntos en un ensayo tras haber sido entrenados por separado. * Si en la fase 1 asociamos paralelamente dos estmulos separados A y B con bolitas de comida y ambos estmulos se condicionan efectivamente, predicen el EI y VA = VB = * En la fase 2 presentamos A junto a B con el EI. * Al presentarse solo una bolita de comida cuando cada EC antes conllevaba una, el EI parece pequeo y el valor de A y B se reduce. + Inhibicn Condicionada * La inhibicin condicionada consta de dos tipos de ensayos - Ensayos Reforzados: Se presenta el EI - Ensayos No Reforzados: Se omite el EI * Para poder anticipar el EI en los ensayos reforzados el EC+ debe adquirir propiedades excitatorias. * Por el contrario, en los ensayos no reforzados el EI no ocurre y hay expectativa excesiva. * Para predecir con exactitud la ausencia del EI en los ensayos no reforzados, los valores asociativos de EC+ y EC- (inhibidor condiconado) tienen que sumar 0. + Extincin de la Excitacin y la Inhibicin - Excitacin * En este caso el EC se presenta repetidamente con el EI, dndole fuertes propiedades excitatorias. * Luego se presenta el EC sin el EI, y de forma repetida, la expectativa de que aparezca el EI se va reduciendo - Inhibicin * Contrario al anterior. El EC- comienza con valor asociativo negativo, como prediccin muy baja del EI * Luego se ajustan las espectativas, dando el EI ms junto al EC-, hasta que su valor negativo se pierde (= 0) + Problemas del Modelo de Rescorla y Wagner * El analisis de la extincin de la inhibicin condicionada es incorrecto, la presentacin repetida del inhibidor condicionado EC- sin el EI no da lugar a una perdida de la inhibicin condicionada. * La excitacin no debera verse como lo opuesto a la extincin. * El modelo solo permite a los EC un nico valor asociado (exictatorio+ o inhibidor-), pero existen condiciones en que pueden tener ambos. * El modelo tiene dificultades para explicar hallazgos recientes en los paradigmas de aversin a sabor y olor, en concreto el efecto de aumento o contrabloqueo (en que el EC previo aumenta el condicionamiento del EC aadido). 3.3- Otros Modelos de Condicionamiento Clsico + Modelos Atencionales de Condicionamiento * Para que el condicionamiento ocurra el sujeto debe prestar atencin al EC * Se asume que el grado de atencin que un animal presta al EC de un ensayo depende del grado en que el EI haya sido sorprendente en un ensayo anterior (expectativas) * La sorpresividad del EI en un ensayo altera el grado de atencin dedicado a los EC en los ensayos siguientes teniendo un efecto prospectivo o proactivo sobre la atencin y el condicionamiento * Esto ltimo resulta una diferencia notable respecto al modelo Rescorla-Wagner 18
+ Factores Temporales y Respuesta Condicionada * Ninguno de los anteriores modelos explica los efectos del tiempo sobre el condicionamiento, y sin embargo el intervalo EC-EI es una variable importante. Relacionado con la duracin del experimento (DE) * Otra variable importante es el intervalo entre ensayos (IEE) sucesivos, con mayor respuesta condicionada en los casos en que los ensayos estn ms separados entre s (dentro de un orden). + Hipotesis del Tiempo de Espera Relativo * El EC proporciona fielmente informacin sobre el EI solo si el intervalo EC-EI es menor que cuando simplemente est expuesto al contexto experimental. * Razn IEE/DE baja: tiempo de espera similar al contexto, EC da poca informacin sobre la aparicin del EI * Razn IEE/DE alta: tiempo de espera menor, el EC parece dar mucha informacin sobre la aparicin del EI + Hiptesis del Comparador * La respuesta condicionada depende no slo de la asociacin del EC y el EI, sino de todas las posibles asociaciones que se pueden dar entre las claves contextuales y el EI. * As se asumen 3 asociaciones en el curso del tiempo. 1) asociacin del EC crtico con el EI (directo) 2) asociacin del EC crtico con las claves contextuales de comparacin 3) asociacin de los estmulos de comparacin y el EI (indirecto) * Esta hipotesis no trata como se establecen las asociaciones, es una teora de ejecucin, no de aprendizaje. * La comparacin entre las asociaciones EC-EI y contexto-EI se realiza en el momento de prueba * Se ha probado tambin en estudios de inhibicin condicionada, atribuyendo la inhibicin condicionada a situaciones en que la asociacin EC-EI es ms debil que la asociacin contexto-EI. * nica hipotesis que predice la extincin de la inhibicin condicionada se puede lograr extinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para el condicionamiento inhibitorio del EC- (en lugar de presentando el EC- de forma aislada) * El modelo precide la reduccin de la respuesta condicionada del EC critico si se incrementa el valor de las claves contextuales tras el tratamiento (dando mas valor al contexto que al EC) * Contribuye tambin al suponer que las diferencias en la respuesta condicionada puede reflejar diferencias en la ejecucin ms que en el aprendizaje. + Visin General de Alternativas Tericas * Hipotesis del Tiempo: Centrada en la distribucin temporal * Hipotesis del Comparador: Teora de ejecucin que da importancia al contexto * Modelos Atencionales: se parecen al modelo Rescorla-Wagner, con sus limitaciones * Ninguna de ellas tuvo la repercusin que tuvo el modelo Rescorla-Wagner en los 70.
19
- Conducta Dirigida a una Meta * Conducta en que los estmulos a los que el organismo se enfrenta son resultado de su conducta.
- Conducta Instrumental * Conducta que se usa porque ha servido previamente como instrumento para conseguir lo mismo.
20
+ Moldeamiento y Nueva Conducta * Toda la nueva unidad conductual de la rata est formada por un conjunto de respuestas preexistentes, ensendole una nueva combinacin de respuestas familiares en una nueva actividad. * El moldeamiento aprovecha la variabilidad inherente de la conducta, en una direccin u otra. * Mediante experimentos de moldeamiento se lograban obtener nuevas formas de respuesta, nunca antes realizadas por el organismo, o no en tal forma, contexto o magnitud (ej. apertura de pico mucho mayor) + Tasa de Respuesta como Medida de la Conducta Operante * Los experimentos con operante libre permiten una observacin continua durante largos periodos, en contraste con los ensayos discretos. * Skinner propuso la tasa de ocurrencia (frecuencia de respuesta por minuto) como medida de la probabilidad de la respuesta, mostrando una tasa de repeticin alta si eran ms probables.
4.1- La Respuesta Instrumental + Variabilidad Conductual vs Estereotipia * Los experimentos de Thorndike y Skinner enfatizaron que el reforzamiento incrementa la probabilidad de que la respuesta instrumental se repita en el futuro. * Sin embargo, esto no quiere decir que el condicionamiento instrumental no pueda producir tambin respuestas creativas o variables, pudiendo obtener reforzamiento de una situacion que requiera nueva respuesta * La variabilidad de la respuesta puede ser base para el reforzamiento instrumental * En un experimento con palomas de Page y Neuringer en 1985, stas tenian que picotear 2 teclas ocho veces para obtener comida, pudiendo alternarlos como quisieran mientras resultaran en ocho picoteos totales. * Tras 50 ensayos solo se les suministraba comida si producan combinaciones no repetidas de los primeros 50, lo que las llev a generar una mayor variabilidad de respuestas que las palomas del grupo de control * As pues la variabilidad de la respuesta puede mantenerse e incrementarse por reforzamiento, pero en ausencia de reforzamiento explcito de la variabilidad la respuesta se vuelve ms estereotipada. + Relevancia en el Condicionamiento Instrumental * Thorndike estudi las respuestas de gatos atrapados en cajas. Condicionando el bostezo y rascado como respuestas instrumentales para escapar, y luego usar un picaporte o tirar de una anilla. * Si se trataba de el picaporte o la anilla, la respuesta del gato era mucho ms vigorosa, se supone que porque son acciones ms naturales para escapar para el gato. A esto se le llama Pertinencia o Relevancia. + Deriva Instintiva * Concepto acuado por Breland y Breland para describir el efecto de interferencia que la conducta innata puede ejercer sobre la conducta operante. * Postulada tras estudiar varias limitaciones y problemas para entrenar animales para los circos, que repetian en ocasiones conductas relacionadas con su alimentacin en lugar de la conducta buscada por el cuidador. + Sistemas de Conducta y Limitaciones del Cond. Instr. * De acuerdo con la teora de los sistema de conducta si un animal est hambriento y encuentra una situacin donde podra encontrarla, su sistema de alimentacin se activa y se dedica a actividades relacionadas con ella * En acuerdo, deberamos ser capaces de predecir qu respuestas se incrementarn con un reforzamiento de comida mediante el estudio de lo que los animales hacen cuando se activa su sistema de alimentacin en ausencia de condicionamiento instrumental. * En el caso de un Hamster, cuando tiene comida se dedica a lavarse, tareas de autocuidado. * Cuando el hamster tiene hambre su sistema de conducta se encetra en actividades como rascar o comer. * As podemos concluir que el autocuidado no est relacionado con su sistema de conducta de alimentacin, y que el reforzamiento de comida podra aumentar el cavar y roer, pero no el lavarse la cara y rascarse. 4.2- El Reforzador Instrumental + Cantidad y Naturaleza del Reforzador * Caractersticas muy relacionadas, un reforzador ms grande o apetecible provocar respuestas mas intensas + Cambio en Naturaleza y Cantidad del Reforzador * Relacionado con el modelo Rescorla-Wagner. * Si el EI es mayor de lo esperado, producir condicionamiento excitatorio, mientras que si el EI es menor de lo esperado, producir condicionamiento inhibitorio (aumentar la recompensa aumenta la reaccin) * Contraste Positivo: elevada respuesta a una recompensa favorable donde antes sta era menor. * Contraste Negativo: respuesta disminuida por una recompensa desfavorable donde antes era mayor. * Contraste Sucesivo (positivo o negativo): dos condiciones de respuesta en diferentes fases del experimento y slo un cambio en la magnitud de la recompensa para los grupos de cambio.
22
* Contraste Conductual Simultneo: efectos de contraste conductual (+ y -), producidos por frecuentes cambios entre una condicin de consecuencia favorable y desfavorable, con cada condicin asociada a su propio estmulo distintivo * Estos efectos de contraste ilustran que la efectividad de un reforzador en una situacin est determinada en parte por las experiencias del organismo con reforzadores en otras situaciones. 4.3- La Relacin Respuesta- Reforzador * En ocasiones hay una fuerte relacin entre la accin y la consecuencia, en otros no la hay y en otros puede que la relacin sea probabilstica. * Un organismo debe organizar su tiempo para enfrentarse a mltiples retos de la mejor manera posible. + 2 Tipos de Relacin Respuesta-Reforzador 1) Relacin Temporal: es el tiempo que transcurre entre la respuesta y el refozador. Existe contigidad temporal si el refozador es inmediatamente subsecuente a la respuesta. 2) Relacin Causal: O contingencia Respuesta-Reforzador, se refiere al hecho de que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador. + Efectos de la Contigidad Temporal * El reforzamiento inmediato es preferible al demorado, facilitando el aprendizaje. Hay varias razones porque. * Una demora larga hace que el sujeto no sepa cual de sus respuestas a producido el refozador (confusin) * Para resolver este problema se entrega un refozador condicionado o secundario inmediatamente despus de la respuesta instrumental, asociado previamente con el reforzador (ej. buen chico previo al treat) * Otra solucin es el procedimiento de marcado de la respuesta instrumental correcta, que puede resultar de cambios en el contexto u otros estmulos (p.ej. sacar al animal de su sitio para recibir la comida si es correcto) + Contingencia Respuesta-Reforzador * Aunque la relacin causal sea perfecta, el reforzamiento no ocurrir si el reforzamiento es demorado durante demasiado tiempo y se pierde la contingencia. + Experimento de Supersticin de Skinner * Skinner comprob al meter a 8 palomas separadas en cajas que eran suministradas comida peridicamente que al tiempo cada una desarroll una conducta que crea produca la comida. * Esto recibira el nombre de conducta supersticiosa, que puede ser resultado de reforzamiento accidental o adventicio, en que se produce una asociacin accidental de una respuesta con la entrega del reforzador. * Sugiere pues que una contingencia positiva respuesta-reforzador no es siempre necesaria para el condicionamiento instrumental. + Reinterpretacin del Experimento de Supersticin * Staddon y Simmelhag profundizaron ms en el experimento de Skinner y observaron que las conductas que las palomas daban al final del intervalo comida-comida, as como las que se daban en medio del intervalo solan coincidir entre palomas, asi que pareca existir una contingencia entre respuesta y el reforzador. * Las respuestas se denominaron respuestas terminales y respuestas de intern respectivamente. * Sugirieron que estas respuestas terminales eran tpicas de la especie, reflejando la anticipacin de la comida. * Las respuestas de intern son manifestaciones de conductas y fuentes de motivacin ms importantes al principio del intervalo entre comidas, cuando la aparicin del alimento era ms improbable. * El tipo de respuesta se clasific en 3 subgrupos segn su secuencia temporal. 1) Busqueda focalizada postcomida (cerca del cuenco) 2) Busqueda general (lejos del cuenco) 3) Busqueda focalizada (cerca del cuenco de nuevo) 23
4.4- Efectos de la Controlabilidad de los Reforzadores * Con una contingencia fuerte la aparicin del reforzador depende de que ocurra la respusta instrumental * Un hallazgo en experimentos con perros fue que una exposicin a una descarga incontrolable dificultaba el aprendizaje posterior. Se le llamara efecto de indefensin aprendida. + Diseo Tridico * Utilizados en experimentos sobre la indefensin aprendida, contiene 2 fases. A) Exposicin * Ratas E expuestas a descargas peridicas que pueden escapar. * Ratas A expuestas a las mismas descargas junto al grupo E pero no pueden escapar. * Ratas C, control, confinadas pero no reciben descargas B) Condicionamiento * Los 3 grupos reciben posteriomente entrenamiento de escape-evitacin. C) Resultados * El grupo A demostraba peores resultados en el aprendizaje escape-evitacin * La diferencia entre los grupos muestra que los animales son sensibles a la contingencia respuesta-reforzador + Hiptesis de la Indefensin Aprendida * Asume que durante la exposicin al estmulo aversivo inescapable (descargas al grupo A), los animales aprenden que las descargas son independientes de su conducta y no pueden controlarlas. * Esta falta de control se supone que hace descender la motivacin de los sujetos para realizar una respuesta instrumental, dificultando el aprendizaje. + Deficit de Actividad * Las ratas del grupo A aprendan a ser inactivas en respuesta a la descarga durante la fase de exposicin + Deficit Atencional * La descarga inescapable e incondicionada hace que los sujetos presten menos atencin a sus acciones * Sin embargo marcar la respuesta instrumental super el deficit de indefensin aprendida. + Relaciones Estimulares en el Condicionamiento de Escape * Rasgo definitorio de la conducta de escape es que la respuesta instrumental es que la respuesta instrumental tiene como consecuencia la terminacin del estmulo aversivo. * Adems la respuesta de escape tiene como resultado 2 claves internas de retroalimentacin de la respuesta - Claves de retroalimentacin de la terminacin de la descarga (al iniciar la respuesta) - Claves de retroalimentacin de la seal de seguridad (al terminar la respuesta) * Estas claves contextuales llegan a convertirse en inhibidores condicionados del miedo y limitan el miedo elicitado por las claves contextuales de la camara experimental. * Cuando las descargas son inescapables hay mayor probabilidad de que las claves contextuales de la camara en que se administran las descargas queden condicionadas para elicitar miedo.
24
25
+ Programas de Intervalo y Espera Limitada * En los programas de espera limitada, el reforzador estar disponible durante X tiempo, y si el sujeto no da el tipo/nmero de respuestas requeridas, dejar de estar disponible hasta el siguiente intervalo. 1.3- Comparacin de Programas de Razn e Intervalo + Similitudes - Razn Fija e Intervalo Fijo * Producen una pausa postreforzamiento tras la administracin del reforzador. * Producen altas tasas de respuesta antes de la administracin del reforzador. - Razn Variable e Intervalo Variable * Mantienen tasas estables de respuesta, sin pausas predecibles. + Diferencias * Activan diferencias neuroqumicas en el cerebro * Los programas de intervalo estn relacionados con el sentido temporal del organismo * En un programa con palomas sometidas a RV e IV, el grupo con RV tena mejor tasa de respuesta y responda con una conducta instrumental mucho ms vigorosa + Reforzamiento Diferencial del Tiempo Interrespuesta * El tiempo interrespuesta, TIR, es el intervalo entre una respuesta y otra. * Asi un TIR cort/bajo corresponde a una tasa alta, y viceversa * Un programa de razn favorece los TIR cortos (puesto que su repeticin equivaldr a un acceso temprano al reforzador) mientras que los programas de intervalo favorecen TIR largos. 1.4- Programas de Reforzamiento de la Tasa de Respuesta * Los programas de tasas de respuesta requieren especficamente que el organismo responda a una tasa particular para obtener el reforzador (mezcla de tiempo y nmero) * Por ejemplo, el organismo debe repetir la respuesta con una media de 12 veces por minuto o menor para que se presente el reforzador. Es el Reforzamiento diferencial de tasas altas o RDA * Reforzamiento Diferencial de Tasas Altas RDA, en que el refuerzo ocurre solo si la respuesta ha ocurrido antes de que haya transcurrido una cierta cantidad de tiempo desde su ltima repeticin. * Reforzamiento Diferencia de Tasas Bajas RDB, en que una respuesta se refuerza solo si ocurre despues de que haya transcurrido una cantidad de tiempo desde su ltima repeticin. Fomentan respuestas lentas.
+ Tasa Relativa de Respuesta de Cada Alternativa * La tasa relativa de respuesta en la tecla A se calcula dividiendo la tasa de respuesta en A por la tasa total de respuesta (tasa de A+ tasa de B) - Tasa Relativa de Respuesta (A) = RA/ ( RA + RB ) * De modo que si la paloma picotea por igual las dos teclas la razn ser de 0,5. * Si la tasa de respuesta A es mayor que la B, la razn > 0,5. * Si la tasa de respuesta A es menor que la B, la razn < 0,5. * A tener en cuenta que la distribucin de conducta entre ambas alternativas de respuesta est muy influenciada por el tipo de programa de reforzamiento asociado con cada respuesta. + Tasa Relativa de Reforzamiento * Frecuencia con la que el individuo obtiene recompensas en cada lado. Calculado de igual manera. - Tasa Relativa de Reforzamiento (A) = rA/ ( rA + rB ) 2.2- Ley de Igualacin (de Herrstein) * Es normal obtener una TRDR de 0,5 cuando ambos programas usados son iguales, pero que ocurre con el clculo de las tasas relativas si los programas usados son diferentes? * Por naturaleza la tendencia es que se iguale la tasa de respuesta con la tasa de reforzamiento, lo cual nos d la Ley de Igualacin RA/ ( RA + RB ) = rA/ ( rA + rB ) RA /RB = rA/rB * Comprobado con palomas con programas IV de 6 minutos e IV de 2 minutos que podan dispensar un mximo de 10 reforzadores por hora cada uno. La tasa de respuesta del IV2 era unas 3 veces mayor. + Infraigualacin, Supraigualacin y Sesgo de Respuesta * Pero las tasas relativas de respuesta no se iguala siempre idealmente a las tasas relativas de reforzamiento * Por ello aadimos dos parmetros ms a la ecuacin: RA / RB = b (rA / rB)s * s = sensibilidad, de la conducta de eleccin a las tasa relativas de reforzamiento para las alternativas de respuesta * s < 1,0 es infraigualacin, una sensibilidad reducida a la tasa relativa de reforzamiento, ms comn. * s > 1,0 es supraigualacin, una sensibilidad aumentada a la tasa relativa de reforzamiento, menos comn * b= bias o sesgo de respuesta, que influyen en la eleccin cuando las alternativas de respuesta son diferentes y/o cuando el reforzador es diferente. * En ausencia de sesgos, b=1. Segn la naturaleza del sesgo o preferencia b ser menor o mayor que 1. + Ley de Igualacin y el Valor Reforzador * La TR de Respuesta es una funcin de la cantidad relativa de cada reforzador, la demora y la palatibilidad, cuanto ms grande, ms sabroso y ms inmediato el reforzador, mayor su valor. + Ley de la Igualacin y Programas Simples de Reforzamiento * Incluso las situaciones de respuesta nica pueden involucrar una eleccin, como es realizar la respuesta o dedicarse a otra actividad (acicalarse, etc). Sustituiremos RB y rB por Ro y ro de las conductas no-respuesta. RA/ ( RA + RO ) = rA/ ( rA + rO ) * Si adems consideramos que (RA + RO) es una constante que no guarda relacin con el reforzador, podemos llamarla constante k. La ecuacin quedar como RA/ k = rA/ ( rA + rO ) RA= k rA / ( rA + rO ) * Dandonos la conclusin de que hay dos formas de modificar las tasa relativa de respuesta: el cambio de su tasa de reforzamiento, o el cambio de la tasa de las otras fuentes de reforzamiento.
27
2.3- Mecanismos de la Ley de Igualacin * Tiene 3 mecanismos A) Maximizacin molecular B) Maximizacin molar C) Mejoramiento * Igualacin y Maximizacin de las Tasas de Reforzamiento, es la nocin de que los organismos distribuyen sus acciones entre las alternativas de respuesta para recibir la mxima cantidad posible de reforzadores. + Maximizacin Molecular * Los organismos siempre eligen cualquier alternativa de respuesta que creen tiene mejores probabilidades de que sea reforzada en ese momento + Maximizacin Molar * El organismo distribuye sus respuestas entre las varias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a la larga y en total. * ej. es probable que el animal solo use una respuesta RF10 en vez de una RF20 tambin disponible. * Pero esta hipotesis tiene problemas para explicar la conducta de eleccin en programas de intervalo (IV-IV) y para programas de razn-intervalo (RF-IV) + Mejoramiento * Los mecanismos de mejoramiento operan a una escala temporal teoras molar y molecular. * El trmino mejoramiento se refiere a hacer algo mejor que el pasado reciente, no a elegir la mejor alternativa en el momento. * Es importante el concepto de tasa local de respuesta y reforzamiento, que considera y calcula las tasas solo sobre el periodo de tiempo que un sujeto dedica a una alternativa particular de respuesta. * Es decir, si hay dos opciones, A y B. La tasa local de respuesta de A se calcula dividiendo la frecuencia de respuesta de A por el tiempo dedicado a responder A. * De modo que 75 respuestas A en 20 minutos dedicados a la respuesta A, equivalen a una tasa global de 75 respuestas/hora, pero la tasa local ser de 225 respuestas/hora. * Esta teora asume que los organismos cambian de una alternativa de respuesta a otra para mejorar la tasa local de reforzamiento que recibe, y el mecanismo de mejoramiento resulta en la igualacin. * As el organismo tendr predileccin por la alternativa de respuesta que arroje mayor tasa local de reforz.
3.2- Estudios de Autocontrol * El autocontrol a menudo supone elegir una recompensa grande demorada frente a su contrario. * Estudio con palomas, en que la opcin A daba una pequea cantidad de grano inmediata, y la opcin B una mayor cantidad retardada 4 segundos a la respuesta * En un procedimiento de eleccin directa las palomas iban directas a la opcin A de forma repetida. * En un procedimiento concurrente encadenado con A y B como eslabones terminales, si la demora hasta el eslabon terminal era suficiente las palomas empezaban a preferir la opcin B (autocontrol). * Como conclusin: la tendencia es al autocontrol si existe una demora suficiente para obtener la recompensa en ambos casos, tratando de maximizar la recompensa por el tiempo ya invertido. + Explicacin del Autocontrol * El valor de un reforzador se reduce en funcin del tiempo que haya que esperar para obtenerlo, lo cual se calcula mediante una funcin descontadora del valor V = M / (1+KD) V= Valor del reforzador M= Magnitud de la recompensa D= Demora de la recompensa K= Parmetro de la tasa descontadora * Por lo que vemos, si no hay demora en la entrega del reforzador, su valor estar directamente relacionado con su magnitud. Por contra, cuanto ms se demora, menor es su valor neto percibido. + El Autocontrol en la Adiccin a las Drogas * Cuanto ms acusada sea la funcin descontadora de la demora de una persona, ms dificultad para mostrar autocontrol en lugar de la impulsividad de elegir una recompensa menor inmediata. * Experimentos de autocontrol en adictos a la heroina demostraban una impulsividad mayor de la normal, y que su valoracin del dinero disminua rapidamente si tardaban en drselo. + Puede Entrenarse el Autocontrol? * La respuesta es SI. Ejemplificado por un test con nios con 3 fases. * El pretest consista de que eligieran 2 centimos inmediatos o 3 al final del dia. * Le segua la sesin de entrenamiento en que los nios deban resolver problemas sencillos para obtener una recompensa, que era en acuerdo con su eleccin en el pretest. * En el postest, se repeta el procedimiento con la pregunta de la fase 1. * Como resultado, una cantidad significativamente mayor de nios elegan la opcin demorada en el postest.
29
+ Interacciones de Respuesta en Exp. de Transferencia de Control * Un estmulo clsicamente condicionado puede influir sobre la conducta instrumental a travs de las respuestas abiertas que elicita * Ej. un EC clsico hace que el animal se paralice, mientras que la respuesta instrumental es saltar. Presentar el EC provocar una disminucin de la respuesta instrumental, saltando menos. + Estados Emocionales Centrales Condicionados o Expectativas de Recompensa? * En ciertas circunstancias los animales adquieren expectativas especficas del reforzador en lugar de un estado emocional ms general de esperanza durante los condicionamientos. 1.3- Relaciones (R-C) y E(R-C) en el Cond. Instr. * En las asociaciones E-R y E-C no se inclua de forma directa una relacin entre respuesta R y reforzador C, lo cual es importante porque C parece el objetivo perseguido por nuestras conductas. + Evidencia de Asociaciones R-C * Para probar la asociacin R-C se devala el reforzador despus del condicionamiento clsico, para ver si la respuesta instrumental tambin disminuye en concordancia. * La devaluacin de un reforzador debilita selectivamente la respuesta particular que ha sido entranada con ese reforzador. + Evidencia del Aprendizaje de Relacin Jerrquica E-(R-C) * Las asociaciones R-C no pueden actuar aisladamente para producir la conducta instrumental, sino que se necesita de un facto adicional para activar su asociacin, el estmulo (E).
* Al establecer que la privacin de la respuesta es ms bsica para la motivacin de la conducta instrumental que su probabilidad, entra en conflicto con el principio de Premack * Aunque como la teora de Premack, sugiere que los reforzadores no existen en sentido absoluto sino que son muy relativos. 2.2- Regulacin Conductual Y el Punto de Deleite Conductual * El concepto de regulacin est relacionado con el de homeostasis. Los organismos tienen una distribucin de actividades preferida que pretenden mantener, si esto se perturba la conducta variar para compensar. + Punto de Deleite Conductual * Ante la libertad para distribuir sus respuestas entre varias alternativas, el sujeto lo har de la forma que sea ms cmoda. Puede medirse mediante la frecuencia relativa de respuesta en una situacin sin restricciones + Imposicin de una Contingencia Instrumental * No permite volver al punto de deleite, pero ste sigue teniendo importancia ya que proporciona la motivacin para la conducta instrumental. * Volver al punto de deleite conductual sigue siendo una meta en la distribucin de respuestas. + Modelo de Desviacin Mnima * Segn Staddon la introduccin de una contingencia respuesta-reforzador provoca que el sujeto redistribuya su conducta entre respuestas instrumentales y contingentes de manera que se minimice la desviacin total de las dos respuestas con respecto al punto de deleite. + Explicacin de los Efectos de Reforzamiento * El efecto de reforzamiento se identifica por un incremento en la ocurrencia de una respuesta instrumental sobre el nivel de esa conducta en ausencia de la contingencia respuesta-reforzador. + Contingencias de Reforzamiento en Contexto Conductual Amplio * El contexto tambin influye notablemente, pues las contingencias no suceden en el vaco, ocurren en un contexto en el que se pueden dar una variedad de respuestas y reforzamientos. 2.3- Conceptos Econmics y Distribucin de Respuesta * La economa sera el estudio de la distribucin de la conducta dentro de un sistema de restricciones. - Economa * Las restricciones de la conducta se imponen por los ingresos del individuo y el precio de los bienes que se quiere obtener. - Psicologa * En las situaciones de condicionamiento instrumental, las restricciones estn proporcionadas por el nmero de respuestas que se es capaz de realizar y el requerido para obtener el reforzador. - Demanda del Consumidor * Es fundamental la relacin entre el precio de una comodidad y cuanto se obtiene, la denominada curva de la demanda. - Elasticidad de la Demanda * Grado en el cual el precio influye en el consumo (a ms elstica ms influir el precio en su consumo) + Analogas - El nmero de respuestas es el dinero - El precio del reforzador es el tiempo o nmero de respuestas requeridas para obtenerlo. * La meta es saber como la conducta instrumental (gasto) es controlada por las contingencias instrumentales (precios). 32
+ Determinantes de la Elasticidad de la Demanda * 3 factores que influyen en como las restricciones de un programa moldean la distribucin de la conducta: 1) Disponibilidad de Sustitutos * El grado en que los aumentos de precio producen una disminucin en el consumo depende de la disponibilidad (y precio) de otros bienes que pueden sustituir el artculo. * La disponibilidad de sustitutos aumenta la sensibilidad del artculo original a precios altos. * ej. economa abierta si los animales reciben comida entre sesiones experimentales, economa cerrada si no reciben comida fuera de las sesiones. 2) Rango de Precios * Un aumento de precio tiene menos efecto en precios bajos que en precios altos. * En un rango de preciso bajos, la demanda de comida no es elstica. 3) Nivel de Ingresos * Cuanto mayor el salario, menos desnimo ante un aumento de precio. * ej. cuanto ms tiempo o mayor facilidad para dar las respuestas tenga el sujeto, menos influir en su conducta un aumento de repeticiones para obtener el reforzador. 2.4- Problemas con Aproximaciones de Regulacin Conductual * El punto de deleite es la caracterstica molar de la conducta, se basa en una medida de cada respuesta acumulada a lo largo de un bloque temporal amplio (ms efectivo en tiempos mayores?) * Las respuestas durante un periodo de linea de base libre no siempre tienen el mismo valor como respuestas que ocurren como parte de una contingencia instrumental impuesta (no es igual por placer que por deber?) * La regulacin conductual no estudia los procesos conductuales moleculares, as que no dice nada acerca de como los organismos defienden una combinacin preferida de bienes o actividades. 2.5- Contribuciones de la Regulacin Conductual * La regulacin conductual y el principio de Premack nos alejan de la consideracin de los reforzadores como un tipo especial de estmulo o respuesta. * El condicionamiento instrumental deja de considerarse como estampando o fortaleciendo la conducta instrumental, sino que se ven como nuevas distribuciones de respuestas. * No existe distincin fundamental entre respuestas instrumentales y reforzadoras, nicamente se distinguen por los papeles asignados en el procedimiento de asociacin instrumental. * La regulacin conductual y la economa conductual aceptan la idea de que los organismos responden para maximizar sus beneficios. * La regulacin conductual y la economa conductual han proporcionado caminos nuevos para describir las restricciones que imponen varios procedimientos de condicionamiento instrumental en el repertorio de conductas del organismo. 3.- Comentarios Finales * Caractersticas no compartidas por las teoras anteriores. - Asociacionismo * Concepto de asociacin, y exploracin de circuitos neuronales * Nivel molecular, los estmulos especficos, respuestas y coneciones como objetivos. * Relacionada con procesos especficos (asociaciones E-R, E-C, R-C, etc) - Regulacin Conductual * Concepto de regulacin conductual (puntos de deleite, restricciones de programa) * Poca aplicacin neurolgica * Nivel molar de agregados de conducta y est relacionada con metas a largo plazo
33
* El efecto de que las claves contextuales absorban ms atencin que el estmulo es el ensombrecimiento * Cuanto ms intenso sea el estmulo, ms rapido se condicionar y tambin ensombrecer el aprendizaje del estmulo ms debil. 2.3- Tipos de Reforzamiento * Es ms probable que ciertos tipos de estmulos adquieran control sobre la conducta instrumental con reforzamiento positivo que con reforzamiento negativo. * ej. con grupos de palomas, se administraba comida con un tono y luz roja, y por otro lado una descarga con tono y luz roja. El grupo de refuerzo positivo responda ms a la luz roja, el del estmulo aversivo al tono. Se supone que porque las claves visuales son ms importantes para comer y las auditivas para evitar peligro. * As pues para un mismo tipo o combinacin de estmulos se puede obtener respuestas distintas segn el tipo de condicionamiento empleado, debido al sistema de conducta elicitado o que se activa. 2.4- Tipos de Respuesta Instrumental * Otro factor importante es el tipo de respuesta requerida para el reforzamiento. * Estudio con perros demostr que las respuestas que se diferencian por localizacin (levantar pata izquierda/ derecha) es ms probable que estn bajo el control de una caracterstica especial de las claves auditivas. * Por el contrario, las respuestas diferenciadas por su naturaleza (hacer o no hace) es ms probable que lleguen a estar bajo el control de la naturaleza de la clave auditiva. * Este es el llamado efecto de la naturaleza-localizacin. * Este efecto es un ejemplo de asociacin selectiva, de lo cual hay otros ejemplos como claves del sabor siendo asociadas con enfermedad o claves audiovisuales siendo asociadas a descargas elctricas 2.5- Elementos del Estmulo y Claves Configuracionales en los Estmulos Compuestos - Aproximacin Elemental del Estmulo * Cuando los distintos elementos que forman el estmulo son tratados por el organismo como rasgos distintivos individuales y separados del ambiente. - Aproximacin de la Clave Configuracional * Los estmulos son percibidos como un todo integrado y no se dividen en partes ms pequeas. * Aunque son teoras opuestas en concepto se han elaborado teoras para unificarlas, se piensa que en ciertas circunstancias predomina al aproximiacin elemental y en otras la aproximacin configuracional.
+ Programacin Mltiples de Reforzamiento * En un programa mltiple funcionan diferentes programas de reforzamiento en presencia de diferentes estmulos (por ejemplo, un programa IV al encenderse una luz, y uno RF al sonar un tono) 3.2- Efectos del Entrenamiento en Discriminacin sobre el Control del Estmulo * Para descubrir la precisin de control de E+ necesitamos no solo observar la conducta diferencial elcitada por E+ y E-, sino tambin determinar lo acusado del gradiente de generalizacin. + Conclusiones de Experimentos de Jenkins y Harrison * El entrenamiento en discriminacin aumenta el control por el estmulo de la conducta instrumental. * Una dimensin particular del estmulo (frecuencia tonal, color, etc) es ms probable que adquiera control sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensin del estmulo. 3.3- Rango de Posibles Estmulos Discriminativos * Los procedimientos de discriminacin pueden ser utilizados para situar la conducta instrumental de un organismo bajo el control de una amplia variedad de estmulos. * Este tipo de procedimientos se usan a menudo para evaluar la capacidad sensorial de los animales. * En un experimento con palomas y cocaina se comprob que incluso pueden distinguir sus sensaciones y aument el control de la conducta por estas sensaciones creadas por la droga. 3.4- Que se Aprende en el Entrenamiento por Discriminacin? * En un escenario clsico el organismo puede aprender 3 cosas diferentes con casi los mismos resultados. a) Responder ante el E+, y no aprender nada sobre el Eb) Aprender a suprimir la respuesta con el E- pero no aprender sobre el E+. c) Aprender el significado tanto del E+ como del E+ Teora de Spence del Aprendizaje de Discriminacin * Meramente que los sujetos respondan ms al E+ que al E- no es suficiente para probar que han aprendido sobre ambos estmulos por lo que necesitamos experimentos usando los gradientes de generalizaicn de est. * Gradiente de generalizacin de estmulo excitatorio, se observar un gradiente de generalizacin acusado con la mayor cantidad de respuestas ante el E+ si ste a condicionado una conducta exctitatoria. * Gradiente de generalizacin del estmulo inhibitorio, si se ha condicionado una tendencia inhibitoria al Eentonces los estmulos que se alejan cada vez ms de E- deberan producir una inhibicin menor. * Algunos experimentos relacionados muestran que el entrenamiento en discriminacin puede producir tanto condicionamiento excitatorio al E+, como condicionamiento inhibitorio al E-. 3.5- Interacciones entre E+ y E- : Desplazamiento del Mximo * El aprendizaje del sujeto sobre E+ tambin puede influir en su respuesta a E-, y viceversa, sobre todo si los dos se encuentran relacionados de alguna manera. + Discriminacin intradimensional es el efecto que se puede producir cuando el E+ y el E- son semejantes excepto por un rasgo o atributo. Es una forma de ejecucin experta (requiere expertos para diferenciar) * Ej. al condicionar con un EC+ de luz de 500nm y un EC- de luz de 600nm, si luego se presentaban un rango de luces de 450, 490, 590 y 650nm, el mximo de respuesta se encontraba en la luz ms alejada del EC- (450) - Explicacin de Spence del Desplazamiento al Mximo * Segn Spence, independientemente de los estmulos que se presenten en la prueba de generalizacin es posible calcular el valor de rasgo hacia el que va a desplazarse el mximo de respuestas atendiendo exclusivamente a los valores netos de E+ y E- originales. * Se basa pues en la interaccin matemtica entre los valores absolutos de E+ y E-, que siendo 100nm y 50nm daran como resultado de mxima respuesta una luz de 150nm. 36
+ Explicacin Alternativa del Desplazamiento al Mximo * La explicacin alternativa asume que el organismo aprende a responder a un estmulo basndose en la relacin de ese estmulo con otras claves de la situacin (relativo a diferencia del modelo de Spence) 3.6- Entrenamiento de Equivalencia de Estmulos * De forma contraria al entrenamiento de discriminacin, potencia la respuesta generalizada o equivalencia de estmulos. * El emparejamiento de estmulos diferentes con la misma consecuencia crea equivalencia funcional entre esos estmulos, haciendo que la respuesta condicionada a uno se extienda a los otros. * Existe una clase de equivalencia si sus miembros poseen 3 propiedades matemticas: 1) Reflexividad o Igualdad (A=A, B=B, C=C) 2) Simetra (si A lleva a B, diremos que tambin B lleva a A) 3) Transitividad (si A lleva a B y B lleva a C, A llevar a C).
37
+ Distincin entre Excitacin y Modulacin * La extincin es el procedimiento en el cual un estmulo previamente condicionado se presenta repetidamente pero se omite el EI, con el resultado tpico de disminuir la conducta condicionada. * Un estmulo condicionado excitatorio seala la proxima presentacin del EI. La ausencia del EI despus de la presentacin del EC durante la extincin es una violacin de esa expectativa. Por tanto el valor como seal del EC debe reajustarse. * Un modulador seala una relacin entre un EC y un EI. Por ello la ausencia del EI cuando se presenta el modulador aislado no significa un cambio en la relacin entre EC y EI. En consecuencia la habilidad del modulador de promover la respuesta elicitada por el EC permanece intacta durante la extincin. + Modulacin vs Condicionamiento Configuracional * Para que el modulador sirva como seal de la relacin entre EC y EI, el modulador y el EC deben de ser tratados como elementos independientes y no como una clave configuracional combinada. * Los efectos modulatorios requieren la respuesta al compuesto estimular como constituido por elementos independientes estimulares. - Compuesto Serial * Para promover que los organismos traten los compuestos estimulares como construidos por elementos independientes, los investigadores presentan los elementos uno tras otro en lugar de simultneamente.
38
2.4- Restablecimiento de la Excitacin Condicionada * Restablecimiento: Procedimiento que sirve para restaurar la respuesta a un EC extinguido * Al igual que con el efecto de renovacin es importante considerar si el efecto de restablecimiento puede ser el resultado del condicionamiento contextual, pues las claves del contexto pueden ser un factor contribuyente * Diversos estudios demuestran que el papel del contexto es mayormente el de suprimir la ambigedad del significado de un estmulo que tiene una historia mezclada de condicionamiento y extincin. * El contexto tiene menor importancia con estmulos con historial de solo un tipo de condicionamiento. * El restablecimiento se considera una forma de renovacin , las claves contextuales que da algunas de las claves para la respuesta excitatoria en condiciones normales se extinguen cuando se presenta el EC solo. 2.5- Sensibilidad a la Devaluacin del Reforzador + Contingencia Operante (Instrumental) * El procedimiento de devaluacin de un reforzador consiste en asociar de forma pavloviana el estmulo que se est usando para reforzar una conducta con algn estmulo aversivo. * El efecto resultante es una disminucin de la respuesta operante reforzada con este reforzador devaluado aunque la respuesta nunca haya sido contingente con el estmulo aversivo (o el reforzador siquiera) + Contingencia Clsica (Pavloviana/ Respondiente) * El procedimiento es similar, consistente en asociar el EI con otro EI de naturaleza inversa (aversivo), provocando una disminucin de la RC ante el EC, aunque el EC nunca se haya relacionado con el EI aversivo. + Conclusiones * El efecto de devaluacin del reforzador se observa tambin en estmulos (C.Clasico) y respuestas (C. instr.) que han sido sometidas a procedimientos de extincin. * Si despus de extinguir un EC devaluamos el EI con el que se condicion, la RC ante ese EC ser todavia menor que si simplemente lo hubieramos extinguido. * Este fenmeno se usa como evidencia para defender que los procesos de extincin no eliminan las asociaciones realizadas durante el condicionamiento, aunque el sujeto no emita las respuestas correspondientes. 3.- Que se Aprende de la Extincin? 3.1- Asociaciones E-R Inhibitorias * La falta de reforzamiento produce una asociacin E-R inhibitoria, la extincin supone un tipo especial de ausencia de reforzamiento que resulta algo aversiva. * La ausencia de reforzamiento sin el reforzamiento previo no es extincin sino habituacin. * Los efectos emocionales de la ausencia de reforzamiento dependen de forma crtica de la historia previa del sujeto. * Los efectos son conductuales y emocionales, siendo uno de los resultados emocionales la frustracin, una respuesta aversiva incondicionada, que supone una asociacin E-R inhibitora para dejar de responder 3.2- Efectos Paradjicos de la Recompensa * Cuanto ms entrenamiento con reforzamiento se proporciona, ms fuerte ser la expectativa de recompensa y en consecuencia mayor ser la frustracin ante la extincin. + Efecto de Sobreentrenamiento en la Extincin * Si la disminucin en la respuesta se debe a los efectos de la frustracin de la ausencia de reforzador o EI, un entrenamiento ms extenso debera producir una extincin ms rpida, aunque parezca contradictorio. + Efecto de la Magnitud del Reforzamiento en la Extincin * La respuesta disminuye ms rapido durante la extincin que sigue a un reforzamiento con un reforzador mayor, puesto que supone una mayor frustracin. 40
+ Efecto de Reforzamiento parcial en la Extincin (ERPE) * Los efectos de la extincin sern diferentes segn el programa de reforzamiento usado, siendo ms lento y con menos frustracin si el reforzamiento es parcial o intermitente en lugar de continuo por ejemplo. 3.3- Mecanismos del Efecto de Reforzamiento Parcial en la Extincin * Hipotesis de la Discriminacin: la ausencia de reforzamiento es mucho ms facil de detectar y acusar tras el reforzamiento continuo. * El reforzamiento parcial acostumbra a los sujetos a la posible ausencia del reforzador y seguir intentndo. + Teora de la Frustracin * De Abraham Amsel: Los sujetos en entrenamientos parciales aprenden a sufrir los efectos emocionales de la ausencia de recompens y a continuar respondiendo a pesar de no ser reforzado o ser frustrado. * Por contra en el reforzamiento continuo nada motiva a los individuos a seguir respondiendo cuando esperan una ausencia de la recompensa, no produce persistencia a la extincin. + Teora Secuencial * Capaldi formula esta teora en trminos de conceptos de memoria. Los sujetos aprenden con la memoria de ausencia de recompensa, y mientras recuerden que esto era una probabilidad, tender a seguir respondiendo como en su condicionamiento intermitente.
41