Вы находитесь на странице: 1из 8

Universidad de Concepcin Facultad de Ciencias Sociales Departamento de Psicologa _________________________

Asignatura: Procesos Psicolgicos Bsicos Docente Coordinadora: Dra. Nieves Schade Y. Carrera : Psicologa Curso : Primer ao Perodo : 1er. Semestre de 2010 ________________________________________

Tema: APRENDIZAJE
Prof. Dr. Ral Edo. Martnez M.

4.- Condicionamiento Operante


Thorndike (1874-1949) descubri la ley del efecto en 1898 mientras desarrollaba su tesis doctoral sobre la inteligencia animal. Esta expresa en esencia que cuando un acto es seguido por una recompensa tiende a repetirse, mientras que cuando es seguido por un castigo, disminuye su probabilidad de aparicin. Lo expresa as en 1913: "Cuando se establece una conexin modificable entre una situacin y una R, y sta es acompaada o seguida por una situacin satisfactoria, se refuerza la intensidad de tal conexin. Cuando la R es, por el contrario, acompaada o seguida por una situacin que no es satisfactoria, la intensidad de la conexin decrece". La ley del efecto era, junto a la de la disposicin (motivacin) y del ejercicio (prctica) la base del aprendizaje por ensayo y error o tanteo, que Thorndike llam ms tarde por "seleccin y conexin" (ej: de gato encerrado en jaula, hambriento y fuera de ella a la vista del animal un trozo de pescado. El gato resuelve el problema a travs de sucesivos tanteos hasta precisar su R, de forma muy diferente a como lo hacen los monos de Khler, que actan razonando y previendo los resultados de sus acciones). Skinner (1937) acu la denominacin "condicionamiento tipo R", para enfatizar el papel central de la R ms que de los Es, como en el condicionamiento respondiente que l llam tipo E. (aludiendo a la transferencia del control de Es que ocurre). Hilgard y Marquis (1940) lo llamaron "condicionamiento instrumental", indicando con ello que la R involucrada sirve al sujeto como medio para el logro de ciertos fines. En esta denominacin est implcito el concepto de propositividad o sentido teleolgico (el hacer algo para obtener resultado). En este caso, la R asume el rol de variable dependiente (VD) en la medida que su aparicin depende de lo que haya acontecido en el pasado (variable independiente: VI), inmediatamente despus de ella; agregando los tericos que proponen procesos cognitivos mediacionales anticipatorios, la previsin de similares acontecimientos futuros asociados a la Op (operante). La adquisicin operante dependera del efecto ms o menos inmediato de la Op. en el ambiente, mientras que la ejecucin y el mantenimiento de la Op. dependera de los procesos cognitivos que anticipan las Cs. El trmino "condicionamiento operante" se debe a Keller y Schoenfeld (1950) quienes enfatizan el hecho de que la R que es objeto de estudio opera, acta, tiene un efecto sobre el medio, y en tal sentido debera entenderse que una R operante asume el papel de una VI, siendo los cambios en el medio que le siguen, correspondientes a la VD. El rol atribuido al O es activo y no reactivo, como en el caso de la R respondiente y el CR. Otros nombres con que se le ha designado son: "condicionamiento por refuerzo" (Razran), "condicionamiento heterodinmico" (Zeliony), "condicionamiento condicionado" (Ivanov 17

Smolensky), "condicionamiento tipo II" (Konorski y Miller, 1937). Actualmente el trmino ms usual es el de "condicionamiento operante" (C.Op.) A diferencia de la respondiente (Re), R propia del condicionamiento del mismo nombre, que es claramente reactiva (se dice "provocada"), la Op. es una R "espontnea" (se dice "emitida" por el O). Skinner aclara que ello no equivale a sostener que la conducta espontnea est libre de fuerzas determinantes, sino slo que no son perceptibles en un momento dado para quien la observa, o que no se intenta conocerlas por su complejidad o porque la historia se reconoce en la actualidad. 4.1.- Paradigma bsico La situacin general del condicionamiento operante puede representarse de la forma siguiente: 3 ED
4 1 2

Operante

C+ -

Aumento o disminucin de la probabilidad futura de aparicin de Ops similares, o de su tasa (frecuencia en unidad de tiempo)

4.2.- Variables Operante R emitida espontneamente por un O (antes de producirse el C. Op.), que produce un cambio consecuente en el medio (es seguida por ste) de modo contingente, importante para todas las personas o para un individuo en particular. Para clasificar una R como Op, en primer lugar debe descartarse la posibilidad de que est controlada totalmente por un E provocador (en cuyo caso se tratara de una Re), y luego, que su probabilidad de aparicin y tasa sea afectada por los Es que le siguen. Consecuencia E que sigue a una Op de modo contingente (real o percibido por el O) y que previsto por el O, afecta la futura probabilidad de aparicin y tasa de ocurrencia de Ops. similares a la emitida inicialmente. E inductor E que constituye parte de la situacin total en que el O, luego de emitir una Op., recibe una C. determinada (positiva o negativa), convirtindose por tal motivo luego del C. Op., en la ocasin para la emisin (estmulo discriminativo: ED) o la inhibicin (estmulo delta: E) de Ops. similares a la inicial. 4.3.- Procesos Dentro de una presentacin resumida de los diferentes fenmenos del C. Op., cabe distinguir los siguientes procesos:
18

I.- Establecimiento de relaciones funcionales entre Op y C. I.1.- Condicionamiento de una clase de Ops. - Procesos generales: Fortalecimiento y Debilitamiento (cambio de la Op. en parmetros: frecuencia, intensidad, duracin), y sus correspondientes Procesos Especficos. - Procesos especficos dentro del Fortalecimiento: Acercamiento, Escape y Evitacin, y los correspondientes Procesos especficos dentro del Debilitamiento: Supresin, Inhibicin y Extincin. - Procesos derivados: Generalizacin y Diferenciacin de R. - Procesos de estabilizacin del cambio producido: Mantenimiento. I.2.- Condicionamiento de varias Ops. relacionadas - Procesos: Moldeamiento y Encadenamiento. II. -Establecimiento de relaciones funcionales entre C, E inductor y Operante - Procesos: Generalizacin y Discriminacin de Es inductores.
4.3.1.-Fortalecimiento

(Cuadro Resumen) Nombre de Operacin Proceso Especfico Acercamiento Escape Evitacin Emocin Agrado Alivio Tranquilidad

Proceso General Fortalecimiento

Operacin Op Op Op

C + Reforzamiento positivo C - Reforzamiento negativo 0 C - Interrupcin de castigo (prevencin)

Operaciones a.- Reforzamiento positivo: consiste en la accin de presentar, entregar/obtener, contingentemente a la Op. emitida por un O y despus de ella, una C + ( reforzador positivo). Un reforzador positivo es "todo E consecuente (C) que incrementa la probabilidad de aparicin o tasa de una Op. y que el O comprometido intenta obtener y/o mantener (siempre que permanezca una misma condicin motivacional apropiada)". Ejs: alimento, agua, acceso a lugares desconocidos, variaciones de color, forma, etc., placer sexual, dinero, aprobacin social, afecto, atencin, etc. b.- Reforzamiento negativo: consiste en la accin de retirar/eliminar contingentemente a la Op. emitida por un O, un E aversivo, preexistente. Un E aversivo es "aqul que el O comprometido intenta eliminar escapando de l (alejndose o bloqueando su recepcin) o retirando la situacin. Ejs. : ante un shock elctrico el animal presiona la palanca que lo suspende; ante un ruido, un individuo se aleja del lugar, se cubre los odos o acta sobre la fuente del ruido; ante la lluvia que lo moja el S se cubre con el paraguas; al sentir hambre, come un alimento (reduce hambre/apetito) o intenta no pensar en ella (reduce tensin). c.- Interrupcin de castigo: consiste en la accin de retener/impedir contingentemente a la Op., emitida por el O la aparicin de un E aversivo, de tal forma que el O al emitir la Op. apropiada impide la presentacin de la C negativa, regularmente en curso previamente. Para que esta operacin pueda ser llevada a cabo, se requiere que el O haya aprendido a escapar previamente del E aversivo. (ejemplos referidos a situaciones de reforzamiento negativo previo: evitar lugar ruidoso, salir con paraguas en da nublado sin lluvia).

19

4.3.2.- Debilitamiento Proceso General Debilitamiento Operacin Op Op Op Operaciones CC+ 0C +

(Cuadro Resumen) Nombre de Operacin Castigo por imposicin Castigo por remocin de refuerzo positivo Interrupcin de Ref. + Proceso Especfico Inhibicin Supresin Extincin Emocin Ira Desagrado Frustracin

a.- Castigo por imposicin: consiste en la accin de presentar/obtener contingentemente a la Op. un E aversivo. Ejs: ruido intenso, descarga elctrica, fro, crtica, insulto, desafecto, etc. b.- Castigo por remocin: consiste en la accin de retirar/perder contingentemente a la Op. emitida, un reforzador positivo no relacionado (segn la experiencia del O) con la Op. que se desea debilitar. Ejs: retiro de dinero, de actividad ldica, de poder, de acceso a la informacin, etc. c.- Interrupcin de reforzamiento positivo: accin de retener/perder contingentemente a la Op. el reforzador positivo que especficamente fortaleci previamente a la Op. que ahora se pretende debilitar. Ejs: si un animal aprieta una barra para el logro de alimento, se retiene de un momento en adelante el alimento. En general, cualquier reforzador positivo puede retenerse. Si un nio recibe atencin por conducta "escandalosa", deja de prestrsele de un momento en adelante. Obviamente, para aplicar con eficacia la interrupcin de reforzamiento positivo, se requiere conocer el reforzador positivo especfico. Esta limitacin no la tiene el castigo por remocin. Variables que afectan el proceso especfico de Acercamiento La estimacin acerca de la efectividad de la operacin de reforzamiento positivo conducente al fortalecimiento, toma en cuenta tanto la elevacin progresiva de la tasa de R como el nivel asinttico alcanzado (nivel mximo de ejecucin). Se pueden citar como variables fundamentales entre otras la magnitud del reforzador positivo, la magnitud de la necesidad o nivel motivacional del O, el retardo del refuerzo positivo, interaccin de la cantidad y calidad del reforzador positivo y el tipo de contingencia (K) usada.
Tipos de Contingencia (K)

El tipo de K entre la Op. y el reforzamiento positivo determina una forma de emisin tanto durante el fortalecimiento como en la etapa de debilitamiento. Es til distinguir varios tipos de K que pueden agruparse en parejas: obligatoria-fortuita, sistemtica-asistemtica, inmediata-retardada, continua-intermitente. K obligatoria: el reforzamiento positivo es absolutamente dependiente de la Op. en el sentido de ser producido por sta directamente.Por ejemplo, el cambio de ubicacin espacial (C) resulta de una Op. de desplazarse (caminar, correr, etc.); el preguntar (Op), obtiene una respuesta (C); presionar un interruptor de luz es seguido por iluminacin.

20

K fortuita: el O percibe/supone/establece una relacin funcional entre una Op. suya y un acontecimiento en el medio, que no deriva natural y realmente de ella. En el ser humano esto es factible por el ejercicio de procesos cognitivos, mientras que en especies inferiores y tambin humanos por yuxtaposicin de acontecimientos (Op y C). Esta situacin puede conducir a la conducta "supersticiosa". Por ejemplo, pensar positivamente (Op.) respecto a una persona es seguido por el hallazgo de un billete de $ 10.000 (supuesta C) En los procedimientos experimentales naturalmente que la K se establece con caractersticas de obligatoria, a partir de las decisiones de programacin del experimentador en la entrega del reforzador positivo, pero para el O puede ser fortuita en cuanto a la relacin entre su Op. y la C. K inmediata: el reforzador positivo escogido sigue muy de cerca de la Op. previa, y en condicin ptima para asegurar su efecto en especies inferiores y nios pequeos, debera corresponder al primer E (cambio del medio ambiente) que apareciera luego de la Op. K retardada o demorada: el reforzamiento positivo de prorroga por segundos y hasta minutos en el caso de especies inferiores y nios. El C. Op. de adultos es posible con K retardada de horas, das o meses. En este caso, entre la Op. y el reforzamiento positivo hay otros eventos E o por lo general el mero paso del tiempo. En el caso de otros Es se requiere naturalmente que el O asocie la Op. con el reforzador positivo correspondiente y no estime como C otros Es. Se sabe que la carencia de reforzadores positivos intermedios en el camino a la obtencin de reforzadores finales importantes, podra acontecer "desgano" y "prdida de objetivos". K sistemtica: la Op. siempre es seguida por el mismo reforzador positivo u otro similar. Como resultado la Op. es emitida o no segn claros ED y E delta, y aparecer de modo predecible en funcin stos. K asistemtica: la Op. es seguida de otras Cs distintas al reforzador positivo original en diferentes apariciones y ello fuerza al O a una discriminacin de las circunstancias que puede no estar en condiciones de llevar a cabo, interfiriendo con el desarrollo del C.Op. K continua: el reforzador positivo es entregado luego de cada emisin de la Op., de tal forma que esta es reforzada en un 100% de las ocasiones. Como resultado, el condicionamiento es ms rpido que con una K intermitente. K intermitente: el reforzador positivo se administra de acuerdo a cierto tiempo transcurrido desde la ltima aparicin de la Op. o cierto nmero de emisiones de la Op., de tal forma que el reforzador positivo slo sobreviene en un porcentaje de apariciones de la Op. La K intermitente es la ms usual en la interaccin social y es la clave para explicar muchas caractersticas de la conducta, atribuidas a impulsos "espontneos", caractersticas de personalidad duraderas, etc. Se distinguen 4 tipos de K intermitente: razn fija (RF), razn variable (RV), intervalo fijo (IF) e intervalo variable (IV). 4.3.3.- Moldeamiento Cuando el objetivo perseguido con el C. Op. es elaborar una Op. nueva, inexistente en el repertorio conductual del O precisar su forma, debe recurrirse al moldeamiento que se vale en esencia de 2 operaciones sucesivas y entrelazadas que se resumen con el trmino: "reforzamiento
21

diferencial", el que consiste en reforzamiento positivo para las Ops. de direccin apropiada y castigo o interrupcin de reforzamiento positivo para las Ops. de direccin inadecuada. El principio de las aproximaciones sucesivas exige que el moldeamiento elabore la Op. deseada, paso a paso. Para comenzar con el procedimiento de moldeamiento se aprovecha el aumento de la actividad operante del O, consecutiva a la recepcin de reforzamiento positivo y posterior interrupcin de ste. De la serie de Rs exhibidas por el O, se escoge para reforzar positivamente aqulla en la direccin apropiada, generando la extincin de las restantes. Una vez establecida una R, se deja de reforzar, aumentando la variacin conductual, lo que permite disponer de varias Rs, una de las cuales se acerca ms a la meta. Cada pequeo avance hacia la forma final debe recibir reforzamiento positivo, de tal manera que va elevndose el criterio progresivamente para entregarlo. En el caso de un nio que aprende a escribir: Tirar lpiz Tomar lpiz Mirar hacia otro lado Golpear con lpiz Rayar Morder el lpiz

Lpiz

Ref. +

Interrup. Ref. +

Ref. +

Interrup Ref. +

Rayar papel Dibujar lneas

Ref.+

Int. Ref.+

Escribir

En el caso del C. Op. en seres humanos, habitualmente antecede a la Op. y el reforzamiento positivo una indicacin general ("toma el lpiz") o una instruccin ("lanza el puo hacia el frente, piernas separadas, tronco recto", etc. en karate), que actan como ED, en el sentido que frente a l la Op. correcta recibir reforzamiento positivo procedente de fuera o de s mismo (Es propioceptivos, evaluacin personal, etc.) 4.3.4.- Encadenamiento En este caso, se trata del establecimiento de una secuencia de Ops. (existentes en el repertorio del O) unidas por reforzadores positivos condicionados. En el encadenamiento hacia adelante, utilizado en el ser humano, la situacin de aprendizaje se establece de tal forma que a una primera Op. se le hace seguir un reforzador positivo condicionado, el que a su vez asume la calidad de ED para la siguiente Op.constituyndose de esta forma una cadena conductual en la cual un eslabn es representado por un ED, una Op. y un reforzador positivo condicionado. El encadenamiento hacia atrs es el procedimiento utilizado en especies infrahumanas, y comienza con el reforzamiento positivo de la ltima Op. de una cadena, continuando con el de la penltima y as sucesivamente hasta el inicio de la cadena. 4.4- Condicionamiento Operante de diversos tipos de respuesta humana
1) Wolf, Risley y Mess (1964)

O : Nio autista de 3 aos y medio Ops.: 1.- Usar anteojos Objetivo: Lograr dicho comportamiento (Moldear) 2.- Arrojar anteojos Objetivo: Eliminar el comportamiento (Debilitar) Diseos de investigacin: 1: AB 2: ABAB

22

Antecedentes generales: Carlos no coma bien y no posea repertorios sociales y verbales de tipo normal. Presentaba conductas autodestructivas extremas. Se le admiti en un hospital psiquitrico, donde se recuper de la esquizofrenia, pero no lleg a usar los anteojos recomendados por el oftalmlogo, quien haba advertido que si el nio no los utilizaba dentro de 6 meses, perdera definitivamente parte importante de la visin. Procedimientos 1. Usar anteojos El moldeamiento comenz a intentarlo un asistente, que permaneca en la habitacin del nio durante 20 minutos, en dos o tres sesiones diarias. "El plan original era el siguiente: en un principio se intentara hacer que el nio usara los anteojos sin vidrios; posteriormente y una vez logrado esto, deberan introducirse los lentes, siguiendo tres etapas hasta alcanzar la graduacin prescrita". Problemas: el asistente no aplic exactamente el moldeamiento y por resistencia del personal a privar al nio de alimentos, debi usarse como reforzadores frutas y dulces, que se demostraron Cs muy poco efectivas. Luego de algunas semanas y escaso avance, se intent manejar en forma ms estricta la privacin de alimento, y as, el moldeamiento se llev a cabo a la hora del desayuno: el nio slo reciba bocados cuando emita alguna Op hacia el uso de los anteojos. A pesar de variaciones introducidas en el marco de los anteojos, al fin de la quinta semana, el nio an no se los pona bien; de all que los propios psiclogos se dedicaron a moldear el comportamiento. Se aprovech una tarde en que el nio haba comido muy poco, y se us leche malteada como reforzador. Observando que la respuesta del nio era ptima, se decidi utilizar los lentes con la graduacin prescrita. Despus de unos 30 minutos, Carlitos se puso adecuadamente los anteojos, y desde all se obtuvo un rpido progreso en el tiempo que usaba los lentes. Luego, se cambi a otros reforzadores positivos, como paseos en coche, caminatas, juegos en el exterior, etc. Estas actividades placenteras se suspendan (interrupcin de reforzamiento positivo) si el nio se quitaba los anteojos. Cuando Carlitos fue dado de alta (a los 120 das) haba usado sus anteojos por ms de 600 horas, cerca de 12 hrs. al da, en promedio. 2. Arrojar anteojos Este problema apareci luego que el nio comenz a usar los anteojos. Una semana ms tarde, tir por primera vez los anteojos. Se comenz a poner al nio en su habitacin, dejndolo ah unos 10 minutos (castigo por remocin de reforzador positivo) cada vez que tiraba los anteojos. El acto disminuy hasta cerca de 0 en 5 das. Posteriormente las condiciones volvieron a ser las iniciales y no se llevaba por lo tanto al nio a su habitacin cuando arrojaba los lentes. Despus de 3 semanas, la frecuencia del comportamiento inadecuado alcanz nuevamente el nivel inicial. Por tal razn, se reinstal el aislamiento en su habitacin. Seis das despus la frecuencia de la Op. descendi otra vez a 0.
2) Lovaas (1967)

O : Nio autista Op.: 1. Comportamiento autodestructivo (golpes en la cabeza, rasguos, etc.) Objetivo: Eliminar dicho comportamiento (Debilitar) 2. Contacto fsico con adultos Objetivo: Desarrollar el comportamiento (Fortalecer)
23

Cs.: Castigo por imposicin para comportamiento autodestructivo: descarga elctrica. Reforzamiento negativo para contacto fsico con adultos: cese de descarga elctrica. Reforzamiento positivo para contacto fsico con adultos: besos y abrazos. Diseo: ABAB Procedimiento: El nio reciba una descarga elctrica cada vez que mostraba conductas autodestructivas. Estas descargas, dolorosas pero inofensivas, cesaban una vez que el nio dejaba de comportarse autodestructivamente, al mismo tiempo que se tomaba contacto fsico con l, abrazndolo y besndolo. En el grfico se aprecian los resultados en las distintas fases del diseo.

----------------------------------------------------------------------------------------------------------------------Apuntes elaborados por Prof. Dr. Ral Edo. Martnez M. Para USO EXCLUSIVO de los alumnos de la Carrera de Psicologa de la Universidad de Concepcin (Chile) Asignatura: Procesos Psicolgicos Bsicos Curso: Primer ao (2010) Docente Responsable: Dra. Nieves Schade Y.
REMM/remm 12 de mayo, 2010

24

Вам также может понравиться