En psicologa, el condicionamiento operante es una forma de aprendizaje en la que la consecuencia (el
estmulo reforzador) es contingente a la respuesta que previamente ha emitido el sujeto. El condicionamiento operante implica la ejecucin de conductas que operan sobre el ambiente.
El condicionamiento operante es un tipo de aprendizaje asociativo que tiene que ver con el desarrollo de nuevas conductas en funcin de sus consecuencias, y no con la asociacin entre estmulos y conductas reflejas existentes como ocurre en el condicionamiento clsico. Los principios del condicionamiento operante fueron desarrollados por B.F. Skinner, quien recibi la influencia de las investigaciones de Pavlov y de Edward L. Thorndike.
El nombre condicionamiento operante es el que dio Skinner, aunque hoy se prefiere el de condicionamiento instrumental, por ser ms descriptivo. Roger Tarpy los equipara, decantndose por el trmino instrumental, especialmente para el aprendizaje humano, aunque para todos en general. Para l ambos son iguales en tanto en cuanto ambos dan lugar a consecuencias reforzantes. Desde el punto de vista histrico, el trmino de condicionamiento operante se ha utilizado para hacer referencia a situaciones experimentales en las que los sujetos actan a su propio ritmo, en contraposicin a recibir ensayos directos. Algunos defienden en esto la separacin de ambos trminos que por lo dems se considera poco operativa.
Aprendizaje por condicionamiento operante
En el condicionamiento operante las conductas se emiten espontneamente y sus consecuencias determinan el aprendizaje. Las consecuencias agradables tienden a fortalecer una conducta. En cambio, las consecuencias desagradables tienden a debilitar una conducta contingente
Un ejemplo claro del aprendizaje por condicionamiento operante ocurre en los perros que halan la correa cuando salen a pasear. El perro hala la correa y su propietario lo sigue, hasta que llegan a donde el perro quiere ir. Entonces, la conducta (inapropiada) de halar la correa se fortalece porque el perro consigue lo que quera.
Por el mismo proceso de aprendizaje, aunque con consecuencias negativas, algunos nios aprenden que no deben tocar la estufa cuando est caliente. Cuando tocan la estufa se queman la mano. Entonces, la conducta de tocar la estufa cuando est encendida desaparece porque tiene consecuencias desagradables.
Thorndike comenz con sus denominadas Caja Problema, jaulas por las que se puede escapar si se tira de una polea que hay en el interior. Meti en una de estas cajas a un gato hambriento. El gato poda ver que fuera de la caja haba comida, pero no poda alcanzarla. Lo que el gato comienza a hacer son movimientos azarosos hasta que casualmente tira de la polea que abre la jaula. Cada vez que Thorndike meta al gato en la jaula, tardaba menos en salir. Esto se deba a que se estaba produciendo un condicionamiento operante: la conducta de tirar de la polea estaba siendo reforzada por su consecuencia (la apertura de la caja y la obtencin de la comida). Esta conducta, al ser reforzada, se convierte en la conducta ms probable en un futuro cuando las circunstancias sean iguales.
Tipos de condicionamiento operante
1. Reforzamiento. Cualquier adicin (para aumentar la frecuencia del comportamiento) o retiro (para disminuir la frecuencia del comportamiento) de algn estimulo o artefacto como consecuencia de cualquier conducta.
Por ejemplo, tu perro se sienta y le das comida cuando lo hace. Tu perro se sienta cada vez con ms frecuencia porque la comida ha funcionado como estmulo reforzador. Esto se conoce como reforzamiento positivo porque la adicin de una consecuencia positiva (comida) aumenta la frecuencia de la conducta (sentarse).
Ahora imagina que tu perro tiene miedo de la gente. Una persona se le acerca y l ladra agresivamente. La persona se aleja y tu perro deja de sentir miedo. Entonces, aprende que ladrando agresivamente puede hacer que la gente que teme se aleje. Esto se conoce como reforzamiento negativo porque el retiro de un estimulo aversivo (la gente) aumenta la frecuencia de la conducta (ladrar agresivamente).
2. Castigo. Comportamiento usado para extinguir o anular algn comportamiento de algn organismo.
Imagina que tu perro se acerca a un extrao al que no le gustan los perros, y esta persona le da una patada. Entonces, tu perro aprende a evitar a las personas. Esto se conoce como castigo positivo porque la adicin de algo (la patada) disminuye la frecuencia de la conducta (acercarse a las personas). Este tipo de castigo no es recomendable en el adiestramiento porque tiene consecuencias adversas que implican dao fsico y/o emocional del organismo.
Un caso diferente ocurre si tu perro est jugando contigo al tira y afloja. T tiras del extremo de un trapo, mientras tu perro tira del otro extremo. En su entusiasmo por morder el trapo, tu perro te muerde la mano por lo que terminas el juego y te vas. Entonces tu perro aprende a no morderte cuando juegan. Esto se conoce como castigo negativo, porque el retiro de algo (el juego) disminuye la frecuencia de la conducta (morder tu mano).
3. Extincin. Es la disminucin de la frecuencia de una conducta aprendida, que ocurre cuando dicha conducta no tiene consecuencias. Es decir que dejan de existir las consecuencias que antes reforzaban la conducta.
Imagina que cuando tu perro era un cachorro saludaba a las personas saltando sobre ellas, porque lo acariciaban y jugaban con l. Entonces aprendi que esta es la manera correcta de saludar a la gente. Un buen da, la gente deja de acariciarlo y jugar con l cuando salta. En cambio, le dan la espalda y lo ignoran. Con el tiempo tu perro deja de saltar para saludar a las personas. Esto ocurre porque la conducta aprendida (saltar sobre las personas) deja de tener consecuencias reforzantes y, entonces, se produce la extincin de la conducta.
4. Discriminacin y control por el estmulo. Es el aumento de la frecuencia de una conducta en presencia de un estmulo, pero no en presencia de otros.
Estrategias de modificacin de conducta operante Existen una variedad de estrategias desarrolladas para modificar, establecer y desvanecer la conducta dentro del paradigma operante. Por ejemplo:
Moldeamiento Encadenamiento Entrenamiento de omisin Castigo Control de respuesta Tiempo fuera
Moldeamiento
El moldeamiento es una estrategia psicolgica con la cual se pretende aumentar la frecuencia de una conducta en un individuo que no la realiza o que no la hace con tanta frecuencia como se deseara. Sirve para establecer conductas complejas que aun no existen en el repertorio comportamental de un individuo. Consiste en reforzar en aproximaciones sucesivas, conductas que el sujeto emita que se asemejen a la conducta meta.
El moldeamiento se utiliza cuando el sujeto (frecuentemente nios o personas con deficiencia mental) no saben realizar la conducta porque les resulta compleja. Por ello, no se ofrece un refuerzo o reforzador positivo cuando consigue hacer la accin. En su lugar, la conducta se descompone en sus partes ms simples y se escalona su aprendizaje, tomando en un primer lugar las ms elementales y avanzando hacia las ms complejas. As, se va reforzando una a una, primero las elementales y progresivamente, las ms complicadas, apoyadas en las anteriores.
Gracias a esta estrategia, el paciente va aprendiendo poco a poco una conducta originariamente muy compleja y fuera de su repertorio.
Por ejemplo, si un profesor est ensendole a un alumno a escribir el numeral "1", puede empezar por reforzarle cuando haga una lnea curva. De todas las lneas curvas que haga, algunas sern ms rectas y ms verticales que otras. Ya habiendo establecido las lneas curvas, el maestro empezar a reforzar las que sean ms rectas, y as sucesivamente.
Tiempo fuera
El Tiempo Fuera es una estrategia psicolgica de intervencin, muy utilizada con nios, para conseguir eliminar una conducta inadecuada.
Con el Tiempo Fuera aplicamos un entrenamiento de omisin (le quitamos algo que le gusta) al privar al nio de todo tipo de reforzador que poda recibir en su contexto, aislndolo durante un periodo breve de tiempo (de 1 a 5 minutos) cuando ha realizado una conducta que deseamos eliminar.
Un ejemplo de esta tcnica, sera que, ante un comportamiento agresivo de un nio para quitarle el juguete a un compaero, le llevsemos al pasillo y le dejsemos ah, quieto y sin poder hacer nada. Esta tcnica ha de ser explicada previamente al nio; se le ha de decir, desapasionadamente (para que no obtenga el reforzador de la atencin) que su comportamiento no ha estado bien, y que le vamos a dejar fuera para que piense en lo que ha hecho.
Condicionamiento instrumental
En psicologa, el condicionamiento instrumental es una forma de aprendizaje en la que la consecuencia (el estmulo reforzador) es contingente a la respuesta que previamente ha emitido el sujeto. Se le llam en principio "operante" porque el organismo opera sobre el medio para recibir una consecuencia.
El nombre que B.F. Skinner dio a este tipo de aprendizaje fue condicionamiento operante, aunque hoy se prefiere el de condicionamiento instrumental, por ser ms descriptivo, aunque hay quien ve algn matiz distintivo desde posiciones puramente conductistas. Fue l precisamente el primero en distinguir entre este tipo de condicionamiento y el condicionamiento clsico.
Distincin entre condicionamiento clsico y operante
En el condicionamiento clsico la asociacin se da entre un estmulo condicionado y uno incondicionado. En el condicionamiento instrumental, la asociacin se da entre las respuestas y las consecuencias que se derivan de ellas. En el condicionamiento clsico, el estmulo incondicionado no depende de la respuesta del sujeto, mientras que, en el operante, las consecuencias dependen de la respuesta del sujeto. En el condicionamiento clsico, la respuesta del sujeto es involuntaria, mientras que en el instrumental es generalmente voluntaria. La distincin entre ambos condicionamientos para los conductistas ms radicales es tanto operativa como de procesos:
Operativa, ya que el reforzador depende de la respuesta, de la conducta, por lo tanto. Procesal, estando implicado en un caso el sistema nervioso autnomo y en el otro el sistema nervioso central. ESTA DIFERENCIA NO HA SIDO DEMOSTRADA EXPERIMENTALMENTE DE MANERA PBLICA ANTE LA COMUNIDAD CIENTFICA PERO LA EVIDENCIA ENCONTRADA EN ESTA INVESTIGACIN EXPONE CLARAMENTE QUE NO SOLO SE TUVO QUE HABER LOGRADO DEMOSTRAR EXPERIMENTALMENTE, SINO QUE LOS RESULTADOS OBTENIDOS PROCESALMENTE SOBRE RESPUESTAS EMITIDAS POR EL SISTEMA NERVIOSO AUTNOMO SON ALARMANTEMENTE EFICACES, SI BIEN LOS FINES CON LOS QUE SE HAN UTILIZADO SON TOTALITARIOS, PREPSTEROS Y PROTERVOS.
Estmulos
Lo verdaderamente importante en este tipo de condicionamiento es la respuesta generada ante el estmulo. Cualquier proceso de condicionamiento instrumental admite el uso de estmulos que en condicionamiento pavloviano podran clasificarse como condicionados, incondicionados o neutros, ya que el anlisis no se concentra en ellos sino en las consecuencias de las respuestas, que son las que determinan la probabilidad de que la conducta se repita o no.
En el condicionamiento instrumental los estmulos incondicionados se usan igual que en el pavloviano. El estmulo incondicionado (EI) es el resultado que sigue a la respuesta (por ejemplo comida, descargas elctricas...)
Tambin se usan estmulos condicionados (EC), estmulos relativamente inocuos sin significado o poder especfico, al menos al comienzo del entrenamiento.
El estmulo discriminativo es un estmulo neutro que indica cundo la respuesta puede conducir o no a la consecuencia deseada. Es decir, el estmulo discriminativo indica si el reforzador est disponible. Por oposicin, el estmulo delta es el estmulo que no estuvo presente cuando la respuesta fue reforzada, y por lo tanto no da informacin sobre la disponibilidad del reforzador.
Respuestas
La respuesta incondicionada (RI) es la provocada por el EI de forma refleja y que viene determinada por l.
La respuesta condicionada (tambin llamada respuesta instrumental) suele ser distinta a la RI, siendo bastante arbitraria.
Fases
Las fases de un experimento de condicionamiento instrumental son esencialmente las mismas que en el caso del condicionamiento clsico:
Adquisicin Extincin
Programas de reforzamiento
Un programa de reforzamiento es una regla sobre la administracin del reforzador. Existen programas de reforzamiento de dos tipos: de razn (en funcin de la respuesta) y de intervalo (en funcin del tiempo), y cada uno admite una administracin fija o variable.
En un programa de razn fija se administra un reforzador cada cierto nmero de respuestas. Un programa RF1, por ejemplo, da un reforzador por cada respuesta. El RF2 da un reforzador por cada dos respuestas. El programa de razn variable administra reforzadores cada cierto nmero de respuestas. Pero en este caso, este nmero no es fijo, sino que vara alrededor de un promedio. RV3 da una respuesta cada 2, 3 4 respuestas, aproximadamente (y aleatoriamente). Un programa de intervalo fijo implica un perodo siempre igual durante el cual no hay disponibilidad del reforzador, perodo que se inicia justo despus de la presentacin de la respuesta criterio (es decir, aquella de inters). El hecho de que el sujeto emita o no respuesta alguna durante el transcurso del intervalo no modifica el ritmo de administracin de los reforzadores. El programa de intervalo variable hace que el perodo durante el cual no est disponible el reforzador cambie alrededor de un promedio. Por lo general, los programas de tasa (razn) producen una adquisicin ms rpida, pero fcilmente extinguible una vez suspendida la administracin de reforzadores; y los de intervalo producen una adquisicin ms estable y resistente a la extincin.
Tipos
Existen cuatro procedimientos o tipos de condicionamiento instrumental:
Condicionamiento de recompensa Entrenamiento de omisin Castigo Escape y evitacin (Aunque distintos, ambos se consideran dentro del mismo procedimiento, ya que ambos implican la no ocurrencia del estmulo incondicionado aversivo.)
Entrenamiento de omisin
El entrenamiento de omisin es, en psicologa, un tipo de condicionamiento instrumental.
Aunque en la literatura psicolgica a menudo se ha usado el nombre de castigo negativo para este tipo de condicionamiento, ese trmino ha sido relegado en aras de la claridad, ya que a menudo el trmino castigo conduca a error.
El entrenamiento de omisin consiste en que el resultado que sigue a la respuesta dada por un individuo es la ausencia de un estmulo apetitivo; es decir, la conducta da lugar a la omisin de la recompensa.
Un ejemplo de castigo negativo podra ser la mala costumbre de mandar a los nios a la cama sin cenar: la consecuencia de su conducta es quitar un estmulo considerado como positivo o apetitivo (excepto, claro que la cena no fuera del gusto del nio).
El entrenamiento de omisin se parece a la extincin en que ambos procedimientos dan lugar a la disminucin de la ejecucin, si bien son muy diferentes en, por ejemplo, el grado de suspensin. Adems todos los experimentos en este sentido coinciden en considerarlos procedimientos semejantes, pero distintos.
Se le suele considerar como lo contrario al condicionamiento de recompensa.
Castigo
El castigo o castigo positivo es, en psicologa un tipo de condicionamiento instrumental. El trmino castigo positivo se hace innecesario al evitarse tambin el trmino castigo negativo, sustituido por el ms adecuado y claro de entrenamiento de omisin.
El castigo ocurre cuando la respuesta instrumental va seguida de un estmulo aversivo. Este estmulo aversivo puede consistir, en los experimentos de laboratorio, en pequeas descargas elctricas o ruidos estridentes. Aplicado a humanos, el castigo es habitual en la sociedad; no slo sera castigo el fsico o penal, tambin puede ser psicolgico.
El castigo es un procedimiento contrario al condicionamiento de recompensa y similar a la preparacin aversiva del condicionamiento clsico. El resultado es, como predice la ley del efecto, la disminucin de la conducta.