Вы находитесь на странице: 1из 7

Condicionamento operante

Origem: Wikipdia, a enciclopdia livre.

O conceito de Condicionamento Operante foi criado pelo escritor e psiclogo Burrhus Frederic Skinner. Este refere-se ao procedimento atravs do qual modelada uma resposta no organismo atravs de reforo diferencial e aproximaes sucessivas. onde a resposta gera uma consequncia e esta consequncia afeta a sua probabilidade de ocorrer novamente; se a consequncia for reforadora, aumenta a probabilidade, se for punitiva, alm de diminuir a probabilidade de sua ocorrncia futura, gera outros efeitos colaterais. Este tipo de comportamento que tem como consequncia um estmulo que afete sua frequncia chamado Comportamento Operante. O conceito de Comportamento Operante difere do conceito de Comportamento respondente, estudado por Pavlov, porque o primeiro ocorre em um determinado contexto, chamado estmulo discriminativo, e gera um estmulo que afeta a probabilidade dele ocorrer novamente; o segundo diretamente eliciado por algum estmulo e uma reao fisiolgica do organismo. Uma resposta fisiolgica a um estmulo, como fechar o olho diante de algo que se aproxima dele, retirar o brao diante de uma agulhada, etc. O comportamento operante modelado a partir de nosso repertrio inato. As respostas que gerem mais reforo em mdia, tendem a aumentar de frequncia e se estabelecer no repertrio, ou seja, em um contexto semelhante tendem a ser novamente emitidas. O tipo de consequncia que aumenta a probabilidade de ocorrncia da mesma funo de resposta em contextos semelhantes, chama-se reforo. O reforo pode ser positivo, quando h a adio de um estmulo no ambiente que resulte no aumento da frequncia da resposta que o gerou; ou negativo, quando a resposta emitida remove algum estmulo aversivo, ou seja, que a pessoa tende a evitar, do ambiente. Os contextos onde existe probabilidade de uma determinada resposta ser reforada so chamados estmulos discriminativos, ou SD; os contextos onde no existe a probabilidade da resposta ser reforada, so chamados estmulos delta, ou S.

Lei do Efeito de Thorndike O condicionamento operante, tambm chamado de condicionamento instrumental ou aprendizagem instrumental foi primeiramente estudado por Edward L. Thorndike (1874-1949), que observou o comportamento de gatos tentando escapar de "caixas problemas".[1] Na primeira vez que os gatos eram colocados nas caixas, eles demoravam bastante tempo para escapar delas. Mas, com o passar do tempo, as respostas ineficientes foram diminuindo de frequncia, e as respostas mais efetivas aumentavam de frequncia, e os gatos agora conseguiam escapar em menos tempo e com menos tentativas. Em sua Lei do Efeito, Thorndike teorizou que as respostas que produziam consequncias mais satisfatrias, foram "escolhidas" pela experincia e portanto, aumentaram de frequncia. Algumas consequncias reforavam o comportamento, outras enfraqueciam-no". Thorndike produziu a primeira curva de aprendizagem com este procedimento. B. F. Skinner (1904-1990)formulou uma anlise mais detalhada do condicionamento operante utilizando de conceitos como reforamento, punio e extino. Seguindo as idias de Ernst Mach, Skinner rejeitou as estruturas mediadores de Thorndike requeridas pela "satisfao" e construiu um novo conceito de comportamento sem a utilizao de tais referncias. Princpios do Reforo importante ressaltar, que reforo, ao contrrio do que pode pensar o senso comum, no uma simples recompensa. Para B. F. Skinner, reforo, pode ser qualquer evento que aumenta a frequncia de uma reao precedente.Um reforo pode ser uma recompensa tangvel. Pode ser um elogio ou uma ateno. Ou pode ser uma atividade, como poder usar o carro depois que a loua estiver lavada, ou ter uma folga depois de uma hora de estudo. Reforos Primrios e Secundrios

Os reforos primrios - como receber alimento ou ser aliviado de um choque eltrico - so intrinsecamente satisfatrios. Os reforos secundrios so aprendidos. Se um rato numa caixa de Skinner aprende que uma luz sinaliza de maneira confivel que a comida est chegando, ele vai se empenhar em acender a luz. Dinheiro, boas notas, so exemplos de reforos secundrios, cada um das quais est ligado a recompensas mais bsicas.[ Reforos Imediatos e Retardados Para ilustrar bem como funcionam esses dois tipos de reforos, pode-se usar como exemplo um experimento de moldagem em que se condiciona um rato a apertar uma barra. Antes de efetuar esse comportamento "desejado", o rato faminto se empenhar numa sequncia de comportamentos "indesejados" - arranhar, farejar, andar de um lado para o outro. qualquer desses comportamentos que preceda imediatamente o reforo de comida tem mais probabilidade de ocorrer de novo. Se voc retarda o reforo da presso da barra por mais 30 segundos, permitindo que outros compotamentos interfiram e sejam recompensados, no ocorrer praticamente qualquer aprendizagem de apertar a barra. Humanos, ao contrrio de ratos, reagem a reforos bem mais retardados: o pagamento do salrio no fim do ms, a nota no fim do semestre, o trofu no campeonato. Porm, reforos pequenos, mas imediatos, so s vezes mais atraentes do que reforos grandes, mas retardados. Fumantes, alcoolatras e outros usurios de drogas podem saber que seu prazer imediato mais do que contrabalanado pelos futuros efeitos perniciosos, mas nem por isso abandonam seu vcio. Reforo Positivo, Reforo Negativo e Punio Existem duas formas de reforo que so: o positivo e o negativo. Ambos tm como escopo ensinar e reforar um determinado comportamento. O indviduo aprende qual o comportamento desejvel para alcanar

determinado objetivo. J a punio refora qual o comportamento indesejvel, ou seja, que no deve ser manifestado para evit-la. No reforo positivo quando o comportamento desejado alcanado um elemento de recompensa adicionado. Para exemplificar o reforo positivo consideremos um experimento onde um rato privado de comida. Quando este puxa determinada alavanca (comportamento desejado) disponibilizado o alimento (elemento de recompensa). Com o passar do tempo o rato ao sentir fome ir puxar a alavanca para receber o alimento. Desta forma o indviduo exposto ao reforo positivo aprende o comportamento adequado. J no reforo negativo um elemento punitivo adicionado ao ambiente e quando o comportamento desejado alcanado este, retirado. Para exemplificar temos novamente um experimento com um rato onde colocada uma corrente eltrica ligada a sua gaiola. Esta corrente provoca um desconforto ao animal (elemento punitivo). Quando puxada uma alavanca (comportamento desejado) a corrente eltrica desligada. Neste exemplo o choque eltrico colocado como elemento punitivo que eliminado ao conseguir o comportamento almejado. Aps algum tempo o rato associa o ato de puxar a alavanca a extino de seu desconforto e sempre que a corrente eltrica ligada vai direto a alanvanca. Como no reforo positivo, o negativo visa que o indviduo aprenda o comportamento adequado a determinada situao. A punio muitas vezes confundida com o refoo negativo pois o elemento punitivo encontra-se inserido neste. Porm, ao contrrio do reforamento negativo, o objetivo da punio levar extino do comportamento, ou seja, com o passar do tempo, a probabilidade de ele ocorrer novamente diminui. O reforamento negativo, passa a idia de uma obrigao: um rato pode puxar uma alavanca (comportamento) para desligar uma corrente eltrica que o esteja infligindo um desconforto (reforo negativo). O reforamente negativo, no um evento punitivo: a remoo de um evento punitivo. Ambos utilizam de estmulos aversivos. As punies podem ser de dois tipos: por adio (punio positiva), quando experincias aversivas so adicionadas, ou por subtrao (punio negativa), quando facilitadores do comportamento so subtrados. Ambas as tcnicas levam a aquilo que chamamos de extino.

A punio pode acarretar uma srie de problemas: esse tipo de estimulao aversiva, acarreta respostas do sistema nervoso, entendidas como ansiedade, depresso, baixa auto-estima.[4] Alm do mais, o comportamento punido no esquecido, ele suprimido. Pode ser que aps a estimulao aversiva ter sido eliminada, o comportamento volte a ocorrer: a criana pode simplesmente aprender a no dizer palavres em casa, mas continuar a uslos em outros lugares. Ela tambm suprime o comportamento indesejado, mas no guia a pessoa para um comportamento mais desejvel. A punio diz o que no fazer, o reforo diz o que fazer. Uma punio combinada com um reforamento positivo de comportamentos desejveis mais eficiente. Em suma, a punio rpida e segura pode ser eficaz, e pode de vez em quando causar menos dor do que o comportamento autodestrutivo que suprime. Mas ele pode reaparecer, se for possvel evitar a punio. Essa estimulao aversiva tambm pode provocar efeitos colaterais indesejveis, como ansiedade e ensinar agressividade. Os psiclogos preferem dar mais nfase ao reforo positivo do que punio. Programaes de Reforo Usando-se esquemas de reforo contnuo, a aprendizagem ocorre rapidamente, mas sem o reforo, a extino ocorre rapidamente tambm. Na vida real, esquemas de reforo contnuo so raros. Nevin, em 1988, estudou que as reaes s vezes so reforadas, s vezes no. o que se chama de reforo parcial. A aprendizagem demora mais, no comeo, mas ela mais "resistente" extino. Imagine um pombo que aprendeu a bicar uma tecla para obter comida. quando o pesquisador vai suspendendo gradativamente a entrega de alimento, at que ela ocorra s de maneira rara e imprevisvel, os pombos podem bicar 150.000 vezes sem recompensa. Com o reforo parcial, a esperana flui eterna (esse o princpio do "pombo superticioso" de Skinner). o que ocorre por exemplo, em jogadores compulsivos, que continuam a jogar, mesmo sem nunca ganharem.

Programaes de Ritmo Fixo Reforam o comportamento depois de um determinado nmero de respostas. Empregados que trabalham em fbricas que recebem por produo, so reforados de tal maneira. quando so recompensados. Programaes de Ritmo Varivel Reforam a primeira resposta depois de uma quantidade imprevisvel de respostas. o que ocorre com os jogadores e pescadores. A dificuldade de se extinguir tais comportamentos de que o reforo aumenta medida que aumentam as respostas. Programaes de Intervalos Fixos Refora a primeira resposta depois de um perodo determinado. Como pessoas que verificam a caixa de correspondncia quando a hora do carteiro passar se aproxima, os pombos bicam uma tecla com mais frequncia medida que fica mais prxima a hora esperada de recompensa, produzindo um padro inconstante de "pra-comea". Programaes de Intervalo Varivel Refora a primeira resposta depois de intervalos de tempo variveis. Como o questionrio imprevisvel que refora o estudo, as programaes de intervalo varivel tendem a eliciar respostas lentas e firmes. Caso os questionrios tornem-se previsveis, os estudantes comearo a seguir o padro de pra-comea que caracteriza as programaes de intervalo fixo (em outras palavras, estudaro apenas na vspera). O Uso dos modelos Animais Um behaviorista utiliza o comportamento dos animais no como forma de poder estudar as particularidades que os animais possuem quanto ao seus

comportamentos, mas sim, para procurar leis universais que regem o comportamento dos organismos. Para Skinner (1956), os esquemas de reforo do condicionamento operante so universais. Importa pouco, disse ele, que reao, que reforo ou que espcie voc usa. O efeito de determinada programao de reforo quase o mesmo: "Pombo, rato, macaco, o que o qu? No importa O comportamento apresenta caractersticas espantosamente similares."

Fonte: http://pt.wikipedia.org/wiki/Condicionamento_operante

Вам также может понравиться