Wat is operante conditionering en hoe werkt het?

Operante conditionering, ook wel instrumentele conditionering genoemd, is een leermethode die beloningen en straffen voor gedrag gebruikt. Door operante conditionering wordt een verband gelegd tussen een gedrag en een gevolg (negatief of positief) voor dat gedrag. behavior

Als laboratoriumratten bijvoorbeeld op een hendel drukken wanneer een groen lampje brandt, krijgen ze als beloning een voedselkorrel. Wanneer ze op de hendel drukken terwijl een rood lampje brandt, krijgen ze een lichte elektrische schok. Hierdoor leren ze de hendel in te drukken wanneer het groene licht brandt en het rode licht te vermijden.

Maar operante conditionering is niet alleen iets dat plaatsvindt in experimentele settings tijdens het trainen van proefdieren. Het speelt ook een krachtige rol in het dagelijkse leren. Versterking en bestraffing vinden de hele tijd plaats in natuurlijke omgevingen, maar ook in meer gestructureerde omgevingen zoals klaslokalen of therapiesessies.

De geschiedenis van operante conditionering

Operante conditionering werd voor het eerst beschreven door behaviorist BF Skinner, en daarom hoor je er af en toe naar verwezen als Skinneriaanse conditionering. Als behaviorist geloofde Skinner dat het niet echt nodig was om naar interne gedachten en motivaties te kijken om gedrag te verklaren . In plaats daarvan, suggereerde hij, moeten we alleen kijken naar de externe, waarneembare oorzaken van menselijk gedrag.

In de eerste helft van de 20e eeuw werd het behaviorisme een belangrijke kracht binnen de psychologie. De ideeën van John B. Watson domineerden deze denkrichting al vroeg. Watson concentreerde zich op de principes van klassieke conditionering en suggereerde ooit dat hij iedereen kon nemen, ongeacht hun achtergrond, en ze kon trainen om alles te zijn wat hij maar wilde.

Vroege behavioristen richtten hun interesse op associatief leren. Skinner was meer geïnteresseerd in hoe de… gevolgen van het handelen van mensen beïnvloedden hun gedrag.

Skinner gebruikte de term operant om te verwijzen naar "actief gedrag dat inwerkt op de omgeving om consequenties te genereren". De theorie van Skinner legde uit hoe we de reeks aangeleerde gedragingen verwerven die we elke dag vertonen.

Zijn theorie werd sterk beïnvloed door het werk van psycholoog Edward Thorndike, die had voorgesteld wat hij de wet van effect noemde. Volgens dit principe is de kans groter dat acties die worden gevolgd door gewenste resultaten worden herhaald, terwijl acties die worden gevolgd door ongewenste resultaten worden minder vaak herhaald.

Operante conditionering is gebaseerd op een vrij eenvoudige premisse: acties die worden gevolgd door versterking zullen worden versterkt en zullen in de toekomst vaker voorkomen. Als je een grappig verhaal vertelt in de klas en iedereen lacht, is de kans groter dat je dat verhaal in de toekomst nog een keer vertelt.

Als je je hand opsteekt om een vraag te stellen en je leraar prijst je beleefde gedrag, is de kans groter dat je je hand opsteekt de volgende keer dat je een vraag of opmerking hebt. Omdat het gedrag werd gevolgd door bekrachtiging, of een gewenst resultaat, wordt de voorgaande actie bekrachtigd.

Omgekeerd zullen acties die leiden tot straf of ongewenste gevolgen worden afgezwakt en in de toekomst minder snel voorkomen. Als je hetzelfde verhaal nog een keer vertelt in een andere klas, maar niemand lacht deze keer, is de kans kleiner dat je het verhaal in de toekomst nog een keer herhaalt. Als je een antwoord roept in de klas en je leraar scheldt je uit, dan is de kans kleiner dat je de klas opnieuw onderbreekt.

Soorten gedrag

Skinner maakte onderscheid tussen twee verschillende soorten gedragingen

Gedrag van respondenten zijn die automatisch en reflexmatig gebeuren, zoals uw hand terugtrekken van een hete kachel of uw been schokken wanneer de arts op uw knie tikt. Je hoeft dit gedrag niet aan te leren. Ze gebeuren gewoon automatisch en onvrijwillig.
Operant gedrag, aan de andere kant, zijn degenen die onder onze bewuste controle staan. Sommige kunnen spontaan optreden en andere opzettelijk, maar het zijn de gevolgen van deze acties die vervolgens bepalen of ze in de toekomst opnieuw plaatsvinden of niet. Onze acties op het milieu en de gevolgen van die actie vormen een belangrijk onderdeel van het leerproces.

Hoewel klassieke conditionering het gedrag van respondenten zou kunnen verklaren, realiseerde Skinner zich dat het niet veel van het leren kon verklaren. In plaats daarvan suggereerde Skinner dat operante conditionering veel belangrijker was.

Skinner vond tijdens zijn jongensjaren verschillende apparaten uit en hij zette deze vaardigheden in tijdens zijn studies over operante conditionering. Hij creëerde een apparaat dat bekend staat als een operante conditioneringskamer, tegenwoordig vaak een Skinner-box genoemd. De kamer kon een klein dier bevatten, zoals een rat of een duif. De doos bevatte ook een balk of sleutel die het dier kon indrukken om een beloning te ontvangen.

Om reacties te volgen, ontwikkelde Skinner ook een apparaat dat bekend staat als een cumulatieve recorder. Het apparaat registreerde reacties als een opwaartse beweging van een lijn, zodat de responspercentages konden worden afgelezen door naar de helling van de lijn te kijken.

Componenten van operante conditionering

Er zijn verschillende sleutelconcepten in operante conditionering.

Versterking in operante conditionering

Versterking is elke gebeurtenis die het gedrag dat erop volgt, versterkt of vergroot. Er zijn twee soorten bekrachtigers. In beide gevallen van bekrachtiging neemt het gedrag toe.

Positieve bekrachtigers zijn gunstige gebeurtenissen of uitkomsten die worden gepresenteerd na het gedrag. In positieve bekrachtigingssituaties wordt een reactie of gedrag versterkt door de toevoeging van lof of een directe beloning. Als je het goed doet op je werk en je manager geeft je een bonus, dan is die bonus een positieve bekrachtiging.
Negatieve bekrachtigers omvatten het verwijderen van ongunstige gebeurtenissen of resultaten na het vertonen van een gedrag. In deze situaties wordt een reactie versterkt door het verwijderen van iets dat als onaangenaam wordt beschouwd. Als uw kind bijvoorbeeld midden in een restaurant begint te schreeuwen, maar stopt zodra u hem een traktatie geeft, heeft uw actie geleid tot het verwijderen van de onaangename toestand, waardoor uw gedrag negatief wordt versterkt (niet dat van uw kind).

Straf in operante conditionering

Straf is de presentatie van een ongunstige gebeurtenis of uitkomst die een afname van het gevolgde gedrag veroorzaakt. Er zijn twee soorten straffen. In beide gevallen neemt het gedrag af.

Positieve straf, soms aangeduid als straf door toepassing, presenteert een ongunstige gebeurtenis of uitkomst om de reactie die erop volgt te verzwakken. Slaan voor wangedrag is een voorbeeld van straf door toepassing.
Negatieve straf, ook bekend als straf door verwijdering, vindt plaats wanneer een gunstige gebeurtenis of uitkomst wordt verwijderd nadat een gedrag heeft plaatsgevonden. Een videogame van een kind wegnemen na wangedrag is een voorbeeld van negatieve straf.

Versterkingsschema's

Versterking is niet per se een eenvoudig proces en er zijn een aantal factoren die van invloed kunnen zijn op hoe snel en hoe goed nieuwe dingen worden geleerd. Skinner ontdekte dat wanneer en hoe vaak gedragingen werden versterkt speelden een rol in de snelheid en kracht van acquisitie. Met andere woorden, de timing en frequentie van versterking beïnvloedden hoe nieuw gedrag werd aangeleerd en hoe oud gedrag werd aangepast.

Skinner identificeerde verschillende schema's van versterking die van invloed zijn op het operante conditioneringsproces:

Continue versterking omvat het leveren van een versterking elke keer dat een reactie optreedt. Leren gaat meestal relatief snel, maar de respons is vrij laag. Uitsterven treedt ook zeer snel op als de wapening wordt stopgezet.
Schema's met vaste verhouding zijn een soort gedeeltelijke wapening. Reacties worden alleen versterkt nadat een bepaald aantal reacties heeft plaatsgevonden. Dit leidt doorgaans tot een redelijk constant responspercentage.
Schema's met vaste intervallen zijn een andere vorm van gedeeltelijke versterking. Versterking vindt pas plaats nadat een bepaald tijdsinterval is verstreken. De responspercentages blijven redelijk stabiel en beginnen toe te nemen naarmate de bekrachtigingstijd nadert, maar vertraagt onmiddellijk nadat de bekrachtiging is geleverd.
Schema's met variabele verhoudingen zijn ook een soort gedeeltelijke bekrachtiging waarbij gedrag wordt versterkt na een gevarieerd aantal reacties. Dit leidt tot zowel een hoge respons als een langzame extinctie.
Variabele intervalschema's zijn de laatste vorm van gedeeltelijke versterking die Skinner heeft beschreven. Dit schema omvat het leveren van versterking nadat een variabele hoeveelheid tijd is verstreken. Dit leidt ook vaak tot een snelle respons en een langzame extinctie.

Voorbeelden van operante conditionering

We kunnen overal om ons heen voorbeelden van operante conditionering aantreffen. Denk aan het geval van kinderen die huiswerk maken om een beloning te verdienen van een ouder of leraar, of werknemers die projecten afmaken om lof of promoties te ontvangen. Meer voorbeelden van operante conditionering in actie zijn onder meer:

Na het optreden in een gemeenschapstheaterstuk krijg je applaus van het publiek. Dit werkt als een positieve bekrachtiger, die je inspireert om meer uitvoeringsrollen uit te proberen.
U traint uw hond om te apporteren door hem te prijzen en een aai over de kop te geven wanneer hij het gedrag correct uitvoert. Dit is een andere positieve bekrachtiger.
Een professor vertelt studenten dat als ze het hele semester perfect aanwezig zijn, ze niet het laatste uitgebreide examen hoeven af te leggen. Door een onaangename stimulus weg te halen (de laatste toets), worden leerlingen negatief versterkt regelmatig naar de les te komen.
Als je een project niet op tijd inlevert, wordt je baas boos en hekelt je prestaties in het bijzijn van je collega's. Dit werkt als een positieve bestraffing, waardoor het minder waarschijnlijk is dat u projecten laat in de toekomst afrondt.
Een tienermeisje ruimt haar kamer niet op zoals haar werd gevraagd, dus nemen haar ouders haar telefoon de rest van de dag af. Dit is een voorbeeld van een negatieve straf waarbij een positieve stimulus wordt weggenomen.

In sommige van deze voorbeelden veroorzaakt de belofte of mogelijkheid van beloningen een toename van gedrag. Operante conditionering kan ook worden gebruikt om gedrag te verminderen door een gewenste uitkomst te verwijderen of een negatieve uitkomst toe te passen. Een kind kan bijvoorbeeld te horen krijgen dat het pauzerechten verliest als het in de klas voor zijn beurt praat. Dit potentieel voor straf kan leiden tot een afname van storend gedrag.

Een woord van Verywell

Hoewel het behaviorisme misschien veel van de dominantie heeft verloren die het in het begin van de 20e eeuw had, blijft operante conditionering een belangrijk en vaak gebruikt hulpmiddel in het leer- en gedragsveranderingsproces. Soms leiden natuurlijke gevolgen tot veranderingen in ons gedrag. In andere gevallen kunnen beloningen en straffen bewust worden uitgedeeld om een verandering teweeg te brengen.

Operante conditionering is iets dat je misschien meteen in je eigen leven herkent, of het nu gaat om het aanleren van goed gedrag aan je kinderen of het trainen van de gezinshond. Onthoud dat elke vorm van leren tijd kost. Overweeg het type versterking of straf dat het beste werkt voor uw unieke situatie en beoordeel welk type versterkingsschema tot de beste resultaten kan leiden.