Hoe versterkingsschema's werken

Operante conditionering is een leerproces waarin nieuw gedrag wordt verworven en gewijzigd door de associatie met consequenties. Het versterken van een gedrag vergroot de kans dat het in de toekomst weer zal voorkomen, terwijl het bestraffen van een gedrag de kans verkleint dat het zal worden herhaald.

Bij operante conditionering zijn schema's van versterking een belangrijk onderdeel van het leerproces. Wanneer en hoe vaak we een gedrag versterken, kan een dramatische impact hebben op de kracht en snelheid van de reactie.

Schema van versterking

Een schema van bekrachtiging is in feite een regel die aangeeft welke gevallen van gedrag zullen worden bekrachtigd. In sommige gevallen kan een gedrag elke keer dat het zich voordoet worden versterkt. Soms wordt een gedrag helemaal niet versterkt.

Positieve bekrachtiging of negatieve bekrachtiging kan worden gebruikt als onderdeel van operante conditionering. In beide gevallen is het doel van bekrachtiging om een gedrag te versterken zodat het waarschijnlijk opnieuw zal voorkomen.

Versterkingsschema's vinden plaats in zowel natuurlijk voorkomende leersituaties als meer gestructureerde trainingssituaties. In de echte wereld zullen gedragingen waarschijnlijk niet elke keer dat ze zich voordoen worden versterkt. In situaties waarin u opzettelijk een specifieke actie probeert te versterken (zoals op school, sport of bij het trainen van dieren), zou u een specifiek versterkingsschema volgen.

Sommige schema's zijn beter geschikt voor bepaalde soorten trainingssituaties. In sommige gevallen kan training een schema vereisen en vervolgens overschakelen naar een ander zodra het gewenste gedrag is aangeleerd.

Soorten wapeningsschema's

De twee fundamentele vormen van wapeningsschema's worden continue wapening en gedeeltelijke wapening genoemd.

Continue versterking

Bij continue bekrachtiging wordt het gewenste gedrag elke keer dat het zich voordoet versterkt. Dit schema kan het beste worden gebruikt tijdens de beginfase van het leren om een sterke associatie te creëren tussen het gedrag en de reactie.

Stel je bijvoorbeeld voor dat je een hond probeert te leren je hand te schudden. Tijdens de beginfase van het leren zou je je aan een continu bekrachtigingsschema houden om het gedrag aan te leren en vast te stellen. Dit kan inhouden dat je de poot van de hond vastpakt, schudt, 'schud' zegt en dan elke keer dat je deze stappen uitvoert een beloning uitdeelt. Uiteindelijk zal de hond de actie alleen beginnen uit te voeren.

Continue bekrachtigingsschema's zijn het meest effectief bij het aanleren van nieuw gedrag. Het geeft een patroon aan waarop elke nauw gedefinieerde reactie wordt gevolgd door een nauw gedefinieerde consequentie.

Gedeeltelijke versterking

Zodra de respons stevig is vastgesteld, wordt een continu versterkingsschema meestal overgeschakeld naar een gedeeltelijk versterkingsschema. Bij gedeeltelijke (of intermitterende) versterking wordt de respons slechts een deel van de tijd versterkt. Aangeleerd gedrag wordt langzamer verworven met gedeeltelijke bekrachtiging, maar de respons is beter bestand tegen uitsterven.

Denk aan het eerdere voorbeeld waarin u een hond trainde om te schudden en. Terwijl je aanvankelijk continue versterking gebruikte, is het gewoon onrealistisch om het gedrag elke keer te versterken. Na verloop van tijd zou je overschakelen naar een gedeeltelijk schema om extra bekrachtiging te geven als het gedrag eenmaal is vastgesteld of nadat er veel tijd is verstreken.

Er zijn vier schema's van gedeeltelijke versterking:

Schema's met vaste verhoudingen

Schema's met vaste verhouding zijn die waarin een reactie pas na een bepaald aantal reacties wordt versterkt. Dit schema zorgt voor een hoge, constante reactiesnelheid met slechts een korte pauze na de levering van de bekrachtiger. Een voorbeeld van een schema met een vaste verhouding is het afleveren van een voedselpellet aan een rat nadat deze vijf keer op een balk heeft gedrukt.

Schema's met variabele verhoudingen

Schema's met variabele verhoudingen treedt op wanneer een reactie wordt versterkt na een onvoorspelbaar aantal reacties. Dit schema zorgt voor een hoge constante reactiesnelheid. Gok- en loterijspellen zijn goede voorbeelden van een beloning op basis van een variabel ratioschema. In een laboratoriumomgeving kan dit inhouden dat voedselpellets aan een rat worden afgeleverd na één keer drukken, opnieuw na vier keer drukken en dan opnieuw na twee keer drukken.

Schema's met vaste intervallen

Vaste-intervalschema's zijn schema's waarbij de eerste reactie pas wordt beloond nadat een bepaalde tijd is verstreken. Dit schema veroorzaakt grote hoeveelheden respons aan het einde van het interval, maar tragere respons onmiddellijk na de levering van de bekrachtiger. Een voorbeeld hiervan in een laboratoriumomgeving is het versterken van een rat met een laboratoriumpellet voor de eerste staafpers nadat een interval van 30 seconden is verstreken.

Variabele intervalschema's

Variabele intervalschema's treden op wanneer een reactie wordt beloond nadat een onvoorspelbare hoeveelheid tijd is verstreken. Dit schema zorgt voor een langzame, gestage respons.

Een voorbeeld hiervan is het afleveren van een voedselpellet aan een rat na de eerste druk op de reep na een interval van één minuut; een tweede pellet voor de eerste respons na een interval van vijf minuten; en een derde pellet voor de eerste respons na een interval van drie minuten.

Het juiste schema gebruiken

Beslissen wanneer een gedrag moet worden versterkt, kan van een aantal factoren afhangen. In gevallen waarin je specifiek nieuw gedrag probeert aan te leren, is een continu schema vaak een goede keuze. Als het gedrag eenmaal is aangeleerd, verdient het vaak de voorkeur om over te schakelen naar een deelschema.

In het dagelijks leven komen gedeeltelijke bekrachtigingsschema's veel vaker voor dan continue. Stel je bijvoorbeeld voor dat je elke keer dat je op tijd op je werk komt een beloning krijgt. Na verloop van tijd, in plaats van dat de beloning een positieve bekrachtiging is, zou de ontkenning van de beloning als negatieve bekrachtiging kunnen worden beschouwd.

In plaats daarvan worden dergelijke beloningen meestal uitgedeeld op een veel minder voorspelbaar schema voor gedeeltelijke versterking. Deze zijn niet alleen veel realistischer, maar ze hebben ook de neiging om hogere responspercentages te produceren terwijl ze minder vatbaar zijn voor uitsterven

Gedeeltelijke schema's verminderen het risico op verzadiging zodra een gedrag is vastgesteld. Als een beloning zonder einde wordt gegeven, kan de proefpersoon stoppen met het uitvoeren van het gedrag als de beloning niet langer gewenst of nodig is.

Stel je bijvoorbeeld voor dat je een hond probeert te leren zitten. Als je elke keer voer als beloning gebruikt, kan de hond stoppen met presteren als hij vol is. In dergelijke gevallen kan iets als lof of aandacht effectiever zijn om een reeds vastgesteld gedrag te versterken.

Een woord van Verywell

Operante conditionering kan een krachtig leermiddel zijn. Het schema van versterking dat tijdens het training- en onderhoudsproces wordt gebruikt, kan een grote invloed hebben op hoe snel een gedrag wordt verworven, de kracht van de reactie en hoe vaak het gedrag wordt weergegeven.

Om te bepalen welk schema de voorkeur heeft, moet u rekening houden met verschillende aspecten van de situatie, waaronder het soort gedrag dat wordt aangeleerd en het soort reactie dat gewenst is.