söndag 18 december 2016

Belöningsbaserad inlärning/träning del 2, bestraffningar & förstärkningar

Så grundläggande trista torr-saker att börja med, som låter självklara, men nog många inte tänker på nog mycket är om man bestraffar eller förstärker. Egentligen kan man skita i namngivningen här och försöka att bara se det som att det finns 4 sätt för att påverka annan individ vid inlärningsmoment.

Vi börjar med en av de som är som det låter och inte kräver så mkt förklaring: positiv förstärkning är som det låter; något positivt tillförs, det kommer alltså efter det utförda beteendet. Och som man rätt lätt kan räkna ut; det gör att individen är mer välvilligt inställd att göra saker igen ;)


Positiv förstärkning, något Minan gillar tillförs (syns inte så bra men jag trycker godis i truten på henne).

Men man kan då sedan använda vad som kallas negativt försärkning, vilket är lite lätt kruxigt namn. Det är att något man ogillar tas bort. Alltså att man gör något individen ogillar och när individen gör det beteende man vill så tar man som tränare bort det otrevliga. Och när man tänker efter så säger det sig själv lite att vem som helst då kommer försöka undvika det otrevliga och göra vad det nu var man skulle för att det ska försvinna. Så då gör alltså individen något som man som tränare vill. Problemet här är alltså motivationen, motivationen är inte att man vill göra beteendet, utan att man vill undvika något obehagligt. Forskning visar (om någon inte kan sätta sig in i det själv...) att individet man tränar med denna metod inte själva söker upp och vill utföra uppgifter frivilligt till samma grad, de visar oftare stress och inlärningen tar längre tid.
Detta är det man till största del använder inom "normal" klassisk hästhållning/ridsport. Alla tryck (grimmor, bett, skänklar, ryttarens tyngd) är tryck hästen lär sig att ge efter för för att komma bort ifrån det den inte gillar. Och då kan man ju börja fundera på hur trevligt är det egentligen? Hur motiverande är det för att få en glad häst som vill göra det man ber den om?



Här jag fallit tillbaa i gamla ovanor och använder negativ förstärkning, tryck, för att backa undan Mino då hon klev på mig. (Spöet används här inte för något negativt, den är för den spanska skritten där hon får ut något positivt av att slå på den, men hon var här allt för på och gick in i mig.)

Sedan har vi då bestraffning. Bestraffningar behöver inte vara så otrevligt som det låter. Jag använder det med flit delvis en hel del. Vi börjar med den trevligare typen av bestraffning; negativa bestraffningar, vilket dock på namnet låter väldigt dåligt men jag upplever igen namngivningen som lite lätt besvärlig att greppa. Negativ bestraffning innebär att något positivt tas bort eller uteblir. Alltså något som individen tycker om. Exempel på det är när individen förväntar sig godbit men inte får det. Eller när man står och kliar och kelar med individen och den gör något oönskat (typ kliar allt för hårthänt tillbaka) och man därför slutar med det trevliga kelandet, det är att något trevligt tas bort, en negativ bestraffning. Frustration är vanligt kring negativ bestraffning och det tar oftast tid att släcka ut ett beteende på detta vis.



Negativ bestraffning; kliar sig Mino hårt nog på mig så kommer jag sluta klia på henne och även gå ifrån henne och ignorera henne då det är ett beteende jag inte vill ha.

Sedan har vi då positiva bestraffningar. Vilket inte är positivt alls, det positiva i denna benämning är att något tillförs. För detta är att något negativt, att något individen ogillar, tillförs. Detta händer alltså efter att beteendet utförts. Det är ett snabbt sätt att få en individ att sluta med ett beteende, och det säger ju sig självt, att utför man ett beteende och något obehagligt händer så är man försiktigt med att utföra det beteendet igen. Detta är alltså när man typ ger ett ryck i grimman på hästen eller petar till den med spöet efter att hästen utfört ett beteende. Forskning visar att de som utsätts för mycket positiva bestraffningar blir rädda för att prova nya saker, instängda i sitt tänkande (gäller inte bara människor, jobbar man enligt klicker så vill man ha ett tänkande djur!) och inte precis är vidare motiverade till att frivilligt utföra saker.


Positiv bestraffning med fullblodshingsten, han får här ett ryck i kapsonen då han kastade sig in i rätt hårdhänt lek, vilket jag helt enkelt inte tål (han hade en period där han trodde vi skulle ligga och brottas på marken, typ som små unghingstar gör, han var lite efter i den sociala utvecklingen efter att ha levt på täbygalopp större delen av sin uppväxt...).


Bild som visar den så kallade operanta betingningens 4 grundpelare i hur man kan bemöta beteenden. Vid belöningsbaserad träning/klicker använder man bara R+, positiv förstärkning.

Vad skulle ni välja vid inlärning och vardagligt arbete rent teoretiskt? 
Vad använder ni nu?

Inga kommentarer:

Skicka en kommentar