かりん先生のドックトレーニング講座

かりん先生のドックトレーニング講座

オペラント条件付け

◇オペラント条件付け◇
 
学習と行動の原理に関心を持っていた研究者のエドワード・ゾーンダイクはすべての犬のトレーナーが覚えておくべき言葉を残した。
”ある反応のあとに満足できる状況が続いて起こればその反応は繰り返される傾向がある”
 
これはその後オペラントの条件付けとして知られるようになり、その後B・F・スキナー博士によってこの条件付けは4つの分類からなる学習法として広く世の中に知られるようになった。これは犬が自分の行動により状況を”操作(オペレート)”して変化させることが出来ることからオペラント条件付けと呼ばれている。
 
自分の行動によって結果を良くも悪くも出来るということを犬はよく理解している。オペラント条件付けが古典的条件付けと異なっている点は、何らかの結果を引き出すためにはその動物が必ず何らかの行動を起こさなければならないということだ。
つまり行動することで状況を操作し、結果が生み出されるのだ。
古典的条件付けでは2つの刺激を関連付けているが、オペラント条件付けの場合は行動とその結果を関連付けていく。
手に持ったりんごを離せば物理の法則に従ってまっすぐに地面に向かって落ちていくように、犬のあらゆる行動も100%、例外なく行動原理の法則に基づいている。以下の4つの原理をしっかりマスターし愛犬のコントロールをより確かなものにしていこう。
 
4つの行動原則とは犬だけでなく我々人間も含めてあらゆる動物のある行動が増えるか減るかを決める基本原則である。この4つの行動原則を理解できると、それだけで飛躍的に犬のトレーニングが上手くなり、楽しくなる。ただし言葉が非常に難しく、混乱を招きやすいのでまず整理しておく。
 
まず強化とは行動を増やすことである。
それに対し、罰とは行動を減らすことである。
 
次は正と負の関係だが、「正」は行動後に何かが現れること。「負」は行動の後に何かが消えること。
よくオペラントの条件付けを分かりにくくさせているのは、この「負」という概念ためである。
「正」は何かが現れることなので何もない状態から考えることが出来るが「負」の場合は何かが消えることなので、前提として消えるものが存在していなければならない。負の強化であれば前提として嫌いなものがあり、負の罰は前提として好きなものがある。
 
オペラントの条件付け~考えられる4つの行動の因果関係~
 
加える+良いこと
正の強化
行動の後に好きなものが現れるとその行動を増やす。
<良い強化の機能をしている例>
●お座りと言われた→座る→ご褒美をもらえた
<悪い強化の機能している例>
●お腹がすいた→吠えてみた→おやつをもらえた
 
取り去る+良いこと
負の罰
行動の後に好きなものが消えるとその直前の行動を減らす。
<良い罰の機能している例>
●遊びたい→飛びついてみた→おやつが消えた
<悪い罰の機能している例>
●おいでと言われた→遊びをやめて戻った→家に帰された
 
加える+嫌なこと
正の罰
行動の後に嫌いなものが現れるとその直前の行動を減らす。
<良い罰の機能をしている場合>
●お腹がすいた→ゴミ箱をあさってみた→ゴミ箱が倒れてきた
<悪い罰の機能している場合>
●おいでと言われた→戻った→叱られた
 
取り去る+嫌なこと
負の強化
行動の後に嫌いなものが消えるとその直前の行動を増やす。
<良い強化の機能している例>
●不安な状況の中→飼い主を見つめた→だっこしてくれた
<悪い強化の機能している例>
●捕まえられた→噛んだ→開放された
 
<トレーニング方法と学習原理>
いつも実習などでしているモチベーショントレーニングにおいては主に正の強化と負の罰を使っている。
これに対し強制訓練は正の罰と負の強化を多く使うものを指している。
正の罰も負の強化それもまた筋の通った理論なので、ある程度は犬をコントロールできるかもしれない。
ただし、そこには人と犬の関係を良くしようとする関係作りという大切なものがごっそりと抜け落ちている可能性がある。
特に負の強化というものは回避学習とも呼ばれており、嫌な状況を回避するために増える行動である。
怒られるのが嫌だからやる。ということである。