７６のニワカ雑学: 日常生活における学習：オペラント条件づけ

私達は日々、学習をしている。
何かを学習し、それを何度も繰り返す。そんなことは誰にでもあるはずだ。

しかし人はどうやって複雑な物事を少しずつ学習するのだろうか？

ここでは、オペラント条件づけというものによって、人がどのように学習していくのかを紹介しようと思う。

オペラント条件付けとは

オペラント条件づけという言葉自体は聞いたことがあるだろう。

オペラント条件づけとは、自身の起こした何らかの行動に対して報酬又はバツを与えることによって、その行動を積極的に行うようになったり、逆に行わなくなったりする現象である。

例えば、あなたが寝坊して学校や職場に遅刻したとする。当然怒られもするだろうし、自分にとっても気分が良くない。なので次は遅刻しないようにする。そうすると怒られなくなったので、次からは早めに起きて遅刻しないように行動する。というようなもの。

日常でのオペラント条件づけ

条件づけによる行動を私達は日々行っている。日常生活におけるオペラント条件づけとはどのようなものだろうか？

◆１，喉が乾くと水を飲む
◆２，水を出すために蛇口をひねる
◆３，暑い（寒い）のでエアコンを付ける
◆４，iPhoneのホームボタンに指を置く

などなど、どれも生活でよくあるものである。
ところで、私達はどうやってこれらの行動を学習したのだろうか？

あなたが初めてスマートフォンを触った時、右も左もわからずにアプリを開いたり、思い通りに操作出来なくてイライラしたりしていたと思う。しかし今はそうではない。あなたはスマートフォンを使いこなしている。

きっと、何かを押せば、こういう反応が帰って来ると学習しているからだろう。

そんな日常でとても身近なオペラント条件づけについて、ザックリと語りたいと思う。

ソーンダイクの実験

ソーンダイクとはアメリカの教育学者、心理学者である。彼はオペラント条件づけの先駆けとなる猫の問題箱という実験を行う。

問題箱とは、小さな鉄格子の箱にお腹の空いた動物を入れ、その箱の外にエサを置く。鉄格子の箱には扉があり、その扉にはヒモが仕掛けられていて、そのヒモを猫が引っ張ることにより扉が開く。という装置である。

当然、いきなり箱に入れられた動物は脱出方法なんて知らないわけで、箱の中をうろうろとしたり、鉄格子に攻撃したりなど試行錯誤を行う。そうしている内に偶然、脱出方法を見つけ出し、無事に脱出する。

ソーンダイクはその現象を試行錯誤学習と名付けたのである。

そして再び動物を閉じ込めた時、その動物が脱出する速度は初回よりも早くなっていた。これは効果の法則とよばれ、動物が脱出方法を学習したと言えるだろう。

ソーンダイクは「満足をもたらす行動には、状況との結合を強める効果があり、不快になるような行動では、状況との結合を弱める効果がある」と考えた。（ただし、不快云々の方に関しては、後にソーンダイクが修正を行っている。）

身近な例で説明すると、室内飼いの猫は脱出方法をしらないが、何らかの方法で脱出が成功すると、その行動を覚えてしまい、ついには簡単に脱出するようになってしまうということがある。

スキナーの実験

後に、ソーンダイクの効果の法則を引き継ぐ形で実験を行った者が現れた。心理学者、行動学者のスキナーである。

スキナーはスキナー箱という装置を猫の問題箱を参考にして開発した。

この装置はレバーのある箱であり、レバーが引かれるとエサが出てくるという仕組みになっている。その装置のなかに空腹のラットを入れ、行動を観察する。

ラットは初め、偶然レバーに触れてエサを手に入れるが、その偶然が何度も起こると自分からレバーに触れるようになっていく。

三項随伴性

ちなみに”さんこうずいはんせい”と読む。

三項随伴性とは、ある出来事が起きた後、その出来事に影響を受けて行動が変化するというもので、例えば先程のスキナー箱にブザーを付けるとする。そしてブザーが鳴っている時にレバーを操作すればエサが出るという仕組みにする。

その装置を使ってラットにブザーが鳴っている時にレバーを操作するという行動を覚えさせたいとしたなら、以下のプロセスを行うことになる。

◆１，弁別刺激（先に起こる条件）
◆２，オペラント反応
◆３，行動の強化（強化子）

まず先に起こる刺激（１）でブザーが鳴ったことを確認する。次にオペラント反応（２）を起こし、レバーを操作する。そしてエサが出てくることによって次からはその行動を積極的に取るようになる（３）。

強化と罰

このような行動は強化と罰の関係にある。

自分自身にとって良いと感じるものを報酬とし、そうでないものを罰とする。この報酬と罰の関係は一般常識によるものではなく、あくまで個人のものである。例えば暴言というのは多くの人にとっては罰であるが、マゾヒストにとってはご褒美である。

ちなみに、強化は望ましい行動が行われやすくなることを意味し、罰は望ましくない行動を行われにくくすることを意味する。これらは正も負も変わらない。

正と負については、正は何らかの刺激を与える。負は何らかの刺激を減らす。と考えるとわかりやすいかもしれない。

正の強化

正の強化は、望ましいとされる行動に対して報酬（強化子）を与えることでその行動を行われやすくする。

例えば、テストで良い点を取った時に、お小遣いを与えたり、褒めたりする。こうすることで、より勉強をしてもらうようにする。

負の強化

負の強化は、本人にとっての嫌な刺激（罰子）を減らすことで、相手の行動を強化する。

例えば、望ましくない行動をして叱るとする。相手は叱られるのは嫌なので（罰子）反省しようとする。その際に叱るのを辞めると、相手は嫌な刺激を減らすために叱った対象に従うようになる。

正の罰

正の罰は、罰の刺激を与えることにより、その行動を抑える（弱化とも）。

例えば、全力で走っていた子供が転けて痛みを感じる、次からはその痛みを感じないようにするために走ることをやめるか、程々に走るようになる。

負の罰

負の罰は、報酬の刺激を減らすことにより、その行動を抑える。

例えば、子供に静かにするという約束でゲームを与えたが、子供が騒いだのでそれを取り上げる。すると子供は騒がなくなったというものである。

消去について

古典的条件づけとオペラント条件づけについては、消去という現象が起こる。

消去は、強化された条件づけとは違う事が起こったり、反応が無くなっていくことにより強化された行動が徐々に無くなっていく。

この消去という考え方は、心的外傷後ストレス障害などの不安障害に対して心理療法を行う際に必要になってくる。主に暴露療法において、特定の相手や場所を避けるといった場合に、その場面に安全な状態で直面させたりすることによって、徐々に強化された行動を無くしていく。

例えば、男性恐怖をもつクライアントに対して、安全な状態で男性と接触させることにより、初めは拒否反応を示すものの徐々に過度な行動が無くなっていく。というようなものである。この療法に関しては、始めは弱い不安な状況から始め、徐々に鳴らしていく過程が必要である。

まとめ

私達の学習には常にこのような現象が起きているとされ、これらを知ることで自分の行動についても、どの条件づけによるものなのか考察したりすることができ、そのような使い方も面白そうではある。

今回はオペラント条件づけによる応用行動分析だったり、学習性無力感については触れなかったが、気が向いたらそれらについても書いてみたいと考えている。

また、最近では内発的動機づけという概念も出てきており、そちらの方が期待される効果が高いという話も出てきている。

いずれにしても、オペラント条件づけについては重要なので覚えておいて損はないだろう。

参考

オペラント条件づけとは？日常例は？応用行動分析や行動療法について解説 - 公認心理師の試験対策ノート

ソーンダイクの猫のパズル・ボックス

効果の法則｜学習心理学 - 科学辞典

三項随伴性 - 心理学用語集サイコタム

オペラント条件づけ - 心理学COCOROの法則

オペラント条件付け：４つの学習パターン - 犬のしつけ

オペラント条件づけ - よくわかる！ホンモノの心理学！

暴露療法とは？不安障害がある私の体験した暴露療法について - 障害者ドットコム

オペラント条件づけ - Wikipedia

強化 - Wikipedia

弱化（心理学） - Wikipedia

暴露療法 - Wikipedia