
行動変容法
1つの図で表すと・・・
https://www.rational.org.nz/prof-docs/women&depression.htm

行動変容法を先に扱う理由は,
- 動物の調教にも応用ができること
-
行動とはなにか?
- 行動はなんらかの機能を有している.それが非適応的であっても,なんらかの目的には合致している.
- 行動のパターンは
外部から観察可能な環境との相互作用 の結果として(意識的であれ非意識的であれ)学習されたもの である. 環境には,先行事象と結果事象 がある.- 行動は頻度,持続時間,強度などの観点から定性的・定量的に測定できるものである.それゆえ,介入により改善したかどうかを客観的に判定することができる.
- 行動はラベリングではない.例えば「彼は怒っている」は行動につけられた名称であり,「彼は,母親に対して大声を上げ,二階に駆け上がり,自分の部屋のドアを強く閉めた」が行動である.
行動変容法が扱う行動は
オペラント行動
オペラント条件付けとは,ある状況における報酬や嫌悪刺激に適応して,自発的にある行動を行うように学習することである.そしてその行動がオペラント行動である.
例)カゴに閉じ込められたネズミがいる.レバーを押したときに餌を与えればレバーをもっと押すようになるし,レバーを押したときに電流を流せば,レバーを押さなくなる,というのがオペラント条件付け.レバーを押す,押さないという行動がオペランド行動である.
オペラント行動は先行事象(Antecedents),オペラント行動(Behavior),結果事象(Consequences)のABCで理解できる.
BとCの関係から整理する
まずはAについては考慮せず,BとCの関係だけを考えると,次の3つに分類できる.ここで好ましい結果事象=報酬をC+ ,望ましくない結果事象をC-と書くことにしよう.
正の強化 = Bをしたときに C+ を与えて Bを増やす
負の強化 = Bにしたときに 今存在するC-をなくして Bを増やす
正の弱化 = Bをしたときに C- を与えて Bを減らす
負の弱化 = Bをしたときに 今得られているC+をなくして Bを減らす
消去 = Bをしたときに 今まで得られていたC+を与えないことで Bを減らす.
分かりづらいと思うのでネズミの例で説明しよう.
ネズミの例
正の強化 = レバーを押したら,新たに餌を与える
負の強化 = レバーを押したら,すでに流していた電流を止める
正の弱化 = レバーを押したら,電流を新たに流す.
負の弱化 = レバーを押したら,今享受している餌を取り上げる.
消去 = レバーを押しても,今までは与えていた餌をもう与えない
となる.
このように消去では行動の結果,得られていたはずの報酬が得られず,なにも起こらない.報酬を与えないだけで,今何かを奪うわけではない.
負の弱化では,行動の結果,今得ている報酬が奪われる.負の強化で,今得ている嫌悪刺激が奪われるのと同じである.いずれの場合でも,今存在するものをなくすのが「負」ということの意味である.
効果的な実施方法
強化を効果的に
強化を有効にするための方法を正の強化を例に説明しよう.
- 即時性
─ 報酬を行動のすぐに与える必要がある.時間が経てば,何に対する報酬なのか分からない. - 随伴性,
─ 行動が起きたときだけ報酬を与える.行動してもしなくても報酬が生じるなら,行動は強化されない. - ランダム性
─ 行動に対して報酬を必ず毎回与える必要はない.むしろ報酬を与えるかどうかにランダム性を加えるほうが効果は高まることが知られている.例えば行動Bを平均して10回行ったときに一回報酬を与えるが,それぞれの頻度は5回とか13回とかバラバラにする.
消去で注意すべきこと
消去で注意すべきは消去バースト,自発的回復である.消去バーストとは,消去によって行動の頻度や持続時間,強度が一時的に増大することである.自発的回復とは,消去された行動がしばらく経った後,再び出現することである.
例えば大学生Kは毎朝校門近くの自販機でコーヒーを買う.これはお金を自販機に入れると(B)コーヒーが飲める(C+)という正の強化を受けていると解釈できる.ある日,お金を入れたのにも関わらず,何も出てこなくなったとしよう(消去).このときKは何度もボタンを押したり,自販機をバンバン叩いてみるも結局無駄でコーヒーは得られなかった(消去バースト).それから一週間はコーヒーをそこで買うことはやめたのだが,ふとお金を再びその自販機に入れてみた(自発的回復).そのときも,同じくコーヒーは出てこなかった.こうしてKは二度とそこでコーヒーを買うことをやめた.
弱化の副作用
効果的な弱化のためには,強化と同じく即時性と随伴性が大切である.しかし,弱化には特有の副作用が存在する.例えば,弱化においては,嫌悪刺激を与える人にも与えられる人にも負の強化が生じうる.
まず嫌悪刺激を与えられる人=正の弱化を受ける人について.この嫌悪刺激から逃げることができるのであれば,この逃避行動により,嫌悪刺激をなくすことができるので,負の強化を受ける.つまり弱化を受けた人は,逃避行動が可能な状況にあるならば,その逃避行動が強化されてしまう.
つぎに嫌悪刺激を与える人=正の弱化を与える人について.例えば,自分が好まない行動を誰かがしたときに,それを弱化(例えば何らかの罰を与える)によって,弱める人がいるとしよう.彼は,弱化によって好まない行動がなくなるという報酬が得られるため,負の強化を受ける.それゆえ,弱化の使用が過剰になってしまうかもしれない.
弱化には副作用が多く,特に嫌悪刺激を用いることになる正の弱化は専門家の間では最後の選択肢とみなされる.負の弱化の代表例としてはタイムアウトがある.これは,問題行動をおこしたときに,短時間,正の強化子に触れる機会を奪うことである.例えば,幼児が危険な遊びをしたときに幼児をベビーベッドに10分間隔離する.これは今得ている報酬を奪われているので負の弱化である.
Aの導入
同じ行動であっても強化,消去,弱化のうちどれが起きるのかは文脈依存的であることに気づけば,先行事象(A)が果たす重要性が理解できる.例えば信号を直進するという行動は,赤信号のときと青信号のときで,別の結果事象をもたらすだろう.
再び,ネズミがレバーを押す状況を考えよう.例えばライトを導入して,赤いライトがついているときにネズミがレバーを押せば,餌を与え,緑のライトがついているときには,ネズミがレバーを押しても,餌を与えないとしよう.するとネズミは赤いライトのときにしかレバーを押さなくなる.
このように行動が強化されたときに存在していた先行事象を,弁別刺激(SD discriminative stimulus)と呼ぶ.一方,行動が強化されないときに存在していた先行事象を,非強化先行刺激(SΔ)と呼ぶ.ネズミの例では赤いライトがSDであり,緑のライトはSΔである.
特定の先行事象を提示したときに,オペラント行動の確率が上がれば,その行動は先行事象の刺激性制御を受けているという.
先行事象は般化(generalization)されうる.つまり,SDと似た先行事象でも,同じ行動を示しうる.例えば自傷行動を示す高度の知的障害児Aを例に取ろう.
Aは母親が部屋にいると,四つん這いになり床に頭を打ち付ける.そうすると,母親がやってきてAを抱き上げ話しかけるという報酬を与える.これで自傷行動は強化される.一方,部屋に姉がいるときにはAは自傷行動をしない.なぜなら,それをしても姉は何もしてくれないからだ.ここから母親の存在はSD,姉の存在はSΔである.ここでAが入院して,そばに女性看護師がいたとしよう.これはSDと類似している.そこでAが四つん這いになり床に頭を打ち付けたとき,彼女はAを母親と同じように,抱きしめ話しかけたとしよう.こうしてSDは般化されていき,誰か大人がいれば自傷行動をするようになるかもしれない.
レスポンデント行動
レスポンデント条件づけは,無条件刺激(US)に,中性刺激(CS)を対提示することを繰り返すことで,CS単独でも,無条件反応(UR)と似た条件反応(CR)を引き起こすことである.URやCRがレスポンデント行動である.
パブロフの犬を例に取った分かりやすい説明がすでにあるので,こちらを参照.汎化,消去,自発的回復なども見てほしい.
では,オペラント行動とレスポンデント行動の違いはなにか.
レスポンデント行動は,「生物学的基礎」をもつ「生理的な身体反応」で,オペラント行動は強化などによる「学習された行動」である.つまりレスポンデント行動は自分の意思とは関係なくおこる反応で,オペラント行動は学ばれた行動である.これら2つは一つの状況下でどちらも生じることがあるが,それが反応なのか行動なのかを意識すれば区別することができる.
- 例えば,工場員Fの目の間には,機械があって,この機械は作業中に時々,Fに空気を吹き付ける(US)ためFはそのたびに目をつぶってしまう(UR)のだが,機械はその前にクリック音(CS)を鳴らす.このUSとCSの対提示により,Fはクリック音(CS)を聞くと必ず目をつぶってしまうようになった(CR).(レスポンデント条件づけ)
- 次第にFはクリック音を聞くと(A),頭を横にそらすこと(B)を覚えた.これにより,空気はFの目には吹き付けられなくなる(C-の除去).それゆえ,頭を横にそらす行動は負の強化をうけ,クリック音のたびに頭を横にそらすようになる.(オペラント条件づけ)
- 頭をそらす行動が学習されれば,クリック音(CS)と目への空気の吹付け(US)の対提示がなくなる.こうしてFはクリック音を聞いても目をつぶらなくなる.(レスポンデント行動の消去)
基本原理のまとめ
行動についての基本的な原理,すなわち
- オペラント行動のABC
- 強化,弱化,消去
- 刺激性制御
- レスポンデント条件づけ
について理解できれば,新しい行動を形成したり,問題行動を分析し修正したりすることができる.
あたらしい行動を形成する方法 -シェイピング
シェイピングは,強化と消去を組み合わせて,獲得したいオペラント行動(標的行動)に漸近的に接近することである.
例えば水族館のイルカやシャチは複雑な芸を学習しているが,これらの複雑な行動を行わせるためにシェイピングを活用できる.
オペラント行動を強化する上での問題になるのは,行動を強化するためには,その行動が実際に発生する必要があるということだ.行動が発生しないと報酬が与えられず,ゆえに強化はできない.しかし,例えば輪をくぐるとか,飛び上がってボールにタッチする,のような複雑な行動が,自然に生じることはない.
そこでシェイピングである.複雑な行動の実行のためには,いくつかのステップを経由すればいいことに注目する.
例えばスキナー(skinner 1938)が行った実験を再現しよう.この実験では,30cm四方の実験箱のなかにいれた実験用ラットにレバーを押させるためにシェイピングを利用した.オペラント条件づけの項で,ラットがレバーを押した時に,餌を与えたり,電流を流したり,という実験を紹介したが,これを行うためには,ラットがレバーを押す必要がある.しかし,ただラットを箱に入れただけでは,ラットはレバーを押そうとはしない.そこで,「レバーを押す」を標的行動とし,これに漸近的に接近するために,次の7つのステップに分解した.
ここで1つ目のステップは,自然にラットが実行することだろう.ラットがたまたま,レバー側に移動すれば,報酬を与え,その行動を強化する.そしてその行動が十分に強化されれば,すなわちレバーの側にいる時間が長くなれば,たまたまレバーの方向に頭を向ける可能性が高くなる.そこでこれが実行されたときに報酬を与えることにする.同時に,ただレバー側にいるだけではもう報酬は与えない.これで2の行動が強化されるとともに,1の行動は消去される.
これ以降のステップは同様で,次の行動を強化しながら,前の行動は消去する.各ステップの行動は,次のステップの行動が自然に発生する確率が高くなるようなものを選ぶ必要がある.最後まで到達すればラットはレバーを押すことを学習する.
例えば,イルカを調教するときにも話は同じである.このとき,効果的な強化のためには即時性が必要だったことを思い出そう.つまり,行動のすぐ後に報酬を与えなければ,その行動を正しく強化することができない.しかしイルカが水面からはねたときに,即座に餌を上げることなどできない.そこでトレーナーはホイッスルを活用する.つまり,餌(UR)とホイッスル(CR)を対提示する
意図せずシェイピングしてしまう場合
シェイピングは自然には生じない複雑な行動を形成するために有効な方法であるが,意図せずシェイピングが生じることで,手に負えない問題行動を作り上げてしまう場合がある.
例)母親が仕事をしているとき(A)に子供Vは,遊ぶようにせがみ(B),母親は遊んでやっていた(C+).母親はこの行動に困っていたので,消去することとした.遊ぶようにせがんでも(B),遊んでやらないことにしたのだ(C+を与えない).そこでVは消去バーストを起こし,泣き叫んで走り回った(B').母親は心配になってVを抱きしめた(C'+).つぎにVが母親に遊ぶようにせがんだ(B)ときも,母親は無視したのだが(C+を与えない),やはりVは消去バーストをおこして,泣き叫んで走り回る(B').母親はやはり心配になってVの相手をした(C'+).これはBを消去して,その近似行動であるB'を強化していることと等しい.
こうして,Vは遊ぶのを断られると,いつも泣き叫んで走り回った(B')が,母親はそれに慣れてきたため,その日は無視した(C'+を与えない).するとVは,走りながら壁にタックルし,床をダンダンと蹴り始めた(B'').近所迷惑になることを恐れた母親はVの相手をすることにした(C''+).こうして,さらに悪い近似行動(B'')を強化してしまっている.
問題行動の分析方法
問題行動の分析はオペラント行動の原理であるABCの観察・理解から始まる.
- A どんなとき?
─ 誰といるとき,どこにいたとき,その前に何をしていた,されたときに問題行動は生じるか.逆にどんなときには生じにくいのか. - B どんな行動?
─ 定性的(単なるラベリングではない正確な行動の記述)・定量的(頻度,持続時間,強度)に行動を記述する. - C 問題行動のあとに何が起きる?
─ 行動の結果,何を得ているのか,何を避けるのか.
そして,行動Bの修正のためには,環境すなわちAとCをどのように修正すればよいかを考える.行動Bが理解できたといえるのは,その行動の予測