「深層学習と新しい心理学」の感想にかこつけて行動の科学のあれこれを語る

つい先日こんな記事が出てXで流れてきた。

www.note.kanekoshobo.co.jp

 

結構いろんな人が反応してるから、俺も流れに乗ってなんか感想くらい言っておこうと思う。まあ本当に流れに乗っかって書くだけなので、ただの感想文みたいなもんでしかないけどね。

 

文脈としては、9月に開催された日本心理学会でのシンポジウム「深層学習と心理学 ー その可能性を探る」の背景的にあるモチベーションの話として、心理学における深層学習の位置付けを「ただ単に道具として便利だね。嬉しいね」以上の基幹的な関係に置こうという構想みたいだ。ちなみに、俺自身は、深層学習とは『ゼロから作るDeep Learning』を大昔に一周したのと、DeepLabCut*1を日常的に使ってるだけ。それだけのあっさい関係。

 

このシンポジウム自体は、俺も参加して楽しく聞かせてもらった。特にこの記事と関係あるのは神谷之康先生のNeuroAIについての講演だと思う。会場から認知心理学者が机を叩いて激昂する勢いで反論してくるんじゃないかとワクワクしたのだが、当日は特にそんなこともなかった。というか、会場から質問したのは俺だけだった。しかも、てってて行動主義がどーのみたいな話。あの会場で、俺だけが興味があることだったかも。でも、大事なことを聞いたとは思う。この話は少し後で戻ってこよう。

 

 

speakerdeck.com

 

 

前置きはこのくらいにして、冒頭の記事の話をしよう。

中身を俺なりに要約すると、次のようなことを言っているように思われる。

  1. 現行の心理学のやばさって「構成概念を使う」やり方そのものに原因があるのでは?
  2. 深層学習は構成概念を使った認知モデルとかではないけど予測うまくいってる。ということは、深層学習が心理学の基礎モデルになるのでは?
  3.  深層学習の解釈は物理学・生物学、あるいは計算機科学から進んでるので、解釈可能性という難点も今後解決されるのでは?
  4. よって、心理学者は予測と介入に従事し、「説明」をしたい人は物理学や生物学を勉強しましょう
  5. 強力な予測と介入の技術が、心理学のドメインでも深刻な影響を及ぼす可能性があり、その悪用に抗する知恵を我々は必要とするはずだ

 

各点に関して、何か頑張って言ってみることにしよう。雑駁とになってしまうが、許してほしい。まず第一点目、「現行の心理学のやばさって「構成概念を使う」やり方そのものに原因があるのでは?」って話。

 

構成概念が何を指しているのか、記事内で特に明示されていないから「心的概念」「心」「内的変数」なんでもいいんだがそういう感じの言葉と置き換え可能な意味で受け取っている人も多かったように見える。でも実際には、ここで述べられている構成概念とは、仮説構成体 (hypothetical construct*2 ) のことだと思われる。仮説構成体ってのは、仲介変数 (intervening variable) と対になってる概念だ。まずはそれを簡単に説明するけど、俺の「行動」論文でも書いたので、みんな読んでね*3

 

心理学ではよく操作的定義ってやつが行われるのはみんな知ってると思う。知能とは知能テストで測られるものってやつだな。操作的定義によって概念をあれこれ定義するわけだが、仲介変数の場合、単に操作と紐づけられ、それ以上の余剰の意味を持たせず用いられる。記述概念とか傾性概念とも呼ばれるけど、ようは同じ。力=質量×加速度として定義*4された「力」は、それ以上の余剰な意味を持ってない。ここで「この "力" って概念にはなあ。質量と加速度からは観測されない俺の "覇気" も込められている、そんな味付けの概念なんだぜ」みたいなことを俺が言っても、誰も相手にしてくれない。Hull派の理論に出てくる心的概念 (動因だとか習慣強度だとか) も、一連の操作とくっついていて、それ以上の意味を持たない (ことになってる)。心理学において仲介変数、記述概念、傾性概念に括られる概念その程度の意味で、至極、行動的事態を単に指してるだけ。これはまあ、こんなもんってことでいいよな。

 

一方で、仮説構成体はそれ以上の余剰な意味ってのが明示・非明示的に付与されている。例えば、「短期記憶」を測る実験課題ってのはいっぱいある。仲介変数として厳密に運用すると、それらはそれぞれの課題にガチっと紐づいていて、記憶A、B、Cとでも言うべきものだが、あまりそうは考えないだろう。それらは「短期記憶」という共通した何か*5があって、それに対し別の測り方をしてる。しかも、それが日常生活で運用されてる「短期記憶」になんらか対応している。そんな風に考えるはずだ。これが「余剰の意味」の部分*6。DL心理学で問題になるのは仮説構成体の方で、仲介変数、記述概念、傾性概念ではない。後者もダメってなったら「●●行動」みたいな測定すら困難なケースが多発する。さすがにDL心理学もそれは勘弁してくれるだろう*7

 

「心理学的説明をしたい!」って人は、仲介変数だとなんか煮え切らないと感じる人が多いと思う。逆に仮説構成体は便利なんだな。すごく内省に合う運用ができるから。比較的内省に合う認知モデルを作って、爆速PDCAで検証サイクルを回す。いいじゃん、認知主義。というふうにこれまで回ってきたことになっている。しかし、いろいろ問題もある。やや乱暴な要約をすると、例えばSkinnerは「いやそれってゆーても言語共同体の合意に基づいた単なる "言い換え" すぎなくて、行動的な事実に心的概念の指し示すものを見つけた方が有効なんじゃないすか」*8とか、「そもそも心的概念ってそんな内側のプロセスとして捉えるべきじゃなくて、相互作用の中で主体がconstitutiveな関係を持つことで実現されていると考えるべきですよね」*9とか、「いやいや構成概念の連鎖をアルゴリズミックな形で表現できるような情報処理として神経活動って必ずしもおこってないんじゃないの・・・」*10とか、まあいろいろある。操作に紐づけられた厳密さが弱まるとと、研究間の理論的繋がりも薄くなってある程度「連想ゲーム」的に仮説を出すことだってできなくはない*11。部分的にせよ、再現性問題の遠因にもなってるのかもしれない。例えば、仮説構成体に頼らない行動分析学だと「対応法則に再現性がありませんでした」なんてことになると、分野そのものが一発で大打撃を受けちゃうよね。

 

DL心理学は、構成概念に頼らない形で心理学研究を展開できるという期待があるようだ。これが2番目の「深層学習は構成概念を使った認知モデルとかではないけど予測うまくいってる。ということは、深層学習が心理学のモデルになるのでは?」という話だ。

従来の認知神経科学実験心理学の仮説構成概念の神経相関を調べるのに対し、NeuroAIが距離をとるのと同じような形で移行ができるかもしれない、そんな展望だと思われる。具体的な研究は記事内ではあまり出てこなかなったが、素っ頓狂な話ではなくて、PredNetが錯視を見るって研究*12とか、意識変容をモデル化した鈴木さんのHallucination Machineとか、想定に近い研究はちらほら出てるのかも。

 

しかも、以上のご利益は深層学習に限った話ではない。例えばreservoir computingもそうだし、特に物理レザバーの考え方は個人的には比較認知科学の新しい指針になりうると俺は思っていて、昔ちょっと触れたことがある。記事内でも触れられている複雑ネットワークだって同じことが言える。俺の後輩の山田くんは、実際にネットワークで習慣行動を説明する論文とか書いてる。ここにも構成概念とか出てこない。すげえぞ、山田*13。まあ、「別に深層学習じゃなくても目的達成できるんじゃ?」みたいなことはいくらでも言えそうだが、深層学習が広い領域で成功を収めているのを踏まえれば、とりあえず第一の旗に掲げていることを殊更にくさすこともないだろう。また、「CNNが人間の認知のモデルたり得るには、生理学的妥当性として●●が足りてないのでは?」みたいなことはいくらでも出てくるだろうけど、それは俺より詳しい人があれこれ既に言ってるだろうから、立ち入らない*14

 

さて、あちこちの反応を見ると、(1)、(2)から「深層学習を基礎に置いた心理学は構成概念フリーになり、結果として心理学的説明が不要」*15となるみたいに受け取ってる人が散見された。けど、この帰結にはやや飛躍がある。というのは、心的概念やら心やらを扱う唯一の方法が仮説構成概念ではないからだ。

構成概念にまったく依拠しない研究となると、本当に数えるほどしかないのではないかと思われます

と、記事中では述べられている。「数えるほど」がどの程度かはわからないけど、そんなことはないんじゃないかなぁと思う。もちろん「主流派」ではないのはその通りだけどね。Skinnerの徹底的行動主義、Rachlinの目的論的行動主義、Staddonの理論的行動主義、Kantorの相互行動主義、Gibson生態学的アプローチ。知覚心理学、心理物理学だって、ここで問題にされるような構成概念を使ってない研究が多いよね。後年の『認知の構図』のNeisserとかもどうだろう?Piagetの諸概念がここで問題にされている構成概念なのかは、意見が割れるかもしれない。歴史的には、Hull派のような厳密な操作主義に基づく体系、ゲシュタルト心理学、実験現象学。構成概念だって、Stevens-Boringの操作主義に忠実に基づく限りはそれほど悪さはしないだろう。逆に、連合学習理論はそのままだとアウトだな・・・。

 

おいおい、半分くらい行動主義じゃねーか、と思われるかもしれないけど、ここに挙げた行動主義者は、心的概念を認知主義に陥らない形で扱うために悪戦苦闘してきた人たちで、全員言ってることが違う。例えば、俺がわりと好きなRachlinだと、心的概念は行動の時空間的な広がりや、その可能性として目的論的に説明され、それは行動の科学の重要な対象である、なんて考える。Rachlinの本、なかなか面白いから読む人が増えたら嬉しい。なんかプレミアついて高くなってるけど*16

 

とまあ、挙げてみたらいろいろとあるわけだ。いろいろあって嬉しいねってことではなくて、いずれも「構成概念、正確に言えば仮説構成体は使わないけど、心的概念の研究は諦めないし、 "心理学的水準" とでも言うべき説明に留まってやるぜ」って枠組みなわけだ。行動主義なら「行動次元で閉じた説明」というやつだ。この点は4番目の話に繋がってくるのですぐ後ほど戻ってこよう。

 

 

3番目の「深層学習の解釈は物理学・生物学、あるいは計算機科学から進んでるので、解釈可能性という難点も今後解決されるのでは?」って部分は、現行のさまざまな議論が列挙されていて、これは後で参照できて助かる。

誰でもすぐに浮かぶ疑問は「いやでも、それが心や行動の説明としてなんか有効になるんか?」ってことだと思う。例えば「ベイズ学習を表わす式 (ベイズの定理) は、生物進化をモデル化するときに用いられるレプリケーター方程式と等価である」ことが心理学的説明としてどんなimplicationがあるのか、というのは、俺にはすぐ出てこない。きっと、DL心理学の旗手たちも今頭を抱えて考えていることなんだろう。

 

でも、別にそういうのは後から見つかった例ってのは科学の世界にはいろいろあるわけだ。例えばSkinnerだってオペラント箱作る前に徹底的行動主義を名乗ったし、Watsonだって条件づけを知る前に行動主義宣言をした。自由エネルギー原理だって最初は皮質の計算原理として出てきたと思ったら、いつの間にか生命のあり方を規定する深淵な話になっちゃってる。

 

逸話めいたことだが、Watsonは1ダースの子どもが云々という有名な文句の直後の文章で次のようにも言っている。

私は、事実より先走っている。私はそれを認める。しかし反対論の提唱者もそうしているし、何千年来そうしてきた。この実験をするときには、子供の育て方や子供が住まなければならない世界をくわしく述べることを、私に許すべきだ、ということをどうか心にとめて欲しい

これが科学者*17がとっていい態度なのかどうかは意見が割れそう*18だが、発見に先走った主張ってのはままあることなんだな。

 

なので、ここはこれ以上とやかく言うところでもないだろう。DL心理学をまじめに取り組めば、経験的にわかっていくことだろうから。

 

 

一番問題になりそうなのはここ、4番目の「心理学者は予測と介入に従事し、「説明」をしたい人は物理学や生物学を勉強しましょう」ってところ。実際、やや煽り気味にも見えるが、端的に次のように書かれている。

予測や介入を超えて、より深い、理論的な説明をしたいと望むのなら、物理学や生物学を学べばいいでしょう。

これは、翻って「心理学的説明みたいなものはないよ」とも読めなくはない*19。構成概念を用いた心理学を脱却するという地点から、この帰結に至るにはだいぶ飛躍があるように思われる。先ほど (3) で述べたように、構成概念を使わないで心的概念を分析したり、実験に乗せたりする方法は歴史上数々の試みがなされていて、今なお息づいている。先ほど出てきたらRachlinもそうだけど、別の行動主義者Staddonだったら「行動と環境の相互作用の履歴の要約」として内部状態という概念が出てきて、それはまたRachlinとは違った分析スケールになる。すごく大雑把には、行動の科学はそういう分析レベルの設定を巡った変遷でもある*20。この諸議論は行ったり来たりしつつも、「もっとたくさんの現象を扱えるように頑張っていきたいよな」って方向で進もうとしてるわけだ。構成概念、もっと言えば仮説構成体の使用を止めるという提案から、この進展自体やめちゃおうというのは、かなり大きいジャンプがある。

 

それに、深層学習みたいなモデルを使って予測と介入に特化したら構成概念から逃れられるとは限らない。似たような事例で考えれば、わかるかもしれない。自由エネルギー原理は、「細胞の代謝から個体の行動まで、いい感じに定義した自由エネルギー (もしくは期待自由エネルギー) を最小化として定式化できるよ」という主張なわけだ。全部自由エネルギーの最小化として捉えられるなら「心理学的説明」がいらなくなって、全部形式的な操作と統一的な目的関数の最適化となって万事OK・・・とは、残念ながらならない。自由エネルギー原理を満たすような個別のモデル (プロセスモデル、と言ったりする) には、ドメイン固有の概念がどうしても出てくる。例えばBogacz (2020) のDopActモデルは、習慣行動を説明するモデルになっていて、自由エネルギー原理にしてはシンプルな定式化でいい感じに実験結果が再現できたよって話なんだが、そういうプロセスモデルを組むのに際してどうしても中に心理学的概念が入り込んでくる。もちろん、これは仮説構成体とはちょっと違う。これはよいとしよう。ただ、「元の実験がいい感じに再現できたよ」というときのデータは仮説構成体*21を背後にした実験になっている。なので、この「いい感じの再現」も当然仮説構成体に基づいた正当化が入り込んでるということになる。形式化は必ずしも仮説構成体の恣意性の混入を防ぐわけじゃない。実験心理学である限り、結局、明らかにしたい心的概念の取り扱い方とどこかで向き合う場面が出てくる*22

 

加えて言えば、「予測と介入」って言い方は、おそらく行動分析学の「予測と制御」からきているんだと思うんだけど*23、実験的行動分析学の「予測と制御」って、系統的な随伴性の操作によって環境との機能的関係を同定することにより実現されるわけなので、「何かインプット入れたらアウトプットがいい感じに現実を予測してくれた」というのとはちょっと違う。というのは、十分に個体と環境の機能的関係が同定されたなら、それは行動的な事実間に成立する法則や秩序による説明が十分に成立しているからだ。しかも、インプットーアウトプットだけじゃ実際にはだめで、後続事象の役割が大事、かつ、後続事象との有機的な関係が心的概念の内実なんじゃってのがSkinnerの主張だったりする。なので、行動分析学の「予測と制御」の語感をそのまま受け取ると結構ミスリーディングなんじゃないかと思う。

 

5番目の「強力な予測と介入の技術が、心理学のドメインでも深刻な影響を及ぼす可能性があり、その悪用に抗する知恵を我々は必要とするはずだ」というのは、俺から特に言うことはない。Skinnerも『自由と尊厳を超えて』とかで行動科学は危険すぎて悪用されたら激ヤバなので、それに対するカウンター制御を我々は知ってないとやばいみたいなことを言ってる。実際、やばい。深層学習でもきっとそれはそうなんだろう。

 

以上をまとめると、俺の感想は次のようになる。

  • 構成概念を振り回す心理学にNoを突きつける方向、俺は好き
  • ただ、それは思ったほど単純な話ではなくて大きな知的冒険になる (まあこれは上等でしょう)
  • 構成概念 (仮説構成体) の使用が「心」の科学の唯一のアプローチではなく、構成概念の放棄と「心」の科学を諦めることは同値ではない
  • 実際には、心理学的水準とは何か、その分析単位とは何かが争点になるはずだし、それは行動の科学の変遷そのものだった。DL心理学が成立しても、そこと向き合う必然性は消えるように思えない
  • 深層学習の機構の説明や解釈可能性の進展が、心や行動の有効な説明になる保証はどこにもないけど、そこはまあ俺が外野からやいのやいの言うまでもないもなく、進むことだろう

 

 

最後に、細かいところにもぶつくさ言うのもあれなんだが、一応述べるだけ述べておこう。

心理学的構成概念を用いた認知主義的制約 (マー, 1987) 

 David Marrをこれに挙げるのはあまり代表的ではないような?Marrに詳しいわけではないのだけど、MarrがDL心理学で問題にされる意味での構成概念を重視する立場なのかは、要審議な気がする。

 

行動主義や認知主義などの「主流派」を、心や社会が本質的に持つ複雑性から眼を背け、生態学的妥当性・一般化可能性を軽視しているとして批判してきました。これは正しい指摘だったと思います。

行動主義が「心や社会が本質的に持つ複雑性から眼を背け、生態学的妥当性・一般化可能性を軽視している」かどうかはそこまで単純な話でもない。Skinner (や、Kantor、Baum、Staddon、あるいはMeadやWeiss、Brunswik) は「心や社会が本質的に持つ複雑性」に対処しようとして社会論や言語行動についても概念的な分析を加えたわけなんだが・・・。「生態学的妥当性」は系統発生的随伴性や生物学的制約として繰り返し述べられてきて、「一般化可能性」は行動の科学の目的そのものでもある。もしかして、ここで批判されている行動主義は、Hull派のことだろうか。それなら納得できる。まあでも、Hull派は「一般化可能性」を求めた最極みたいなもんだと思うけど。

 

深層学習は、それ自体複雑なモデルであり・・・

この上の段でいってる「複雑」は複雑系科学の複雑だけど、ここの「複雑」は一般的な意味での形容に見える。

 

心理学史の中でさえ、行動主義の流行と衰退、それに代わる認知主義の到来、認知神経科学の流行、そして近年では再現可能性問題への取り組みなど、幾度もパラダイムの転換が起こってきました。

これらはいずれも「パラダイム転換」だとは俺は思わないな。

 

 

*1:このソフトウェアでやることは、訓練データぽちぽちするだけ。つまり、完全にただのお客様ユーザーレベルってこと

*2:MacCorquodale, K., & Meehl, P. E. (1948). On a distinction between hypothetical constructs and intervening variables. Psychological review, 55(2), 95.どうでもいいけど、俺、この論文すごく好き。

*3:隙あらば宣伝

*4:これは「操作的」ではないけどね

*5:この「何か」には性質、機能、entityなど、認知主義の中でも考え方によって変わる言葉が入るはずだ

*6:ちょっと余談なんだが、Greenwood (1999) は、いわゆる「認知革命」って呼ばれている運動は、仲介変数から仮説構成体への大規模移行なんじゃ?みたいなことを言っていて、これには俺も「なるほどなぁ」と一定の納得感がある。

Greenwood, J. D. (1999). Understanding the “cognitive revolution” in psychology. Journal of the History of the Behavioral Sciences, 35(1), 1-22.

*7:俺自身としては、仮説構成体どうにかなんねえかなと思いながら使ったり使わなかったりしてる。ゆくゆくは、自由な思考を毀損することなく、どうにかしたい。幸せになりたい。そんなスタンス。

*8:Skinner, B. F. (2016). Why I Am Not A Cognitive Psychologist1. In Approaches to Cognition (pp. 79-90). Routledge.

*9:ようはenactivism。例えばGallagher, S. (2017). Enactivist interventions: Rethinking the mind. Oxford University Press.

*10:Scott, S. H. (2008). Inconvenient truths about neural processing in primary motor cortex. The Journal of physiology, 586(5), 1217-1224.

*11:でも、連合学習理論だと割合そんなことないので、この部分は言うほど構成概念は関係ないのかもしれない

*12:Watanabe, E., Kitaoka, A., Sakamoto, K., Yasugi, M., & Tanaka, K. (2018). Illusory motion reproduced by deep neural networks trained for prediction. Frontiers in psychology, 345.

*13:ただ、構成概念から完全に逃れているわけじゃない。この話は少し後にする。

*14:例えば、通常のfeedforward networkのCNNなら、再帰結合の割合とか揺らぎとかbakc propの問題とか?俺は詳しくないのでこれくらいでお茶を濁しておく

*15:よく見たらそんなこと言ってない。でも、最後の方に「説明」をするためには物理学と生物学を勉強せよと言ってるし、うーん、微妙なライン。チャリタブルに読めば、物理・生物アナロジーで良い説明の体系が生まれることに期待している、というところか。

*16:そんなの読んでらんねえよって人がいたら、こっそり俺に連絡してくれ。ちょっとしたものをプレゼントしてやろう・・・。

*17:まあこれ書いたときのWatsonは既に広告会社勤務なんだがな

*18:もちろん「言い過ぎだよなあ」とは思うし、俺自身はあんまこういう態度を取らないようにしてるけど、この節はそもそも当時流行った優生学に対する反論なので、こうでも言わないと相手にされなかったのかもしれない。あるいは、単に大学クビになって言いたい放題言ってるだけか・・・。

*19:ただ、前脚注の通り、チャリタブルに見ればそうじゃないと読むこともできるし、本当のところ目指しているのはそっちなんじゃないかと俺は推測してる

*20:ちなみに、認知科学の祖であるGeorge Millerも『プランと行動の構造』で「新しい科学を名乗るからにはまずは分析レベルを述べなきゃいけないよなぁ!」とはじまっている。

*21:学習心理学の「習慣」は仮説構成体かと言われたら、「運用のされ方による」って話ではあるんだが。ただ、S-R連合とか言い始めたら、そりゃあ仮説構成体だろう。

*22:俺自身はどっちかというとそっちの考慮を頑張りたいというのが比較認知科学をやりながら思っている「裏目標」みたいな感じ。

*23:全然違ったらごめんなさい!ちなみに、予測と制御を目標って言い出したのは、俺が知る限りではWilliam Jamesだから別に行動主義の商標ってわけではない