予測の重要性と雑多な刺激の報酬価値

人間は「予想外の出来事」も多少期待するが、基本的に外部の事象が自分の予想の範疇に収まることを望む。

これはどのような理由によるものか?

換言すると、「何らかの予測を行い、予測通りの刺激を得る」ことはなぜ報酬価値を持つのかという。


厳密な意味での「新規性」は予測不可能なものかもしれないが、例えば「部屋の模様替えをして気分転換する」ことは「予測可能」だが一定の「新規性」をもたらす。

根源的な欲求以外の何が報酬になるか明確ではないが、ほとんど全ての雑多な刺激が微小な報酬価値を持ち、それらの刺激は飽和しない(飽きない)限り報酬価値が持続すると考えれば、「何らかの操作によって周囲の環境を変える」ことは予測可能かつ報酬感を伴う行為である。

もっと単純なケースでは、「物を動かす」こともその一例と言える。

(本の置き場を変える、程度では面白みはないが、例えば幼児はオモチャの車を動かすだけでも満足するわけで)


また強化学習仮説では、報酬を予期させる情報はそれ自体報酬価値を持つわけで、予測そのものが報酬であると言えないこともないかもしれない。

ただ予測の対象はある程度限定される。

(もちろん上記のように「雑多な刺激」に微小な価値があると仮定すれば、どんな現象の予測も多少は報酬価値を持つ)