確実性の選好

人間には「リスクを好む」という面もあるのだが、それはひとまず置いておく。

何か欲しいものがあった場合、高い確率で手に入るならそれに越したことはないが、「低い確率でもそれなりに期待する」人間と「低い確率なら期待しない」人間がいる。

後者は「確実に手に入るなら意味があるが、そうでなければ意味がない」という考え。

どうしてそのようなスタンスになるかというと、「期待したのに手に入らない」ことのストレスが大きいことなどが理由だったりする。

おそらくAS傾向があるとそういうスタンスになることが多いのではないか。


強化学習の枠組みでそういった傾向を解釈するとどうなるか?

何らかの報酬が得られたとして、その時点で(というか少し前に)報酬の手掛かりとなる刺激がいくつか提示されているはずである。

その中には、非常に高い確率で報酬の到来を予測するものもあれば、報酬が来るかどうかは半々程度(もちろん何ら手掛かりがない状態よりは高いわけだが)というものもある。

どちらも報酬に先行する刺激である限り、報酬と関連付けられる可能性はある。


しかし、報酬を確実に予測する刺激でない場合には、その刺激が与えられたが報酬が得られない場合もある。

その際には(多少なりとも報酬と関連付けられている場合には)負の報酬予測誤差が生じて、報酬との関連が弱められてしまう。

その際の「弱められる程度」が個人の確実性への選好を決めるのではないか?