確実性の選好
人間には「リスクを好む」という面もあるのだが、それはひとまず置いておく。
何か欲しいものがあった場合、高い確率で手に入るならそれに越したことはないが、「低い確率でもそれなりに期待する」人間と「低い確率なら期待しない」人間がいる。
後者は「確実に手に入るなら意味があるが、そうでなければ意味がない」という考え。
どうしてそのようなスタンスになるかというと、「期待したのに手に入らない」ことのストレスが大きいことなどが理由だったりする。
おそらくAS傾向があるとそういうスタンスになることが多いのではないか。
強化学習の枠組みでそういった傾向を解釈するとどうなるか?
何らかの報酬が得られたとして、その時点で(というか少し前に)報酬の手掛かりとなる刺激がいくつか提示されているはずである。
その中には、非常に高い確率で報酬の到来を予測するものもあれば、報酬が来るかどうかは半々程度(もちろん何ら手掛かりがない状態よりは高いわけだが)というものもある。
どちらも報酬に先行する刺激である限り、報酬と関連付けられる可能性はある。
しかし、報酬を確実に予測する刺激でない場合には、その刺激が与えられたが報酬が得られない場合もある。
その際には(多少なりとも報酬と関連付けられている場合には)負の報酬予測誤差が生じて、報酬との関連が弱められてしまう。
その際の「弱められる程度」が個人の確実性への選好を決めるのではないか?