報酬獲得の副産物と一度達成したら機能しなくなる目的

以前にも述べたが、直接報酬獲得に繋がらないものの、他の手段での報酬獲得時に付随することが多く、結果的に手掛かり刺激として機能する(状態価値を持つ)ものが存在しうる。

しかし実際それ単独では報酬をもたらさないので、それを最終的な目的として行動を起こした場合、報酬が得られずに負の報酬予測誤差が生じ、すぐに消去されてしまう。

ゆえにそういったものが目的として機能しうるものは基本的に書回のみ(消去に時間が掛かったとしてもせいぜい数回)である。


ただ「達成するまで」は、複数回の試行を促す可能性もある。

この時の目的としての価値は何によって支えられているのか?


おそらく、過去にそのものが付随していた報酬獲得の経験が強固なのだろう。

無限に機能するわけではないだろうが、そこで獲得した報酬が大きければ、長期間機能する可能性がある。

また、同様の報酬獲得(目的とするものが付随する形での)を繰り返せば、薄れた価値を再び高めることもできる。


しかし、達成するまでに複数回を促進できるにも拘わらず、一度達成すると価値が失われてしまうのは何故か?

おそらくそれ自体を目的とした場合には、責任割り当てが大きくなるので、少数の試行で大きく価値が変動してしまうのだろう。


そういうことを考えると、「敢えて達成しないことで状態価値を維持し、目的として長期間機能するようにする」という戦略が合理的な場合もあるのかもしれない。

報酬獲得に繋がらない目的が(本能的に理解している状態価値ではなく、理性に基づいて)価値を持つ状況とはどのようなものか?

例えば、「理性ではやるべきだと認識しているがやる気が起こらない行動(例えば勉強)」がその目的の達成に必要だとか、行動そのものが目的たりうる場合には、維持する合理的理由が存在する。