人間の意志と強化学習と手掛かり刺激と誘因特徴

典型的な「基底核強化学習」の枠組みでは、皮質に現在の状況が、線条体に行動がコードされ、外界から与えられる報酬によって適切な状況と行動の組が強化される。

すなわち、人間がある状況である行動を起こすのは、それが過去の経験によって強化されたからに過ぎない。


では、何らかの報酬を予期させる手掛かり刺激、あるいは「誘因特徴」によって、ドーパミン系が賦活された状態は、人間の「意志」にどのような影響を及ぼすか?

将来的にはそこに繋がった行動を強化するとして、その時点での効果は何か?


そもそも「手掛かり刺激」によってドーパミン系が賦活されることの意義は何か?

手掛かり刺激よりもさらに先行する刺激を手掛かり刺激および報酬と関連付けるという機能はある。

しかしドーパミン系の賦活にはそういった学習以外の効果もあるのではないか?


一部のOCDにおいてドーパミン系が過剰に働くことからも、特定の行動にコミットさせる効果はあるように思う。