適度な探索を行う機構

外部には無限に情報があるわけで、そこから必要な情報を引き出すのはなかなか難しい。

まずは効率よく外部の新規な情報を得ることが重要である。

一度学習したものに対して、それ以降も注意を払うのは情報獲得の観点では無駄なので、常に予測したものとの差分のみを意識に上げるべきだろう。

差分が一定以上存在している間は、その場所での探索行動が持続する、という機構があれば、閾値の調節次第で適切な探索行動が実現できる。


おそらくこれは主として皮質→線条体側坐核)→(腹側)淡蒼球視床→皮質のループとそこに投射する中脳ドーパミン系によって調節されているのだろう。

いわゆる強化学習的な機構によって、黒質腹側被蓋野)が予測誤差を算出し、その値が行動の維持にも関与しているという解釈である。