2013-08-05から1日間の記事一覧

病的な完璧主義の処方箋

おそらく完璧主義は、負の予測誤差が生じることへの病的な恐怖感から来ていると思う。それはある種の依存症に近い。 重要なのは、何か瑕疵ができてしまったとしても、一時的に報酬感がなくなることにさえ耐えられれば、特に問題はないということだ。

人生におけるメタな戦略

いすれは自分に合ったものを見つけてコミットすべきなんだろうが、ある程度ランダムに探索することも重要である。どの程度探索を行うべきかは非常に難しい問題で、最適な度合いを見極めている人間などまずいないだろう。 最終的に何かにコミットした場合に、…

状況の変化と即時の学習

行動が強化されるまでにはかなりの時間を要するが。例えば、ある報酬が、行動を起こさなくても手に入ると分かった時、行動もモチベーションは短時間で大幅に低下する。これはどのような機構によるものか?

可制御性と報酬感

明確な報酬が与えられなくとも、自分の行動がダイレクトの環境に反映される状況なら、行動のモチベーションは持続しやすい。「外部の環境の変化」がある種の報酬になっている可能性もあるが。

行動の強度と報酬感

基本的に行動に要する労力は、負の報酬として報酬から差し引かれるし、労力があまりに大きい行動は実行されない。しかし、全く行動を必要としない状況では、報酬が得られたとしても満足感はさほど大きくない。行動の労力には最適な値があるのだろうか?ある…

生物学的にありそうな行動選択のアルゴリズム

やはり行動の価値によるソフトマックスよりも、個々の行動について実行後のδを算出してその多寡で実行するかしないか決める(どれを実行すべきか決めるわけではない)方がありそうである。この手のアルゴリズムは、割と早い段階で提案されていたが。 この場…

状態と行動

強化学習のアルゴリズムとしては、どちらも似たようなパラメータだが、人間の場合はどのコードのされ方にかなり違いがあるのではなかろうか。 「状態」は、外部の環境からの刺激を受けて皮質にコードされるという解釈が多い。「行動」は、(基底核全体のルー…

能動性と報酬感

状況が徐々に好転していくことは好ましいが、それが自動的なものか、自分の行動によるものかで満足度は異なるだろう。おそらく自動的なものよりも、自分の行動に基づくものの方が大きいはずである。 本当に状況の好転が自分の行動に基づくかどうかは、判定が…

待つか行動を起こすか

集団に所属していて、その集団に誰かがやらなければならない仕事があったとする。その状況で、自分がやるか、他人がやるのを待つか。 単純に考えれば、ひたすら「待つ」のが合理的である。もちろん現実には、誰もやらずに問題が生じるケースや、いつも仕事を…

最低限の労力で目的を達成することの意義

特に男性はそこに価値を見出すことが多いように思う。もちろん労力が小さいに越したことはないと思うが、そこまで大きな価値を見出すからには、別の理由もあるのだろう。 行動による状況の変化が大きくないと行動を起こせない、という性質があるなら、「最低…