報酬感は予測誤差だけで決まるか？

もし人間がドーパミンに駆り立てられて行動するなら、得られることが確定している報酬ではドーパミン放出を持続できないので、いずれはどんな報酬にも興味を失ってしまう。もっとも、ドーパミン放出は学習のためのものと考えれば、報酬を学習するまでの段階…

2013-07-28

常同性の解釈

常同性は強化学習の枠組みではどのように解釈できるか？強化学習における予測誤差は、学習に反映されて期待値（状態や行動の価値）を上げてしまうので、ドーパミン放出を永続することはできない。それでも学習率が低ければ、予測誤差の総和が大きくなるかも…

2013-07-27

メタな言説にいら立つ理由

メタというか、より一般的な物の見方に対して。「より一般的である」ということは、自分が必須条件と思っているものを、不要なものとして切り捨てているということでもある。

2013-07-27

ミスと動揺

ミスによって失われたものが、自分の時間や労力だけなら、その多寡にもよるが、それほど気にすることはないはずである。しかし、「自分は最小の労力で作業をこなしている」という自負があったりすると、上記のような小さいミスでも大きな痛手になる場合があ…

2013-07-27

条件の発生による思考の限定

何かしら目標を設定すると、その達成に必要な条件が想起される。これによって、思考がその条件を満たす範囲に限定される。「思考の範囲を狭める」ことは、「充足する条件を増やす」ことでもある。「思考の範囲を狭める」と言うと、刺激の量を減らす印象があ…

2013-07-27

世界を狭めるのに必要なもの

基本的に能動的な努力がなければ、世界というか視野は狭まっていくのだろうけど。ただ短期的には何らかの刺激は必要になる。例えば、人間関係は広い方が豊かな生活が送れそうだが、敢えて狭めることで満足感を高める人間もいる。そういう人間は、「人間関係…

2013-07-27

少しでも瑕疵があると興味を失う理由は

現実的には「瑕疵がない」ものは、まず見つからないだろうけど。相対的に「瑕疵があると興味を失いやすい」人間の特徴とはなにか？性格的なものもあるかもしれないが、すぐに別の興味の対象を見つけられることが大きいのではないか？それはある程度経済力に…

2013-07-26

限定された範囲を網羅する満足感

「範囲の限定」自体に、不確実な要素、不利な要素を除く効果があるのだが。「網羅」することで大きな満足感が生じるのはなぜか？ちなみに「網羅」した後にやることは、その中で最も条件のいいものを「選択する」という行動の場合が多い。その選択より下のも…

2013-07-25

優越感の齟齬

例えば、ごく限られた集団（「状況」でもいい）でのアドバンテージを築こうとする人間を、その集団（状況）にさほど関心のない人間が嘲笑する場合がある。もちろん、その集団（状況）があまりにも早く消滅してしまうのなら、その努力は無為に終わるだろうが…

2013-07-24

報酬と不安感とか、恩義と報恩とか

恵まれた状況にあるほど不安感は大きくなるし、恩義を受けるほど恩に報いねばという心理が強迫的になる。

2013-07-23

借りとか後ろめたさとか

返済が義務であり、かつ返済が遅れるほど状況が不利になる場合（利息が大きくなるとか）なら、借りを作ることを躊躇するのは当然である。また、借りを返すことをはっきりと求められなくても、利己的な人間に借りを作ると後々面倒になりそうなので、それを避…

2013-07-18

アトミズムの問題点

「弱肉強食」が好きならそれも悪くないだろうけど。ある程度リスクの小さい社会を志向した場合には、再配分の仕組みが必要になるわけだけど、再配分の方法としても「国が税金を取って国が面倒をみる」という方法はモチベーションの観点で好ましくない。税金…

2013-07-14

一般化と飽き

2013-07-14

先見性とか刺激の永続性とか

例えば、テレビゲームが好きな人がいるとする。仮に、20代まではそれにハマっていたが、30代以降はあまり楽しめなくなったとする。30代以降楽しめなくなった理由は何だろうか？「仕事に関係ないから」という場合もあるだろうが、仕事があっても趣味として続…

2013-07-10

一般化と予測

物事を一般的に解釈しているほど、予測は容易になる。「一般的な解釈」というと抽象的だが、解釈する対象から重要な要素のみを抽出し、その要素の有無で判断するような感じだろうか。少数の要素の有無で事象を評価するのであれば、未来に起きる出来事もその…

2013-07-06

過去の失敗と予測への反映

単純な強化の枠組みだと、行動を起こしても報酬が得られなければ、行動の価値は下がり、最終的には「消去」される。しかし現実には、完全に同一の状況や完全に同一の行動というのは存在せず、過去の失敗も状況と行動の類似性に応じて、いくらか弱められた状…

2013-07-06

永続性の認識について

永続する保証のある好ましい刺激は、獲得に積極的になるし、永続する保証がなければ獲得に消極的になる。

2013-07-06

選択肢の増加と減少

外部の状況が変化して選択肢が増減することもあるし、自身の探索によって増えることもある。それ以外に増減するパターンとしては、実際に失敗して、あるいは思考実験によって無理だと判断して減るケースと、思考というか思いつきによって増えるケースがある。…

2013-07-06

無知とモチベーション

「経験が乏しいためにモチベーションが維持できる」ということは起こりうる。例えば、前回述べた「規範の順守」は、成果を上げる術を知らないから可能になる場合がある。これはなぜか？前提条件として、成果を上げる術は知らないが、成果を上げる必要性は感…

2013-07-06

規範の順守の一側面

規範を守るかどうかにはいくつかの要素があるだろうが、最終的に成果を出す術を知らないために規範に忠実になる、という場合もあるだろう。

2013-07-05

可能性の想起と不安感

対応しなければならないことが明確になった段階で、その作業の多さに辟易するのは分かりやすいが、起こってもいない事態を想起して怯えるのはなぜか？

2013-07-04

予測誤差が価値を持つ理由

Houkの説によると、ドーパミンの放出が予測誤差に依存するのは、過去に報酬をもたらした先行刺激が（過去の経験から結合が強まっている）線条体を賦活し、それによってドーパミンニューロンが抑制されるからである。

2013-07-04

順位とか定量化とか要素の抽出とか

良いものも悪いものも個別に評価すればいいように思うが、人間はとかく順位をつけたがるし、評価の要素を抽出し、かつそれぞれの要素を定量化したがる。これはなぜか？

2013-07-04

要素の強化と予測と強迫観念

ある行動を構成する要素が強化されたとすると、結果的にその要素を共有する別の行動も強化されるわけだが、別の行動を駆り立てるためには、その行動が既知であるか、容易に予測可能であることが必要である。

2013-07-03

強化の対象の限定

幼児期には報酬を得た行動と関係が薄い行動（概念）まで強化されやすい印象があるが、成長に伴って強化される行動が、報酬獲得と関連の強いものに限定されていくように思う。

2013-07-02

手に入らないものが視界に入るとストレスを生じる理由

視界に入るパターンとしては、１．周囲の他者がそれを見せびらかす２．自分が得た情報にそれが含まれるで、１は他者との関係が不可避であればそれも避けることは困難である。では２を避けることは容易なのだろうか？何も情報を欲しないのであれば、都合の悪…

2013-07-02

比較と希望と絶望

人間が何かを手に入れられるかどうかは、他者の行動や自分の過去の行動と比較することで見積もる場合が多い。仮に他者が、自分にも実行可能な方法でそれを手に入れていれば、それは希望に繋がるが、それを手に入れた方法が自分に実行不可能であれば、絶望に…

2013-07-01

過去の不合理な行動を後悔する理由

どうしても欲しいものがあったが、それを手に入れられずに後悔する、というのは分かる。そういうわけでもないのに、ささいな不合理性（例えば90円で買えるものを100円で買ってしまった）を後悔するのはなぜだろうか？自分の過去の行動と最適な行動の「比較…

2013-07-01

要素の抽出と網羅

「あるカテゴリに属するものを全て手に入れなければ…」という強迫観念が、カテゴリ内の一つ（あるいはいくつか）のものによってカテゴリに共通の要素が強化された結果生じるものだとしたら、強化を生じた単一物（あるいは複数）からの「要素の抽出」はどのよ…

jotunの頭の中

2013-07-01から1ヶ月間の記事一覧

報酬感は予測誤差だけで決まるか？

常同性の解釈

メタな言説にいら立つ理由

ミスと動揺

条件の発生による思考の限定

世界を狭めるのに必要なもの

関連付けと比較と思考の誘導

少しでも瑕疵があると興味を失う理由は

限定された範囲を網羅する満足感

優越感の齟齬

報酬と不安感とか、恩義と報恩とか

借りとか後ろめたさとか

アトミズムの問題点

一般化と飽き

先見性とか刺激の永続性とか

一般化と予測

過去の失敗と予測への反映

永続性の認識について

選択肢の増加と減少

無知とモチベーション

規範の順守の一側面

可能性の想起と不安感

予測誤差が価値を持つ理由

順位とか定量化とか要素の抽出とか

要素の強化と予測と強迫観念

強化の対象の限定

手に入らないものが視界に入るとストレスを生じる理由

比較と希望と絶望

過去の不合理な行動を後悔する理由

要素の抽出と網羅