2012-07-01から1ヶ月間の記事一覧

問題点の発見と解決策の発見の間

ある問題を適切に解決できるようになるまでに、どのような思考プロセスを経るか?既存の手法で目的が達成できてる段階では、潜在的な問題に気付くことはなかなかない。「上手くいかなくなった」後に「要因と思しきもの」に注意を払うようになり、最終的に要…

目標達成までの「近さ」がストレスを生じる理由

競技の世界では、二位よりも三位の方が満足度は高いと言われる。(もちろん例外もあろう)また試験を受けて合格点に1点満たずに不合格となった場合は、合格点に100点満たない場合よりも悔しさが大きい。そういった心理は直感的に理解しやすいが、それが生じ…

ストレスと思考の限定の連鎖

非常の大きな報酬を期待し、それが得られなくなると、強いストレスを受けることになる。この状態を脱するためには、別の何かによって「慰める」必要がある。しかしその「慰め」によって新たな枷が生じる危険性についても考えなければならない。

ストレスとは

ストレスという言葉は様々なところで使われるが、神経科学的な実体は明らかではない。ある種のホルモン(コルチゾルなど)の分泌と相関があると言われるが、ホルモン分泌のみに影響する現象ではないだろう。 ドーパミン系の活動が通常より低下すると不快感を…

感受性とか生活の豊かさについて

ドーパミンの平均的な放出レベルが高ければ、どうでもいいことまで「手掛かり刺激」になりやすい。それは細かいことへの気づきを生む一方で、余計なストレスも生じやすい。 手掛かり刺激を認知しやすいということは「気づきを生みやすい」ということでもある…

完璧主義について・再々々考

完璧主義については何度か考察したけども。「不完全な部分が見つかる」とか「改善のアイディアが浮かぶ」というのは一種の「手掛かり刺激」なのではないか?手掛かり刺激を得てしまうと、それに対応する報酬を獲得するとか、価値の高い状態に遷移しない限り…

特殊性の希求

人間(少なくとも子供)は特別な存在でありたいと願うし、特別なものを欲しがる。他者から承認を得る手段とか、新規性の希求と解釈することもできるのだが、他の見方はないものか? 「特別でない」状態というのは、既存の概念で説明可能なものである。例えば…

年を取っても主体性が身に付かないと不安感を生じる理由

「主体性を身につける」は「自分の遺志で報酬を獲得する」と換言できると思う。しかしそれができないと不安感を生じるのはなぜか? 親から何もかも与えられる場合、親が最大の二次強化子であり。手掛かり刺激となる。子供の頃はそれでも問題なく生活できる。…

報酬とか罰の与え方

教育に報酬や罰が有効に機能する可能性あるだろう。ただやはり与え方に注意が必要である。 例えば悪いことをして叱った場合、やった直後に叱るか、何が悪かったのか明確にしてから叱らないと、負の報酬を割り当てる対照が不明確で、理不尽な印象のみを与える…

大雑把な解釈とかレッテルの必要性

人間が世の中の真実をそのまま理解できたらいいのだが、それは非常にコストが高い。例えば他者とコミュニケーション取る場合、一人ひとり相手に応じて適切な対応を決めるのがいいんだろうが、それは大変なので「○○国の人にはこう対応する」といった大雑把な…

好ましい価値観とは

例えばものすごい金持ちだとして、金で全ての人間が従うと思ってたとする。それは好ましい価値観ではないだろうが、実際に財力である程度親しい人間が確保できるなら、すぐに修正が必要というわけでもないだろう。その価値観が「悪」とされるのは、あくまで…

状態の価値と関係性と思考の範囲

報酬を予期させるような手掛かり刺激は、強化学習では高い状態の価値として表現される。強化学習の枠組みでは、ある状態から推移しうる状態のバリエーションはあらかじめ与えられているが、実際の人間の思考は必ずしもそうではないだろう。 明確な因果関係を…

価値を付与すべき対象

容易に得られる報酬があれば、無理やりそれと関連付けることで意味のない刺激に価値を付与することもできる。しかしこれを維持するには常に報酬を与え続けなければならないし、それができなければ「無意味な刺激」によってドーパミン系が賦活された後、負の…

固執と手掛かり刺激

「固執」をどうにか強化学習の枠組みで説明したのだが。行動の価値が非常に高ければその行動が選択されるのは当然の話である。ただ、報酬を伴わなければ次第にその行動の価値は低くなり、選択されなくなる。病的な「固執」は報酬が伴わなくなっても特定の行…

思考の転換とは

人間の判断の違いを生む要因はいろいろあるだろうが、ある目標を設定しそれが上手くいかない場合に、どれだけ粘るかというのは重要なポイントだと思う。必ずしも「粘れば粘るほどよい」というわけではない。また「諦める」だけなのか「すぐに別の目標を設定…

非常に面倒くさい作業が強いられることで、やや面倒くさい作業が捗る理由

単純に「比較の結果」かもしれない。一時的に「より面倒なもの」が想起されたことで、「やや面倒なもの」の評価が高まったという。しかし別の解釈も可能ではないか?

時間(労力)当たりの報酬という概念

時間割引にしろ費用対効果にしろ、人間の頭が厳密に定量的な評価をしているとは思えないがそれはさておき。A、B、Cの3つの条件を満たすことで報酬が得られるとする。A、B、Cの報酬への寄与度は同程度だが、心理的な負担はA>B>Cだとする。この時のどの仕事か…

強化学習的な教育の捉え方

子供の頃は「親の賞賛」自体が大きな報酬価値を持つ。もちろん「報酬価値」と言っても一次強化子ではなく、様々な一次強化子と関連付けられた二次強化子だろうが。(まぁ人の表情への関心は生得的なものだろうし、一次強化子である可能性もあるんだけど、少…

「遊びによる思考の転換」が上手くいかない理由

快刺激を得た際に一時的に思考の転換が容易になるが、その後はむしろ思考が固定化されてしまうので、その遊び自体を長く続けてしまうことが多い。

好奇心とか未知のものに対するスタンスとか

未知のものに対する興味や恐れはどのようにして生じるか?経験の乏しさだけでなく感受性の強さも必要になるだろうが、それだけで説明できるわけではない。

未知と既知の判断

例えば、都内のレストランに精通した人間がいたとする。その人間は「美味い店で自分が知らないところはない」と思っている。実際のところ、どれだけ多くの店で食べていようと、全ての店を回り尽くしたのでない限り、「知らない美味い店がある」可能性は残る…

報酬が与えられたのか与えられていないのか不明な状況での条件付け

例えば努力してプレゼンの練習をして、翌日上司の前でプレゼンをしたとする。んで、上司は「なるほど、そうか」という淡白な反応だったとする。満足してるのかもしれないし、不満があるのかもしれない。この時、前日のプレゼンの準備は強化されるのか、それ…

高次の強化子の成立とその問題

強化学習の枠組みでは、理論上無限次の強化子が存在しうる。例えば一次強化子が食べ物だったとして、条件付けによってブザーを二次強化子にすることはできるし、そのブザーと関連付けることでライトを三次強化子にすることもできる。ただその場合、下記のよ…

成功か失敗か分からない状況で自信を保つ術

例えば、以前のエントリで挙げた「上司が自分のプレゼンに対し曖昧な反応を示す」という場合。自分のプレゼンの技量を見極めることも重要だが、上司の評価は自分の進退にも関係してくるので、成功したのか失敗したのか見極めることは大きな意味を持つ。もち…

対立する条件付け

例えば「金を出して食べ物を買う」場合。「金」も「食べ物」も(おそらくは)中性的な刺激だが、「金」も「食べ物」も報酬と関連付けられているため、ドーパミン系を賦活する。ただ上記の例では、「食べ物」を買うと「金」は失われるので、どちらか一方しか…

報酬と枷

あるものによって報酬が得られると、そのものに対してドーパミン系が反応するようになる。十分に学習する(複数回繰り返す)とそれを見るだけでドーパミン系が賦活されるようになるが、それを見ただけで実際に報酬の獲得まで至らないと、逆にドーパミン系の…

複数の手掛かり刺激とそれに対するドーパミン細胞の反応性

手掛かり刺激が複数与えられてその後に報酬が与えられたとする。その関係が十分学習されたとして、手掛かり刺激のうち一つだけが提示されたらドーパミン細胞の反応性はどうなるか? いくつか可能性は考えられる。「全ての手掛かり刺激が揃った時のみ報酬が与…

手掛かり刺激とオペラント条件付け

Schultzによる手掛かり刺激へのドーパミン細胞の反応性の実験は、パブロフ条件付けの一種だと言っても差し障りないだろう。手掛かり刺激と報酬が関連付けられた結果起こるのは、「唾液を流す」という生理的・観測可能な事象ではなく、「ドーパミン細胞の発火…

類似性と意外性

比較と報酬予測誤差

報酬予測誤差は、先行する刺激によって生じる予測と、実際の報酬との差異なわけだが。「複数の事物の価値を比較する」という場合にも似たような機構が働いているのではないか? 例えば自分がカバンを持っていたとして(それを意識していたとして)、他人のカ…