結果が不確実なことについて、ヒトはどのように判断し、行動に移すのでしょうか。ギャンブルであれば、当たりの金額と当たりの確率をかけた期待値を計算し、その期待値が最も高いものに賭けることで、平均的に高い利得を得られます。このように合理的に自己利益を計算して判断することを前提に、伝統的な経済学はヒトの行動を説明してきました。
しかし、実際のヒトの行動は完全に合理的なわけではありません。1万円持っている状態で2万円を得るのも、100万円を持っている状態で2万円を得るのも、利得は同じ2万円ですが、1万円から増えた2万円の方が大きな価値があるように感じます。また、宝くじの1等の当選確率は極めて低いのに、当たるかもしれないと思ってつい買ってしまいがちです。このようなヒトの主観を普遍的に説明するのが、プロスペクト理論です。その一方で、ヒトの判断・行動を説明するもう一つの理論に強化学習理論があります。強化学習理論では、ヒトの主観は過去の報酬経験を踏まえて変わり、最も儲かる判断を選ぶように学習すると考えます。プロスペクト理論がヒトの主観は変わらないことを前提にするのとは大きく異なります。
本研究チームは、これら二つの理論を統合した「動的プロスペクト理論」を構築し、不確実な状況におけるヒトの判断・行動を一つの統一理論で説明する事に成功しました。 具体的には、参加者70人にくじ引きを繰り返し経験してもらい、その行動変化を解析しました。その結果、予測したよりもずっと大きな報酬が得られた直後に、くじの当選確率を、プロスペクト理論が予想する以上に高く評価してしまうことが分かりました。つまり、”大当たり”を経験した直後には、「もう一回当たりそうだ」と感じてしまうわけです。この予想外の出来事からの学習は強化学習理論の根幹を成すアルゴリズムです。二つの理論を統合した動的プロスペクト理論は、毎回の判断・行動を、大当たりの直後も含め、よく説明できます。
同じ霊長類に属し、ヒトに類似した脳を持つサルでも、基本的に同じ結果が観察されました。今回の研究成果に基づいてサルの脳を調べる事で、私たち一人一人が抱く多様な金銭感覚や確率の感じ方、成功した時の喜びなどが生み出される脳の仕組みの理解につながることが期待されます。
PDF資料
プレスリリース
研究代表者
筑波大学医学医療系
山田 洋 准教授
掲載論文
【題名】 Dynamic prospect theory: two core decision theories coexist in the gambling behavior of monkeys and humans
(動的プロスペクト理論:二つの核となる意思決定理論がヒトとサルのギャンブル行動に共存する) 【掲載誌】 Science Advances 【DOI】 10.1126/sciadv.ade7972