見出し画像

『人はどこまで合理的か 下』より 自分の利益は相手次第「ゲーム理論」とは

引き続き、『人はどこまで合理的か 下』より今回は、「ゲーム理論」についてですが、自分だけの利益を合理的に考える場合は問題ないのですが、自分の利益が他の誰かの利益にも関わっているとき、どのように選択したら合理的なのか、という場合に有効な考え方が「ゲーム理論」。

■「じゃんけん」というゼロサムゲーム

ゲーム理論の中でも、典型的なのがじゃんけん。どちらかが勝てばどちらかが負けるというゼロサムゲームで、ゲーム理論に基けば、どのようにグー・チョキ・パーを出したらよいかは、もうわかっている。それは「混合戦略」といって、どれもランダムに3分の1の確率になるように取り混ぜるのが最適な戦略。

相手から先読みされないよう、ランダムにグーチョキパーを出し、それが平均的に同じ確率になるよう出していく

じゃんけんの場合は、自分も相手も完全にイコールな立場なので、自分も相手も最適な戦略を出すという前提になるため、偏りのないランダムな出し方にしないと相手に先読みされて負けてしまうのです。

(実際にはグーチョキパーの出しやすさには差があるので、パー→チョキ→グーの順番で出すと一番勝利の確率が高い

■ゲーム理論といえば「囚人のジレンマ」

ゲーム理論で一番有名な事例が「囚人のジレンマ」。

すでに証拠が揃っている軽罪相当(禁錮6ヶ月)の犯罪とまだ証拠が揃っていない重罪相当(禁錮6年)の二つの犯罪を犯した二人の共犯者ブルータスとレフティが別々に勾留され、検察官が重罪相当の罪の証拠を自白させようと二人に司法取引を持ちかけます。

その結果が以下4パターン。この場合のゲーム理論では「協力(信頼)→黙秘」と「裏切り→自白」の2パターンで整理。勝ち負けしかないジャンケンと違ってお互いの選択結果の利益に差がある点がポイント。これによって「どの選択に利益があるか」が変わってくるから。

①報酬:二人とも黙秘した場合(双方が協力)
→ 二人とも軽罪でしか起訴されないので禁錮6ヶ月

②誘惑:自分が先に検察官に協力して相手の罪を証言した場合(自分が裏切り)
→ 自白した方のみが司法取引に成功して釈放

③罰 :二人とも検察官に協力して相手の罪を証言した場合(双方が裏切り)

→  二人とも自白して証拠が揃ったので禁錮6年で二人とも起訴

④裏切られ損:相手が先に検察官に協力して自分の罪を証言した場合(相手が裏切り)
→ 先に自白しなかった罰4年相当が追加されて、6年+4年で合計禁錮10年

本書 第8章 協力や敵対をゲーム理論で考える

期間だけみれば二人の期間の合計が一番少ない①報酬(双方が協力)が最適戦略。

しかし相手あってのゲーム理論なので、相手の選択がどれであっても自分が有利になる選択を選ぶのがよい(「最適反応」という)。そうすると、相手が自白しようが黙秘しようが、マシな選択である「相手の罪を証言」を選ぶ。相手が証言しなければ「釈放」になるし、相手が証言したとしても「禁錮6年」で済むからです。

そしてお互いが最適反応すると結果的に利益が「6年・6年」の組み合わせになる「③双方が裏切り」という結果になってしまいます(これを「ナッシュ均衡」という)。

このように本当だったらお互いが協力する(自白しない)のが一番お互いにとって得なのに、結論はお互いが自白して双方とも禁錮6年が結論になってしまう。なので「ジレンマ」と呼ばれているのです。

ちなみにゲーム理論を理解するには、残念ながら本書よりも以下、たくみのYouTubeの方が断然わかりやすかった(こんな専門的なのに、なんと75万回再生実績)。おすすめします。

ほんと、YouTuber優秀です。

■(人間含む)社会的動物は「しっぺ返し戦略」で共同体を維持

これは面白い。「しっぺ返し戦略」は、猿でも人間でも社会的動物が本能的に身につけているゲーム理論の応用編で、「協力」と「裏切り」の適切な使い分け=「しっぺ返し戦略」によって社会を維持。

まずは、

初対面の時は「協力」を選択
基本的に人間は信用できる人の方が圧倒的に多いので当然ですね。まずは「協力」から入り、人間関係が生まれて付き合い出したら、

②ひたすら「協力」を積み重ねていく
ことで信頼関係を育みます。

③しかし、相手が裏切ってきた場合は、こちらも裏切る。
相手の裏切りには裏切りで応じ(相手がよっぽど機嫌が悪い場合もあるので、1回ぐらいは見逃す方が良い)、

そこで人間関係は終わる、というのが「しっぺ返し戦略」。

ピンカー曰く

わたしたちは共感によって協力するようになり、怒りによって裏切りには裏切りで応じるようになり、罰せられる前に罪悪感によって自分の裏切りを償うようになり、相手の裏切りを寛容によって一度は見逃すように(一度だけの裏切りから果てしない相互離反に発展するのを阻止するように)なったという考え方である。

同上

そしてこの「しっぺ返し戦略」に最初に気づいたのは、哲学者デイヴィッド・ヒュームだといいます。

■社会契約の根拠「共有地の悲劇」

「囚人のジレンマ」は、二人だけのジレンマでしたが、これが集団になると「共有地の悲劇」というジレンマになります。そしてこのジレンマが、国家や大企業レベルの大規模な(つまり人間という生き物だけにみられる)共同体を維持する根拠となっているのがとても興味深い。

新型コロナを事例にするとわかりやすい(この事例は周りを気にする東アジア人のみに当てはまる事例です)。

「マスク着用」は「しっぺ返し戦略」だし、「ワクチン接種」は「共有地の悲劇」。

みんながワクチン打ってマスクしてくれれば、パンデミックは収束に向かう可能性が高くなりますが、「ワクチン打って副反応に我慢するのは面倒だし、マスクも面倒だから、自分だけはワクチン打たずにマスクもやめちまおう」という人(裏切り)が出てきます。

①マスクの場合は「面倒だな」と思っても人目があるので「周りがマスクするするなら自分もしよう」ということで協力し、「しっぺ返し戦略」によって守られます→協力が協力を生む関係

②しかしワクチンの方は、ワクチン接種しても接種しなくても、周りの人にはわからないので、自分ぐらいは「裏切って」もいいだろう、となり、この結果みんなが「裏切る=ワクチン接種しない」とパンデミックは収まりにくい、という悲劇が起きる、というのが「共有地の悲劇」。

周りから気づかれてしまうマスク着用の事例や、周りがみんな知り合いのような閉じられた小集団(家族など)であれば、ワクチン接種の場合でも、接種したかどうかがバレてしまうので「しっぺ返し戦略」で共同体は維持できます(だから社会的動物は皆「しっぺ返し戦略」)。

しかし、ワクチン接種のように、周りから判断できない場合や、集団がそこそこ大規模で知らない人が一杯いるような集団(=人間という生き物にしか存在しない集団)では、自分だけが燃費の悪いガソリン車を使っても誰にもバレないように、しっぺ返し戦略では共同体は維持できません。

このような匿名性が生まれる一定規模以上の共同体の場合、「共有地の悲劇」にならないよう、拘束力のある規則で縛るしかありません。もちろん「ワクチン接種」のように規則で縛るのが難しい場合もあります。この場合は「接種を無料にする」「接種すると自分の利益になる」「接種しやすい環境を作る(近所に接種会場があるなど)」などの別の要件が必要になります。

つまり「共有地の悲劇」は、共同体の社会契約にも通じる概念。誰もがその共同体の一員であるならば、その権利と義務は公平でなければなりません。それが社会契約の原則。

ルールを作って、みんなが「協力」しあう社会になれば、結果的にみんなの利益

になります。それが「共有地の悲劇」から導かれた最適戦略=社会契約説です。

17世紀の哲学者トマス・ホッブズ曰く

社会の原理とは「人は、他の人々もそうするのであれば(中略)、すべてのものに対するこの権利を自ら放棄するべきであり、自分が他の人々に対して有する自由は、他の人々が自分に対して有することを許容できる範囲のもので満足すべきである」(第二自然法)

同上

このように、ゲーム理論は、他人と関わる場合の損得勘定に有効な合理的思考。ゲーム理論の表を作って検討すると「最適解が出る」場合もありますし、ジャンケンのように最適解が出ない場合は「混合戦略」でランダムに平均的に選択していく、ということになります。

さらに人間関係は「しっぺ返し戦略」で望めば「知り合いは良い人ばかり」になりますし、国家などの大規模な人間社会は「共有地の悲劇」にならないよう「法の支配」を浸透させればよい。

ゲーム理論は、このようにあらゆる機会に使える合理的思考。ゲーム理論を発明した数学者フォン・ノイマンと経済学者モルゲンシュテルンは、まさに天才ですね(実際ノイマンは知能の高さが並外れていたので「火星人」と呼ばれていた)。

この記事が気に入ったらサポートをしてみませんか?