
執筆者
K.S.
利害が絡む意思決定

ゲーム理論とは、複数の意思決定主体(人・企業・国家・AIなど)が互いに影響を与え合う状況で、「どのような行動が合理的か」を分析する理論です。
ここでいう「ゲーム」とは娯楽ではなく、利害が絡む意思決定の場面を指します。
各主体(プレイヤー)は、
・取りうる行動(戦略)
・行動の結果として得られる利得(報酬・損失)
を考慮しながら行動します。
重要なのは、「自分だけでなく、相手がどう動くかを予想して決める」という点です。
ゲーム理論は経済学を中心に、政治学、社会学、生物学、AI研究など幅広い分野で使われています。
最も身近な例
私たちの生活の中で誰もが経験したことのある最も身近なゲーム理論の例が『じゃんけん』です。
・プレイヤー:2人
・戦略:グー・チョキ・パー
・利得:勝てば+1、負ければ-1、あいこは0
じゃんけんでは、特定の手を出し続けると不利になります。そのため合理的な戦略は「完全にランダムに出す」ことです。
この状態では、どちらのプレイヤーも戦略を変えても期待値が改善しないため、安定した状態になります。これは後述する「ナッシュ均衡」の一例です。
ジレンマ・均衡・最適

囚人のジレンマ
ゲーム理論で最も有名な例が囚人のジレンマです。
2人の容疑者が別々に取り調べを受け、以下の選択を迫られます。
◆設定
2人の容疑者が別々に取り調べを受け、以下の選択を迫られます。
・黙秘する(協力)
・裏切って自白する(裏切り)
⇒貼付の画像のパターンになります。
★結果
合理的に考えると、
・相手が黙秘 → 自白した方が得
・相手が自白 → 自白した方が損が少ない
よって、
両者とも自白するのが合理的選択になります。
しかし、これは両者にとって最善ではありません。
両者が黙秘すれば、もっと良い結果になるからです。
このように、
・個人合理性 → 裏切り
・集団合理性 → 協力
が食い違う状況を「囚人のジレンマ」と呼びます。
ナッシュ均衡とは何か
ナッシュ均衡とは、「誰も一方的に戦略を変えても得をしない状態」のことです。
囚人のジレンマでは、(自白, 自白)がナッシュ均衡です。
どちらか一人が黙秘に変えても、状況は悪化するため、戦略を変える動機がありません。
重要なのは、ナッシュ均衡=最善の結果とは限らない点です。
合理的な選択の結果が、必ずしも望ましい社会結果を生むとは限りません。
パレート最適とは何か
パレート最適とは、「誰かの状況を改善しようとすると、必ず誰かが悪化する状態」を指します。
囚人のジレンマでは、
・(黙秘, 黙秘)は(自白, 自白)よりも両者にとって良い結果であり、パレート改善です。
・(黙秘, 黙秘)はパレート最適
・(自白, 自白)はナッシュ均衡だが、パレート最適ではない
この違いは非常に重要で、
・ナッシュ均衡:安定性の概念
・パレート最適:効率性の概念
と整理できます。
人数と回数の増加

人数が増えた場合(n人ゲーム)
プレイヤーが増えると、問題はさらに複雑になります。
フリーライダー問題
公共財(例:道路、治安、環境保護)では、自分は負担せず、他人が負担した恩恵を受けるという行動が合理的になりがちです。
・個人の合理的行動
自分は負担せず、他人が負担した恩恵を受ける(フリーライド)
・人数増加の影響
「自分一人が協力しなくても影響は小さい」と考えやすくなり、協力が崩壊します
・本質
囚人のジレンマが多人数に拡張された形。集団が大きくなるほど協力維持が困難になります
回数が増えた場合(繰り返しゲーム)
同じゲームを一度きりではなく、何度も繰り返す場合、結論は変わります。
繰り返し囚人のジレンマ
将来も相手と関係が続くとき、
・今裏切ると、次回以降に報復される
・協力を続けた方が長期的に得
となる場合があります。
有名な戦略にしっぺ返し戦略(Tit for Tat)があります。
・最初は協力
・次からは相手の前回の行動を真似る
この単純な戦略は、協力を維持しやすいことが知られています。
◆意味
・一回限り → 裏切りが合理的
・繰り返し → 協力が合理的になり得る
これは、
現実社会で「信用」「評判」「長期関係」が重要視される理由を説明します。
ゲーム理論の意義
ゲーム理論は、
・なぜ非効率が生まれるのか
合理的な人が非効率な結果を生む仕組みを解明します
・協力の条件
どのような条件で協力が成立するのかを分析します
・制度設計
制度やルールをどう設計すべきかを考える枠組みを提供します
経済、政治、国際関係、企業戦略、AIの意思決定設計に至るまで、現代社会の「対立と協力」を読み解く共通言語といえるでしょう。













