商業與經濟中的囚徒困境

ETH储备银行 · 2026-02-11T10:17:17+00:00

囚徒困境是一個由 Merrill Flood 和 Melvin Dresher 在 1950 年於 Rand Corporation 概念化的悖論。後來由加拿大數學家 Albert William Tucker 正式化並命名。囚徒困境基本上提供了一個理解如何達成一個

ETH储备银行

2026-02-11 10:17:17

囚徒困境是一個由 Merrill Flood 和 Melvin Dresher 於 1950 年在蘭德公司提出的悖論概念。後來由加拿大數學家 Albert William Tucker 正式化並命名。

囚徒困境基本上提供了一個理解如何在合作與競爭之間取得平衡的框架，這些概念有時也能成為策略決策的有用工具。因此，它在商業、金融、經濟、政治科學甚至哲學、心理學、生物學和社會學等多個領域都有應用。

主要重點

囚徒困境描述了一個情境，根據博弈論，兩個自私行事的玩家最終都會做出對自己不利的次佳選擇。
囚徒困境也告訴我們，僅僅合作並不總是符合個人最佳利益。
在現實世界中，囚徒困境的經典例子是兩個競爭者在市場上的激烈較量。
在商業中，理解某些決策結構為囚徒困境，可以帶來更有利的結果。
這種設置允許在競爭與合作之間取得平衡，達到雙贏的局面。

Investopedia 解答

提問

VioletaStoimenova / Getty Images

理解囚徒困境

囚徒困境的情境如下：兩名嫌疑人在警察局被逮捕，分別在不同的房間，無法相互溝通。檢察官分別告訴他們以下內容：

如果你認罪並同意作證指控另一名嫌疑人，而他不認罪，你的指控將被撤銷，你將獲得自由，而另一名嫌疑人將服三年刑期。
如果你不認罪，但另一名嫌疑人認罪，你將被判刑三年，而他將獲得自由。
如果你們都認罪，你們都將被判兩年監禁。
如果你們都不認罪，你們都將被控以輕罪，判一年監禁。

嫌疑人應該怎麼做？這就是囚徒困境的核心。

囚徒困境的基本概念

要使囚徒困境悖論成立，必須具備一些基本概念，包括：

必須有兩個玩家。 這個情境涉及兩個個人或實體，他們共同牽涉在一個情境中，例如共同犯罪或面臨共同決策。
決策是在同一時間做出的。 兩個玩家在不知道對方選擇的情況下做出決定。這種同步決策是困境的關鍵，因為每一方都必須在不考慮對方決策的情況下做出選擇。
必須有多種結果組合。 獎勵矩陣是一個表格，列出雙方可能的選擇組合及其對應的獎勵或結果，幫助可視化不同決策的後果。稍後我們會詳細討論獎勵矩陣。
可以是互相合作或互相背叛。 玩家可以選擇合作（追求雙贏結果）或背叛（追求個人利益）。囚徒困境的張力來自個人利益與集體利益之間的衝突。
每個玩家都有一個優勢策略。 這是對自己來說最有利的策略，不論對方選擇什麼。這個優勢策略通常是理性的選擇，但當雙方都採用時，會導致次佳的結果。
假設玩家是理性決策者。 這意味著人們傾向於最大化自己的利益。這是博弈論和理性選擇模型的基本假設，驅動著選擇之間的衝突。

評估最佳行動方案

讓我們先建立一個獎勵矩陣，如下表所示。這裡的“獎勵”以監禁時間長短來衡量（用負號表示，數字越大越好）。“合作”和“背叛”分別指嫌疑人合作（例如都不認罪）或背叛（其中一人認罪，另一人不認罪）。格子（a）到（d）中的第一個數字是嫌疑人A的獎勵，第二個數字是嫌疑人B的獎勵。

囚徒困境 – 獎勵矩陣
嫌疑人B




合作
背叛
嫌疑人A
合作
(a) -1, -1
© -3, 0

背叛
(b) 0, -3
(d) -2, -2

每個玩家的優勢策略是能帶來最大利益的策略，不論對方採用什麼策略。這裡的優勢策略是背叛（即認罪），因為認罪能最小化監禁時間。可能的結果包括：

如果A和B都合作（都不認罪），都判一年（格子a）。
如果A認罪但B不認罪，A獲得自由，B判三年（格子b）。
如果A不認罪但B認罪，A判三年，B獲得自由（格子c）。
如果兩人都認罪，兩人都判兩年（格子d）。

因此，如果A認罪，他們可能獲得自由或兩年監禁；如果不認罪，則可能獲得一年或三年監禁。B面臨的情況與此相同。

囚徒困境的影響

囚徒困境巧妙地展示了：當每個人追求自己的利益時，結果往往比雙方合作更糟。在上述例子中，合作（雙方都保持沉默、不認罪）會讓兩個嫌疑人只判一年。其他結果則是兩年或三年的判刑。

理性的人若只追求最大利益，通常會選擇背叛而非合作。如果雙方都假設對方不會背叛，結果會是雙方都背叛（格子d），各判兩年，這比合作的結果更差。

在囚徒的例子中，與另一嫌疑人合作（不認罪）會得到不可避免的一年刑期，而認罪則可能在最好情況下獲得自由，最壞情況則是兩年監禁。然而，不認罪的最大風險是如果對方認罪，自己將面臨三年刑期（反之亦然）。

這種激勵背叛（不合作）但合作可能帶來最佳結果的矛盾，在商業和經濟中以多種方式展現。

快速事實

Albert Tucker 於 1950 年首次向史丹佛大學的研究生心理學學生展示囚徒困境，作為博弈論的範例。

商業應用

在現實中，囚徒困境的經典例子是兩個競爭者在市場上的激烈較量。許多產業中都存在兩大競爭對手。例如，在美國，可口可樂（KO）與百事可樂（PEP）在軟飲市場激烈競爭，家得寶（HD）與勞氏（LOW）在建材市場。這些競爭案例在商學院中被廣泛研究。其他激烈的競爭還包括星巴克（SBUX）與 Tim Horton’s（QSR）在加拿大，以及蘋果（AAPL）與三星在全球手機市場。

以可口可樂與百事可樂為例，假設前者考慮降低其標誌性汽水的價格。如果這樣做，百事可能別無選擇，只能跟進以維持市場份額。這可能導致雙方利潤大幅下降。

任何一方降價都可視為背叛，因為這打破了保持價格高企、最大化利潤的默契協議。因此，如果可口可樂降價但百事保持高價，前者就是背叛，後者則是合作（遵守默契）。在這種情況下，可口可樂可能藉由增加銷售量來獲得市場份額和額外利潤。

獎勵矩陣

假設可口可樂與百事的額外利潤如下：

兩者都保持高價，利潤各增加5億美元（由於需求正常增長）。
一方降價（背叛），另一方不降（合作），則前者利潤增加7.5億美元（因市場份額擴大），後者不變。
兩者都降價，飲料銷量增加抵消降價損失，利潤各增加2.5億美元。

獎勵矩陣（數字以百萬美元表示）如下：

可口可樂 vs. 百事可樂 – 獎勵矩陣
百事可樂




合作
背叛
可口可樂
合作
500, 500
0, 750

背叛
750, 0
250, 250

其他常見的囚徒困境例子包括新產品或技術開發，以及公司在廣告和市場推廣上的投入。

例如，兩家公司若約定不調整廣告預算，則其淨收入可能保持較高水平。但若一方背叛，增加廣告投入，則可能藉由更高銷售額獲得更大利潤，儘管增加的廣告費用會抵消部分收益。若雙方都增加廣告預算，則彼此的投入可能相互抵銷，導致效果不佳，反而降低利潤。

經濟應用

美國民主黨與共和黨之間的債務僵局，是囚徒困境的經典例子。

假設解決美國債務問題的效益是下一次選舉的選票支持。合作意味著雙方願意維持現狀，控制不斷擴大的預算赤字；背叛則是採取更保守的措施，縮減支出。

如果雙方合作，經濟能順利運行，選票支持會增加。但如果A黨試圖積極解決債務問題，而B黨不合作，B可能因此失去選票，轉而支持A。

反之，若雙方都不合作，採取激烈手段，可能引發經濟動盪（股市下跌、信用評級下調、政府關門），反而使雙方的選票支持都受損。

如何運用？

囚徒困境可以用來幫助個人在生活中的決策，例如買車、薪資談判等。

假設你打算買新車，走進經銷商。你的“獎勵”是滿意度（非數值），你希望以最優惠的價格、最滿意的配置買到車，而銷售員則希望賣出最高價以獲取最大佣金。

合作意味著不議價，照標價買車（銷售員滿意），你滿意度高；背叛則是議價，追求更低價格。用數值表示滿意度，10代表完全滿意，0代表完全不滿意，獎勵矩陣如下：

買家 vs. 銷售員 – 獎勵矩陣
銷售員




合作
背叛
買家
合作
(a) 7, 7
© 0, 10

背叛
(b) 10, 0
(d) 3, 3

這個矩陣告訴我們什麼？如果你強硬議價，成功獲得大幅降價，你會非常滿意（格子b），但銷售員可能不滿（失去佣金）。反之，如果銷售員堅持不讓步，你會不滿（格子c），而銷售員則滿意。

如果你直接接受標價（格子a），你的滿意度較低，銷售員也可能不太滿意，因為你可能讓他懷疑是否能賣出更貴的車或加裝配件來賺取更多佣金。雙方都選擇背叛（議價），則滿意度都較低（格子d），因為長時間議價可能導致雙方都妥協。

在薪資談判中，接受第一個報價看似簡單，但可能會損失一些薪資空間。議價爭取更高薪資，則可能拿到更豐厚的待遇，但如果雇主不願意調整，則可能不滿意最終結果。

理想情況是雙方都能合作，達到雙贏，但現實中常常陷入囚徒困境。

經濟中的囚徒困境範例

最後，我們來談談囚徒困境在經濟中的應用。一個宏觀經濟的例子是政府在經濟衰退時的財政政策。

當經濟衰退時，各國政府面臨是否採取擴張性財政政策來刺激經濟的抉擇。這些政策的效果取決於其他國家的行動。

假設所有國家都同時採取擴張性政策，全球經濟將受益於需求增加，可能促成復甦。但如果某個國家選擇保守策略，專注於緊縮或削減預算，短期內可能較穩定，但全球影響可能不利。

這就像囚徒困境：每個政府都必須決定是合作（共同推行擴張政策）還是背叛（採取保守措施）。如果所有國家都合作，全球經濟能更有效復甦；若某些國家背叛，追求最大個人利益，則整體復甦受阻，結果對所有國家都不理想。

囚徒困境的解答是？

沒有絕對正確的答案。它是一個悖論，展示了個人決策如何影響整體結果。

簡單來說，兩個囚徒面臨是否認罪或保持沉默的選擇，彼此無法溝通。認罪會讓一方獲得較輕判或自由，保持沉默則可能獲得較短刑期。雙方都認罪則中等，都保持沉默則較短。博弈論預測，通常人們會選擇對自己最有利的選項。

囚徒困境的最佳策略是？

囚徒困境並沒有一個絕對的“最佳策略”或“答案”。它主要展示了：兩個自利行事的實體，並不會產生雙方都最優的結果。

結論

囚徒困境告訴我們，追求個人利益並不總能帶來最佳整體結果。企業、政府和個人在行動時，應該考慮合作可能帶來的正面影響，以達到更理想的結果。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

讚賞
點讚
留言
轉發
分享

留言

0/400

暫無留言

熱門 Gate Fun
查看更多

1
bfcs
八方财神
市值:$0.1持有人數:1
0.00%
2
cwt
CWT
市值:$0.1持有人數:1
0.00%
3
maolu
maolu
市值:$2337.93持有人數:1
0.00%
4
红星
红星闪闪
市值:$2344.82持有人數:1
0.00%
5
DXMFC
丁香猫家族
市值:$2351.72持有人數:2
0.00%

商業與經濟中的囚徒困境

主要重點

理解囚徒困境

囚徒困境的基本概念

評估最佳行動方案

囚徒困境的影響

快速事實

商業應用

獎勵矩陣

經濟應用

如何運用？

經濟中的囚徒困境範例

囚徒困境的解答是？

囚徒困境的最佳策略是？

結論

熱門話題

當前行情抄底還是觀望？

幣圈生存指南

Gate春節賽馬紅包嘉年華

白宮穩定幣收益討論會議

沃什將謹慎推進聯準會縮表

熱門 Gate Fun

bfcs

八方财神

cwt

CWT

maolu

maolu

红星

红星闪闪

DXMFC

丁香猫家族

置頂