这段时间在学习P2P系统中激励机制的实现,看到了博弈论中著名的囚徒困境问题(prisoners' delimma),十分有意思,特摘录至此。
“囚徒困境”最早是由美国普林斯顿大学数学家曾克1950年提出来的。他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最著名的案例。故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。在这里,博弈者就是两个嫌疑犯,他们每个人都有两个选择,即坦白和不坦白。
最终结果是A和B均选择了坦白。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判10年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白不被判刑而抵赖却要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来也一样,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各被判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合叫做纳什均衡。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
P2P系统引入激励机制(incentive mechanism)是为了防止公用品悲剧(tragedy of the commons)的发生。 tragedy of the commons 这个经济学概念是 Garrett Hardin 于 1968年提出来的,他在文章中写到:
Therein is the tragedy. Each man is locked into a system that compels him to increase his herd without limit - in a world that is limited. Ruin is the destination toward which all men rush, each pursuing his own best interest in a society that believes in the freedom of the commons. Freedom in a commons brings ruin to all.
意思就是说如果一个系统允许成员只关注自身利益,而无节制地滥用有限的公共资源,最终会导致公共资源的耗尽。这种现象在P2P网络中经常出现,如在文件共享网络中,BitTorrent,eMule等,我们就必须避免用户只下载而不上传数据(free riding),最终导致系统效率低下。
分享到:
相关推荐
根据纳什非合作博弈理论,博弈各方从个体理性出发,以最大最小化的原则采取策略,往往会陷入囚徒困境。但实际出现的囚徒困境要比理论所表明的要少的多,这说明现实生活中互动的人们之间存在着较强的协调性。为此,...
博弈论与囚徒困境-展示PPT.ppt
博弈论—囚徒困境专题PPT学习教案.pptx
博弈论与囚徒困境展示PPT教案学习.pptx
博弈论囚徒困境.pdf
博弈论囚徒困境的四种形式.pdf
介绍博弈论的相关经典案例:囚徒困境,金发女郎,从博弈论角度看当今世界存在的问题
第0章 博弈论基础 第1讲囚徒困境 第3讲重复剔除优势(DRAGON-THINK_2012-09-21 08-13-34) 第4讲Nash均衡 第5讲连续策略 第6讲混合策略(冲突_Dragon-PC_2013-03-03 09-59-43) 第7讲 动态博弈 第8讲 重复博弈 第9讲 ...
二、 完全信息动态 “ 囚徒 困境 ”博 三 、不 完全信 息静态 “ 囚徒 困境 ” 博 四、不完全信 息动 态“ 囚徒 困境 ”博
博弈论经典案例“囚徒困境”及其实证分析 .pdf
复杂网络囚徒困境博弈matlab源程序,采用方形格子规则网络或无标度网络。
博弈论视角下政府APP便民服务的研究——基于囚徒困境博弈模型 (1).pdf
模仿现实中人们的决策方式,提出类“触发策略”的策略思想,将原问题由双策略的多阶段博弈转换为多策略的一次性博弈,并建立起扩展的支付矩阵;然后运用进化博弈理论,将随机扰动引入复制子动态,从理论上说明有限次...
盘点博弈论&纳什均衡&囚徒困境&零和博弈&智猪博弈.pdf
复杂网络上非完美信息的自学习囚徒困境博弈,李卓政,楚天广,本文讨论了复杂网络上非完美信息的囚徒困境博弈。假设参与者不了解对手策略信息,以及他们通过学习自己的历史来做出决策。我们提
本文研究"囚徒困境"中促进合作演化的机制,设计"合作识别"和"背叛识别"两种控制形式,并分析合作在相应控制之下的演化路径问题.在合作识别控制设计中,通过将博弈群体...
博弈论 关于游戏理论的多人游戏。 该游戏基于提供的骨架代码。 无论如何,通过让主机在其计算机上托管游戏来运行游戏。 然后,客户可以加入游戏并通过扮演囚徒的困境来学习游戏理论。
囚徒困境在这个经典的博弈论困境中,程序与程序之战。 播放器类必须有一个公共 play() 方法来使用,该方法返回一个布尔值。 示例在 Angel.class 中。 除此之外,可以使用任何私有函数。规则两位玩家都以随机金额开始...
为了研究博弈理论在复杂网络上的影响,对Zachary网络应用重复囚徒困境博弈的思想提出了两种网络演化算法,即随机算法和伪度优先算法,并对重复博弈后的复杂网络特性进行了分析,其中包括度分布特性和聚集系数。...