首页 > 范文大全 > 正文

谈“囚徒困境博弈”与商业信用

开篇:润墨网以专业的文秘视角,为您筛选了一篇谈“囚徒困境博弈”与商业信用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

内容摘要:一次性博弈背叛是最为理智的。但在多次重复博弈中,合作则成为博弈双方的最佳选择。

关键词:囚徒困境博弈 一报还一报 谈判

“囚徒困境博弈”

有两个人因抢劫银行而被分别关押在单人牢房里,一个聪明的检查官向他们分别做出了如下提议:你可以选择坦白或保持沉默。如果你坦白而你的同伙保持沉默,我就撤消对你的所有指控,而你的同伙将坐10年牢;如果你的同伙坦白了而你保持沉默,他就获得自由而你将坐10年牢。你们两人都坦白的结果是都判刑8年,但能早日获得假释。两个人都保持沉默的结果是各判刑1年。

在这个博弈中,每个博弈方在选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对自己利益的影响,因此他会根据对方两种可能的选择分别考虑自己的最佳策略:坦白或沉默。于是,每个囚犯从自身利益最大化出发,就会“聪明”地发现:无论对方选择坦白还是沉默,自己选择坦白总是最有利的。因此,在单局博弈(One-short game)中,如果只从个人理性出发,最基本的道德现象――合作就无从发生。

合作的进化

上述“囚徒困境博弈”研究的是单局博弈,也就是“一锤子买卖”。如果是多轮博弈,人们就有了合作的可能性,“囚徒困境”就有可能破解。

美国密执根大学的Robert Axelrod为了研究有关合作的问题,在1979年组织了一场特殊的计算机比赛。这场比赛的设计非常简单:要求每个参赛的博奕论专家根据“囚徒困境博弈”规则,各自设计一种计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出得分最高的策略。Axelrod在比赛开始之前,先设定了两个前提:每个人都是自私的;没有权威干预个人决策。也就是说,个人可以完全按照自己最大化利益进行决策。他要研究的主要问题是:人为什么要合作?人什么时候合作,什么时候不合作?如何使别人与自己合作?第一轮博弈有14个程序参加,再加上Axelrod自己的一个随机程序(即以50%的概率选取合作或不合作),运转了300次。结果得分最高的是加拿大学者Anatol Rapoport编写的“一报还一报”(Tit for Tat)程序。这个程序的特点是,第一次对局采取合作的策略,以后每一次对局都采用和对手上一次相同的策略,即对手上一次合作,我这次就合作,对手上一次不合作,我这次就不合作。Axelrod发现,得分排在前面的程序有三个特点:“善良的”(be nice),即不首先背叛;“反击的”(be reactive),对于对方的背叛行为一定要报复,也搞一次背叛;“宽恕的”(forgive),不怀恨在心,只要对手以后改为合作,我们也要与之合作。

为了进一步验证上述结论,Axelrod决定邀请更多的人再进行一次比赛。第二次他征集到了62个程序,加上他自己的随机程序,一共是63个程序。比赛结果获冠军的仍是“一报还一报”程序。Axelrod总结这次比赛的结论是:“一报还一报”仍是最优策略;前面提到的三个特点仍然有效。除此之外,Axelrod认为占优的策略还必须具有的一个特点是“不过于‘聪明’”,也就是说要“简单”,以便对手能够理解,可以使对方很快就发现规律,从而与你采取合作的态度。

“囚徒困境博弈”对谈判活动的启示

许多人认为谈判是一种从对方那里获利的手段,因此在谈判桌上得到的好处越多就越好。其实不然,对每一位谈判者来说应当明确,一场成功圆满的谈判必须使双方的利益需求获得一定的满足,或者说双方各自目标预期在谈判桌上求得一定程度的平衡,随之而来的是彼此合作关系在此基础上得到进一步的改善和融洽。因此,一次成功的谈判活动,不是“零和博弈”,而是“双赢博弈”,参加谈判的每一方都应该是胜利者。

模拟谈判也证明了这一点。参照前面提到的“囚徒困境博弈”规则:如果我方和对方彼此都采取合作态度,双方都得5分;如我方合作而对方欺骗,则对方得10分,我方负10分;反之,则我方得 10分,对方负10分;如果谈判双方彼此都采取欺骗态度,双方都负5分;模拟谈判的双方在知晓结果前不能联络。那么我们在这类谈判中应采取什么态度?

假如仅有一轮谈判,最佳的选择显然是欺骗。对于我们来说,无论对方选择合作还是欺骗,我们都将处于有利地位,前一种情况下我们可以赢10分,而对手则要输掉10分。在后一种情况下(双方各负5分),至少我们不会比对方损失更多。与此类似,对方在这种情况下,欺骗也是他们的最佳选择。因此这类谈判的结果一般是双方各损失5分。这可以用来解释为什么日常生活中许多“一锤子买卖”的谈判双方都选择欺骗策略。

但是,如果改变条件――不只是一轮谈判,而是有更多轮次的过程,在此情况下,欺骗的决策便并非最佳了。完全有这样的可能性:双方彼此合作,结果是双赢。模拟谈判证明,在几轮重复之后,谈判双方常常会采用心照不宣的策略――每一方都选择合作。此外,开始和中期双方合作的决策占上风,越临近终轮采取欺骗的可能性就越大。但是,如果不限定停止的轮次,那么双方都会努力学会合作下去。这也说明:在日常生活中,谈判双方彼此的利益满足越具有连续性,合作与信用便越成为双方恪守的准则。