谈“囚徒困境博弈”与商业信用(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇谈“囚徒困境博弈”与商业信用范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

内容摘要：一次性博弈背叛是最为理智的。但在多次重复博弈中，合作则成为博弈双方的最佳选择。

关键词：囚徒困境博弈一报还一报谈判

“囚徒困境博弈”

有两个人因抢劫银行而被分别关押在单人牢房里，一个聪明的检查官向他们分别做出了如下提议：你可以选择坦白或保持沉默。如果你坦白而你的同伙保持沉默，我就撤消对你的所有指控，而你的同伙将坐10年牢;如果你的同伙坦白了而你保持沉默，他就获得自由而你将坐10年牢。你们两人都坦白的结果是都判刑8年，但能早日获得假释。两个人都保持沉默的结果是各判刑1年。

在这个博弈中，每个博弈方在选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对自己利益的影响，因此他会根据对方两种可能的选择分别考虑自己的最佳策略：坦白或沉默。于是，每个囚犯从自身利益最大化出发，就会“聪明”地发现：无论对方选择坦白还是沉默，自己选择坦白总是最有利的。因此，在单局博弈（One-short game）中，如果只从个人理性出发，最基本的道德现象――合作就无从发生。

合作的进化

上述“囚徒困境博弈”研究的是单局博弈，也就是“一锤子买卖”。如果是多轮博弈，人们就有了合作的可能性，“囚徒困境”就有可能破解。

美国密执根大学的Robert Axelrod为了研究有关合作的问题，在1979年组织了一场特殊的计算机比赛。这场比赛的设计非常简单：要求每个参赛的博奕论专家根据“囚徒困境博弈”规则，各自设计一种计算机程序，然后用单循环赛的方式将参赛程序两两博弈，以找出得分最高的策略。Axelrod在比赛开始之前，先设定了两个前提：每个人都是自私的；没有权威干预个人决策。也就是说，个人可以完全按照自己最大化利益进行决策。他要研究的主要问题是：人为什么要合作？人什么时候合作，什么时候不合作？如何使别人与自己合作？第一轮博弈有14个程序参加，再加上Axelrod自己的一个随机程序（即以50%的概率选取合作或不合作），运转了300次。结果得分最高的是加拿大学者Anatol Rapoport编写的“一报还一报”（Tit for Tat）程序。这个程序的特点是，第一次对局采取合作的策略，以后每一次对局都采用和对手上一次相同的策略，即对手上一次合作，我这次就合作，对手上一次不合作，我这次就不合作。Axelrod发现，得分排在前面的程序有三个特点：“善良的”（be nice），即不首先背叛；“反击的”（be reactive），对于对方的背叛行为一定要报复，也搞一次背叛；“宽恕的”（forgive），不怀恨在心，只要对手以后改为合作，我们也要与之合作。

为了进一步验证上述结论，Axelrod决定邀请更多的人再进行一次比赛。第二次他征集到了62个程序，加上他自己的随机程序，一共是63个程序。比赛结果获冠军的仍是“一报还一报”程序。Axelrod总结这次比赛的结论是：“一报还一报”仍是最优策略；前面提到的三个特点仍然有效。除此之外，Axelrod认为占优的策略还必须具有的一个特点是“不过于‘聪明’”，也就是说要“简单”，以便对手能够理解，可以使对方很快就发现规律，从而与你采取合作的态度。

“囚徒困境博弈”对谈判活动的启示

许多人认为谈判是一种从对方那里获利的手段，因此在谈判桌上得到的好处越多就越好。其实不然，对每一位谈判者来说应当明确，一场成功圆满的谈判必须使双方的利益需求获得一定的满足，或者说双方各自目标预期在谈判桌上求得一定程度的平衡，随之而来的是彼此合作关系在此基础上得到进一步的改善和融洽。因此，一次成功的谈判活动，不是“零和博弈”，而是“双赢博弈”，参加谈判的每一方都应该是胜利者。

模拟谈判也证明了这一点。参照前面提到的“囚徒困境博弈”规则：如果我方和对方彼此都采取合作态度，双方都得5分；如我方合作而对方欺骗，则对方得10分，我方负10分；反之，则我方得 10分，对方负10分；如果谈判双方彼此都采取欺骗态度，双方都负5分；模拟谈判的双方在知晓结果前不能联络。那么我们在这类谈判中应采取什么态度？

假如仅有一轮谈判，最佳的选择显然是欺骗。对于我们来说，无论对方选择合作还是欺骗，我们都将处于有利地位，前一种情况下我们可以赢10分，而对手则要输掉10分。在后一种情况下（双方各负5分），至少我们不会比对方损失更多。与此类似，对方在这种情况下，欺骗也是他们的最佳选择。因此这类谈判的结果一般是双方各损失5分。这可以用来解释为什么日常生活中许多“一锤子买卖”的谈判双方都选择欺骗策略。

但是，如果改变条件――不只是一轮谈判，而是有更多轮次的过程，在此情况下，欺骗的决策便并非最佳了。完全有这样的可能性：双方彼此合作，结果是双赢。模拟谈判证明，在几轮重复之后，谈判双方常常会采用心照不宣的策略――每一方都选择合作。此外，开始和中期双方合作的决策占上风，越临近终轮采取欺骗的可能性就越大。但是，如果不限定停止的轮次，那么双方都会努力学会合作下去。这也说明：在日常生活中，谈判双方彼此的利益满足越具有连续性，合作与信用便越成为双方恪守的准则。

谈“囚徒困境博弈”与商业信用

优秀范文