从博弈论中运用激励(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇从博弈论中运用激励范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

一个组织要在激烈的市场竞争环境中立于不败之地，就应充分调动员工的积极性和创造性，促进组织活力，提高组织的效率与效益。而管理人员调动员工积极性和创造性的一个强有力的手段就是激励。激励，是指人们朝向某一特定目标行动的倾向，它将影响员工们怎样适应一个组织，员工们在特定地点和岗位上怀有的特定动机，会影响生产率。本文试图以博弈论原理为基础，通过分析企业效益与员工、员工与员工之间的博弈关系来探讨企业激励制度对员工工作态度及企业整体效益的影响，以寻求激励的最佳策略。

一、理论基础

1.纳什均衡与非合作博弈。博弈论又称对策学（game theory），博弈论研究的是理性的人之间如何进行策略选择。其对人的基本假定是人是理性的，理性的人是指他在具体策略选择时的目的是使自己的利益最大化。纳什编制的博弈论经典故事“囚徒困境”，说明非合作博弈及其均衡解的成立，故称“纳什均衡”。博弈问题会遇到三个要素：当事人又称策略者（players），策略（strategies）回报又称赢得（payoffs）。在囚徒的故事中，两个囚徒是当事人，当事人所做的选择策略是承认了杀人事实，最后两个人均赢得了中间的宣判结果。囚徒困境的支付矩阵为：

2.艾克斯罗德实验。A和B各表示一个人，他们的选择是完全无差异的。选择C代表合作，选择D代表不合作。如果AB都选择C合作，则两人各得3分；如果一方选C，一方选D，则选C的得零分，选D的得5分；如果AB都选D，双方各得1分。显然，对群体来说最好的结果是双方都选C，各得3分，共得6分。如果一方选C，一方选D，总体得5分。如果两人都选D，总体得2分。显然，在有限且可预期次数的博弈中，选择D对于个人来说都是最优选择。而对于总体来说，却是最差选择。对策学界用这个矩阵来描述个体理性与群体理性的冲突：每个人在追求个体利益最大化时，就使群体利益受损，这就是囚徒困境。但是，当这一博弈关系处于无限次或未知次数的重复中时，情况就截然不同了，这就是艾克斯罗德试验。艾克斯罗德实验是社会化的纳什博弈论实验。当策略者处于群体环境，并且博弈的次数未知时，有选择的合作显然是个人利益最大化必要的选择。

所以，类似于中国古代所说的“一报还一报”式的策略在这种情况下成为了最优策略。而更令人鼓舞的是，它突破了“囚犯困境”的研究困境，证明了社会向合作进化的棘轮是不可逆转的，而群体的合作性将越来越大。

3.智猪博弈。猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。结论是小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩好。这个故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。但是对于社会或者企业而言，因为小猪未能参与竞争，社会资源的配置并不是最佳状态。为使资源最有效配置，规则的设计者就要完全杜绝这种“搭便车”现象，具体来说，就是要找到合适的游戏规则，对于企业而言，也就是要权衡合适的激励力度与激励规则。

二、博弈关系分析

1.企业效益与员工。站在博弈论的观点考虑，企业作为博弈的一方，以最小的投入（最少的激励）获得最大的产出是其利益最大化的选择；而博弈的另一方――员工，以最少的劳动换取最大的回报是其利益最大化的选择。所以，投入与回报是这一博弈中的两个关键所在。从长期利益考虑，大多数企业与员工保持着长期重复博弈的关系，也就是艾氏实验所模拟的群体次数未知博弈。这是因为，对于企业来说，效益的最大化离不开员工的高效率、高效果工作，而员工从事某一业务的熟练程度与工作效率、工作效果又有着明确且紧密地正相关关系，因此长期留住业务熟练且工作努力的员工对于企业来说，是效益最大化的一个优良选择；而对于员工来说，寻求新工作的成本（即寻求新工作的风险以及从事新工作所要面对的困境）往往是不可预期的，相对于现有的稳定环境来说，寻求新工作的边际利益可能远小于其边际成本。

2.员工与员工。员工与员工之间同样也存在着博弈关系。这种博弈是基于人的理性（利己性或者说是自私性）而产生的，以最少的努力获得最大的回报（或者是与其他更为努力的人获得相同的回报）是所有员工的最优选择。然而，企业里的工作总要有人完成，因而员工相互之间的博弈关系便形成了。而基于员工彼此之间职位高低、职业技能、人际关系等因素的不同，这种博弈关系往往是一种非均衡的博弈关系。这种强势与弱势的不平衡，往往造成员工中的弱势方倒向“小猪”式的等待型最佳策略。从而导致大猪疲于奔命，小猪坐享其成，企业的资源不但无法优化配置而且大量浪费，最终大猪小猪都疲惫饥饿，企业效益也随之减少。

综上不难看出，大多数员工之间存在的是“智猪博弈”式的博弈关系，大猪与小猪式的博弈关系是由于员工之间的强势与弱势地位而形成。企业，作为这个博弈关系的环境――最终结果承受者与规则设计者――应当找出一个能够同时调动大猪与小猪积极性的规则，以期达到资源的优化，企业的效益最大化。

三、激励制度――最佳策略

通过对企业效益与员工、员工与员工之间博弈关系以及企业激励制度对员工工作态度和企业整体效益影响的分析，我们可以运用博弈论原理对企业的激励制度作出如下的优化设计：企业效益与员工――持续的“悔过式一报还一报”模式

1.合作的必要条件。一是关系要持续，一次性的或有限次的博弈中，对策者是没有合作动机的。也就是说，企业的激励措施与员工的工作态度之间，要有持续的博弈关系，一次性的激励与一次性的心血来潮努力工作之间是无法建立合作关系的。而且，持续的回报，会给员工带来对于下次回报的预期，而促使其更加努力地工作。所以，企业的激励制度应有持续性，持续的公平的评判标准，持续的明确的奖惩制度，持续的积极的对于员工努力工作所期望回报的实现等等。另外，适度的利润分红也是维持员工与企业长期合作关系的一个重要手段，固定的红利标准与根据个人绩效浮动的红利调整机制相结合，是维持企业与员工相互信任长期合作的一个措施。二是对对方的行为要做出回应，一个永远合作的对策者是不会有人跟他合作的，一个永远的不合作者也是无法寻求合作的。相对于企业与员工来说，企业要奖罚分明，员工也会对企业的行为做出积极地反应。企业要坚持一贯的评判标准与奖惩制度，对于员工的行为做出快速的、明确的回应。这有利于企业激励制度声誉的确立与保持，也有利于员工对企业的行为做出同样快速且明确的回应，延迟的激励，往往造成不可预期的后果。

2.合适的合作关系。吴坚忠博士经研究发现，当博弈中考虑到随机干扰，即对策者由于误会而开始互相背叛的情形时，以宽大的“一报还一报”即以一定的概率不报复对方的背叛，和“悔过式一报还一报”即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强，“悔过式一报还一报”效果越好，“宽大式一报还一报”效果越差。

3.提高两者合作性。一要增强识别对方行动的能力，如果不清楚对方是合作还是不合作，就没法回报他了，同样的，对于企业来说，提高企业内部信息的对称性就十分重要；二要维持声誉，说要报复就一定要做到，人家知道你是不好欺负的，才不敢不与你合作。对于企业来说，明确的规章制度和严格的执行，是维持其制度的首要条件。这不但保证了企业规章制度的透明性和公开性，也可以使奖惩更加公平。三要能够分步完成的对局不要一次完成，以维持长久关系。激励手段，也可以按照这种方法进行。如分期的培训或奖励与定期业务考核相结合。有利于长期的维持合作关系。四要善意的对待对方。对于员工，善意的对待有利于建立合作关系。在员工故意不合作以前，认为每一个员工都是合作的，善意的。对于犯错误的员工，也应该视情况，首先善意的解决问题，这样有利于解决抵触情绪，保持稳定的关系。五回报要及时明确到位。企业的激励制度一定要保证其对员工的回报在其合理的预期之内。延迟的、不清晰的、不到位的激励往往会造成相反的结果，导致员工的情绪波动，工作效率下降。

（作者单位：江西蓝天学院）

从博弈论中运用激励

常用范文

优秀范文