登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

朱富强的博客

中山大学岭南学院

 
 
 

日志

 
 

协同惩罚与“强互惠”  

2016-03-13 10:21:29|  分类: 《博弈论》 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

协同惩罚与“强互惠”

1.缘起:允许第三方惩罚的两个实验

著名行为经济学家和实验经济学家、苏黎世大学的恩斯特.费尔(E.Fehr)等利用囚徒困境和独裁者博弈作了一系列第三方惩罚实验:

实验一是独裁者实验,A被授予100分,并可以选择01020304050分赠与B;第二阶段是,收益不受A之决策影响的C被赋予50分,他有权扣减A的分,且从A的得分中每扣除3C就会消耗掉1分。实验结果表明:A据为己有的超过50分的每一分都会被C以平均牺牲0.28分予以惩罚,使得A的每一额外分被惩罚达到0.84分;这样,即使独裁者A试图将100分都据为己有,它实际获得的分数也只有58分。

实验二是囚徒困境实验,受试者AB的初始禀赋是10分,它可以将之保留也可以转让给对方,而转让时实验者将三倍返还积分;这样,双方合作时各自可得30分,都不合作时则各得10分,一方合作时转让方得0分而背信者得40分。第二阶段,收益不受他们之决策影响的C被赋予40分,他有权扣减AB的得分。实验结果表明:当一人背信而另一人合作时,背信者被C扣减的平均分数为10.05;而如果两人都背信时,平均损失只有1.75;同时,有45.8%C会惩罚背叛合作者的受试者,而只有20.8%C会惩罚背叛不合作者的受试者。

这些实验又说明了什么问题呢?它反映出,在博弈互动中,除了对方约束和(源自组织或法律的)第三方约束外,还存在一种对背信者进行约束的机制:无利益相关的个体对背信者进行惩罚。这就是“强互惠”(Strong Reciprocity)行为。

2.“强互惠”行为的表现

“强互惠”表现为:人们倾向于与合作者进行合作,而对非合作者愿意花费一定成本进行惩罚。显然,“强互惠”行为的存在意味着,第三方的行为不符合经济人假设,因为他的惩罚使自己承担了成本却没有任何收益。

一般地,互惠有两种基本类型:积极的互惠(Positive Reciprocity),即,选择一个有利的反应,奖励合作者;消极的互惠(Negative Reciprocity),即,选择一个不利的反应,惩罚背信者。积极的互惠自不待说,这可以从大量的最后通牒博弈实验中窥见一斑:提议方的出价越公平,就越容易为回应方接受。消极的互惠也是司空见惯,如妻子往往会选择与沾花惹草的丈夫离婚,家族企业的继承者之间往往会打花费甚巨且旷日持久的诉讼官司,一个偶发性冒犯往往会引发街头械斗。

消极的互惠中一个重要类型就是“强互惠”,博弈方往往乐于与那些守信者进行合作而惩罚那些背信者。这里的惩罚对象并不是曾经损害自己的背信者,而是曾经损害他人的背信者。例如,银行往往不愿贷款给曾有过不良信用记录的人,日本企业往往也不愿与违背行业规范的企业做生意。“强互惠”是相对于“弱互惠”而言的,“弱互惠”是基于互惠利他主义或直接互惠主义之上,是源于自利个体之间的重复博弈行为所形成的均衡策略。显然,由于“强互惠”行为需要承担一定的私人成本,而收益却由所有人分享;但是,多数人的类似行为就形成了相互利他主义,最终也会有利于自身的长期利益。

事实上,“强互惠”是广泛存在的,无论是简单社会的人种学史文献、集体行动的历史解释、可控的行为实验还是日常生活的观察,都展示了“强互惠”现象大量存在的证据。在很大程度上,正是由于“强互惠”行为的普遍存在,有效地减少了欺骗和背信行为,促进了亲社会行为的扩散,衍生出了惩恶扬善的社会风气,促进了社会规范的完善,维护了协会或社会秩序,并促进了合作秩序的生成和扩展例如,2009年的诺贝尔经济学奖得主埃莉诺.奥斯特罗(Elinor Ostrom)设计了一个受试者可以通过支付一定费用对其他受试者进行罚款的公共品投资博弈实验,就发现受试者明显具有惩罚不合作者的行为;后来,实验又在受试者有权沟通但不能达成有约束力的协议下进行重复,结果导致了只有很少的制裁(4%)的情况下几乎实现了完美的合作(93%)。

在很大程度上,人类社会的合作都可以通过这种“强互惠”行为来解释,人们往往愿意遵循共同设立的规则。例如,金迪斯构建的一个模型就证明,当集体经常性地面临灭绝事件的威胁时,一般的互利主义往往无法激发自利的个体进行合作以避免灾难的发生,而当“强互惠”主义足够强大时就可以进行有效的合作以降低团体灭绝的可能性。显然,如果将公地悲剧视为集体行动中的这种灾难的话,那么,避免这种悲剧也需要依赖于“强互惠”行为;而现实生活中的公共资源之使用往往保持着非常高的效率,这也反映出“强互惠”行为的广泛存在而且,Marlowe等人的实验证明,这种强互惠现象在大而复杂的社会中往往比在小规模的社会中更有意义,因为在更大规模的社会中,交往者之间的信息更不对称,而强互惠行为所施行的第三方惩罚有助于抑制这类欺骗和背信行为。那么,大规模社会中的“强互惠”行为是如何形成的?在很大程度上,正是这种社会网络关系的存在为“强互惠”行为提供了社会基础,从而提高了整个社会的生存能力;同时,这种社会网络关系本身是不断扩展的,大社会的网络关系是有效社会的网络关系扩展而来,“强互惠”行为也会在社会中进行扩展和传承。

3.“强互惠”行为的证据

首先,就实践中的经验证据而言。在群体行动中,大多数个体都愿意承担一定的成本对那些不友好对待他们的背信者进行惩罚,尽管他从中获得的好处往往小于其成本。譬如,在现实生活中,我们常常可以看到,参与工会罢工的工人们往往会将罢工的持续时间拉长到远大于其物质利益的获得的程度,其目的仅仅是为了对公司的“不公平”行为进行惩罚;参与政治运动的利益集团往往也会将游行示威的持续时间拉长到远大于其物质利益的获得的程度,其目的仅仅是为了对主政者的“不公平”行为进行惩罚。同样,一些群众往往会自发地抵制某些国家的商品,或者某些领导人的来访,尽管同时也损害了自身的物质能利益;其原因仅仅在于:该国存在“不公正”竞争、“不友好”行为或者限制“人权”行为。

其次,就研究中的实验证据而言。大量的信任博弈、独裁者博弈、最后通牒博弈、公共品投资博弈等行为实验也都表明,在群体行动中,大多数个体都愿意承担一定的成本对那些不友好对待他们的背信者进行惩罚,尽管他从中获得的好处往往小于其成本。例如,卡尼曼等就做了独裁者博弈实验:允许受试者支付1美元对不公平的分配者进行惩罚并奖励公平分配者,结果发现,74%的受试者都使用了这种惩罚。实验还显示,81%的受试者宁愿只获得与公平的分配者共享10美元而不愿与不公正的分配者共享12美元。

这里,我们再看一个公共品投资博弈:设置一个公共账户,4个匿名的受试者可以把任意数量的筹码投资于该公共账户,每一轮结束后,受试者都能得到公共账户中筹码总数的40%,一共进行6轮。博弈开始时每个人都有20个筹码,这样,如果每个人都将自己的筹码全部投入公共账户,那么,第1轮后每个人能得到32个筹码,第2轮后则可以得到51.2(4×32×40)个筹码,以此类推,全部6轮后将得到210个筹码。但是,假如存在一个从不向公共账户投资的搭便车者,则第1轮后,他将得到44(即203×20×40%)个筹码,其他每个人得到24(即3×20×40%)个筹码;6轮过后,搭便车者将得到258个筹码,其他每人大约只有60个筹码。根据主流博弈论的后向推理思维,每个人都不向公共账户投资是纳什均衡。然而,实验却表明,只有很少人符合这一推断。例如,费尔等人的实验就显示,最初几轮中,投资的平均水平在40%和60%之间,随着轮次的增加,投资额有所降低,最后一轮有73%的个体拒绝投资,剩下的投资水平也大幅度下降。

显然,这个实验反映出两点:1理性分析的理论结论并没有在实验中出现;2越接近结束,行为就越与理性人假设相符。当然,实验结束后的调查表明,之所以在博弈尾声的投资率大幅度下降,大部分人声称这样做是出于愤怒,而通过减少投资来报复那些搭便车者。后来费尔等人设计了一个允许对搭便车者进行惩罚的实验,受试者可以支付一定的成本来罚没某个人的筹码。在这种情况下,惩罚可以增加公共福利却要个人支付成本,这就可能产生第二种意义上的搭便车:人人都希望别人来实施惩罚而自己坐享其成。但是,实验结果却显示,惩罚行为非常普遍,而且整个投资水平也明显提高。也就是说,现实世界中每个人或多或少地都希望通过互惠合作来最大化自身收益,甚至为此愿意花费成本来对那些机会主义行为进行惩罚。这反映出了人类行为和动物行为之间的差异。

  评论这张
 
阅读(14081)| 评论(5)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018