2.6重复占优与选美博弈困境
1.缘起:选美博弈的困境
我们来做一个“p-选美比赛”博弈实验,其中p为2/3。即博弈程序为:一群受试者在0~100之间选一个整数,选的数字最接近猜测平均数的2/3为赢家,可获得奖品10万元。当然,每个人的思维逻辑是不同的,但一般来说,以下两种是大多数受试者面对这个博弈情形的基本思维方式。
【思维一:最大平均数思维】由于67是100的2/3的最大平均数,因此,博弈方应该选择比67小的数字而取得占优策略,所有博弈方的选择范围缩小到[0,67]。给定这个共同知识,由于44是67的2/3的最大平均数,因此,博弈方就应该选择比44小的数字而取得占优策略,所有博弈方的选择范围缩小到[0,44]。给定这个共同知识,由于29是44的2/3的最大平均数,因此,博弈方就应该选择比29小的数字而取得占优策略,所有博弈方的选择范围又缩小到[0,29]。随后再被缩小到[0,20]……依此类推,那么就可以得到唯一的纳什均衡0。
【思维二:随机平均数思维】假设人们的选择是随机的,那么,在[0,100]中选择的中位数或平均数就是50,因而33就成为最佳选择;但在给定他人都选择33的情况下,22又成为更佳的选择……这样循环下去,最后的结果还是0。
事实上,在该选美博弈中,由于所有参与者都试图选择平均数的2/3,那么就有:x*=(2/3)×x*;从而就可得“0”,这就是惟一的纳什均衡。不过,实验中选择“0”的人非常罕见,“0”成为大家的现实选择结果几乎更是不可能的。例如,德国经济学家R.Nagel在1995年对此作了研究,她使用14~16岁的德国学生作为受试者,发现选择的平均数是35左右,其中,许多试验对象要么选择33(从中位数50开始的一步推理),或者选择22(二步推理)。按照R.Nagel的估计,44%的人使用第一个层次的后向归纳,39%的人使用两个层次的后向归纳,少于3%的人使用多于两个层次的后向归纳,而13%的人不使用后向归纳。同样,凯莫勒等在1998年所作的相似实验也发现,几乎很少人会在第一轮就选择零均衡;而且,他们也不应该选择零,否则就聪明过头了。
那么,这个博弈推理出了什么问题呢?
2.人类的推理能力
实际上,上述选美博弈使用了无限“重复占优”的博弈思维。例如,在思维一中,由于平均数的2/3不会超过67,因而选择大于67的数字违反了占优,相应地,选择大于44的数字违反了两步重复占优,选择大于29的数字违反了三步重复占优,依此类推,这里使用了无限的“重复占优”思维。
问题是,真实的人类推理逻辑是有局限的。事实上,大量的行为实验表明,绝大多数人进行重复推理的步数不超过三级,以至于心里语言学家H.克拉克(H.Clark)取笑说,对三级或更多级重复推理的掌握“只需一杯上好的雪利酒就可以被忘却”。
因此,在这类博弈中,尽管博弈方需要了解其他博弈方重复推理的步数,但由于人们使用的重复推理步数是有限的,从而就不需要把别人视为完全理性的。也就是说,这个实验反映出,赢者并不需要完全理性,完全理性者也不一定会成为赢者。赢的关键在于,自己的推理比其他人多走一步,而不是更多,而这又需要有对方的信息。
凯莫勒就写道:剔除劣策略是一种自然而然的决策规则,因为无论别的参与者做了什么,它都能至少保证一个较好的结果;但是,相信别人服从占优是一个不同的问题,因为它是对双方支付以及对别人推理的一种猜测;进一步地,相信别人相信你服从占优又是一个不同的问题。结果,人们实际进行的剔除劣策略的等级数目是一个有趣的问题,而且是一个重要的经验问题。
这也意味着,即使通过无限逻辑推理,有博弈方正确地推算出了“0”这一均衡结果,他也不应选择“0”。事实上,在股票市场上,即使所有投资者都预见到了非理性繁荣的股市最终会崩盘,他也不会采取持续逆推法直到眼前,一推算出崩盘就马上进行清仓;相反,他会采取以静制动之策,并猜测别人会在崩盘前的一两步售出,而自己则计划刚好在别人售出前售出。这也可以解释股市的非理性繁荣为何可以在很长一段时间内得到维持。
3.“知识的诅咒”现象
“选美博弈”困境实际上揭示了一个“知识的诅咒”现象:那些具有更多知识的人所得的结果甚至比没有知识的人还要糟糕。奈特就指出,苏格拉底之所以必须死去,根本原因不是他知道自己的无知,而是因为他知道其他人的无知。由此,我们就可以理解学术庸人的大量存在现象。在当今中国学术界,取得学术地位以及相应的学术影响的人并非都是有明显学术创新和深邃洞见的人,而主要是在阐述或解释传统智慧方面做得相对较好的人。究其原因,那些具有独特学术思想或洞见的人,反而因领先普通学者几个等级而无法为大多数人所理解,从而也就只能被边缘化。
譬如,时下经济学界就流行开一本《经济学常识》,据说在商业策划下已经为作者赢得了数百万元。问题是,这是怎样的“经济学常识”呢?大体上只是使用新自由主义教材中的自由交易和理性选择思维来解释一些日常生活中的现象,而且,这些分析往往只是停留在表象上,而根本无法深入事物的实质,也看不到真正的问题。实际上,只要进一步拓展我们的视角就可以认识到,现代经济学眼中的“常识”可能并不是常识而是一种“误解”,而不加反思地将之宣扬为常识只不过是在推行自身理念的措辞,或者借之牟利。这些人之所以能够通过通俗化教材中的一些“常识”甚至“谬误”就能够获利,只不过他们对这些“常识”做了些整理和阐释,从而比普通大众拥有了更多一些知识。不过,学者的根本任务在于引导人们的思考而不是灌输一些根本不是常识的“常识”,只不过对这些“常识”的剖解需要更为广博的知识,从而也就难以在社会大众中得到普遍的反应。
事实上,在经济学说史上,那些在世时就拥有巨大影响力的经济学人几乎都只是对经典学说或已经被大家接受的思想进行概括和条理化,而真正的开创性学术往往要经过一、二代之后才逐渐为人们所理解和接受,这些先驱也才会被后人所认同和传诵。同样,在当前中国经济学界,那些所谓的著名经济学家几乎都是正统马克思主义的教材化阐释者或者对现代主流经济学的数理化阐释者,而很少有真正的学术创新。尤其是随着现代主流经济学的“西学东渐”,那么所谓的经济学名人往往只是在数理建模或计量实证方面比其他大多数人做得稍好一点,并借此在那些注重形式和规范的数理经济学刊物上发表文章,更有机遇者则凭此获得了论文百优的称号,进而成为“××学者”,成为享受各种津贴的学术带头人;相反,那些真正在作理论探讨并有独到想法的学者则无法为大众所接受,乃至处于被边缘化的地位。
最后,“知识的诅咒”现象在当前中国社会之所以如此盛行,根本上就在于新自由主义的经济人思维的广泛传播,这导致人们往往以利益动机到审视和回应他人的行为。这在主流博弈论就表现为:每个人都关心自己的利益,都基于行为功利原则行事,相互作用的结果就会导向极其糟糕的困境。例如,在选美比赛中,如果过分看重社会大众的偏好,那些哗众取宠的候选者反而会当选,从而让人大倒胃口;在高考择校中,那些好学校或者专业往往会成为某一年的冷门,而使一些学子抱憾。事实上,这也就是社会经济中广泛存在的混沌现象,如金融泡沫,各种经济风潮都是这种预期效应强化的结果。
摘自
评论