Saturday, September 10, 2016

谢选骏:中国社会的亡国经历与囚徒困境


刚到美国的时候,有一位老华侨告诉我:如果有一百万美元放在面前,让十个窃贼来瓜分;那么美国人大多想的是如何可以得到其中的二十万美元,中国人大多想的是如何可以得到全部的一百万美元。而如此运行的结果很可能是,美国窃贼成功地分配了他们的赃款,而中国窃贼因为内讧互咬而致使案情败露了。
老华侨不知道,这是因为培养了中国人的中国社会,已经陷入了囚徒困境。例如,百年来国共两党的斗争,流血死亡了亿万人民,迄今为止毫无结果:共产党采取了国民党的路线,国民党承认了共产党的主权;但双方却让中国社会付出了百倍的惨痛代价。这就是囚徒困境里两败俱伤的产物。相比之下,日本社会由于具有较高的社会信任度,因此避免了这样的互相背叛所带来的社会恶果,走上了一条精诚合作的道路。
若囚徒们不互相合作,则无法脱离困境——如此则产生了“囚徒困境”(Prisoner's Dilemma)。
(一)
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。
在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
囚徒困境的主旨为,囚徒们彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在无法沟通的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考虑。
(二)
1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将实时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监5年。
(显然,中国社会之所以盛行“背叛”,而较少“合作”,是因为中国社会已经陷入了囚徒困境。)
如同博弈论的其它例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其它策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其它力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
若对方沉默、我背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑5年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑5年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判监均比合作为高,总体利益较合作为低。这就是“困境”所在。例子有效地证明了:非零和博弈中,帕累托最优和纳什均衡是互相冲突的。
(三)
固定局数的囚徒困境
概括而言囚徒困境进行第一次后会出现以下两种情况:
甲在第一次中被乙指控,即会在第二次指控乙,最终导致,甲即时获释,乙服刑10年或二人同服刑2年这两种情况。
双方均保持沉默,即会建立互信的关系,最终导致,二人同服刑半年。
但互信的关系并非牢不可破,这一点也可以被利用,即甲,乙在第一次中共同选择沉默而赢得对方的信任,但甲或乙中的一人在获得对方的信任后指控对方而获得自身最大的利益即自身即时获释,但对方将服刑10年。这是一个以牺牲对方利益而获得自身最大利益的一种策略。
假设,两个囚徒均欲利用此策略,并将局数推演为十次,那么就会出现如下的情况:在第一局到第九局的过程中双方均会保持沉默,以期望建立互信关系,并在第十局指控对方,这将最终导致,二人同服刑5年。
再一次假设,双方都明确对方会使用与自己同样的策略,即知道对方会在第十局中指控自己,这样,在第九局时两者间的信任关系的建立即是没有意义的,如此类推,第八局到第一局中信任关系的建立也是没有意义的,即是十局都会互相背叛,也就是纳什均衡。也可推论,在如此的情况下,只有在囚徒困境的局数在不肯定的情况下(即双方均不知道进行的局数),才会出现互相保持沉默以获得信任关系的现象。
(四)
一般形式
整理囚徒困境的基本博弈结构,可更清楚地分析囚徒困境。实验经济学常用这种博弈的一般形式分析各种论题。以下是实现一般形式的其中一例:
有两个参与者和一个庄家。参与者每人有一式两张卡片,各印有“合作”和“背叛”。参与者各把一张卡片文字面朝下,放在庄家面前。文字面朝下排除了参与者知道对方选择的可能性1。然后,庄家翻开两个参与者卡片,根据以下规则支付利益:
一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。
二人都合作:各得3分(合作报酬)。
二人都背叛:各得1分(背叛惩罚)。
(五)
现实的例子
上述例子可能显得不甚自然,但现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用,说明这种博弈的重要性。以下为各界例子:
1、政治学例子:军备竞赛
在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。
2、经济学例子:关税战
两个国家,在关税上可以有以两个选择:
1.提高关税,以保护自己的商品。(背叛)
2.与对方达成关税协定,降低关税以利各自商品流通。(合作)
当一国因某些因素不遵守关税协定,而独自提高关税(背叛)时,另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。)
3、商业例子:广告战
商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。
两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。
此二公司可以有二选择:
1.互相达成协议,减少广告的开支。(合作)
2.增加广告开支,设法提升广告的质量,压倒对方。(背叛)
若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要求两个互相竞争的公司达成合作协议是较为困难的,多数公司都会陷入囚徒困境中。
4、自行车赛例子
自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自行车赛中有以下情况:选手们在到终点前的路程常以“大队伍”(法语:peloton)方式前进,他们采取这个策略是为了让自己不至于太落后,又出力适中。而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其它选手以及大队伍就会赶上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。
(六)
与囚徒困境相关的各事件
1、异想
威廉·庞德斯通(William Poundstone)在他的著作中,以一新西兰的例子来说明囚徒困境。在新西兰,报亭既无管理员也不上锁,买报纸的人自行放下钱后拿走报纸。当然某些人可能取走报纸却不付钱(背叛),但由于大家认识到如果每个人都偷窃报纸(共同背叛)会造成以后不方便的有害结果,这种情形很少发生。这个例子的特别之处,是新西兰人并没有被任何其它因素影响而能脱离囚徒困境,并没有任何人特别去注意报亭,人们守规则是为了避免共同背叛带来的恶果。这种避免囚徒困境的大家共同的推理或想法被称为“异想(magical thinking)”。
2、“认罪减刑”不可行
囚徒困境的结论是许多国家中认罪减刑(英文:plea bargain)被禁止的原因之一。囚徒困境带来的结论是:如果有二个罪犯,其中一人犯罪而另外一人是无辜的,犯罪者会为了减刑坦白一切甚至冤枉清白者(单独背叛)。最糟糕的情况是,如果他们二人都被判入狱,坦白的犯罪者刑期少,坚持无罪的冤枉者刑期反而更多。
3、公用品悲剧
现实的博弈参与者不只一方,会有多方参与的囚徒困境。加勒特·詹姆斯·哈丁(Garrett James Hardin)的公用品悲剧就是一例:“公用品悲剧是指凡是属于最多数人的公共财产常常是最少受人照顾的事物”,例如渔业,公海中的鱼是属于公共的,而在本身不滥捕其它人也滥捕的思想下,渔民会没有节制的大捞特捞,结果海洋生态破坏,渔民的生计也受影响(共同背叛的结果)。但是,多方囚徒困境的提法有待商榷,因为其总是可以被分解为一组组经典的二方囚徒困境。就是说只有二方的囚徒困境,没有多方的。所谓多方的囚徒困境只是由多个二方囚徒困境混杂在一起而形成的错觉。
(七)
重复的囚徒困境
美国政治学家罗伯特·阿克塞尔罗德(Robert Marshall Axelrod)在其著作《合作的进化》(The Evolution of Cooperation)中,探索了经典囚徒困境情景的一个扩展,并把它称作“重复的囚徒困境”(IPD)。在这个博弈中,参与者必须反复地选择他们彼此相关的策略,并且记住他们以前的对抗。阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,并在一个重复囚徒困境竞赛中互相竞争。参赛的程序的差异广泛地存在于这些方面:算法的复杂性、最初的对抗、宽恕的能力等等。
阿克塞尔罗德发现,当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终“贪婪”策略趋向于减少,而比较“利他”策略更多地被采用。他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。
最佳确定性策略被认为是“以牙还牙”,这是俄裔美籍数学心理学家阿纳托尔·拉波波特(Anatol Rapoport)开发并运用到锦标赛中的方法。它是所有参赛程序中最简单的,只包含了四行BASIC语言,并且赢得了比赛。这个策略只不过是在重复博弈的开头合作,然后,采取你的对手前一回合的策略。更好些的策略是“宽恕地以牙还牙”。当你的对手背叛,在下一回合中你无论如何要以小概率(大约是1%-5%)时而合作一下。这是考虑到偶尔要从循环背叛的受骗中复原。当错误传达被引入博弈时,“宽恕地以牙还牙”是最佳的。这意味着有时你的动作被错误地传达给你的对手:你合作但是你的对手听说你背叛了。
通过分析高分策略,阿克塞尔罗德指定了策略获得成功的几个必要条件:
友善:最重要的条件是策略必须“友善”,这就是说,不要在对手背叛之前先背叛。几乎所有的高分策略都是友善的。因此,完全自私的策略仅仅出于自私的原因,也永远不会首先打击其对手。
报复:但是,阿克斯洛德主张,成功的策略必须不是一个盲目乐观者。要始终报复。一个非报复策略的例子是始终合作。这是一个非常糟糕的选择,因为“下流”策略将残酷地剥削这样的傻瓜。
宽恕:成功策略的另一个品质是必须要宽恕。虽然它们不报复,但是如果对手不继续背叛,它们会一再退却到合作。这停止了报复和反报复的长期进行,最大化了得分点数。
不嫉妒:最后一个品质是不嫉妒,就是说不去争取得到高于对手的分数(对于“友善”的策略来说这也是不可能的,也就是说“友善”的策略永远无法得到高于对手的分数)。
因此四个条件,阿克塞尔罗德得出一种给人以乌托邦印象的结论,认为自私的个人为了其自私的利益会趋向友善、宽恕和不嫉妒。阿克塞尔罗德关于重复囚徒困境的研究的重要结论之一,是友善的家伙能先完成交易。
重新考虑经典的囚徒困境一节中给定的军备竞赛模型:结论是,只是理性策略增进了军事力量,似乎两个国家都宁可花费其GDP在枪炮而不是黄油上。有趣的是,企图说明对抗国家实际上以这种方式(在“重复囚徒困境假定”下的不同时期,军费支出在“高”和“低”之间反复)竞赛的尝试,却经常表明假定的军备竞赛并没有如预想的那样出现。(例如希腊人和土耳其人的军费支出,看来并不像遵循“以牙还牙”的重复囚徒困境式的军备竞赛,却更可能是被其国内的政策所驱使。)这可能是一次性博弈和重复性博弈中的理性行为不同的例子。
对一次性囚徒困境博弈来说,最佳(点数最大化的)策略是简单地背叛;正如前面解释的,无论对手的行动可能是什么,这都是真实的。但是,在重复的囚徒困境博弈中,最佳策略依赖于可能的对手的策略,和他们怎样对背叛和合作作出反应。例如,考虑这样一个人群,那里每个人每次都背叛,除了一个人是遵循以牙还牙策略。这个人处于一种轻微的不利地位,因为第一回合的损失。在这样的人群中,对这个人来说最佳策略就是每次都背叛。在一个有一定的百分比的总背叛者而剩下的则是以牙还牙者的人群中,对个人来说的最佳策略依赖于这个百分比和博弈的长度。
一般有两种方法得到最佳策略:
1.贝叶斯纳什均衡:如果对抗策略的统计分布能被确定(例如,50%以牙还牙,50%一直合作),就能从数学上获得最佳的相对策略。
2.已经有了人群的蒙特卡罗模拟,在这里低分个人消失了,高分个人一再被生产出来(一种获得最佳策略的天才算法)。决赛人群中的算法合成通常依赖于初赛人群中的算法合成。
尽管以牙还牙始终被认为是最可靠的基本策略,但是在重复囚徒困境的20周年纪念赛中,来自英国南安普敦大学的一个小组(由尼古拉斯·詹宁斯(Nicholas Jennings)领导,包括了拉蒂普·达什(Rajdeep Dash)、萨瓦帕里·拉姆琼(Sarvapali Ramchurn)、亚历克斯·罗杰斯(Alex Rogers)斯和皮鲁克里士南·维特林根(Perukrishnen Vytelingum))介绍了一个新的策略,这个策略证明了它比以牙还牙更成功。这个策略依赖于程序之间的合作,为单一程序中获得了最高的点数。南安普敦大学提交了60个程序参与竞赛,这些程序的开头被设计成通过一组5到10个的动作去彼此识别。一旦这些识别被作出,一个程序将总是合作,其它程序则总是背叛,保证背叛者得到最大的点数。如果程序识别出它在操作一个非南安普敦参与者,这程序将持续地背叛,企图去最小化竞争程序的得分。结果,这个策略以获得前3位结束了竞赛,也得到了大量接近底部的位置。虽然这个策略显著地证明了比以牙还牙有效,但是这是因为利用了下述事实:在这个特殊的竞赛中,多重通道是被允许的。在一方只能控制单一参与者的竞赛中,以牙还牙确实是更好的策略。
如果重复囚徒困境将被精确地重复N次,已知N是一个常数,那么会产生另一个有趣的事实。纳什均衡就是每次都背叛。这很容易用归纳法证明。你也可以在最后的回合背叛,这样你的对手将没有机会惩罚你。如果大家都可能选择在最后的回合背叛,那么,交友的选择似乎是在倒数第二回合中背叛,因为最后一回无论你做什么,你的对手都将背叛。依此类推。为了继续保持合作,那么对两个参与者来说未来必须是不确定的。所以,对于缺乏宗教信仰的人来说,更容易选择背叛。
还有一个解决方案,是让博弈的总次数,变成随机的。也就是说,对“未来”的预期必须是无法确定的长度。
(八)
囚徒困境博弈是某些人类合作和信任理论的基础。假定囚徒困境能够模拟需要信任的两人之间的交流,群体的合作行为可以用有多个参与者的、重复博弈的变体来模拟。这从而引起了许许多多学者经久不衰的兴趣。1975年,格罗夫曼(Grofman)和普尔(Pool)估计,致力于这方面研究的学术文章,数量超过2000篇。
1、学习心理学和博弈论
当博弈参与者能学会估计其它参与者背叛的可能性,他们自身的行为就为他们关于其它人的经验所影响。简单的统计显示,总体上,缺乏经验的参与者与其它参与者的互动,或者是典型的好,或者是典型的坏。如果他们不在这些别人经验的基础上行动(通过更多的背叛或合作),他们可能在未来的交易中受损。随着经验逐渐丰富,他们获得了对背叛可能性的更真实的印象,变得更成功地参与博弈。不成熟的参与者经历的早期交易对他们未来参与的影响,可能比这些交易对成熟的参与者的影响要大得多。这个原理部分地解释了,为什么年轻人的成长经验这么具有影响力,以及为什么他们特别容易被欺负,有时他们本身最后也成为欺凌弱小的人。
群体中背叛的可能性,可以被合作的经验所削弱,因为先前的博弈建立了信任。因此自我牺牲行为可以,例如,加强团体的道德品质。如果团体很小,积极行为更可能以互相肯定的方式——鼓励这个团体中的个人继续合作——得到反馈。这与相似的困境有关:鼓励那些你将援助的人,从可能使他们处于危险的境地的行为中得到满足。这类方法主要在互惠利他主义、血缘选择和道德哲学的研究中涉及。
2、相关的博弈
(1)封闭袋子交易
霍夫施塔特曾提出像囚徒困境的问题。他提出“密封袋子交易”,他认为以这简单博弈题,有助人们理解此论题。
“密封袋子交易”:甲、乙两人面对面交换密封的袋子,双方的共识是甲的袋放钱、乙的放商品。双方各自可以诚实地把东西放到袋子,然后交换;又或者交空袋子给对方,选择背叛。
在这场博弈中,由于背叛可获得巨大利益,必然有多人选择背叛。这意味着理性的商人不会进行这种交易,因而“封闭袋子交易”将由于逆向选择而失去市场。
(2)是敌是友
“是敌是友?”是一个竞赛表演节目,从2002年到2005年在美国竞赛表演广播网(Game Show Network)放映。这是一个用真人进行的囚徒困境博弈例子,不过情景是人造的。这个竞赛表演有三对人参与竞争。当每对人被淘汰时,他们做一个囚徒困境博弈,决定如何分他们的奖品。如果他们都合作(“朋友”),他们的奖品就被平分。如果一个合作而另一个背叛(“敌人”),背叛者得到所有的奖品,合作者什么都得不到。如果双方互相背叛,那么两人都一无所获。注意,这个支付矩阵与前述标准的支付矩阵不同,因为发生“互相背叛”的情形和“我合作而对手背叛”的情形,其损失是一样的。和标准囚徒困境的稳定均衡相比,“互相背叛”是不稳固的均衡(weak equilibrium)。如果你知道你的对手将成为“敌人”,这时你的选择无法影响你的奖品。在某种意义上,“是敌是友”拥有一个介于“囚徒困境”和“小鸡”之间的支付模型。
这个支付矩阵是:
如果参与者都合作,每人得到 +1。
如果都背叛,每人得到0。
如果甲合作而乙背叛,甲得到0而乙得到 +2。
是敌是友对于想对囚徒困境作现实分析的人将是有用的。注意到,参与者只能进行一次,所以所有涉及重复进行博弈的观点都不适用,“以牙还牙”策略也无法发展出来。
在是敌是友中,每个参赛者被允许做一个声明,使另一战友在双方秘密决定合作或背叛之前,确信他的友善。可能“打破制度”的方法将是一个参与者告诉他的对手:“我会选择做敌人。如果你相信我后来会和你分奖品的话,就选择做朋友。否则,如果你选择做敌人,我们都会空手而回。”一个更贪婪的版本将是:“我将选择做敌人。我会给你百分之X,剩下的百分之(100-X)归我。所以,要或不要,要么我们都得到一些,要么我们都一无所获。”(在最后通牒博弈中时。)现在,奸计就是去尽量减少那个百分之X,并保持另一个竞争者仍然选择做朋友。基本上,这个参与者必须知道这个界限,在这里他的对手从看到他一无所获中得到的效用,要超过他从肯定能赢得的金钱中得到的效用,如果他顺利的话。
在竞赛中这个方法从未被试验过;可能是因为裁判们不会允许,而且即使允许,不平等厌恶也会由于这个规则的使用而导致较低的期望收益。(最后通牒博弈中尝试了这个方法,结果导致对高而不平等的出价的拒绝。)
(九)
中国社会为何缺乏合作,甚至习惯于互相拆台?换言之,中国社会为何是被囚徒困境所主宰的社会?
这是因为中国社会具有漫长的亡国经历。中国人因此失去了自主的权力,被迫在“不背叛就不能生存”的压力下,一再做出了互相背叛、尔虞我诈的选择。相比之下,日本由于其岛国的地形,幸运地躲过了几次残暴的外来入侵(秦朝和元朝的等等),所以保存了较高的社会信任度。
《群众的智慧》一书表明,长久的资本主义能够围绕教友派信徒的核心形成,这些教友派信徒们总是体面地同他们的生意合伙人交易(而不是背叛和食言——一种已经阻碍了早先的、非强制履行的长期境外合同的现象)。这表明,和可靠的商人作交易使合作拟子(meme)传播给其它交易者,这些交易者又把它传播到更远的地方,直到高水平的合作在一般商业活动中成为有利可图的策略。……但是,这种合作模式在中国是无法形成的。因为基于外来军事征服的中国专制政权,会全力打击这样的“非法组织”,哪怕它仅仅是商业性的;因为专制者担心,这样的社会信任会造成其为所欲为的障碍。
因此一来,“获知其它人的策略”从而调整自己的做法,以便形成某种良性反馈,就不被民间社会考虑了。其理由是:在强蛮的专制政权面前,即使有人能获知他人的策略,“背叛”并“投靠专制政府”仍然是最佳的个人策略,无论他获知对方选择“合作”或“背叛”都是如此。人的自私天性不会改变,专制制度必然加深囚徒困境,使得社会整体永远无法达到自身的最大利益。所以在专制制度之下,知不知他人的策略,对囚徒困境的存在已经几乎没有影响了。“厚颜无耻”成为囚徒生存的第一守则。
“群众的智慧”在中国变成了“群众的专政”。
————————————————————
附录
《群众的智慧》的卖书广告
有些书,决定不得不读,是因为看到太多书引用该书了,像是《群众的智慧:如何让整个世界成为你的智囊团》(The Wisdom Of Crowds: Why The Many Are Smarter Than The Few, And How Collective Wisdom Shapes Business, Economies, Societies, And Nations)。
《群众的智慧》作者是《纽约客》(The New Yorker) 杂志的专栏作家索罗维基(James Surowiecki),这本书的影响力颇大到其书名“群众的智慧”(the wisdom of crowds)也成了流行用语。他在书中指出,平均并不决然平庸,在大多数情况下,一个众人的猜测平均起来更有可能比那些其个别成员的准确。虽然它可能是违背我们的直觉,群众可以比单打独斗的专家更聪明。
索罗维基在《群众的智慧》举了许多有趣的例子,从流行文化、心理学、生物学、经济行为学、人工智慧、军事历史、社会现象、政治理论来论述群众的智慧在真实的世界是如何运作的。《群众的智慧》中的例子最早从英国维多利亚时代开始:一群人猜牛只的重量的平均数居然高达99%准确!这让统计学家高尔顿(Francis Galton,1822-1911)非常的惊讶。他原本笃信只有极少数的人具有能令社会维持健康的优良特质,也唯有将权力及掌控权交到经过挑选的,品种优良的少数人手中,社会才可能保持健康与强壮。
《群众的智慧》探讨了许多有趣的问题,例如为什么美国的的情报机构未能准确预测并预防2001年的911事件?不管好片烂片,电影院何以死守单一票价的策略?科学界中为何既是竞争又是合作?股票市场中“做空”与“做多”为何同样重要?我们为什么要缴税?为什么你排的队伍总是看起来最长?为什么你在世界任一角落买一颗螺丝帽,都能与距离它一万英哩之外的一颗螺丝钉相吻合?如果你得在某一天,在巴黎与某人碰面,但却没办法联络到她,你们可能会在何时、何地碰面?塞车是怎么形成的?什么方法最有机会赢得电视益智节目的奖金?为何你在凌晨两点,走进一家便利商店想买瓶汽水,而汽水就会坐在架上等着你?为什么好莱坞的黑帮电影,能让我们了解企业是怎么回事?
在另一个有趣的例子中,太空梭挑战者号(STS Challenger,STS是太空运输系统Space Transportation System的缩写,是美国官方对于太空梭这种设备的正式称呼)爆炸发生21分钟后,光看各家涨跌就能“知道”哪家公司的零件有问题。1986年1月28日,上午11点38分,太空梭挑战者号爆炸发生21分钟后,制造大空梭及其零件的洛克希德(Lockheed)股价跌落百分之五,马丁马瑞艾塔 (Martin Marietta)股价跌落百分之三,洛克威尔(Rockwell International)则跌落百分之六。制造固态燃料辅助引擎的莫顿希尔科(Morton Thiokol)的股价掉得最惨。换句话说,在爆炸发生后不过半小时,股市就“知道”哪家公司有罪。没有证据显示,有人大量卖出莫顿希尔科的股票。(谢选骏指出:这显然是内线交易的结果!)人类好像是经过程式设计,成为能够展现集体智慧的动物。(谢选骏指出:这显示,所谓“集体智慧”其实是受到少数领袖操纵的。作者如此叫卖“群众的智慧”,可能只是为了吸引大量愚蠢的买家进来消费。)
在911事件之前,美国情报圈衍生出一大串各行其是、分权的团体,大家前进的目标都相同,都要确保美国安全,不要受到攻击,但是大家各走各的路。直到 911事件,大众都没有注意到这个体系的缺点。(谢选骏指出:这显然不合所谓的“群众的智慧”。)911事件后,有参议者认为集权才是王道,可是索罗维基指出,统合不是一把抓,过去未来汇集各方情报,无法有效聚集多样的意见才是问题所在。他又举了Linux的开放源码软体的传播的例子,显示了群众的智慧甚至能够与来自微软等公司一较高下,提供可靠和廉价的电脑软体。
《群众的智慧》指出,如果能集结到一群具备不同程度知识与见解的人,大可将重要的棘手问题交给他们去处理,强过交到一两个人手中,无论他们有多聪明。期待专家能解决一个组织的问题,是在浪费时间。我想,这就是为何经济问题总是无法由几个官大学问大的专家来解决,甚至过度自以为是的干预还扰乱市场,更甭提要强行通过众人皆知会对全民极为不利的协议等等。有时候政府只要做好重分配的税制就好,把选择权交给人民和市场吧。
要利用集体的智慧来解决问题,要有四个条件符合:一、意见真正的多样性;二、独立意见(所以它们之间没有相关性);三、经验权力下放; 四、意见聚集的适当机制。(谢选骏指出:互相矛盾。)为什么专家没有那么聪明?因为专家所见往往是略同,因此并不反映意见最大的多样性;当见解和实际状况有出入时,他们往往也无法修改或调整自己的见解,而且往往过度自信。过去的表现从来都不是未来成功的预测,他们可能只是幸运。
他指出美国NASA任务小组,在2003年讨论面哥伦比亚号太空梭(STS Columbia OV-102)的因机翼遭泡绵撞击时没有预料到其极高的风险,导致它要在进入大气层,因太空梭的机翼受损而爆炸。同样的,美国和英国的情报部门没有考虑到伊拉克并没有窝藏大规模杀伤性武器的可能性。在这两种情况下,多样的意见并没有真正被汇整过。
我们为什么愿意与那些几乎不认识的人合作?索罗维基很崇尚罗伯·赖特( Robert Wright)在《非零年代:人类命运的逻辑》(Nonzero: The Logic of Human Destiny)的答案:经过一段时间后,我们自然会学到买卖与交易是能让人皆大欢喜的游戏,不像零和游戏,永远要分出谁赢、谁输。
《群众的智慧》表示,最理想的企业总裁,当然应该要承认自己的知识有限,而且个人的决策也有限。而这也是为什么通用汽车在它最风光,身为全球最成功企业的时候,重大决策都 是采取史隆(Alfred  P.Sloan,1875-1966)所谓的“群体管理”方式。他以流行服装品牌ZARA为例解释由下而上的管理之效率。
不过,对于群体决策的效力,索罗维基也没有一味地吹嘘。《群众的智慧》解释金融泡沫和崩盘,指出确定股票的价格既是一种认知和统合的问题。我们总是在该公司的未来表现和其他股民之间的平衡作猜测。泡沫和崩盘发生时,这个平衡点过度转移至统合那方,我们更担心其他股民的动作多过公司的未来表现。
只要有足够的煽动,一大群人甚至可以真的以为,黑色的确是白色的。包括17世纪30年代的荷兰郁金香狂热、南海泡沫、十字军东征等等,称不上是群众的智 慧,只能称上是群众的疯狂。(谢选骏指出:“群众的智慧”与“群众的疯狂”,一体两面。)加上1990年代末的达康热潮,和1950年代的不太知名,但更有趣的保龄球泡沫,当时投资者大力投资保龄球球玚,他们的计算居然是,全美每一个男女和小孩,一年52周每周打两小时的保龄球。金融市场也是群众的活动,只是根据凯因斯(John Maynard Keynes, 1883-1946),其自我修正的时间长到你不会有机会看到。
最后,索罗维基在《群众的智慧》指出,欧美政界抱怨投票率太低。但是若从经济学家的观点来看,令人困惑的应该是,为什么会“有人”肯去投票,因为想靠手中那一张票来改变选举结果的机会,几乎等于零。民主,作为一个群众的智慧之经典案例,可以是优于柏拉图主义的精英主义。民主的决策或许不是群众的智慧,可是决定采用民主这种方式来达成政策的事实,却证明了群众的智慧。(谢选骏指出:老生常谈。)

No comments:

Post a Comment