声称的策略与实际的策略:言语博弈问题
有些博弈是“无声的”,而有些博弈是“有声的”。这有声的博弈可称之为言语博弈。如各国的外交声明,战争中或战争之前各方发布的真假策略(如在海湾战争中,伊拉克对美国说:如果你打我们的话,我们将向以色列发射导弹),都是言语博弈。在博弈论中有学者称之为信号博弈。
言语博弈涉及实际的策略决定和声称的策略决定。
如:当有人说“人不犯我,我不犯人;人若犯我,我必犯人”时,这含有什么意思呢?
如果“别人犯我,我不犯别人”的话,别人会不断地犯我,我将不断地受到侵犯——这是我所不希望的;如果“别人不犯我,我犯别人”的话,我不犯人的时候别人也会来犯我——这也不是我所期望的。因此,“人不犯我,我不犯人;人若犯我,我必犯人”的策略是我的好的策略。其价值是由理性的我出于利己的动机来规定的。这是策略决定。
同时,这个策略的说出本身有“传达”的功能:你不要犯我,否则我肯定犯你;你不犯我,我也不会犯你。语言哲学中有人认为,语言本身就是行动(speech act)。这里行动者就是将行动的可能策略告诉对方,目的是使双方避免出现不希望的结果,而首先是为了自己的目的。
如美国声称,如果中国武力攻打台湾的话,美国将介入。这是美国声称的策略。美国通过这言语上的声明,目的是为了恐吓中国政府。而中国政府同样以言语回击:是否以武力收复台湾是中国的内政,美国无权干预。言下之意,如果美国干预的话,美国和中国将发生战争。如果中国政府真的武力攻打台湾以实现国土统一,美国真的会介入吗?这是中国政府所要考虑的问题,即要弄清美国届时实际的策略是什么。而美国也要考虑,一旦战争打起来,美国如果干预的话,中国会向美国开战吗?
因此要分清行动者真正的策略决定与声称的策略决定。真正的策略决定,我们说是规定真的,因为它是行动者从利己的角度确定的,行动者没有理由确定对自己不利的策略决定。而声称的策略决定本身也是一种策略,或者说本身是一种决定了的行动。行动者通过这个行动来达到某种目的。
可以这么认为:“人不犯我,我不犯人;人若犯我,我必犯人”是一种声称的策略决定。而“如果天下雨,我将带伞”则是真正的策略决定。
怎么区分这两种决定呢?
声称的策略决定首先是一种语言行动,而真正的策略决定不是一种语言行动。声称的策略决定是行动者向其他行动者说出去的一种行为,它是行动者的一种行动。而真正的策略决定是不是需表达出来的,其他行动者有可能知道也有可能不知道,并且有时这种真正的策略决定是保密的。
其次,声称的策略决定与真正的策略决定可以相同也可以不同。行动者的真正的策略决定是利益最大化得来的,只要社会的逻辑结构或博弈结构给定,行动者就会有自己的策略决定。囚徒困境中,被警察抓到的囚徒——行动者或博弈方,在警察给了他们的支付矩阵后,他们就会分析出自己的策略决定,即:无论对方招认还是不招认,他的最优策略是招认。
言语博弈中的“威胁”与“承诺”
在现实中,我们经常看到声称的策略决定,但是这些声称的策略可信吗?
声称的策略包括“威胁”与“承诺”。美国和中国在台湾问题上的言语博弈就是威胁的。而在国际核武器问题上,我国及其他一些国家承诺“不首先使用核武器”就是一种言语承诺。
博弈论中,经常用“可置信”和“不可置信”的“威胁”或“承诺”来区分行动者说出来的策略,我们在对动态博弈的分析中会分析什么样的策略是可置信的,什么样的策略是不可置信的。而分析“威胁”或“承诺”是可置信的还是不可置信的方法是倒推法。
倒推法(backward induction)也叫逆向归纳法。那么什么是倒推法?
要理解什么是倒推法,先来看一下商界里经常见到的博弈。
在某个城市假定只有一家房地产开发商A,我们知道任何没有竞争下的垄断利润是很高的,假定A此时每年的垄断利润是10亿元。
现在假定有另外一个企业B,准备从事房地产开发。面对着B要进入其垄断的行业,A想:一旦B进入,A的利润将受损很多,B最好不要进入。所以A向B表示,你进入的话,我将阻挠你进入。假定当B进入时A阻挠的话,A的利润降低到2,B的利润是1。而如果A不阻挠的话,A的利润是4,B的利润也是4。
现在让我们回到房地产开发商之间的博弈问题。A的最好结局是“B不进入”,而B的最好结局是“进入”而A“不阻挠”。这两个最好的结局不能构成均衡。那么结果是什么呢?
A向B发出威胁:如果你进入,我将阻挠。而对B来说,如果进入,A真的阻挠的话,它将受损失1(假定1是它的机会成本),当然此时A也有损失。对于B来说,问题是:A的威胁可置信吗?
B通过分析得出:A的威胁是不可置信的。原因是:当B进入的时候,A阻挠的收益是2,而不阻挠的收益是4。4》2,理性人是不会选择做非理性的事情的。也就是说,一旦B进入,A的最好策略是合作,而不是阻挠。因此,通过分析,B选择了进入,而A选择了合作。双方的收益各为4。
在这个博弈中,B采用的方法为倒推法,或者说逆向归纳法,即:当参与者作出决策时,他要通过对最后阶段的分析,准确预测对方的行为,从而确定自己的行为。
在这里,双方必须都是理性的。如果不满足这个条件,就无法进行分析了。
这个例子只是简单的两阶段博弈,而三阶段或更多阶段的博弈,可用同样方法加以分析。
在动态博弈中,涉及“威胁”与“承诺”是不是可信的问题。静态地看,一博弈存在许多均衡。
因此,阻挠,不进入的纳什均衡点得以淘汰,在动态博弈中一个新的均衡——子博弈精练纳什均衡——得以实现。子博弈精练纳什均衡的定义及分析,归功于另一位诺贝尔经济学奖获得者塞尔屯(Selton)。
这里分析的是完全且完美信息下的动态博弈。所谓完全信息是指:博弈的支付函数是“公共知识”(我们在第一部分叙述了公共知识的含义)。本书中未涉及不完全信息的博弈问题,如囚徒困境这样的静态博弈也是完全信息博弈。完美信息是针对动态博弈而言的,指参与者知道博弈的所有历史。
倒推法是动态博弈中有用的工具,它可以说是理性的人自然的推理方式。然而倒推法面临着一个困难,这就是蜈蚣博弈的悖论。(参见第六章)
上面我们分析了“威胁”是否可信,下面我们可分析“承诺”是否可信。“不首先使用核武器”的承诺可信吗?这个承诺是针对常规战争而言的,即:只要大家都运用常规武器进行战争,那么承诺者将不首先使用核武器。在常规战争下不涉及国家生死存亡的时候,这个承诺是可信的。因为如果承诺者首先使用核武器,将使他国也对它使用核武器,这样一来,它会因首先使用核武器而带来更大的灾祸。但是,如果在常规战争中某国面临着被消灭的危险时,它还不首先使用核武器吗?在这种情况下,使用核武器有可能挽救这个国家,而不使用,则该国肯定灭亡,即使用的好处大于不使用的好处。因此,这个承诺在一个国家面临灭亡的时候将是不可信的。
空口声明博弈
在博弈论中存在另外一种言语博弈,英文叫cheep talk。cheep talk 可翻译成“空口声明”,它是一口头表态,发话者说出某些话语无需某些成本,也无须承担某些责任,它不是“威胁”也不是“承诺”,但发话者说出它是有目的的。听者要分析他话中的含义,即要分析cheep talk是真还是假。
如:某人应聘某职位时,他会说“我的能力很高”,这就是cheep talk。他的目的是为
了能应聘得上或者说是为了获取高工资,他说出这样的话是无需成本的,每个应聘者都可以这么说。而雇主则要弄清这些应聘者的cheep talk中哪个是真的哪个是假。
明天太阳必然能升起吗?
——归纳推理的合理性问题人有两种推理方式:一是演绎的,二是归纳的。
由前提真必然地推出结论真就是演绎推理。这是逻辑或传统逻辑研究的对象。古希腊哲学家亚里士多德确定了三段论推理形式如:
大前提:所有人皆要死;
小前提:张三是人;
结论:张三要死。
再比如:
大前提:所有的爬行动物是用肺呼吸的。
小前提:蛇是爬行动物。
结论:所以蛇是用肺呼吸的。
只要前提真,推理过程无误,演绎推理的结论就是真的。演绎推理是由某个普遍性的原理推出某种特殊的结论。这个结论其内容不会超过前提蕴含的内容。数学就是演绎性的。
不仅有演绎推理,同时还有归纳推理。如:
前提1:张三要死;
前提2:李四要死;
结论:所有人都要死。
又如:
前提1:蛇是用肺呼吸的;博弈生存博弈生存博弈生存博弈生存归纳推理的合理性问题前提2:鳄鱼是用肺呼吸的;
结论:所有的爬行动物都是用肺呼吸的。
这种由个别性的真的现象或前提推导出普遍性的结论就是归纳推理。
归纳出来的普遍性的结论不是必然真的,而是归纳真的,或者说是“或然真的”,即:结论可能是真的,也可能是假的。
归纳推理是跳跃的,结论的内容超出前提的内容。当然,这种跳跃性的过程是可质疑的。大哲学家休谟批判人们的归纳没有合理性,只是人的习惯联想而已。因为没有逻辑的理由来证明归纳法。
演绎与归纳在人的认识与行动中起着重要作用,哲学家在研究它们的作用。
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。
赞一下
添加书签加入书架