本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
. v8 l7 Y9 @) Y! x; A
# r _7 ^/ {$ B$ }严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 H2 C( K9 ^3 k 以下三个定义:
! b$ |7 _/ I! x& H: W 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ Y( \9 @5 _' L* V& n' _ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . U5 |5 G3 L4 v/ x) t1 r
所谓的双方优势策略则是指双方利益总和最大的策略。
\4 I& j- \4 j, S[编辑本段]严格优势策略举例分析; n; s( q& p* Z- P
一、经典的囚徒困境
9 Z& \( ^/ V2 N4 t 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 4 r% n6 Q- F3 ~
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
J9 \/ q! r- [/ b8 X5 [ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 W/ T, F6 y# L1 m8 R 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& j# T6 C6 ?9 {5 ?4 b 若二人都互相检举(互相“背叛”),则二人同样判监2年。6 x& [: ?* g; v6 B5 w0 X1 E4 R+ I8 D
+ P: Y F1 U" O9 B用表格概述如下:
: r$ s& ]3 H& z! |/ L
1 ~9 s0 k" Q. p' U; I9 C3 n( Q# H# o 甲沉默(合作) 甲认罪(背叛)
( Z! h1 q% e- d% A" ~6 [4 k乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" A* E( n) O3 l+ p2 {! U乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 g, z% ^% Y5 x+ ~3 @
0 h x( @- |0 `9 C) N
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" v" Z/ Y" }' ]# v; ` 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 l6 F$ G" i0 i( s$ ~" G
若对方沉默、背叛会让我获释,所以会选择背叛。 % R. U2 O9 a: A" ]
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
( ?/ ~. ~: m) ]# e2 G' ~4 X 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ z" l% A7 \9 ~& a3 w: W 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 $ f/ h0 ^0 ~8 o5 ~; n* {6 f; Q5 V
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. J3 D7 H7 a6 [
[编辑本段]二、智猪博弈理论
" ^ `( a7 b; a 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 u) r/ ^$ l7 F
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& u; u# ?" ?" j0 M( l _0 l 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ; M: c( _0 @, L5 t4 \4 Z3 V% N# q
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 7 s6 [( ]4 P/ _7 S
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * M* I8 _6 z4 _) c9 Y
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
$ h' ]2 b: ^3 i. a \ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
b: ]4 W/ g) N V; h5 p 6 t' g. R: Q8 n
三、关于企业价格策略8 R1 P$ N- o5 m i3 o
9 }' N- K! f; k, q: n g
4 ^# Q1 M( Q; V& i% `
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 i+ A U; l# N
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 E; X0 M# R/ @# q2 N) Q( Y/ C
以下三个定义:
" |2 l2 J% E; l/ E4 y8 Y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # }6 f E* h/ ~- y t
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ d; C* _( @( K# [( ?8 X) L H3 f 所谓的双方优势策略则是指双方利益总和最大的策略。 7 Z) D& w. ~4 E& r: ^: S6 Z
[编辑本段]严格优势策略举例分析3 h" }: d0 Z K8 _
一、经典的囚徒困境
) U& K# u% X5 U' e: Z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 C! B5 Y: u- P
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / U# B. L3 ?6 A# x( m1 W, S
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 8 M! N) P8 B9 F- N- M
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* U9 y( C) q: w) k' N 若二人都互相检举(互相“背叛”),则二人同样判监2年。
, h9 ]% s; K* R& l
( ^1 s2 T2 w7 O/ K/ X# ~用表格概述如下:
, R6 \8 q2 ]4 Z6 P Y- a6 }; j9 w1 K( d) A6 d8 w
甲沉默(合作) 甲认罪(背叛)
7 ?& ~7 k* `, t4 W乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 $ f2 d/ d8 w+ R$ Y$ a/ \( S
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 * [/ w) X# ~' `8 h( |' v
7 J& q' @. c8 e
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 " A4 w$ E. M; M4 |) H" `/ y) u- f
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" Z' Y* N4 B; o1 E, A' f' n 若对方沉默、背叛会让我获释,所以会选择背叛。 ! T6 ~0 W3 t9 |& b" ?
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( z/ B- G/ L5 \% Z# P2 A
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 j4 a, G6 D9 F6 l3 p& z
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 5 g1 D* S8 e( V* p
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 f8 {7 s; P) G2 T+ l
[编辑本段]二、智猪博弈理论
: ` w ?5 `* k% w& s; P$ D# Y 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
; Z# l! t& u5 k1 w 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& H0 y2 W" T4 O 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . Z+ D- c) G/ S
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 R4 }6 d9 V( C1 a, y P7 v “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
5 j; R- p1 H- p. | _+ J6 |: Q8 G 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ x8 H6 b# H, w( \0 h 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。+ ~) G$ i* G* C0 @' H
( n$ j7 I+ r2 m9 y/ B. m三、关于企业价格策略: M! @2 Q( d1 {) q+ i" J; D
4 G1 L5 f2 n4 j! |, ^ ( ~1 i4 i; W* x9 ~' q H. t5 Q
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? " _1 L- H( `) Z$ P) R
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);# o+ x6 c- n4 }) l, f# P3 E1 E; m
以下三个定义:
x. y8 ^8 a8 ~& U6 j' L 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , w! i8 h7 _8 z
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 " h8 O9 ^3 B7 U1 N' C, ?" X
所谓的双方优势策略则是指双方利益总和最大的策略。
$ F: e1 L1 b+ J5 b% r# P[编辑本段]严格优势策略举例分析3 o- Q& R. @4 M) p6 H8 M! O
一、经典的囚徒困境 2 p* m9 K( N- Z' _/ P: D
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 h1 }. o8 R6 N2 Y) _7 r) ^; i 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: h( w9 H# {9 U* ] 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( y Z, I+ E) i' l4 a+ F
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ P! d! a5 p4 e; n' [# j" r 若二人都互相检举(互相“背叛”),则二人同样判监2年。
+ k1 w8 O+ I$ P% X4 L . q* l8 o; Y& f3 [
用表格概述如下:' J$ A0 U9 A! G5 V
6 H7 E+ D2 g. m7 ~
甲沉默(合作) 甲认罪(背叛)
: S" M# A4 V; N- }. f( t乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
: d2 K( f( O+ A) x乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
3 m' o9 K+ U3 g& E( `- ]8 P+ Q) n1 m$ D: a
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
6 L: _- o8 y; p5 e4 [" o8 R* N 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" O4 q. W5 |. s0 X6 Y0 ]0 y 若对方沉默、背叛会让我获释,所以会选择背叛。
" e% n+ H O6 P 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" o2 M' F3 m% y5 s+ j% z) T 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & P8 r$ j: t. Y" z P* g5 a# M
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ; L% r; z3 e/ A- \8 i
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' m: Z$ @/ Q' q1 m[编辑本段]二、智猪博弈理论; s' b% A1 C, w. _
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 R; K& [" I3 N2 z. X' @
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 X8 s) d7 V0 j# m
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 Z+ U" N& m. m' `
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 9 B& c, `3 k; u( ] G4 ^
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 s+ s$ m \! Q% ~5 a 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) X# R( D% ~4 |% r; o; ?8 y5 p
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( ]' e6 O; r' N3 x2 ] 4 p0 y3 J6 h+ B& d' S3 G3 l5 g/ Q% y
三、关于企业价格策略
" I+ F9 r$ k! [! x i7 l' y2 A9 A3 n( i) R, }0 g8 O6 Z7 u
7 h v6 H q2 t 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
1 C3 o, I. p6 T) v1 I 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);: `, O7 a6 N3 ?$ A# p' G
以下三个定义:/ `; p2 u5 o- i" {3 Q: D' W4 J
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( U0 r* {2 a' [! x+ p& B6 X
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' S1 }2 ?; T3 m$ G& }/ E
所谓的双方优势策略则是指双方利益总和最大的策略。
9 x, a1 ]( a& z5 Q[编辑本段]严格优势策略举例分析. ^+ t6 P0 h- A+ W" q
一、经典的囚徒困境
3 }5 k9 o1 }' w 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 u( d) w. P/ U, n' S r6 ~7 E% a 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. i* G9 t1 i* ~% Q# ~5 Z 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( g& |* \' u( ~! M) A. n# f
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 3 f6 t$ L9 n. F) h' Z
若二人都互相检举(互相“背叛”),则二人同样判监2年。
( Y) B0 i5 M4 M% ? " E2 w8 L& r! p
用表格概述如下:
" f6 j3 V ~' _! P C6 U5 P9 i/ s i( T5 J6 ], ] E* A& t
甲沉默(合作) 甲认罪(背叛) \; t/ J* P) }( g" ]
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
3 q" R. g3 T( C. |* U乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
. ^% T# ^5 X; ^! E$ p2 ^3 G8 e) k& k% {0 v+ w( C9 M
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ u: G+ u! j" }$ Y
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 i. A) a! Y9 y+ A& N
若对方沉默、背叛会让我获释,所以会选择背叛。
; y+ X/ I# g9 s 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
! a5 `1 ~! i3 b$ |4 z+ z5 b 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% `( ]! A( v- _' ~* d. K 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% t! u9 D; S9 _! [5 ~ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。 ^! W, I+ a2 F- H
[编辑本段]二、智猪博弈理论
! o; W' a0 l% @ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 ~( H3 W4 O3 }2 F' O+ J. b
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! o0 i, l O# }/ N d- N! v; J7 a 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
7 }, L6 h; O: e& b! c! B 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " N& K: b4 Y/ C% _3 R: v
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 ], n) {) A0 x5 M$ ?% W 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
5 |7 b* K' N3 O1 M0 G1 H0 C# B3 F 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) S+ F& N/ k. ^1 N
3 A1 i- L' l) p三、关于企业价格策略7 L p4 k0 r! ~/ d( q$ r) ^
6 }/ w) Z o! p R0 e% K- T
& t, q- V7 v- m; }9 _3 O& P 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 7 T9 J0 ?2 F& Y' a' k
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |