康曉光:作為內(nèi)生博弈規(guī)則的精英聯(lián)盟——關(guān)于當(dāng)前中國大陸政治結(jié)構(gòu)的博弈論解釋
發(fā)布時間:2020-06-02 來源: 短文摘抄 點擊:
一、問題的提出
在分析改革以來中國大陸的政治發(fā)展模式和政治穩(wěn)定問題的3篇文章中,我指出,20世紀(jì)90年代中后期,在中國大陸,市場經(jīng)濟體制已經(jīng)取代了計劃經(jīng)濟體制,為了支持市場的有效運行,政府賦予公眾“消極自由”,相應(yīng)地,權(quán)威主義政治取代了毛時代的極權(quán)主義政治。
與此同時,市場也造就了新的社會集團并改變了各個集團的相對地位。經(jīng)濟精英和知識精英崛起,進入社會上層,而工人和農(nóng)民則淪入社會底層。制度和群體組成的變化對統(tǒng)治者提出了挑戰(zhàn)。他們必須重新回答“誰是我們的敵人,誰是我們的朋友”這一“統(tǒng)治的首要問題”。
統(tǒng)治集團的回答是建立精英聯(lián)盟,即政治精英與經(jīng)濟精英和知識精英結(jié)成聯(lián)盟,而精英聯(lián)盟的機制可以概括為“行政吸納政治”。我還運用這一模型解釋了這一時期中國大陸政治穩(wěn)定的原因,并分析了市場、權(quán)威主義政治和精英聯(lián)盟如何造就了威脅政治穩(wěn)定的因素。
在改革之前和整個改革過程中,政府始終保持了高度的自主性,也就是說,它沒有成為任何社會集團的“俘虜”。它凌駕于所有集團之上,對全社會實行權(quán)威主義統(tǒng)治。政治精英不但剝奪了大眾的政治權(quán)利,也剝奪了社會精英的政治權(quán)利。那么,為什么日益壯大的社會精英會接受或默認這種權(quán)威主義政治秩序呢?這是因為統(tǒng)治集團向他們提供了經(jīng)濟賄賂,甚至做出了適當(dāng)?shù)恼巫尣。通過掠奪大眾的經(jīng)濟利益并與社會精英分享掠奪成果,政治精英不但滿足了自己的利益要求,也滿足了社會精英額外的經(jīng)濟利益。這是社會精英同意放棄政治權(quán)利的根本原因!皠儕Z弱者,滿足強者”是精英聯(lián)盟的本質(zhì)。實際上,精英聯(lián)盟也就是分贓聯(lián)盟。
那么,精英聯(lián)盟是偶然的,還是具有某種必然性?是統(tǒng)治者強加于社會的,還是所有參與者共同締造的?是統(tǒng)治者愚民政策的成果,還是在完全信息環(huán)境中所有參與者共同選擇的結(jié)果?是人為的設(shè)計,還是自發(fā)的秩序?是穩(wěn)定的,還是不穩(wěn)定的,而失去穩(wěn)定的條件又是什么?本文將運用博弈理論探討上述問題。我將在Weingast和青木昌彥的研究成果的基礎(chǔ)上開展工作,并期望這種努力能夠進一步深化我們對中國大陸現(xiàn)行政治結(jié)構(gòu)的理解。
二、構(gòu)造博弈論模型
本文將運用完全信息動態(tài)博弈理論尋求對精英聯(lián)盟的解釋。為此,需要確定動態(tài)博弈的擴展式表述,即確定博弈的參與者集合、參與者的行動順序、參與者的行動集合、參與者的信息集、參與者的報酬函數(shù)。
參與者集合
這場博弈的參與者包括政府(也可以稱之為“政治精英”或“統(tǒng)治集團”)P 、社會精英(包括經(jīng)濟精英和知識精英)E 、社會大眾M.
把社會成員劃分為統(tǒng)治集團、社會精英和大眾,其依據(jù)是各個集團與現(xiàn)實政治秩序的利益關(guān)系及其挑戰(zhàn)現(xiàn)實政治秩序的動機和能力。而且,這種劃分方法也適合下面將要展開的分析的需要。這正是我從眾多的相互競爭的群體分類模式中選擇這種三元(統(tǒng)治集團/社會精英/大眾)分類模式的主要原因。
關(guān)于參與者有兩個重要假設(shè):第一,參與者都是追求自身利益最大化的理性經(jīng)濟人。第二,參與者擁有關(guān)于這場博弈的“完全信息”。這意味著,每個參與者都知道大家都是“理性經(jīng)濟人”,都會按照同樣的邏輯思考和選擇,都知道其他參與者的行動順序和行動集合,都知道每個參與者過去的選擇情況,也都知道博弈的報酬函數(shù)。更為重要的是,每個參與者還知道其他參與者也了解這些信息,而且知道它們也知道它也了解這些信息。
行動順序
假定參與者的行動順序為,政府首先做出選擇,然后精英做出選擇,最后大眾做出選擇。
無論是改革之初,還是在整個改革過程中,在力量對比格局中,政府始終處于絕對優(yōu)勢地位,所以,假設(shè)政府最先出牌是合理的。
設(shè)G1為按照“政府→精英→大眾”順序行動的博弈模型,G2為按照“政府→大眾→精英”
順序行動的博弈模型,而且G1與G2的唯一區(qū)別是參與者的行動順序。下面我們僅僅對G1展開分析。但是,只要對G2重復(fù)同樣的分析,就可以發(fā)現(xiàn)兩種分析結(jié)果并沒有“實質(zhì)性差異”。
所以說,在我們的模型中,精英和大眾誰先出牌并不重要。
行動集合
為了定義“剝奪”,需要確定一個基準(zhǔn)狀態(tài),如諾奇克所謂的“最小政府”。這個“最小政府”也可以理解為亞當(dāng)?斯密的“守夜人”。為維持一個“最小政府”,社會必須向政府提供必要的利益。
但是,在“必要利益”之外,政府還有可能追求更多的利益,即“額外利益”。為了追求額外利益,政府需要剝奪大眾或精英的經(jīng)濟或政治利益。政府共有4種可行的行動,即S1={不剝奪精英,不剝奪大眾}、S2={不剝奪精英,剝奪大眾}、S3={剝奪精英,不剝奪大眾}、S4={剝奪精英,剝奪大眾}.現(xiàn)在,不考慮“賄賂”行動。
精英和大眾的策略包括“反抗”或“默認”,C={反抗},A={默認}.
信息集
假設(shè)每個參與者都知道所有參與者過去的選擇情況。這意味著,在動態(tài)博弈的任一階段,在該階段采取行動的參與者對博弈的各個方面都是“完全知情”的,只有那些將在以后發(fā)生的情況除外。
報酬函數(shù)
在最小政府狀態(tài)下,設(shè)T 為政府獲得的必要利益,Γe 為精英的收益,Γm 為大眾的收益。
設(shè)Tp為精英或大眾被政府剝奪的政治利益。政府獲得的額外政治利益等于精英和大眾的損失之和。一般來說,在權(quán)威主義政治中,Tp是政府的“當(dāng)然權(quán)利”,所以下面的討論局限于對經(jīng)濟利益的剝奪。
設(shè)Te為政府追求的額外經(jīng)濟利益。
Ce為精英遭到政府剝奪時進行反抗的代價。Cm為大眾遭到政府剝奪時進行反抗的代價。
Ces 為精英反抗時政府付出的代價,Cms 為大眾反抗時政府付出的代價,Ci為政府采取行動Si(i=1、2、3、4)時精英和大眾共同反抗時政府付出的代價。
注意:第一,只有在與“被剝奪的額外利益”進行比較時“反抗的代價”才有意義。第二,Ce、Cm、Ces 、Cms 是“政府的鎮(zhèn)壓能力”和“被統(tǒng)治者的反抗能力”的函數(shù)。當(dāng)其他條件相同時,政府的鎮(zhèn)壓能力越強,被統(tǒng)治者反抗的代價(Ce、Cm)越大,政府為鎮(zhèn)壓而付出的代價(Ces 、Cms )越小。同樣,當(dāng)其他條件相同時,被統(tǒng)治者的反抗能力越強,其反抗的代價(Ce、Cm)越小,而政府的鎮(zhèn)壓成本(Ces 、Cms )越高。
假設(shè)精英集團與大眾集團無法事前達成可信的私下交易。這個假設(shè)對于中國大陸是完全合理的。這是因為,兩個集團的規(guī)模都太大,根據(jù)奧爾森的集體行動理論,很難組織有效的集體行動,而且,更為重要的是,權(quán)威主義政府幾乎剝奪了公眾組織集體行動的一切手段。
首先,考慮政府選擇{不剝奪精英,不剝奪大眾}時的報酬函數(shù)。注意,無論是“剝奪”
還是“不剝奪”都僅僅指“額外的經(jīng)濟利益”,而不包括“額外的政治利益”。再強調(diào)一次,一般情況下,我們把“額外的政治利益”視為權(quán)威主義政府的“當(dāng)然權(quán)利”。如果精英和大眾同時反抗,則反抗成功,政府不但得不到“額外利益”,還要付出代價C1,所以政府的收益為T ?C1.同時,由于精英和大眾都未受到剝奪,但要為反抗付出代價,所以兩者的收益分別為Γe ?Ce和Γm ?Cm.如果精英反抗而大眾默認,則反抗無效,政府剝奪兩者的政治權(quán)利2Tp ,同時付出代價Cse ,收益為T+2Tp ?Cse ;
而精英喪失政治權(quán)利Tp,并付出代價Ce,收益為Γe ?Ce?Tp;
大眾則僅僅喪失政治權(quán)利Tp,收益為Γm ?Tp.同理,可以得到精英默認而大眾反抗的報酬函數(shù)值。如果精英和大眾都采取默認,則政府不負任何代價剝奪兩者的政治權(quán)利2Tp ,收益為T+2Tp ;
而精英和大眾也僅僅失去自己的政治權(quán)利Tp,收益分別為Γe ?Tp和Γm ?Tp.
政府選擇{不剝奪精英,不剝奪大眾}時的報酬函數(shù)
在討論政府選擇S2的報酬函數(shù)之前,先討論一下精英和大眾各自的“反抗”行為。假設(shè)精英的反抗能力遠遠大于大眾,大眾不可能成功地單獨反抗政府,但只要精英“全力反抗”,即使沒有大眾的配合,政府的剝奪行動也將失敗。再假設(shè)精英只有在自己的“額外經(jīng)濟利益”
受到剝奪的時候,才會“全力反抗”,而當(dāng)大眾受到剝奪時,精英的反抗將會“打折扣”。
中國大陸的現(xiàn)實支持這一假設(shè)。由于政府壟斷了暴力和集體行動資源,所以除了政治精英以外,其他社會集團都處于“一盤散沙”狀態(tài),社會精英和大眾只能采取消極反抗,無法組織有效的積極反抗。大眾的消極反抗手段極為有限,非經(jīng)濟性手段包括上訪、靜坐、罷工、游行、盜竊、殺人、破壞,經(jīng)濟性手段包括罷工和怠工。但是,政府可以輕易制服大眾的非經(jīng)濟性手段。大眾危害經(jīng)濟業(yè)績的能力也極為有限。他們是無產(chǎn)者或小自耕農(nóng),必須千方百計出賣自己的勞動力以求維持生存。因此,除了好好干活,他們唯一的選擇就是挨餓。但是,精英就不同了。經(jīng)濟精英可以拒絕參與經(jīng)濟活動,如停止投資、向海外轉(zhuǎn)移資產(chǎn)等等。經(jīng)濟全球化進一步強化了他們的權(quán)力。知識精英特別是其中的專業(yè)人士對現(xiàn)代經(jīng)濟運行的業(yè)績具有直接的影響,而且知識精英可以干預(yù)輿論、鼓動學(xué)生鬧事、甚至自己上街鬧事。所以,精英的消極反抗會對經(jīng)濟發(fā)展產(chǎn)生直接的、顯著的負面影響。如今,官方意識形態(tài)已經(jīng)失去了提供合法性的作用,政府的合法性嚴(yán)重依賴于經(jīng)濟增長業(yè)績。對于政府來說,經(jīng)濟衰退或停滯無異于滅頂之災(zāi)。這意味著,精英的消極反抗可以給政府造成極大的損害。
現(xiàn)在考慮政府選擇{不剝奪精英,剝奪大眾}時的報酬函數(shù)。如果精英和大眾同時反抗,則反抗成功,政府的收益為T ?C2,而精英和大眾的收益分別為Γe ?Ce和Γm ?Cm.如果精英反抗而大眾默認,由于精英自己沒有受到剝奪,所以不會“全力反抗”,其結(jié)果是政府只能從大眾那里奪得一部分Te,如λTe,0<λ<1.當(dāng)然,政府會成功地剝奪精英和大眾的政治利益2Tp ,但要付出代價Cse ,其收益為T+λTe+2Tp?Cse.相應(yīng)地,精英喪失政治權(quán)力Tp,并付出反抗代價Ce,收益為Γe ?Ce?Tp.大眾喪失政治權(quán)力Tp和經(jīng)濟權(quán)利λTe,收益為Γm ?λTe?Tp.如果大眾反抗而精英默認,則反抗失敗,政府成功地剝奪大眾的Te,同時還剝奪大眾和精英的2Tp ,但要付出代價Csm ,其收益為T+Te+2Tp?Csm.而精英僅僅失去Tp,收益為Γe ?Tp.大眾不但失去Tp和Te,還要徒勞地付出反抗的代價Cm,其收益為Γm ?Cm?
Te?Tp.如果精英和大眾都放棄反抗,則政府同時剝奪兩者的政治權(quán)利2Tp ,并從大眾那里掠奪經(jīng)濟利益Te.
政府選擇{不剝奪精英,剝奪大眾}時的報酬函數(shù)
下面,考慮政府選擇{剝奪精英,不剝奪大眾}時的報酬函數(shù)。S2與S3的區(qū)別在于被剝奪的是精英而不是大眾。如果精英和大眾同時反抗,則反抗成功,政府、精英、大眾的收益分別為T ?C3、Γe ?Ce、Γm ?Cm.如果精英反抗而大眾默認,注意此時精英自己受到剝奪,所以它將“全力反抗”,其結(jié)果是政府的剝奪行動失敗。在這種情況下,政府得到2Tp ,但付出代價Cse ,收益為T+2Tp ?Cse ;
精英保住了Te,失去Tp,付出反抗代價Ce,收益為Γe ?Ce?Tp;
而大眾僅失去Tp,收益為Γm ?Tp.如果精英默認而大眾反抗,則反抗失敗,政府得到2Tp 和Te,但要付出代價Csm ,收益為T+Te+2Tp?Csm.精英同時失去Tp和Te,收益為Γe ?Te?Tp.而大眾將失去Tp,并付出代價Cm,收益為Γm ?Cm?Tp.如果精英和大眾都選擇默認,則政府的收益與S2相同,但是與S2相比,精英將多失去Te,而大眾則少失去Te.
政府選擇{剝奪精英,不剝奪大眾}時的報酬函數(shù)
最后,我們考慮政府選擇{剝奪精英,剝奪大眾}時的報酬函數(shù)。假設(shè)政府分別剝奪精英和大眾規(guī)模為Te的經(jīng)濟利益。按照上述邏輯,我們可以得到這種情況下的報酬函數(shù)值。
政府選擇{剝奪精英,剝奪大眾}時的報酬函數(shù)
在此,討論一下T ?C1、T ?C2、T ?C3、T ?C4的關(guān)系?梢院侠淼丶僭O(shè),在不同的情況下,政府為應(yīng)付反抗而付出的代價是不同的,(點擊此處閱讀下一頁)
這種代價應(yīng)該與反抗的強度成正比,而反抗的強度又應(yīng)該與被剝奪的強度成正比。所以有C1T ?C2>T?C3>T?C4.
三、求解模型
我們所構(gòu)造的博弈模型是一個有限完美信息博弈。Zermelo 和Kuhn證明,一個有限完美信息博弈有一個純戰(zhàn)略納什均衡。對于有限完美信息博弈來說,逆向歸納法是尋找子博弈精煉納什均衡的最簡便的方法。
在動態(tài)博弈過程中,在每一個決策結(jié)上,參與者在權(quán)衡各種可行行動的成本和收益的基礎(chǔ)上做出自己的選擇。具體來說,精英將根據(jù)Ce與Tp、Te、Tp+Te 的關(guān)系進行決策,而大眾則根據(jù)Cm與Tp、Tp+λTe、Tp+Te 的關(guān)系進行決策。為了尋找子博弈精煉納什均衡,首先,以Ce為橫軸,以Cm為縱軸,做一個二維笛卡爾坐標(biāo)系。然后,用水平線Cm=Tp 、Cm=Tp+λTe、Cm=Tp+Te和垂直線Ce=Tp 、Ce=Te 、Ce=Tp+Te把第一象限劃分為一些小區(qū)域。最后,運用逆向歸納法分別尋找每一個小區(qū)域內(nèi)的子博弈精煉納什均衡。
全面掠奪型權(quán)威主義國家
在第一類情況下,子博弈精煉納什均衡為{S4,A ,A},即政府選擇{剝奪精英,剝奪大眾}、精英選擇{默認}、大眾選擇{默認}.政府剝奪所有人的政治和經(jīng)濟權(quán)利,而被剝奪者則保持沉默。我把這種情況稱之為“全面掠奪型權(quán)威主義國家”。
“全面掠奪型權(quán)威主義國家”出現(xiàn)的條件是:Ce>Tp+Te,或者Cm>Tp+Te并且Tp當(dāng)Ce>Tp+Te時,精英反抗政府剝奪的代價(Ce)高于因反抗而避免的損失(或默認政府剝奪時所受的損失)(Tp+Te ),因此無論大眾采取什么行動,精英的最優(yōu)選擇都是放棄反抗。由于精英放棄反抗,加之大眾的單獨反抗是無效的,因而無論大眾的態(tài)度如何,政府都可以放心大膽地掠奪所有的社會成員。
當(dāng)Cm>Tp+Te時,大眾反抗政府剝奪的代價(Cm)高于因反抗而避免的損失(或默認政府剝奪時所受的損失)(Tp+Te ),因此無論精英采取什么行動,大眾的最優(yōu)選擇都是默認。由于精英單獨反抗最多可以保住Te,但必須付出代價Ce,又由于Te由此可見,只要與被剝奪的利益相比反抗的成本足夠高,被剝奪者就將默認剝奪,而政府就可以肆無忌憚地掠奪。
掠奪大眾型權(quán)威主義國家
在第二類情況下,子博弈精煉納什均衡為{S2,A ,A},即政府選擇{不剝奪精英,剝奪大眾}、精英選擇{默認}、大眾選擇{默認}.我把這種情況稱之為“掠奪大眾型權(quán)威主義國家”。
“掠奪大眾型權(quán)威主義國家”出現(xiàn)的條件是:TpTp+λTe.
當(dāng)Tp當(dāng)CeTp+λTe,即大眾與精英同時反抗的代價(Cm)大于因此而避免的損失(Tp+λTe),所以大眾不會與精英同時反抗政府。由于精英單獨反抗既不能保住Tp,又要付出代價Ce,所以在這種情況下,精英的最優(yōu)選擇還是默認。其結(jié)果是政府可以安全地剝奪大眾。
需要說明的是,在區(qū)域10和區(qū)域11中,{S3,A ,A}也是子博弈精煉納什均衡。當(dāng)存在多個均衡解時,政府可以在其中任選其一?紤]到政府傾向于保持策略的連續(xù)性,因此可以合理地假設(shè)它將選擇{S2,A ,A}.
最小權(quán)威主義國家
在第三類情況下,子博弈精煉納什均衡為{S1,A ,A},即政府選擇{不剝奪精英,不剝奪大眾}、精英選擇{默認}、大眾選擇{默認}.政府滿足于剝奪精英和大眾的政治權(quán)利,而不會剝奪它們的經(jīng)濟權(quán)利。我把這種情況稱之為“最小權(quán)威主義國家”。
“最小權(quán)威主義國家”出現(xiàn)的條件是:Tp當(dāng)Ce如果政府放棄剝奪大眾的經(jīng)濟利益,即選擇S1,由于Tp權(quán)威主義崩潰
在第四類情況下,精英和大眾將為保護自己的政治利益而聯(lián)合反抗政府,而政府又無力鎮(zhèn)壓這種全民反抗,于是權(quán)威主義政治終結(jié)。我把這種情況稱之為“權(quán)威主義崩潰”。
“權(quán)威主義崩潰”出現(xiàn)的條件是:Cm當(dāng)Ce精英勾結(jié)型權(quán)威主義國家
當(dāng)Ce只要Te>Tp ?Ce,政府就可以從取自大眾的經(jīng)濟利益(Te)中拿出一部分(Δ)分給精英,使得Te >Δ>Tp ?Ce.此時,新的報酬函數(shù)為
由于Te >Δ>Tp ?Ce,所以Δ?Tp>?Ce,所以Γe+Δ?Tp >Γe ?Ce.對于精英來說,這意味著,{受賄并默認}要比{反抗}更好。這樣一來,政府通過賄賂精英消弭了精英反抗的動機,而精英收受賄賂在之后也就會默認政府對大眾進行掠奪。于是,{{賄賂精英,剝奪大眾},精英受賄并默認,大眾默認}就是一個新的子博弈精煉納什均衡。其對應(yīng)的報酬函數(shù)的值為{T+Te?Δ+2Tp,Γe+Δ?Tp,Γm ?Te?Tp }.
歷史現(xiàn)實可以幫助我們理解精英勾結(jié)型權(quán)威主義國家出現(xiàn)的機制。隨著市場和經(jīng)濟的發(fā)展,精英的勢力日益膨脹。當(dāng)精英的實力足夠大時,一方面,他們具有較強的反抗政府的能力,或者說,反抗政府的代價較小,即Ce較小,另一方面,他們對政治權(quán)利的要求較強,即Tp較大,于是就會出現(xiàn)Ce在此前的3篇文章中,我已經(jīng)描述了統(tǒng)治集團“賄賂”社會精英的具體形式。例如,通過不斷推進市場化改革,實施鼓勵經(jīng)濟發(fā)展的政策,禁止獨立工會,壓制輿論,降低環(huán)境標(biāo)準(zhǔn),政府為經(jīng)濟精英創(chuàng)造了最有利的賺錢環(huán)境。通過錢權(quán)勾結(jié)和裙帶關(guān)系,政治腐敗還為經(jīng)濟精英創(chuàng)造了可觀的非法獲利渠道,如侵吞國有資產(chǎn)、偷稅漏稅、走私、騙匯、生產(chǎn)和銷售假冒偽劣產(chǎn)品等等。此外,通過吸收入黨,安排進入政府、人大和政協(xié),資本家和經(jīng)理們的“面子”(政治地位的象征)也得到相當(dāng)程度的滿足。再如,通過提供適當(dāng)?shù)难哉摽臻g,進入官僚系統(tǒng)和經(jīng)商的機會,大幅度提高工資,高標(biāo)準(zhǔn)的就業(yè)、醫(yī)療、退休保障,政府也滿足了知識精英的利益訴求。需要指出的是,這些賄賂形式并非都是統(tǒng)治者處心積慮的設(shè)計,有的屬于無意為之,有的甚至是無可奈何的妥協(xié)或權(quán)宜之計。
其他可能情況
如果政府垮臺會導(dǎo)致社會失去秩序,陷入全面混亂,其結(jié)果是全社會都遭殃,而不僅僅是政府遭殃。對應(yīng)的報酬函數(shù)的值為{T ?C ∞,Γe ?C ∞,Γm ?C ∞}.C ∞表示一種無法承受的代價。而且所有參與者都明確地了解這一點,即形成為一種社會共識。那么,不但是政府,而且精英和大眾都將極力避免共同反抗局面的出現(xiàn),結(jié)果是共同反抗不會出現(xiàn)。我把這種情況稱之為“政府綁架社會”。在這種情形下,政府就可以為所欲為。因此,聰明的政府總是極力制造自己是秩序的唯一提供者的“共享信念”。
如果精英和大眾都已經(jīng)高度組織化,就存在雙方達成事前協(xié)議的可能性。在這種情況下,被剝奪的一方可以要求另一方和它一起聯(lián)合抵制政府,事成之后,它將給后者支付補償。在這種情況下,政府將放棄剝奪行為,轉(zhuǎn)型成為“最小權(quán)威主義國家”。
如果Ce如果精英和大眾的實力旗鼓相當(dāng),則政府或是同時剝奪兩者;
或是任選其一進行剝奪,而不剝奪另一個;
或是任選其一進行剝奪,同時賄賂另一個;
或是放棄任何剝奪企圖。根據(jù)North 、Weingast和青木昌彥,在這種情況下,也許會出現(xiàn)“民主型國家”或“社會契約的民主型國家”。
如果大眾的實力超過精英,則大眾將取代上述分析中精英的位置。如果CmTp?Cm,則政府將剝奪精英,并向大眾行賄。這意味著,建立社會保障制度或俾斯麥型的福利國家。
我們可以進一步放寬研究的視野。例如,“精英”可以進一步劃分為“經(jīng)濟精英”和“知識精英”。這樣一來,參與者集合擴大了。但是,只要模型仍然是有限完美信息動態(tài)博弈,就可以運用同樣的方法求解,只不過求解的過程稍微復(fù)雜一點而已。
只要重新定義參與者、行動策略和報酬函數(shù),模型可以適用于計劃時期的中國大陸。例如,可以用“城市”(或“工業(yè)部門”、“市民集團”)代替“精英”,用“農(nóng)村”(或“農(nóng)業(yè)部門”、“農(nóng)民集團”)代替“大眾”等等。根據(jù)同樣的邏輯,我們可以發(fā)現(xiàn),政府將傾向于采取{不剝奪城市,剝奪農(nóng)村}或{賄賂城市,剝奪農(nóng)村}策略。同樣,經(jīng)過適當(dāng)調(diào)整,我們的模型也可以分析建國前后的“土地改革”和“社會主義改造”運動。在這種情況下,“精英”可以是“地主”、“資產(chǎn)階級”或“知識分子”。根據(jù)同樣的邏輯,我們可以發(fā)現(xiàn),在計劃體制下或為了建立計劃體制,政府必然傾向于選擇{剝奪精英,不剝奪大眾}或{剝奪精英,賄賂大眾}策略。
四、博弈論模型傳達的信息
本文所作的一切,不是為了把已有的思想“翻譯”為數(shù)學(xué)語言,即僅僅用博弈論術(shù)語重新表述過去的思想。實際上,這種分析能夠為我們提供許多重要的“新知識”。它不但可以幫助我們加深對現(xiàn)行政治結(jié)構(gòu)的理解,也可以加深我們對政治演變歷史的理解。
改革之初,在計劃體制下,政府實施的是{賄賂城市,剝奪農(nóng)村}策略。從計劃到市場的經(jīng)濟轉(zhuǎn)型徹底改變了博弈的外生規(guī)則。參與者變了,報酬函數(shù)也變了。在20世紀(jì)80年代,相對于毛時代,政府采取了{不剝奪精英,不剝奪大眾}策略。這一策略的另一種標(biāo)準(zhǔn)表述形式為“放權(quán)讓利”,即政府同時降低了對精英和大眾的剝奪程度。但是,由于市場化改革帶來了巨大的增長效應(yīng),這一時期,政府的收益并沒有因為“放權(quán)讓利”而減少。這是一個“三贏時代”,即政府、精英、大眾的收益同時提高。由于受到“八九風(fēng)波”的刺激,90年代初期,政府轉(zhuǎn)而實行“全面剝奪”策略。但是,這一策略很快就被它的制定者主動放棄了。在全球化時代,對于一個嚴(yán)重依賴經(jīng)濟增長為自己提供合法性的政府來說,剝奪精英無異于自取滅亡。于是,90年代中期以后,聰明的政府轉(zhuǎn)而采取{賄賂精英,剝奪大眾}策略,即統(tǒng)治集團與社會精英勾結(jié)起來掠奪大眾。這樣一來,中國大陸就演變?yōu)椤熬⒐唇Y(jié)型權(quán)威主義國家”。在此前的3篇文章中,我把這一時期的群體關(guān)系稱為“精英聯(lián)盟”,并用“贏家通吃”概括它的利益分配效應(yīng)。
那么,關(guān)于“精英聯(lián)盟”博弈論還告訴了我們什么新的東西?博弈論主張,思考制度的最合理的思路是將它概括為一種博弈均衡。此前的分析表明,以市場和權(quán)威主義政治作為外生變量,那么精英聯(lián)盟——精英勾結(jié)型權(quán)威主義國家——就是一種內(nèi)生博弈規(guī)則。根據(jù)博弈論所揭示的納什均衡的基本性質(zhì),我們可以指出和解釋精英聯(lián)盟的一系列重要屬性。
首先,精英聯(lián)盟是穩(wěn)定的。在博弈論看來,作為納什均衡的精英聯(lián)盟實質(zhì)上就是一種特殊的策略組合,它使得每個參與者的策略是對其他參與者策略的最優(yōu)反應(yīng)。而且精英聯(lián)盟是一種帕雷托最優(yōu)狀態(tài),即任何參與者都不可能在不損害其他參與者利益的條件下改善自己的利益。這也意味著,社會一旦進入這種狀態(tài)就很難從中擺脫出來,或者說精英聯(lián)盟具有很高的穩(wěn)定性。
其次,精英聯(lián)盟是自我實施和自我維系的。納什均衡是所有參與者關(guān)于博弈將會如何進行的“一致”預(yù)測。也就是說,納什均衡能夠使參與者預(yù)測到它,而且能預(yù)測到他們的對手也能預(yù)測到它。既然所有參與者能夠預(yù)測到這一均衡(精英聯(lián)盟)會出現(xiàn),而且這一均衡又屬于帕雷托最優(yōu),那就沒有任何參與者有動力采用與該均衡不同的行動。在這種意義上,精英聯(lián)盟就是“自我實施的”。同時,精英聯(lián)盟也是自我維系的。參與者基于共有信念而做出的決策共同決定了均衡的再生,均衡的再生反過來又強化了共有信念。這樣一來,制度成為自我維系的。其實,制度作為一種均衡現(xiàn)象,只要別人不忽略它,任何人都不敢違抗它的權(quán)威,從而對人們的策略選擇構(gòu)成影響。
最后,建立精英聯(lián)盟需要時間。博弈規(guī)則的有效性依賴于參與者是否共享某種關(guān)于博弈將如何進行的“知識”或“信念”。那么,參與者的完全信息和共享信念來自哪里?答案是,來自經(jīng)驗,來自學(xué)習(xí),來自實踐中的學(xué)習(xí)過程。在我們的分析中,參與者被假定為是完全理性的,而且擁有完全信息,可以預(yù)測自己和其他參與者的所有選擇及相應(yīng)的結(jié)果。這是古典博弈理論的基本假設(shè)。但是,實際上,現(xiàn)實中的博弈參與者卻并非如此。他們僅僅擁有有限的信息和理性,并根據(jù)自己以往的經(jīng)驗進行歸納推理。針對這種情況,進化博弈論假設(shè),在每一個特定的時期,參與者的信息是有限的,而且他會根據(jù)以往的經(jīng)驗做出當(dāng)前的決策,以實現(xiàn)眼前利益的最大化。正是通過從經(jīng)驗中學(xué)習(xí),參與者才有可能積累起越來越豐富的經(jīng)驗,發(fā)展出越來越有效的分析能力,進而逐漸逼近“完全信息”和“完全理性”狀態(tài)。其實,古典理性觀點的均衡概念大致上可以理解為是學(xué)習(xí)的產(chǎn)物。(點擊此處閱讀下一頁)
相關(guān)熱詞搜索:中國大陸 博弈 內(nèi)生 規(guī)則 解釋
熱點文章閱讀