• <input id="zdukh"></input>
  • <b id="zdukh"><bdo id="zdukh"></bdo></b>
      <b id="zdukh"><bdo id="zdukh"></bdo></b>
    1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

      <wbr id="zdukh"><table id="zdukh"></table></wbr>

      1. <input id="zdukh"></input>
        <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
        <sub id="zdukh"></sub>
        公務(wù)員期刊網(wǎng) 精選范文 博弈論的概念范文

        博弈論的概念精選(九篇)

        前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的博弈論的概念主題范文,僅供參考,歡迎閱讀并收藏。

        博弈論的概念

        第1篇:博弈論的概念范文

            1944年,美國數(shù)學(xué)家馮·諾伊曼(Von Neumann)和摩根斯坦(Morgensien)合著的《博弈論與經(jīng)濟行為》一書的出版,標(biāo)志著系統(tǒng)的博弈理論的初步形成。該巨著匯集了當(dāng)時博弈論的研究成果,將其框架首次完整而清晰地表述出來,使其作為一門學(xué)科獲得了應(yīng)有的地位。同時身為經(jīng)濟學(xué)家的摩根斯頓首先清楚而全面地確認(rèn),經(jīng)濟行為者在決策時應(yīng)考慮到經(jīng)濟學(xué)上的利益沖突性質(zhì)。該書詳盡地討論了二人零和博弈,并對合作博弈作了深入探討,開辟了一些新的研究領(lǐng)域。更重要的是將博弈論加以空前廣泛的應(yīng)用,尤其是在經(jīng)濟學(xué)上,由于博弈論數(shù)學(xué)上的嚴(yán)整性與經(jīng)濟學(xué)應(yīng)用上的廣泛性,一些經(jīng)濟學(xué)家將該巨著的出版視為數(shù)理經(jīng)濟學(xué)確立的里程碑。

            接下來的一段時期對合作博弈的研究有了長足進步。按豪爾紹尼(1966)的觀點,如果一博弈中意愿表示——協(xié)議、承諾、威脅——具有完全的約束力并可強制執(zhí)行,則該博弈是合作的。如意愿表示不可強制執(zhí)行,則為非合作博弈。非合作博弈隨后發(fā)展起來,納什、澤爾滕和豪爾紹尼因此而獲獎,但當(dāng)時注意力主要集中在合作博弈上。事實上,合作博弈可視為非合作博弈的特殊情況,它略去非合作個體之間建立合作關(guān)系的過程而著重研究合作的可能性與形式。由于省去從非合作到合作過程中繁復(fù)的難以盡述的細(xì)節(jié),合作博弈能對合作問題有更清晰的把握。為了解決合作博弈中所遇到的問題,這一期間提出了聯(lián)盟博弈、穩(wěn)定集、解概念、可轉(zhuǎn)移效用、核心等重要概念與思想。1950年代是博弈論的成長期,納什為非合作博弈的一般理論奠定了基礎(chǔ),提出了博弈論中最為重要的概念——納什均衡,開辟了一個全新的研究領(lǐng)域。非合作理論發(fā)展起來,如阿爾·塔克的囚徒困境、重復(fù)博弈概念等。合作博弈理論在這個階段得到進一步發(fā)展,如沙普利值概念、核概念等。博弈論的研究隊伍開始擴大,蘭德公司在圣基尼卡開業(yè),在隨后的許多年里,這里成為博弈論的研究中心。此經(jīng)濟學(xué)逐漸成為博弈論最重要的應(yīng)用領(lǐng)域。1960年代是博弈論的成熟期。不完全信息與非轉(zhuǎn)移效用聯(lián)盟博弈那樣的擴充使理論變得更具廣泛應(yīng)用性。常識性的基本概念得到了系統(tǒng)闡述與澄清。博弈論成了完整而系統(tǒng)的體系。更重要的是,博弈論與數(shù)理經(jīng)濟及經(jīng)濟理論建立了牢固而持久的關(guān)系。例如,等價性原理說明博弈論與經(jīng)濟理論間存在競爭市場經(jīng)濟的價格均衡與相應(yīng)博弈的重要解概念之間的對應(yīng)關(guān)系。豪爾紹尼與澤爾滕正是在這一時期開始他們的工作,豪爾紹尼提出了不完全信息理論,澤爾滕開始其均衡選擇問題的研究。1970年代至今是博弈論的豐富壯大期。博弈論在所有研究領(lǐng)域都得到重大突破。博弈論開始對其它學(xué)科的研究產(chǎn)生強有力的影響,計算機技術(shù)的飛速發(fā)展使得研究復(fù)雜與涉及大規(guī)模計算的博弈模型發(fā)展起來。在理論上,博弈論從基本概念到理論推演均形成了一個完整與內(nèi)容豐富的體系。在應(yīng)用上,政治與經(jīng)濟模型有了深入研究,非合作博弈理論應(yīng)用到大批特殊的經(jīng)濟模型。同時博弈論應(yīng)用到生物學(xué)、計算機科學(xué)、道德哲學(xué)等領(lǐng)域,如隨機策略這樣的概念得到了重新解釋。漸漸地,博弈論變得大眾化起來。不再是僅為少數(shù)研究者所知。要對每年所發(fā)表的有關(guān)博弈論數(shù)以千計的文獻進行了解已不是件容易的事。至今,博弈論仍在不斷發(fā)展與深化,預(yù)測其可能出現(xiàn)的創(chuàng)新與成就是很困難的。

            在博弈論的發(fā)展過程中,納什奠定了非合作博弈的理論框架與概念基礎(chǔ),他的名字與博弈論的中心概念——納什均衡聯(lián)在一起;豪爾紹尼與澤爾滕則致力于博弈論的進一步發(fā)展與應(yīng)用。

            在非合作博弈論和經(jīng)濟分析里所應(yīng)用的博弈論思想中,納什均衡都處于核心地位??死灼账?D.Kreps)教授認(rèn)為,如今在每一個經(jīng)濟學(xué)領(lǐng)域及與其相關(guān)的金融、會計、市場學(xué)甚至政治學(xué)等領(lǐng)域,在消化其近期研究成果過程中,對納什均衡概念的理解均起著重要作用。雖然作為先驅(qū)者的古諾(Cournot)已在其研究中開創(chuàng)這一思想的先河,但其目前的形式則是納什獨立完成得出的卓越成就。美國普林斯頓大學(xué)的數(shù)學(xué)家和統(tǒng)計學(xué)家納什。從1950年至1954年,他發(fā)表了多篇論述博弈論的文章,為非合作的一般理論和合作博弈的談判理論奠定了基礎(chǔ)。他規(guī)定了非合作博弈的形式,并定義了著名的“納什均衡點”。納什最先對合作與非合作進行了區(qū)別。納什認(rèn)為以前的理論包含著某種被稱為合作類型的n人博弈思想,它以一種對能由局中人形成的不同合作之間相互關(guān)系的分析為基礎(chǔ);與此相反,納什認(rèn)為他自己的理論則“以缺乏合作為基礎(chǔ),在其中假定每個參與者都各行其是,與其他人之間沒有合作與溝通”。該思想拓展了博弈論的研究范圍,并增強了其應(yīng)用性。在闡明了合作與非合作之間區(qū)別的基礎(chǔ)上,納什定義了著名的“納什均衡點”,并對它的存在進行了證明。納什均衡的定義一般是通過簡單確定一個正常形式的有限局中人和行動的博弈來給出的。在純策略中,它是指這樣一種策略分布:假使其他局中人不變換其策略,則任何一個局中人都不能以單方面變換自己的策略來增加其效用。納什還證明,在一個有限局中人和行動的博弈中,至少總存在一個納什均衡,雖然當(dāng)我們考察混合策略時才能完全保證其存在,因為有例子表明,存在著沒有純策略均衡的對策。這一定義實際上包含著一個前提假定,即局中人對游戲結(jié)構(gòu)有充分的了解,也就是說擁有完全信息,以便能夠?qū)С鏊麄冏约旱念A(yù)測。納什均衡的意義直到現(xiàn)在仍是探討與爭論的題目。一般認(rèn)為,它是隨不同情況而變化的一種過程。例如,假設(shè)在某種博弈中,局中人通過某些非強制手段就局中人的策略選擇達成協(xié)議,這項協(xié)議具體確定了每個局中人選擇的策略。由于協(xié)議無強制力量,局中人如果能通過違背協(xié)議而獲得利益,則該協(xié)議無效。所以,為了保證協(xié)議有效,必須有一種局中人不可能因單方面違背協(xié)議而獲益的機制,即形成一種納什均衡。即,納什均衡使得協(xié)議能夠自我約束,無外力作用下也能保證協(xié)議的生效。這里納什均衡的意義在于保證協(xié)議的自我強制執(zhí)行。但這并不是說每個納什均衡都具有自我強制性,就多個局中人背信問題而言可能得出不同的結(jié)論。此外,這里并未討論協(xié)議如何實施及無協(xié)議時的情況。納什均衡在上述情況中的含義是有差別的。納什均衡刻畫了人們理性選擇的結(jié)果:利益沖突達到一種穩(wěn)態(tài)以至無人會單方面加以改變。納什均衡并未對這一結(jié)果做出福利上即總體上優(yōu)與劣的判斷。這就允許存在一種情形:由于人們的不合作使得每個人都達不到可能的最大收益。在囚徒困境中表現(xiàn)得十分明顯,其中唯一的納什均衡是雙方均交待,因為在其它策略組合下均有一方能因改變策略而獲益。但是這一局勢中的帕累托最優(yōu)是雙方均不交待。這表明,帕累托最優(yōu)并不一定能在納什均衡點上實現(xiàn)。也即,在存在利益沖突的情況下,利己主義個人理性選擇的結(jié)果在總體上可能并不是最有效的。進而,西方經(jīng)濟學(xué)中在經(jīng)濟人假設(shè)下,市場經(jīng)濟會達到或者趨向帕累托最優(yōu)這一結(jié)論在引入利益沖突后有可能無法成立。在囚徒困境中,雙方雖可在均不交待的情況下達到帕累托最優(yōu),卻難以實現(xiàn)這一結(jié)果。這是由于缺乏對對方的信任。因?qū)Ψ娇砂巡呗愿臑榻淮棺约韩@釋得利,故無法信任對方會信守承諾。每個人追求自身利益最大化這個理性人假設(shè)更使這種信任失去基礎(chǔ)。這說明,個人利己的理性選擇并不能保證人們的處境都得到改善,結(jié)果可能對大家都不利。就此而言,納什均衡揭示了利己理性的弱點。在人人求得自利的同時,如何防止對一切人均不利的結(jié)果出現(xiàn),這已成為今天博弈論和經(jīng)濟學(xué)中研究的熱點問題。

        第2篇:博弈論的概念范文

        關(guān)鍵詞:經(jīng)濟博弈論 語義分析 經(jīng)濟學(xué)方法論 實證分析 語言轉(zhuǎn)向

        “囚徒博弈”、“智豬博弈”、“懦夫博弈”、“協(xié)調(diào)博弈”等許多經(jīng)典案例,被廣泛運用于經(jīng)濟學(xué)、決策論、管理學(xué)等各學(xué)科領(lǐng)域;而這些虛構(gòu)的案例能否用來說明博弈理論引發(fā)了學(xué)者們激烈的爭論。直至今日爭論看似逐漸平息,經(jīng)典案例仍在使用,但爭論其實仍是無果而終或只是暫時表面的平靜,而相類似的討論不斷在經(jīng)濟科學(xué)的其他領(lǐng)域重演。必須認(rèn)識到,這場爭論歸根到底是方法論問題。按照傳統(tǒng)方法論提出的規(guī)范與實證二分法無法處理這一問題,本文試圖從語義學(xué)的視角進行分析。

        爭論雙方的觀點

        (一)質(zhì)疑者的觀點

        較為溫和的批評者認(rèn)為,“囚徒博弈”等所謂的“案例”不真實,只是一個故事或寓言,不在現(xiàn)實中發(fā)生。激進的批評者指出,不僅上述案例是虛構(gòu)的,經(jīng)濟博弈論中一些所謂真實的案例,也包含有假設(shè)和抽象的成分。極端反對者不僅把焦點放在質(zhì)疑案例本身,而且通過分析案例與模型、現(xiàn)實與理論的關(guān)系,進一步對博弈論的整體研究方法提出質(zhì)疑。

        從理論角度看,博弈理論和模型中包含有假設(shè)的變量,這些變量無法在現(xiàn)實中進行觀察。從案例角度看,在案例中被忽略掉的變量對結(jié)論不一定是無關(guān)緊要的,相反可能是必要的甚至是決定性的。因此整個博弈論漠視了變量可觀察的重要性,無論理論建構(gòu)還是案例實證都需要做出改進。

        (二)支持者的觀點

        對案例使用的辯護者則直接從研究方法出發(fā),首先強調(diào)博弈論研究中使用假設(shè)和抽象是不可避免的。任何一門科學(xué)研究都需要假設(shè)和抽象,抽象和假設(shè)并不是博弈論的局限性,而是任何理論的局限性。經(jīng)濟學(xué)科的研究方法如同物理學(xué)、生命科學(xué)的研究方法一樣,通過抽象和假設(shè)從萬千變化、紛繁復(fù)雜的社會經(jīng)濟現(xiàn)象中找尋本質(zhì)的經(jīng)濟規(guī)律,經(jīng)濟學(xué)家使用博弈模型的目的是試圖完成一種可解釋不同經(jīng)濟現(xiàn)象的一般理論或機制體系的建構(gòu),通過博弈模型抓住諸多現(xiàn)象的本質(zhì)機理。

        (三)觀點比較及本文的思路

        通過以上雙方觀點分析可以總結(jié)出雙方的三點同識和一點分歧,如表1所示。同識在于:第一,雙方都同意博弈論屬于實證分析而不是規(guī)范分析;第二,無論反對者還是支持者都認(rèn)同博弈理論的正確性需要在現(xiàn)實中得到驗實;第三,真實的案例有證實或證偽博弈理論的作用。而分歧主要在于:虛構(gòu)的案例能不能用以論證博弈理論?支持者表示同意,反對者堅決抵制。

        傳統(tǒng)的經(jīng)濟學(xué)規(guī)范和實證的二分法并不能處理關(guān)于博弈論案例使用的爭端。而如果將博弈論作為一類知識,從知識論的角度對實證知識的語義進行分析,則實證知識可進一步劃分為綜合知識和分析知識,它們都屬于實證知識的范疇,但有著不同的命題性質(zhì)。本文旨在介紹實證知識二分法,闡明分析命題與綜合命題的命題性質(zhì)與邏輯關(guān)系,論證經(jīng)濟博弈論屬于分析命題的范疇,劃清了博弈論案例使用的合法范圍,以避免研究中的方法誤用。

        經(jīng)濟學(xué)實證知識的二分法

        (一)經(jīng)濟學(xué)實證與規(guī)范二分法

        經(jīng)濟學(xué)以實證方法描述經(jīng)濟事實、發(fā)現(xiàn)經(jīng)濟規(guī)律。實證與規(guī)范二分法最早追溯到休謨(D.Hume),休謨砍刀(Hume`s guillotine)提出不能從是中推出應(yīng)當(dāng),經(jīng)濟學(xué)實然知識與應(yīng)然知識是截然不同的,需要分別采取各自不同的方法進行研究。穆勒(J.S.Mill)、韋伯(M.Weber)、西尼爾(N.W.Senior)和凱恩斯(J.N.Keynes)的著作對這個劃分進行了進一步的闡述與運用。弗里德曼(M.Friedman)著名的論文“實證經(jīng)濟學(xué)方法論”中再次提出,并且對它進行了詳細(xì)地討論,“斯諾命題”加深了人們對兩類知識差異的認(rèn)識。當(dāng)前關(guān)于實證分析和規(guī)范分析的二分法,在經(jīng)濟學(xué)領(lǐng)域是被普遍接受的。

        (二)經(jīng)濟學(xué)實證知識二分法的提出

        將經(jīng)濟學(xué)知識視為整體知識體系中的一類,則按照研究方法將經(jīng)濟學(xué)實證知識劃分為分析知識和綜合知識。在第一個層次,經(jīng)濟學(xué)理論作為一門學(xué)科是通過命題語言來表達,命題語言既包括文字語言,也包括符號語言、數(shù)學(xué)模型或公式。在第二個層次上,按照傳統(tǒng)劃分,經(jīng)濟學(xué)分析劃分為實證分析和規(guī)范分析。在第三個層次上,經(jīng)濟學(xué)實證命題可劃分為分析命題和綜合命題,同時根據(jù)實證原則將命題劃分為無意義的實證命題和有意義的實證命題。

        經(jīng)濟博弈論實證知識類型證明

        (一)從主詞指稱上

        從語義學(xué)上看,命題的主詞是概念詞或是專名。概念詞表述某類事物或?qū)傩?,專名表述個體事物。弗雷格對命題主詞的涵義與意謂做出明確劃分,指出在數(shù)學(xué)中,a=a和a=b之間的差別,只是表達形式上的差別。前者使用相同的符號,后者使用不同的符號。由于它們表示相等的數(shù)量關(guān)系,所以可以用a代替b,或者用b代替a,等式仍然成立。但是在命題語言中情況就不同了。在命題中要考慮語義的關(guān)系,即同時要考察主詞的意義與意謂,這不像代數(shù)的等式中那樣只考慮數(shù)量間的相等關(guān)系。

        主詞的意義是主詞表述的思想,主詞的意謂是主詞指稱的對象?!疤O果”是有意義且有意謂的概念,“理性”是有意義但無意謂的概念,“地球”是有意義且有意謂的專名,“智豬”是有意義但無意謂的專名。對于任何一個有意義的命題,主詞必然有意義,但不一定都有意謂。有意義的命題,主詞一定有意義,但不一定有意謂。綜合命題的主詞必須同時有意義與意謂,即在實現(xiàn)中的相對應(yīng)的對象。

        根據(jù)命題主詞指稱分析,經(jīng)濟博弈論屬于分析命題。從博弈理論看,理論的真與主詞的意謂無關(guān);從案例看,如“智豬博弈”中用任何一個概念代入x或y,或替換“大豬”和“小豬”,案例結(jié)論仍成立。

        (二)從命題與現(xiàn)象的時空關(guān)系上

        在命題與現(xiàn)象的時空關(guān)系上,又體現(xiàn)了分析命題與綜合命題的根據(jù)不同。引用張慶熊等學(xué)者說明賴爾(G.Ryle)“范疇錯誤”所使用的五個命題:“(1)一只蘋果正掛在樹上。(2)蘋果服從萬有引力定律。(3)我剪斷了它的柄。(4)蘋果因為萬有引力掉到地上。(5)蘋果掉到地上因為它的柄被剪斷了”。

        分析命題具有超時空性,分析命題的真包含一切可能的世界,求證分析命題的真與時空無關(guān)。時空是綜合命題真的必要條件,綜合命題描述的對象一定位于現(xiàn)實世界。時間、空間是綜合命題必然的、普遍有效的形式,是因為綜合知識如果是可以理解的話,或者說如果是綜合命題的話,就必定帶上時間、空間和因果性的印記??臻g、時間和因果性是綜合命題的可能性的條件。

        于是,句(1)、(3)與句(2)在邏輯上是不同范疇的實證命題。句(1)和(3)屬于綜合命題,它們報道發(fā)生的事情,人們可以提問句(3)在什么地方剪斷蘋果柄,它在什么時候發(fā)生,它花了多少時間等。句(2)不是綜合命題而是分析命題。句(2)是理論或假設(shè)而不是一個事件,它并不發(fā)生,它假設(shè)命題在一切可能世界都為真。對這樣的句子不能提問在什么時候、在什么地點發(fā)生了什么事情,它是理論或假設(shè)。根據(jù)命題與現(xiàn)象的時空關(guān)系分析,經(jīng)濟博弈論屬于分析命題。從博弈理論看,命題的真與時空無關(guān);從案例看,案例的發(fā)生與時空無關(guān)。

        (三)從命題間的因果關(guān)系上

        從命題間的邏輯關(guān)系上分析,用分析命題作為原因的命題仍是分析命題,用綜合命題作為原因的命題是綜合命題。句(4)和(5)都在解釋蘋果掉到地上的原因,都屬于實證分析范疇。用句(4)作為蘋果落地的原因,再用句(2)作為句(4)的原因,是采用邏輯演繹方法進行推理,因此句(4)是分析命題。用句(5)作為蘋果落地的原因,再用句(3)作為(5)的原因,是通過經(jīng)驗觀察獲得的知識,因此句(5)是綜合命題。盡管句(4)和句(5)中都有“因為”這兩個字,都屬于實證分析的范疇,但是這兩個“因為”在各自的句子中所起的邏輯上的作用是不同的。但前者是分析知識,后者是綜合知識,不能犯“范疇錯誤”。

        與此相聯(lián)系,分析知識的真是必然的,綜合知識的真是偶然的。用句(2)作為句(4)的原因是必須的,它的反面是不可能;用句(3)作為句(5)的原因是偶然的,它的反面是可能的,即蘋果有“我剪斷了它的柄”之外的原因落地。分析命題的真假通過邏輯規(guī)則推論出來,綜合命題是建立在經(jīng)驗事實的基礎(chǔ)上,其真假通過經(jīng)驗加以檢驗。

        根據(jù)命題間的因果關(guān)系分析,經(jīng)濟博弈論屬于分析命題。從博弈理論看,命題間的因果關(guān)系是必然的;從案例看,案例的結(jié)論與前提的關(guān)系是必然的。

        (四)從命題的驗證方法上

        從命題的驗證方法上分析,分析命題通過邏輯規(guī)則,綜合命題通過實際觀察。分析命題依據(jù)矛盾律從一些先天的概念、原則演繹出來;綜合命題通過歸納一類事物的性質(zhì)或事物間的關(guān)系得到結(jié)論。驗證分析命題,只要看看它們是否在邏輯上自相矛盾;驗證綜合命題,則要看看它們是否與現(xiàn)實中情況相符合。

        對此托馬斯·謝林(T.C.Schelling)也指出,博弈論是抽象的和推論的,而不是一門研究人們?nèi)绾螞Q策的經(jīng)驗主義科學(xué),但它是一種附有以下相關(guān)條件下的演繹原理,即參與者的決策必須是“理性的”、“一致的”或“非矛盾的”。

        根據(jù)命題的驗證方法分析,經(jīng)濟博弈論屬于分析命題。從博弈理論看,它不能被綜合命題證明或證偽,因為它的檢驗不依賴于經(jīng)驗事實而依賴于邏輯規(guī)則。從案例看,無法被經(jīng)驗觀察所證明或證偽,因為它的檢驗來源于理論模型內(nèi)部的正確性。

        通過綜合命題和分析命題的五個性質(zhì)區(qū)分(見表1),本文證明了博弈論及其所使用的案例均屬于分析命題的實證知識范疇。

        結(jié)論及啟示

        (一)結(jié)論

        經(jīng)濟博弈論屬于分析知識。根據(jù)傳統(tǒng)方法論分析,經(jīng)濟博弈論屬于實證知識而不是規(guī)范知識,是關(guān)于“真”的知識。而根據(jù)語義分析,在知識類型上經(jīng)濟博弈論屬于分析知識而不是綜合知識。如圖1所示,分別用實線框和虛線框表示屬于和不屬于經(jīng)濟博弈論的語言區(qū)域。在求真方法上,經(jīng)濟博弈論通過演繹、推理獲得,而不是通過經(jīng)驗觀察從現(xiàn)象中獲得。

        不僅是虛構(gòu)的案例,任何案例運用于博弈理論研究中,既無效又無益。本文業(yè)已證明博弈論知識屬于分析命題范疇,博弈論的真與案例無關(guān),試圖用空想的案例或抽象的案例來“實證”博弈理論的做法是無效。用案例去論證博弈理論,是用綜合知識的研究方法去處理分析知識,是對博弈論研究方法的破壞,對整個博弈論研究是無益的。

        博弈論案例使用爭論雙方的觀點都是對的。反對者絕不允許用虛構(gòu)的案例去論證實證知識的做法是正確的,是對實證精神和實證方法的捍衛(wèi)。支持者絕不允許實證知識只停留在抽象思維的層面,堅持用案例證實或證偽理論的做法是正確的。產(chǎn)生爭論的真正原因是誤把作為分析知識的博弈論當(dāng)作綜合知識。如表2所示,爭論雙方的觀點都是對的。

        第3篇:博弈論的概念范文

        聯(lián)盟的穩(wěn)定性是聯(lián)盟博弈中一個重要的概念。傳統(tǒng)的聯(lián)盟博弈理論是假設(shè)每一個人的偏好都是公開的,但是在實際應(yīng)用中,不少軟件人的應(yīng)用系統(tǒng)并不符合這個前提,他們往往是擁有私人信念的個體,因此他們不是按照全體人擁有的共同信念來行動的。針對以上的問題,本書對傳統(tǒng)的穩(wěn)定性概念中的“核”概念進行擴充,提出一套新的概念,分析了帶有不確定性并且以信念為基礎(chǔ)的聯(lián)盟的穩(wěn)定性,并展示這套新概念如何應(yīng)用于一類新的聯(lián)盟博弈――以信念為本位的聯(lián)盟博弈。

        本書共分7章:1.多合作及穩(wěn)定性。介紹了本書所討論的博弈理論的有關(guān)概念,引入了博弈論;2.不可轉(zhuǎn)讓的實用程序(NTU)博弈及聯(lián)盟形成機制。在回顧了相關(guān)文獻的基礎(chǔ)上,討論了合作博弈理論和多人聯(lián)盟形成問題。本章主要內(nèi)容包括不可轉(zhuǎn)讓效用合作博弈、可轉(zhuǎn)讓效用合作博弈、聯(lián)盟形成機制以及信念與不確定性等;3.兩類穩(wěn)定性。討論了博弈的穩(wěn)定性問題以及信任不確定性所帶來的影響。在此基礎(chǔ)上,本章提出了一種基于規(guī)則的方法,并引入了強核心以及弱核心的概念。進而,本章末還討論了信念聯(lián)盟的穩(wěn)定性精制程度的影響;4.基于信念的聯(lián)盟穩(wěn)定性。將私人信念引入到不可轉(zhuǎn)讓的實用程序(NTU)博弈中,使得人的偏好不再是公開的。此外,本章還對信任精確度穩(wěn)定性的影響進行了進一步測試;5.應(yīng)用實例介紹。本章介紹了基于信念穩(wěn)定性概念而提出的一個應(yīng)用實例:買方聯(lián)盟問題。進而,本章對如何有效地應(yīng)用概念解決此類多聯(lián)盟形成問題進行了評估;6.sb核以及wb核。在前面章節(jié)所述內(nèi)容的基礎(chǔ)上,引入并詳述了本書核心概念:在不可轉(zhuǎn)讓的實用程序游戲中引入私人信念。包括不確定的意見及私人信念、NTUBU博弈、性能對比與檢測等;7.總結(jié)與展望。對本書進行了總結(jié),并且對不可轉(zhuǎn)讓的實用博弈理論(NTU)未來可能的發(fā)展方向作了展望。

        本書篇幅較小,內(nèi)容生動活潑,語言通俗易懂,不是簡單地羅列博弈論相關(guān)理論,而是突出新亮點,并輔之以清晰的例證.本書適合對人工智能、博弈論等領(lǐng)域感興趣的讀者閱讀。

        (中國科學(xué)院國家空間科學(xué)中心)

        第4篇:博弈論的概念范文

        維特根斯坦是學(xué)界倍受關(guān)注的大師,其前后期思想的迥異恰當(dāng)?shù)卦忈屃怂恼軐W(xué)主題:“哲學(xué)不是一種學(xué)說,而是一種活動?!雹儆腥さ氖?辛提卡博弈論語義學(xué)所強調(diào)的也是動態(tài)的理解命題,這與維特根斯坦哲學(xué)在本質(zhì)上殊途同歸。

        維特根斯坦哲學(xué)的主要貢獻之一就在于提出了著名的“圖象論”。維特根斯坦前期哲學(xué)和后期哲學(xué)的目的都在于通過研究語言的結(jié)構(gòu)和界限來理解思想的結(jié)構(gòu)和界限。維特根斯坦工作的基點,就是回到邏輯的出發(fā)點,即考慮命題的性質(zhì)。這樣,真的界限就構(gòu)成了語言的界限,維特根斯坦所考慮的就是關(guān)于事實的話語?!叭私o自己造出事實的圖象”②。維特根斯坦指出:命題是實在的圖象,“圖象是實在的一幅模型”③。“圖象是一種事實”④?!皥D象所表現(xiàn)者即是其意義”⑤。“圖象的真假在于其意義與實在的符合與否”⑥。維特根斯坦認(rèn)為,圖象與它所圖示的事實之間的關(guān)系包括兩個方面:一是這種關(guān)系“由圖象元素與物項的配合而成”⑦,這種關(guān)系本身也是一種圖象;二是“凡圖象,不論只有什么型式但要能表象實在———對或錯———所必須與實在共有的東西,即是邏輯型式,亦即實在的型式?!雹嗨?“每個圖象亦是一邏輯圖象”⑨?!皩ο笫呛唵蔚摹雹狻!皩ο髽?gòu)成世界的本體。因此不能是復(fù)合的?!?/p>

        一切復(fù)合物必然可分解到不可再分的部分,這就是絕對簡單的對象,那么,這種絕對簡單的對象是什么?很顯然,維特根斯坦這一思想的形成深受羅素和弗雷格的影響。羅素對客體進行了區(qū)分,一類是親知的客體,一類是描述的客體,通過“親知還原”,描述的客體可以轉(zhuǎn)化為親知的客體,維特根斯坦對羅素的客體進行了擴展,認(rèn)為屬性和關(guān)系也是一種客體。語言中的一個名稱來表示一個簡單的客體,通過這些客體的結(jié)合方式,指稱客體的名稱可以相互組合成句子。對于簡單的客體,我們無法定義它們是什么,我們僅僅能夠指示它們,這樣,我們也就無法言說這些客體是存在的,因為定義一個客體就是意謂著被定義項的存在。維特根斯坦的絕對簡單的對象實質(zhì)上是羅素親知客體的變體,是經(jīng)驗的客體。圖象論的主旨是說明圖象如何具有命題的內(nèi)容,圖象可以看成一個句子,一個句子也可以看成圖象,這對于解釋最簡單句子的合理性是顯而易見的,那么如何處理復(fù)雜的句子呢?

        維特根斯坦最開始的設(shè)想是用合取和析取處理一切復(fù)雜句子,這也是辛提卡采取斯科倫前束式處理量詞句的直接思想來源,但是維特根斯坦后來采取了另一個思路,代之以集成的圖象法,“凡對于復(fù)合體的陳述,都可解析成對于其成分的陳述,解析成一些把復(fù)合體完全摹狀了的命題。”即一個復(fù)雜的表達式的真值取決于組成它的表達式的真值,即命題就是基本命題的真值涵項,這樣,維特根斯坦就完成了語言的運作方式。維特根斯坦的這一思想源于羅素和弗雷格的啟發(fā),羅素和弗雷格兩人都認(rèn)為命題才是最基本的意義單位,主張將命題形式化,即用數(shù)學(xué)中的函數(shù)表示命題。維特根斯坦對這一思想的運用是水到渠成的。維特根斯坦認(rèn)為,“命題是原初命題的真值函量”?!霸趺}是命題的真值函目”。換句話說,“一切命題都是對原初命題做真值運算的結(jié)果”?!懊}就是從一切原初命題的總和(自然也從其確是一切原初命題的總和)而得出的一切。所以,從某種意義可以說,一切命題都是原初命題的總括?!?/p>

        命題與世界的圖象論包含了兩層含義:一是圖象的元素與事物之間具有對應(yīng)關(guān)系;二是圖象與事實之間具有相同的邏輯形式。由此,在維特根斯坦看來,“圖象是實在的一幅模型”,“圖象是一事實”,“圖象所表現(xiàn)者即是其意義”。

        正是因為命題具有相同的結(jié)構(gòu),才使得我們可以將其形式化,并且可以進行變項替換。那么,圖象如何與世界相聯(lián)系?在維特根斯坦早期哲學(xué)中,這種關(guān)系由名稱—客體的關(guān)系來決定,但是名稱如何與客體相聯(lián)系?與其說維特根斯坦后期哲學(xué)是對前期哲學(xué)的反叛,不如說是進一步的深入,在維特根斯坦的語言游戲說中,名稱與客體的關(guān)系被受一定規(guī)則支配的人類活動所確定。在完成這個思想轉(zhuǎn)變之后,維特根斯坦不需要圖象論了,取而代之的是語言這種被規(guī)則所支配的特征。

        辛提卡的博弈論語義學(xué)是將博弈的方法引入命題分析,他的研究涉及兩個問題,第一個問題就是命題的構(gòu)成和命題的真假,第二個問題就是如何確定命題的真假。第二個是維特根斯坦后期哲學(xué)討論的一個主要問題,其前期哲學(xué)為解決辛提卡的第一個問題提供了思想元素。命題是由概念構(gòu)成的,而博弈語義學(xué)中的概念則直接對應(yīng)維特根斯坦意義上的存在。值得注意的是,維特根斯坦的存在是與事實相對應(yīng)的存在,是以現(xiàn)實世界為界限的,所以辛提卡用他的可能世界改造了維特根斯坦的客體。在辛提卡看來,很多情況下,人們的語言交流所涉及的客體多是描述的客體,這些描述的客體有些能轉(zhuǎn)換為親知客體,有些不能,如“結(jié)構(gòu)為H3O的水”,但是人們在日常的交流中又會涉及這些概念,自然在定義域D中也就應(yīng)該包含這些元素,可以看出,辛提卡的客體是對維特根斯坦客體的擴展。辛提卡的客體分為存在的和可能存在的兩類,即在現(xiàn)實世界中存在和在可能世界中存在。而且很明顯的是,辛提卡的存在概念不是語義學(xué)層面上的,而是語用學(xué)層面上的語義,這在博弈論語義學(xué)的操作性中得以體現(xiàn)。在辛提卡的博弈論語義學(xué)中,定義域D中的個體必須能與可能世界中的對象一一對應(yīng),脫離了這種對應(yīng)關(guān)系,我們就不可能知道自己在言說何物,更不用說判定言說語句的真假。正如DanaScott所指出的那樣,語義確定一個實現(xiàn)不是必需的,它應(yīng)該為證實一個實現(xiàn)是正確的提供標(biāo)準(zhǔn)。

        在確定了命題的構(gòu)成之后,需要解決的問題是命題真假的標(biāo)準(zhǔn)是什么。辛提卡認(rèn)為,命題是有意義的,命題的意義就是命題的真假值。博弈論語義學(xué)的處理方法是找到一個體用概念的名稱代入量詞所約束的變元,即參與人“我”在定義域D中找到相關(guān)的個體以證實語句,而參與人“自然”則企圖找到范例來證偽語句。那么,如何才是找到相關(guān)的個體呢?或者說,怎樣才知道代入個體后的語句為真?如前所述,辛提卡在擴展了維特根斯坦概念的基礎(chǔ)上明確了命題的構(gòu)成問題,相應(yīng)的,辛提卡的命題范圍較之維特根斯坦就寬泛的很多。辛提卡將博弈論語義學(xué)稱為“尋找并找到的”邏輯,尋找并找到了什么?就是找到一個適當(dāng)個體代入后的原子句所反映出來的圖象與現(xiàn)實世界相符合。這不僅直觀,而且符合人們的日常交流??梢?在確定命題真假的標(biāo)準(zhǔn)上,辛提卡與維特根斯坦是一致的,就是采用圖象論的符合標(biāo)準(zhǔn)。辛提卡自己也曾明確指出,“博弈語義學(xué)不排斥圖示的(同形的)關(guān)系理論,圖示的(同形的)關(guān)系理論在原子句和現(xiàn)實之間建立了聯(lián)系?!睆倪@句話我們可以看出,要確定命題的真值,只要將命題與圖象做個比較就可以了。用辛提卡的話說就是,“名稱-客體關(guān)系曾經(jīng)被建立,僅僅需要一件事,這件事就是將原子句和現(xiàn)實相比較?!?/p>

        辛提卡指出:“維特根斯坦的圖像理論和邏輯語義學(xué)之間的相似性和非相似性更有趣。最重要的大范圍相似性之一,就是在兩個理論中,語言的基本元素和現(xiàn)實的特定方面之間的代表關(guān)系,用任何的方式都不能進一步的分析?!绷_素指出,事實是意指那種使一個命題真或假的事物。而一個命題的本質(zhì)就在于:它可以兩種方式,即以人們所謂的真的方式或假的方式對應(yīng)于一個事實。最基本的事實是原子事實,與原子事實相對應(yīng)的是原子命題,它肯定某物具有某種性質(zhì)或某些事物具有某種關(guān)系。原子命題的真假取決于它是否與原子事實相符合。在原子命題的基礎(chǔ)上,借助邏輯聯(lián)結(jié)詞就構(gòu)成了分子命題。分子命題的真假取決于組成它的原子命題的真假,是原子命題的真值函項。在分子命題的基礎(chǔ)上,借助邏輯量詞可以構(gòu)成更高一級的概括命題。其真假最終也取決于原子命題的真假。維特根斯坦繼承了這一思想,認(rèn)為任何復(fù)雜命題經(jīng)過分析都可以還原為最基本的原子命題。辛提卡由此得出結(jié)論:“一個指示性句子的表達在通常的本質(zhì)上不是這些語言博弈的一個回合,在這些語言博弈中,給出了幾個構(gòu)成成分的詞語,并且因此給出了整個句子的內(nèi)涵?!痹谛撂峥ǖ牟┺恼撜Z義學(xué)中,我們根據(jù)可能世界理論可以確定定義域D,根據(jù)維特根斯坦的圖象論可以處理命題,并且將命題的具體處理方法轉(zhuǎn)化為真值函項的求解,那么,接下來要考慮的是,我們究竟應(yīng)該如何為真值函項求解,并且這個方法是否可以形式化。遵循維特根斯坦的哲學(xué)思路,辛提卡找到了博弈論。

        二“語言游戲說”與語義博弈

        維特根斯坦的“語言游戲”說中的所謂“語言游戲”,實際上是把游戲當(dāng)成是運用語言的比喻,即強調(diào)語言的使用,他指出:“我將把由語言和行動(指與語言交織在一起的那些行動)所組成的整體叫做‘語言游戲’”。維特根斯坦認(rèn)為,語詞的意義在于使用,運用語言是一種活動,我們使用的語詞在不同的場合會有不同的意義,必須根據(jù)具體的使用環(huán)境才能確定語詞的意義,試圖通過孤立的邏輯分析來揭示語詞的意義,結(jié)果只能誤入歧途。維特根斯坦對語言的這種處理方法,實質(zhì)上是從具體的語境動態(tài)地觀察語詞的用法,我們不能孤立地去問“什么是意義”這一類的問題,而應(yīng)該說“什么是意義的解釋”。弄清一個語詞代表什么之前,必須首先掌握包括這個語詞在內(nèi)的那種語言游戲,一個詞語的意義也就是它在語言游戲中的實際用法。維特根斯坦對于語言及其意義問題的思考,得益于一場足球比賽的啟發(fā),同時,相較于足球比賽,語言游戲也存在規(guī)則,在維特根斯坦看來,遵守規(guī)則是語言游戲的靈魂,也是一切人類行為的必要條件。維特根斯坦用了很多篇幅討論規(guī)范和遵守規(guī)則?!白袷匾?guī)則,做報告,下命令,下棋都是習(xí)慣(習(xí)俗,制度)。

        “遵循規(guī)則類似于服從命令。人們是被訓(xùn)練這樣做的;人們是以特定的方式對命令做出反應(yīng)的。人類共同的行為方式乃是我們據(jù)以解釋陌生語言的參考系。”可見,規(guī)則和遵循規(guī)則是人們在實踐和交往中形成的相對穩(wěn)定的行為準(zhǔn)則和行為模式。這種語言游戲所遵循的規(guī)則究竟是什么?是否就是邏輯必然性?“維特根斯坦最終在他的認(rèn)識論斗爭中失敗了”。

        其實[論/文/網(wǎng)LunWenNet/Com]只要留意維特根斯坦前期哲學(xué),我們不難發(fā)現(xiàn)維特根斯坦在處理這個問題上的缺陷,維特根斯坦指出:“我的根本思想是‘邏輯常量’不代表任何東西。事實的邏輯不可能為任何東西所代表?!薄皼]有‘邏輯的對象’、‘邏輯常量’(照弗雷格與羅素的意義),于此便顯然可見?!彪m然維特根斯坦不承認(rèn)邏輯常項的存在,但是認(rèn)為客體具有邏輯形式,這種形式使得客體能夠聚攏。

        辛提卡認(rèn)為維特根斯坦的語言游戲受到博弈論的影響。“游戲概念的主要用法如此多地分享了像馮·諾意曼(vonNeumann)和約翰·納什(JohnNash)那些數(shù)學(xué)家構(gòu)建一個詳細(xì)的游戲的一般理論的結(jié)構(gòu),那個理論旨在幫助科學(xué)家與哲學(xué)家理解有趣的問題的范圍。它們甚至包括了真理與意義的問題(以及其他的語言—世界關(guān)系)以供討論,維特根斯坦從中提出了他的語言游戲觀念?!?/p>

        與維特根斯坦相同,辛提卡在確立了命題和世界的圖示關(guān)系之后,需要研究的就是這種關(guān)系是如何建立的,“處于這些描述關(guān)系之間的關(guān)系是什么?”在辛提卡看來,單純的圖像論已經(jīng)不能解釋這個問題了,圖像論的任務(wù)是描述關(guān)系,那么對關(guān)系的關(guān)系的刻畫,則需要另一個理論。辛提卡指出:比起那些為解釋語言與現(xiàn)實結(jié)合所需要的思想,維特根斯坦經(jīng)常包含更多的語言博弈思想。“為了理解(一個給定的一階邏輯語句)F,我們顯然沒有足夠的時間和記憶空間,事實上,我們對一階語句的理解必須建立在對語句和世界的有限的逐步比較之上,而不是(潛在的)F的圖像本質(zhì)。”“有時語言博弈能夠明顯的被發(fā)現(xiàn)用于提供詞語和它所刻畫之間的關(guān)聯(lián)”。

        這里我想指出的是,或許我們用圖像論處理語句理解的時候已經(jīng)不足道了,但更為恰當(dāng)。辛提卡認(rèn)為自己受到“維特根斯坦有關(guān)思想的啟發(fā),強調(diào)受規(guī)則支配的人類活動,亦即尋求和發(fā)現(xiàn)語言游戲的重要性?!钡?辛提卡“比維特根斯坦走得遠得多,因為后者的思想是輪廓性的且不系統(tǒng)?!薄霸谖覜]有有效的方式找到我的下一步該如何行動時,我怎么可能在實踐中采取一個策略?”

        這里有幾種選擇。也許有人會像在非確定性證據(jù)系統(tǒng)內(nèi)所做的那樣提出某種思路,但是辛提卡建議把我的策略限制在遞歸中。這種限制的方法是非常精致的,它注意到了維特根斯坦對語言游戲中實際可游戲性的思考。辛提卡堅持認(rèn)為語言目標(biāo)導(dǎo)向語言本質(zhì),這可以幫助我們重新認(rèn)識處于維特根斯坦形式化時期的游戲概念的意義。當(dāng)時,維特根斯坦使用“游戲”來指稱目標(biāo)導(dǎo)向的活動,諸如證實或者證偽的活動。辛提卡延用了這一思想,他說:維特根斯坦的“用法”概念強調(diào)的是一種活動,是一種構(gòu)成一個詞的自然環(huán)境并使該語詞從中獲得其意義的活動。

        因此,在他的博弈論語義學(xué)框架下所研究的語義博弈,可以被看作是“維特根斯坦意義上的一類語言游戲”。維特根斯坦認(rèn)為邏輯常項不存在,在這點上,辛提卡與維特根斯坦所持的觀點不同,辛提卡認(rèn)為邏輯常項是存在的,并且將邏輯常項與博弈規(guī)則做了比較,認(rèn)為邏輯常項等同于博弈規(guī)則。與經(jīng)典邏輯一致,辛提卡認(rèn)為邏輯常項與自然語言中的連接詞是一致的。這樣,辛提卡就為博弈論語義學(xué)找到了至關(guān)重要的一環(huán)———規(guī)則的確定。辛提卡將維特根斯坦的語言游戲說與博弈的數(shù)學(xué)理論概念直接結(jié)合,“其結(jié)果就是那個既適用于自然語言又適用于形式語言的最現(xiàn)成的語義理論”。辛提卡認(rèn)為,與一個語詞相關(guān)的語言博弈就是圍繞該詞發(fā)生的使該詞活動意義的活動,語詞的意義同樣需要在相應(yīng)的使用中才能確定。我們所言說的語句是可以分解簡化的,而行之有效的方法就是用博弈論,通過將句子簡化為原子句,再依據(jù)名稱與所指的對應(yīng)關(guān)系,我們就可以確定句子的真假。

        辛提卡在吸取維特根斯坦哲學(xué)思想精華的基礎(chǔ)上提出了博弈論語義學(xué),作為當(dāng)代語義學(xué)發(fā)展的一個重要方向,博弈論語義學(xué)的運用并不僅僅局限于邏輯學(xué)的范疇,可以說,博弈論語義學(xué)的哲學(xué)意義與它的理論特征是密切相關(guān)的。理清其背后的哲學(xué)思想,不僅有助于幫助我們更好的理解這一理論,并且大大擴展了我們思考語言和世界關(guān)系的哲學(xué)和邏輯學(xué)空間。

        第5篇:博弈論的概念范文

        Abstract: With the development of economy, the construction market has become regular. The bidding legislation play an important role in equity, public, quality and against illegal competition and corruption. Although the enterprise spent a lot of material, time on a complex bidding, but usually the end is not desirable. On the basis of bidding evaluation analysis, a set of suitable bidding game model methods are considered, which is useful for scientific decision on bidding practice in construction enterprises.

        關(guān)鍵詞:建筑市場;招投標(biāo);評標(biāo)辦法;博弈論

        Key words: construction market;bidding;bidding evaluation method;game theory

        中圖分類號:TU71 文獻標(biāo)識碼:A文章編號:1006-4311(2010)08-0100-02

        0引言

        工程項目建設(shè)招標(biāo)投標(biāo)是國際通用的、比較成熟的而且科學(xué)合理的工程承發(fā)包方式。承包商投標(biāo)的目的是能夠制定科學(xué)合理的技術(shù)方案并報出一份既有最大中標(biāo)可能性又可以贏利的最佳的報價。

        我國目前建筑市場競爭日益復(fù)雜和激烈,施工企業(yè)在注重提高企業(yè)內(nèi)在素質(zhì)的同時,加強工程投標(biāo)工作的研究,優(yōu)化投標(biāo)決策,提高投標(biāo)質(zhì)量,是在市場競爭中生存和發(fā)展的重要保證。

        我國的工程招標(biāo)評估一般采用綜合評估法,即對工程質(zhì)量、施工工期、投標(biāo)價格、施工組織設(shè)計或者施工方案、投標(biāo)人及項目經(jīng)理業(yè)績等提出要求,并確定評價標(biāo)準(zhǔn)。這些要求和標(biāo)準(zhǔn)的確定也是因為業(yè)主的要求不同,所以各個標(biāo)準(zhǔn)也不盡相同。。一般以評分方式進行評估,得分最高者中標(biāo)。采用經(jīng)評審的最低投標(biāo)價法,是在投標(biāo)文件能夠滿足招標(biāo)文件實質(zhì)性要求的投標(biāo)人中,評審出投標(biāo)價格最低的投標(biāo)人,但投標(biāo)價格低于其企業(yè)成本的除外。

        招標(biāo)投標(biāo)是為了營造公平、公開、公正的競爭環(huán)境,進一步規(guī)范我市建筑市場秩序,加快培育市場機制,遏制腐敗現(xiàn)象發(fā)生,培育和建立統(tǒng)一開放、競爭有序的建筑市場,保證工程建設(shè)的順利進行和建筑業(yè)的健康發(fā)展。但由于舊體制的功能與慣性還未消失,新體制的功能尚不完善,致使建筑市場交易成本過高,交易秩序出現(xiàn)混亂,影響了招標(biāo)投標(biāo)制度的效率。

        本文認(rèn)為,要對工程造價作出科學(xué)合理的評估,需要建立嚴(yán)密的數(shù)學(xué)模型,而根據(jù)實際情況,顯然選擇博弈理論更加合理?;诓┺恼摻⑦m應(yīng)不同評標(biāo)辦法的投標(biāo)模型,為施工企業(yè)的投標(biāo)工作提供一些具有理論和實質(zhì)意義的參考。

        1博弈論投標(biāo)報價建模的基本要素

        1.1 博弈論在投標(biāo)報價建模應(yīng)用中的適宜性博弈論是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題。博弈論的基本概念包括:參與人、行動、結(jié)果、信息、戰(zhàn)略、支付函數(shù)、均衡。博弈分析的目的是運用博弈規(guī)則預(yù)測博弈均衡。

        工程投標(biāo)是一種對策行為,眾多投標(biāo)者之間就是一場博弈。投標(biāo)人往往不具備甚至完全不具備競爭對手的投標(biāo)信息資料,施工企業(yè)在與對手參與投標(biāo)活動時可以認(rèn)為是同時選擇行動,因而可以運用不完全信息靜態(tài)博弈理論來描述和解釋工程競標(biāo)博弈。

        1.2 博弈論基本要素概述從理論上講,博弈分為四種類型,分別為:

        1.2.1 合作博弈――研究人們達成合作時如何分配合作得到的收益,即收益分配問題;

        1.2.2非合作博弈――研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題;

        1.2.3 完全信息不完全信息博弈:參與者對所有參與者的策略空間及策略組合下的支付有充分了解稱為完全信息;反之,則稱為不完全信息;

        1.2.4 靜態(tài)博弈和動態(tài)博弈:靜態(tài)博弈指參與者同時采取行動,或者盡管有先后順序,但后行動者不知道先行動者的策略。動態(tài)博弈指雙方的的行動有先后順序并且后行動者可以知道先行動者的策略。

        為了說明博弈的各個類型,我們可以在這里舉個例子:a、b、c、投票決定如何分配100萬,他們分別擁有50%、40%、10%的權(quán)力,規(guī)則規(guī)定,當(dāng)超過50%的票認(rèn)可了某種方案時才能通過。那么如何分配才是合理的呢?按票力分配,a50萬、b40萬、c10萬c向a提出:a70萬、b0、c30萬b向a提出:a80萬、b20萬、c0……

        權(quán)力指數(shù):每個決策者在決策時的權(quán)力體現(xiàn)在他在形成的獲勝聯(lián)盟中的“關(guān)鍵加入者”的個數(shù),這個“關(guān)鍵加入者”的個數(shù)就被稱為權(quán)利指數(shù)。

        夏普里值:在各種可能的聯(lián)盟次序下,參與者對聯(lián)盟的邊際貢獻之和除以各種可能的聯(lián)盟組合。

        次序:abc acb bac bca cab cba ,關(guān)鍵加入者:a c a c a b ,由此計算出a,b,c的夏普里值分別為4/6,1/6,1/6 。所以a,b,c應(yīng)分別獲得100萬的2/3,1/6,1/6。

        以下結(jié)合具體實例,對博弈論涉及的各個要素進行逐一分析:

        (1)參與人是指一個博弈中的決策主體,它的目的是通過選擇行動(或戰(zhàn)略)以最大化自己的支付(效用)水平。參與人可能是自然人,也可能是團體,如企業(yè)、國家,甚至若干國家組成的集團。在本文中,一般用i=1,…,n代表參與人。除了一般意義上的參與人之外,在博弈論中“自然”作為“虛擬參與人”來處理。

        (2)信息是參與人有關(guān)博弈的知識,特別是有關(guān)“自然”的選擇、其他參與人的特征和行動的知識。信息集是博弈論中描述參與人信息特征的一個基本概念,是參與人在特定時刻有關(guān)變量的知識。

        (3)戰(zhàn)略戰(zhàn)略是參與人在給定信息集的情況下的行動規(guī)則,它規(guī)定參與人在什么時候選擇什么行動。一般地,用si表示第i個參與人的特定戰(zhàn)略,Si ={si}代表第i個參與人的所有可選擇戰(zhàn)略的集合。如果n個參與人每人選擇一個戰(zhàn)略,n維向量S=(s1,…si,…sn)稱為一個戰(zhàn)略組合,其中si 是第i個參與人選擇的戰(zhàn)略。

        (4)支付在博弈論中,支付是指在一個特定的戰(zhàn)略組合下參與人得到的確定的效用水平或者是指參與人得到的期望效用水平。參與人的目標(biāo)是選擇自己的戰(zhàn)略以最大化其期望效用函數(shù)。在博弈論中,支付或者是指在一個特定的戰(zhàn)略組合下參與人得到的確定的效用水平或者是指參與人得到的期望效用水平。

        (5)結(jié)果是博弈研究者所感興趣的分析,例如均衡戰(zhàn)略組合,均衡行動組合,均衡支付組合等。

        (6)均衡是所有參與人的最優(yōu)戰(zhàn)略組合,博弈分析的目的是預(yù)測博弈的均衡結(jié)果,即給定每個參與人都是理性的(理性是指有一個很好定義的偏好,在面臨給定的約束條件下最大化自己的偏好)。博弈論中的均衡概念與一般均衡理論中討論的均衡概念是不同的。

        在博弈論里一個博弈可以用兩種不同的方式來表述,一種是戰(zhàn)略式表述;另一種是擴展式表述(或稱為展開式表述),更適合于討論動態(tài)博弈。因為本文中基于博弈論建立的報價模型都是靜態(tài)博弈,下面僅給出適合于靜態(tài)博弈的戰(zhàn)略式表述(又稱為標(biāo)準(zhǔn)式表述):

        博弈的參與人集合:i∈Γ,Γ=(1,2,…,n)

        每個參與人的戰(zhàn)略空間:Si,i=(1,2,…,n)

        每個參與人的支付函數(shù):ui=(s1,…si…,sn),i=(1,2,…,n)

        用戰(zhàn)略式表述的博弈為:G={Si,Sn;ui…,un}

        在這種表述中所有參與人同時選擇各自的戰(zhàn)略。所有參與人選擇的戰(zhàn)略一起決定每個參與人的支付。

        2不同投標(biāo)報價評分方法下的建模方法分析

        目前,我國施工企業(yè)參與投標(biāo)的項目報價評分辦法主要有兩種:一是經(jīng)評審的最低價法;二是復(fù)合標(biāo)底法。根據(jù)評分辦法及可獲取的數(shù)據(jù)類型應(yīng)建立不同的博弈模型。具體來說,綜合評估法采用較多,即對工程質(zhì)量、施工工期、投標(biāo)價格、施工組織設(shè)計或者施工方案、投標(biāo)人及項目經(jīng)理業(yè)績等提出要求,并確定評價標(biāo)準(zhǔn)。這些要求和標(biāo)準(zhǔn)的確定,因業(yè)主的期望值、業(yè)主的管理水平、工程項目和建筑市場的實際情況的不同而不同。一般以評分方式進行評估,得分最高者中標(biāo)。

        2.1 基于合理最低價法的成本分布函數(shù)博弈模型(信息較對稱時)適用于合理最低價法投標(biāo)的博弈模型在求最優(yōu)解的過程中,成本分布函數(shù)的確定是關(guān)鍵。確定競爭對手承包工程的成本分布函數(shù)f(x),需要參考對手以往的設(shè)計報價記錄,結(jié)合投標(biāo)者現(xiàn)在的發(fā)展,運用一定的數(shù)理統(tǒng)計方法抽象得出,從而可以將企業(yè)的投標(biāo)價格和具體的環(huán)境條件聯(lián)系起來,具有動態(tài)性。

        在具體方法上,首先研究只有兩個投標(biāo)者的成本分布函數(shù)博弈模型建模過程:只有兩個投標(biāo)者參與投標(biāo),即i=1,2。令bi為投標(biāo)者i的報價,ci為投標(biāo)者i的承包成本。假定ci只有i自己確切知道。競爭者之間都相互知道自己和其他投標(biāo)者的ci獨立地取自定義在區(qū)間[m,n]上的分布函數(shù)f(x)。則由以上定義可知投標(biāo)者i的支付ui如下:

        u(b,b,c)=b-c,if,b>b0.5×(b-c),if,b=b0,if,b

        這是最簡單的投標(biāo)報價博弈模型。投標(biāo)者i面臨的問題是:

        max ui=(b-c)f(x)dx,

        其中:b為最優(yōu)報價,c為實際成本,Φ(b)=f-1(b)。

        2.2 基于合理最低價法的模糊預(yù)測博弈模型(信息不對稱時)

        投標(biāo)人投標(biāo)決策分析時往往并不具備完全的資料信息,且競爭對手的投標(biāo)策略是變化的。經(jīng)實例證明采用基于“概率模型”的投標(biāo)報價模型誤差較大,偏于保守;而采用基于博弈模型和模糊預(yù)測的投標(biāo)報價決策方法,更符合信息不完全情況下的投標(biāo)競標(biāo)實際情況,其得出的最優(yōu)報高率f更大,比前者為投標(biāo)人帶來更大的期望收益。因此,在信息不完備情況下的投標(biāo)報價決策中,該投標(biāo)報價決策方法更為有效。

        具體方法是,通過研究收集競爭對手以往的投標(biāo)報價分布情況的統(tǒng)計資料來作為分析的基礎(chǔ),直接建立報高率f與贏標(biāo)率T的函數(shù)關(guān)系。

        對很少遇到的或沒有遇到的對手,則可以運用模糊數(shù)量法來確定其報高率f與贏標(biāo)率T的關(guān)系。模糊預(yù)測模型為:T=A0+Aigf,其中A0=(a0,c0),Ai=(ai,ci)是模糊數(shù),ai為模糊數(shù)的中心值,ci為模糊數(shù)的模糊幅度。

        如果投標(biāo)人在某次投標(biāo)競爭中有m個已知競爭對手,n個未知對手,對成本的估算為c,則對于該投標(biāo)者而言,是首先分別分析已知競爭對手和未知競爭對手總體贏標(biāo)率,并取其大者作為最優(yōu)投標(biāo)報價報高率f*的函數(shù)輸入,求得最優(yōu)報價。

        3結(jié)論

        在博弈模型建立與應(yīng)用中,成本分布函數(shù)模型及模糊預(yù)測模型均是基于已有較成熟的概率統(tǒng)計方法的報高率f的研究,適用于經(jīng)評審的最低價法項目,能夠較好地指導(dǎo)實踐。因此合理最低價法投標(biāo)報價博弈模型的研究具有很強的現(xiàn)實指導(dǎo)意義。

        由于對最低投標(biāo)價的合理性評判尚缺少一致的理想標(biāo)準(zhǔn),復(fù)合標(biāo)底法被廣泛應(yīng)用。由于復(fù)合標(biāo)底可采用多種復(fù)合形式,很難取得這樣的記錄;如果擁有以往與當(dāng)前評標(biāo)方法完全相同的項目,則借助評分矩陣模型,根據(jù)不同的復(fù)合公式建立不同的矩陣模型,分析采集自投標(biāo)報價與標(biāo)底比價的區(qū)間歷史記錄,進而確定最佳報價。因此,對復(fù)合標(biāo)底法投標(biāo)報價的評分矩陣博弈模型的深入研究具有廣泛的現(xiàn)實意義。

        我國的招投標(biāo)制度雖然已實施多年,但有許多的內(nèi)容還需要不斷的完善和補充,本文區(qū)別目前通用的評標(biāo)辦法,針對性地建立博弈模型,對提高招投標(biāo)在綜合決策中的科學(xué)性的有益嘗試,在今后的研究可以通過待實際經(jīng)驗數(shù)據(jù)的積累來進一步驗證其有效性和可靠性。

        參考文獻:

        [1]袁建波,丁夏淑.博弈論在復(fù)合標(biāo)底投標(biāo)中的應(yīng)用[J].中外公路,2005, (8):199-201.

        第6篇:博弈論的概念范文

        受到近年來理論界多視角和多元研究方法的啟示,作者認(rèn)為,高校的學(xué)生教育管理就其實質(zhì)來說,是學(xué)校和學(xué)生雙方在一定規(guī)則下各自尋求最優(yōu)理性決策的互動行為,是雙方為各自利益最大化所進行的利益博弈。

        關(guān)鍵詞: 博弈 高校學(xué)生 教育管理

        博弈論(game theory)又稱對策論,它是研究決策主體(決策者)在沖突或合作中的策略選擇的理論。它要解決的主要問題是,當(dāng)兩個主體的行為互受對方行為的影響時,各方應(yīng)該選擇何種行動方案,才能實現(xiàn)各自收益的最大化。

        在我國,雖然博弈論的研究起步很晚,但博弈的思想?yún)s源遠流長。早在兩千多年前的春秋時代,著名的“田忌賽馬”就是一個經(jīng)典的博弈事例。它揭示的是,在給定齊王的比賽策略不變的情況下,田忌應(yīng)該采用何種策略才能取得比賽的勝利。這實際上就是現(xiàn)代博弈論中的完全信息條件下的兩人博弈問題。我國古代典籍中的《孫子兵法》、《三十六計》以及《三國志》中都有大量的博弈事例,蘊育了豐富和深刻的博弈論思想。

        博弈論作為一種理論最早是由美國數(shù)學(xué)家馮?諾依曼(Von Neumann)在1937年提出的,而馮?諾依曼(Von Neumann)和摩根斯坦恩(Morgenstern)于1944年合著的《對策論與經(jīng)濟行為》概括了經(jīng)濟主體的典型行為特征,提出了多種基本的對策模型的概念和分析方法,創(chuàng)立了對策論的科學(xué)體系從而成為博弈論誕生的標(biāo)志。50年代,納什(Nash)等人奠定了現(xiàn)代博弈理論的基石;60年代,澤爾騰(Selten)將納什均衡的概念引入動態(tài)分析,提出了“精煉納什均衡”概念;海薩尼(Harsanyi)則把不完全信息引入博弈論的研究。80年代,克瑞普斯(Kreps)和威爾遜(Wilson)發(fā)展了動態(tài)不完全信息博弈論,將博弈論的研究提高到一個嶄新的水平。

        博弈論作為一種方法,最重要功能就是為其他學(xué)科提供研究方法。實際上,博弈論的應(yīng)用范圍不僅包括經(jīng)濟學(xué),在政治學(xué)、社會學(xué)、管理學(xué)、生物學(xué)、心理學(xué)、犯罪學(xué)、軍事、外交、國際關(guān)系、公共選擇和法律等諸多學(xué)科和領(lǐng)域,博弈理論也得到了廣泛的應(yīng)用。之所以如此,主要是由博弈論的特殊視角和特殊方法決定的。博弈論研究決策與其他理論研究決策的最大區(qū)別是,博弈論研究的決策是在一種互動狀態(tài)下的策略選擇,而不是一種孤立和靜態(tài)的策略選擇。比如,微觀經(jīng)濟學(xué)研究消費者的消費選擇,就是在給定一個價格和收入?yún)?shù)的情況下來說明消費者怎樣實現(xiàn)效用最大化的問題,在這里,個人效用函數(shù)只是價格和收入的函數(shù)而不是其他人的選擇的函數(shù)。而我們知道,一定時期的價格實際上是市場上所有人行為選擇的結(jié)果,當(dāng)每一個市場參與者都根據(jù)價格來進行選擇的時候,價格就會發(fā)生變化,這就意味著,單個主體進行決策所依據(jù)的價格參數(shù)中,包含著其他無數(shù)主體的決策過程。因此,單個主體的效用函數(shù)不僅依賴于他個人的選擇,而且也依賴于他人的選擇。但微觀經(jīng)濟學(xué)則沒有考慮這一問題,它僅僅是把其他人的選擇后果歸結(jié)為一個價格參數(shù),這樣,單個主體決策時面對的就是一個價格,而不是其他的決策主體。他既不會考慮自己的選擇對別人選擇的影響,也不必考慮別人選擇對自己選擇的影響。博弈論則正好相反,它強調(diào)是,單個主體間的選擇是互相聯(lián)系互相影響的,個人的效用不僅依賴于自己的選擇,而且也依賴于他人的選擇。因此,博弈論研究的決策實質(zhì)上是一種存在外部經(jīng)濟條件時的個人決策。正是由于博弈論研究的“決策”更接近現(xiàn)實且普遍存在于各個領(lǐng)域,因而博弈論的應(yīng)用十分廣泛。

        雖然博弈理論的應(yīng)用非常廣泛,但是用博弈論作為分析方法運用在高校學(xué)生教育管理研究中的文章卻很少。

        高校學(xué)生教育管理問題的研究主體,過去多由從事學(xué)生教育管理的人員組成,其研究多數(shù)局限于實際工作的對策性研究領(lǐng)域。但最近幾年高校學(xué)生教育管理研究的主體數(shù)量迅速擴大,且日益多元。一批經(jīng)濟學(xué)、社會學(xué)等領(lǐng)域的學(xué)者從不同學(xué)科的視角和方法介入這一領(lǐng)域,為這一領(lǐng)域的研究開辟了更加廣闊的前景。正是在這樣一種背景下,博弈論作為一種研究方法,也被運用高等教育管理的研究之中,并且取得了值得注意的研究成果。如吳曉莉,黃芳在其《高等教育與博弈》提出的“高等教育領(lǐng)域存在許多對博弈的組合”的觀點;郭萍,胡軍對高等教育服務(wù)中的信息不對稱及規(guī)制的分析以及“教育評估中介應(yīng)該與政府、市場互補,進行合作規(guī)制”的主張,都為運用博弈論進一步研究教育管理問題提供了有益的啟示。作者認(rèn)為,大學(xué)生是高校教育管理的主要對象之一。學(xué)生的教育和管理是高等教育管理工作最重要的內(nèi)容。對高校學(xué)生的有效教育和管理有助于提高學(xué)生學(xué)習(xí)的積極性、主動性和自覺性,促進學(xué)生的思想道德的提升,提高學(xué)生的生活能力及素質(zhì),從而有助于高校管理目標(biāo)的最終實現(xiàn)。因此,在已有研究成果的基礎(chǔ)上,運用博弈論的方法進一步開展高校學(xué)生教育和管理問題的研究,從新的角度來審視高校的學(xué)生工作,它可以幫助人們拓展學(xué)生管理工作的思路,提高高校學(xué)生學(xué)習(xí)、生活以及思想政治工作的水準(zhǔn)和質(zhì)量,有利于學(xué)校培養(yǎng)更多更好的人才。同時也可以創(chuàng)新學(xué)生管理研究的方法,拓展了學(xué)生管理研究的理論視野,對于加強和改進大學(xué)生思想政治工作,提高教育質(zhì)量,建設(shè)和諧校園都具有十分重要的意義。

        高校學(xué)生教育管理涉及的主體就是學(xué)校和學(xué)生。作為學(xué)校來說,進行學(xué)生管理的目的就是引導(dǎo)學(xué)生努力學(xué)習(xí),力爭使最多的學(xué)生達到自己的人才培養(yǎng)規(guī)格,引導(dǎo)學(xué)生努力學(xué)習(xí),實質(zhì)就是要求學(xué)生增加學(xué)習(xí)成本,即學(xué)生的時間成本,物質(zhì)成本以及克制某種欲望而付出的精神成本等等。而在假定學(xué)生都是理性經(jīng)濟人的前提下,學(xué)生的目的則是以盡量少的成本來取得學(xué)校的認(rèn)同,這種認(rèn)同的直接表現(xiàn)就是順利畢業(yè)。學(xué)校希望學(xué)生順利畢業(yè),學(xué)生也希望學(xué)校能允許自己順利畢業(yè),這一點決定了二者之間具有合作關(guān)系,其次,雙方都對對方有要求,學(xué)校要求學(xué)生通過增加學(xué)生的成本來使學(xué)生順利畢業(yè);而學(xué)生則希望在不增加自己成本的情況下自己也能順利畢業(yè)。由于二者要求的對立,因而使二者之間具有競爭關(guān)系。這種競爭的實質(zhì)就是爭奪決定學(xué)生學(xué)習(xí)成本增加或減少的主動權(quán)。在這種合作與競爭的關(guān)系中,雙方也有不同的手段和對策,學(xué)校的手段就是在符合國家學(xué)生管理規(guī)章的前提下,通過制定激勵和處分制度來引導(dǎo)和約束學(xué)生的學(xué)習(xí)行為、思想道德和生活行為,包括設(shè)立獎學(xué)金,評優(yōu)和進行違紀(jì)處分等等。學(xué)生則是在認(rèn)可學(xué)校學(xué)生管理工作的前提下,努力尋求有利于既能減少成本,又能達到自己目的的對策和手段。在這種情況下,學(xué)校和學(xué)生的任何一種行為都會影響雙方進一步的行動以及未來的對策,從而影響學(xué)生的潛在資源在學(xué)習(xí)和休閑兩種用途中的分配。從理論上說,當(dāng)我們把教育看成是一種社會公器時,只有學(xué)校擁有主導(dǎo)權(quán)才符合權(quán)利配置最優(yōu)原則。而由于學(xué)生作為受教育對象的不成熟性,又決定了這一配置過程必然充滿了競爭和不確定性。因此,學(xué)校學(xué)生管理中學(xué)校和學(xué)生的關(guān)系,必然是圍繞爭奪決定學(xué)生潛在資源分配的主導(dǎo)權(quán)而展開的博弈關(guān)系。

        同時,我們還要看到,在高校學(xué)生教育管理中,不僅存在著學(xué)校和學(xué)生之間的博弈,而且也存在學(xué)生之間的博弈,比如,在學(xué)校對學(xué)生實施獎勵和處分時,就存在學(xué)生與學(xué)生的博弈。當(dāng)學(xué)校要對表現(xiàn)好的學(xué)生進行獎勵時,由于名額有限,學(xué)生之間必然存在為獲獎而展開的競爭,在競爭中也就必然存在個人競爭策略的選擇問題。同樣,當(dāng)學(xué)校要對各種違紀(jì)行為進行處罰時,違紀(jì)學(xué)生中也存在一個如何逃避處罰或減輕處罰的策略選擇問題。

        總之,高校學(xué)生教育管理過程,決不是一種單向的管理與服從的過程,而是各主體之間互相影響的一個互動過程。一方面,學(xué)校的選擇要主導(dǎo)學(xué)生的行為和選擇,但同時,學(xué)生的選擇也要影響學(xué)校的選擇以及學(xué)生之間的選擇。

        參考文獻:

        [1]張維迎.博弈論與信息經(jīng)濟學(xué)[M].上海:上海人民出版社,2001:35-45.

        [2]謝識予.經(jīng)濟博弈論[M]. 上海:上海復(fù)旦大學(xué)出版社,1997:21-22.

        [3]林勇娟,倪水雄.大學(xué)生管理工作中的博弈思想[J].高教論壇,2004(1):5-8.

        [4]鄔補科,沈曉敏.新時期高校學(xué)生管理工作的現(xiàn)狀及創(chuàng)新[J].財經(jīng)論叢,2003(9):13-15.

        [5]岳超源.決策理論與方法[M].北京:科學(xué)出版社,2003:45-47.

        [6]劉青秀,賈云鵬.論高等教育中供求雙方權(quán)利和義務(wù)的不對等[J].江蘇高教,2004(4):35-38.

        第7篇:博弈論的概念范文

        【關(guān)鍵詞】初步博弈論,基本理論,日常應(yīng)用

        前言

        博弈論是二人在平等的對局中為達到取勝的目的而各自利用對方的策略變換自己的對抗策略的思想。博弈論思想古已有之,我國古代的《孫子兵法》就是最早的一部博弈論著作。最初主要研究象棋、賭博中的勝負(fù)問題,人們對博弈局勢的把握只停留在經(jīng)驗上,沒有向理論化發(fā)展。1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦共著的《博弈論與經(jīng)濟行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)的應(yīng)用于經(jīng)濟領(lǐng)域,奠定了這一學(xué)科的基礎(chǔ)和理論體系。此外,塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。今天博弈論已發(fā)展成一門較完善的學(xué)科。

        一、博弈論的概念

        博弈論是研究在策略性環(huán)境中如何進行策略性決策和采取策略性行動的科學(xué)。這里,策略性環(huán)境是指,每一個人進行的決策和采取的行動都會對其他人產(chǎn)生影響;策略性決策和策略性行動是指,每個要根據(jù)其他人的可能反應(yīng)來決定自己的決策和行動。

        二、博弈論的類型

        博弈論有兩種基本的類型,即“同時博弈”和“序貫博弈”。前者是參與人同時進行決策或行動的博弈,后者是參與人的決策和行動有先有后的博弈。這里,所謂的“同時”或“先后”主要是看參與人在決策時是否知道其他參與人的決策,而并不一定取決于物理意義上的時間。當(dāng)然,除了上述兩種基本的類型,還有其他不同的分類方式。

        三、博弈的要素

        博弈的目的是利益,利益形成博弈的基礎(chǔ)。經(jīng)濟學(xué)中最基本的假設(shè)就是經(jīng)濟人或理性人的目的在于使收益最大化。參與博弈者正是為了自身收益的最大化而相互競爭。也就是說,參與博弈的各方形成相互競爭、相互對抗的關(guān)系,以爭得利益的多少來決定勝負(fù),一定的外部條件又決定了競爭和對抗的具體形式,這就形成了博弈。博弈的要素大致上可以包含以下四點:⑴2個或2個以上的參與者;⑵要有參與各方爭奪的資源或收益;⑶參與者有自己能夠選擇的策略;⑷參與者擁有一定量的信息。

        四、日常生活中的博弈策略

        正如王春元在其編著的《博弈論的詭計》中所言“博弈論的目的在于巧妙的策略,而不是解法”。學(xué)習(xí)博弈論的目的,不是為了享受博弈分析的過程,而在于贏得更好的結(jié)局。博弈的思想既然來自現(xiàn)實生活,它就既可以用數(shù)學(xué)工具來高度抽象地表述,又可以用日常事例來具體說明并運用。博弈時時存在,它就在你的身邊。

        在博弈論中,一個著名例子就是塔克給出的“囚徒困境”模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。假設(shè)警察懷疑甲乙兩人作案,但他們手中并沒有掌握確鑿證據(jù),于是警方將兩人分別置于不同的兩個房間內(nèi)進行審訊,并分別告知兩名犯罪嫌疑人:對他們犯罪事實的認(rèn)定及相應(yīng)的量刑完全取決于他們自己的供認(rèn)。

        兩名囚徒面臨的選擇及帶來的后果組合可以查看下表。

        從上表中可以知道:每個犯罪嫌疑人都有兩種可供選擇的策略:供認(rèn)或不供認(rèn)。而且,每個犯罪嫌疑人選擇的最優(yōu)策略不依賴于同伙的策略選擇?;谌耸抢硇缘倪@一前提,由于犯罪嫌疑人不知道對方的想法,最理性的博弈策略,就是選擇供認(rèn)。這時的策略,可稱之為占優(yōu)策略。不管甲乙兩人誰供認(rèn),都將得到減輕懲罰的結(jié)果。顯然,這一策略一定是所有其他參與人選擇某一特定策略時該參與者的占優(yōu)策略。但值得注意的一個問題是,采用優(yōu)勢策略得到的最壞結(jié)果,并不一定比采用另外一個策略得到的最佳結(jié)果要好。

        除了上例,博弈論在生活中的應(yīng)用還有很多,譬如:重復(fù)博弈的應(yīng)用。以我國俗語“以牙還牙,以眼還眼”來說,在沒有法律和道德的約束下,對自己最有利的一種策略是一報還一報。重復(fù)的博弈理論導(dǎo)致了合作的產(chǎn)生,但是誰也不能保證合作的繼續(xù),因為合作的代價是建立在損害個人利益基礎(chǔ)之上的。如果個人放棄未來收益或背叛當(dāng)前收益大于未來收益則背叛風(fēng)險將仍然存在。

        五、博弈論的局限性

        “任何一個理論體系必定是不完全的,任何理論都包含了既不能證明為真也不能證明為假的命題,對這個世界的最好描述可能只有其本身?!辈┺恼撘彩侨绱?,其基本假設(shè)之一就是人是理性的。所謂理性的人是指行動者具有推理能力,在具體策略選擇時的目的是使自己的利益最大化。而現(xiàn)實生活中,人們在做決策時往往是有限理性的。因為人類的精力和時間是有限的,人不可能具備完全理性,不可能掌握所有知識和信息?;ㄙM大量的時間、財力、物力去尋求所有信息,企圖做出最優(yōu)決策,有時反而是最不理性的舉動。

        六、博弈論的意義

        從理論上講,博弈論是研究理性的行動者相互作用的形式理論,而實際上正深入到經(jīng)濟學(xué)、政治學(xué)、社會學(xué)等并被各社會科學(xué)所應(yīng)用。

        博弈論代表著一種全新的分析方法和全新的思想。諾貝爾經(jīng)濟學(xué)獎獲得者保羅·薩繆爾遜如是說“要想在現(xiàn)代社會做個有價值的人,你就必須對博弈論有個大致的了解”,也可以這樣說,要想贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。

        參考文獻:

        [1]王春永(2007.1).博弈論的詭計.北京.中國發(fā)展出版社[M]

        第8篇:博弈論的概念范文

        引言

        一、兩個簡單的例子

        1.1 老鷹(Hawk)與鴿子(Dove)博弈

        1.2 系統(tǒng)選擇博弈

        二、進化博弈理論的產(chǎn)生及其發(fā)展

        2.1 理性的由來及其缺陷

        2.2 心理學(xué)研究成果及有限理性概念的提出

        2.3 進化博弈理論的產(chǎn)生及其發(fā)展

        三、進化博弈理論的基本內(nèi)容

        3.1 進化博弈理論基本模型分類

        3.2 進化博弈理論基本均衡概念-----進化穩(wěn)定策略

        3.3 進化博弈理論基本動態(tài)概念----模仿者動態(tài)

        四、進化博弈理論的應(yīng)用

        五、傳統(tǒng)方法的缺陷及進化博弈理論研究方法的現(xiàn)實性

        5.1 新古典經(jīng)濟學(xué)均衡分析法的缺陷

        5.2 經(jīng)典博弈理論的策略互動分析法及其缺陷

        5.3 進化博弈理論局部動態(tài)分析方法的現(xiàn)實性

        5.3.1 局部動態(tài)分析法的均衡觀

        5.3.2 局部動態(tài)法的時間觀

        5.3.3 局部動態(tài)法的均衡選擇觀

        5.3.4 局部動態(tài)法的特殊性

        六、結(jié)論

        參考文獻

        摘要

        本文從兩個簡單的博弈例子出發(fā),以通俗的語言全面介紹了進化博弈理論的理性基礎(chǔ)及其形成、發(fā)展、基本內(nèi)容和部分應(yīng)用,在此基礎(chǔ)上文章進一步比較了新古典經(jīng)濟學(xué)、經(jīng)典博弈理論 ①及進化博弈理論在研究方法上的不同之處,并特別強調(diào)了進化博弈理論局部動態(tài)法的均衡觀、時間觀、均衡選擇觀及方法上的特殊性。進化博弈理論的局部動態(tài)分析方法既是經(jīng)濟學(xué)研究方法的一次創(chuàng)新又是經(jīng)濟學(xué)直面現(xiàn)實的有力武器。

        關(guān)鍵詞:沉默互動;社會互動;進化穩(wěn)定策略;模仿者動態(tài);均衡分析法;局部動態(tài)法

        引言

        為什么同樣一項經(jīng)濟制度在某個地方對經(jīng)濟發(fā)展有積極的推動作用而在另一個地方對經(jīng)濟發(fā)展卻起著消極的阻礙作用?為什么能夠有效降低交易費用的中介在一些地方會出現(xiàn)而在另一些地方卻不能出現(xiàn)?為什么同樣的管理方法在一個地方顯示出高效率而在另一地方卻不具有效率?諸如此類的問題,新古典經(jīng)濟學(xué)利用均衡分析法都無法給出令人滿意的答案。均衡分析法的最大缺陷是把經(jīng)濟系統(tǒng)中參與人看作是互不聯(lián)系的單個人(僅研究單個生產(chǎn)者或消費者的行為),不能把其所考察的問題放在一定的環(huán)境中去,該方法完全忽略了制度環(huán)境、社會環(huán)境及人文環(huán)境等對參與人行為的影響,單純考察某個條件與結(jié)果之間的一一對應(yīng)關(guān)系。因而,無法對現(xiàn)實中出現(xiàn)的諸多現(xiàn)象給予合理的解釋。博弈理論盡管把參與人之間行為互動關(guān)系納入到了模型之中,但依然沒能跳出新古典均衡分析法的基本框架,并且由于其對理性賦予更強的假定,使得該理論更加脫離現(xiàn)實。進化博弈理論則一反常規(guī),從一種全新的視角來考察經(jīng)濟及社會問題,它所提供的局部動態(tài)研究方法是從更現(xiàn)實的社會人出發(fā),把其所考察的問題都置于一定的環(huán)境中進行更全面的分析,因而,其結(jié)論更接近于現(xiàn)實且具有較強的說服力。進化博弈理論屬于經(jīng)濟學(xué)的前沿理論,該理論從其理論框架建立到現(xiàn)在僅僅只有近三十年的歷史,但其在經(jīng)濟學(xué)、社會學(xué)、生態(tài)學(xué)等領(lǐng)域卻得到了廣泛的應(yīng)用,近年來已經(jīng)成為主流經(jīng)濟的研究方法之一。在我國由于歷史原因,對經(jīng)濟學(xué)的研究起步較晚,特別對進化博弈這樣的前沿理論更是知者甚少,本文的主要目的是以通俗的語言介紹進化博弈理論的相關(guān)內(nèi)容及其應(yīng)用,讓讀者對該理論有一個全面的了解。

        本文的結(jié)構(gòu)如下:第一部分給出進化博弈理論的兩個典型的例子;第二部分對進化博弈理論的產(chǎn)生及其發(fā)展進行闡述;第三部分對進化博弈理論的基本內(nèi)容進行簡要的介紹;第四部分概述進化博弈理論的有關(guān)應(yīng)用;第五部分論述傳統(tǒng)的經(jīng)濟學(xué)研究方法的缺陷及進化博弈理論研究方法的現(xiàn)實性;第六部分對進化博弈理論的發(fā)展及理論前景進行簡要的說明。

        一、兩個簡單的例子

        為了下文說明的方便,本文先給出進化博弈理論中兩個具有代表性的例子,在此基礎(chǔ)上再進一步給出該理論的基本內(nèi)容及其研究方法的基本特點。

        1.1 老鷹(Hawk)與鴿子(Dove)博弈

        假定一個生態(tài)環(huán)境中有老鷹與鴿子兩種動物,它們?yōu)榱松嫘枰獱帄Z有限的資源(如食物或生存空間等)而競爭。老鷹一般比較兇悍,必要時在斗爭中直到重傷。鴿子一般比較溫馴,競爭時在強敵面前常常退縮。競爭中獲勝者得到了生存資源就可以更好地繁衍后代,重傷者則不利于其后代生長,即會減少其后代的數(shù)量。如果群體中老鷹與鴿子相遇并競爭資源,那么老鷹就會輕而易舉地獲得全部資源,而鴿子由于害怕強敵退出爭奪,從而不能獲得任何資源(當(dāng)然不會受傷);如果群體中兩個鴿子相遇并競爭生存資源,由于它們均膽小怕事不愿意戰(zhàn)斗,結(jié)果平分資源;如果群體中兩個老鷹相遇并競爭有限的生存資源,由于它們都非常勇猛而相互殘殺,直到雙方受到重傷而精疲力竭,結(jié)果雖然雙方都獲得部分生存資源但損失慘重,入不敷出。假定競爭中得到全部資源為50個單位(該數(shù)字也可以表示為生物的適應(yīng)度、繁殖成活率或后代數(shù)量);得不到資源則表示其適應(yīng)度為零;雙方重傷則用來表示。于是老鷹、鴿子兩種動物進行的資源競爭可以用一個對稱博弈來描述,博弈的支付矩陣如下:

        操作依賴于該群體的初始狀態(tài)。如果初始時,該宿舍有多于4人使用操作系統(tǒng),那么該宿舍所有學(xué)生最終都會使用該操作系統(tǒng);否則所有學(xué)生最終會使用操作系統(tǒng)。

        二、進化博弈理論的產(chǎn)生及其發(fā)展

        進化博弈理論是經(jīng)濟學(xué)研究方法的一次創(chuàng)新,該理論從否定傳統(tǒng)理論賴以成立的基礎(chǔ)----理性人假定出發(fā)而建立起來一個新的分析框架,它結(jié)合了生態(tài)學(xué)、社會學(xué)、心理學(xué)及經(jīng)濟學(xué)的最新發(fā)展成果,從有限理性的社會人出發(fā)來分析參與人的資源配置行為。

        2.1 理性的由來及其缺陷

        經(jīng)濟學(xué)自從古希臘哲學(xué)中分離出來并成為一門系統(tǒng)的學(xué)問,是在亞當(dāng)•斯密1776年發(fā)表《國富論》之后。以斯密為代表的古典經(jīng)濟學(xué)關(guān)注的核心是資源的稀缺程度如何能被人類經(jīng)濟活動所減少,他們關(guān)注的重點不是資源配置問題而是國民財富的增長及國別差異的原因。1890年馬歇爾《經(jīng)濟學(xué)原理》的出版,標(biāo)志著新古典經(jīng)濟學(xué)的成形,馬歇爾之后,新古典經(jīng)濟學(xué)關(guān)注的核心逐漸轉(zhuǎn)向在給定稀缺程度下資源的最優(yōu)配置問題。稀缺資源的配置是需要人的參與,也就是說經(jīng)濟學(xué)研究的問題演變?yōu)殛P(guān)于經(jīng)濟中參與人如何把稀缺的資源配置到效率最高地方去的問題,強調(diào)個體行為在資源配置中的作用。經(jīng)濟中參與人的決策行為是通過高度復(fù)雜的思維活動作出的,為了更好地從微觀個體行為來解釋資源配置問題,新古典經(jīng)濟學(xué)借用了哲學(xué)中“理性”概念對復(fù)雜的人類行為過程進行了抽象的假定。然而,理性一詞用于經(jīng)濟學(xué)時卻對其含義的理解與哲學(xué)中對其含義的理解已經(jīng)有了明顯的區(qū)別。哲學(xué)中的理性是指人類所特有的用以探索自然和社會奧秘的認(rèn)知能力,當(dāng)代偉大的哲學(xué)家康德在其著作《純理性批判》一書中指出,人類理性即認(rèn)知能力并不是萬能的,而是有限的。經(jīng)濟學(xué)中的理性則是指一種行為方式,具體地說即是經(jīng)濟中參與人對其所處世界的各種狀態(tài)及不同狀態(tài)對自己支付的意義都具有完全信息,并且在既定的條件下每個參與人都具有選擇使自己獲得最大效用或最大利潤的能力。

        經(jīng)濟學(xué)家認(rèn)為理性是至高無上的,人們憑借理性就可以完全地認(rèn)識自然與社會。經(jīng)濟學(xué)中對理性的含義經(jīng)過這樣的處理以后,就使得經(jīng)濟學(xué)能夠充分運用數(shù)學(xué)理論發(fā)展的成果來進行分析。為了應(yīng)用數(shù)學(xué)工具并更好地處理經(jīng)濟問題,傳統(tǒng)經(jīng)濟學(xué)家們從偏好,信念及理性三個方面來界定經(jīng)濟主體的特征,其中信念就是個體認(rèn)為不同結(jié)果將會出現(xiàn)的基于個體所獲信息之上的條件概率。偏好則是基于不同結(jié)果的信念之上的序。理性是根據(jù)上述偏好及信念,個體獲得最優(yōu)決策的程度以及個體根據(jù)已經(jīng)獲得的信息來修正其信念的能力。這三個特征使得經(jīng)濟學(xué)研究的對象由現(xiàn)實人轉(zhuǎn)向了理想化的對象,經(jīng)濟學(xué)越來越偏離了現(xiàn)實。

        由理性概念而引致的缺陷首先表現(xiàn)在理性人具有無限的信息收集及處理能力的均衡觀,認(rèn)為經(jīng)濟系統(tǒng)常常處于均衡狀態(tài),非均衡只是一種暫時的現(xiàn)象,當(dāng)受到外生因素擾動而使系統(tǒng)偏離均衡狀態(tài)時,系統(tǒng)會以線性的方式回歸均衡,這種機械式線性反應(yīng)的均衡觀來源于牛頓力學(xué),由此而得出的比較靜態(tài)分析法完全忽視了系統(tǒng)受到非線性擾動及連續(xù)因素的影響。其次表現(xiàn)在由全知全能的理性人而引致的均衡跳躍觀,認(rèn)為經(jīng)濟系統(tǒng)達到均衡或者從一個均衡到另一個均衡是不需要時間的,認(rèn)為時間是可逆的,即經(jīng)濟變量與物理學(xué)的變量一樣,只要條件相同系統(tǒng)的均衡也就相同,市場和經(jīng)濟對于過去的記憶是短暫的或者是沒有的。這種應(yīng)用經(jīng)典牛頓力學(xué)分析方法來分析高度復(fù)雜的參與人經(jīng)濟行為使得其預(yù)測效果大打折扣。最后表現(xiàn)在其比較靜態(tài)分析方法上,傳統(tǒng)經(jīng)濟學(xué)的最基本分析方法----比較靜態(tài)分析法賴以成立的基礎(chǔ)是假定經(jīng)濟系統(tǒng)只受到外界一個個相互獨立、互不重疊的沖擊的影響,或者當(dāng)一個因素的影響消除之后,下一因素才開始對經(jīng)濟系統(tǒng)產(chǎn)生影響。我們知道現(xiàn)實世界是普遍聯(lián)系的,各種因素之間不可能相互獨立,系統(tǒng)中任何一個因素的變動都會引起其他因素的變動,這些因素之間相互作用的時間可能很短也可能很長,各因素對最終目標(biāo)會產(chǎn)生不同程度的影響。比較靜態(tài)法卻只見局部不見整體,企圖通過比較不同均衡來找出系統(tǒng)達到均衡的條件,因此得不出符合現(xiàn)實的結(jié)論,其研究方法上的局限性大大降低了其理論的現(xiàn)實意義。

        2.2 心理學(xué)研究成果及有限理性概念的提出

        隨著經(jīng)濟學(xué)家對理論研究的深入,特別近來實驗經(jīng)濟學(xué)的迅速發(fā)展,主流經(jīng)濟學(xué)賴以成立的基礎(chǔ)“理性人”假定及其基本的比較靜態(tài)均衡分析法越來越受到了人們的質(zhì)疑。相繼出現(xiàn)了許多其他的研究方法,其中在經(jīng)濟學(xué)中影響最大的就是心理學(xué)的研究方法。心理學(xué)應(yīng)用于經(jīng)濟分析有著非常曲折的歷史。事實上,斯密、馬歇爾、庇古、費雪爾和凱恩斯等一批古典經(jīng)濟學(xué)家都仔細(xì)地分析了偏好和信念的心理學(xué)基礎(chǔ)。但從1940’s開始,一方面受到薩繆爾森及??怂沟刃乱慌苫诶硇约俣ń?jīng)濟學(xué)家的影響,心理分析在經(jīng)濟學(xué)中的地位慢慢地被降低了;另一方面理性模型也遇到了許多如Allais(1952)悖論等難以給出合理解釋的經(jīng)濟現(xiàn)象。于是1960’s開始,許多微觀經(jīng)濟學(xué)家再次運用心理學(xué)研究方法來解釋現(xiàn)實中的異?,F(xiàn)象,宏觀經(jīng)濟學(xué)也把經(jīng)驗法則和適應(yīng)性預(yù)期納入到其模型之中,正是在這一時期心理學(xué)家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初隨著Robert Lucas等人提出的理性預(yù)期理論、Selten、Kreps等倡導(dǎo)的強調(diào)正確信念及貝葉斯修正的博弈理論及Stiglitz、Spence等研究的信息經(jīng)濟學(xué)理論相繼成為主流經(jīng)濟學(xué)的一部分,經(jīng)濟學(xué)界再一次掀起了排除滲透在經(jīng)濟學(xué)領(lǐng)域中心理學(xué)研究方法的熱潮,心理的研究方法在經(jīng)濟學(xué)界幾乎無立足之地,嚴(yán)格理性假定席卷整個經(jīng)濟學(xué)界。行為經(jīng)濟學(xué)的發(fā)起者Amos Tversky在經(jīng)濟學(xué)界根本找不到志趣相投者。1970’s末期,隨著心理學(xué)家Amos Tversky與Kahneman合作發(fā)表了一系列應(yīng)用心理分析方法來研究經(jīng)濟學(xué)問題的原創(chuàng)性文章,如1974年他們在Science發(fā)表的Judgment under uncertainty: Heuristics and biases,1979年他們合作在Econometrica發(fā)表Prospect theory: An analysis of decision under risk,慢慢消除了經(jīng)濟學(xué)界中存在的對心理學(xué)分析方法的偏見,此后應(yīng)用心理分析方法來解釋經(jīng)濟現(xiàn)象的文獻見諸于各種經(jīng)濟學(xué)期刊之中,心理分析方法也漸漸地成為了主流經(jīng)濟學(xué)的研究方法之一。

        進入1980’s,隨著經(jīng)典博弈理論、生態(tài)理論及心理學(xué)理論研究的深入發(fā)展,特別是心理學(xué)家西蒙把其在心理學(xué)領(lǐng)域研究的成果直接應(yīng)用經(jīng)濟分析并因此獲得了諾貝爾經(jīng)濟學(xué)獎,極大地激勵著經(jīng)濟及社會學(xué)家從現(xiàn)實人行為出發(fā)來解釋經(jīng)濟及社會現(xiàn)象。心理學(xué)研究表明人類認(rèn)知過程首先表現(xiàn)為人們通過一種“感知秩序”進行學(xué)習(xí)活動,并形成分散的非同質(zhì)的知識,其中“感知秩序”是指人的理解力、知識和人類行動之間的關(guān)系;其次表現(xiàn)為個體通過學(xué)習(xí)所達到的理性程度的有限性,組織學(xué)習(xí)個體學(xué)習(xí)行為的整合而形成的多層次“理性結(jié)構(gòu)”,個體理性便會在一個累積性的組織或制度環(huán)境中得到塑造和提高并發(fā)揮作用,在這個過程中,個體學(xué)習(xí)行為總會受到組織、習(xí)慣和文化等制度性的限制和影響。西蒙認(rèn)為人類并不是完全理性而是有限理性的,因為人類認(rèn)知能力有著心理的臨界極限,人類進行推理活動需要消耗大量的能量,推理也是一種相對稀缺的資源,另外決策者決策時需要大量的信息,而這些信息是不可能免費獲得的,獲得決策所需要的信息是需要大量成本的??紤]到參與人有限的知識水平、有限的推理能力、有限的信息收集及處理能力,經(jīng)濟主體的決策行為并非總是最大化的結(jié)果,其決策受到參與人所處的社會環(huán)境、過去的經(jīng)驗、日常慣例及其他人相似情形下的行為選擇等因素的影響。在有限理性條件下,由于參與人無法免費獲得決策所需要的全部信息,并且參與人即使獲得了決策所需要的全部信息也可能由于有限的計算能力而無法得出最優(yōu)決策。因此,參與人只能采取模仿、學(xué)習(xí)等簡單的直觀決策方法或一些固定的常規(guī)來進行決策。人類的決策結(jié)果受到復(fù)雜的認(rèn)知過程的影響,不同的人或者同一個人在不同時間即使給出相同的條件也可能會得出不同的決策結(jié)果,即決策結(jié)果受到認(rèn)知過程的路徑影響。

        2002年諾貝爾經(jīng)濟學(xué)獎得主之一心理學(xué)家丹尼爾·卡內(nèi)曼(Daniel Kahneman)將源于心理學(xué)的綜合洞察力應(yīng)用于研究在不確定條件下參與人的決策過程及行為結(jié)果并展示了人為決策是如何異于標(biāo)準(zhǔn)經(jīng)濟理論預(yù)測的結(jié)果。在1979年,他與有著深厚數(shù)學(xué)及哲學(xué)背景的心理學(xué)家特韋爾斯基(Tversky)提出了震撼經(jīng)濟學(xué)界的“前景理論”(Prospect theory)。他們的發(fā)現(xiàn)激勵了新一代經(jīng)濟學(xué)研究人員運用認(rèn)知心理學(xué)來研究經(jīng)濟學(xué),使經(jīng)濟學(xué)的理論更加豐富。一個理論獲得諾貝爾經(jīng)濟學(xué)獎不僅是對獲獎?wù)哌^去成就的肯定,更主要說明了獲獎理論將會成為主流經(jīng)濟學(xué)未來的發(fā)展方向。2002年諾貝爾經(jīng)濟學(xué)獎授予給丹尼爾·卡內(nèi)曼標(biāo)志著經(jīng)濟學(xué)的研究對象從傳統(tǒng)的“經(jīng)濟人”轉(zhuǎn)向現(xiàn)實的“社會人”,經(jīng)濟學(xué)直面現(xiàn)實。如何從有限理性出發(fā)來研究參與人的行為,許多經(jīng)濟學(xué)家對之進行了廣泛而深入的研究并提出了許多理論,在這些理論之中影響最大且受到了經(jīng)濟學(xué)界普遍接受的理論即進化博弈理論。

        2.3 進化博弈理論的產(chǎn)生及其發(fā)展

        進化博弈理論源于對生態(tài)現(xiàn)象的解釋,1960年代生態(tài)學(xué)家Lewontin就開始運用進化博弈理論的思想來研究生態(tài)問題。生態(tài)學(xué)家從動植物進化的研究中發(fā)現(xiàn),動植物進化結(jié)果在多數(shù)情況下都可以用博弈論的納什均衡概念來解釋。然而,博弈論是研究完全理性的人類互動行為時提出來的,為什么能夠解釋根本無理性可言的動植物的進化現(xiàn)象呢?我們知道動植物的進化遵循達爾文“優(yōu)勝劣汰”生物進化理論,生態(tài)演化的結(jié)果卻能夠利用博弈理論來給予合理的解釋,這種巧合意味著我們可以去掉經(jīng)典博弈理論中理性人假定的要求。另外,1960年代生態(tài)學(xué)理論研究取得突破性的進展,非合作博弈理論研究成果也不斷涌現(xiàn)并日趨成熟,進化博弈理論具備了產(chǎn)生的現(xiàn)實及理論基礎(chǔ)。

        進化博弈理論應(yīng)用于研究經(jīng)濟學(xué)問題在學(xué)術(shù)界曾經(jīng)引起極大的爭議,爭論的焦點在于理性假定。當(dāng)時由于理性概念在經(jīng)濟學(xué)界已經(jīng)根深蒂固。多數(shù)人認(rèn)為利用研究生態(tài)演化的進化博弈理論來研究參與人的行為是不合適的。因為動植物行為是完全由其基因所決定的,而經(jīng)濟問題則涉及到具有邏輯思維及學(xué)習(xí)、模仿能力的理性參與人的行為,因此,借助于進化博弈理論來研究遠比動植物復(fù)雜的人類行為顯然是行不通的。但隨著心理學(xué)研究的發(fā)展及有限理性概念的提出,越來越多的經(jīng)濟學(xué)家應(yīng)用進化博弈理論來解釋經(jīng)濟現(xiàn)象并獲得了巨大的成功,利用進化博弈理論來研究并解釋經(jīng)濟現(xiàn)象的文獻大量出現(xiàn)于各種經(jīng)濟學(xué)期刊了。盡管如此,利用進化博弈理論來解釋經(jīng)濟現(xiàn)象還是需要對該理論的基本分析框架作出相應(yīng)的調(diào)整。如果去掉參與人偏好、信念及理性假定等條件,那么參與人是如何作出決策的呢?進化博弈理論在處理有限理性參與人決策問題時,常常假定參與人遵循某種比貝葉斯法則更簡單的行為規(guī)則,這種行為規(guī)則應(yīng)該告訴如何采取行動及如何根據(jù)經(jīng)驗來改變行為選擇,這樣參與人只要知道什么會發(fā)生,而不必知道為什么會發(fā)生。

        1970年代,生態(tài)學(xué)家Maynard Smith and Price(1973)結(jié)合生物進化論與經(jīng)典博弈理論在研究生態(tài)演化現(xiàn)象的基礎(chǔ)上而提出了進化博弈理論的基本均衡概念----進化穩(wěn)定策略(Evolutionarily stable stragegy ESS),目前學(xué)術(shù)界普遍認(rèn)為進化穩(wěn)定策略概念的提出標(biāo)志著進化博弈理論的誕生。此后,生態(tài)學(xué)家Taylor and Jonker(1978)在考察生態(tài)演化現(xiàn)象時首次提出了進化博弈理論的基本動態(tài)概念----模仿者動態(tài)(Replicator Dynamics)。至此,進化博弈理論有了明確的研究目標(biāo)。

        1980年代以后,隨著新古典經(jīng)濟學(xué)及博弈論固有的缺陷逐漸被人們所認(rèn)識,有限理性概念得到了學(xué)術(shù)界的普遍認(rèn)可,加之進化博弈理論在解釋生態(tài)現(xiàn)象時獲得的巨大成功,特別是經(jīng)濟學(xué)界于1992年在康奈爾大學(xué)召開的進化博弈理論學(xué)術(shù)會議,正式確立了該理論的學(xué)術(shù)地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等經(jīng)濟學(xué)家從不同的角度對傳統(tǒng)的進化博弈理論分析框架進行拓展,并使之逐漸轉(zhuǎn)化為描述經(jīng)濟行為的理論。目前,進化博弈理論的基本理論體系雖然已經(jīng)形成但還是相當(dāng)粗糙。因此,它仍然處于不斷發(fā)展和完善的階段,但該理論提供了比傳統(tǒng)理論更具現(xiàn)實性且能夠更準(zhǔn)確地解釋并預(yù)測參與人行為的研究方法,從而得到了越來越多的經(jīng)濟學(xué)家、社會學(xué)家、生態(tài)學(xué)家的重視,我們有理由相信該理論成為主流經(jīng)濟學(xué)的一部分已經(jīng)為時不遠。

        三、進化博弈理論的基本內(nèi)容

        進化博弈理論結(jié)合經(jīng)典博弈理論及生態(tài)理論研究成果,并以有限理性的參與人群體為研究對象,利用動態(tài)分析方法把影響參與人行為的各種因素納入其模型之中,并以系統(tǒng)論的觀點來考察群體行為的演化趨勢。

        進化生態(tài)學(xué)與博弈論的結(jié)合至少已有三十幾年的歷史,初看起來使人覺得奇怪,因為博弈論常常假定參與人是完全理性的,而基因和其他的演化載體常常被假定是以一種完全機械的方式運動。然而一旦用參與人群體來代替博弈論中的參與者個人,用群體中選擇不同純策略的個體占群體中個體總數(shù)的百分比來代替博弈論中的混合策略,那么這兩種理論就達到了形式上的統(tǒng)一。盡管這兩種理論在形式上達到了統(tǒng)一,但進化博弈理論與經(jīng)典博弈理論還是存在本質(zhì)區(qū)別。在進化博弈理論中每個參與人都是隨機地從群體中抽取并進行重復(fù)、匿名博弈,他們沒有特定的博弈對手 ④。在這種情況下,參與人既可以通過自己的經(jīng)驗直接獲得決策信息,也可以通過觀察在相似環(huán)境中其他參與人的決策并模仿而間接地獲得決策信息,還可以通過觀察博弈的歷史而從群體分布中獲得決策信息。對參與人來說,觀察群體行為的歷史即估算群體分布是非常重要的,首先,群體分布包含了對手如何選擇策略的信息。其次,通過觀察群體分布也有助于參與人知道什么是好的策略什么是不好的策略。參與人常常會模仿好的策略⑤ 而不好的策略則會在進化過程中淘汰,模仿是學(xué)習(xí)過程中的一個重要組成部分,成功的行為不僅以說教的形式傳遞下來,而且也容易被模仿。參與人由于受到理性的約束而其行為是幼稚的(Naive),其決策不是通過迅速的最優(yōu)化計算得到,而是需要經(jīng)歷一個適應(yīng)性的調(diào)整過程,在此過程中參與人會受到其所處環(huán)境中各種確定性或隨機性因素影響。因此,系統(tǒng)均衡是達到均衡過程的函數(shù),要更準(zhǔn)確地描述參與人行為就必須考察經(jīng)濟系統(tǒng)的動態(tài)調(diào)整過程,動態(tài)均衡概念及動態(tài)模型在進化博弈理論中占有相當(dāng)重要的地位。

        3.1 進化博弈理論基本模型分類

        進化博弈理論的基本模型按其所考察的群體數(shù)目可分為單群體模型(Monomorphic Population Model)與多群體模型(Polymorphic Populations Model)。單群體模型直接來源生態(tài)學(xué)的研究,在研究生態(tài)現(xiàn)象時,生態(tài)學(xué)家常常把同一個生態(tài)環(huán)境中所有種群看作一個大群體,由于生物的行為是由其基因唯一確定的,因而可以把生態(tài)環(huán)境中每一個種群都程式化為一個特定的純策略。經(jīng)過這樣處理以后,整個群體就相當(dāng)于一個選擇不同純策略(純策略集的數(shù)目就相當(dāng)于群體中的種群數(shù))的個體。群體中隨機抽取的個體兩兩進行的都是對稱博弈,有些文獻中稱這類模型為對稱模型(Symmetry model)。嚴(yán)格地說,單群體時個體進行的并不是真正意義上的博弈,博弈是在個體與群體分布所代表的虛擬參與人之間進行。如第一部分的老鷹----鴿子博弈,該生態(tài)環(huán)境中有兩個種群老鷹與鴿子,它們代表兩個不同的純策略,用進化方法進行處理時認(rèn)為該生態(tài)群體中每個個體都有兩種可供選擇策略即老鷹策略與鴿子策略,此時的博弈并不是在隨機抽取的兩個個體之間進行,而是每個個體都觀察群體狀態(tài)(選擇老鷹策略與鴿子策略個體數(shù)在群體中所占的比例),給定此狀態(tài)它就可以計算自己選擇不同策略所得的期望支付(嚴(yán)格地說這并不是期望支付,但為了說明的方便本文仍然借用該概念)進而確定選擇哪一個策略不選擇哪一個策略,對物種而言這就意味著種群數(shù)量的增加或減少。

        多群體模型是由Selten (1980)首次提出并進行研究的,他在傳統(tǒng)單群體生態(tài)進化模型中通過引入角色限制行為(Role Conditioned Behavior)而把對稱模型變?yōu)榱朔菍ΨQ模型。在非對稱博弈個體之間有角色區(qū)分,此時可以從大群體中區(qū)分出不同的小群體,群體中隨機抽取的個體之間進行真正意義上的兩兩配對重復(fù)、匿名非對稱博弈,有時又稱之為非對稱模型(Asymmetry model)。如果我們把系統(tǒng)選擇博弈中的宿舍變成學(xué)校(整個學(xué)校相當(dāng)于一個大群體)而把十個人變成十個班(每一個班看成是一個小群體,且同一班的同學(xué)無角色區(qū)分即與單群體情形一樣),每個班的學(xué)生都有多種選擇,此時該校學(xué)生所進行的計算機系統(tǒng)選擇博弈就是非對稱博弈。非對稱博弈模型并不是對單群體博弈模型的簡單改進,由單群體到多群體涉及到一系列的如均衡及穩(wěn)定性等問題的變化。Selten(1980)證明了“在多群體博弈中進化穩(wěn)定均衡都是嚴(yán)格納什均衡⑥ ”的結(jié)論,這就說明在多群體博弈中,傳統(tǒng)的進化穩(wěn)定均衡概念就顯示出其局限性了。同時,在模仿者動態(tài)下,同一博弈在單群體與多群體時也會有不同的進化穩(wěn)定均衡。

        按照群體在演化過程中所受到的影響因素是確定性的還是隨機性的,進化博弈模型可分為確定性動態(tài)模型和隨機性動態(tài)模型。確定性模型一般比較簡單并且能夠較好地描述系統(tǒng)的演化趨勢,因而,理論界對之進行較多的研究。隨機性模型需要考慮許多隨機因素對動態(tài)系統(tǒng)的影響,一般比較復(fù)雜,但該類模型卻能夠更準(zhǔn)確地描述系統(tǒng)的行為,近年來理論界對之也進行廣泛的探討[對隨機動態(tài)的詳細(xì)討論可以參閱這方面的經(jīng)典文獻Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

        3.2 進化博弈理論基本均衡概念-----進化穩(wěn)定策略

        進化博弈理論的基本均衡概念---進化穩(wěn)定策略⑦ [文獻2、5有詳細(xì)介紹]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生態(tài)演化問題時提出來的,其直觀思想是:如果一個群體(原群體)的行為模式能夠消除任何小的突變?nèi)后w,那么這種行為模式一定能夠獲得比突變?nèi)后w高的支付,隨著時間的演化突變者群體最后會從原群體中消失,原群體所選擇的策略就是進化穩(wěn)定策略。系統(tǒng)選擇進化穩(wěn)定策略時所處的狀態(tài)即是進化穩(wěn)定狀態(tài),此時的均衡就是進化穩(wěn)定均衡。下面給出Maynard Smith and Price(1973)對進化穩(wěn)定策略的定義(此后本文稱之為原初定義),用符號表示如下:

        說是進化穩(wěn)定策略,如果,存在一個<,不等式對任意都成立。其中A是群體中個體博弈時的支付矩陣;y表示突變策略;是一個與突變策略y有關(guān)的常數(shù),稱之為侵入邊界(Invasion Barriers);表示選擇進化穩(wěn)定策略群體與選擇突變策略群體所組成的混合群體。實際上相當(dāng)于該吸引子對應(yīng)吸引域的半徑,也就說進化穩(wěn)定策略考察的是系統(tǒng)落于該均衡的吸引域范圍之內(nèi)的動態(tài)性質(zhì),而落于吸引域范圍之外是不考慮的,所以說它只能夠描述系統(tǒng)的局部動態(tài)性質(zhì)。至于系統(tǒng)是如何進入吸引域的原初的進化穩(wěn)定策略定義所沒有給予足夠的重視。

        要準(zhǔn)確地理解進化穩(wěn)定策略概念就必須正確理解突變者和侵入邊界的含義。我們可借助于前面的兩個例子來理解。在老鷹、鴿子博弈中,當(dāng)該生態(tài)環(huán)境中只有老鷹(或只有鴿子)時,這時系統(tǒng)已經(jīng)處于均衡狀態(tài),但它們都是不穩(wěn)定的均衡,因為這兩個均衡都可以被突變者侵入。開始時,假定該生態(tài)環(huán)境處于老鷹均衡,如果由于某種原因而進入鴿子時,那么隨著時間的演化,整個生態(tài)系統(tǒng)最終就會穩(wěn)定于一半為老鷹一半為鴿子的狀態(tài),即混合策略納什均衡是進化穩(wěn)定的。這說明該博弈中兩個純策略納什均衡是不穩(wěn)定的。因為,當(dāng)系統(tǒng)處于純策略所表示的狀態(tài)時,只要存在突變者系統(tǒng)就會離開這種狀態(tài),所以它們都不是進化穩(wěn)定的。相反混合策略納什均衡卻不一樣,即當(dāng)系統(tǒng)處于一半是老鷹一半是鴿子時,如果由于某種因素使得系統(tǒng)偏離該狀態(tài),那么系統(tǒng)會自動恢復(fù)到原來狀態(tài)。另外,在系統(tǒng)選擇博弈中突變者、侵入邊界就更為明顯,所謂突變者即是指選擇進化穩(wěn)定策略以外的策略者,且侵入邊界與不同的均衡有關(guān)。該博弈有兩個純策略納什均衡和一個混合策略納什均衡(),前一個均衡所對應(yīng)的侵入邊界就是,也就是說如果選擇操作系統(tǒng)的學(xué)生數(shù)占群體總數(shù)的比例大于(即學(xué)生數(shù)大于4),那么選擇操作系統(tǒng)的突變者就不可能侵入到該群體中,如果選擇操作系統(tǒng)的學(xué)生數(shù)占群體總的比例小于(即學(xué)生數(shù)小于4),那么選擇操作系統(tǒng)的突變者就會侵入到該群體中而原來選擇操作系統(tǒng)的學(xué)生會轉(zhuǎn)而學(xué)習(xí)操作系統(tǒng)。

        最初進化穩(wěn)定策略定義有比較苛刻的條件限制,如單群體、群體中個體數(shù)目無限大、系統(tǒng)只受到不連續(xù)且互不重疊沖擊的影響等。這些條件大大地限制該定義的應(yīng)用,隨著學(xué)術(shù)界對進化博弈理論研究的深入,許多理論家們從不同的角度對最初定義進行了拓展,如Selten 1980首次給出了適應(yīng)于描述多群體均衡的定義;Schaffer 1988首次給出了適應(yīng)于描述有限規(guī)模群體的均衡定義;Foster and Young(1990)首次給出了適應(yīng)于描述連續(xù)隨機系統(tǒng)的均衡定義等等(有關(guān)對進化穩(wěn)定策略進行拓展的討論見文獻[5])。最初定義是在解釋生態(tài)現(xiàn)象時提出來的,如果進行經(jīng)濟分析,時需要進行相應(yīng)的改變。在分析生態(tài)現(xiàn)象時,把每一個種群的行為都程式化為一個策略,因此進化的結(jié)果將會是突變種群的消失(消失的原因在于生物的行為是由其遺傳基因唯一確定的)。如果用于經(jīng)濟分析,那么進化的結(jié)果將是那些選擇突變策略的個體最終會改變策略而選擇進化穩(wěn)定策略(因為人類可以通過學(xué)習(xí)、模仿等來改變自己所選擇的策略)。

        經(jīng)典博弈理論中的核心概念納什均衡即是指一種策略組合,在該策略組合下任何個人單獨偏離都不會變得比不偏離好。納什均衡是一個靜態(tài)概念,不能描述系統(tǒng)的動態(tài)性質(zhì),用數(shù)學(xué)語言來說它是動態(tài)系統(tǒng)的不動點,納什的成功就是在于他應(yīng)用拓?fù)鋵W(xué)的不動點定理證明了納什均衡的存在性。進化穩(wěn)定策略必定是納什均衡策略,它是納什均衡的精練,文獻[3]對此有詳細(xì)的介紹。在進化穩(wěn)定策略的定義中引入突變者及侵入邊界使之能夠更好地描述系統(tǒng)的局部動態(tài)性質(zhì)。第一部分的兩個例子中,按照納什均衡的概念是無法得知兩個系統(tǒng)最終會選擇哪一個均衡,但利用進化穩(wěn)定策略卻可以說明系統(tǒng)最終會穩(wěn)定哪一個均衡并可以分析系統(tǒng)達到不同均衡的條件,在某種程度上,較好地解決了多重均衡選擇問題。

        3.3 進化博弈理論基本動態(tài)概念----模仿者動態(tài)

        進化博弈理論來源于生態(tài)學(xué)的研究,該理論基本上從“優(yōu)勝劣汰”的進化論觀點來看待群體行為的調(diào)整過程。一般的進化過程都包括兩個可能的行為演化機制:選擇機制(Selection Mechanism)和突變機制(Mutation mechanism)。選擇機制是指本期中能夠獲得較高支付的策略,在下期被更多參與者選擇;突變是指參與者以隨機(無目的性)的方式選擇策略,因此突變策略可能獲得較高支付也可能獲得較低支付,突變一般很少發(fā)生。新的突變也必須經(jīng)過選擇,并且只有獲得較高支付的策略才能生存(Survive)下來。進化博弈理論需要解決的關(guān)鍵問題就是如何描述群體行為的這種選擇機制和突變機制。博弈理論家對群體行為調(diào)整過程進行了廣泛而深入的研究,由于他們考慮問題的角度不同,對群體行為調(diào)整過程的研究重點也就不同,因而提出了不同的動態(tài)模型,如Weibull(1995) 提出的模仿動態(tài)(Imitation Dynamics)模型,認(rèn)為人們常常模仿其他人的行為尤其是能夠產(chǎn)生較高支付的行為;Börgers and Sarin(1995,1997)等提出并應(yīng)用強化動態(tài)(Reinforcement Dynamics)來研究現(xiàn)實中參與人的學(xué)習(xí)過程;Skyrms (1986) 引入了意向動態(tài)(Deliberational Dynamics)模型對哲學(xué)中的理性問題進行了討論;Swinkels(1993)提出了近似調(diào)整動態(tài)(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反應(yīng)動態(tài)(Stimulus-Response Dynamics)等等。到目前為止,在進化博弈理論中應(yīng)用得最多的還是由Taylor and Jonker(1978)在對生態(tài)現(xiàn)象進行解釋時首次提出描述單群體動態(tài)調(diào)整過程的模仿者動態(tài)(Replicator Dynamics)。所謂模仿者動態(tài)是指使用某一策略人數(shù)的增長率等于使用該策略時所得的支付與平均支付之差。下面就給出Taylor and Jonker(1978)提出的模仿者動態(tài)的微分形式:

        化的而且因素之間的互動作用也是需要時間的。因此,均衡只是一種暫時現(xiàn)象或者在多數(shù)情況下,系統(tǒng)根本不可能達到的現(xiàn)象,要更準(zhǔn)確地考察參與人的行為就必須運用系統(tǒng)論的觀點,把行為互動性、因素互動性及時間因素納入到其模型之中。

        5.2 經(jīng)典博弈理論的策略互動分析法及其缺陷

        考慮到新古典經(jīng)濟學(xué)沒有把參與人行為之間的互動關(guān)系納入到其模型之中,經(jīng)典博弈理論則在理性人假定的基礎(chǔ)上把參與人行為的互動關(guān)系納入到其模型之中進一步考察了參與人的決策問題。在我國,對人類互動行為的研究至少可以追溯到三國時期田賽馬的故事,但作為一種正式理論提出來,一般認(rèn)為是始于馮·諾意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈論與經(jīng)濟行為》一書,直到納什(Nash 1950)在研究非合作博弈的基礎(chǔ)上提出著名的納什均衡(Nash Equilibrium)概念才使得博弈論成為一門完整的理論。經(jīng)過近五十年的發(fā)展,終于在1994年,三位杰出的博弈論大師:納什(John F. Nash)、澤爾藤(Rechard Selten)和海薩尼(John C. Harsanyi)獲得了經(jīng)濟學(xué)的最高榮譽——諾貝爾經(jīng)濟學(xué)獎,在全球經(jīng)濟學(xué)界再次掀起了對博弈論的研究熱潮。經(jīng)典博弈論為社會科學(xué)提供了一個新的研究視角,使我們能夠以全新的方法來處理各種沖突與合作的問題。博弈論作為一種理論工具,其應(yīng)用相當(dāng)廣泛。在信息經(jīng)濟學(xué)中得到了充分的應(yīng)用,1996年諾獎得主Mirrlees等、2001年諾獎得主Akerlof等都對信息經(jīng)濟學(xué)研究作出了卓越的貢獻。這充分說明了博弈論在經(jīng)濟學(xué)的地位可見一斑。

        經(jīng)典博弈理論的核心概念----納什均衡就是由普林斯頓大學(xué)數(shù)學(xué)家納什在研究非合作博弈時提出來的。納什均衡即是指給定其他參與人選擇的情況下,每一個人單獨偏離均衡都不會變得比不偏離好,顯然納什均衡是一個靜態(tài)均衡概念。經(jīng)典博弈理論盡管把參與人的互動行為引入到其模型之中,并認(rèn)為現(xiàn)實中參與人不是孤立地作出自己的決策,每一個參與人的決策不僅依賴于其自身所面臨的條件及其所擁有的信息,而且也依賴于其他參與人的決策選擇。但該理論卻面臨著其自身無法克服的缺點。首先,博弈論中的互動是一種“沉默互動⑨ ”,這種互動不允許參與人之間存在任何形式的交流,即假定參與人都是一個個只會理性計算的孤立經(jīng)濟人而非社會人,一旦引入社會互動,許多博弈都無法進行分析,也就是說經(jīng)典博弈理論中的互動并不“社會互動”而是孤立的“沉默互動”。其次,博弈論的基本均衡概念納什均衡要求博弈各方都是理性的,并且理性是共同知識,博弈時如果某一方選擇了非理,那么博弈就無法進行下去。特別地該理論在利用后向歸納法(Backward Induction)對納什均衡進行精練時,不但要求參與人完全理性,而且還要求參與人的行為滿足序貫理性(Sequential Rationality)要求。這一比理性更強的要求使得博弈論更加遠離現(xiàn)實人。再次,在處理參與人所面臨的不確定性時,不僅要求各參與人知道世界的各種狀態(tài),而且要求參與人知道每一種狀態(tài)所出現(xiàn)的概率,并且給定一個先念信念,當(dāng)出現(xiàn)任何新信息時,每個參與人都能夠應(yīng)用貝葉斯法則修正自己的先念信念,也就是說參與人不但具有很強的計算、推理能力,而且能夠在一個大的狀態(tài)空間上應(yīng)用貝葉斯法則解決相當(dāng)復(fù)雜的問題?,F(xiàn)實中多數(shù)情況下,參與人并不都具有這種計算、推理能力。最后,博弈論碰到了其最棘手的問題就是多重均衡的處理,當(dāng)博弈出現(xiàn)多重均衡特別是多重嚴(yán)格納什均衡時,盡管許多理論家提出了一些方法(Selten(1965)提出的子博弈精煉納什均衡概念,Selten(1975)提出的顫抖手精練納什均衡,Kerps—wilson(1982)提出的序貫均衡,Schelling(1960)提出的聚點均衡等)來處理多重均衡問題,但始終沒能獲得一致認(rèn)可的結(jié)論。

        與新古典經(jīng)濟學(xué)相比,經(jīng)典博弈理論雖然在其模型中納入了行為的“沉默互動”關(guān)系,但該理論給出的研究方法仍然沒能跳出新古典經(jīng)濟學(xué)的均衡分析框架,這種只注重結(jié)果而忽略達到結(jié)果的過程的分析方法依然把對經(jīng)濟系統(tǒng)的影響因素都看作為一個個孤立因素,依然認(rèn)為影響因素與決策結(jié)果是一一對應(yīng)的關(guān)系,依然沒能把參與人所處社會環(huán)境等因素納入到其模型之中,因而不能準(zhǔn)確地描述現(xiàn)實中人的決策行為,其結(jié)論也僅僅具有理論意義而缺乏政策含義。

        5.3 進化博弈理論局部動態(tài)分析方法的現(xiàn)實性

        進化博弈理論利用達爾文“優(yōu)勝劣汰”的生物進化論、經(jīng)典博弈理論并結(jié)合心理學(xué)的研究成果,從西蒙提出有限理性(Bounded Rationality)的參與人群體出發(fā),通過對群體行為的研究進一步得出參與人個體的行為。進化博弈理論跨越了完全理性的“經(jīng)濟人”與有限理性的“社會人”的鴻溝,實現(xiàn)了經(jīng)濟學(xué)研究方法革命性的突破。與傳統(tǒng)均衡分析法相比,進化博弈理論的局部動態(tài)分析方法在以下幾個方面獨具特色。

        5.3.1 局部動態(tài)分析法的均衡觀

        傳統(tǒng)的均衡分析方法認(rèn)為完全理性參與人能夠?qū)Νh(huán)境的任何變化作出迅速的最優(yōu)反應(yīng),因而,經(jīng)濟系統(tǒng)是常常處于均衡狀態(tài)的,分析參與人的行為只需要研究均衡結(jié)果,并以此來預(yù)測經(jīng)濟人的行為,通過比較不同均衡結(jié)果來尋找系統(tǒng)達到均衡的條件。這種處理方法為了數(shù)學(xué)上處理的方便而撇開現(xiàn)實中“因素互動”而分別考察單個因素對均衡的影響,使得理論更加缺乏現(xiàn)實基礎(chǔ)。進化博弈理論則完全摒棄傳統(tǒng)理論中非現(xiàn)實的“理性人”假定,直接從有限理性參與人群體出發(fā)而提出的一種全新的研究方法----局部動態(tài)法。局部動態(tài)法把經(jīng)濟系統(tǒng)達到均衡結(jié)果的過程納入到其模型之中,認(rèn)為經(jīng)濟系統(tǒng)達到均衡需要一個長期的漸進過程,均衡結(jié)果依賴于達到均衡的過程,也就是說任何一個結(jié)果都是路徑依賴的,它與混沌經(jīng)濟學(xué)完全動態(tài)的研究方法具有某種程度的相似之處。

        5.3.2 局部動態(tài)法的時間觀

        傳統(tǒng)的均衡分析法并沒有納入因素互動關(guān)系并且理性計算是不需要時間的,所以得出經(jīng)濟系統(tǒng)常常是均衡的結(jié)論。進化博弈理論的局部動態(tài)法一個顯著特征就是把參與人的決策過程時間及因素互動的時間納入到其基本模型之中,強調(diào)系統(tǒng)達到均衡的過程,并認(rèn)為經(jīng)濟系統(tǒng)由于受到各種互動行為及互動因素的影響,有些系統(tǒng)達到均衡可能只需要很短的時間,有些系統(tǒng)達到均衡可能需要很長的時間,有些系統(tǒng)可能無法達到均衡。時間因素對經(jīng)濟學(xué)研究有著非常重要的意義,如均衡分析法無法考慮宏觀經(jīng)濟政策中“時滯”使得許多實施時有效的政策在發(fā)生作用時卻出現(xiàn)了與原意相反的結(jié)果。時間是度量政策效率的一個很重要的因素,如果不考慮時間因素有些政策可能很有效率,但納入時間因素,一些需要太長時間才能使系統(tǒng)達到意愿均衡的政策可能根本就沒有效率。進化博弈理論把時間納入到模型分析中并充分應(yīng)用數(shù)學(xué)中的相圖來描述經(jīng)濟系統(tǒng)達到均衡的路徑,這樣有利于決策者控制經(jīng)濟系統(tǒng)使之朝向既定的目標(biāo)前進,也有利于決策者尋找能夠最大限度地促進系統(tǒng)向意愿均衡轉(zhuǎn)化的因素,使系統(tǒng)盡快達到有效率的均衡。

        5.3.3 局部動態(tài)法的均衡選擇觀

        新古典經(jīng)濟學(xué)研究的邏輯有理性就有均衡,然后在既定均衡下通過對不同均衡的比較來尋找系統(tǒng)達到不同均衡的條件,即比較靜態(tài)法,最后結(jié)合條件找出希望達到的均衡,因此,該理論不存在真正意義的均衡選擇問題。經(jīng)典博弈理論提供的分析方法在多數(shù)情況下都存在其自身所無法處理的多重均衡問題。如老鷹與鴿子博弈及系統(tǒng)選擇博弈中多重均衡問題。進化博弈理論的局部動態(tài)法引入突變因素就能夠較好地解決了多重均衡的選擇問題,在老鷹與鴿子博弈中,盡管全是老鷹(全是鴿子)都是均衡的,但這兩個均衡都極不穩(wěn)定即都不是進化穩(wěn)定均衡,一旦有鴿子(老鷹)突變者進入該系統(tǒng)就會使系統(tǒng)偏離,隨著時間的推移而使得系統(tǒng)趨向于混合策略進化穩(wěn)定均衡即一半鴿子一半老鷹(該均衡是一個全局吸引子);在系統(tǒng)選擇博弈中經(jīng)典博弈理論無法解釋系統(tǒng)最終會趨于哪一個均衡,局部動態(tài)法引入了突變因素就能夠很好地解決了均衡選擇問題,即系統(tǒng)最終會趨于哪一個均衡依賴于系統(tǒng)的初始狀態(tài)即路徑依賴。進化博弈理論的基本均衡概念----進化穩(wěn)定均衡描述的是當(dāng)經(jīng)濟系統(tǒng)一旦進入到某一均衡的吸引域內(nèi)時,系統(tǒng)就會對其他的突變策略具有一定程度(即在突變邊界內(nèi))的抵抗力。

        5.3.4 局部動態(tài)法的特殊性

        新古典經(jīng)濟學(xué)與經(jīng)典博弈理論均衡分析法都是以單個消費者、單個生產(chǎn)者、單個市場為研究對象來考察參與人的最優(yōu)決策行為,并由此研究整個社會的資源配置問題。然而它們卻碰到了如何由個體行為轉(zhuǎn)化到群體行為的困難,因為這種轉(zhuǎn)化過程涉及到各種互動因素的影響。一個明顯的例子是經(jīng)典博弈理論中囚徒困境博弈,在該博弈中兩個囚徒都從個體理性出發(fā),但得到了集體非理性均衡的結(jié)論。也就是說,均衡分析法根本無法實現(xiàn)從個體行為向集體行為的過渡,在此框架內(nèi)尋找宏觀經(jīng)濟的微觀基礎(chǔ)的困難是非常大的。進化博弈理論的局部動態(tài)法則從人的社會性出發(fā),利用系統(tǒng)論的處理方法來看待參與人的決策行為。該理論直接以參與人的群體為其研究的邏輯起點,在考慮到影響參與人行為的社會因素、文化因素、民族習(xí)俗及個體生活習(xí)慣等因素的基礎(chǔ)上進一步考察群體中有限理性個體的行為互動關(guān)系,很巧妙地避開由個體行為向集體行為轉(zhuǎn)化問題,因而能夠更加真實地反應(yīng)現(xiàn)實人的決策過程及其決策結(jié)果。

        六、結(jié)論

        進化博弈理論是經(jīng)濟學(xué)領(lǐng)域的前沿理論,它來源于對生態(tài)現(xiàn)象的研究,雖然該理論應(yīng)用于經(jīng)濟分析的時間不長,但它為經(jīng)濟學(xué)研究提供了一個全新的分析方法,較好地克服了新古典經(jīng)濟學(xué)及經(jīng)典博弈理論中理性假定及多重均衡的困難。并且,應(yīng)用進化博弈理論來研究經(jīng)濟系統(tǒng)能夠獲得比傳統(tǒng)理論更準(zhǔn)確的結(jié)果,能夠更加現(xiàn)實地解釋經(jīng)濟現(xiàn)象,因而在短期內(nèi)為多數(shù)經(jīng)濟學(xué)家所接受。從某種意義上說引入進化博弈理論局部動態(tài)法來分析經(jīng)濟中參與人的行為是經(jīng)濟學(xué)研究方法的一次創(chuàng)新。

        注釋: ①本文把源于馮·諾意曼和摩根斯藤經(jīng)納什發(fā)展而成的博弈理論稱之為經(jīng)典博弈理論。 ②即無性生殖,這樣假定的意思就是說后代繼承其母體的策略,并且永遠不改變,當(dāng)然用于研究人類的行為時,需要作相應(yīng)的調(diào)整。 ③所謂近視調(diào)整即是指參與人不管未來怎么樣,只知道使當(dāng)前的支付最大化 ④ 經(jīng)典博弈理論中每一個參與人都有特定的博弈對象,并且,在重復(fù)動態(tài)博弈中,后行動者通過觀察先行動者的理而利用貝葉斯法則來修正自己的先念信念,然后,在此信念下選擇使自己獲得最大支付的策略。 ⑤好的策略即是指能夠獲得較高支付的策略。 ⑥所謂嚴(yán)格納什均衡即是嚴(yán)格占優(yōu)納什均衡。給定對手選擇的情況下,每個人都通過選擇嚴(yán)占優(yōu)的策略而組成的納什均衡。 ⑦事實上,這與Selten提出的顫抖手均衡概念具有相似性,所謂顫抖手均衡是指一個戰(zhàn)略組合,只有當(dāng)它在允許所有參與人都可能犯錯誤時仍是每一個參與人的最優(yōu)戰(zhàn)略的組合時才是一個均衡,其嚴(yán)格定義可以參閱張維迎的《博弈論與信息經(jīng)濟學(xué)》。其中的顫抖或者犯錯誤與進化穩(wěn)定策略中的突變因素有差不多的含義,但它們之間存在本質(zhì)上的不同。 ⑧由模仿者動態(tài)方程進行支付變換,可得。 ⑨這一點我們可以從博弈論一個著名的捐款----回贈實驗中看出,募捐者要求每一個人都自愿捐款,最終募捐者以3倍于捐款總額的錢平均分派給每個捐款者,為了使得博弈能夠分析下去,募捐者要求自愿捐款時每個人都不得與其他人討論,否則該博弈就無法進行下去,因此,本文稱博弈論中的互動是一種沉默互動而非社會互動。這個實驗充分體現(xiàn)了古典經(jīng)濟學(xué)及博弈論研究對象上的一致性,即它們都是研究單個個體的行為而排除了人的一個重要特征----社會性。參考文獻

        [1] 王則柯(1999):《博弈論平話》,中國經(jīng)濟出版社。

        [2] 張維迎(1999):《博弈論與信息經(jīng)濟學(xué)》,上海三聯(lián)出版社。

        [3] 張良橋,馮從文(2001):《進化穩(wěn)定均衡與納什均衡:兼談進化博弈理論的發(fā)展》,《經(jīng)濟科學(xué)》,3,103-111。

        [4] 張良橋(2001):《理性與有限理性:論經(jīng)典博弈理論與進化博弈理論之關(guān)系》,《世界經(jīng)濟》,8,74-78。

        [5] 張良橋(2003):《論進化穩(wěn)定策略》,《經(jīng)濟評論》,2,70-74。

        [6] 張良橋,郭立國(2003):《論模仿者動態(tài)》,《中山大學(xué)學(xué)報自然科學(xué)版》,3。

        [7] 楊小凱(2000):《新興古典經(jīng)濟學(xué)和超邊際分析》,中國人民大學(xué)出版社。

        [8] 青木昌彥, 奧野正寬(1999):《經(jīng)濟體制的比較制度分析》, 魏加寧等譯, 北京: 中國發(fā)展出版社.

        [9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

        [10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

        [11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

        [12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

        [13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

        [14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

        [15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

        [16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

        [17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

        [18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

        [19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

        [20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

        [21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

        [22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

        [23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

        [24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

        [25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

        [26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

        [27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

        [28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

        [29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

        [30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

        [31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

        [32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

        [33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

        [34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

        [35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

        [36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

        [37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

        [38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

        [39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

        [40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

        第9篇:博弈論的概念范文

        關(guān)鍵詞:博弈論;君臣博弈;不完全信息靜態(tài)博弈;不完全信息動態(tài)博弈

        近年來,博弈論在西方世界發(fā)展迅速,應(yīng)用廣泛。而在中國,博弈論并沒有得到長足的發(fā)展,現(xiàn)有的博弈論教材也多是翻譯國外學(xué)者的著作或引用西方學(xué)者的理論。實際上,中國并不是沒有博弈論,中國歷史上發(fā)生的一幕幕歷史事件,其精彩程度遠遠高于西方學(xué)者構(gòu)造的博弈論模型。中國的博弈論只是沒有被作為一門系統(tǒng)化的學(xué)科單獨提煉出來而已,它隱含在史學(xué)家的筆下,埋藏在中國古典文化里,流傳至今。

        一、歷史背景

        在司馬遷的《史記》中,關(guān)于漢高祖劉邦和丞相蕭何,有這樣一段記載:漢十一年,陳反,高祖自將,至邯鄲。未罷,淮陰侯謀反關(guān)中,呂后用蕭何計,誅淮陰侯,語在淮陰事中。上已聞淮陰侯誅,使使拜丞相何為相國,益封五千戶,令卒五百人一都尉為相國衛(wèi)。諸君皆賀,召平獨吊?!倨街^相國曰:"禍自此始矣。上暴露於外而君守於中,非被矢石之事而益君封置衛(wèi)者,以今者淮陰侯新反於中,疑君心矣。夫置衛(wèi)衛(wèi)君,非以寵君也。愿君讓封勿受,悉以家私財佐軍,則上心說。"相國從其計,高帝乃大喜。漢十二年秋,黥布反,上自將擊之,數(shù)使使問相國何為。相國為上在軍,乃拊循勉力百姓,悉以所有佐軍,如陳時??陀姓f相國曰:"君滅族不久矣。夫君位為相國,功第一,可復(fù)加哉?然君初入關(guān)中,得百姓心,十馀年矣,皆附君,常復(fù)孳孳得民和。上所為數(shù)問君者,畏君傾動關(guān)中。今君胡不多買田地,賤貰貸以自污?上心乃安。"於是相國從其計,上乃大說。上罷布軍歸,民道遮行上書,言相國賤強買民田宅數(shù)千萬。上至,相國謁。上笑曰:"夫相國乃利民!"民所上書皆以與相國,曰:"君自謝民。"相國因為民請曰:"長安地狹,上林中多空地,棄,愿令民得入田,毋收稿為禽獸食。"上大怒曰:"相國多受賈人財物,乃為請吾苑!"乃下相國廷尉,械系之。數(shù)日,王衛(wèi)尉侍,前問曰:"相國何大罪,陛下系之暴也?"上曰:"吾聞李斯相秦皇帝,有善歸主,有惡自與。今相國多受賈豎金而為民請吾苑,以自媚於民,故系治之。"……是日,使使持節(jié)赦出相國。相國年老,素恭謹(jǐn),入,徒跣謝。高帝曰:"相國休矣!相國為民請苑,吾不許,我不過為桀紂主,而相國為賢相。吾故系相國,欲令百姓聞吾過也。"(《史記o蕭相國世家》)

        上述文字記載的是漢高祖劉邦和丞相蕭何的一系列的博弈過程,下文將從博弈論的角度加以分析。

        二、基于不完全信息靜態(tài)博弈的分析

        1.不完全信息靜態(tài)博弈

        假設(shè)博弈參與人的支付函數(shù)是所有參與人的共同知識,這樣的博弈被稱為"完全信息博弈"(game of complete information),而在劉邦與蕭何的博弈中,信息是不完全的,這一博弈是"不完全信息博弈"。

        規(guī)定一個參與人所擁有的所有私人信息(private information,即所有不是共同知識的信息)是他的類型(type)。"不完全信息"表示至少有一個參與人有多種類型,也就是說其他參與人可能不知道這個參與人的類型,反過來,這一參與人也不知道其他參與人是否知道自己的類型。

        在"不完全信息博弈"的基礎(chǔ)上,經(jīng)濟學(xué)家海薩尼提出了"貝葉斯納什均衡",即在靜態(tài)不完全信息博弈中,所有參與人同時行動,沒有機會觀察別人的選擇。給定別人的戰(zhàn)略選擇,每個參與人的最優(yōu)戰(zhàn)略依賴于自己的類型,他不可能準(zhǔn)確地知道其他參與人實際上會選擇什么戰(zhàn)略;但是,他能準(zhǔn)確地預(yù)測到其他參與人的選擇是如何依賴于其各自的類型的。這樣,他決策的目標(biāo)就變成了,在給定自己的類型、別人的類型以及別人類型依從戰(zhàn)略的情況下,最大化自己的期望效用。

        2.劉邦與蕭何博弈的貝葉斯納什均衡

        《史書》記載,蕭何是位忠臣,對劉邦忠心耿耿,用古代的道德觀念來評價,蕭何是一個有道德的人。但劉邦身居高位,高處不勝寒,不能確定蕭何是否忠心耿耿。從博弈論的角度講,劉邦不知道蕭何的類型。古人是很看重后人對自己的評價的,例如曹操為了不留下"亂臣賊子"的罵名就沒有殺漢獻帝。對于蕭何而言,造反是有成本的,這些成本不但包括一旦失敗會被誅殺滅族,還包括自己的名譽,所以如果蕭何是一個有道德的人,他的造反成本就高,相反,如果蕭何不是一個有道德的人,那么他的造反成本就低。雙方的支付矩陣如表1所示。

        現(xiàn)對這個博弈做出假定:第一,博弈參與人有兩個,分別是皇帝劉邦、丞相蕭何;第二,劉邦的決策變量是"殺蕭何/不殺蕭何",而蕭何的決策變量是"造反/不造反";第三,雙方都以實現(xiàn)自身效用最大化為最終目的;第四,雙方同時行動,但信息并不完全,即蕭何了解劉邦的類型,但劉邦不了解蕭何的類型。

        表 1 劉邦與蕭何的君臣博弈

        如果蕭何是一個有道德的人,那么他的造反成本會比較高,即使劉邦選擇殺他,他為了留下"忠臣"的美名也不會造反;如果蕭何不是一個有道德的人,那么即使劉邦不殺他,他也會選擇造反。

        另一方面,在劉邦看來,蕭何屬于"造反成本高"的類型的概率是p,屬于"造反成本低的概率是1-p。那么劉邦究竟該做出什么樣的選擇呢?由于劉邦并不確切的知道蕭何的成本是高是低,所以劉邦的選擇依賴于他在多大程度上信任蕭何造反是高成本的。如果劉邦選擇不殺蕭何,那么劉邦的期望效用是:100p-100(1-p)=200p-100。如果劉邦選擇殺蕭何,那么劉邦的期望效用是:50p+50(1-p)=50。

        令200p-100=50,得到p=3/4。這一結(jié)果說明,劉邦的最優(yōu)選擇是:如果p≥3/4,不殺蕭何;如果p

        上文引述的史料中提到,劉邦曾兩次試探蕭何,第一次是召平提出的"禍自此始矣。上暴露於外而君守於中,非被矢石之事而益君封置衛(wèi)者,以今者淮陰侯新反於中,疑君心矣",其大意為"您的禍患從此開始了?;噬显谕庾鲬?zhàn)風(fēng)餐露宿,而您留守京城,并不需要冒著矢石去沖鋒陷陣,但皇上卻要給您加封食邑、設(shè)置衛(wèi)隊,這是因為淮陰侯剛剛在關(guān)中謀反,皇上對您也起了疑心。"第二次是蕭何的門客提到的:"君滅族不久矣。夫君位為相國,功第一,可復(fù)加哉?然君初入關(guān)中,得百姓心,十馀年矣,皆附君,常復(fù)孳孳得民和。上所為數(shù)問君者,畏君傾動關(guān)中。今君胡不多買田地,賤貰貸以自污?上心乃安";其大意是:"您要不了多久就會遭受滅族的慘禍了。您位為相國,功居第一,難道功名還能再增加嗎?但您從剛進關(guān)中的時候起,就深得民心,到現(xiàn)在已有十多年了,百姓們都擁戴您,您總是勤勉辦事,深得民心?;噬现詫掖闻扇藖韱柲那闆r,是怕您利用自己的威望動搖關(guān)中?,F(xiàn)在您不如多買些田地,并低價賒購、借貸,以此來玷污自己,這樣皇上對您就放心了。"劉邦之所以一再地試探蕭何,就是為了確定蕭何作為博弈參與者的類型--蕭何到底是屬于造反成本高的類型還是造反成本低的類型。

        三、基于不完全信息動態(tài)博弈的分析

        1.不完全信息動態(tài)博弈

        在動態(tài)博弈中,行動次序有先有后,后行動者可以通過觀察先行動者的行動獲得有關(guān)后者偏好、戰(zhàn)略空間等方面的信息,修正自己的判斷。先行動者知道自己的行為有傳遞信息的作用,就會有意識地選擇某種行動來揭示或掩蓋自己的真實面目。不完全信息動態(tài)博弈的均衡概念是"精煉貝葉斯均衡"(perfect Bayesian equilibrium)。精煉貝葉斯均衡的關(guān)鍵在于后行動者要根據(jù)所觀察到的他人的行為來修正自己對他人類型的"信念"(主觀概率),并據(jù)此選擇自己的行動。修正過程使用的是"貝葉斯規(guī)則",即每個參與人都假定其他參與人選擇的是均衡戰(zhàn)略。具體而言,精煉貝葉斯均衡是所有參與人戰(zhàn)略和信念的一種結(jié)合,他滿足如下條件:(1)給定每個人有關(guān)其他人類型的信念的情況下,他的戰(zhàn)略選擇是最優(yōu)的;(2)每個人有關(guān)他人類型的信念都是使用貝葉斯法則從所觀察到的行為中獲得的。

        2.劉邦與蕭何博弈的精煉貝葉斯均衡

        一種行動要起到傳遞特定信息的功能,行動者必須為此付出足夠的成本,否則行動者的行動就不可信。對于蕭何,簡單的向劉邦訴說"我是忠臣","我不會謀反","我是個品德高尚的人"是起不到傳遞信息作用的,因為這種行動不花費任何成本。所以蕭何每次向劉邦表明自己的忠誠時都花費了很大的成本:劉邦第一次試探蕭何,蕭何"悉以家私財佐軍",就是把自己家里全部的私有財產(chǎn)拿出來資助軍隊,表明自己沒有私心,結(jié)果"高帝乃大喜";劉邦第二次試探蕭何,蕭何"多買田地,賤貰貸以自污",通過低價賒購、借貸來玷污自己的名聲,以表明自己貪圖小利,沒有爭奪天下的野心,結(jié)果"上乃大說",劉邦很開心。以上這兩種行為雖然在一定程度上減少了劉邦對蕭何的猜忌,但要讓劉邦徹底對蕭何放心,還是不夠的。要想達到最佳的信息傳遞效果,蕭何就必須付出更大的代價--"乃下相國廷尉,械系之",意思是"于是就下令把相國交給廷尉拘禁起來,還給他上了刑具"。蕭何通過這樣三次傳遞信息終于使劉邦對他徹底地放心,使自己避免了殺身滅族之禍。

        劉邦要試探蕭何,也并不是不耗費成本的。第一次試探,劉邦"使使拜丞相何為相國,益封五千戶,令卒五百人一都尉為相國衛(wèi)",派遣使者拜丞相蕭何為相國,加封食邑五千戶,命令安排五百名士兵由一名都尉率領(lǐng)充任相國的衛(wèi)隊;第二次試探,劉邦"數(shù)使使問相國何為",多次派遣使者探問相國在做什么;第三次把蕭何打入監(jiān)獄,要背負(fù)"暴君"的惡名。這些都是搜索信息所必須付出的成本。

        按照貝葉斯規(guī)則,劉邦與蕭何博弈并得出均衡解的過程如下:在博弈的第一回合,蕭何知道自己的類型,但劉邦并不知道。假設(shè)在劉邦看來,蕭何屬于第一種類型(即造反成本高的類型)的概率和屬于第二種類型的概率都是1/2,。此時劉邦向蕭何發(fā)出了第一次試探,蕭何作為理性的參與者,向劉邦傳遞信號--舍棄自己的家財,證明自己的衷心。劉邦收到信號后,依據(jù)自己的判斷,將自己對蕭何的信念修正,假設(shè)修正為3/5,這一概率大于劉邦試探之前對蕭何的信任程度,雙方進入第二回合的博弈。劉邦再次做出試探,蕭何通過"自污"的方式向劉邦傳遞信號,劉邦收到信號后再次修正自己的信念,假設(shè)修正為7/10,雙方進入第三輪博弈。在第三輪博弈中,劉邦雖然將蕭何打入監(jiān)獄,但實際上是劉邦主動發(fā)出信號,考驗蕭何的忠誠度,蕭何出獄后,謙恭謹(jǐn)慎,進宮拜見劉邦時,光著腳步行表示謝罪,表現(xiàn)出絕對的服從,這時,劉邦終于將自己對蕭何的信念修正為3/4或更高的水平,相信蕭何屬于造反成本高的類型,選擇不殺蕭何,最終得到的均衡解是(不殺,不造反)。

        四、結(jié)語

        本文結(jié)合了博弈論的基本理論,通過引述歷史資料,對博弈參與人提供基本假定,構(gòu)建博弈論模型,以及對博弈過程的分析,試圖從博弈論的角度闡釋歷史事件。雖然博弈論這一理論產(chǎn)生自西方,并且在西方發(fā)達國家得到了快速的發(fā)展和高度的重視,但事實上,有五千年光輝歷史的中國早已形成了自己的博弈論,只是它沒有形成獨立的學(xué)科,而是產(chǎn)生于歷史人物的不朽的思想之中,通過歷史人物自覺地或者不自覺地運用而流傳下來。

        參考文獻:

        [1]張維迎.博弈論與信息經(jīng)濟學(xué)[M].上海:上海三聯(lián)書店,1996.

        [2]張元鵬.微觀經(jīng)濟學(xué)(中級教程)[M].北京:北京大學(xué)出版社,2007.

        [3]司馬遷.史記[].韓兆琦,注.北京:中華書局,2007.

        [4]胡興華.論蕭相國在《史記》中的形象[J].魅力中國,2010,(6).

        相關(guān)熱門標(biāo)簽
        无码人妻一二三区久久免费_亚洲一区二区国产?变态?另类_国产精品一区免视频播放_日韩乱码人妻无码中文视频
      2. <input id="zdukh"></input>
      3. <b id="zdukh"><bdo id="zdukh"></bdo></b>
          <b id="zdukh"><bdo id="zdukh"></bdo></b>
        1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

          <wbr id="zdukh"><table id="zdukh"></table></wbr>

          1. <input id="zdukh"></input>
            <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
            <sub id="zdukh"></sub>
            砀山县| 岳池县| 资阳市| 息烽县| 石景山区| 吉木萨尔县| 遵义县| 阿鲁科尔沁旗| 巴楚县| 海林市| 大冶市| 台东县| 米林县| 青冈县| 嫩江县| 黄梅县| 勃利县| 三亚市| 麻栗坡县| 桃源县| 景东| 玉田县| 安达市| 顺昌县| 普陀区| 内丘县| 海兴县| 东光县| 泽州县| 仲巴县| 平顶山市| 原平市| 延长县| 巴马| 比如县| 福泉市| 柳江县| 泰安市| 庄浪县| 囊谦县| 科技| http://444 http://444 http://444