博弈邏輯分析論文

時間:2022-01-05 04:38:00

導(dǎo)語:博弈邏輯分析論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

博弈邏輯分析論文

1一種新的邏輯:博弈邏輯

博弈論研究人類活動中的互動行為,在經(jīng)濟學(xué)中得到廣泛的運用。在博弈論中,人類的所有活動,只要是互動行為,均可以看成是博弈行動。在此基礎(chǔ)上,一種新的邏輯“博弈邏輯”(gamelogic)得以興起,它是一種特殊的行動邏輯(actionlogic)。

博弈論研究多個理性人在互動過程中如何選擇自己的策略。理性的人是使自己的目標(biāo)或得益最大化的人,在經(jīng)濟活動中理性的人即是使經(jīng)濟目標(biāo)最大化的人——經(jīng)濟人。理性人如何使得自己的“得益”最大?關(guān)鍵是“推理”。

博弈邏輯中存在著兩種研究綱領(lǐng)。第一種研究綱領(lǐng)是結(jié)合模態(tài)邏輯系統(tǒng),建立新的博弈邏輯系統(tǒng)。在這方面,日本筑波大學(xué)的金子守(MamoruKaneko)教授是這方面的權(quán)威。近幾年,他在國際刊物上發(fā)表了大量有關(guān)博弈邏輯方面的論文。他不僅在模態(tài)邏輯系統(tǒng)的基礎(chǔ)上建立了多個博弈邏輯(gamelogic)系統(tǒng),而且,建立了與博弈邏輯密切相關(guān)的公共知識邏輯(commonknowledgelogic)系統(tǒng)。第二種研究綱領(lǐng)是研究博弈活動中的實際“推理問題”,許多博弈論專家在此方面做了大量的工作。對博弈邏輯做整體的分析不是這里的任務(wù),本文的目的是簡要論述博弈活動中的推理問題,屬于第二種研究綱領(lǐng)。

根據(jù)博弈論,人們在實際的博弈活動中涉及到兩種推理:演繹推理與歸納推理。然而,正如傳統(tǒng)邏輯中存在著悖論(演繹悖論和歸納悖論),在博弈邏輯中同樣存在著悖論。

2博弈邏輯中的演繹推理與歸納推理

博弈論有兩個假定:第一,博弈參與人是理性的;第二,博弈參與人的得益不僅取決于自己的行動,同時取決于其他人的行動。

每個理性的參與人在策略選取,使自己得益最大時,要充分考慮局中其他人的策略選取。同時,每個參與人知道其他參與人與他有同樣的想法。在博弈中,“每個人是理性的”是公共知識(commonknowledge),它是每個參與人進行策略選擇或者推理的前提。

博弈參與人的推理表現(xiàn)在他對策略的選取上。決定參與人的策略選取一方面是博弈結(jié)構(gòu),另一方面是其他參與人的策略。博弈結(jié)構(gòu)是不同策略組合下的支付函數(shù)或者得益函數(shù)。按照博弈的次序來分,博弈分動態(tài)與靜態(tài)博弈;按照信息的分布來分,博弈分為完全信息與不完全信息博弈。在不同的博弈結(jié)構(gòu)下,參與人所用的推理不同。

根據(jù)參與人推理前提與結(jié)論之間的關(guān)系,在博弈中推理分為演繹推理和歸納推理。我們來分析博弈參與人是如何運用演繹推理與歸納推理的。

(1)靜態(tài)博弈的演繹推理讓我們來分析典型的“囚徒博弈”的例子。

警察抓到了兩個共同偷竊的小偷,對他們進行單獨關(guān)押。囚徒面臨這樣的“政策”:如果一方“招認”,供出自己與對方以前所做違法之事,而對方“不招認”,“招認”方將無罪釋放,對方會被判重刑10年;如果雙方都與警方合作,選擇“招認”策略,各被判刑5年;而如果雙方均“不招認”,因警察找不到其他證明他們以前違法的證據(jù),只能對他們的小偷行為進行懲戒,各判刑1年。這兩個小偷如何做出選擇?

囚徒困境的支付矩陣為:

附圖

“囚徒困境”是一個被廣泛談?wù)摵脱芯康牟┺摹T谶@個囚徒困境中,小偷的最終“得益”是當(dāng)場釋放還是被判刑(10年、5年、1年),不僅取決于該囚徒的決定,而且取決于另外的小偷的決定。

在這個例子中,每個小偷都作這樣的推理:

如果對方“招認”,

我“不招認”的結(jié)果是判刑10年,“招認”的結(jié)果是判刑5年;

“招認”的結(jié)果好于“不招認”的結(jié)果

此時,我應(yīng)當(dāng)選擇“招認”

如果對方“不招認”,

我“不招認"的結(jié)果是判刑1年,“招認”的結(jié)果是當(dāng)場釋放;

當(dāng)場釋放比判刑1年要好

此時,我應(yīng)當(dāng)選擇“招認”

因此,無論對方采取“招認”還是“不招認”,我最好的策略是“招認”。

無論是甲,還是乙,他們均推理得出最好的策略是“招認”。雙方均招認是“納什均衡”——這是一個穩(wěn)定的結(jié)果。

在囚徒博弈中存在惟一的納什均衡(注:納什均衡,簡單地說就是,一策略組合中,所有的參與者面臨這樣的一種情況:當(dāng)其他人不改變策略時,他此時的策略是最好的;也就是說,此時如果他改變策略,他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的沖動。)點,即兩個囚犯均選擇“招認”策略。一旦人們處于囚徒困境,“囚徒困境有惟一的納什均衡點”構(gòu)成參與人的“公共知識”,雙方均毫不猶豫地選擇“招認”。

這是靜態(tài)博弈的例子。在這個推理過程中,雙方的推理均是演繹的。

(2)動態(tài)博弈中的演繹推理動態(tài)博弈過程如同靜態(tài)博弈,也是一個推理過程。我們來看一下動態(tài)博弈中人們是如何進行演繹推理的。先看一個例子。

有兩個企業(yè)A、B。企業(yè)B獨占一個行業(yè)的市場,企業(yè)A要進入這個領(lǐng)域,想與企業(yè)B瓜分該市場。企業(yè)B不愿意A與它一起瓜分該市場,它發(fā)出“威脅”:“如果你進入,我將打擊”。當(dāng)然,對B進行打擊,雙方均有損失。——這是雙方的“公共知識”。該博弈用博弈樹表示,即為:

附圖

上圖中的數(shù)字表明:如果A“不進入”,A的得益為0,B的得益為10;如果A“進入”,B“不打擊”的話,A與B平分10,各得到5,而如果“打擊”的話,A的收益為-3,B的收益為4。

這個博弈的結(jié)果是,A選擇“進入”,B選擇“不打擊”?!鼈儤?gòu)成“子博弈精煉納什均衡”。對于這個博弈,B的威脅“如果A進入,我將打擊”是“不可信的”威脅。

在這個動態(tài)博弈中,理性的參與人所用的推理方法被稱為“逆向歸納法”又稱“倒推法”(backwardinduction)。雖然被稱為逆向歸納法,但它是完全歸納法,即它是演繹性的。

逆向歸納法是求解動態(tài)博弈的方法。它是演繹性的,因為它的推理是必然的。在上面的例子,我們看到,企業(yè)A作這樣的推理:

假定我(A)進入,B如果“打擊”,它的得益為4;“不打擊”的得益為5。B是理性人。它將選擇“不打擊”。既然我預(yù)測到B將“不打擊”,我在“進入”和“不進入”間進行選擇時,“進入”的得益為5,“不進入”的得益為0,我作為理性人,將選擇“進入”。

當(dāng)A選擇“進入”策略時,B的推理是:

如果采取“打擊”,我的得益為4;“不打擊”的得益為5,選擇“不打擊”是理性的選擇。

(3)靜態(tài)博弈中的歸納推理博弈中參與人運用歸納推理,原因大體有兩個:一是由于信息不完全;二是由于博弈是競爭性的——零和博弈。

不完全信息博弈,又稱貝葉斯博弈,是博弈論研究的重要內(nèi)容。不完全信息博弈是指博弈參與人的得益函數(shù)不是公共知識時的博弈。此時,雖然博弈參與人是理性的構(gòu)成公共知識。但是,總存在某個策略組合下的得益不是公共知識。這樣,即使一個博弈存在惟一的納什均衡,由于這個均衡不是公共知識,這樣的均衡不能夠在一次博弈中達到。而所謂競爭性的博弈是指零和博弈,在一個博弈中如果只有兩個參與人,其中一方所得等于另外一方所失,此時,雙方不可能形成一個大家均接受而不會改變的純策略對。

在這樣的過程中,博弈參與人如何確定自己的策略選取呢?他只能根據(jù)其他參與人“歷史”中的策略“歸納地”得出對方此時的策略,從而決定自己的策略。一個例子就是,《三國演義》一書中“空城計”博弈。

諸葛亮誤用馬謖,致使街亭失守??酌髟谖鞒侵?,準(zhǔn)備啟程。等他安排停當(dāng),司馬懿引大軍15萬蜂擁而來。當(dāng)時孔明身邊別無大將,只有一班文官,五千軍士,已分一半先運糧草去了,只剩二千五百軍在城中。眾官聽到這個消息,盡皆失色??酌鞯浅峭粔m土沖天,魏兵分兩路殺來??酌鱾髁畋妼?,旌旗竟皆藏匿,諸軍各收城鋪。打開城門,每一門用上二十軍士,扮作百姓,灑掃街道。而孔明披鶴髦,戴綸巾,引二小童,攜琴一張,于城上敵樓前,憑欄而坐,焚香操琴。馬司懿來到城下,見到諸葛亮焚香操琴,笑容可掬。司馬懿嚇壞了,立即叫后軍作前軍,前軍作后軍,急速退去。司馬懿之子司馬昭問:莫非諸葛亮無軍,故作此態(tài),父親何故退兵?司馬懿說:“亮平生謹慎,不曾弄險,今大開城門,必有埋伏。我兵若進,中其計也?!笨酌饕娢很娡巳?,撫掌而笑,眾官無不駭然。諸葛亮說:司馬懿料吾平生謹慎,不曾弄險,見如此模樣,疑有伏兵,所以退去。吾非行險,蓋因不得已而用之。我們兵只有二千五百,若棄城而去,必為之所擒。

我們可以用如下的博弈矩陣來表示這個博弈:

附圖

這個博弈中,“進攻”是司馬懿的“占優(yōu)策略”。該博弈有兩個納什均衡,即:(司馬懿“進攻”,諸葛亮“守城”);(司馬懿“進攻”,諸葛亮“棄城”)。然而,司馬懿不知道自己和對方在不同行動策略下的支付,而諸葛亮知道。他們對博弈結(jié)構(gòu)的知識是不對稱的:諸葛亮擁有比司馬懿較多的知識。當(dāng)然這種知識的不對稱完全是諸葛亮“制造出來的”。

司馬懿是如何推理的呢?司馬懿的推理是“歸納的”。司馬懿說:“亮平生謹慎,不曾弄險。今大開城門,必有埋伏。我兵若進,中其計也。”在司馬懿看來,諸葛亮一生都是謹慎的,既然諸葛亮一生沒有冒險,此次也肯定不會冒險,諸葛亮有埋伏。司馬懿在“攻城”和“撤退”之間作出“撤退”的選擇。

在這里,司馬懿歸納作出了一個錯誤的策略選擇。盡管如此,我們不能說司馬懿是不理性的。司馬懿作出錯誤的策略選取,是由于不完全信息造成的。在孔明-司馬懿的博弈中,孔明做出的空城假象,目的就是讓司馬懿感到“攻城”有較大的失敗的可能。如果我們用概率論的術(shù)語來說,諸葛亮的做法是加大司馬懿對進攻失敗的主觀概率。此時,在司馬懿看來,“攻城”失敗的可能性較大,而“撤退”的期望效用大于“攻城”的期望效用。即:司馬懿認為,“攻城”的期望效用低于“撤退”的效用。諸葛亮惟有通過這個辦法,才能讓司馬懿退兵。

(4)動態(tài)博弈中的歸納推理下面我們來分析“酒吧問題”中人們是如何運用歸納推理的?!熬瓢蓡栴}”是一個重復(fù)性的動態(tài)博弈。

“酒吧問題”(barproblem)是美國人阿瑟(W.B.Arthur)提出的。阿瑟是斯坦福大學(xué)經(jīng)濟學(xué)教授,同時是美國著名的圣塔菲研究所(SantaFelnstitute)研究人員。他不滿意經(jīng)濟學(xué)中人們所認為的,經(jīng)濟主體或行動者(agents)的行動是建立在演繹推理基礎(chǔ)之上的觀點。他認為人們的行動是基于歸納的基礎(chǔ)之上的。“酒吧問題”就是阿瑟為了說明他的這個觀點而提出的。

在1994年《美國經(jīng)濟評論》的題為《歸納論證和有界理性》一文中阿瑟提出了“酒吧問題”博弈,后來在1999年的著名的《科學(xué)》雜志上題為《復(fù)雜性和經(jīng)濟》一文又闡述了這個博弈。

酒吧問題是指這樣一個博弈:有一群人,比如總共有100人,每個周末均要決定,是去附近的一個酒吧活動還是呆在家里。該酒吧的容量是有限的,比如空間是有限的,或者座位是有限的。我們假定酒吧的容量是60人,或者說座位是60個。如果去酒吧的人數(shù)少于60,并且他也去了,他的決定就是正確的;或者,如果去酒吧的人超過60人,而他沒有去——當(dāng)然這只有事后才知道,他的決定也是正確的。否則,其決定是錯誤的。

這里,我們假定他們之間不存在信息交流。我們看到,每個人根據(jù)對總的去酒吧人數(shù)的預(yù)測,而決定去酒吧與否。如果他預(yù)測去酒吧的人數(shù)超過60人,他將做出“不去酒吧”的決定,如果其預(yù)測不超過60人,他將做出“去酒吧”的決定。他們是如何做出預(yù)測呢?

每個參與者或決策者面臨的信息只是以前去酒吧的人數(shù),每個參與者只能根據(jù)以前去的人數(shù)的信息“歸納”地得出一個規(guī)律。根據(jù)這個規(guī)律,參與人預(yù)測下次去酒吧的人數(shù),從而決定自己去還是不去。

這是一典型的動態(tài)博弈問題。假定,前面幾周去酒吧的人數(shù)如下:

44,76,23,77,45,66,78,22……

不同的行動者可根據(jù)過去的歷史“歸納”出某個規(guī)律,從而做出預(yù)測。例如預(yù)測:下次的人數(shù)將是前4周的平均數(shù)(53);兩點的周期環(huán)(78);與前面隔一周的相同(78)……。

通過計算機的模型實驗,阿瑟得出一個有意思的結(jié)果。當(dāng)不同的行動者根據(jù)過去的歷史而進行行動時,去酒吧的人數(shù)沒有一個可預(yù)測的固定的規(guī)律。然而有這樣一個“規(guī)律”:經(jīng)過一段時間以后,“平均去酒吧的人數(shù)總是趨于60”。即,經(jīng)過一段時間,這個系統(tǒng)中的人群“去”與“不去”的人數(shù)比是60:40。盡管每個人不會固定地屬于“去”或“不去”的人群,但這個系統(tǒng)的這個比例是不變的。阿瑟說,預(yù)測者自組織到一個均衡類型或生態(tài)均衡系統(tǒng)。這100人構(gòu)成的系統(tǒng)是一個混沌系統(tǒng)(混沌系統(tǒng)的行為是不可預(yù)測的)。

這就是酒吧問題。在這個問題中,每個參與人根據(jù)歷史數(shù)據(jù)進行歸納并進行預(yù)測,然而,對于下次去酒吧的確定的人數(shù),參與人是無法作出肯定的預(yù)測。例如,有趣的是,如果許多人均預(yù)測去酒吧的人數(shù)多于60,而決定不去酒吧,此時酒吧的人數(shù)將少于60。他們的預(yù)測則錯了。如果許多人預(yù)測去酒吧的人數(shù)少于60,這些人去了酒吧,此時去酒吧的人數(shù)多過60。他們的預(yù)測也錯了。

附圖

因此人們要作出“正確的”預(yù)測,他要知道其他人如何作出預(yù)測的。但是在這個問題中每個人的預(yù)測的信息來源是一樣的,即都是過去的去酒吧的人數(shù)。每個人不知道別人如何作出預(yù)測的信息。因此,所謂“正確”預(yù)測是沒有的。每個人只能根據(jù)以往歷史“歸納地”作出預(yù)測,而無其他辦法。阿瑟教授提出這個問題,是強調(diào)在實際中歸納推理與行動之間的實際關(guān)聯(lián)。

利用歸納法的另外的例子是寡頭壟斷廠商之間的博弈。如果一個行業(yè)被多個寡頭廠商所壟斷,他們之間的競爭也是一個重復(fù)性的動態(tài)博弈。寡頭廠商要確定自己最優(yōu)的生產(chǎn)產(chǎn)量,但它們無法知道其他企業(yè)的產(chǎn)量。每個企業(yè)只能根據(jù)過去其他企業(yè)的生產(chǎn)產(chǎn)量來“推測”它們將要生產(chǎn)的產(chǎn)量,從而確定自己的最優(yōu)產(chǎn)量。這個產(chǎn)量是最優(yōu)的?不一定。如果是,它們就不調(diào)整自己的產(chǎn)量,如果不是,他們還要不斷地調(diào)整。這同樣是一個“歸納”和“調(diào)整”的過程。

3演繹推理的一個悖論:逆向歸納法悖論

逆向歸綱法是演繹推理,它是求解完全且完美信息下的動態(tài)博弈的方法。逆向歸納法推理嚴密。然而,將看到,逆向歸納法面臨著致命的缺陷:悖論。

讓我們來看一個蜈蚣博弈(centipedegame)的例子。

蜈蚣博弈是由羅森塞爾(Rosenthal)提出的。它是指這樣一個博弈:兩個參與者A、B輪流進行策略選擇:可供選擇的策略有“合作”和“不合作”兩種。假定A先選,然后是B,接著是A,如此交替進行。A、B之間的博弈次數(shù)為一有限次,比如198次。假定這個博弈的各自的支付給定如下:

附圖

蜈蚣博弈

上圖中,c表示“合作策略”,nc表示“不合作”。

在這個博弈中的參與人A、B是如何進行策略選擇的?

這個博弈形狀像一只蜈蚣,而被命名成蜈蚣博弈。這個博弈奇特之處是:當(dāng)A決策時,他考慮博弈的最后一步即第198步:B在“合作”和“不合作”之間作出選擇時,因“合作”給B帶來i00的收益,而“不合作”帶來101的收益,根據(jù)理性人的假定,B會選擇“不合作”。但是,要經(jīng)過第197步才到第198步,在197步,A考慮到B在第198步時會選擇“不合作”——此時A的收益是98,小于B合作時的100——那么在第197步時,他的最優(yōu)策略是“不合作”——因為“不合作”的收益99大于“合作”的收益98?!绱送普撓氯?。最后的結(jié)論是:在第一步A將選擇“不合作”,此時各自的收益為1!遠遠小于大家都采取“合作”策略時的收益:A:101,B:99。

根據(jù)逆向歸納法,結(jié)果是令人悲傷的。從邏輯推理來看,逆向歸納法是嚴密的。但結(jié)論是違反直覺的。直覺告訴我們,一開始就停止的策略A、B均只能獲取1,而采取合作性策略有可能均獲取100,當(dāng)然A一開始采取合作性策略有可能獲得0,但1或者0與100相比實在是太小了。直覺告我們采取“合作”策略是好的。而從邏輯的角度看,A一開始應(yīng)選擇“不合作”的策略。

是逆向歸納法錯了,還是直覺錯了?

似乎逆向歸納法不正確。然而,我們會發(fā)現(xiàn),即使雙方開始能走向合作,即雙方均采取合作策略,但這種合作不會堅持到最后一步。理性的人出于自身利益的考慮,肯定在某一步采取不合作策略。逆向歸納法肯定在某一步要起作用。只要逆向歸納法起作用,合作便不能進行下去。

因此,我們不能懷疑逆向歸納法的合理性,它的推理過程嚴密,符合邏輯。然而如果我們用逆向歸納法來求解蜈蚣博弈,則博弈結(jié)果是我們不能接受的。

許多博弈論專家認為,蜈蚣博弈所反映的不是悖論,逆向歸納法作為求解動態(tài)博弈的方法,是有效的。蜈蚣博弈的結(jié)果盡管不是我們所期望的,但它是均衡結(jié)果。這個均衡結(jié)果反映的是多主體下個體理性的局限。這是理性的困境。

4博弈行為中歸納推理的“合理性”問題

休謨告訴我們,人們使用歸納法尋求自然現(xiàn)象之間的因果聯(lián)系的這個過程,只不過是人的心理上的習(xí)慣聯(lián)想。我們有什么其他理由認為,我們所認為的事物之間的所謂因果聯(lián)系是必然的?這就是休謨問題。休謨質(zhì)疑的是認識中的歸納法的合理性問題。在博弈行為中,歸納推理同樣存在是否合理的問題。

我們用歸納法對自然進行認識,并根據(jù)我們歸納的結(jié)果做出相應(yīng)的行動。如:我們看到天空中烏云密布,風(fēng)漸漸地大了,我們想,天可能要下雨了,我們要帶傘。之所以有這樣的認識,是因為以往的經(jīng)驗“告訴”我們:當(dāng)烏云增多并刮大風(fēng)時,意味著要下大雨。即,當(dāng)我們面對自然現(xiàn)象時,我們根據(jù)過去的經(jīng)驗來歸納并采取相應(yīng)的行動。

在認識論中,我們知道,歸納推理所得出的結(jié)論是或然的。但是在認識中我們存在著這樣一個信念:全稱命題要么真、要么假,并且它是超越時間和空間的。我們用歸納法可以不斷地接近真理。在互動的博弈中,理性的人運用歸納法進行推理時,歸納法是否有效?它的合理性在哪里?

在“酒吧問題”中,我們憑什么說,以前去酒吧的人數(shù)與下次去酒吧的人數(shù)之間有聯(lián)系呢?當(dāng)某人進行預(yù)測時,只有當(dāng)他知道其他人預(yù)測的方法,他才能根據(jù)以往的人數(shù)和其他人的預(yù)測方法來“正確地”預(yù)測下次去酒吧的人數(shù)。這樣的預(yù)測才能是“有根據(jù)的”或者說“有理由的”。但我們除了能知道以往去酒吧的人數(shù)外,我們無法知道其他人的預(yù)測的方法。即使我們知道了其他人的預(yù)測方法,但當(dāng)其他人知道了我們將根據(jù)他們的預(yù)測方法來預(yù)測時,他們將改變他們的預(yù)測方法,從而使我們的預(yù)測歸于無效。

在酒吧問題上,我們通過歸納法無法準(zhǔn)確預(yù)測下次去酒吧的人數(shù),那么我們通過對過去的歷史能夠知道什么?或者,在更一般的意義上說,在博弈行動中,人們通過歸納法能夠?qū)W習(xí)到什么東西?這就是歸納法的合理性問題。

我們發(fā)現(xiàn),在博弈中歸納法的有效性體現(xiàn)在參與人對博弈均衡的認識。即通過歸納性的學(xué)習(xí),博弈參與人對該博弈均衡獲得了認識,對其他參與人的均衡策略也獲得了認識。

任何一個博弈均存在均衡,這也是諾貝爾經(jīng)濟學(xué)獎獲得者約翰·納什的貢獻,被稱為納什均衡存在定理。然而,這里的均衡有兩類:一類是純策略均衡,另一類混合策略均衡。歸納法的作用就是對這兩種均衡的認識。

當(dāng)一個博弈存在惟一一個純策略納什均衡點時,并且該博弈是完全信息博弈,參與人在一次博弈中就可達到均衡點。但當(dāng)博弈不是完全信息博弈時,博弈參與人通過多次博弈,“了解”其他參與人不同策略組合下的得益,一旦策略組合達到了納什均衡,博弈方均無意改變策略。因為此時,這一點是博弈各方均能夠接受的點。在這樣的過程中,參與人通過歸納法認識到該策略均衡,同時認識到其他參與人的策略選擇。

如果不存在純策略均衡,而只存在混合策略均衡,博弈參與人通過歸納法同樣能夠認識到該混合策略均衡,同樣能夠認識其他參與人的策略選取,但此時是一混合策略,即參與人在其策略空間上的一個概率分布。在酒吧問題的博弈中不存在“純策略納什均衡”點,此時的參與人通過歸納法“認識到”平均去酒吧的人數(shù)為"60%",即每次去酒吧的人數(shù)與不去酒吧的人數(shù)的“可能”比率為60:40。

因此,當(dāng)一個博弈存在純策略納什均衡時,博弈各參與人通過對以往的博弈歷史的歸納,制定出下次的策略均衡點,從而摸索著接近該均衡,最終達到一個純策略。而當(dāng)博弈存在混合策略均衡時,博弈參與人所能夠做的只是逐漸認識對方的混合策略,而相應(yīng)地制訂自己的混合策略,最終達到混合策略均衡。

這就是說,博弈中參與人運用的歸納推理是有效的,這種有效性是針對博弈均衡的認識而言的。

5結(jié)語

逆向歸納法悖論只是博弈論中一個悖論而已,歸納的合理性也只是多主體互動時理性人進行歸納推理的一個問題。博弈論涉及許多關(guān)于推理的邏輯“問題”。本人希望我國有更多的邏輯研究人員參與到博弈邏輯的研究中來,邏輯學(xué)家參與到博弈論的研究定能夠結(jié)出豐碩的研究成果。

【內(nèi)容提要】博弈邏輯(gamelogic)是隨著博弈論的迅速發(fā)展而形成的一個新的學(xué)科,它是一行動邏輯。博弈邏輯研究的是理性的人在互動行動中即博弈中的推理問題。在博弈行為中存在演繹推理和歸納推理。正如在傳統(tǒng)邏輯中存在邏輯悖論一樣,博弈邏輯中同樣存在悖論或者“問題”。博弈參與人運用演繹推理時存在逆向歸納法悖論,而運用歸納推理時存在歸納是否有效的問題。

【關(guān)鍵詞】博弈邏輯/演繹推理與歸納推理/逆向歸納法悖論/歸納推理的合理性

【參考文獻】

[1]潘天群.博弈生存[M].北京:中央編譯出版杜,2002.

[2]MamoruKaneko,TekashiNagashima.GameLogicandltsApplicationsⅠ[J].StudiaLogica,vo157,1996.325-354.

[3]MamoruKaneko,TakashiNagashima.GamelogicandItsApplicationsⅡ[J].StudiaLogica,vo158,1997.273-303.

[4]Bermudez.RationalityandtheBackwardsIndutionArgument[J].Analysis,1999,59(4):243-248.

[5]Arthur.InductiveReasoningandBoundedRationality[J].AmericanEconomicReview,vo184,1994.406.

[6]plexityandtheEconomy[J].Science,Vol284,1999.5411.