支持向量機在新經濟中的可靠性

時間:2022-08-23 09:38:05

導語:支持向量機在新經濟中的可靠性一文來源于網友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

支持向量機在新經濟中的可靠性

一、引言

2008年,中國政府為應對由美國次貸危機引起的全球性金融危機,通過投資四萬億元拉動經濟增長,使得中國的經濟增長模式由出口型向內需型轉變,雖然在一定程度上有效地緩解了金融危機帶來的影響,但其不可持續(xù)性已成定論?!笆濉逼陂g尋找新的經濟發(fā)展契機、培育新經濟增長點已成為各級政府統(tǒng)籌經濟工作的重點。如何能夠找到新的增長點,將選擇過程變得有根有據(jù),為政策制定提供依據(jù),是本文研究的出發(fā)點。經濟增長點理論來源于經濟不平衡增長理論,法國經濟學家弗朗索瓦•佩魯(F.Perroux)在《經濟空間:理論的應用》和《略論發(fā)展極的概念》等著述中最早提出了“發(fā)展極”(PolesofDevelopment)理論,他認為某些主導產業(yè)或有創(chuàng)新能力的企業(yè)在一些區(qū)域的聚集和優(yōu)先發(fā)展形成經濟活動中心,這些中心具有輻射作用,可以帶動一個地區(qū)的經濟發(fā)展[1]。在西方,新經濟增長點主要指的是地理上的經濟活動中心,在我國,新經濟增長點主要指產業(yè)上的帶動作用[2]。由此可見,新經濟增長點是一個經濟屬性與空間屬性并重的概念,是經濟點與空間點的結合[3]。本文認為,新經濟增長點是一切能引起經濟增長的潛在因素,不僅具有經濟屬性和空間屬性,同時也具有時間上的潛在性,即不是已有的、成熟的增長點,而是在現(xiàn)階段尚不明顯或已初現(xiàn),但在不久將來,因其巨大的成長性和帶動作用將成為一個時期發(fā)展的主流。新經濟增長點的選擇模型主要有三種:選擇圖譜法[4],線性模型法[3],因子分析法[5]。現(xiàn)有方法存在兩點不足,第一,沒有突出新經濟增長點的潛在性,區(qū)分出“已有的”增長點與“新的”增長點;第二,沒有指明新經濟增長點具體的增長環(huán)節(jié)。支持向量機(SupportVectorMachine,SVM)方法是建立在統(tǒng)計學習理論和Vapnik-Cher-vonenkis(VC)維概念的基礎之上[6]225-260。雖然統(tǒng)計學習理論論證堅實,理論完善,但是它對所研究對象的樣本數(shù)目要求較高,往往要有趨于無窮大的漸近行為,而實際問題中,研究對象的樣本數(shù)目有限,通常很難滿足以上假設前提。支持向量機的出現(xiàn),為解決有限樣本學習問題提供了有力支持。鄭治偉、孟衛(wèi)東使用支持向量機對重慶市主導產業(yè)進行了預測[7],研究結果同“十一五”期間重慶市產業(yè)現(xiàn)狀和未來產業(yè)規(guī)劃基本吻合,證實了支持向量機的科學性、合理性和前瞻性。前人的研究成果啟發(fā)了筆者的研究思路。VM是一種典型的兩類問題分類器,可以根據(jù)已學會的知識和處理問題的經驗對復雜問題做出合理的判斷決策,給出較滿意的解答[8]。對于新經濟增長點的選擇問題,可以使用過去的“新經濟增長點”對模型進行訓練,識別出未來的“新經濟增長點”的時間屬性。同時,針對新經濟增長點選擇更為具體、微觀的特點,在選擇出新經濟增長點后,將行業(yè)與本地區(qū)的自然資源和行業(yè)發(fā)展動態(tài)相結合,尋找具體的增長環(huán)節(jié),完成新經濟增長點的微觀化,加深對增長環(huán)節(jié)具體化的理解和研究。

二、計量模型及測量指標

(一)支持向量機簡介支持向量機是由V.Vapnik和A.Lerner提出的一種新型的基于統(tǒng)計學習理論的機器學習算法。自從20世紀90年代提出相關概念后,SVM已在手寫體識別、圖像分類、時間序列預測等領域取得了廣泛的應用和豐碩的成果。隨著對支持向量機的不斷深入研究,它已經成為機器學習和數(shù)據(jù)挖掘最重要的工具之一。SVM模型主要應用于樣本點的分類問題。在線性可分的情況下,如圖1所示,對于分別屬于H1和H2的兩類樣本點,可以輕易地找出一條直線H,將兩類樣本很好地區(qū)分開來。在無法用直線來分類樣本點的情況下,SVM通過尋找唯一的分類間隔最大超平面來解決分類問題。在圖1中,超平面H1由兩個空心圓張成,超平面H2由兩個實心圓張成。這四個樣本稱為支持向量。所謂分類間隔最大超平面就是指平行H1和H2的超平面H,它不僅能將H1和H2正確分類,而且使得兩者之間的距離最大。無論是直線還是超平面,在線性可分的情形下,總可以在原空間上利用SVM解決分類問題。但是對于線性不可分的情況,在原空間上已不能直接應用上述分類手段,必須利用非線性特征函數(shù)Φ∶Rd→W,將原空間上線性不可分的情形轉換為特征空間上線性可分的情形,才能夠繼續(xù)利用SVM進行分類。由于無法直接在高維的特征空間上利用特征函數(shù)計算分類超平面,為此,引入核函數(shù)K(x,y)的概念。核函數(shù),就是原空間上的非線性映射,它的函數(shù)表現(xiàn)為特征函數(shù)的點積形式,即K(x,y)=Φ(x)•Φ(y)。因此,特征空間上的分類問題可以轉化為支持向量在核函數(shù)上的權重和問題。實際應用中,由于徑向基函數(shù)實現(xiàn)非線性映射時使用參數(shù)較少,往往成為選擇核函數(shù)時的首選。本文即選用徑向基函數(shù)作為核函數(shù)進行SVM分類。從以上介紹可知,相對其他統(tǒng)計方法,SVM具有以下優(yōu)勢:1.在有限樣本的前提下,可以求出問題的最優(yōu)解,降低了收集樣本信息的成本;2.SVM模型得到的結論是全局最優(yōu)的,克服了其他方法中無法避免的局部極值問題;3.通過引入核函數(shù),使得可以僅僅通過兩個原始低維空間中的向量,獲得高維特征空間中的向量內積,解決了在高維空間中難以求解最優(yōu)超平面的難題。

(二)建立分類模型已知新經濟增長點訓練樣本(x1,y1),(x2,y2),…,(xl,yl),x∈R,y=-1,非新經濟增長點1,{新經濟增長點,l為樣本容量,則建立SVM判別新經濟增長點的模型步驟為:1.訓練樣本數(shù)據(jù)預處理(1)對訓練樣本歸一化,消除量綱的影響;(2)yqi采用如下策略進行調整:若行業(yè)屬于新經濟增長點,則yqi=1;反之,yqi=-1。2.建立SVM模型分類器取徑向基函數(shù)為核函數(shù),利用訓練樣本(xi,yi)求解如式(5)的二次優(yōu)化問題,從而獲得(αi,b)及其對應的支持向量:maxQ(α)=∑li=1ai-12∑lj=1αiαjyqiyqjK(xi•xj)+bs.t.∑li=1yqiαi=0,αi≥0,q=1,2,…,烅烄烆m(5)利用獲得的αi,b和支持向量,得到行業(yè)的分類模型:f(x)=∑pi=1αiyqiK(xi,x)+b,q=1,2,…,m(6)重復上述分類過程l次,得到l個行業(yè)分類模型。3.判別行業(yè)是否屬于新經濟增長點利用獲得的判別模型,即可根據(jù)行業(yè)輸入模式,判別行業(yè)是否屬于新經濟增長點。若第q個行業(yè)的輸出等于1,則該行業(yè)屬于新經濟增長點;若輸出為-1,則該行業(yè)不屬于新經濟增長點。

(三)指標體系的設立新經濟增長點是指那些處于潛在狀態(tài),尚不明顯或者已初現(xiàn),具有良好的發(fā)展勢頭和前景,能在不久的將來發(fā)揮作用的經濟增長點,結合經濟增長點的特征,經濟增長點的選擇應依據(jù)以下三點原則:1.增長潛力與成長性。新經濟增長點要有發(fā)展?jié)摿统砷L性,對經濟增長貢獻要大,能夠成為拉動經濟增長的主導力量。同時,具有技術進步帶動作用,技術進步才能使得增長點由外延式增長轉變?yōu)榧s式、內涵式增長。2.經濟效益。所選行業(yè)應具有一定的經濟規(guī)模和經濟效益。3.帶動性。新經濟增長點的推動作用和帶動作用要大,能夠促進相關產業(yè)發(fā)展。結合以上原則,根據(jù)理論指導及實際數(shù)據(jù)來源,本文選擇如下指標:1.反映增長潛力與成長性的指標經濟增長理論認為,決定經濟增長的主要因素有技術進步、人力資源和資本積累。根據(jù)前言分析,中國現(xiàn)階段通過投資實現(xiàn)增長已經不可持續(xù),但可以通過鼓勵技術進步得到,因此在增長潛力原則下選擇技術進步貢獻率指標。技術進步貢獻率x1=1-(α×K)/Y-(β×L)/Y其中K為資本的年均增長速度,L為勞動的平均增長速度,α為資本產出彈性,β為勞動產出彈性,通常假定生產在一定時期內α、β為一常數(shù),并且α+β=1。新經濟增長點應該適應市場需求,具有巨大的市場潛力,因此選擇需求收入彈性系數(shù)x2作為反映市場需求標準的指標。該系數(shù)是指在價格不變的前提下,某行業(yè)的需求增加率同人均國民收入增加率之比,用以反映某行業(yè)的社會需求量的變化對國民收入變化的敏感程度。需求收入彈性系數(shù)x2=ΔQiQi/ΔNiNi(7)其中x2表示某行業(yè)i的需求收入彈性系數(shù);ΔQi/Qi為該產業(yè)的需求增加率;ΔNi/Ni為同期人均國民收入增加率,i=1,2,…,n。2.反映經濟效益的指標增加值貢獻率x3=Nit-Ni0GDPt-GDP0×100%,其中Nit代表i行業(yè)期末增加值,Ni0代表i行業(yè)期初增加值,GDP0代表區(qū)域期初GDP,GDPt代表區(qū)域期末GDP。產值利稅率x4=SiYi×100%,其中Si代表利稅額,Yi代表工業(yè)總產值。成本費用利潤率x5=riwi×100%,其中ri代表利潤總額,wi代表成本費用總額。資產增加值率x6=NiCi×100%,其中Ni代表i行業(yè)增加值,Ci代表平均資產總額。全員勞動生產率x7=NiLi×100%,其中Ni代表i行業(yè)增加值,Li代表i行業(yè)員工人數(shù)。3.反映帶動性的指標新經濟增長點對一個時期一個地區(qū)經濟增長的帶動性可以通過影響力系數(shù)和感應度系數(shù)得以評價。影響力系數(shù)反映了某產品部門最終需求增加一個單位時對國民經濟其他部門的影響程度。影響力系數(shù)x8=∑ni=1b珔ij1n∑nj=1∑ni=1b珔ij,其中b珔ij代表完全需求系數(shù)。感應度系數(shù)反映了國民經濟的其他部門的最終需求均增加一個單位,各部門應該增加的總產出的數(shù)量。感應度系數(shù)x9=∑nj=1b珔ij1n∑ni=1∑nj=1b珔ij,其中b珔ij代表完全需求系數(shù)。

三、實證分析

(一)訓練集與實驗集樣本數(shù)據(jù)來源訓練集中的訓練樣本分為兩類,一類為“新經濟增長點”,另一類為“非新經濟增長點”。“新經濟增長點”一類選擇的是我國信息產業(yè)(2010)、汽車產業(yè)(2003),這兩個行業(yè)在相關文獻中有所提及并在經濟發(fā)展中得到檢驗[9-10],因此選擇信息產業(yè)2005—2009年的數(shù)據(jù)及汽車產業(yè)1999—2003年數(shù)據(jù);“非新經濟增長點”一類選擇的是我國水的生產和供應業(yè)(2010),為與“新經濟增長點”一類保持同比性,數(shù)據(jù)同樣為5年期限,從2006—2010年。指標數(shù)據(jù)來源于《中國信息產業(yè)年鑒》(2006—2010),《中國汽車工業(yè)年鑒》(2000—2004),《中國統(tǒng)計年鑒》(2004—2011),《中國投入產出表》(2002,2007),部分指標數(shù)據(jù)經計算得到。實驗集中的實驗樣本選擇《陜西統(tǒng)計年鑒》(2011)工業(yè)分類下的38個部門,數(shù)據(jù)來源于《陜西統(tǒng)計年鑒》(2005—2011),《中國投入產出表》(2007),《陜西省投入產出表》(2007)。

(二)計算步驟與結果1.數(shù)據(jù)無量綱化處理為了剔除量綱對計算結果的影響,首先對數(shù)據(jù)進行初始化處理。本文選擇的無量綱化方法為標準化處理法,xi*j=xij-x珚jsj,式中x珚j、sj(j=1,2,…,m)分別為第j項指標觀測值的平均值和標準差,xij*為處理后的標準化指標。2.指標計算需求收入彈性系數(shù)的計算。在利用式(7)對需求收入彈性系數(shù)進行實際計算時,對此公式做適當?shù)霓D化,用某行業(yè)的產品收入彈性系數(shù)代表該行業(yè)的收入彈性系數(shù);公式所指的需求量是指未來的需求量,但因無法提前預知,故用當期的需求量替代;基于對統(tǒng)計數(shù)據(jù)可得性的考慮,用當期的銷售量表示需求量。技術進步貢獻率的計算。技術進步貢獻率的計算根據(jù)C-D生產函數(shù),ΔA/A=ΔY/Y-αΔK/K-βΔL/L。式中,ΔA/A為全要素生產率;ΔY/Y為生產增長率,ΔL/L為勞動增長率;ΔK/K為資金增長率;α表示勞動對國民收入所做貢獻的百分比,β表示資金對國民收入所作貢獻的百分比。本文對陜西省第二產業(yè)各行業(yè)分別取2005—2011年產值、從業(yè)人員數(shù)、固定資產數(shù),根據(jù)C—D生產函數(shù),其中使用永續(xù)存盤法測算固定資本存量,使用SPSS11.0利用多元非線性回歸功能計算第二產業(yè)各行業(yè)的技術進步貢獻率。3.模型擬合首先,按如下規(guī)則設置訓練集樣本:(1)設“新經濟增長點”信息產業(yè)和汽車產業(yè)均為“1”;(2)設“非新經濟增長點”水的生產和供應業(yè)為“-1”。模型采用基于徑向基函數(shù)的SVM分類器,令σ=0.5。利用式(5),求出相應的(αi,b)及其對應的支持向量,并結合式(6)給出的行業(yè)分類模型,計算實驗樣本中各行業(yè)的分類結果。表1給出了以上計算過程的擬合結果。從表1中可以看出,模型將行業(yè)分為兩類:新經濟增長點(13個行業(yè))和非新經濟增長點(24個行業(yè))。通過計算各行業(yè)實驗數(shù)據(jù)到最優(yōu)平面的距離(d),可以給出各行業(yè)在各自分類中的排名次序規(guī)則:d越小,越與訓練集中的分類標準相近,該行業(yè)越有可能成為(非)新經濟增長點。

(三)結果分析經計算可知,被劃分為新經濟增長點一類的行業(yè)為通信設備、計算機及其他電子設備制造業(yè),非金屬礦物制品業(yè),石油和天然氣開采業(yè),文教體育用品制造業(yè),醫(yī)藥制造業(yè),印刷業(yè)和記錄媒介的復制,有色金屬礦采選業(yè),通用設備制造業(yè),電氣機械及器材制造業(yè),專用設備制造業(yè),紡織業(yè),化學纖維制造業(yè),非金屬礦采選業(yè)。根據(jù)行業(yè)到最優(yōu)平面的距離(d)將排在前十位的行業(yè)作為重點發(fā)展行業(yè)。根據(jù)行業(yè)增長特點,具體的增長環(huán)節(jié)分析如下:通信設備、計算機及其他電子設備制造業(yè)可發(fā)展一些污染小、附加值高、對整個西部輻射作用較大的產業(yè),如高端軟件和集成電路產業(yè)、物聯(lián)網產業(yè);通用設備制造業(yè)著重發(fā)展高新技術產業(yè);有色金屬礦采選業(yè)注重其中新能源產業(yè)的發(fā)展;基于陜西省大力發(fā)展文化產業(yè)的實際情況,印刷業(yè)和記錄媒介的復制業(yè)的發(fā)展可側重于與文化產業(yè)相關部分進行結合;醫(yī)藥制造業(yè)著重培育在生物產業(yè)的生物醫(yī)藥領域中的應用;借陜西省建立國家民用航天產業(yè)基地的契機,專用設備制造業(yè)也可與之相結合發(fā)展;電氣機械及器材制造業(yè)可著重發(fā)展集成電路、激光、半導體照明等產業(yè)?!蛾兾魇窠洕蜕鐣l(fā)展“十二五”規(guī)劃綱要》中指出,“十二五”期間陜西省要重點發(fā)展裝備制造業(yè)、文化產業(yè)、戰(zhàn)略性新興產業(yè),其中戰(zhàn)略性新興產業(yè)包括高新技術產業(yè)、能源產業(yè),與本文的分析結果相比,通過支持向量機的方法選擇的新經濟增長點與陜西省“十二五”規(guī)劃確定的重點發(fā)展產業(yè)基本吻合。

四、結論

本文使用SVM選擇新經濟增長點,其優(yōu)勢在于:通過經時間證實的增長點挖掘潛在經濟增長點,使得模型同時具備經濟屬性、空間屬性和時間上的潛在性。SVM在解決小樣本、非線性及高維模式識別方面具有優(yōu)勢,本文使用某個地區(qū)在某個時期成為新經濟增長點的行業(yè)作為新經濟增長點判斷的“標準行業(yè)”,利用SVM在識別時需要訓練的特點,使用這些標準行業(yè)進行訓練,通過訓練使模型對新經濟增長點的特征有了“記憶”,這時,再使用需要被評價的某地區(qū)當下時間段的多個行業(yè)輸入模型進行運算,當某個行業(yè)的特征同經過時間驗證的過去的新經濟增長點的特征一致或接近時,模型就會識別出來新經濟增長點。同時,在選擇出新經濟增長點后,將行業(yè)與本地區(qū)的自然資源和行業(yè)發(fā)展動態(tài)相結合,尋找具體的增長環(huán)節(jié),完成新經濟增長點的微觀化,加深對增長環(huán)節(jié)具體化的理解和研究。