矩陣論在神經(jīng)網(wǎng)絡(luò)中的應(yīng)用范文

時間:2024-03-28 18:10:06

導(dǎo)語:如何才能寫好一篇矩陣論在神經(jīng)網(wǎng)絡(luò)中的應(yīng)用,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

矩陣論在神經(jīng)網(wǎng)絡(luò)中的應(yīng)用

篇1

人工神經(jīng)網(wǎng)絡(luò)是近年來迅猛發(fā)展的前沿課題,它對突破現(xiàn)有科學(xué)技術(shù)的瓶頸起到重大的作用。本文剖析了人工神經(jīng)網(wǎng)絡(luò)的特征、模型結(jié)構(gòu)以及未來的發(fā)展趨勢。

【關(guān)鍵詞】人工神經(jīng)網(wǎng)絡(luò) 神經(jīng)元 矩陣

1 人工神經(jīng)網(wǎng)絡(luò)概述

人工神經(jīng)網(wǎng)絡(luò)(ANN)是一種用計算機網(wǎng)絡(luò)系統(tǒng)模擬生物神經(jīng)網(wǎng)絡(luò)的智能神經(jīng)系統(tǒng),它是在現(xiàn)代神經(jīng)生物學(xué)研究成果的基礎(chǔ)上發(fā)展起來的,模擬人腦信息處理機制的一種網(wǎng)絡(luò)系統(tǒng),它不但具有處理數(shù)值數(shù)據(jù)的計算能力,而且還具有處理知識的學(xué)習(xí)、聯(lián)想和記憶能力。

人工神經(jīng)網(wǎng)絡(luò)模擬了大腦神經(jīng)元的組織方式,反映了人腦的一些基本功能,為研究人工智能開辟了新的途徑。它具有以下基本特征:

1.1 并行分布性

因為人工神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元排列并不是雜亂無章的,往往是以一種有規(guī)律的序列排列,這種結(jié)構(gòu)非常適合并行計算。同時如果將每一個神經(jīng)元看作是一個基本的處理單元,則整個系統(tǒng)可以是一個分布式處理系統(tǒng),使得計算快速。

1.2 可學(xué)習(xí)性和自適應(yīng)性

一個相對很小的人工神經(jīng)網(wǎng)絡(luò)可存儲大量的專家知識,并能根據(jù)學(xué)習(xí)算法,或利用指導(dǎo)系統(tǒng)模擬現(xiàn)實環(huán)境(稱為有教師學(xué)習(xí)),或?qū)斎脒M行自適應(yīng)學(xué)習(xí)(稱為無教師學(xué)習(xí)),可以處理不確定或不知道的事情,不斷主動學(xué)習(xí),不斷完善知識的存儲。

(3)魯棒性和容錯性

由于采用大量的神經(jīng)元及其相互連接,具有聯(lián)想映射與聯(lián)想記憶能力,容錯性保證網(wǎng)絡(luò)將不完整的、畸變的輸入樣本恢復(fù)成完整的原型,魯棒性使得網(wǎng)絡(luò)中的神經(jīng)元或突觸遭到破壞時網(wǎng)絡(luò)仍然具有學(xué)習(xí)和記憶能力,不會對整體系統(tǒng)帶來嚴重的影響。

1.3 泛化能力

人工神經(jīng)網(wǎng)絡(luò)是大規(guī)模的非線性系統(tǒng),提供了系統(tǒng)協(xié)同和自組織的潛力,它能充分逼近任意復(fù)雜的非線性關(guān)系。如果輸入發(fā)生較小變化,則輸出能夠保持相當小的差距。

1.4 信息綜合能力

任何知識規(guī)則都可以通過對范例的學(xué)習(xí)存儲于同一個神經(jīng)網(wǎng)絡(luò)的各連接權(quán)值中,能同時處理定量和定性的信息,適用于處理復(fù)雜非線性和不確定對象。

2 人工神經(jīng)網(wǎng)絡(luò)模型

神經(jīng)網(wǎng)絡(luò)是在對人腦思維方式研究的基礎(chǔ)上,將其抽象模擬反映人腦基本功能的一種并行處理連接網(wǎng)絡(luò)。神經(jīng)元是神經(jīng)網(wǎng)絡(luò)的基本處理單元。

在神經(jīng)網(wǎng)絡(luò)的發(fā)展過程中,從不同角度對神經(jīng)網(wǎng)絡(luò)進行了不同層次的描述和模擬,提出了各種各樣的神經(jīng)網(wǎng)絡(luò)模型,其中最具有代表性的神經(jīng)網(wǎng)絡(luò)模型有:感知器、線性神經(jīng)網(wǎng)絡(luò)、BP網(wǎng)絡(luò)、自組織網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)、反饋神經(jīng)網(wǎng)絡(luò)等等。

3 神經(jīng)元矩陣

神經(jīng)元矩陣是神經(jīng)網(wǎng)絡(luò)模型的一種新構(gòu)想,是專門為神經(jīng)網(wǎng)絡(luò)打造的一個矩陣,它符合神經(jīng)元的一切特征。

神經(jīng)元矩陣采用矩陣形式,它可為n維向量組成。引入向量觸頭和信使粒的概念,向量觸頭可生長,即長度可變,方向可變,信使??伞坝问帯痹诰仃囍?,建立各種聯(lián)系。如圖1即是神經(jīng)元矩陣模型

(1)容器可產(chǎn)生一種無形的約束力,使系統(tǒng)得以形成,容器不是全封閉的,從而保證系統(tǒng)與外界的溝通和交互;各向量間可用相互作用的力來聯(lián)系,而各個信使粒則受控于容器、中空向量以及其它的信使粒。各神經(jīng)元之間自主交互,神經(jīng)元矩陣是一種多層次的管理,即一層管理一層。系統(tǒng)具有明顯的層級制和分塊制,每層每塊均獨立且協(xié)同工作,即每層每塊均含組織和自組織因素。

(2)向量觸頭是中空的,信使??梢酝ㄟ^向量或存儲于向量中,所以又稱為中空向量。向量存儲了信使粒后,可以吸引更多的信使粒在附近,或使鄰近向量轉(zhuǎn)向、伸長,進而形成相對穩(wěn)定的信息通路。

(3)當兩條或更多的信息通路匯集時,可能伴隨著通路的增強、合并,以及信使粒的聚集、交換,這是神經(jīng)元矩陣運算的一種主要形式。通路的形成過程,也就是是神經(jīng)元矩陣分塊、分層、形成聯(lián)接的過程,也為矩陣系統(tǒng)宏觀管理、層級控制的實現(xiàn)奠定了基礎(chǔ)。

神經(jīng)元矩陣亦是一種具有生物網(wǎng)絡(luò)特征的數(shù)學(xué)模型,綜合了數(shù)學(xué)上矩陣和向量等重要概念,是一種立體的矩陣結(jié)構(gòu)。尤其是將矩陣的分塊特性和向量的指向特征結(jié)合起來,更好的體現(xiàn)了神經(jīng)網(wǎng)絡(luò)的整體性和單元獨立性,系統(tǒng)的組織和自組織特征也更為凸顯。信使粒以“點”的數(shù)學(xué)概念,增強了系統(tǒng)的信息特征,尤其是增強了矩陣的存儲和運算功能。

4 人工神經(jīng)網(wǎng)絡(luò)的發(fā)展趨勢

人工神經(jīng)網(wǎng)絡(luò)是邊緣叉科學(xué),它涉及計算機、人工智能、自動化、生理學(xué)等多個學(xué)科領(lǐng)域,研究它的發(fā)展具有非常重要意義。針對神經(jīng)網(wǎng)絡(luò)的社會需求以及存在的問題,今后神經(jīng)網(wǎng)絡(luò)的研究趨勢主要側(cè)重以下幾個方面。

4.1 增強對智能和機器關(guān)系問題的認識

人腦是一個結(jié)構(gòu)異常復(fù)雜的信息系統(tǒng),我們所知道的唯一智能系統(tǒng),隨著信息論、控制論、計算機科學(xué)、生命科學(xué)的發(fā)展,人們越來越驚異于大腦的奇妙。對人腦智能化實現(xiàn)的研究,是神經(jīng)網(wǎng)絡(luò)研究今后的需要增強的地發(fā)展方向。

4.2 發(fā)展神經(jīng)計算和進化計算的理論及應(yīng)用

利用神經(jīng)科學(xué)理論的研究成果,用數(shù)理方法探索智能水平更高的人工神經(jīng)網(wǎng)絡(luò)模型,深入研究網(wǎng)絡(luò)的算法和性能,使離散符號計算、神經(jīng)計算和進化計算相互促進,開發(fā)新的網(wǎng)絡(luò)數(shù)理理論。

4.3 擴大神經(jīng)元芯片和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的作用

神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)體現(xiàn)了結(jié)構(gòu)和算法的統(tǒng)一,是硬件和軟件的混合體,神經(jīng)元矩陣即是如此。人工神經(jīng)網(wǎng)絡(luò)既可以用傳統(tǒng)計算機來模擬,也可以用集成電路芯片組成神經(jīng)計算機,甚至還可以生物芯片方式實現(xiàn),因此研制電子神經(jīng)網(wǎng)絡(luò)計算機潛力巨大。如何讓傳統(tǒng)的計算機、人工智能技術(shù)和神經(jīng)網(wǎng)絡(luò)計算機相融合也是前沿課題,具有十分誘人的前景。

4.4 促進信息科學(xué)和生命科學(xué)的相互融合

信息科學(xué)與生命科學(xué)的相互交叉、相互促進、相互滲透是現(xiàn)代科學(xué)的一個顯著特點。神經(jīng)網(wǎng)絡(luò)與各種智能處理方法有機結(jié)合具有很大的發(fā)展前景,如與專家系統(tǒng)、模糊邏輯、遺傳算法、小波分析等相結(jié)合,取長補短,可以獲得更好的應(yīng)用效果。

參考文獻

[1]鐘珞.饒文碧.鄒承明著.人工神經(jīng)網(wǎng)絡(luò)及其融合應(yīng)用技術(shù).科學(xué)出版社.

篇2

與經(jīng)典測驗理論相比,項目反應(yīng)理論(簡稱IRT)由于具有參數(shù)不變性、能進行計算機化自適應(yīng)測驗等優(yōu)點而受到歡迎[1,2],但是也存在著不少問題,首先是目前比較成熟的、得到廣泛應(yīng)用的IRT軟件,如BILOG、MicroCAT等,主要是運用極大似然法或貝葉斯方法進行項目參數(shù)和被試能力估計[3],一般都只能處理二值記分的項目,也有少數(shù)軟件可以處理等級記分的項目,例如MULTILOG,但對于連續(xù)記分的項目還缺少估計方法和工具;其次是在運用BILOG、MicroCAT和MULTILOG等軟件時往往需要數(shù)百人的大樣本,而對于小樣本則缺少有效的估計方法,因此需要另尋途徑來解決這些問題。

2 聯(lián)結(jié)主義理論中的級連相關(guān)模型

聯(lián)結(jié)主義理論(或稱人工神經(jīng)網(wǎng)絡(luò))是近年來得到廣泛關(guān)注的認知心理學(xué)理論[4,5,6],它一方面可以用來模擬人的認知活動,探討人類的信息加工機制[7],另一方面可以作為一種工具來分析系統(tǒng)的輸入和輸出之間的關(guān)系,特別是當系統(tǒng)的輸入和輸出之間難以用顯性的數(shù)學(xué)方程表示時,聯(lián)結(jié)主義模型就可以通過其本身的學(xué)習(xí)功能,在用一組已知的輸入和輸出數(shù)據(jù)對它進行訓(xùn)練以后,就可以在一定程度上掌握了該系統(tǒng)內(nèi)部的輸入和輸出之間的關(guān)系,即建立了某種模型。如果我們再給這個經(jīng)過訓(xùn)練的網(wǎng)絡(luò)模型以新的輸入,那么它就可以給出相應(yīng)的輸出值。因此,人們可以利用聯(lián)結(jié)主義模型的這種性質(zhì)來進行預(yù)測和參數(shù)估計等活動[8]。

聯(lián)結(jié)主義模型通常由一個輸入層、一個輸出層和若干個隱含層組成,每一層中含有若干個結(jié)點,一個模型中所含的隱含層數(shù)目和各層所含結(jié)點數(shù)目,是由具體問題的性質(zhì)和復(fù)雜程度來確定的。各個結(jié)點之間的聯(lián)結(jié)具有一定的權(quán)重,它的大小反映了相鄰兩個結(jié)點之間相互影響的程度,在模型被訓(xùn)練的過程中,各結(jié)點間的權(quán)重得到了調(diào)整。

聯(lián)結(jié)主義模型通??梢苑譃殪o態(tài)型和動態(tài)型兩種,靜態(tài)型模型的拓撲結(jié)構(gòu)是實驗者在一開始的時候就設(shè)計好的,它的訓(xùn)練過程就是調(diào)節(jié)各結(jié)點之間的權(quán)重。動態(tài)型模型的拓撲結(jié)構(gòu)是在訓(xùn)練過程中不斷變化的,它能夠隨著訓(xùn)練的進行,自動地加入新的隱含結(jié)點,同時也調(diào)整各結(jié)點間的聯(lián)結(jié)權(quán)重,這樣就可以更快地減少訓(xùn)練誤差。

級連相關(guān)模型是動態(tài)型聯(lián)結(jié)主義模型中的一種[9],它的計算精度較高,運算速度較快。在開始訓(xùn)練時,該模型只有輸入層和輸出層,處于最小拓撲結(jié)構(gòu)。隨著訓(xùn)練過程的進行,它能夠根據(jù)需要自動地逐個加入隱含結(jié)點。該模型的訓(xùn)練分為輸出和輸入兩個階段交替進行,首先是輸出階段,在這一階段,模型對聯(lián)結(jié)隱含結(jié)點和輸出結(jié)點間的各權(quán)重進行調(diào)整,直到誤差不再減少為止;然后轉(zhuǎn)至輸入階段,在這一階段,模型對于聯(lián)結(jié)輸入結(jié)點和候選隱含結(jié)點間的各個權(quán)重進行調(diào)整,并從中選出其輸出變量和網(wǎng)絡(luò)的誤差變量間相關(guān)為最大的候選隱含結(jié)點,把它裝入網(wǎng)絡(luò),這樣使得每次裝入的新隱含結(jié)點都能最大程度地影響誤差的變化。然后再轉(zhuǎn)至輸出階段,這個過程不斷重復(fù),直到達到預(yù)定的訓(xùn)練精度。在本研究中,由于無法事先確定模型的拓撲結(jié)構(gòu),以及為了較快地對模型進行訓(xùn)練和達到較好的訓(xùn)練和測試效果,采用了級連相關(guān)模型作為研究的工具。

3 連續(xù)記分IRT模型

連續(xù)記分IRT模型是二值記分IRT模型的擴展,即它的記分不是按照二值邏輯的全對或全錯的方式來進行,而是根據(jù)被試答對項目的程度來進行記分,如果全對該題目就得滿分。由于各題目的滿分值不一樣,有的是3分、5分、6分或更高的分數(shù),為了統(tǒng)一起見,可以對它們進行歸一化處理,全部轉(zhuǎn)化為0至1的值。這樣就可以和下面的三參數(shù)邏輯斯諦模型中的P(θ)相一致。Samejima[10]、Muller[11]和Mullenbergh[12]等都對連續(xù)記分IRT模型進行過研究,它和二值記分模型一樣,可以用正態(tài)卵形模型和邏輯斯諦模型表示。對于常用的三參數(shù)邏輯斯諦模型,它的表示式為:

P(θ)=c[,i]+(1-c[,i])exp[1.7a[,i](θ-b[,i])]/{1+exp[1.7a[,i](θ-bi)]}

在該模型中,式中的ai、bi和ci分別為第i個項目的區(qū)分度、難度和猜測參數(shù),θ為某個被試的能力,P(θ)為該被試答對第i個項目的概率,它的值為0至1,這是一個連續(xù)的值。

雖然有些學(xué)者對于該模型進行了一些研究,但是他們的研究還只是涉及該模型的性質(zhì)、信息函數(shù)的定義、參數(shù)不變性等方面,在具有實用意義的參數(shù)和被試能力估計方面還沒有成熟的結(jié)果。

為了對連續(xù)記分IRT模型的參數(shù)估計問題進行研究,作者對目前常用的幾個IRT軟件的算法進行分析[13,14],發(fā)現(xiàn)它們的共同特點都是運用統(tǒng)計的方法來進行參數(shù)估計,都無法對小樣本情況下的IRT連續(xù)記分模型進行參數(shù)估計,于是作者就決定另辟捷徑,在本研究中采用了和常用統(tǒng)計技術(shù)完全不同的聯(lián)結(jié)主義模型(人工神經(jīng)網(wǎng)絡(luò))方法。運用統(tǒng)計方法不能完全解決的問題,并不意味著用其它方法就不能解決,其關(guān)鍵問題是常用的統(tǒng)計參數(shù)估計方法大多是建立在線性模型的基礎(chǔ)上的,而被試的反應(yīng)和IRT中參數(shù)之間的關(guān)系是非線性的,因此在運用統(tǒng)計方法進行參數(shù)估計時,要采用大樣本才能得到較好的結(jié)果。而人工神經(jīng)網(wǎng)絡(luò)的輸出和輸入之間的關(guān)系本身就是非線性的,特別值得一提的是,本研究把人工神經(jīng)網(wǎng)絡(luò)的激活函數(shù)設(shè)計為S型的Sigmoid函數(shù),它的表達式為

f(x)=exp(x)/[1+exp(x)]

它和上述的三參數(shù)邏輯斯諦模型的表示式非常相似,仔細比較一下,就可以看出它實際上就是IRT模型在c[,i]=0,b[,i]=0,1.7a[,i]=1,θ=x時的特例,因此聯(lián)結(jié)主義模型(人工神經(jīng)網(wǎng)絡(luò))的這種輸出和輸入之間的非線性結(jié)構(gòu)就可以較好地處理IRT中相類似的數(shù)據(jù)關(guān)系。

4 計算機模擬實驗的設(shè)計和實施

該實驗的基本思想是:把一組被試對于一組項目的反應(yīng)矩陣作為級連相關(guān)模型(以下簡稱為神經(jīng)網(wǎng)絡(luò))的輸入,這組被試的能力θ或該組項目的參數(shù)a、b和c作為該模型的輸出,并且用這些輸入和對應(yīng)的輸出值對該神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,經(jīng)過訓(xùn)練的網(wǎng)絡(luò)就具備了估計θ,a,b或c的能力。當輸入一組新的反應(yīng)矩陣時,該網(wǎng)絡(luò)就可以輸出所需的被試能力或項目參數(shù)估計值。本實驗是用計算機模擬方法來考察運用這種方法得到的估計值和真實值之間的誤差是否能夠達到相當小的程度。

4.1 實驗步驟的設(shè)計

整個實驗分以下幾個步驟進行:

(1)運用蒙特卡羅方法產(chǎn)生一組均勻分布的被試能力值θ,一組均勻分布的項目參數(shù)值(包括項目區(qū)分度a、項目難度b和項目猜測參數(shù)c)。被試能力值θ的分布范圍為[-3,+3],項目區(qū)分度a的分布范圍為[0,2],項目難度b的分布范圍為[-3,+3],項目猜測參數(shù)c的分布范圍為[0,0.25]。

(2)根據(jù)項目反應(yīng)模型,讓各個模擬的被試回答各個模擬的項目,產(chǎn)生反應(yīng)矩陣。

(3)將該反應(yīng)矩陣作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練模式的輸入部分,用所要學(xué)習(xí)的項目參數(shù)或被試能力作為訓(xùn)練模式的輸出部分。若要估計被試的能力,就把反應(yīng)矩陣中的每一行作為一個模式,因為它恰好是一個被試對于一組項目的反應(yīng);若要估計項目參數(shù),就把反應(yīng)矩陣中的每一列作為一個模式,因為它反映了每一個項目被解答的情況。

(4)用上述訓(xùn)練模式對一組神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,直至達到預(yù)定的精確度為止。在本研究中為了統(tǒng)計上的方便,對30個神經(jīng)網(wǎng)絡(luò)進行了訓(xùn)練,預(yù)定的精確度為網(wǎng)絡(luò)的目標值和實際輸出值之間的誤差小于0.001。

(5)用經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)來估計被試能力和項目參數(shù)。在本研究中需要估計的被試能力和項目參數(shù)的真實值實際上是用蒙特卡羅方法產(chǎn)生的,因此可以計算出估計值(實際輸出值)和真實值的誤差,稱為測試誤差,并用下式表示:

附圖

式中,T[,p.o]為每個測試模式的每個輸出結(jié)點的目標值。N[,p.o]為每個測試模式的每個輸出結(jié)點的實際輸出值。p是測試模式的數(shù)目,o是輸出結(jié)點的數(shù)目。根據(jù)測試誤差E的大小,可以看出經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)是否真正可以對項目參數(shù)和被試能力進行很好的估計。

4.2 預(yù)備實驗

由于在正式對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練以前,對于要用什么樣的模式來訓(xùn)練沒有任何先驗的知識,為此先進行預(yù)備實驗。和正式實驗的步驟一樣,首先運用蒙特卡羅方法產(chǎn)生25個被試對15個項目的反應(yīng)矩陣,用這一矩陣和相應(yīng)的被試能力或項目參數(shù)組成4組訓(xùn)練模式,分別用以估計θ,a,b和c。在對被試能力進行估計時,將矩陣的行作為一組神經(jīng)網(wǎng)絡(luò)訓(xùn)練模式的輸入部分,因為矩陣的一行數(shù)據(jù)就代表了一個被試對所有項目的反應(yīng);相應(yīng)被試的θ值作為訓(xùn)練模式的輸出部分,因為它代表了被試的能力值。在對項目參數(shù)進行估計時,將矩陣的列作為一組神經(jīng)網(wǎng)絡(luò)訓(xùn)練模式的輸入部分,因為矩陣的一列數(shù)據(jù)就代表了所有被試對一個項目的反應(yīng);相應(yīng)項目的a,b或c值作為訓(xùn)練模式的輸出部分,因為它代表了項目的參數(shù)值。就用這些訓(xùn)練模式分別對4組神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,這4組神經(jīng)網(wǎng)絡(luò)分別對應(yīng)于被試能力和項目的三個參數(shù),每組有30個網(wǎng)絡(luò)。然后,再用蒙特卡羅方法產(chǎn)生另外25個被試對另外15個項目的反應(yīng)矩陣,并用已經(jīng)訓(xùn)練過的網(wǎng)絡(luò)對這個反應(yīng)矩陣估計θ,a,b和c,記錄下測試誤差。其結(jié)果表明,雖然可以進行被試能力和項目參數(shù)的估計,但誤差較大,無法達到實際應(yīng)用的精確度。根據(jù)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的一般規(guī)律,估計出現(xiàn)這一情況的原因有兩條,一是訓(xùn)練模式太少,二是訓(xùn)練模式和測試模式之間沒有任何聯(lián)系,即沒有用“錨題”或“錨人”把它們聯(lián)系起來,改進的方法可以是增加訓(xùn)練模式,或運用一定的“錨題”或“錨人”方法,在本研究中先用“錨題”的方法進行試驗(具體方法在進行正式實驗時詳述),試驗的效果很好,然后進行下面的正式實驗。

4.3 正式實驗

(1)步驟1:產(chǎn)生訓(xùn)練矩陣和測試矩陣

運用蒙特卡羅方法產(chǎn)生25個被試(稱為第一組被試)對45個項目(稱為第一組項目)的反應(yīng)矩陣(稱為第一矩陣),這一矩陣在下面的實驗中將作為測試矩陣;從該45個項目中隨機取出15個項目(稱為第二組項目),再用蒙特卡羅方法產(chǎn)生另外25個被試(稱為第二組被試),令它們和上述隨機取出的第二組項目起反應(yīng),產(chǎn)生另一個反應(yīng)矩陣(稱為第二矩陣),用它作為訓(xùn)練模式的一部分,由此可見,訓(xùn)練矩陣和測試矩陣之間有15個項目作為“錨題”,如下面圖1所示。

附圖

圖1 被試、項目和反應(yīng)矩陣

圖1中的第三組項目和第三矩陣將在下面作解釋。

(2)步驟2:建立能力訓(xùn)練模式

用“第二矩陣”中的每一行作為一個模式的輸入,其相應(yīng)的25個第二組被試的能力值作為輸出,組成能力訓(xùn)練模式,對一組神經(jīng)網(wǎng)絡(luò)(共30個,稱為第一組神經(jīng)網(wǎng)絡(luò))進行訓(xùn)練。

(3)步驟3:建立能力測試模式并進行測試

將“第一矩陣”中的每一行作為一個模式的輸入,相應(yīng)的第一組被試的25個能力值作為輸出,組成能力測試模式,用上述經(jīng)過訓(xùn)練的第一組神經(jīng)網(wǎng)絡(luò)對其進行測試。這時,實際上是神經(jīng)網(wǎng)絡(luò)對第一組被試的能力值進行估計。然后,將估計值和真實值進行比較,記錄下測試誤差,如表1左邊第1列所示,要注意的是,表中記錄的是30個網(wǎng)絡(luò)的測試誤差實際值,根據(jù)公式可見,它是所有輸出結(jié)點和所有測試模式的誤差總和。由于本研究中只有一個輸出結(jié)點,有25個測試模式(因為有25個被試),因此要將表中的測驗誤差實際值除以25,得到對單個測試模式的測試誤差,然后,再計算其平均數(shù)M和標準差SD,結(jié)果如表2所示,可以看出測試誤差是比較小的。由此可見,當測試模式中有部分項目(本例中為15個項目)和訓(xùn)練模式相同時,經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可以對被試的θ進行很好的估計。應(yīng)該指出的是,測試模式和訓(xùn)練模式中沒有被試是重復(fù)相同的,這說明經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)確實可以對新的被試進行能力估計。

表1 測試誤差

θ

a

b

c

0.129

2.239

2.982

0.065

0.084

1.843

2.976

0.056

0.243

2.016

2.798

0.069

0.324

1.804

2.133

0.058

0.126

2.159

2.556

0.027

0.201

2.224

2.399

0.067

0.288

2.246

2.617

0.043

0.114

1.741

2.834

0.065

0.189

1.937

2.347

0.076

0.249

2.295

2.745

0.092

0.264

2.319

2.433

0.065

0.321

2.382

2.030

0.044

0.105

2.136

2.231

0.093

0.132

2.061

2.244

0.023

0.153

2.019

2.868

0.068

0.279

2.270

2.042

0.044

0.204

2.196

1.850

0.099

0.102

1.950

2.597

0.059

0.105

1.732

1.709

0.089

0.282

1.764

2.328

0.072

0.228

2.281

2.556

0.114

0.256

2.089

1.961

0.071

0.222

2.445

2.002

0.093

0.210

1.666

2.243

0.035

0.138

1.743

2.441

0.075

0.201

2.438

2.034

0.080

0.171

1.740

2.100

0.106

0.246

2.307

2.594

0.069

0.195

1.577

2.535

0.057

0.213

2.436

2.199

0.057

(4)步驟4:建立項目參數(shù)訓(xùn)練模式

當估計項目參數(shù)時,將“第一矩陣”中的每一列作為一個模式的輸入,因為每一列都代表所有被試對一個項目的反應(yīng)情況,于是可以將與各列相應(yīng)項目的a、b或c作為輸出,組成項目參數(shù)訓(xùn)練模式,用該模式對一組神經(jīng)網(wǎng)絡(luò)(共30個,稱為第二組神經(jīng)網(wǎng)絡(luò))進行訓(xùn)練。

(5)步驟5:建立項目參數(shù)測試模式并進行測試

用蒙特卡羅方法產(chǎn)生15個項目(稱為第三組項目)的參數(shù)a、b、c,并用原先已經(jīng)產(chǎn)生的第一組被試的θ值對它們起反應(yīng),產(chǎn)生反應(yīng)矩陣(稱為“第三矩陣”)。然后,將“第三矩陣”中的每一列作為模式的輸入,相應(yīng)的15個項目的參數(shù)a、b或c作為輸出,組成測試模式。用經(jīng)過訓(xùn)練的第二組神經(jīng)網(wǎng)絡(luò)對其進行測試,也就是由神經(jīng)網(wǎng)絡(luò)對第三組項目進行參數(shù)估計,然后將估計值和真實值進行比較,記錄下測試誤差,如表1的2、3、4列所示。和對θ估計的測試誤差一樣,它是所有測試模式的誤差之和。這里共有15個測試模式(即上述的第三組項目)。因此要把表1中的的2、3、4列數(shù)字除以15,再求平均數(shù)M和標準差SD,得到結(jié)果在表2中。

表2 單個模式測試誤差的平均數(shù)和標準差

統(tǒng)計項

θ

a

b

c

M

0.0027

0.1379

0.1586

0.0045

SD

0.0009

0.0174

0.0227

0.0015

4.4 減少項目參數(shù)的測試誤差的實驗

從表2的數(shù)據(jù)可以看出,上述方法對于θ的估計已經(jīng)達到了較好的精度,但對于a、b和c的估計誤差仍然比較大。于是再用增加訓(xùn)練模式的方法來試圖減少測試誤差。上述在訓(xùn)練第二組神經(jīng)網(wǎng)絡(luò)時,是用“第一矩陣”中的每一列作為模式的輸入,該矩陣共有45列,相應(yīng)于第一組的45個項目?,F(xiàn)在將這組項目擴大,即增加到60個,75個,90個和105個,這些項目的參數(shù)都是用蒙特卡羅方法產(chǎn)生的。然后,拿第一組25個被試的θ值和它們起反應(yīng),用產(chǎn)生的反應(yīng)矩陣和相應(yīng)的項目參數(shù)作為訓(xùn)練模式,對30個神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,并重復(fù)上述步驟4和步驟5,得到在各種不同數(shù)量的訓(xùn)練模式條件下的a、b和c的單個模式測試誤差的平均數(shù)M和標準差SD,如表3所示。從表中數(shù)據(jù)可以看出,隨著訓(xùn)練項目數(shù)的增加,對項目參數(shù)a、b和c的測試誤差都有明顯降低,當項目數(shù)達到105時,基本上已經(jīng)可以接受參數(shù)估計的結(jié)果了。

附圖

從上面的討論可以看出,在該計算機模擬實驗中,共有兩組被試,第一組被試是用于能力測試模式的,第二組被試是用于能力訓(xùn)練模式的;該實驗中有三組項目,其中的第二組項目是第一組的一部分,第一組項目用于項目參數(shù)訓(xùn)練和能力測試模式的,第三組項目是用于項目參數(shù)測試模式的,第二組項目是用于能力訓(xùn)練模式的;該實驗中有三個反應(yīng)矩陣,其中的第一矩陣又被分為左、右兩個部分,左部分是由被抽取出來的第二組項目產(chǎn)生的,右部分是由其余項目產(chǎn)生的,第二矩陣的“行”作為能力訓(xùn)練模式,第一矩陣的“行”作為能力測試模式,第一矩陣的“列”作為項目參數(shù)訓(xùn)練模式,第三矩陣的“列”作為項目參數(shù)測試模式。

4.5 實際測驗中的被試能力和項目參數(shù)估計步驟小結(jié)

上述的實驗是在計算機模擬的情況下了產(chǎn)生的各組被試能力和項目參數(shù),在實際的測驗情況中,可以按照以下步驟來進行測驗編制以及被試能力和項目參數(shù)估計:

(1)在已知項目參數(shù)的題庫中取出若干個項目(類似于上述模擬實驗中的第二組項目,這些項目可以是二值記分的,它可以事先通過BILOG等估計得到),再加上自行編制的、未知參數(shù)的若干項目(類似于上述模擬實驗中第三組項目),混合后組成實際的測驗試卷。

(2)用這一試卷對一組真實的被試(類似于上述模擬實驗中的第一組被試)進行測試,得到一組實際的結(jié)果。

(3)用蒙特卡羅方法產(chǎn)生一組被試的能力值(類似于上述模擬實驗中的第二組被試),令它和真實試卷中的已知項目參數(shù)的那部分項目(類似于上述模擬實驗中的第二組項目)起反應(yīng),得到反應(yīng)矩陣(類似于上述模擬實驗中的第二矩陣)。

(4)用這一矩陣和這組蒙特卡羅方法產(chǎn)生的被試能力值組成能力訓(xùn)練模式,對一組神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練。

(5)用真實的測驗結(jié)果矩陣的每一行作為一個模式的輸入部分,輸入上述經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò),其輸出就是真實被試的能力估計值。

(6)運用蒙特卡羅方法產(chǎn)生一組項目參數(shù),根據(jù)上述的模擬實驗,大約要有100個項目的參數(shù),令真實被試的能力估計值和它們起反應(yīng),得到一個反應(yīng)矩陣(類似于上述模擬實驗中的第一矩陣右部分)。用這個矩陣中的每一列和相應(yīng)的蒙特卡羅方法產(chǎn)生的項目參數(shù)組成訓(xùn)練模式,對另一組神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,使之具有估計項目參數(shù)的功能。

(7)將這一經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)對真實測驗中未知參數(shù)的那部分項目(類似于上述模擬實驗中的第三組項目)進行參數(shù)估計,從而得到這些項目的參數(shù)估計值。

至此,就把實際的被試能力和項目參數(shù)估計出來了。對照上述模擬實驗的圖1,其中的第一矩陣左部分和第三矩陣是由真實測驗的數(shù)據(jù)產(chǎn)生的,第一矩陣的右部分和第二矩陣是用蒙特卡羅方法產(chǎn)生的。

5 討論

5.1 該方法的優(yōu)點

(1)提出了一種全新的IRT項目參數(shù)和被試能力的估計方法,以往的方法都是建立在統(tǒng)計基礎(chǔ)上的,而該方法則是建立在聯(lián)結(jié)主義理論(人工神經(jīng)網(wǎng)絡(luò))基礎(chǔ)上的。

(2)以往的方法多數(shù)只能對二值記分的IRT模型進行參數(shù)估計,本研究中的方法則可以對連續(xù)記分的IRT模型進行參數(shù)估計。由于人工神經(jīng)網(wǎng)絡(luò)有很強的學(xué)習(xí)功能,因此從理論上講,它也可以用于等級記分和二值記分的IRT模型,當然,這有待于進一步的實驗研究。

(3)本研究中用于估計被試能力的樣本只有25人,用于估計項目參數(shù)的樣本只有15個項目,都屬于比較小的樣本,這說明該方法可以用于小樣本的情況,這是以往方法所不能解決的。雖然在對神經(jīng)網(wǎng)絡(luò)訓(xùn)練時可能要用到較多的訓(xùn)練模式,但這些模式是可以用蒙特卡羅方法產(chǎn)生的,并不要擴大實際的測驗樣本。

(4)在使用一般的統(tǒng)計方法處理小樣本的數(shù)據(jù)時,確實存在著參數(shù)估計的可靠性問題,但是本實驗的研究表明,在運用與統(tǒng)計方法完全不同的聯(lián)結(jié)主義(人工神經(jīng)網(wǎng)絡(luò))方法處理數(shù)據(jù)時,就有可能克服這一困難。這是什么原因呢?在對人工神經(jīng)網(wǎng)絡(luò)理論進行深入探討以后[15~17],可以發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)在對IRT參數(shù)進行估計時,并不是一開始就直接根據(jù)原始數(shù)據(jù)來估計參數(shù),而是先對一組神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,使它們首先具備了這方面的知識,然后再用訓(xùn)練過的神經(jīng)網(wǎng)絡(luò)對IRT參數(shù)進行估計,這種參數(shù)估計的可靠性如何,并不取決于被估計的樣本的大小,而是取決于對這些神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練的樣本的數(shù)量、質(zhì)量以及神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)和算法。在這其中,訓(xùn)練模式是研究者運用蒙特卡羅方法產(chǎn)生的,它本身并不是一個小樣本,而是一個比較大的樣本;產(chǎn)生這些數(shù)據(jù)的模型就是IRT模型本身,因此數(shù)據(jù)本身的質(zhì)量是有保證的。關(guān)于神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu),在大多數(shù)情況下是要通過預(yù)測和調(diào)整學(xué)習(xí)率等參數(shù)來確定隱含層的數(shù)量和其中每一層的神經(jīng)元的數(shù)量,但由于本研究采用的是級聯(lián)相關(guān)模型,它可以根據(jù)反傳誤差的大小自動地調(diào)整網(wǎng)絡(luò)的拓撲結(jié)構(gòu)和聯(lián)結(jié)權(quán)重,因此可以自動地建立優(yōu)化的網(wǎng)絡(luò)結(jié)構(gòu),不再需要考慮學(xué)習(xí)率等問題;另外在人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,本研究的程序設(shè)計也使得只有誤差達到預(yù)定的很小的數(shù)值時,訓(xùn)練過程才停止,這就保證了被訓(xùn)練過的神經(jīng)網(wǎng)絡(luò)是較高質(zhì)量的。由此可見,聯(lián)結(jié)主義(人工神經(jīng)網(wǎng)絡(luò))模型是采用了和一般統(tǒng)計技術(shù)完全不同的思路和方法,它對IRT參數(shù)估計的可靠性主要不是取決于被估計樣本的大小,而是依賴于經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)的質(zhì)量,因此我們只要采取一定的措施將神經(jīng)網(wǎng)絡(luò)訓(xùn)練好,就有可能對小樣本的IRT數(shù)據(jù)進行可靠的參數(shù)估計。

5.2 需要進一步研究的問題

(1)首先是在編制測驗時,需要一部分已知項目參數(shù)的二值記分題目,這對于已經(jīng)建立題庫的學(xué)科來說是可以做到的,但對于尚未建立題庫的學(xué)科,就無法運用這一方法。雖然可以用BILOG等軟件對有關(guān)的二值記分項目進行參數(shù)估計,但如果沒有BILOG等軟件又該怎么辦呢?要解決這個問題,需要構(gòu)造更加復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,筆者目前正在構(gòu)造“基于知識的級連相關(guān)模型”,并試圖用它解決這一困難,實驗結(jié)果將另文闡述。

(2)該方法要求實際的測驗中有一部分作為錨題的項目是已知參數(shù)的,那么這一部分錨題至少應(yīng)該是多少項目呢?它們占整個測驗的比例至少要達到多少呢?本實驗表明若錨題數(shù)量為15,它們在整個測驗中所占比例為三分之一,就可獲得良好結(jié)果,那么少于15個項目行不行?低于三分之一的比例行不行?筆者也正在作進一步的實驗。

(3)本研究中用蒙特卡羅方法產(chǎn)生虛擬的被試能力和項目參數(shù),那么它們的分布應(yīng)該是什么形式為最好?人工神經(jīng)網(wǎng)絡(luò)的理論認為是均勻分布為最好,因此在本研究中采用了均勻分布。但是在對實際數(shù)據(jù)的分析中,有些數(shù)據(jù)是由真實的被試和項目產(chǎn)生的,不可能保證他(它)們呈完全的均勻分布,那么這種偏離均勻分布的情況對于估計值的誤差有多大影響?另外,是否可以減少虛擬數(shù)據(jù)數(shù)量甚至取消虛擬數(shù)據(jù),而完全采用真實的數(shù)據(jù)?也需要進一步探討。

雖然有待于進一步研究的問題還很多,但這一實驗畢竟提出了一種新的、有一定應(yīng)用價值的方法。

【參考文獻】

[1] Hambleton R K.Item Response Theory:Principles and Appli-cations.Boston:Kluwer-Nijhoff Pub,1985.58~63

[2] Yu J Y.Item Response Theory and Its Application(in Chin-ese).Nanjing:Jiangsu Education Press,1992.79~84

(余嘉元.項目反應(yīng)理論及其應(yīng)用.南京:江蘇教育出版社,1992.79~84)

[3] Baker F B.Item Response Theory:Parameter Estimation Tec-hniques.New York:M.Dekker,1992.66~71

[4] McLead P.Introduction to Connectionist Modeling of Cogn-itive Processes.New York:Oxford University Press,1998.256~261

[5] Mahwah N J,Erlbaum L L.Localist Connectionist Approaches to Human

Cognition.New

York:Oxford University Press,1998,188~192

[6] Anderson,J.A.An Introduction to Neural Networks.Cambrid-ge:The MIT Press,1995,136~143.

[7] Yu J Y.Studying perceptual boundary effects with connec-tionist model(in Chinese).Acta Psychologica Sinica,2001,33(2):123~126

(余嘉元.運用聯(lián)結(jié)主義模型研究知覺邊界效應(yīng)問題,心理學(xué)報,2001,33(2):123~126)

[8] Haykin S S.Neural Networks:A Comprehensive Foundation.Upper Saddle

River,N.N.,Press Hall,1999.178~181

[9] Fahlman S E,Lebiere C.The Cascade-correlation learning architecture.In:Touretzky D S ed.Advances in Neural Informati-on Processing Systems.Los Altos,CA:Morgan Kaufmann,1990.524~532

[10] Samejima F.Homogeneous case of the continuous response

model.Psychometrika,1973,38(3):203~219

[11] Muller H.A Rasch model for continuous ratings.Psychmet-rika,1987,52(2):165~181

[12] Mellenbergh G J.A unidimensional latent trait model forcontinuous item responses.

Multivariate Behavioral Research,1994,29(3):223~236

[13] Qi S Q,Dai H Q.Ding S L.Modern Educational and Psychol-ogical Measurement(in Chinese).Nanchang:Jiangxi Education Pre-ss,1998.126~129

(漆書青,戴海崎,丁樹良.現(xiàn)代教育與心理測量學(xué),南昌:江西教育出版社,1998.126~129)

[14] Mislevy R J,Bock R D.Manual of BILOG 3.Scientific Soft-ware,Inc.1990.27~31

[15] Wang W.Artificial Neural Network Theory:Introduction a-nd Application(in Chinese).Beijing:Beijing Aviation and Space University Press,1995.36~41

(王偉.人工神經(jīng)網(wǎng)絡(luò)原理——入門與應(yīng)用.北京:北京航空航天大學(xué)出版社,1995.26~41)

[16] Zhao L M,Hu H Y,Wei D H.Multilevel Forward Artificial Neural Network(in Chinese).Beijing:Huanghe Water Conservancy Press,1999.52~56

(趙林明,胡浩云,魏德華等.多層前向人工神經(jīng)網(wǎng)絡(luò),北京:黃河水利出版社,1999.52~56)

篇3

關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò); 模糊矩陣; 教學(xué)評價

中圖分類號:TP183 文獻標識碼:A文章編號:2095-2163(2013)06-0060-03

0引言

教師教學(xué)效果的審核評定是高校教學(xué)中的重要工作。傳統(tǒng)的考核方法或者只是由學(xué)生填寫調(diào)查表,給教師劃分等級,進行定性描述,或者是由督導(dǎo)組根據(jù)幾堂課的聽評給教師的課堂教學(xué)打出一個分值。無論是哪種方法都不能全面客觀地對教學(xué)工作做出科學(xué)評定。而且傳統(tǒng)的考核方法受主觀因素影響較大,學(xué)生在對教師的評判中常會加入多種因素,各種因素之間的影響也各不相同,僅以學(xué)生或僅憑督導(dǎo)團的評定來實施評判顯然已不盡合理。因此, 建立一種能盡量排除各種主觀因素的干擾,同時又具有完善且穩(wěn)定的評價體系的評定方法則成為必要和重要的研究課題。

本文構(gòu)建一種教學(xué)效果評價體系,即對教師的評價從“教學(xué)態(tài)度”、“教學(xué)內(nèi)容”、“教授方法”、“課堂效果”四大方面分項進行,無論是學(xué)生還是督導(dǎo)組均可據(jù)此評價體系給出相應(yīng)評分。本文提出使用BP反向傳播神經(jīng)網(wǎng)絡(luò)來構(gòu)建一個穩(wěn)定的評分系統(tǒng),各項評分指標為網(wǎng)絡(luò)輸入,使用已訓(xùn)練完成的BP神經(jīng)網(wǎng)絡(luò)來模擬一個專家的打分經(jīng)驗,由此輸出一個終值。BP神經(jīng)網(wǎng)絡(luò)通常是指基于誤差反向傳播算法的多層前向神經(jīng)網(wǎng)絡(luò),由于BP網(wǎng)絡(luò)的神經(jīng)元采用的傳遞函數(shù)是Sigmoid型可微函數(shù),因而可以實現(xiàn)輸入和輸出間的任意非線性映射[1]。由于BP神經(jīng)網(wǎng)絡(luò)本身就是一種高度復(fù)雜的非線性動力系統(tǒng)的辨識模型,并且BP神經(jīng)網(wǎng)絡(luò)具有逼近任意非線性函數(shù)的能力[2],因此使用BP神經(jīng)網(wǎng)絡(luò)進行評價將使結(jié)果更具客觀性,以此來模擬一個穩(wěn)定的評分系統(tǒng)亦將具備了現(xiàn)實實現(xiàn)基礎(chǔ)。在本文提出的系統(tǒng)中,系統(tǒng)將評價體系中各組評分的分值作為反向傳播神經(jīng)網(wǎng)絡(luò)的輸入,使用BP網(wǎng)絡(luò)運算后得出一個綜合性的評分,即整個過程好似系統(tǒng)模擬一個經(jīng)驗頗豐的專家進行打分。其后,本文又通過數(shù)據(jù)測試驗證了模型的評價結(jié)果與實際相符。

1BP神經(jīng)網(wǎng)絡(luò)模型

BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是基于誤差反向傳播的多層前向神經(jīng)網(wǎng)絡(luò),即權(quán)值和閾值的調(diào)節(jié)規(guī)則采用了誤差反向傳播算法,這是一個有導(dǎo)師的神經(jīng)元網(wǎng)絡(luò)學(xué)習(xí)算法[2]。BP網(wǎng)絡(luò)能學(xué)習(xí)和存儲大量的輸入輸出模式映射關(guān)系,而無需事前揭示描述這種映射關(guān)系的數(shù)學(xué)方程。該網(wǎng)絡(luò)的學(xué)習(xí)規(guī)則是使用最速下降法,通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。BP神經(jīng)網(wǎng)絡(luò)模型拓撲結(jié)構(gòu)包括輸入層(input)、隱層(hide layer)和輸出層(output layer)。其中的隱層可擴展為多層。只要在隱層中有足夠數(shù)量的神經(jīng)元,就可使用這種網(wǎng)絡(luò)來逼近任何一個函數(shù)[3]。一個典型的BP網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

2評價模型的構(gòu)建

本文構(gòu)建了一套評價體系,使用一套客觀標準進行量化表達,且該體系適用于大多數(shù)學(xué)校的教學(xué)評價。評價項目中,各項指標的取值范圍為[0,10]。多位專家將根據(jù)評價體系方案為每一位參評教師填表打分,經(jīng)過匯總后,每一個教師的教學(xué)情況評分將和一個評價矩陣A對應(yīng)。列向量x為各個項目指標,行向量e為各位專家評出的各項指標分值。對列向量進行均值計算,則得到各個教師的教學(xué)效果指標向量S。所得教學(xué)效果指標向量S即是神經(jīng)網(wǎng)絡(luò)的輸入。評價體系方案設(shè)計如表1所示。

表1教師教學(xué)評價體系

Tab.1 The system of teaching evaluation類別項目教學(xué)態(tài)度嚴謹負責(zé)x0; 思想教育x1;教學(xué)內(nèi)容教學(xué)目標x2; 準確度x3; 熟練程度x4; 信息量x5;教授方法啟發(fā)思維x6; 講授思路x7;重點難點x8;聯(lián)系實際x9;教學(xué)儀態(tài)x11;語言表述x12;媒體使用x14課堂效果課堂紀律x15;學(xué)生思維x16 圖2則為一個由6名專家給出的某位教師教學(xué)效果的評分矩陣。

3BP網(wǎng)絡(luò)模型的設(shè)計與實現(xiàn)

使用BP神經(jīng)網(wǎng)絡(luò)可以構(gòu)建穩(wěn)定的評分系統(tǒng)。人為打分時由于主觀因素的影響,分值出入較大,往往不能準確地反映實際情況,為了避免對同一教師的教學(xué)評價出現(xiàn)較大反差,構(gòu)建一個穩(wěn)定的BP神經(jīng)網(wǎng)絡(luò)系統(tǒng)即已成為實踐發(fā)展過程中的一個必然要求。在系統(tǒng)實現(xiàn)過程中,一位專家首先根據(jù)本文提出的評分系統(tǒng)給出各項成績,并將此成績作為神經(jīng)網(wǎng)絡(luò)的輸入值。其后,這位專家再給出一個綜合評分,作為神經(jīng)網(wǎng)絡(luò)的樣本,即輸出值,以此即可對BP網(wǎng)絡(luò)進行訓(xùn)練。訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)就可以模擬該專家的打分經(jīng)驗,由此構(gòu)建形成一個穩(wěn)定的評分系統(tǒng)。

根據(jù)BP神經(jīng)網(wǎng)絡(luò)模型的定理(Kolmogrov 定理):給定任一連續(xù)函數(shù)f:[0,1]nRn,f可以用一個三層前向神經(jīng)網(wǎng)絡(luò)來模擬實現(xiàn)。第一層,即輸入層,有n個神經(jīng)元;中間層,神經(jīng)元個數(shù)可由經(jīng)驗公式實驗得出;第三層,輸出層有m個神經(jīng)元。因此一個三層結(jié)構(gòu)的、設(shè)有Sigmoid神經(jīng)元,并具有足夠隱節(jié)點的BP神經(jīng)網(wǎng)絡(luò)則可以逼近任何一個連續(xù)函數(shù)。本系統(tǒng)采用有三層結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)如圖1所示。由于評價體系中有17個指標,因此網(wǎng)絡(luò)的輸入層有17個輸入。系統(tǒng)的輸出層則確定為1個節(jié)點。隱層神經(jīng)元個數(shù)將根據(jù)實驗結(jié)果而確定為11個。隱層傳遞函數(shù)可使用“l(fā)ognsig”對數(shù)傳遞函數(shù)實現(xiàn),輸出層傳遞函數(shù)使用“pureline”純線性傳遞函數(shù)實現(xiàn)。訓(xùn)練函數(shù)則使用“traingdm”動量梯度下降反向傳播法對網(wǎng)絡(luò)進行訓(xùn)練,另外,網(wǎng)絡(luò)性能函數(shù)使用了默認的“mse”均方誤差函數(shù)。MATLAB中的主要代碼如下:

設(shè)有10位教師需要評分,因而使用10組分數(shù)即17×10的矩陣作為10個教師的教學(xué)效果矩陣。教學(xué)效果矩陣即是神經(jīng)網(wǎng)絡(luò)的輸入矩陣,亦是訓(xùn)練樣本,矩陣的行向量為各項評價指標,10個樣本,即10位教師的最終評價結(jié)果則作為目標樣本來訓(xùn)練神經(jīng)網(wǎng)絡(luò),獲取1×10矩陣為目標矩陣,即10位教師的最終得分。實驗中運用Matlab編程建立三層BP神經(jīng)網(wǎng)絡(luò),目標訓(xùn)練誤差為0.1,最大訓(xùn)練次數(shù)為 3 000次。訓(xùn)練誤差隨訓(xùn)練次數(shù)的變化情況如圖3所示,神經(jīng)網(wǎng)絡(luò)經(jīng)過909步迭代達到精度要求。對應(yīng)輸出與目標的誤差如圖4所示。

訓(xùn)練樣本的輸出與專家打分結(jié)果比較如表2所示。

由表2可以看出,訓(xùn)練后的網(wǎng)絡(luò)輸出值與專家給出的終值之間的差異均在可接受的指標范圍內(nèi),因此采用BP神經(jīng)網(wǎng)絡(luò)可以構(gòu)建穩(wěn)定的評分系統(tǒng)。

4結(jié)束語

在對教師教學(xué)效果的評價中存在著多種因素,本文構(gòu)建了一套較為合理的評價體系,并且提出使用BP神經(jīng)網(wǎng)絡(luò)對專家評分進行模擬,利用神經(jīng)網(wǎng)絡(luò)可避免打分過程中出現(xiàn)的寬嚴不定的情況。實驗證明,BP神經(jīng)網(wǎng)絡(luò)可以構(gòu)建穩(wěn)定的評分系統(tǒng),并取得了良好的實驗效果。

參考文獻:

[1]許東. 吳錚. 基于Matlab 的系統(tǒng)分析與設(shè)計—神經(jīng)網(wǎng)絡(luò)[M]. 西安:西安電子科技大學(xué)出版社,2003:18-19.

[2]胡守仁. 神經(jīng)網(wǎng)絡(luò)導(dǎo)論[M] . 長沙:國防科技大學(xué)出版社,1993 :113 - 120.

[3]Martin T. Hagan, Howard B.demuth. 神經(jīng)網(wǎng)絡(luò)設(shè)計[M]. 北京:機械工業(yè)出版社 ,2002:227-255.

[4]郭齊勝. 系統(tǒng)建模原理方法[M]. 長沙:國防科技大學(xué)出版社,2003:172-173.

[5]袁劍. BP神經(jīng)網(wǎng)絡(luò)在學(xué)生綜合考評中的應(yīng)用[J]. 福建電腦,2010(6).

篇4

[關(guān)鍵詞]動態(tài)系統(tǒng)建模 仿真 人工神經(jīng)網(wǎng)絡(luò)

在講授完線性與非線性動態(tài)系統(tǒng)建模方法基本理論以后,需要讓學(xué)生進行上機實驗[1]以達到以下目的:1進一步加深理解學(xué)習(xí)的基本理論;2各種參數(shù)的選擇對建模效果的影響;3各種建模方法的優(yōu)缺點及適用場合。為了達到這些目的,我們模擬實際應(yīng)用時的情況,提供給學(xué)生模擬的輸入輸出數(shù)據(jù),以便學(xué)生利用這些數(shù)據(jù),進行編程建立模型。同時我們編程實現(xiàn)基于最小二乘法、最大似然估計、BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)的動態(tài)系統(tǒng)建模方法[2,3],學(xué)生可以利用這些Matlab程序進行各種方法的學(xué)習(xí)、各種情況下建模效果的對比,以及各種方法的適用場合的對比。

一、 基于Matlab仿真的線性動態(tài)系統(tǒng)最小二乘法建模的教學(xué)

假設(shè)系統(tǒng)的差分方程為:y(k)=-a1y(k-1)-a2y(k-2)-…-any(k-n)+b0u(k)+b1u(k-1)+…+bmu(k-m)+e(k)。其中y(k)為輸出,u(k)為輸入,e(k)為模型殘差。假定建模用的數(shù)據(jù)序列從y(k)開始,則構(gòu)建以下數(shù)據(jù)矩陣及數(shù)據(jù)向量:

如果模型殘差為白噪聲(實際情況多為有色噪聲,但當噪聲強度不大時,可近似當作白噪聲處理),則根據(jù)最小二乘法,由這 組數(shù)據(jù)估計得到的參數(shù) 。

以上的最小二乘法需要輸入(u(K-m),u(K-1),…,u(K+N-1))和輸出(y(K-n),y(K-n+1),…,y(K+N-1))數(shù)據(jù),我們可用以下的Matlab程序(程序1)產(chǎn)生模擬的輸入輸出數(shù)據(jù)(程序中采用了一個簡單的二階離散系統(tǒng),學(xué)生實驗時可換成需要的模型),并形成數(shù)據(jù)矩陣及數(shù)據(jù)向量。

程序1:

clear all

K=3;%殘差序列開始序號

N=1000;%共N組數(shù)據(jù)

n=2;%對應(yīng)

m=2;%對應(yīng)

u=randn(1,K+N-1)*0.1;%隨機產(chǎn)生輸入數(shù)據(jù)

for i=1:1:n

y(i)=0;%設(shè)定初始狀態(tài)

end

for k=n+1:1:K+N-1

y(k)=0.2*y(k-1)+0.5*y(k-2)+u(k)+0.3*u(k-1);%根據(jù)輸入計算輸出

end

y=y+randn(1,K+N-1)*0.001; %在求得的單位階躍響應(yīng)上疊加噪聲用以模擬測量誤差

X=zeros(N,n+m+1);

for i=K:1:K+N-1

for j=1:1:n

X(i-K+1,j)=y(i-j);%構(gòu)成矩陣X

end

for j=n+1:1:n+m+1

X(i-K+1,j)=u(i-j+n+1); %構(gòu)成矩陣X

end

end

for i=K:1:K+N-1

Y(i-K+1)=y(i);%構(gòu)成向量Y

end

save X X;

save Y Y;

save N N;

運行程序1將生產(chǎn)數(shù)據(jù)矩陣X(保存在X.mat中)及數(shù)據(jù)向量Y(保存在Y.mat中)。以下是根據(jù)最小二乘法估計參數(shù)的程序(程序2)。

程序2:

clear all

load X;

load Y;

XT=X';

sita=(XT*X)^(-1)*XT*Y'%計算得到估計的參數(shù)sita

運行程序2,將得到估計的參數(shù)sita。如某一次運行中sita=[0.2004,0.4998,0.9998,0.2995,-0.0005]T,與模型中的值(見程序1)a1=0.2,a2=0.5,b0=1,b1=0.3,b2=0非常接近。

二、 基于Matlab仿真的線性動態(tài)系統(tǒng)最大似然估計建模的教學(xué)

在模型殘差為白噪聲的假設(shè)下,最大似然估計和最小二乘法在估計參數(shù)時是相同的,但最大似然估計還能估計出噪聲的強度,程序3為相應(yīng)的程序。

程序3:

clear all

load X;

load Y;

load N;

XT=X';

sita=(XT*X)^(-1)*XT*Y'

Z=Y'-X*sita;

StdV=sqrt(Z'*Z/N)%估計標準差

運行程序3,得到和程序2一樣的參數(shù)估計值,除此之外,還能得到噪聲的標準差(或方差)。如某一次的運行結(jié)果為StdV=0.0011,和模型中值(見程序1)0.001非常接近。

三、 基于Matlab仿真的非線性動態(tài)系統(tǒng)BP神經(jīng)網(wǎng)絡(luò)建模的教學(xué)

基于神經(jīng)網(wǎng)絡(luò)的非線性動態(tài)系統(tǒng)建模的輸入輸出的樣本數(shù)據(jù)組織如圖1所示。

圖1:基于神經(jīng)網(wǎng)絡(luò)的動態(tài)系統(tǒng)建模的樣本數(shù)據(jù)的組織

如圖1所示,當輸入為y(K-1),y(K-2),…,y(K-n),u(K),u(K-1),…,u(K-m)時,期望輸出為y(K),因此BP神經(jīng)網(wǎng)絡(luò)的輸入輸出數(shù)據(jù)樣本對為(x,y),其中x,y分別為上述最小二乘法中的數(shù)據(jù)矩陣及數(shù)據(jù)向量,將程序1中的動態(tài)系統(tǒng)以非線性動態(tài)系統(tǒng)代替(如將y(k)=0.2*y(k-1)+0.5*y(k-2)+u(k)+0.3*u(k-1)

改為y(k)=0.2*y(k-1)+0.5*y(k-2)+2*u(k)*u(k)+0.3*u(k-1)),采用程序1產(chǎn)生非線性動態(tài)系統(tǒng)的數(shù)據(jù),然后設(shè)計如下的基于BP神經(jīng)網(wǎng)絡(luò)的非線性動態(tài)系統(tǒng)建模程序(程序4)。

程序4:

clear all

load X;

load Y;

net = newff(X',Y,10);

net.trainParam.epochs = 100;

net.trainParam.goal = 0.000001;

net = train(net,X',Y);

Y1 = sim(net,X');

plot(Y,'s-');

hold on

plot(Y1,'*-');

save net net;

從程序4運行后的產(chǎn)生的圖形中可以看出BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練的效果。

四、 基于RBF神經(jīng)網(wǎng)絡(luò)的非線性動態(tài)系統(tǒng)建模教學(xué)

基于RBF神經(jīng)網(wǎng)絡(luò)的非線性動態(tài)系統(tǒng)建模的樣本數(shù)據(jù)的組織和BP神經(jīng)網(wǎng)絡(luò)相同,因此可以使用BP神經(jīng)網(wǎng)絡(luò)建模時所用的樣本數(shù)據(jù)進行建模實驗,以便對比兩種網(wǎng)絡(luò)的建模效果。以下(程序5)是RBF神經(jīng)網(wǎng)絡(luò)建模的樣例程序。

程序5:

clear all

load X;

load Y;

net=newrb(X',Y,0.000001);

Y1=sim(net,X');

plot(Y,'s-');

hold on

plot(Y1,'*-');

save net net;

從程序5運行后的產(chǎn)生的圖形中可以看出RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練的效果。

五、 結(jié)論

本文設(shè)計了matlab程序,模擬產(chǎn)生較逼真的輸入輸出數(shù)據(jù)樣本數(shù)據(jù)供學(xué)生使用,學(xué)生可以利用這些數(shù)據(jù)進行線性與非線性動態(tài)系統(tǒng)建模實驗。同時也提供了面向動態(tài)系統(tǒng)建模的最小二乘法、最大似然估計、BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)樣例程序供學(xué)生學(xué)習(xí)使用。學(xué)生可以利用這些Matlab程序進行各種方法的學(xué)習(xí)、各種情況下建模效果的對比,以及各種方法的適用場合的對比。學(xué)生也可以參照這些程序編制更加復(fù)雜的程序以解決實際的系統(tǒng)建模問題。

基金資助:本文系東華大學(xué)信息學(xué)院教改項目的研究成果。

[參考文獻]

[1]劉娣許有熊林健,基于MATLAB的“系統(tǒng)辨識”課程實驗教學(xué)改革[J].中國電力教育,2013(1):139-140.

[2]王秀峰,盧桂章.系統(tǒng)建模與辨識[M].北京:電子工業(yè)出版社,2004.

篇5

關(guān)鍵詞:燃氣發(fā)電;風(fēng)險評價;模糊神經(jīng)網(wǎng)絡(luò);節(jié)能減排

引言

隨著環(huán)境污染日益嚴重、能源供給壓力不斷增大等問題的凸顯,轉(zhuǎn)變經(jīng)濟增長方式,走低碳化發(fā)展道路,已經(jīng)成為世界各國的普遍共識。燃氣發(fā)電廠由于使用天然氣等清潔能源,各項排放指標優(yōu)于燃煤電廠[1,2],使得燃氣發(fā)電不僅可以有效減少碳排放,而且可以緩解煤炭等傳統(tǒng)能源的供需壓力。

隨著燃氣發(fā)電越來越受到重視,很多學(xué)者對燃氣發(fā)電進行了實證分析和研究。如文獻[1]分析了我國燃氣發(fā)電現(xiàn)狀及規(guī)劃,并對行業(yè)前景從天然氣開采、發(fā)電量等方面進行預(yù)測;文獻[3]在隨機生產(chǎn)模擬的基礎(chǔ)上,對天然氣發(fā)電效益進行分析;文獻[4-5]從風(fēng)險評價方面對天然氣市場或發(fā)電方面進行研究。本文在已有研究的基礎(chǔ)上,從燃氣發(fā)電現(xiàn)狀入手,建立我國燃氣發(fā)電行業(yè)的風(fēng)險評價指標體系,結(jié)合模糊神經(jīng)網(wǎng)絡(luò)方法,對我國燃氣發(fā)電進行風(fēng)險評價。

1 燃氣發(fā)電風(fēng)險評價指標體系

基于風(fēng)險評價指標體系的構(gòu)建原則,本文將我國燃氣發(fā)電的風(fēng)險分為以下五類并進行評價。

(1)資源風(fēng)險:對于燃氣電廠來說,資源的可采儲量、采選方式可能與計劃結(jié)果存在偏差,導(dǎo)致燃氣發(fā)電成本增加或發(fā)電量乃至電網(wǎng)收到影響。(2)生產(chǎn)風(fēng)險:燃氣電廠對天然氣供應(yīng)的要求很高,而其在與天然氣供應(yīng)商簽訂“照付不議”合同、與電網(wǎng)公司的協(xié)調(diào)方面,都存在一定程度的不確定性,并會對發(fā)電產(chǎn)生影響。(3)技術(shù)風(fēng)險:隨著燃氣發(fā)電的應(yīng)用擴大化和機組大型化趨勢日益明顯,技術(shù)和工作原理也更加復(fù)雜,因此存在一定的技術(shù)風(fēng)險。(4)市場風(fēng)險:燃氣發(fā)電的市場風(fēng)險主要包括市場競爭、市場供求和發(fā)電效益三個方面[6,7]。(5)環(huán)境風(fēng)險:國內(nèi)外天然氣、電力市場的變動以及國際經(jīng)濟形勢也會對燃氣發(fā)電的發(fā)展起重要作用,因此存在一定的環(huán)境風(fēng)險。

根據(jù)上述對燃氣發(fā)電風(fēng)險的分析,構(gòu)建我國燃氣發(fā)電風(fēng)險評價指標體系,如表1所示。

2 模糊神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建

2.1 模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

模糊神經(jīng)網(wǎng)絡(luò)將模糊理論和神經(jīng)網(wǎng)絡(luò)理論結(jié)合起來,本文構(gòu)建的模糊神經(jīng)網(wǎng)絡(luò)模型采用模糊系統(tǒng)和神經(jīng)網(wǎng)絡(luò)串聯(lián)連接方式,即輸入經(jīng)過隸屬函數(shù)轉(zhuǎn)化為模糊量后,再進入神經(jīng)網(wǎng)絡(luò)系統(tǒng)進行處理[8-10]。模型結(jié)構(gòu)的第1層為輸入層,第2層為模糊化層,第3層為模糊推理層,第4層為輸出層。本文模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

2.2 模糊化處理步驟

根據(jù)已建立的燃氣發(fā)電風(fēng)險評價指標體系,采用模糊綜合評價法對燃氣發(fā)電風(fēng)險因素的指標量化處理,使得模糊處理系統(tǒng)的輸出作為神經(jīng)網(wǎng)絡(luò)系統(tǒng)的輸入,具體步驟如下。

(1)確定因素集。根據(jù)風(fēng)險指標體系構(gòu)造因素集X={x1,x2,…,xk}和每個二級指標的因素集Xi={Xi1,Xi2,...Xin},i=1,2,…k。

(2)確定評語集。對于因素Xi來說,專家對各風(fēng)險因素逐個給出風(fēng)險程度評語,將各指標的評語分為m個等級,評語集為Y={y1,y2,…ym}。

(3)做單因素評價,得評價矩陣R。構(gòu)造模糊映射f,XF(Y),F(xiàn)(Y)是Y上的模糊集,映射f為風(fēng)險因素xi對評語集Y的隸屬向量Ri={ri1,ri2,…rim},i=1,2…n。由此得到評價矩陣R=(rij)n×m∈F(X×F)。

(4)做綜合評價。對評語集中每個評價指標賦予權(quán)重A=(a1,a2,…,an), ai=1,ai?叟0由模糊運算得到一級評價結(jié)果B=A?R,并以類似方法求出二級評價結(jié)果C=(c1,c2,…,cn),該向量作為神經(jīng)網(wǎng)絡(luò)的輸入。

2.3 神經(jīng)網(wǎng)絡(luò)模型

設(shè)輸入層節(jié)點數(shù)為m,隱含層節(jié)點數(shù)為e,輸出層節(jié)點數(shù)為n,其中隱含層節(jié)點數(shù)通常采用Kol-mogorov定理的經(jīng)驗處理公式e= +c,式中,c為介于1~10的常數(shù)。對任一神經(jīng)元i,其輸入、輸出關(guān)系可表述為Oi=f( ?棕ijhj+?茲i),式中,hj為神經(jīng)元的第j個輸入,Oi為神經(jīng)元的第i個輸出;?棕ij是所有與第i個神經(jīng)元相連的權(quán)值;?茲i是神經(jīng)元第i節(jié)點的閾值。f(x)為傳遞函數(shù),一般采用sigmoid型:f(x)=(1+exp(-x))-1。

設(shè)有p組訓(xùn)練樣本,用其中的第k組的樣本的輸入、輸出模式對網(wǎng)絡(luò)進行訓(xùn)練。設(shè)定收斂誤差界值為?著min,最大學(xué)習(xí)次數(shù)為N,經(jīng)過反復(fù)迭代運算,根據(jù)誤差函數(shù),得出樣本誤差Ek= (hoi(k)-yoi(k)),訓(xùn)練集誤差E= Ek。若網(wǎng)絡(luò)輸出值與期望輸出值之間的誤差不滿足誤差精度要求,則將誤差反向傳播,誤差傳播過程中,要不斷地反復(fù)修正網(wǎng)絡(luò)中連接權(quán)值和閾值,直至滿足誤差精度要求。連接權(quán)值和閾值修正公式為?駐k?棕(t+1)=?濁?啄jkoik+?琢?駐k?棕ij(t),?茲j(t+1)=?茲j+ ?駐k?茲j。式中,?濁學(xué)習(xí)率,?琢為動力因子,二者均介于0到1之間;?琢?駐k?棕ij(t)為動力項,?啄jk為輸出節(jié)點計算誤差,t為訓(xùn)練次數(shù)。

3 算例分析

以我國燃氣發(fā)電為例,用模糊神經(jīng)網(wǎng)絡(luò)風(fēng)險評價法對其風(fēng)險進行評。

(1)確定因素集和評語集,根據(jù)評價矩陣得出模糊評價結(jié)果。

本文的評價對象為我國燃氣發(fā)電風(fēng)險,由評價體系可知,一級指標因素集為X={x1,x2,x3,x4,x5}={資源風(fēng),生產(chǎn)風(fēng)險,技術(shù)風(fēng)險,市場風(fēng)險,環(huán)境風(fēng)險},二級指標因素集分別為X1={x11,x12,x13}={儲量風(fēng)險,開采風(fēng)險,地理地質(zhì)條件風(fēng)險},X2={x21,x22,x23}={天然氣供應(yīng)風(fēng)險,燃氣設(shè)備選擇風(fēng)險,技術(shù)選擇風(fēng)險},X3={x31,x32,x33}={技術(shù)研發(fā)風(fēng)險,技術(shù)成熟度風(fēng)險,技術(shù)應(yīng)用性風(fēng)險},X4={x41,x42,x43}={市場競爭風(fēng)險,市場供求風(fēng)險,發(fā)電效益風(fēng)險},X5={x51,x52,x53}={國家政策法律風(fēng)險,國際政治和經(jīng)濟環(huán)境風(fēng)險,自然環(huán)境風(fēng)險}。評語集為Y={y1,y2,y3,y4,y5}={大,較大,中等,較小,小},相對應(yīng)的分值為1.0,0.7,0.5,0.3,0.1。由15個專家組成評分小組,得到一級評價矩陣和二級評價矩陣,以及由評價矩陣求得的最大特征向量得到的權(quán)重向量得出15個樣本的綜合評價得分矩陣為?滋=(?滋1,?滋2,…,?滋15)=(0.669,0.623,0.691,

0.691,0.611,0.637,0.668,0.582,0.604,0.548,0.612,0.621,0.607,0.641,0.625,0.632)。模糊化后15個樣本各列得分和綜合得分結(jié)果如表2所示。

(2)神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測試階段

設(shè)置訓(xùn)練參數(shù)時,在BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練選擇22×13×1的網(wǎng)絡(luò)結(jié)構(gòu),訓(xùn)練最大次N=1000,學(xué)習(xí)率?濁=0.01,動量因子?琢=0.5,最收斂誤差界?著min=10-4,傳遞函數(shù)選擇對數(shù)S函數(shù)logsig,訓(xùn)練函數(shù)為traingdx,學(xué)習(xí)函數(shù)為learndm,權(quán)值矩陣初值由系統(tǒng)隨機給定。BP網(wǎng)絡(luò)模型的仿真結(jié)果均由Matlab軟件給出。選取表1的前10組數(shù)據(jù)作為訓(xùn)練樣本,后5組數(shù)據(jù)作為測試集,模擬待評估對象。經(jīng)過BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練后的前10組樣本輸出結(jié)果如下圖2所示。

利用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)模型對表2中的第11到15組數(shù)據(jù)進行測試,測試結(jié)果如下圖3所示。

將測試結(jié)果與專家評價結(jié)果進行對比分析,如下表3所示。

表3 BP神經(jīng)網(wǎng)絡(luò)測試結(jié)果

由上表看出,5個測試集仿真評價的結(jié)果與專家評價結(jié)果非常接近,平均相對誤差為2.90%,除了測試樣本13的訓(xùn)練相對誤差相比于其它測試樣本稍微偏大為8.89%,但是仍保持在較低的誤差水平。因此可以認為所建立的模糊神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練精度較高,模擬測試結(jié)果較好。測試結(jié)果顯示,當前我國燃氣發(fā)電風(fēng)險得分值在0.5與0.7之間,根據(jù)劃定的評價集,可判斷出當前我國燃氣發(fā)電風(fēng)險為較大和中等之間。

4 結(jié)束語

本文運用模糊神經(jīng)網(wǎng)絡(luò)對目前我國燃氣發(fā)電風(fēng)險進行了評價研究,可以得到以下主要結(jié)論:

(1)該模糊神經(jīng)網(wǎng)絡(luò)模型能夠充分避免主觀、人為因素的影響,具有自學(xué)習(xí)、自組織適應(yīng)能力強等優(yōu)點,算例分析結(jié)果也顯示出該模型訓(xùn)練精度高,預(yù)測結(jié)果好,評價結(jié)果較為客觀;

(2)建立模糊神經(jīng)網(wǎng)絡(luò)模型應(yīng)合理確定網(wǎng)絡(luò)層數(shù)及隱含層的神經(jīng)元數(shù),設(shè)置不合理會影響網(wǎng)絡(luò)的學(xué)習(xí)能力和效率;

(3)基于模糊神經(jīng)網(wǎng)絡(luò)對我國燃氣發(fā)電進行評價,有利于業(yè)內(nèi)人士更加客觀、清楚地了解當前我國燃氣發(fā)電現(xiàn)狀和問題,從而有利于促進該行業(yè)的發(fā)展。

參考文獻

[1]張斌.我國天然氣發(fā)電現(xiàn)狀及前景分析[J].中國能源,2012,34(11):12-16.

[2]李強.燃氣發(fā)電企業(yè)的市場營銷戰(zhàn)略[J].現(xiàn)代商業(yè),2007,(36):163.

[3]董軍,陰少華,王江波等.基于隨機生產(chǎn)模擬的天然氣發(fā)電環(huán)境效益與可靠性效益分析[J].陜西電力,2010,38(7):6-9.

[4]劉毅軍,李松玲,徐小輝等.天然氣產(chǎn)業(yè)鏈下游市場風(fēng)險評價模型探討[J].天然氣工業(yè),2006,26(7):136-138.

[5]熊焰,周偉國,嚴銘卿等.模糊神經(jīng)網(wǎng)絡(luò)在燃氣風(fēng)險評價的應(yīng)用[J].煤氣與熱力,2006,26(6):6-9.

[6]唐永偉. 燃氣電廠風(fēng)險分析[J].中國電力,2002,35(4):1-4.

[7]劉毅軍,夏新生,宋建新.天然氣產(chǎn)業(yè)鏈下游市場風(fēng)險評價指標體系探討[J].天然氣工業(yè),2006,26(增刊):172-174.

[8]魏陽,李凌云,馬明娟等.基于模糊綜合評價法的聚光型太陽能光熱發(fā)電風(fēng)險評價研究[J].陜西電力,2012,40(3):1-5.

[9]M. Mosleha, M. Otadia, S. Abbasbandyb. Evaluation of fuzzy regression models by fuzzy neural network[J]. Journal of Computational and Applied Mathematics, 2011, 234(3):825-834.

[10]陳建宏,胡敏,肖誠等.基于模糊人工神經(jīng)網(wǎng)絡(luò)的金屬礦山投資風(fēng)險評價[J].廣西大學(xué)學(xué)報(自然科學(xué)版),2011,36(6):1030-1035.

篇6

為尋求一種簡便的船舶運動模型辨識方法,根據(jù)船舶動力學(xué)與運動學(xué)基本方程的結(jié)構(gòu)形式,建立一種基于Elman神經(jīng)網(wǎng)絡(luò)的辨識模型,給出網(wǎng)絡(luò)結(jié)構(gòu)的選取和確定方法.以載質(zhì)量為5萬t的散貨船為例,利用國際海事組織要求的幾個典型的船舶操縱試驗數(shù)據(jù)對網(wǎng)絡(luò)進行訓(xùn)練,計算權(quán)值矩陣,獲得該船舶可用于船舶操縱性分析的神經(jīng)網(wǎng)絡(luò)模型.將網(wǎng)絡(luò)計算結(jié)果代入船舶運動學(xué)方程進行船舶航跡仿真,并與試驗航跡數(shù)據(jù)進行對比, 驗證網(wǎng)絡(luò)模型的精確性.比較仿真驗證結(jié)果和試驗數(shù)據(jù)可知,該網(wǎng)絡(luò)模型能基本反映被辨識船舶的動態(tài)特性,驗證其有效性和準確性.

關(guān)鍵詞:

船舶動力學(xué)模型; 船舶運動學(xué)方程; 神經(jīng)網(wǎng)絡(luò); 系統(tǒng)辨識

中圖分類號: U661.33;TP183

文獻標志碼: A

0引言

目前對于船舶操縱運動數(shù)學(xué)模型的研究基本上從兩方面著手:一是機理建模研究,從基本運動方程出發(fā),通過確定其水動力求解其運動參數(shù)的水動力模型;二是辨識建模研究,將船舶看作一個動態(tài)系統(tǒng),舵角作為輸入,船舶運動參數(shù)作為輸出,進行水動力參數(shù)辨識和函數(shù)形式傳遞的船舶模型辨識.前一種方法需要測量和計算復(fù)雜的水動力導(dǎo)數(shù),工作量大,而且某些水動力導(dǎo)數(shù)的理論估算目前還不能滿足工程精度的要求,只能通過拘束船模試驗精確確定,費用高,可行性較低.后一種方法中的水動力參數(shù)辨識,存在無法完全辨識的問題,而傳遞函數(shù)形式的船舶模型,更適合于寬闊水域的船舶操縱,不適合具有高強機動性的船舶操縱控制,若要應(yīng)用于仿真,還需補充目前尚無統(tǒng)一形式的船舶縱向方程[1].近幾年,隨著神經(jīng)網(wǎng)絡(luò)研究的再度興起,神經(jīng)網(wǎng)絡(luò)在模式識別、系統(tǒng)辨識、圖像處理和自動控制等眾多領(lǐng)域得到廣泛應(yīng)用[24],在運動建模與仿真,特別是在船舶操縱性中的應(yīng)用也越來越受到國內(nèi)外眾多學(xué)者[58]的關(guān)注.神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)、自適應(yīng)的能力,能夠從輸入數(shù)據(jù)中自動學(xué)習(xí),抽取包含在數(shù)據(jù)中的映射關(guān)系,因此可以用來學(xué)習(xí)船舶在航行過程中的動態(tài)操縱特性.目前, 在系統(tǒng)辨識中應(yīng)用最多的是多層前向網(wǎng)絡(luò). 該網(wǎng)絡(luò)具有逼近任意連續(xù)非線性函數(shù)的能力, 但這種網(wǎng)絡(luò)結(jié)構(gòu)一般是靜態(tài)的, 而人們更關(guān)心控制系統(tǒng)的動態(tài)特性, 這恰恰是反向傳播(BackPropagation,BP)神經(jīng)網(wǎng)絡(luò)等前饋型網(wǎng)絡(luò)所缺乏的.與靜態(tài)前饋型神經(jīng)網(wǎng)絡(luò)不同,動態(tài)遞歸網(wǎng)絡(luò)通過存儲內(nèi)部狀態(tài)使其具備映射動態(tài)特征的功能, 從而使系統(tǒng)具有適應(yīng)時變特性的能力, 更適合于非線性動態(tài)系統(tǒng)的辨識.動態(tài)遞歸神經(jīng)網(wǎng)絡(luò)是控制系統(tǒng)建模和辨識中極具發(fā)展?jié)摿Φ木W(wǎng)絡(luò).[9]本文將動態(tài)遞歸神經(jīng)網(wǎng)絡(luò)應(yīng)用于船舶操縱運動辨識,建立一種基于Elman神經(jīng)網(wǎng)絡(luò)的辨識模型.該網(wǎng)絡(luò)模型與已知的船舶動力學(xué)基本模型相對應(yīng),使網(wǎng)絡(luò)結(jié)構(gòu)具有明確的物理意義.隨后,利用幾種典型的船舶操縱性試驗數(shù)據(jù)對網(wǎng)絡(luò)模型進行訓(xùn)練和驗證,得到比較滿意的結(jié)果.

1船舶運動數(shù)學(xué)模型

船舶的實際運動是一種具有6個自由度的異常復(fù)雜的運動.對大多數(shù)情況下的船舶運動及控制而言,可以忽略船舶垂蕩、橫搖和縱搖運動.國際海事組織(International Maritime Organization,IMO)要求的幾種典型的船舶操縱性試驗極少包含對船舶垂蕩、橫搖和縱搖運動的數(shù)據(jù)記錄.本文的主要目的在于驗證Elman神經(jīng)網(wǎng)絡(luò)對船舶運動辨識的可行性.考慮上述原因,僅對船舶3自由度運動進行辨識與建模,不考慮風(fēng)、浪和流等外界條件的影響.

船舶3自由度的動力學(xué)方程[5]為

篇7

Abstract: In the view of the shortage of the Wavelet Neural Network Algorithm, adapt Adaptive Inertia Weight Particle Swarm Optimization Algorithm(AIW-PSO) as a study algorithm, build the AIW-PSO Wavelet Neural Network Model to predict the Shanghai stock Index., and make a comparison between the results of improved algorithm prediction model with results of traditional Wavelet Neural Network Model. The results show that the AIW-PSO Wavelet Neural Network Prediction Model has better prediction results on the Shanghai Stock Index.

關(guān)鍵詞: 自適應(yīng)慣性權(quán)重粒子群優(yōu)化算法;小波神經(jīng)網(wǎng)絡(luò);上證指數(shù)預(yù)測

Key words: Adaptive Inertia Weight Particle Swarm Optimization;Wavelet Neural Network;Shanghai Stock Index Prediction

中圖分類號:F832.5;F224 文獻標識碼:A 文章編號:1006-4311(2014)08-0006-03

0 引言

股票市場預(yù)測是一個非線性函數(shù)值估計和外推問題,隨著股市預(yù)測問題的復(fù)雜性增高,僅僅依靠傳統(tǒng)的預(yù)測方法或是單一的人工智能模型已經(jīng)不足以達到人們所期望的要求。近年來,學(xué)者們試圖將多種股市預(yù)測技術(shù)結(jié)合,使它們優(yōu)劣互補,從而達到更加理想的股市預(yù)測效果。殷光偉、藺玉佩[1]應(yīng)用小波理論對混沌模型預(yù)測的結(jié)果予以重構(gòu),實現(xiàn)對原始收益率的預(yù)測,結(jié)果有了更高的精度。王剛[2]等利用小波將股指數(shù)據(jù)進行去噪處理,然后利用BP神經(jīng)網(wǎng)絡(luò)進行預(yù)測分析,試驗結(jié)果精準度相對于BP神經(jīng)網(wǎng)絡(luò)方法更高、效果更好。劉海珗[3]等將AR模型、RBF和GRNN神經(jīng)網(wǎng)絡(luò)模型進行比較,結(jié)果表明若神經(jīng)網(wǎng)絡(luò)選擇恰當?shù)膶W(xué)習(xí)算法時,對上證指數(shù)預(yù)測結(jié)果會更優(yōu)越。肖冬榮等[4]采用PSO算法訓(xùn)練神經(jīng)網(wǎng)絡(luò)對股市進行預(yù)測,實證結(jié)果表明改進算法易實現(xiàn)且預(yù)測精度高。文獻[5、6]提出了將遺傳算法與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合對股市價格進行預(yù)測,實證仿真結(jié)果證實該改進模型的優(yōu)越性。Yoshinori[7]等將小波系數(shù)作為特征量輸入于多階段模糊推理系統(tǒng)中,并價格漲落進行預(yù)測。Taeksoo[8]等利用遺傳算法和神經(jīng)網(wǎng)絡(luò)將小波系數(shù)加權(quán)后作為特征量預(yù)測匯率,效果同樣相對較好。而隨著小波神經(jīng)網(wǎng)絡(luò)快速發(fā)展,這些年來其優(yōu)越的性能使其得到了廣泛的應(yīng)用,但其學(xué)習(xí)算法的一些缺陷對其在股市預(yù)測中的應(yīng)用得到了限制。而本文所提出的一種自適應(yīng)粒子群優(yōu)化算法尋優(yōu)等能力突出、簡單易實現(xiàn)等優(yōu)勢會克服原有缺陷,而將AIW-PSO算法與小波神經(jīng)網(wǎng)絡(luò)結(jié)合后的新技術(shù)將會成為一種全新的、更優(yōu)越的股票市場預(yù)測方法。

1 自適應(yīng)慣性權(quán)重粒子群優(yōu)化算法

自從粒子群算法被提出以來不少學(xué)者也是提出各種各樣的改進算法來克服其收斂快、容易陷入局部極小值等缺點。如通過產(chǎn)生多子群、增加自適應(yīng)變異、魚群算法中聚群行為、混沌理論等去改進粒子群,但在這么多改進算法中必然會存在一些如相互結(jié)合的算法之間的性能相互抵消及相互影響等情況,從而導(dǎo)致改進算法在做預(yù)測時的結(jié)果出現(xiàn)一種“假”的精度高等現(xiàn)象。故本文結(jié)合文獻[9、10]中所提出的一種自適應(yīng)慣性權(quán)重粒子群優(yōu)化算法,選擇該方法作為小波神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法,來指導(dǎo)小波神經(jīng)網(wǎng)絡(luò)的模型擬合。

由PSO算法的基本原理中粒子的位置和速度方程可知,其中ω是為非負數(shù)的慣性權(quán)重,它使粒子保持運動慣性,使其具有擴展收縮空間的趨勢,有助于新區(qū)域的搜索。設(shè)ωmax為最大慣性權(quán)重,ωmin為最小慣性權(quán)重,k為當前迭代次數(shù),kmax為算法迭代總次數(shù),則自適應(yīng)慣性權(quán)重ω的方程如下:

ω=ωmax-k(ωmax-ωmin)/kmax

根據(jù)個體粒子的尋優(yōu)能力,給出自適應(yīng)慣性權(quán)重來調(diào)整全局搜索能力和局部開發(fā)能力。每一維每個粒子在每次迭代時都有不同的慣性權(quán)重,這對于提高收斂精度上有較好的效果。而實際應(yīng)用中常將慣性因子ωmax和ωmin分別設(shè)為0.9和0.4。

2 基于AIW-PSO小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型

由上述AIW-PSO算法原理及算法流程,本小節(jié)試圖將AIW-PSO算法的尋優(yōu)機制作為學(xué)習(xí)策略添加到小波神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,構(gòu)建AIW-PSO小波神經(jīng)網(wǎng)絡(luò),令小波神經(jīng)網(wǎng)絡(luò)和AIW-PSO算法相互取長補短。對于小波神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)問題,輸入層節(jié)點數(shù)為m,隱含層節(jié)點數(shù)為n,輸出層節(jié)點數(shù)為k,則優(yōu)化維度D=n×m+k×n+n+n。假設(shè)1:輸入層到隱含層的權(quán)值矩陣為Wkj,隱含層和輸出層的權(quán)值矩陣Wji;假設(shè)2:小波基函數(shù)平移系數(shù)bj,向量為B1=(b1,b2,…,bj);小波基函數(shù)伸縮系數(shù)aj,向量為B2=(a1,a2,…,aj);故單個粒子在維度上的順序編碼為包括以上假設(shè)1和假設(shè)2中的矩陣和向量中的所有元素的一行或一列的向量x=(W11,…,Wkj,W11,…,Wji b1,…,bj,a1,…,aj)。

優(yōu)化單隱層小波神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的主要步驟和基本流程為:

步驟1:對小波神經(jīng)網(wǎng)絡(luò)的權(quán)值、小波基函數(shù)平移系數(shù)和伸縮系數(shù)進行結(jié)構(gòu)編碼,使其對應(yīng)于AIW-PSO算法中的個體;

步驟2:將權(quán)值和小波基函數(shù)平移系數(shù)和伸縮系數(shù)的取值區(qū)間賦予AIW-PSO算法的種群,隨機初始化種群;

步驟3:結(jié)合問題,設(shè)定網(wǎng)絡(luò)類型、結(jié)構(gòu)、小波基函數(shù)及初始化各項參數(shù),生成新的網(wǎng)絡(luò)模型;

步驟4:分別將種群的維度信息解碼為網(wǎng)絡(luò)模型各項參數(shù),對網(wǎng)絡(luò)進行仿真輸出,計算均方誤差MSE作為算法的適應(yīng)度;

步驟5:按照AIW-PSO算法的尋優(yōu)方式進行迭代,直到某一個體的適應(yīng)度滿足要求,或達到最大迭代步數(shù)則終止算法;

步驟6:將算法的最優(yōu)解解碼給小波神經(jīng)網(wǎng)絡(luò),得到經(jīng)過優(yōu)化后的WNN模型,進行預(yù)測。

AIW-PSO算法訓(xùn)練小波神經(jīng)網(wǎng)絡(luò)模型的基本流程如圖1所示。

3 應(yīng)用分析

股票指數(shù)時間序列是一個很不穩(wěn)定的動態(tài)變化過程,其影響因素眾多,其中包括如宏觀、微觀、政治、經(jīng)濟等因素。如何在上述眾多的影響因素中選取主要影響指標作為上證指數(shù)預(yù)測模型的輸入變量將會是一個十分關(guān)鍵的問題。根據(jù)文獻中和現(xiàn)實股票市場情況,輸出變量選為第t 日的收盤價,而影響指標選取為上證指數(shù)第t-1日的開盤價、最低價、最高價、收盤價和交易量信息共五個。實驗數(shù)據(jù)選取多少應(yīng)看所預(yù)測的指數(shù)。過多會增加收集,過少則可能導(dǎo)致結(jié)果偏差。故本文所采集的數(shù)據(jù)是從2010年8月6日至2011年8月6日的一年的共243組上證指數(shù)序列,其中前195組用來訓(xùn)練,后48 組用來預(yù)測。為了消除數(shù)據(jù)之間的影響,本文利用歸一化函數(shù)將原始數(shù)據(jù)的序列歸一化到[-1,1]之間,再利用反歸一化函數(shù)將模擬結(jié)果還原到上證指數(shù)的時間序列。本文選取的WNN隱含層激勵函數(shù)為最常用的具有良好的時頻局部性的Morlet小波,而各層神經(jīng)元數(shù)根據(jù)預(yù)測的上證指數(shù)和影響指標個數(shù)設(shè)為:輸入層為5,輸出層為1。根據(jù)經(jīng)驗公式及反復(fù)測試后隱含層小波基函數(shù)個數(shù)取10,此時AIW-PSO算法中粒子維度D為80,粒子個數(shù)S=40,粒子個體參數(shù)初始為(-1,1)的數(shù)值,常數(shù)c1=c2=2,本文中常將粒子最大速度Vmax初始化為0.5,粒子位置的最大值Xmax 確定為1,最大迭代次數(shù)kmax為500。

為了而體現(xiàn)改進算法預(yù)測的優(yōu)越性,固將AIW-PSO小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型與傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型進行對比。兩種預(yù)測模型程序在matlab2012a工具環(huán)境下分別進行5次測試,測試結(jié)果如表1所示。

由實驗各項結(jié)果可知,基于小波神經(jīng)網(wǎng)絡(luò)的模型結(jié)果不太穩(wěn)定,波動較大,MAPE值在1.53%-9.03%之間。為了體現(xiàn)AIW-PSO小波神經(jīng)網(wǎng)絡(luò)的優(yōu)越性,在此我們?nèi)≡撃P妥詈玫念A(yù)測結(jié)果,即預(yù)測誤差百分比MAPE為1.53%,此時訓(xùn)練樣本的均方誤差MSE指標為0.0163,測試樣本的預(yù)測結(jié)果見圖2。對于AIW-PSO小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型預(yù)測結(jié)果來說,無論是在預(yù)測結(jié)果穩(wěn)定性和預(yù)測精度方面都較小波神經(jīng)網(wǎng)絡(luò)有明顯提高,5次測試中MAPE值都在0.99%-1.25%之間,足以說明該預(yù)測模型的優(yōu)越性,測試樣本的預(yù)測結(jié)果見圖3。

4 結(jié)語

用自適應(yīng)慣性權(quán)重粒子群優(yōu)化算法訓(xùn)練小波神經(jīng)網(wǎng)絡(luò)能夠起到很好的網(wǎng)絡(luò)權(quán)值和系數(shù)優(yōu)化效果,而兩種算法預(yù)測模型結(jié)果對比分析表明,本文所建立AIW-PSO小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型無論是在測試MAPE、預(yù)測穩(wěn)定性、預(yù)測精度上都相對傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)優(yōu)越。說明AIW-PSO小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有更加優(yōu)越的性能,將會是成為股市預(yù)測的一種新型混合算法預(yù)測工具。

參考文獻:

[1]殷光偉,鄭丕諤.基于小波與混沌集成的中國股票市場預(yù)測[J].系統(tǒng)工程理論方法應(yīng)用,2004,13(6):554-547.

[2]王剛,許曉兵.基于小波分析與神經(jīng)網(wǎng)絡(luò)時間序列的股票預(yù)測方法[J].金融經(jīng)濟,2013,4(12):161-162.

[3]劉海珗,白艷萍.時間序列模型和神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測中的分析[J].數(shù)學(xué)的實踐與認識,2011,3(2):14-19.

[4]肖冬榮,楊子天.基于粒子群訓(xùn)練的神經(jīng)網(wǎng)絡(luò)股票預(yù)測模型[J].統(tǒng)計與決策,2009,12(2):20-22.

[5]孟祥澤,劉新勇,車海平,袁著祉.基于遺傳算法的模糊神經(jīng)網(wǎng)絡(luò)股市建模與預(yù)測[J].信息與控制,1997,13(10):388-392.

[6]歐陽林群.GA神經(jīng)網(wǎng)絡(luò)在證券市場預(yù)測中的應(yīng)用研究[J].湖北武漢理工大學(xué)學(xué)報(信息與管理工程版),2006,28(11):160-163.

[7]Yoshinori K, Shozo.T. Prediction of Stock Trends by Using the Wavelet Transform and the Multi-stage Fuzzy Inferenle System Optimized by the GA[J]. IEICE Trams Fundamentals, 2000, 83(2): 357-366.

[8]Taeksoo S,Ingoo H. Optimal signal multi-resolution by genetic algorithm to Support Artificial neural network for exchange rate forecasting[J]. Expert System with Applications, 2000, 18(4): 257-269.

篇8

關(guān)鍵字:智能手機;安全;神經(jīng)網(wǎng)絡(luò);病毒病毒識別模型在智能手機監(jiān)測中的優(yōu)越性以及可行性。

0 引言

現(xiàn)階段,互聯(lián)網(wǎng)已成為當今社會不可或缺的一部分,智能手機的數(shù)量也是與日俱增,與此同時不斷發(fā)展的是手機病毒,手機病毒已成為現(xiàn)代病毒發(fā)展的趨勢。

所謂手機病毒,其實是一種破壞手機系統(tǒng)的程序,且其傳播手段極為廣泛,可通過短信、彩信、郵件、網(wǎng)站或者下載文件、藍牙等傳播,手機一旦被病毒感染就會根據(jù)所感染病毒程序的要求對手機實施破壞,其表現(xiàn)方式不盡相同,可以使關(guān)機、死機、刪除手機資料、自動通話、發(fā)郵件等,有的病毒還能夠破壞手機SIM卡和芯片等手機硬件設(shè)備。

怎樣才能避免手機遭受病毒的破壞?其主要措施還是殺毒軟件和防火墻:

①定期對殺毒軟件的病毒庫進行更新升級,盡可能的保證其擁有當時已出現(xiàn)的病毒程序的破解,若病毒庫中不存在某個病毒的特征,則殺毒軟件就不能對該病毒進行查殺。此外,現(xiàn)在的手機殺毒軟件病毒庫采用的是特征代碼法,病毒的細微的變化都需要病毒庫對其進行辨別,然而智能手機的存儲空間和運算能力都是有限的,所以這種防殺毒的方法對智能手機而言,并不是完美的。

②而智能手機的防火墻主要的作用是攔截騷擾電話等,而并不是對手機病毒進行監(jiān)控,面對現(xiàn)存的多樣易變的病毒,防火墻更是顯得微不足道。

究竟該選擇何種方式來保護手機,這也是本文研究的重點―神經(jīng)網(wǎng)絡(luò)。

1 神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)是依據(jù)生物神經(jīng)的機制和原理,對信息進行處理的一種模型。它能夠模擬動物大腦的某些機制機理,實現(xiàn)一些特定的功能。人工神經(jīng)網(wǎng)絡(luò)具有很大的優(yōu)越性:

①具有自學(xué)功能。比如說,當對一幅圖像進行識別時,將各種不同的圖像樣本及其對應(yīng)的結(jié)果輸入人工神經(jīng)網(wǎng)絡(luò),它就能夠自己學(xué)習(xí)識別相同類型的圖像。

②具有聯(lián)想存儲功能。人工神經(jīng)網(wǎng)絡(luò)中的反饋網(wǎng)絡(luò)具備了聯(lián)想存儲的功能。

③具有高速尋找優(yōu)化解的功能。

2 神經(jīng)網(wǎng)絡(luò)安全監(jiān)控系統(tǒng)

神經(jīng)網(wǎng)絡(luò)安全監(jiān)控系統(tǒng)就是監(jiān)控手機應(yīng)用程序,使手機的正常業(yè)務(wù)能夠順利進行,而對那些異常業(yè)務(wù)則進行阻止。所謂正常的業(yè)務(wù)就是那些手機用戶已知的、按照用戶的意愿運行的、并且其運行并不破壞用戶手機中的資源和產(chǎn)生額外費用的已經(jīng)授權(quán)的程序。

通過神經(jīng)網(wǎng)絡(luò)監(jiān)控手機的而應(yīng)用程序的流程圖如圖1所示:

圖1 神經(jīng)網(wǎng)絡(luò)安全監(jiān)控流程圖圖2 單層感知器神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

神經(jīng)網(wǎng)絡(luò)智能手機安全監(jiān)控的第一步是獲取所運行程序的特征,然后借助于神經(jīng)網(wǎng)絡(luò)的識別功能,對所提取的應(yīng)用程序的行為特征進行識別,如果識別結(jié)果為病毒手機會向用戶發(fā)出提示信息,若不為病毒則程序?qū)⒗^續(xù)運行。

3.1 程序行為特征的獲取

這里舉個例子說明。例如OwnSkin.A病毒,該病毒以手機主題的形式誘導(dǎo)手機用戶進行下載安裝,一旦該病毒被安裝進了手機,它就會在用戶不知情的情況下自動連接網(wǎng)絡(luò),自動想外界批量發(fā)送短信,對手機收到的短信的信息內(nèi)容進行刪除等等。從對病毒的描述詳細程度方面來說,病毒具有很多種特征,本文以3個為例,進行說明,這3個特征分別是有無按鍵、是否自啟動、是否特殊號碼,程序行為特征獲取的方法如下:

①針對手機自啟動的行為特征:每種手機的系統(tǒng),都有其正常的程序啟動方式,例如Windows Mobile通過“啟動”設(shè)置,Symbian的系統(tǒng)式通過“Recognizer”來設(shè)置程序的啟動,Linux系統(tǒng)是將啟動語句加入/ect/init.d/rcs,或者/usr/etc/rc.local中,在程序啟動的時候?qū)@些個位置進行監(jiān)控,就可以很容易的判別其是否為自啟動。

②針對按鍵這個行為特征:塞班的系統(tǒng)對是否有按鍵這個行為特征的監(jiān)控是粗略的監(jiān)控,以短信為例,手機短信的使用一般是先按功能鍵啟動功能圖標,然后選取短信的圖標,接著是對短信內(nèi)容的編輯,即一系列的數(shù)字鍵,監(jiān)控可得到一個相應(yīng)的按鍵序列,這樣就可以通過是否有按鍵這個行為特征來監(jiān)測手機程序的啟動是否正常。

③針對“被叫號碼”和“文件信息”的特征: 對于被叫號碼主要執(zhí)行的是,查看所要撥出去的電話號碼是否是設(shè)置在黑名單里的電話,對于文件信息則是查看信息中所添加的附件是否是安裝文件,如果是手機用戶之間的正常傳輸行為,則必定有按鍵行為特征,這樣也就會避免手機中的病毒程序隱蔽性的自啟動來傳輸文件。

3.2 神經(jīng)網(wǎng)絡(luò)建模

仍舊以上述3個行為特征為例,將其三個特征分別用“0”或者“1”來表示,若無按鍵、自啟動、特殊號碼,其特征值都取“1”,反之則取“0”,這三個特征值一共組合成了8中可能出現(xiàn)的情況,將其標記為矩陣如下:

(1)

借助于神經(jīng)網(wǎng)絡(luò)的識別功能,本文以單層單神經(jīng)元的神經(jīng)網(wǎng)絡(luò)為例進行說明,采用以下的參數(shù)對神經(jīng)網(wǎng)絡(luò)進行設(shè)計:

該網(wǎng)絡(luò)包含有一個輸入向量,包汗三個元素,并且每個元素取0―1之間的值。

神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元通過hardlim函數(shù)為傳輸手段,根據(jù)這個函數(shù)設(shè)計出如圖2所示的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),:

(2)

該結(jié)構(gòu)輸出結(jié)果為二值向量“0”或者“1”,其中“0”表示不是病毒特征,“1”則表示是行為特征。

在智能手機的實際應(yīng)用中,傳輸函數(shù)和網(wǎng)絡(luò)結(jié)構(gòu)、層數(shù)極易神經(jīng)元等的類型多種多樣,可根據(jù)病毒的實際情況進行選擇和應(yīng)用,在此筆者只是舉個例子來論述神經(jīng)網(wǎng)絡(luò)是如何識別網(wǎng)絡(luò)的。當網(wǎng)絡(luò)建好之后,就需要通過適當?shù)姆椒▽Σ《緲颖具M行訓(xùn)練得出誤差。

仍以上述例子為例進行訓(xùn)練:

輸入向量為:p= ;目標向量選為:t= ,在MATLAB7.1的環(huán)境中對病毒進行訓(xùn)練,根據(jù)所的結(jié)果得出訓(xùn)練的誤差性能曲線,如圖3所示:

圖3 訓(xùn)練誤差性能曲線

經(jīng)過訓(xùn)練并獲取矩陣權(quán)重,至此,神經(jīng)網(wǎng)絡(luò)的建?;就瓿?,其模型為

a=hardlim(P1*2+P2*2+P3*1-3)

在手機中所執(zhí)行的應(yīng)用程序,計算程序的行為特征向量與病毒的行為特征向量(111)之間的歐式距離,當所得之數(shù)比程序的特征行為向量和正常行為特征向量之間的歐式距離大時,系統(tǒng)將將此程序判定為病毒。

運用神經(jīng)網(wǎng)絡(luò)系統(tǒng)對手機進行監(jiān)測不需要像殺毒軟件一樣需要定期更新,這對手機的安全具有更好的防護作用。

3結(jié)語

隨著現(xiàn)代社會智能手機數(shù)量的增多和日?;?,網(wǎng)絡(luò)黑客技術(shù)也在不斷的發(fā)展和完善,因此智能手機安全問題已然不能忽視或者小視。本文針對這個問題,以及殺毒軟件和防火墻的不足之處,論述了神經(jīng)網(wǎng)絡(luò)病毒識別模型在智能手機監(jiān)測中的優(yōu)越性以及可行性。

參考文獻

[1]劉一靜,孫瑩,藺洋. 基于手機病毒攻擊方式的研究[J]信息安全與通信保密, 2007, (12) .

[2]李錦. 手機病毒特點及防范對策[J]通信技術(shù), 2009, (02) .

[3]楊建強,吳釗,李學(xué)鋒. 增強智能手機安全的動態(tài)惡意軟件分析系統(tǒng)[J]. 計算機工程與設(shè)計, 2010, (13) .

[4]智能手機安全防護框架淺析[J]. 信息安全與通信保密, 2010, (10).

篇9

關(guān)鍵詞:LM-BP網(wǎng)絡(luò);糧食產(chǎn)量;預(yù)測

中圖分類號:S11+4;TP183 文獻標識碼:A 文章編號:0439-8114(2012)23-5479-03

Forecasting Corn Production Based on LM-BP Neural Network

GUO Qing-chun1,3,4,HE Zhen-fang2,4,LI Li3

(1. Teaching Affairs Office, Shaanxi Radio & TV University, Xi’an 710068, China; 2. Cold and Arid Regions Environmental and Engineering Research Institute, Chinese Academy of Sciences, Lanzhou 730000, China; 3. Institute of Earth Environment Research, Chinese Academy of Sciences, Xi’an 710075, China; 4. Graduate University, Chinese Academy of Sciences, Beijing 100049, China)

Abstract: A corn production porecasting method based on improved LM-BP was proposed. According to measurement and agricultural significance principle, 9 factors of grain-sown area, fertilizer input, effective grain irrigated area, stricken area, rural electricity consumption, total agriculture mechanism power, the population engaged in agriculture, rural residents family productive assets, the average net income of rural households were extracted as the network input; corn production was extracted as the network output. The LM algorithm could minimize the error, and the modeling results were evaluated with the correlation coefficients, relative error, etc. For training sample set, the correlation coefficient between the simulated value and the actual value was 0.996, the average relative error was 0.47%; for testing sample set, the correlation coefficient between the forecasted value and the actual value was 0.994, the average relative error was 0.56%. The results showed that the improved LM-BP model could improve simulation precision and stability of the model. This method is effective and feasible for corn production prediction.

Key words: LM-BP network; corn production; forecast

糧食產(chǎn)量預(yù)測是復(fù)雜的農(nóng)學(xué)和統(tǒng)計學(xué)問題,受自然環(huán)境、政策、資源投入等多因素的影響。國內(nèi)外的相關(guān)研究中,不少學(xué)者構(gòu)建了許多很有價值的理論假說和預(yù)測模型,主要有4類:投入產(chǎn)出模型、遙感技術(shù)預(yù)測模型、氣候生產(chǎn)力模型及多元回歸和因子分析模型,這些模型從不同角度對糧食產(chǎn)量預(yù)測進行了研究[1,2]。但這些模型多數(shù)采用傳統(tǒng)的統(tǒng)計預(yù)測技術(shù),如時間序列統(tǒng)計模型、定性與推斷技術(shù)、因果關(guān)系方法。而糧食產(chǎn)量是受不確定性因素影響的,是一個復(fù)雜的非線性系統(tǒng)。

人工神經(jīng)網(wǎng)絡(luò)具有很強的處理大規(guī)模復(fù)雜非線性系統(tǒng)的能力。近年來,許多學(xué)者已將人工神經(jīng)網(wǎng)絡(luò)成功地應(yīng)用于實際問題的預(yù)測中,取得了令人滿意的結(jié)果[3-12]。為此,采用改進算法的神經(jīng)網(wǎng)絡(luò)建立了糧食產(chǎn)量預(yù)測系統(tǒng),結(jié)果表明,基于改進算法的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有良好的預(yù)測精度、訓(xùn)練時間短、收斂速度快等特點。

1 仿真試驗數(shù)據(jù)

1.1 預(yù)測因子的選擇

根據(jù)能夠計量及具有農(nóng)學(xué)意義的原則,結(jié)合農(nóng)業(yè)專家的意見,通過前期大量的影響因子分析[13-15],選取1994-2009年的糧食總產(chǎn)量為輸出因子,初步選取糧食作物播種面積、化肥施用量、糧食作物有效灌溉面積、受災(zāi)面積、農(nóng)村用電量、農(nóng)業(yè)機械總動力、從事農(nóng)業(yè)的人口、農(nóng)村居民家庭生產(chǎn)性固定資產(chǎn)原值、農(nóng)村居民家庭平均純收入9個因子作為輸入因子構(gòu)筑模型,原始數(shù)據(jù)來源于2010年《中國統(tǒng)計年鑒》。

1.2 網(wǎng)絡(luò)輸入的初始化

為了消除不同因子之間由于量綱和數(shù)值大小的差異而造成的誤差,以及由于輸入數(shù)值過大造成溢出,首先需要對數(shù)據(jù)進行標準化處理,即把輸入數(shù)據(jù)轉(zhuǎn)化為[0,1]或[-1,1]的數(shù)。通過公式y(tǒng)=(x-min(x))/(max(x)-min(x))對糧食產(chǎn)量進行處理,得到了符合網(wǎng)絡(luò)要求的數(shù)據(jù)。減少了識別數(shù)據(jù)的動態(tài)范圍,使預(yù)測成功的可能性得以提高。然后將數(shù)據(jù)分成兩部分:網(wǎng)絡(luò)的訓(xùn)練樣本集(前11年的數(shù)據(jù))和檢測樣本集(后5年的數(shù)據(jù))。

2 預(yù)測仿真模型的建立

BP網(wǎng)絡(luò)是誤差反向傳播(Back Propagation)人工神經(jīng)網(wǎng)絡(luò)的簡稱,是目前計算方法比較成熟、應(yīng)用比較廣泛、效果比較好、模擬生態(tài)經(jīng)濟系統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型,但傳統(tǒng)BP網(wǎng)絡(luò)存在學(xué)習(xí)過程收斂慢,局部極小、魯棒性不好、網(wǎng)絡(luò)性能差等缺點。為了改進算法,引入Levenberg-Marquardt優(yōu)化算法,其基本思路是使其每次迭代不再沿著單一的負梯度方向,而是允許誤差沿著惡化的方向進行搜索,同時通過在最速梯度下降法和高斯-牛頓法之間自適應(yīng)調(diào)整來優(yōu)化網(wǎng)絡(luò)權(quán)值,使網(wǎng)絡(luò)能夠有效收斂,大大提高網(wǎng)絡(luò)的收斂速度和泛化能力,它能夠降低網(wǎng)絡(luò)對誤差曲面局部細節(jié)的敏感性,有效抑制網(wǎng)絡(luò)陷入局部極小。

Levenberg-Marquardt算法實際上是梯度下降法和擬牛頓法的結(jié)合,該算法期望在不計算Hessian矩陣的情況下獲得高階的訓(xùn)練速度,其公式表達為XK+1=XK-[JTJ+μI]-1JTe,其中,JT為雅克比矩陣,e是網(wǎng)絡(luò)誤差向量。如果μ=0的話,就變成采用近似Hessian矩陣的擬牛頓法;如果μ很大,即成為小步長的梯度下降法,由于牛頓法在誤差極小點附近通常能夠收斂得更快更準確,因此算法的目的就是盡快轉(zhuǎn)換為牛頓法。如果某次迭代成功,誤差性能函數(shù)減小,那么就減小μ值,而如果迭代失敗,就增加μ值。如此可以使得誤差性能函數(shù)隨著迭代的進行而下降到極小值。Matlab工具箱提供了Trainlm 函數(shù)Levenberg-Marquardt算法的計算。

網(wǎng)絡(luò)結(jié)構(gòu)的選擇是應(yīng)用BP網(wǎng)絡(luò)成功與否的關(guān)鍵因素之一,一個規(guī)模過大的神經(jīng)網(wǎng)絡(luò)容易造成網(wǎng)絡(luò)容錯性能下降、網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、泛化能力較差等缺陷;而規(guī)模過小的神經(jīng)網(wǎng)絡(luò)往往對訓(xùn)練樣本的學(xué)習(xí)較為困難,學(xué)習(xí)過程可能不收斂,影響網(wǎng)絡(luò)的表現(xiàn)能力,降低網(wǎng)絡(luò)應(yīng)用的精度。理論研究表明,只要具有足夠的隱層神經(jīng)元,3層人工神經(jīng)網(wǎng)絡(luò)可以無限地逼近任何時間序列和函數(shù),因此這里采用含有一個隱含層的3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。隱含層神經(jīng)元數(shù)的選擇較為復(fù)雜,它關(guān)系到整個BP網(wǎng)絡(luò)的精確度和學(xué)習(xí)效率,但目前,它的選取尚無一般的指導(dǎo)原則,只能根據(jù)一些經(jīng)驗法則或通過試驗來確定,如Hecht-Nielsen提出的“2N+1”法,由輸入矩陣可以確定輸入層節(jié)點數(shù)為9,根據(jù)“2N+1”這一經(jīng)驗,可確定隱含層節(jié)點數(shù)為19;輸出層節(jié)點數(shù)為1,這樣就構(gòu)成了一個9-19-1的BP神經(jīng)網(wǎng)絡(luò)模型,其中,訓(xùn)練函數(shù)為Trainlm,輸入層到隱含層以及隱含層到輸出層的傳遞函數(shù)分別為Logsig和Purelm,最大訓(xùn)練次數(shù)Epochs為50 000次;訓(xùn)練誤差精度Goal為0.001;訓(xùn)練時間間隔Show為5,學(xué)習(xí)步長Lc為0.5,動量因子Me為0.95,其他參數(shù)均選用缺省值。

3 仿真結(jié)果

取1994-2004年的11個實際產(chǎn)量作為訓(xùn)練樣本集,將2005-2009年的5個實際產(chǎn)量作為預(yù)測效果檢測樣本集。將1994-2004年9個指標的原始數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入樣本,糧食產(chǎn)量實際值作為輸出樣本,然后對網(wǎng)絡(luò)進行訓(xùn)練,可得相應(yīng)結(jié)點的權(quán)值與閾值,將2005-2009年9個指標的原始數(shù)據(jù)(檢測樣本)作為網(wǎng)絡(luò)的仿真輸入,得到最終預(yù)測結(jié)果,表1是1994-2009年中國糧食實際產(chǎn)量和神經(jīng)網(wǎng)絡(luò)方法模擬值對比分析結(jié)果。

從表1可以看出,訓(xùn)練樣本集中擬合精度平均相對誤差為0.47%,最大值為2004年的1.13%,模擬值和實際值的相關(guān)系數(shù)為0.996;檢測樣本集中,BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型得到的預(yù)測值和實際值具有較好的擬合效果,平均相對誤差為0.56%,最大相對誤差為1.11%,最小相對誤差僅為0.04%,模擬值和實際值的相關(guān)系數(shù)為0.994;2005-2009年的糧食產(chǎn)量預(yù)測值的相對誤差均較小。這種改進后的方法比較有效,利用該算法獲得的預(yù)測數(shù)據(jù)結(jié)果較好。

總之,由以上分析結(jié)果可以看出,無論是擬合精度還是預(yù)測5個獨立樣本,BP神經(jīng)網(wǎng)絡(luò)模型的精度都比較高。但從預(yù)測結(jié)果也可以看出,BP網(wǎng)絡(luò)模型方法預(yù)測的平均相對誤差為0.56%,平均預(yù)測精度仍有待提高。

4 小結(jié)與討論

針對中國糧食產(chǎn)量預(yù)測問題,將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于國家糧食安全預(yù)警系統(tǒng)中,采用1994-2004年的中國糧食產(chǎn)量和影響因子的歷史數(shù)據(jù)建立模型,利用2005-2009年的數(shù)據(jù)檢驗?zāi)P?,研究得出以下結(jié)論。

1)由于常規(guī)統(tǒng)計模型難以滿足糧食產(chǎn)量的預(yù)測要求,提出的改進BP算法較好地解決了神經(jīng)網(wǎng)絡(luò)收斂慢和易陷入局部極小值的問題,通過建立預(yù)測模型,運用該改進方法對中國糧食產(chǎn)量進行了預(yù)測,實例證明,運用基于Levenberg-Marquardt算法的改進BP神經(jīng)網(wǎng)絡(luò),無論從訓(xùn)練結(jié)果精度上還是在收斂性能上都表現(xiàn)出較好的效果,說明運用該方法來預(yù)測糧食產(chǎn)量是完全可行的,彌補了傳統(tǒng)BP算法的不足,提高了預(yù)測精度,加快了收斂速度,而且具有很好的外延性。

2)BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度高,預(yù)測值和實際產(chǎn)量的擬合性好。BP神經(jīng)網(wǎng)絡(luò)法允許原始的隨機數(shù)據(jù)或數(shù)據(jù)中含有較多的噪聲,這是它區(qū)別于其他模型的最大優(yōu)勢,因而任何能用傳統(tǒng)的模型分析或統(tǒng)計方法解決的問題,BP神經(jīng)網(wǎng)絡(luò)能處理得更好。在進行糧食產(chǎn)量預(yù)測時,BP神經(jīng)網(wǎng)絡(luò)法是一種非常理想的預(yù)測方法,但是在構(gòu)造神經(jīng)網(wǎng)絡(luò)的預(yù)測模型時,要注意正確選擇影響因素,不要漏掉對預(yù)測對象有重大影響的因素。

由于糧食產(chǎn)量受各種因素的影響,波動性較大,除了受到上述9種因素的影響外,在很大程度上還受國家宏觀政策、作物品種、耕作技術(shù)等因素的影響,如何更全面地將難以量化的因素也納入模型中進行考慮分析,從而不斷地改進預(yù)測模型、提高預(yù)測精度,是需要進一步研究的工作。

參考文獻:

[1] 和文超,師學(xué)義,鄧青云,等.土地利用規(guī)劃修編中糧食產(chǎn)量預(yù)測方法比較[J].農(nóng)業(yè)工程學(xué)報,2011,27(12):348-352.

[2] 周永生,肖玉歡,黃潤生. 基于多元線性回歸的廣西糧食產(chǎn)量預(yù)測[J]. 南方農(nóng)業(yè)學(xué)報,2011,42(9):1165-1167.

[3] 王巧華,文友先.基于BP神經(jīng)網(wǎng)絡(luò)的雞蛋大小分級方法研究[J].湖北農(nóng)業(yè)科學(xué),2005(1):97-99.

[4] 于平福,陸宇明,韋莉萍,等.基于小波廣義回歸神經(jīng)網(wǎng)絡(luò)的糧食產(chǎn)量預(yù)測模型[J].湖北農(nóng)業(yè)科學(xué),2011,50(10):2135-2137.

[5] 李紅平,魏振方,郭衛(wèi)霞.小麥白粉病的數(shù)學(xué)模型預(yù)測[J].湖北農(nóng)業(yè)科學(xué),2011,50(17):3611-3613.

[6] 李 艷,劉 軍.農(nóng)產(chǎn)品價格預(yù)測系統(tǒng)設(shè)計與實現(xiàn)[J].湖北農(nóng)業(yè)科學(xué),2011,50(14):2976-2978.

[7] 黃 華,黎未然.人工神經(jīng)網(wǎng)絡(luò)在柚皮總黃酮提取中的應(yīng)用[J].湖北農(nóng)業(yè)科學(xué),2011,50(10):2088-2091.

[8] 汪東升,李小昱,李 鵬,等.基于小波和神經(jīng)網(wǎng)絡(luò)的柴油機失火故障檢測[J].湖北農(nóng)業(yè)科學(xué),2011,50(15):3181-3183.

[9] 梁 丹,李小昱,李培武,等.近紅外光譜法對食用植物油品種的快速鑒別[J].湖北農(nóng)業(yè)科學(xué),2011,50(16):3383-3385.

[10] 吳澤鑫,李小昱,王 為,等. 基于近紅外光譜的番茄農(nóng)藥殘留無損檢測方法研究[J].湖北農(nóng)業(yè)科學(xué),2010,49(4):961-963.

[11] 章 英.基于收購質(zhì)量的烤煙煙葉無損檢測技術(shù)研究綜述[J].湖北農(nóng)業(yè)科學(xué),2011,50(7):1297-1300.

[12] 李 哲,李干瓊,董曉霞,等.農(nóng)產(chǎn)品市場價格短期預(yù)測研究進展[J]. 湖北農(nóng)業(yè)科學(xué),2011,50(17):3666-3675.

[13] 宰松梅,溫 季,仵 峰,等.基于灰色關(guān)聯(lián)分析的遼寧省糧食產(chǎn)量預(yù)測模型[J].節(jié)水灌溉,2011(5):64-66.

篇10

關(guān)鍵詞性能對比感知器BP網(wǎng)絡(luò)霍普菲爾德網(wǎng)絡(luò)字符識別

1引言

人工神經(jīng)網(wǎng)絡(luò)是在人類對其大腦神經(jīng)網(wǎng)絡(luò)認識理解的基礎(chǔ)上人工構(gòu)造的能夠?qū)崿F(xiàn)某種功能的神經(jīng)網(wǎng)絡(luò)。 它是理論化的人腦神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型,是基于模仿大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能而建立的一種信息處理系統(tǒng)。因其自組織、自學(xué)習(xí)能力以及具有信息的分布式存儲和并行處理,信息存儲與處理的合一等特點得到了廣泛的關(guān)注,已經(jīng)發(fā)展了上百種人工神經(jīng)網(wǎng)絡(luò)。

一般來說,人工神經(jīng)網(wǎng)絡(luò)從結(jié)構(gòu)上可分為兩種:前向網(wǎng)絡(luò)和反饋網(wǎng)絡(luò)。典型的前向網(wǎng)絡(luò)有單層感知器、BP網(wǎng)絡(luò)等,反饋網(wǎng)絡(luò)有霍普菲爾德網(wǎng)絡(luò)等[1]。

人工神經(jīng)網(wǎng)絡(luò)已經(jīng)被廣泛應(yīng)用于模式識別、信號處理、專家系統(tǒng)、優(yōu)化組合、智能控制等各個方面,其中采用人工神經(jīng)網(wǎng)絡(luò)進行模式識別具有一些傳統(tǒng)技術(shù)所沒有的優(yōu)點:良好的容錯能力[2j、分類能力、并行處理能力和自學(xué)習(xí)能力,并且其運行速度快,自適應(yīng)性能好,具有較高的分辨率。單層感知器、BP網(wǎng)絡(luò)和霍普菲爾德網(wǎng)絡(luò)均可以用于字符識別。

本文通過具體采用感知器網(wǎng)絡(luò)、BP網(wǎng)絡(luò)和霍普菲爾德反饋網(wǎng)絡(luò)對26個英文字母進行識別的應(yīng)用,通過實驗給出各自的識別出錯率,通過比較,可以看出這3種神經(jīng)網(wǎng)絡(luò)的識別能力以及各自的優(yōu)缺點。

2 字符識別問題描述與網(wǎng)絡(luò)識別前的預(yù)處理

字符識別在現(xiàn)代日常生活的應(yīng)用越來越廣泛,比如車輛牌照自動識別系統(tǒng)[3,4],手寫識別系統(tǒng)[5],辦公自動化等等[6]。畢業(yè)論文 本文采用單層感知器、BP網(wǎng)絡(luò)和霍普菲爾德網(wǎng)絡(luò)對26個英文字母進行識別。首先將待識別的26個字母中的每一個字母都通過長和寬分別為7×5的方格進行數(shù)字化處理,并用一個向量表示。其相應(yīng)有數(shù)據(jù)的位置置為1,其他位置置為O。圖1給出了字母A、B和C的數(shù)字化過程,其中最左邊的為字母A的數(shù)字化處理結(jié)果所得對應(yīng)的向量為:IetterA~「00100010100101010001111111000110001〕’,由此可得每個字母由35個元素組成一個向量。由26個標準字母組成的輸人向量被定義為一個輸人向量矩陣alphabet,即神經(jīng)網(wǎng)絡(luò)的樣本輸人為一個35×26的矩陣。其中alphabet=[letterA,letterB,lettere,……letterZj。網(wǎng)絡(luò)樣本輸出需要一個對26個輸人字母進行區(qū)分輸出向量,對于任意一個輸人字母,網(wǎng)絡(luò)輸出在字母對應(yīng)的順序位置上的值為1,其余為O,即網(wǎng)絡(luò)輸出矩陣為對角線上為1的26×26的單位陣,定義target=eye(26)。

本文共有兩類這樣的數(shù)據(jù)作為輸人:一類是理想的標準輸人信號;另一類是在標準輸人信號中加上用MATLAB工具箱里的噪聲信號,即randn函數(shù)。

3 識別字符的網(wǎng)絡(luò)設(shè)計及其實驗分析

3.1單層感知器的設(shè)計及其識別效果

選取網(wǎng)絡(luò)35個輸人節(jié)點和26個輸出節(jié)點,設(shè)置目標誤差為0.0001,最大訓(xùn)練次數(shù)為40。設(shè)計出的網(wǎng)絡(luò)使輸出矢量在正確的位置上輸出為1,在其他位置上輸出為O。醫(yī)學(xué)論文 首先用理想輸人信號訓(xùn)練網(wǎng)絡(luò),得到無噪聲訓(xùn)練結(jié)果,然后用兩組標準輸入矢量加上兩組帶有隨機噪聲的輸人矢量訓(xùn)練網(wǎng)絡(luò),這樣可以保證網(wǎng)絡(luò)同時具有對理想輸人和噪聲輸人分類的能力。網(wǎng)絡(luò)訓(xùn)練完后,為保證網(wǎng)絡(luò)能準確無誤地識別出理想的字符,再用無噪聲的標準輸入訓(xùn)練網(wǎng)絡(luò),最終得到有能力識別帶有噪聲輸人的網(wǎng)絡(luò)。下一步是對所設(shè)計的網(wǎng)絡(luò)進行性能測試:給網(wǎng)絡(luò)輸人任意字母,并在其上加人具有平均值從。~0.2的噪聲,隨機產(chǎn)生100個輸人矢量,分別對上述兩種網(wǎng)絡(luò)的字母識別出錯率進行實驗,結(jié)果如圖2所示。其中縱坐標所表示的識別出錯率是將實際輸出減去期望輸出所得的輸出矩陣中所有元素的絕對值和的一半再除以26得到的;虛線代表用無噪聲的標準輸人信號訓(xùn)練出網(wǎng)絡(luò)的出錯率,實線代表用有噪聲訓(xùn)練出網(wǎng)絡(luò)的出錯率。從圖中可以看出,無噪聲訓(xùn)練網(wǎng)絡(luò)對字符進行識別時,當字符一出現(xiàn)噪聲時,該網(wǎng)絡(luò)識別立刻出現(xiàn)錯誤;當噪聲均值超過0.02時,識別出錯率急劇上升,其最大出錯率達到21.5%。由此可見,無噪聲訓(xùn)練網(wǎng)絡(luò)識別幾乎沒有抗干擾能力。而有噪聲訓(xùn)練出的網(wǎng)絡(luò)具有一定的抗干擾能力,它在均值為。~0.06之間的噪聲環(huán)境下,能夠準確無誤地識別;其最大識別出錯率約為6.6%,遠遠小于無噪聲訓(xùn)練出的網(wǎng)絡(luò)。

3.2BP網(wǎng)絡(luò)的設(shè)計及其識別效果

該網(wǎng)絡(luò)設(shè)計方法在文獻[lj中有詳細介紹。網(wǎng)絡(luò)具有35個輸人節(jié)點和26個輸出節(jié)點。目標誤差為0.0001,采用輸人在(0,l)范圍內(nèi)對數(shù)S型激活函數(shù)兩層109519/109519網(wǎng)絡(luò),隱含層根據(jù)經(jīng)驗選取10個神經(jīng)元。和單層感知器一樣,分別用理想輸人信號和帶有隨機噪聲的輸人訓(xùn)練網(wǎng)絡(luò),得到有噪聲訓(xùn)練網(wǎng)絡(luò)和無噪聲訓(xùn)練網(wǎng)絡(luò)。由于噪聲輸人矢量可能會導(dǎo)致網(wǎng)絡(luò)的1或o輸出不正確,或出現(xiàn)其他值,所以為了使網(wǎng)絡(luò)具有抗干擾能力,在網(wǎng)絡(luò)訓(xùn)練后,再將其輸出經(jīng)過一層競爭網(wǎng)絡(luò)的處理,使網(wǎng)絡(luò)的輸出只在本列中的最大值的位t為1,保證在其他位置輸出為O,其中網(wǎng)絡(luò)的訓(xùn)練采用自適應(yīng)學(xué)習(xí)速率加附加動量法,在MATLAB工具箱中直接調(diào)用traingdx。在與單層感知器相同的測試條件下對網(wǎng)絡(luò)進行性能測試,結(jié)果如圖3所示。其中虛線代表用無噪聲訓(xùn)練網(wǎng)絡(luò)的出錯率,實線代表用有噪聲訓(xùn)練網(wǎng)絡(luò)的出錯率。從圖中可以看出,在均值為o一0.12之間的噪聲環(huán)境下,兩個網(wǎng)絡(luò)都能夠準確地進行識別。在0.12~0.15之間的噪聲環(huán)境下,由于噪聲幅度相對較小,待識別字符接近于理想字符,故無噪聲訓(xùn)練網(wǎng)絡(luò)的出錯率較有噪聲訓(xùn)練網(wǎng)絡(luò)略低。當所加的噪聲均值超過。.15時,待識別字符在噪聲作用下不再接近于理想字符,無噪聲訓(xùn)練網(wǎng)絡(luò)的出錯率急劇上升,此時有噪聲訓(xùn)練網(wǎng)絡(luò)的性能較優(yōu).

轉(zhuǎn)貼于 3.3離散型,霍普菲爾德網(wǎng)絡(luò)的設(shè)計及其識別效果

此時網(wǎng)絡(luò)輸人節(jié)點數(shù)目與輸出神經(jīng)元的數(shù)目是相等的,有r=s=35,采用正交化的權(quán)值設(shè)計方法。在MATLAB工具箱中可直接調(diào)用函數(shù)newh叩.m。要注意的是,由于調(diào)用函數(shù)newhoP.m,需要將輸人信號中所有的。英語論文 變換為一1。如letterA~[一1一11~1-1一11一11一l一11一11一11一1一1一11111111一l一l一111一1一1一11〕’。設(shè)計離散型霍普菲爾德網(wǎng)絡(luò)進行字符識別,只需要讓網(wǎng)絡(luò)記憶所要求的穩(wěn)定平衡點,即待識別的26個英文字母。故只需要用理想輸人信號來訓(xùn)練網(wǎng)絡(luò)。對于訓(xùn)練后的網(wǎng)絡(luò),我們進行性能測試。給網(wǎng)絡(luò)輸入任意字母,并在其上加人具有平均值從。~0.5的噪聲,隨機產(chǎn)生100個輸人矢量,觀察字母識別出錯率,結(jié)果如圖4所示。從圖中可以看出,在均值為0~0.33之間的噪聲環(huán)境下,網(wǎng)絡(luò)能夠準確地進行識別。在0.33~0.4之間的噪聲環(huán)境下,識別出錯率不到1%,在0.4以上的噪聲環(huán)境下,網(wǎng)絡(luò)識別出錯率急劇上升,最高達到大約10%??梢钥闯觯摼W(wǎng)絡(luò)穩(wěn)定點的吸引域大約在0.3~。.4之間。當噪聲均值在吸引域內(nèi)時,網(wǎng)絡(luò)進行字符識別時幾乎不出錯,而當噪聲均值超過吸引域時,網(wǎng)絡(luò)出錯率急劇上升。

4結(jié)論

本文設(shè)計了3種人工神經(jīng)網(wǎng)絡(luò)對26個英文字母進行了識別。可以看出,這3種人工神經(jīng)網(wǎng)絡(luò)均能有效地進行字符識別,并且識別速度快,自適應(yīng)性能好,分辨率較高。由圖2和圖3可以看出,單層感知器的有噪聲訓(xùn)練網(wǎng)絡(luò)在均值為O~0.06之間的噪聲環(huán)境下可以準確無誤的識別,而有噪聲訓(xùn)練的BP網(wǎng)絡(luò)可以在o~0.12之間的噪聲環(huán)境下準確無誤的識別,故BP絡(luò)網(wǎng)絡(luò)容錯性比單層感知器的容錯性好;此外,噪聲達到0.2時,單層感知器的有噪聲訓(xùn)練網(wǎng)絡(luò)的識別出錯率為6.6%,而有噪聲訓(xùn)練的BP網(wǎng)絡(luò)的識別出錯率為2.1%,故BP網(wǎng)絡(luò)比單層感知器識別能力強。另外,由圖2、圖3和圖4可以看出,這3種網(wǎng)絡(luò)中霍普菲爾德網(wǎng)絡(luò)識別率最高,它在噪聲為0.33以前幾乎不會出錯,BP網(wǎng)絡(luò)次之,感知器最差。

通過設(shè)計、應(yīng)用與性能對比,我們可得單層感知器網(wǎng)絡(luò)結(jié)構(gòu)和算法都很簡單,訓(xùn)練時間短,但識別出錯率較高,容錯性也較差。BP網(wǎng)絡(luò)結(jié)構(gòu)和算法比單層感知器結(jié)構(gòu)稍復(fù)雜,但其識別率和容錯性都較好。霍普菲爾德網(wǎng)絡(luò)具有設(shè)計簡單且容錯性最好的雙重優(yōu)點。因此,我們應(yīng)根據(jù)網(wǎng)絡(luò)的特點以及實際要求來選擇人工神經(jīng)網(wǎng)絡(luò)對字符進行識別。 參考文獻

[1]叢爽.面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用「M.合肥:中國科學(xué)技術(shù)大學(xué)出版社,2003.

[2]武強,童學(xué)鋒,季雋.基于人工神經(jīng)網(wǎng)絡(luò)的數(shù)字字符識別[J].計算機工程,2003,29(14):112一113.

[3]廖翔云,許錦標,龔仕偉.車牌識別技術(shù)研究[J].徽機發(fā)展,2003,13:30一35.

[4]李中凱,王效岳,魏修亭.BP網(wǎng)絡(luò)在汽車牌照字符識別中的應(yīng)用[J].東理工大學(xué)學(xué)報,2004,18(4):69一72.