神經(jīng)網(wǎng)絡(luò)的基本概念范文
時間:2024-04-01 18:17:41
導語:如何才能寫好一篇神經(jīng)網(wǎng)絡(luò)的基本概念,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞: Hopfield神經(jīng)網(wǎng)絡(luò); 二值矩陣; OSTU算法;識別率
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2013)21-4925-04
1 原理概述
1.1 Hopfield網(wǎng)絡(luò)的拓撲結(jié)構(gòu)
Hopfield最早提出的網(wǎng)絡(luò)是二值神經(jīng)網(wǎng)絡(luò),神經(jīng)元的輸出只取1和-1,所以也稱離散神經(jīng)網(wǎng)絡(luò)(DHNN,Discrete Hopfield Neural Network)。在離散Hopfield網(wǎng)絡(luò)中,所采用的神經(jīng)元是二值神經(jīng)元,因此,所輸出的離散值1和-1分別表示神經(jīng)元處于激活和抑制狀態(tài)。
5 結(jié)束語
本文在前人研究成果的基礎(chǔ)上改進了對字符進行識別的算法,通過對大量隨機圖的仿真計算,最終的實驗結(jié)果表明,離散型Hopfield神經(jīng)元網(wǎng)絡(luò)能有效地進行字符識別,并且識別速度快,自適應(yīng)性能好,分辨率較高。通過實驗驗證,本算法達到了一定的識別率,能在實際生活中得到應(yīng)用,但也存在一些缺點和不足,如對訓練樣本和識別樣本有一定的限制(盡管是為了方便訓練和識別),且神經(jīng)網(wǎng)絡(luò)的設(shè)計方法在理論上還不是很完善,因此,還有待提取出新的方法,進一步提高識別率,識別系統(tǒng)的性能關(guān)鍵與瓶頸仍然在于字符識別的核心算法性能上,最終目標是研究零誤識率和低拒識率的高速識別算法。當然,我們也可以把此神經(jīng)網(wǎng)絡(luò)的原理運用在其他的領(lǐng)域,以檢驗其算法的有效性。
參考文獻:
[1] Matlab中文論壇.MATLAB神經(jīng)網(wǎng)絡(luò)30個案例分析[M].北京航空航天大學出版社,2009.
[2] 許錄平.數(shù)字圖像處理[M].科學出版社,2007.[3] 張良均,曹晶,蔣世忠.神經(jīng)網(wǎng)絡(luò)實用教程[M].機械工業(yè)出版社,2008.[4] 張宏林.數(shù)字圖像模式識別技術(shù)及工程實踐[M].人民郵電出版社,2004.[5] 鄧麗華,崔志強,張靜.基于人工神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別[J].三峽大學學報,2005(6):255-256.
篇2
【關(guān)鍵詞】BP神經(jīng)網(wǎng)絡(luò) 高職 學生 體質(zhì) 綜合評價 應(yīng)用
【中圖分類號】 G 【文獻標識碼】A
【文章編號】0450-9889(2014)02C-0156-03
體質(zhì),是指在遺傳性和獲得性的基礎(chǔ)上表現(xiàn)出來的人體形態(tài)結(jié)構(gòu)、生理功能和心理因素的綜合的、相對穩(wěn)定的特征。對學生體質(zhì)進行綜合評價,是一項復雜的工作。建立健全學生的體質(zhì)評價體系,科學地評價學生的體質(zhì)狀況,引導學生進行有針對性的體育鍛煉,對提高學生的身體素質(zhì)將起到十分重要的作用。當前,數(shù)據(jù)挖掘技術(shù)在各領(lǐng)域的應(yīng)用研究已取得很大的進展,而在學生身體素質(zhì)方面的應(yīng)用卻很少?;诖耍疚奶接態(tài)P神經(jīng)網(wǎng)絡(luò)在高職學生體質(zhì)綜合評價中的應(yīng)用。
一、影響學生體質(zhì)的指標分析
體質(zhì)綜合評價是體育界研究健康問題的一個領(lǐng)域,它由人體的骨骼形態(tài)、身體機能、身體的綜合素質(zhì)和人體所具備的運動能力等一系列綜合因素組成。這些綜合因素又可以通過若干個相互聯(lián)系、相互制約的數(shù)據(jù)指標體系來反映。學生的體質(zhì),除先天因素外,后天合理、系統(tǒng)、科學的運動訓練是必不可少的。對學生體質(zhì)進行監(jiān)測,指標的選取是一個很重要的因素。本文根據(jù)現(xiàn)試行的《大學生體質(zhì)健康標準》,采用身體形態(tài)、身體機能和運動能力3個方面對學生的體質(zhì)健康進行綜合評價。其中,身體形態(tài)用克托萊指數(shù)(體重/身高×1000)表示,該指標能有效地反映人體形態(tài)發(fā)育水平和勻稱程度。身體機能采用肺活量―體重指數(shù)和臺階試驗指數(shù)。肺活量―體重指數(shù)指標反映每千克體重肺活量的大小,即每1kg體重的肺活量的相對值來反映肺活量與體重的相關(guān)程度,從而能比較客觀地對不同年齡、性別的個體與群體進行定量比較分析。臺階試驗指標則通過有節(jié)律的登臺階運動持續(xù)時間(s)與恢復期測定的脈搏次數(shù)相應(yīng)的比值來評價人體心血管功能,該指標反映學生的心血管系統(tǒng)功能,并間接推斷機體的耐力。本文采用的是中國改良臺階試驗,這兩個指標都是越趨于極值表示其身體機能越好。運動能力用立定跳遠、50米跑和引體向上表示。立定跳遠能體現(xiàn)人體在運動中的靈敏度,50米短跑表現(xiàn)人體在運動中的速度,引體向上能體現(xiàn)人體的靜力性力量。各要素之間密切相關(guān),互相制約,又互相影響,是不可分割的整體。通過以上分析,可得本文所用學生體質(zhì)健康評價指標體系,詳見表1。
表1 高職學生體質(zhì)健康評價指標體系
項目 評價指標
身體形態(tài) 克托萊指數(shù)
身體機能 肺活量―體重指數(shù)
臺階試驗
運動能力 立定跳遠
50米跑
引體向上
二、BP神經(jīng)網(wǎng)絡(luò)的基本概念
BP神經(jīng)網(wǎng)絡(luò)是一種對可微分非線性函數(shù)進行權(quán)值訓練的多層前饋網(wǎng)絡(luò),其基本結(jié)構(gòu)如圖1所示。
輸入層 隱藏層 輸出層
圖1 BP神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
從圖1可以看到,BP神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)是一個前向的多層網(wǎng)絡(luò),該網(wǎng)絡(luò)由輸入層、輸出層以及一層或多層的隱藏層組成。BP網(wǎng)絡(luò)的輸出yk可以用公式描述為:
(1)
其中,Xj為輸入信號,Wkj為網(wǎng)絡(luò)的權(quán)值,θk為網(wǎng)絡(luò)的閾值,為 網(wǎng)絡(luò)的激活函數(shù),k,j∈[1,n]。
在BP網(wǎng)絡(luò)中,同層的各神經(jīng)元之間互不連接,相鄰層的神經(jīng)元則通過權(quán)值連接。BP網(wǎng)絡(luò)的學習過程由兩部分組成:一是信息的正向傳播;二是信息的誤差反向傳播。在信息的正向傳播過程中,輸入的信息Xj經(jīng)隱含層單元逐層處理,最終由輸出層輸出。在這個信息的傳播過程中,每一層神經(jīng)元只對緊連接它的下一層神經(jīng)元的狀態(tài)產(chǎn)生影響。如果網(wǎng)絡(luò)的輸出yk與實際期望的輸出產(chǎn)生的誤差E達不到預先設(shè)定的要求,此時,BP網(wǎng)絡(luò)轉(zhuǎn)入信息反向傳播階段。算法將誤差信號沿原來的連接通路反傳回來,并修正各層連接權(quán)值和閾值,直到網(wǎng)絡(luò)的輸出達到預期目標。
三、BP神經(jīng)網(wǎng)絡(luò)在高職學生體質(zhì)綜合評價中的具體應(yīng)用
(一)數(shù)據(jù)的采集。這里以某高校為例,由于男生、女生個體之間的差異,為了簡化問題,本文選取2006~2008年大一的男生共8500人按表1所列指標進行各項測試。在測試過程中,遵循先靜止后運動的測試原則,在測試時各項目之間留有一定的間隔,從而使學生的體力與機能得到完全恢復,以保證學生能以最佳狀態(tài)參加測試。測試完成后,組織10個一線的、長期從事學生體質(zhì)評測的體育教師對測試所得數(shù)據(jù)進行評測,所用評語為優(yōu)、良、中、差4個等級。為了便于BP神經(jīng)網(wǎng)絡(luò)的處理,將4個評價等級轉(zhuǎn)換為相應(yīng)的二進制數(shù)值,如表2所示。收集到的原始測試數(shù)據(jù)如表3所示。
表2 評語等級對應(yīng)的分值標準
評語等級 對應(yīng)的分值
優(yōu) 1000
良 0100
中 0010
差 0001
表3 高職學生體質(zhì)測試原始數(shù)據(jù)(部分)
序號 克托萊指數(shù)(kg/cm×1000) 肺活量―體重指數(shù)(ml/kg) 臺階試驗 立定跳遠 50米跑(秒) 引體向上 綜合評價
1 352 90 78 2.45 7”3 16 良
2 318 73 65 2.39 7”7 13 差
3 372 81 83 2.61 7”1 13 優(yōu)
4 349 61 81 2.52 7”2 8 中
5 356 87 89 2.63 6”7 11 優(yōu)
6 323 73 73 2.39 7”6 12 中
7 367 79 85 2.61 7”2 11 良
8 373 75 82 2.46 6”9 15 優(yōu)
9 326 83 69 2.39 7”7 11 中
(二)網(wǎng)絡(luò)的訓練過程。BP神經(jīng)網(wǎng)絡(luò)處理的是[0,1]范圍內(nèi)的數(shù)值,但是從表3學生體質(zhì)測試的原始數(shù)據(jù)中可以看出,各評測指標所得數(shù)據(jù)差別較大,且屬性的取值多是大于1。因此,必須將這些數(shù)據(jù)轉(zhuǎn)化為[0,1]之間的數(shù)據(jù)。所用歸一化公式為:
(2)
其中,X是所收集的一組數(shù)據(jù),MIX(X)和MIN(X)分別是這組數(shù)據(jù)的最大值和最小值,是映射后的數(shù)據(jù)。經(jīng)過歸一化后的數(shù)據(jù)如表4所示。
表4 高職學生體質(zhì)測試歸一化數(shù)據(jù)(部分)
序號 克托萊指數(shù)(kg/cm×1000) 肺活量―體重指數(shù)(ml/kg) 臺階試驗 立定跳遠 50米跑(秒) 引體向上 綜合評價
1 0.6182 1 0.5417 0.25 0.6 1 良
2 0 0.4138 0 0 1 0.625 差
3 0.9818 0.6897 0.75 0.9167 0.4 0.625 優(yōu)
4 0.5636 0 0.6667 0.5417 0.5 0 中
5 0.6909 0.8966 1 1 0 0.375 優(yōu)
6 0.0909 0.4138 0.3333 0 0.9 0.5 中
7 0.8909 0.6207 0.8333 0.9167 0.5 0.375 良
8 1 0.4826 0.7083 0.2917 0.2 0.875 優(yōu)
9 0.1455 0.7586 0.1667 0 1 0.375 中
取2006、2007年的學生數(shù)據(jù)共6500筆作為訓練網(wǎng)絡(luò)用,余下的數(shù)據(jù)作為測試數(shù)據(jù)。
關(guān)于隱含層節(jié)點數(shù)的選擇是一個十分復雜的問題,隱層神經(jīng)元數(shù)目的選擇對BP神經(jīng)網(wǎng)絡(luò)的性能影響較大。如果網(wǎng)絡(luò)隱層神經(jīng)元數(shù)量過少,則網(wǎng)絡(luò)所能獲取的用以解決問題的信息太少;如果隱層神經(jīng)元數(shù)量過多,增加了網(wǎng)絡(luò)的訓練時間,甚至還會出現(xiàn)網(wǎng)絡(luò)過度匹配現(xiàn)象。實踐證明,隱層神經(jīng)元個數(shù)n2和輸入層個數(shù)n1之間有以下近似關(guān)系:
n2+2n1+1 (3)
因此,本文采用三層BP網(wǎng)絡(luò)來進行建模。
從表4的數(shù)據(jù)可知,本例的BP網(wǎng)絡(luò)有6個輸入層,1個輸出層。根據(jù)公式(3)可求出BP網(wǎng)絡(luò)的隱層神經(jīng)元個數(shù)為13。雖然有公式(3)作為指導,但BP網(wǎng)絡(luò)隱層的神經(jīng)元個數(shù)并非一成不變。在BP網(wǎng)絡(luò)的訓練過程中,需要對同一樣本集采用不同隱層節(jié)點數(shù)的網(wǎng)絡(luò)進行訓練,直到網(wǎng)絡(luò)輸出穩(wěn)定為止。最后,根據(jù)BP網(wǎng)絡(luò)的測試結(jié)果,把網(wǎng)絡(luò)輸出誤差最小的隱層節(jié)點數(shù)確定為該BP網(wǎng)絡(luò)的最佳隱節(jié)點數(shù)。經(jīng)過對同一樣本集的多次測試,本例的BP網(wǎng)絡(luò)最終確定的隱層節(jié)點數(shù)為11。實驗采用的軟件環(huán)境為matlab7,采用S型正切函數(shù)tan sig作為本實驗的網(wǎng)絡(luò)中間層傳遞函數(shù)。由于實驗中數(shù)據(jù)的輸出模式為0~1,因此采用S型的對數(shù)函數(shù)log sig作為輸出層的傳遞函數(shù)。其余訓練參數(shù)的設(shè)定如表5所示。
表5 訓練參數(shù)
訓練次數(shù) 訓練目標 學習速率
1000 0.01 0.1
經(jīng)過242次訓練后,網(wǎng)絡(luò)的性能就達到了要求,如圖2所示。
圖2 訓練結(jié)果
接下來需要對訓練好的網(wǎng)絡(luò)進行測試。隨機抽取3筆2009級大一學生的測試數(shù)據(jù)進行測試,結(jié)果如表6所示。
表6 抽樣數(shù)據(jù)測試結(jié)果
序號 BP神經(jīng)網(wǎng)絡(luò)測試結(jié)果 實際情況
1 0.0327 0.9796 0.0125 0.0001 良
2 0.0000 0.0001 0.9611 0.0321 中
3 0.9840 0.0000 0.0150 0.0001 優(yōu)
(三)結(jié)果分析。從表6的結(jié)果來看,抽樣數(shù)據(jù)的測試結(jié)果和實際值相互吻合。把該網(wǎng)絡(luò)模型用于2009級大一男生的體質(zhì)健康綜合評測中,有效率為96.3%,完全能滿足應(yīng)用要求。
綜上所述,目前《學生體質(zhì)健康標準》實施工作的重點在數(shù)量,難點在質(zhì)量。本文采用BP神經(jīng)網(wǎng)絡(luò)對高職學生的體質(zhì)進行綜合評價是一次新的嘗試,有利于更科學地對(下轉(zhuǎn)第163頁)(上接第157頁)學生的體質(zhì)進行綜合評價,從而更好地把握學生的健康狀況,為學生今后的學習和工作打下良好的基礎(chǔ)。該模型的應(yīng)用對于縱向研究大學生的體質(zhì)發(fā)展態(tài)勢和體質(zhì)等級的方法更具有現(xiàn)實意義。
【參考文獻】
[1]陳明達,于道中.實用體質(zhì)學[M].北京:北京醫(yī)科大學、中國協(xié)和醫(yī)科大學聯(lián)合出版社,1993
[2]王童,徐明欣,李瑞年.大學生體質(zhì)等級綜合評定判別分類的方法[J].天津體育學院學報,2005(2)
[3]孫文爽.體質(zhì)的綜合評價方法[J].楚雄師專學報,2001(3)
[4]S Horikawa.On fuzzy modelling using fuzzy nerual networks with BP algorithm.IEEE Trans[J].nerual Networks, 1992(2)
[5]包健,趙建勇,周華英.基于BP網(wǎng)絡(luò)曲線擬合方法的研究[J].計算機工程與設(shè)計,2005(7)
[6]韋萌.BP神經(jīng)網(wǎng)絡(luò)在高校教學實驗室綜合評價中的應(yīng)用[J].柳州職業(yè)技術(shù)學院學報,2010(1)
[7]王秀春,智會強,毛一之,等.多宗量導熱反問題求解的神經(jīng)網(wǎng)絡(luò)法[J].航空動力學報,2004(4)
[8]張志立,程磊,何敏.基于人工神經(jīng)網(wǎng)絡(luò)的煤與瓦斯突出檢測[J].礦業(yè)安全與環(huán)保,2005(6)
[9]French M.N. etal.Rainfall forecasting in space and time using a neural networks[J].J.of hydrol,1992(7)
【基金項目】2012年度廣西高等教育教學改革工程項目(2012JGA322)
篇3
關(guān)鍵詞:函數(shù)依賴;屬性依賴;屬性空間;高維映射;復合型神經(jīng)網(wǎng)絡(luò)
中圖分類號: TP138
文獻標志碼:A
Attribute dependency theory and its application on neural network
FANG Liang-da1, YU Yong-quan1,2
(
1. Faculty of Computer, Guangdong University of Technology, Guangzhou Guangdong 510090, China;
2. Department of Computer Science, Guangdong Baiyun University, Guangzhou Guangdong 510450, China
)
Abstract:
Neural network optimization methods are generally confined to learning algorithms and input attributes. Due to the higher dimensional mapping which neural network fits contains complex intrinsic attribute dependencies. And the traditional optimization methods have not conducted the analytical study to it. The article puts forward the attribute dependency theory based on functional dependency theory and elaborates the definition of the attribute dependency theory and infers its theorem. Combining with the RBF neural network, it proposes a new neural network optimization method based attribute dependency theory (ADO-RBF).
Neural network optimization methods are generally confined to learning algorithms and input attributes. Due to the high-dimensional mapping that neural network fits contains complex intrinsic attribute dependencies, the traditional optimization methods have not conducted the analytical study on it. The article put forward the attribute dependency theory based on functional dependency theory, elaborated the definition of the attribute dependency theory, and proved related theorem. Combining the Radius Basis Function (RBF) neural network, a new neural network optimization method based on attribute dependency theory (ADO-RBF) was proposed.
Key words:
functional dependency; attribute dependency; attribute space; high-dimensional mapping; composite neural network
0 引言
由于神經(jīng)網(wǎng)絡(luò)的自學習能力,使得神經(jīng)網(wǎng)絡(luò)在低維空間的映射逼近能力較強,并且逐步地代替數(shù)學公式來擬合低維空間上的函數(shù)。但是,隨著社會的發(fā)展需要,高維空間上的映射擬合已經(jīng)成為了人工智能的重要研究方向之一,并且在這方面已經(jīng)取得許多研究成果。例如,文獻[1-3]基于改進神經(jīng)網(wǎng)絡(luò)的參數(shù)的學習公式的思想,分別提出了結(jié)構(gòu)簡單的分式線性神經(jīng)網(wǎng)絡(luò)、SEFNN學習算法和多目標微粒群學習算法,為神經(jīng)網(wǎng)絡(luò)的精確性和復雜性的尋優(yōu)問題提供了一種新的解決方法。文獻[4] 提出了基于Hebb規(guī)則的分布式神經(jīng)網(wǎng)絡(luò)學習算法。文獻[5-9]基于神經(jīng)網(wǎng)絡(luò)集成方法,提出了各種改善多個神經(jīng)網(wǎng)絡(luò)集成結(jié)構(gòu)的方法,提高神經(jīng)網(wǎng)絡(luò)的泛化能力與仿真精度。文獻[10]基于改進神經(jīng)網(wǎng)絡(luò)的內(nèi)部神經(jīng)元,提出了一種分式過程神經(jīng)元網(wǎng)絡(luò),該模型是基于有理式函數(shù)具有的對復雜過程信號的逼近性質(zhì)和過程神經(jīng)元網(wǎng)絡(luò)對時變信息的非線性變換機制構(gòu)建的,其基本信息處理單元由兩個過程神經(jīng)元成對偶組成,邏輯上構(gòu)成一個分式過程神經(jīng)元,是人工神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)和信息處理機制上的一種擴展。文獻[11]中提出一種基于主成分分析和神經(jīng)網(wǎng)絡(luò)的高維映射擬合方法,利用主成分分析法提取樣本中的輸入維度主成分,實現(xiàn)樣本的輸入維度的最優(yōu)壓縮,有效減少輸入層神經(jīng)元個數(shù),提高神經(jīng)網(wǎng)絡(luò)的學習速度和擬合精度。文獻[12]提出了一種基于人工免疫原理的徑向基網(wǎng)絡(luò)函數(shù)映射模型,使用新的克隆選擇算法和免疫抑制策略,通過中間層可行解的抽取算法EAHLFS,能在聚類數(shù)目未知的情況下,生成徑向基網(wǎng)絡(luò)的中間層,與傳統(tǒng)的基于聚類算法的徑向基神經(jīng)網(wǎng)絡(luò)函數(shù)映射模型比較,AIP-RBF具有更快的收斂速度和更高的求解精度。文獻[13]提出了高維多輸入分層神經(jīng)網(wǎng)絡(luò),將一部分輸入節(jié)點移至其某些隱層,減少連接權(quán)值,能夠在同樣的時間內(nèi)達到比原神經(jīng)網(wǎng)絡(luò)更好的學習效果。
但是,上述文獻僅僅從學習算法、集成網(wǎng)絡(luò)方面對神經(jīng)網(wǎng)絡(luò)進行改進,并沒有考慮從樣本數(shù)據(jù)中的各類屬性對內(nèi)部網(wǎng)絡(luò)結(jié)構(gòu)進行優(yōu)化。本文結(jié)合樣本中各類屬性之間的關(guān)系,通過對函數(shù)依賴理論的分析與研究,提出了屬性依賴理論,并在此理論基礎(chǔ)上,提出一種新的神經(jīng)網(wǎng)絡(luò)優(yōu)化方法ADO-RBF。
1 屬性依賴的基本理論
1.1 映射及其屬性的基本概念
定義1 設(shè)X(xi∈X)和Y(yj∈Y)是兩組屬性的集合,如果存在某種對應(yīng)法則f,對于X中的任何一個元素,在Y中都有唯一的元素和它對應(yīng),這樣的對應(yīng)f叫作從集合X到集合Y的映射,記作Y=f(X)[14]。當X,Y都屬于高維屬性集合時, f稱為從集合X到集合Y的高維映射。
其中xi為該映射的外輸入屬性,yj為外輸出屬性。為了方便表示,設(shè)Xi={xi},Yj={yj},稱為單元屬性集。
由于在高維映射中存在各種子映射。例如定義1中的Y=f(X)包含了Yj=fj(X)(YjY,fj∈f)。所以存在子映射,使得輸出屬性yj作為該映射的輸入屬性。
1.2 屬性依賴的基本概念
在數(shù)據(jù)庫領(lǐng)域中,E.F.Codd給出了函數(shù)依賴的定義[15],但是他只定義了屬性之間是否存在依賴關(guān)系,卻沒有定義兩者之間的依賴關(guān)系程度。本文在此基礎(chǔ)上,給出高維空間中數(shù)據(jù)之間的依賴關(guān)系程度的定義。
定義2 設(shè)S為樣本空間的屬性集合,X和Y是S中的任意子集,存在某種映射f,使得Y=f(X)成立,則稱Y屬性依賴于X,或者X屬性決定Y (記作XY)。
定義3 當XY且YX,則稱XY是非平凡的屬性依賴。
定義4 當XY且YX,則稱XY是平凡的屬性依賴。
注意:若不特別聲明,則討論的XY是非平凡的屬性依賴。
定義5 屬性空間(Ω,F,μ)是一個總測度為1的測度空間,即μ(Ω)=1。
其中Ω是一個非空屬性集合,稱作屬性空間。
F是屬性空間Ω的冪集的一個非空子集,F的集合元素也是一個屬性集合,并且滿足以下條件:
1) Ω∈F;
2) 若Xn∈F,n=1,2,…,則∪∞n=1Xn∈F
μ稱為屬性測度,是一個從屬性集合F到[0,1]的函數(shù),μ:F[0,1]。每個屬性集都被此函數(shù)賦予一個0~1的數(shù)值,且μΩ(Ω)=1。
┑4期 攪即锏:屬性依賴理論及其在神經(jīng)網(wǎng)絡(luò)中的應(yīng)用
┆撲慊應(yīng)用 ┑30卷
定義6 如果XY,且存在直接映射f,使得Y=f(X)成立,則稱Y直接屬性依賴于X(記作XDY),并且稱d(X,Y)為XDY的直接屬性依賴度,其取值范圍為[0,1]。
其中,當d(X,Y)=0時,X\DY;當d(X,Y)=1時,稱Y完全直接屬性依賴于X(記作XFDY);當0
在屬性依賴中,存在最小直接依賴集Z,使得ZFDY。即對于Z的任意非空真子集Zi(即ZiZ,Zi≠),都使得ZiPDY成立。其中(Z,X,μ)為屬性空間,而d(X,Y)=μZ(X)。
直接屬性依賴度函數(shù)滿足下列條件。
1)非負性。對于任意兩個屬性集合X和Y,有d(X,Y)≥0。
2)規(guī)范性。如果Y完全直接屬性依賴X,則d(X,Y)=1。
3)左側(cè)可加性。設(shè)X1,X2,…,Xn是兩兩互無交集的屬性集合,即i,j≤n,i≠j,Xi∩Xj=,則有:
d(∪ni=1Xi,Y)=∑ni=1d(Xi,Y)(1)
4)右側(cè)可乘性。設(shè)Y1,Y2,…,Yn是兩兩互無交集的屬性集合,即i,j≤n,i≠j,Yi∩Yj=,則有:
d(X,∪ni=1Yi)=∏ni=1d(X,Yi)(2)
由直接屬性依賴的定義,可以推出直接屬性依賴的一些重要定理。
定理1 當Y≠潦,d(,Y)=0。
證明 令Xn=(n=1,2,…),則∪ni=1Xi=,且i,j∈N,i≠j,Xi∩Xj=,由左側(cè)可列可加性(1)可得:
d(,Y)=d(∪ni=1Xi,Y)=∑ni=1d(Xi,Y)=∑ni=1d(,Y)
由于d(X,Y)≥0,故由上式可知當Y≠潦,d(,Y)=0。
定理2 d(X,)=1。
證明 令Yn=(n=1,2,…),則∪ni=1Yi=,且i,j∈N,i≠j,Yi∩Yj=,由右側(cè)可列可加性(2)得:
d(X,)=d(X,∪ni=1Yi)=∏ni=1d(X,Yi)=∏ni=1d(X,)
由于d(X,Y)≤1,故由上式可知d(X,)=1。
從定理1、2可以看出:當左側(cè)屬性集合為空時,左側(cè)屬性無法直接決定右側(cè)屬性;當右側(cè)屬性集合為空時,任意左側(cè)屬性集合(包括空屬性集)都可以直接決定右側(cè)屬性。
定理3 設(shè)X,Y,Z是屬性集合,若XY,則有:
d(Y-X,Z)=d(Y,Z)-d(X,Z)(3)
d(X,Z)≤d(Y,Z)(4)
證明 由XY可得Y=X∪(Y-X),且X∩(Y-X)=,再由條件3)可得:
d(Y-Z,Z)=d(Y,Z)-d(X,Z)
式(3)得證。
又由定義5,可得d(Y-X,Z)≥0,因此:
d(X,Z)≤d(Y,Z)
式(4)得證。
證畢。
定理4 設(shè)X,Y,Z是屬性集合,若YZ,則有:
d(X,Z-Y)=d(X,Z)d(X,Y)(5)
d(X,Y)≥d(X,Z)(6)
證明 由XY可得Y=X∪(Y-X),且X∩(Y-X)=,再由條件4)可得:
d(X,Z-Y)=d(X,Z)d(X,Y)
式(5)得證。
又由定義5,可知0≤d(Y-X,Z)≤1,所以:
d(X,Y)≥d(X,Z)
式(6)得證。
證畢。
定理5 d(X∪Y,Z)=d(X,Z)+d(Y,Z)-d(X∩Y,Z),當X∪Y=潦,d(X∪Y,Z)=d(X,Z)+d(Y,Z)。
證明 因X∪Y=X∪(Y-X∩Y),且X∩(Y-X∩Y)=,X∩YY,故由條件3)與定理3得:
d(X∪Y,Z)=d(X,Z)+d(Y-X∩Y,Z)=d(X,Z)+
d(Y,Z)-d(X∩Y,Z)
證畢。
定理6 d(X,Y∪Z)=d(X,Y)•d(X,Z)d(X,Y∩Z),
當Y∪Z=潦,d(X,Y∪Z)=d(X,Y)•d(X,Z)。
證明 因Y∪Z=Y∪(Z-Y∩Z),且Y∩(Z-Y∩Z)=,Y∩ZZ,故由條件4)與定理4得:
d(X,Y∪Z)=d(X,Y)•d(X,Z-Y∩Z)=
d(X,Y)•d(X,Z)d(X,Y∩Z)
定義7 當XDY,YDZ,且Y∩X=,Y∩Z=,則稱Z的Y一階傳遞屬性依賴于X(記作XT(1)YZ),并且稱tY(X,Z)為XT(1)YZ的Y一階傳遞屬性依賴度,其取值范圍為[0,1]。
其中:
t(1)Y(X,Z)=d(X,Y)•d(Y,Z)(7)
定理8 當Y∪T=潦,t(1)Y∪T(X,Z)=d(X,Y)•d(X,T)•[d(Y,Z)+d(T,Z)]。
證明 由式(3)可得,t(1)Y∪T(X,Z)=d(X,Y∪T)•d(Y∪T,Z);
再由定理1和2,得出t(1)Y∪T(X,Z)=d(X,Y)•d(X,T)•[d(Y,Z)+d(T,Z)]。
證畢。
定理9 當Y∪T=潦,t(1)Y∪T(X,Z)≤t(1)Y(X,Z)+t(1)T(X,Z)。
證明 由定理8和定義6可得:
t(1)Y∪T(X,Z)=d(X,Y)•d(X,T)•[d(Y,Z)+d(T,Z)]t(1)Y(X,Z)=d(X,Y)•d(Y,Z)
由于d(X,Y),d(X,T),d(Y,Z),d(T,Z)≤1
所以t(1)Y∪T(X,Z)≤t(1)Y(X,Z)+t(1)T(X,Z)
證畢。
定義8 對于所有Y=∪ni=1Yi,如果存在XDYi,YiDZ,Yi(Yi∩X=,Yi∩Z=),則稱Z一階傳遞屬性依賴于X,并且稱t(1)┆sum(X,Z)(簡寫為t(1)(X,Z))為XT(1)Z的一階傳遞屬性依賴度,其取值范圍為[0,1],其公式如下:
t(1)(X,Z)=d(X,∪ni=1Yi)•d(∪ni=1Yi,Z)(8)
當t(X,Z)=0時,X\TZ;當t(X,Z)=1時,稱Z完全一階傳遞屬性依賴于X(記作XFT(1)Z);當t
定義9 對于Y(Yi,YjY,Yi∩Yj=,Yi∩X=,Yi∩Z=),如果存在某一種排列p1,p2,…,pn(pi,pj∈{1,2,…,n},pi≠pj),使得XDYp1,Yp2DYp3,…,Ypn-1DYpn,YpnDZ,則稱Z n階傳遞屬性依賴于X,并且稱t(n)┆sum(X,Z)(簡寫為t(n)(X,Z))為XTZ的n階傳遞屬性依賴度,其取值范圍為[0,1],其公式如下:
t(n)(X,Z)=∑nk=1[∏nj=1d(X,Yj)•∏ni=1,i≠j,i≠kd(Yi,Yi+1)•
d(Yk,Z)]當t(X,Z)=0時,X\T(n)Z;當t(X,Z)=1時,稱Z完全n階傳遞屬性依賴于X(記作XFT(n)Z);當t
顯然,XDY等價于Y 0階傳遞屬性依賴于X,其d(X,Y)為XT(0)Z的0階傳遞依賴度。
1.3 復雜高維映射及屬性依賴
從客觀世界分析所得,一般的高維映射不僅僅是簡單的多維輸入對應(yīng)多維輸出的關(guān)系,而更多的是映射中的屬性之間也存在依賴關(guān)系。其情況分別如下(以下例子假設(shè)基本初等函數(shù)與一次的四則運算[17]為直接映射關(guān)系)。
1)高維映射中存在各種子直接映射。例如定義1中的B=f(A)包含了Bj=fj(A)(BjB,fj∈f)。而所有的外輸入屬性ai都直接決定于bj,即∑id(Ai,Bj)=1。例如(a,b)(c,d)=(a-b,a+b)。
2)高維映射中外輸入屬性僅傳遞決定外輸出屬性。即存在AiA,BjB,使得n≥1,d(Ai,Bj)=0,t(n)(Ai,Bj)≥0。例如(a,b)=(a,sin a)(c,d)=(b2,a2)。上述例子中,{a}DD{c},即{a}T(1){c}。
3)高維映射中外輸入屬性既不直接決定又不傳遞決定外輸出屬性。即存在AiA,BjB,使得n≥0,t(n)(Ai,Bj)=0。例如(a,b)(c,d)=(sin a,cos a),顯然,\{c,d}。
4)高維映射中的某個外輸出屬性決定某個外輸出屬性。即存在Bi,BjB,Bi≠Bj,使得d(Bi,Bj)≥0。例如(a,b)(c,d)=(a+b,sin c)。上述例子中,{a}D{c}Dicocyes,即{a}T(1)iyv2ztp。
從上述情況分析可知:情況1)是最簡單的多維輸入對應(yīng)多維輸出的關(guān)系;情況2)表明了存在輸出屬性不直接依賴于某些輸入屬性的映射關(guān)系;情況3)闡述了某些輸入屬性與輸出屬性并不存在映射關(guān)系;情況4)說明了輸出屬性之間存在直接依賴映射關(guān)系。由于一般情況下,擬合高維映射采用的方法都是黑盒系統(tǒng)(例如神經(jīng)網(wǎng)絡(luò)、模糊系統(tǒng)等),但是當高維映射存在情況2),3),4)等的非簡單直接依賴關(guān)系時,黑盒系統(tǒng)無法精確地擬合出該高維映射。因此,需結(jié)合屬性依賴原理,分析高維映射中內(nèi)在的屬性依賴關(guān)系,然后再采用復合型神經(jīng)網(wǎng)絡(luò)對高維映射進行擬合。
1.4 高維映射的屬性類型分析
由1.3節(jié)可知,當擬合具有直接依賴性質(zhì)的高維映射時,神經(jīng)網(wǎng)絡(luò)才具有較好的精確度。因此,本節(jié)以高維映射中的屬性依賴關(guān)系為基礎(chǔ),分析各個屬性的類型。
定義10 設(shè)A(ai∈A)和B(bj∈B)是兩組屬性的集合,如果存在直接屬性依賴,使得{ci}DD,(DA∪B,ci∈A∪B,ciD),則稱ci為該高維映射中的直接輸入屬性。
定義11 設(shè)A(ai∈A)和B(bj∈B)是兩組屬性的集合,如果存在直接屬性依賴,使得CD{dj},(CA∪B,di∈A∪B,diC),則稱ci為該高維映射中的直接輸出屬性。
定義12 設(shè)A(ai∈A)和B(bj∈B)是兩組屬性的集合,如果直接屬性依賴,使得CD{ei}DD(C,DA∪B,ei∈A∪B,eiC∪D),則稱ei為該高維映射中的轉(zhuǎn)換屬性。
由圖1可知,外輸入屬性、外輸出屬性、直接輸入屬性、直接輸出屬性和轉(zhuǎn)換屬性5者之間的關(guān)系。
圖片
圖1 各類型屬性之間的關(guān)系
1.5 屬性依賴與函數(shù)依賴的關(guān)系與區(qū)別
由定義5~8可知,屬性依賴理論引入了屬性直接依賴度與傳遞依賴度兩個概念。盡管函數(shù)依賴理論中不存在依賴度的定義。實際上可以看出,兩者的依賴度函數(shù)可分別定義為(X,Y)[0,1];(X,Y){0,1}。例如,存在二元關(guān)系{UserNo,UserName},一般可以通過用戶編號,準確地知道該用戶的姓名。但是由于用戶姓名會出現(xiàn)重名的情況,如果僅僅知道用戶姓名,則不能夠精確獲取該用戶的編號信息。由函數(shù)依賴理論可得,UserNoUserName,其相應(yīng)的直接函數(shù)依賴度為d({UserNo},{UserName})=1,d({UserName},{UserNo})=0;而由屬性依賴理論,可得出UserNo┆塥DUserName,其相應(yīng)的直接屬性依賴度為d({UserNo},{UserName})=1,d({UserName},{UserNo})=0.9。由此可見,函數(shù)依賴是屬性依賴的特殊化,而屬性依賴是函數(shù)依賴的細化。
2 直接依賴性的復合型神經(jīng)網(wǎng)絡(luò)生成方法
由于神經(jīng)網(wǎng)絡(luò)是擬合高維映射的主要方法之一,由1.3節(jié)可知,一般的高維映射不僅是簡單的多維輸入對應(yīng)多維輸出的關(guān)系,而是具有復雜屬性依賴性的映射關(guān)系;又因為神經(jīng)網(wǎng)絡(luò)在擬合具有傳遞依賴性的高維映射能力較差,所以需要復合型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)擬合復雜的映射關(guān)系。復合型神經(jīng)網(wǎng)絡(luò)的生成流程見圖2。
圖片
圖2 復合型神經(jīng)網(wǎng)絡(luò)生成流程
2.1 分析高維映射中的屬性依賴關(guān)系
分析高維映射中的屬性依賴關(guān)系這是生成方法的第一步,包括:
1) 分析高維映射中的屬性所屬的類型(包括直接輸入屬性、直接輸出屬性、轉(zhuǎn)換屬性3類);
2) 分析各個屬性之間的關(guān)系;
3) 給每個單元屬性集的直接依賴關(guān)系賦予相應(yīng)的直接依賴度。
2.2 提取具有直接依賴性的單輸出屬性集子映射
由定理6、9可以看出,當輸出屬性集合包含越多屬性時,該系統(tǒng)的精確度越低。因此,本節(jié)根據(jù)上一步所分析的單元屬性集的依賴關(guān)系,依照屬性依賴理論(定理5),提取出具有直接依賴性的單輸出屬性集子映射。通過將具有相同的單輸出屬性集的子映射關(guān)系提取出來,同時計算多輸入屬性集與單輸出屬性集的直接依賴度。
例如,存在某個高維映射f,其單元屬性集的直接依賴關(guān)系分別為{A1}D{B1},{A2}D{B1},{A2}D{B2},{B1}D{B2}為,其中A1,A2為外輸入屬性;B1,B2為外輸出屬性。子映射的直接依賴度分別為d({A1},{B1})=0.68;d({A2},{B1})=0.3;d({A2},{B2})=0.2;d({B1},{B2})=0.75。
根據(jù)屬性依賴理論分析可得:{A1,A2}D{B1},{A2,B1}D{B2}(其中{A1,A2}={A1}∪{A2},{A2,B1}={A2}∪{B1})。并且由于任意的單元屬性集交集為空集,由此可得d({A1,A2},{B1})=0.98;d({A2,B1},{B2})=0.95。
2.3 合并融合度高的子映射
該步驟的主要思想就是對具有融合度較高的子映射集合進行組合,構(gòu)造一個新的子映射,即簡化復合型神經(jīng)網(wǎng)絡(luò)的內(nèi)在結(jié)構(gòu),提高其效率。例如存在一個映射關(guān)系(a,b)(c)=(a+b)(d)=(sin c),其中包含的2個直接依賴關(guān)系如下: f1:{a,b}D{c}, f2:{c}D7v4njy3,但是由于f1與f2的融合度較高,因此存在一個復合子映射: f3:{a,b}T9szns8p(其中d=sin (a+b))。雖然f3為傳遞依賴的子映射,但仍可采取神經(jīng)網(wǎng)絡(luò)方法對其進行擬合。
2.4 構(gòu)建復合型神經(jīng)網(wǎng)絡(luò)
該步驟的主要思想就是將2.3節(jié)中所得出的子映射采用神經(jīng)網(wǎng)絡(luò)進行擬合,然后將所有的神經(jīng)網(wǎng)絡(luò)進行結(jié)合,構(gòu)建一個復合型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。由2.2節(jié)所得出的子映射關(guān)系:{A1,A2}D{B1},{A2,B1}D{B2},因此,需要構(gòu)造2個子神經(jīng)網(wǎng)絡(luò)模型分別對應(yīng)f1:A1×A2B1, f2:A2×B1B2。其中f1、 f2分別為所需擬合的高維映射f的子映射。在神經(jīng)網(wǎng)絡(luò)訓練階段,因為采用樣本數(shù)據(jù)進行訓練,所以各神經(jīng)網(wǎng)絡(luò)模型可以同時進行訓練。但是進行識別計算時,必須依據(jù)依賴關(guān)系內(nèi)在的拓撲結(jié)構(gòu)進行映射計算。上述映射關(guān)系對應(yīng)的拓撲結(jié)構(gòu)如圖3。
圖片
圖3 映射關(guān)系的拓撲結(jié)構(gòu)
復合型神經(jīng)網(wǎng)絡(luò)在進行識別計算時,應(yīng)先將A1,A2代入子神經(jīng)網(wǎng)絡(luò)模型f1計算得出B1;然后將f1的輸出元B1與原有的輸入元A1結(jié)合代入子神經(jīng)網(wǎng)絡(luò)模型f2進行第2次運算,得出B2;最后將B1和B2結(jié)合成{B1,B2}作為復合型神經(jīng)網(wǎng)絡(luò)的外部輸出。
2.5 復合型神經(jīng)網(wǎng)絡(luò)的外部結(jié)構(gòu)與內(nèi)部結(jié)構(gòu)
由復合型神經(jīng)網(wǎng)絡(luò)的外部結(jié)構(gòu)(如圖4)與內(nèi)部結(jié)構(gòu)(如圖5)可見,復合型神經(jīng)網(wǎng)絡(luò)并沒有改變原神經(jīng)網(wǎng)絡(luò)的外部輸入―輸出關(guān)系,僅僅改變了其內(nèi)部關(guān)系,而且對神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、采取的訓練算法,甚至是否采取神經(jīng)網(wǎng)絡(luò)方法也沒有作規(guī)定。對于具有復雜屬性依賴性的高維映射,可以采用多種系統(tǒng)(模糊推理系統(tǒng)、數(shù)學公式、混沌系統(tǒng)等)對其內(nèi)在的子映射進行擬合。因此,屬性理論不僅對如何構(gòu)造最優(yōu)復合型神經(jīng)網(wǎng)絡(luò)提供了理論依據(jù),而且對復合型系統(tǒng)的建模提供了具有嚴格理論基礎(chǔ)的方法。
圖片
圖4 復合型神經(jīng)網(wǎng)絡(luò)的外部結(jié)構(gòu)
圖片
圖5 復合型神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)
2.6 神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法的復雜度分析
本文以采取監(jiān)督選取中心法訓練的RBF神經(jīng)網(wǎng)絡(luò)為研究對象,分析普通RBF與基于屬性依賴理論的RBF(ADO-RBF)的時間復雜度。
一般神經(jīng)網(wǎng)絡(luò)算法分為2個階段:訓練階段與識別階段。
設(shè)Tt(m,n),Rt(m,n)為擬合m-n維映射的普通RBF的訓練算法和識別算法的時間復雜度,ct為普通RBF中間層的中心數(shù),it為訓練的迭代次數(shù);Ta(m,n),Ra(m,n)為ADO-RBF的訓練算法和識別算法的時間復雜度,k為ADO-RBF的神經(jīng)網(wǎng)絡(luò)個數(shù),m1,m2,…,mk為ADO-RBF輸入層的輸入維度,c1,c2,…,ck分別為ADO-RBF中間層的中心數(shù),n1,n2,…,nk為ADO-RBF輸入層的輸出維度,i1,i2,…,ik為訓練的迭代次數(shù),s為樣本個數(shù)。
經(jīng)過分析,普通RBF的訓練階段分為修改權(quán)系數(shù)、學習中心、學習誤差3個步驟,并且每個步驟的時間復雜度皆為O(s•i•m•n•c),因此Tt(m,n)=O(s•m•n•it•ct)。由于ADO-RBF為復合型神經(jīng)網(wǎng)絡(luò),因此其時間復雜度Ta(m,n)=Os•∑kj=1ij•mj•nj•cj。由于經(jīng)過2.1~2.5節(jié)方法分析后的復合型神經(jīng)網(wǎng)絡(luò)必定滿足:
j∈N,j≤k,mj≤m,ij≤it,cj≤ct(10)
∑kj=1nj=n(11)
由式(10)和(11)可得Ta(m,n)=O(s•∑kj=1ij•mj•nj•cj)≤O(s•m•n•it•ct)=Tt(m,n)。因此,在訓練階段,ADO-RBF優(yōu)于普通RBF。
而在識別階段,Rt(m,n)=O(i•m•n•c),Ra(m,n)=O(∑kj=1ij•mj•nj•cj)。同理,Ra(m,n)=O(∑kj=1ij•mj•nj•cj)≤O(i•m•n•c)=Rt(m,n)。因此,在識別階段,ADO-RBF也優(yōu)于普通RBF。
綜上所述,ADO-RBF的運算時間比普通RBF要少。
3 實驗和結(jié)果分析
為了驗證神經(jīng)網(wǎng)絡(luò)的直接屬性依賴優(yōu)化法的性能,本文采用某公司中的軟件項目估算系統(tǒng)作為例子,結(jié)合RBF神經(jīng)網(wǎng)絡(luò),將結(jié)果與普通RBF神經(jīng)網(wǎng)絡(luò)進行比較。其中RBF的學習方法采用監(jiān)督選取中心進行,并且中心個數(shù)為49個,樣本數(shù)據(jù)為49個。
在軟件項目估算中,存在nг關(guān)系,包含12個屬性,分別為:1)項目序號;2)項目名稱;3)項目規(guī)模;4)需求變更率;5)需求人員技能;6)原型化程度;7)編碼人員技能;8)測試用例總數(shù);9)評審工作量;10)測試人員技能;11)生產(chǎn)率;12)遺留缺陷密度[19]。其中{A1,A2,…,A10}為外輸入屬性集,{A11,A12}為外輸出屬性集,A11為轉(zhuǎn)換屬性。經(jīng)過專家的研究分析,軟件項目估算系統(tǒng)中存在2個直接屬性依賴關(guān)系:f1:{A3,A4,A5,A6,A7}D{A11},f2:{A3,A4,A8,A9,A10,A11}D{A12} [19],其直接依賴度分別為:d({A3,A4,A5,A6,A7},{A11})=1,d({A3,A4,A8,A9,A10,A11},{A12})=1。由此可得出復合型神經(jīng)網(wǎng)絡(luò)中的2個子模型f1與f2。由于2個子模型的融合度較低,因此直接采用2.4節(jié)中的復合型神經(jīng)網(wǎng)絡(luò)進行歷史曲線擬合與估算。
圖6是ADO-RBF和RBF對軟件項目估算訓練數(shù)據(jù)集的擬合性能比較,評價標準是誤差的絕對值之和??梢钥闯?RBF對訓練數(shù)據(jù)的擬合程度并不理想,而 ADO-RBF不僅擬合程度高于RBF,而且學習效率也優(yōu)于 RBF(普通RBF的訓練時間為15.39@s,而ADO-RBF為13.39@s)。
圖片
圖6 擬合性能比較
4 結(jié)語
本文提出了屬性依賴的概念、基本原理及其在神經(jīng)網(wǎng)絡(luò)的應(yīng)用,通過嚴格的定義與公式推演證明了相關(guān)的定理,并通過實例證明該理論在實際應(yīng)用的可行性。屬性依賴是函數(shù)依賴的進一步推廣,其適用范圍并不局限于數(shù)據(jù)庫領(lǐng)域,其他領(lǐng)域(例如神經(jīng)網(wǎng)絡(luò)、主成分分析等)也適用。但當前理論尚存在某些問題,需要進一步完善,包括:單元屬性集之間的直接依賴度的統(tǒng)計確定方法;具有循環(huán)依賴性的屬性關(guān)系圖的拓撲求解方法;屬性集的主成分分析法等。
神經(jīng)網(wǎng)絡(luò)的屬性依賴優(yōu)化方法與其他的神經(jīng)網(wǎng)絡(luò)優(yōu)化方法不同,它以新的概念和理論作為支撐,并且容易與其他方法有機地結(jié)合使用。本文結(jié)合實例,采用了該優(yōu)化方法建立軟件項目估算模型,具有較高的估計精度。
參考文獻:
[1]楊國為,王守覺,閆慶旭. 分式線性神經(jīng)網(wǎng)絡(luò)及其非線性逼近能力研究[J].計算機學報,2007,30(2):192-199.
[2]李寧,謝振華,謝俊元,等. SEFNN:一種基于結(jié)構(gòu)進化的前饋神經(jīng)網(wǎng)絡(luò)設(shè)計算法[J].計算機研究與發(fā)展,2006,43(10):1713-1718.
[3]馬銘,周春光,張利彪,等. 一種優(yōu)化模糊神經(jīng)網(wǎng)絡(luò)的多目標微粒群算法[J].計算機研究與發(fā)展,2006,43(12):2104-2109.
[4]田大新,劉衍珩,李賓. 基于Hebb規(guī)則的分布神經(jīng)網(wǎng)絡(luò)學習算法[J].計算機學報,2007,30(8):1379-1388.
[5]凌錦江,周志華. 基于因果發(fā)現(xiàn)的神經(jīng)網(wǎng)絡(luò)集成方法[J].軟件學報,2004,15(10): 1479-1484.
[6]王正群,陳世福,陳兆乾. 優(yōu)化分類型神經(jīng)網(wǎng)絡(luò)線性集成[J].軟件學報,2005,16(11):1902-1908.
[7]李凱,黃厚寬. 一種基于聚類技術(shù)的選擇性神經(jīng)網(wǎng)絡(luò)集成方法[J].計算機研究與發(fā)展,2005,42(4):594-598.
[8]劉宇,覃征,盧江,等. 多模態(tài)粒子群集成神經(jīng)網(wǎng)絡(luò)[J].計算機研究與發(fā)展, 2005,42(9):1519-1526.
[9]李艷來,王寬全,張大鵬. 多層前饋式神經(jīng)網(wǎng)絡(luò)的HJPS訓練算法[J].計算機研究與發(fā)展,2005,42(10):1790-1795.
[10]許少華,何新貴,王兵. 一種分式過程神經(jīng)元網(wǎng)絡(luò)及其應(yīng)用研究[J].計算機研究與發(fā)展,2006,43(12):2088-2095.
[11]汪蔚,王榮杰,胡清. 基于PCA和神經(jīng)網(wǎng)絡(luò)的故障診斷技術(shù)[J].計算機工程,2008,34(7):184-185.
[12]蔣華剛,吳耿鋒. 基于人工免疫原理的RBF網(wǎng)絡(luò)預測模型[J].計算機工程,2008,34(2):202-205.
[13]邢進生,劉人境. 基于加工工序的高維多輸入層神經(jīng)網(wǎng)絡(luò)及應(yīng)用[J].系統(tǒng)工程理論與實踐,2004,24(2):64-67.
[14]JACOBSON N. Lectures in abstract algebra I: Basic concepts[M]. Berlin:Springer-Verlag,1951.
[15]DATE C J. An introduction to database systems[M].8th ed. New Jersey:Addison Wesley,2003.
[16]FELLAR W. An introduction to probability theory and its applications [M]. 3rd ed. New Jersey:Wiley,1968.
[17]阿黑波夫, 薩多夫尼齊, 丘巴里闊夫. 數(shù)學分析講義[M]. 王昆揚,譯.北京:高等教育出版社,2006.
[18]CORMEN T H, LEISERSON C E, RIVEST R L. Intruduction to algorithms[M]. 2nd ed. Cambridge:The MIT Press,2002.
[19]CAPERS J. Estimating software costs[M]. New York: McGraw Hill,2007.
[20]ASH R B, DOLEANS-DADE C A. Probability and measure theory[M]. 2nd ed. Salt Lake City:Academic Press,1999.
篇4
關(guān)鍵詞:網(wǎng)絡(luò)安全;入侵檢測;常用技術(shù)
中圖分類號:TP393文獻標識碼:A文章編號:1009-3044(2011)12-2781-02
Discussion Intrusion Detection Several General Techniques
GAO Kai
(Department of Computer Science and Technology, Shaanxi University of Technology, Hanzhong 723001, China)
Abstract: Firewall, intrusion detection system as a reasonable supplement, has been in the network security plays a very important role. In this paper, the definition of intrusion detection technology, discusses the basic principles of intrusion detection, intrusion detection is discussed in detail several general techniques.
Key words: network security; intrusion detection; general techniques
網(wǎng)絡(luò)安全的本質(zhì)是要保障數(shù)據(jù)的保密性、完整性、可用性、可控性和不可否認性。保密性指信息不泄露給非授權(quán)用戶、實體或過程;完整性指數(shù)據(jù)未經(jīng)授權(quán)不能被改變的特性;可用性指可被授權(quán)實體訪問并按需求使用的特性;可控性指對信息的傳播及內(nèi)容具有控制能力;不可否認性指保證任何一方無法抵賴自己曾經(jīng)做過的操作,從而防止中途欺騙。入侵檢測技術(shù)就是通過收集和分析網(wǎng)絡(luò)行為、安全日志、審計數(shù)據(jù)等安全信息,檢查計算機系統(tǒng)或網(wǎng)絡(luò)中是否存在違反安全策略的行為和被攻擊的跡象。
1 入侵檢測技術(shù)
入侵檢測系統(tǒng)IDS(Intrusion Detection Systems)是一種主動保護自己免受攻擊的一種網(wǎng)絡(luò)安全技術(shù)。作為防火墻的合理補充,入侵檢測技術(shù)能夠幫助系統(tǒng)對付網(wǎng)絡(luò)攻擊,擴展了系統(tǒng)管理員的安全管理能力,提高了信息安全基礎(chǔ)結(jié)構(gòu)的完整性。
有效的入侵檢測系統(tǒng)應(yīng)該既能正確識別入侵行為,又能保障系統(tǒng)自身的安全并適應(yīng)網(wǎng)絡(luò)環(huán)境發(fā)展的需要。從數(shù)據(jù)處理的角度來看,入侵檢測系統(tǒng)是一個典型的數(shù)據(jù)處理過程,它通過對大量的系統(tǒng)審計數(shù)據(jù)進行分析,來判斷被檢測的系統(tǒng)是否受到入侵攻擊。具體到系統(tǒng)的檢測機制,其實就是一個系統(tǒng)主體行為的分類系統(tǒng),它需要把對系統(tǒng)具有惡意的行為從大量的系統(tǒng)行為中區(qū)分出來。而解決問題的關(guān)鍵就是如何從已知的數(shù)據(jù)中獲得系統(tǒng)的正常行為知識或有關(guān)入侵行為的知識。顯然,在入侵檢測系統(tǒng)的研究領(lǐng)域中,相關(guān)的知識獲取技術(shù),諸如模式匹配、數(shù)據(jù)挖掘、神經(jīng)網(wǎng)絡(luò)等技術(shù)以及各種分類算法的研究占有重要的地位,下面我們討論一下這幾種技術(shù):
2 入侵檢測的幾種常用技術(shù)
2.1 模式匹配技術(shù)
這是最簡單、通用的入侵檢測方法:遍歷事件流是否存在己定義模式(類似于殺毒程序的特征匹配),從而發(fā)現(xiàn)違背安全策略的行為。如“^ GET [^ls] *'/ etc/Passwd |s”是發(fā)出HTTP請求詢問UNIX密碼文件,定義含有該命令信息的事件為入侵事件,當觀察事件與該規(guī)則匹配時就認定為入侵。其特點是原理簡單、擴展性好、檢測效率高,可以實時檢測,但只能適用于比較簡單的攻擊方式,并且誤報率高。隨著網(wǎng)絡(luò)傳輸速度的提高,目前急需解決的是快速匹配的問題,著名的snort便采用這種檢測手段。
2.2 神經(jīng)網(wǎng)絡(luò)技術(shù)
一個神經(jīng)網(wǎng)本質(zhì)上是由大量計算單元(computational units)組成的,單元之間通過帶有權(quán)值的連接進行交互,共同實現(xiàn)復雜的映射功能。初始階段,用正常的用戶歷史行為訓練網(wǎng)絡(luò),網(wǎng)絡(luò)的輸入為用戶當前輸入的命令和已經(jīng)執(zhí)行的N個命令。用戶執(zhí)行過的命令被神經(jīng)網(wǎng)絡(luò)用來預測用戶輸入的下一個命令,當用這個神經(jīng)網(wǎng)絡(luò)預測不出某用戶正確的后繼命令,即在某種程度上表明了用戶行為與其輪廓框架的偏離,這時有異常事件發(fā)生。系統(tǒng)同時要提供對所定義的網(wǎng)絡(luò)結(jié)構(gòu)、連接的權(quán)值進行修正的功能,根據(jù)新鮮的觀測值訓練網(wǎng)絡(luò),允許其學習新的系統(tǒng)行為。神經(jīng)網(wǎng)絡(luò)方法對異常檢測來說具有很多優(yōu)勢:由于不使用固定的系統(tǒng)屬性集來定義用戶行為,因此屬性的選擇是無關(guān)的:神經(jīng)網(wǎng)絡(luò)對所選擇的系統(tǒng)度量(Metrics)也不要求滿足某種統(tǒng)計分布條件,因此,與傳統(tǒng)的統(tǒng)計分析相比,神經(jīng)網(wǎng)絡(luò)方法具備了非參量化統(tǒng)計分析的優(yōu)點。同時神經(jīng)網(wǎng)絡(luò)具有概括和抽象的能力,對不完整輸入信息具有一定程度的容錯處理能力。
2.3 免疫技術(shù)
免疫系統(tǒng)最基本也是最重要的能力是識別“自勿非自我”(Self/ Nonself),即它能夠識別哪些屬于正常機體,不屬于正常的就認為是異常。Forrest等人發(fā)現(xiàn):對一個特定的程序來說,其系統(tǒng)調(diào)用序列是相當穩(wěn)定的,使用系統(tǒng)調(diào)用序列來識別“自我”,應(yīng)該可以滿足系統(tǒng)的需要。在系統(tǒng)的訓練階段建立起反映正常行為的知識庫,這里定義的模式以系統(tǒng)進程為中心,有別于其它檢測系統(tǒng)中以用戶為中心的行為模式。在實際檢測過程中,收集各個特權(quán)進程(Privilege Process)所產(chǎn)生的系統(tǒng)調(diào)用序列,與正常的行為模式相比較,偏離了正常模式的系統(tǒng)進程被認為是出現(xiàn)了異常。Forrest小組提出了短序列匹配算法,用于計算實際系統(tǒng)調(diào)用序列與正常序列模式的相似程度。
2.4 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘通常稱之為知識發(fā)現(xiàn),是一種脫機知識創(chuàng)建過程。這些知識是隱含的、事先未知的、潛在的有用信息,提取的知識表示為規(guī)則、特征及模式等形式。其過程一般包括數(shù)據(jù)采集、數(shù)據(jù)預處理、數(shù)據(jù)開采、知識評價和呈現(xiàn)。
數(shù)據(jù)挖掘技術(shù)適于從歷史行為數(shù)據(jù)中進行數(shù)據(jù)提取,在入侵檢測系統(tǒng)中,可應(yīng)用于對用戶行為數(shù)據(jù)進行特征的提取。其分析方法主要有以下4種:關(guān)聯(lián)分析,序列模式分析,分類分析和聚類分析。其中,關(guān)聯(lián)分析和序列分析方法可以發(fā)現(xiàn)隱藏在數(shù)據(jù)間的關(guān)系,提取出入侵者入侵行為之間的關(guān)聯(lián)特征,找出各種入侵行為之間的相關(guān)性。分類分析方法可以在前兩項分析的基礎(chǔ)上,對具有不同的行為特征的入侵進行分類,判斷入侵行為的可疑程度。聚類分析根據(jù)一定的規(guī)則對用戶行為數(shù)據(jù)重新劃分,以此獲得更好的結(jié)果。
2.5 數(shù)據(jù)融合技術(shù)
隨著因特網(wǎng)的迅速發(fā)展,網(wǎng)絡(luò)規(guī)模也在不斷擴大,IDS中的待處理數(shù)據(jù)也呈幾何級數(shù)增長。于是海量數(shù)據(jù)處理問題也正在成為IDS的關(guān)鍵問題。而正在興起的數(shù)據(jù)融合技術(shù)為該問題提供了較為良好的解決方案。
數(shù)據(jù)融合在這里是指我們在IDS中采用多種分析和檢測機制,針對系統(tǒng)中不同的安全信息進行分析,并把它們的結(jié)果進行融合和決策。這樣會有效提高系統(tǒng)檢測的正確率,降低虛帶率。入侵檢測中的數(shù)據(jù)融合問題早已被人提出,并有一些組織致力于這方面的研究。
3 結(jié)束語
入侵檢測是對計算機和網(wǎng)絡(luò)資源上的惡意使用行為進行識別和響應(yīng),它不僅檢測來自外部的入侵行為,同時也監(jiān)督內(nèi)部用戶的未授權(quán)活動。本文主要闡述了目前網(wǎng)絡(luò)面臨的安全問題、入侵檢測技術(shù)的基本概念、分析了常用的入侵檢測,對今后進一步研究入侵檢測技術(shù)有一定的指導意義。
參考文獻:
[1] 付玉珍,張清華.計算機網(wǎng)絡(luò)入侵檢測技術(shù)研究進展[J].茂名學院學報,2007(6).
[2] 姚麗娟.網(wǎng)絡(luò)入侵檢測技術(shù)綜述[J].軟件導刊,2010(6).
[3] 何小虎.計算機網(wǎng)絡(luò)入侵檢測探討[J].科技信息,2010(14).
篇5
[關(guān)鍵詞]數(shù)據(jù)挖掘數(shù)據(jù)挖掘方法
隨著信息技術(shù)迅速發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴大,產(chǎn)生了大量的數(shù)據(jù)。但大量的數(shù)據(jù)往往無法辨別隱藏在其中的能對決策提供支持的信息,而傳統(tǒng)的查詢、報表工具無法滿足挖掘這些信息的需求。因此,需要一種新的數(shù)據(jù)分析技術(shù)處理大量數(shù)據(jù),并從中抽取有價值的潛在知識,數(shù)據(jù)挖掘(DataMining)技術(shù)由此應(yīng)運而生。
一、數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘是指從數(shù)據(jù)集合中自動抽取隱藏在數(shù)據(jù)中的那些有用信息的非平凡過程,這些信息的表現(xiàn)形式為:規(guī)則、概念、規(guī)律及模式等。它可幫助決策者分析歷史數(shù)據(jù)及當前數(shù)據(jù),并從中發(fā)現(xiàn)隱藏的關(guān)系和模式,進而預測未來可能發(fā)生的行為。數(shù)據(jù)挖掘的過程也叫知識發(fā)現(xiàn)的過程。
二、數(shù)據(jù)挖掘的方法
1.統(tǒng)計方法。傳統(tǒng)的統(tǒng)計學為數(shù)據(jù)挖掘提供了許多判別和回歸分析方法,常用的有貝葉斯推理、回歸分析、方差分析等技術(shù)。貝葉斯推理是在知道新的信息后修正數(shù)據(jù)集概率分布的基本工具,處理數(shù)據(jù)挖掘中的分類問題,回歸分析用來找到一個輸入變量和輸出變量關(guān)系的最佳模型,在回歸分析中有用來描述一個變量的變化趨勢和別的變量值的關(guān)系的線性回歸,還有用來為某些事件發(fā)生的概率建模為預測變量集的對數(shù)回歸、統(tǒng)計方法中的方差分析一般用于分析估計回歸直線的性能和自變量對最終回歸的影響,是許多挖掘應(yīng)用中有力的工具之一。
2.關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是一種簡單,實用的分析規(guī)則,它描述了一個事物中某些屬性同時出現(xiàn)的規(guī)律和模式,是數(shù)據(jù)挖掘中最成熟的主要技術(shù)之一。關(guān)聯(lián)規(guī)則在數(shù)據(jù)挖掘領(lǐng)域應(yīng)用很廣泛適合于在大型數(shù)據(jù)集中發(fā)現(xiàn)數(shù)據(jù)之間的有意義關(guān)系,原因之一是它不受只選擇一個因變量的限制。大多數(shù)關(guān)聯(lián)規(guī)則挖掘算法能夠無遺漏發(fā)現(xiàn)隱藏在所挖掘數(shù)據(jù)中的所有關(guān)聯(lián)關(guān)系,但是,并不是所有通過關(guān)聯(lián)得到的屬性之間的關(guān)系都有實際應(yīng)用價值,要對這些規(guī)則要進行有效的評價,篩選有意義的關(guān)聯(lián)規(guī)則。
3.聚類分析。聚類分析是根據(jù)所選樣本間關(guān)聯(lián)的標準將其劃分成幾個組,同組內(nèi)的樣本具有較高的相似度,不同組的則相異,常用的技術(shù)有分裂算法,凝聚算法,劃分聚類和增量聚類。聚類方法適合于探討樣本間的內(nèi)部關(guān)系,從而對樣本結(jié)構(gòu)做出合理的評價,此外,聚類分析還用于對孤立點的檢測。并非由聚類分析算法得到的類對決策都有效,在運用某一個算法之前,一般要先對數(shù)據(jù)的聚類趨勢進行檢驗。
4.決策樹方法。決策樹學習是一種通過逼近離散值目標函數(shù)的方法,通過把實例從根結(jié)點排列到某個葉子結(jié)點來分類實例,葉子結(jié)點即為實例所屬的分類。樹上的每個結(jié)點說明了對實例的某個屬性的測試,該結(jié)點的每一個后繼分支對應(yīng)于該屬性的一個可能值,分類實例的方法是從這棵樹的根結(jié)點開始,測試這個結(jié)點指定的屬性,然后按照給定實例的該屬性值對應(yīng)的樹枝向下移動。決策樹方法是要應(yīng)用于數(shù)據(jù)挖掘的分類方面。
5.神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)建立在自學習的數(shù)學模型基礎(chǔ)之上,能夠?qū)Υ罅繌碗s的數(shù)據(jù)進行分析,并可以完成對人腦或其他計算機來說極為復雜的模式抽取及趨勢分析,神經(jīng)網(wǎng)絡(luò)既可以表現(xiàn)為有指導的學習也可以是無指導聚類,無論哪種,輸入到神經(jīng)網(wǎng)絡(luò)中的值都是數(shù)值型的。人工神經(jīng)元網(wǎng)絡(luò)模擬人腦神經(jīng)元結(jié)構(gòu),建立三大類多種神經(jīng)元網(wǎng)絡(luò),具有非線形映射特性、信息的分布存儲、并行處理和全局集體的作用、高度的自學習、自組織和自適應(yīng)能力的種種優(yōu)點。
6.遺傳算法。遺傳算法是一種受生物進化啟發(fā)的學習方法,通過變異和重組當前己知的最好假設(shè)來生成后續(xù)的假設(shè)。每一步,通過使用目前適應(yīng)性最高的假設(shè)的后代替代群體的某個部分,來更新當前群體的一組假設(shè),來實現(xiàn)各個個體的適應(yīng)性的提高。遺傳算法由三個基本過程組成:繁殖(選擇)是從一個舊種群(父代)選出生命力強的個體,產(chǎn)生新種群(后代)的過程;交叉〔重組)選擇兩個不同個體〔染色體)的部分(基因)進行交換,形成新個體的過程;變異(突變)是對某些個體的某些基因進行變異的過程。在數(shù)據(jù)挖掘中,可以被用作評估其他算法的適合度。
7.粗糙集。粗糙集能夠在缺少關(guān)于數(shù)據(jù)先驗知識的情況下,只以考察數(shù)據(jù)的分類能力為基礎(chǔ),解決模糊或不確定數(shù)據(jù)的分析和處理問題。粗糙集用于從數(shù)據(jù)庫中發(fā)現(xiàn)分類規(guī)則的基本思想是將數(shù)據(jù)庫中的屬性分為條件屬性和結(jié)論屬性,對數(shù)據(jù)庫中的元組根據(jù)各個屬性不同的屬性值分成相應(yīng)的子集,然后對條件屬性劃分的子集與結(jié)論屬性劃分的子集之間上下近似關(guān)系生成判定規(guī)則。所有相似對象的集合稱為初等集合,形成知識的基本成分。任何初等集合的并集稱為精確集,否則,一個集合就是粗糙的(不精確的)。每個粗糙集都具有邊界元素,也就是那些既不能確定為集合元素,也不能確定為集合補集元素的元素。粗糙集理論可以應(yīng)用于數(shù)據(jù)挖掘中的分類、發(fā)現(xiàn)不準確數(shù)據(jù)或噪聲數(shù)據(jù)內(nèi)在的結(jié)構(gòu)聯(lián)系。
8.支持向量機。支持向量機(SVM)是在統(tǒng)計學習理論的基礎(chǔ)上發(fā)展出來的一種新的機器學習方法。它基于結(jié)構(gòu)風險最小化原則上的,盡量提高學習機的泛化能力,具有良好的推廣性能和較好的分類精確性,能有效的解決過學習問題,現(xiàn)已成為訓練多層感知器、RBF神經(jīng)網(wǎng)絡(luò)和多項式神經(jīng)元網(wǎng)絡(luò)的替代性方法。另外,支持向量機算法是一個凸優(yōu)化問題,局部最優(yōu)解一定是全局最優(yōu)解,這些特點都是包括神經(jīng)元網(wǎng)絡(luò)在內(nèi)的其他算法所不能及的。支持向量機可以應(yīng)用于數(shù)據(jù)挖掘的分類、回歸、對未知事物的探索等方面。
事實上,任何一種挖掘工具往往是根據(jù)具體問題來選擇合適挖掘方法,很難說哪種方法好,那種方法劣,而是視具體問題而定。
三、結(jié)束語
目前,數(shù)據(jù)挖掘技術(shù)雖然得到了一定程度的應(yīng)用,并取得了顯著成效,但仍存在著許多尚未解決的問題。隨著人們對數(shù)據(jù)挖掘技術(shù)的深人研究,數(shù)據(jù)挖掘技術(shù)必將在更加廣泛的領(lǐng)域得到應(yīng)用,并取得更加顯著的效果。
篇6
關(guān)鍵詞:智能控制 專家控制 模糊控制 神經(jīng)網(wǎng)絡(luò)控制 遺傳算法
1.引言
智能控制是自動控制發(fā)展的高級階段,是人工智能、控制論、信息論、系統(tǒng)論、仿生學、進化計算和計算機等多種學科的高度綜合與集成,是一門新興的邊緣交叉學科。智能控制是當今國內(nèi)、外自動化學科中的一個十分活躍和具有挑戰(zhàn)性的領(lǐng)域,代表著當今科學和技術(shù)發(fā)展的最新方向之一。它不僅包含了自動控制、人工智能、系統(tǒng)理論和計算機科學的內(nèi)容,而且還從生物學等學科汲取豐富的營養(yǎng),正在成為自動化領(lǐng)域中最興旺和發(fā)展最迅速的一個分支學科。
2.智能控制產(chǎn)生的背景
從控制理論學科發(fā)展的歷程來看,該學科的發(fā)展經(jīng)歷了三個主要階段。
第一階段為20世紀40—60年代的“經(jīng)典控制理論”時期,經(jīng)典控制理論以反饋理論為基礎(chǔ),是一種單回路線性控制理論。主要采用傳遞函數(shù)、頻率特性、根軌跡為基礎(chǔ)的頻率分析方法。主要研究單輸入一單輸出、線性定長系統(tǒng)的分析和設(shè)計。
第二階段為20世紀60—70年代的“現(xiàn)代控制理論”時期,現(xiàn)代控制理論主要研究具有高性能、高精度的多變量參數(shù)系統(tǒng)的最優(yōu)控制問題。采用的方法包括狀態(tài)空間法、bellman動態(tài)規(guī)劃方法,kalman濾波理論和pontryagin極大值原理等?,F(xiàn)代控制理論可以解決多輸入多輸出問題,系統(tǒng)可以是線性定長的,也可以是非線性時變的。
第三階段為20世紀70年代至今的“大系統(tǒng)理論”和“智能控制理論”時期。由于現(xiàn)代控制理論過多地依賴對象的數(shù)學模型,其控制算法較為理想化,設(shè)計方法非常數(shù)字化,因此在面對難以用數(shù)學模型描述或者具有時變、非線性、不確定特性的復雜系統(tǒng)時,現(xiàn)代控制系統(tǒng)也顯得無能為力。為了提高控制系統(tǒng)的品質(zhì)和尋優(yōu)能力,控制領(lǐng)域的研究人員開始考慮把人工智能技術(shù)用于控制系統(tǒng)。近年來,控制領(lǐng)域的研究人員把傳統(tǒng)的控制理論與模糊邏輯、神經(jīng)網(wǎng)絡(luò)、遺傳算法等智能技術(shù)相結(jié)合,充分利用人的經(jīng)驗知識對復雜系統(tǒng)進行控制,逐漸形成了智能控制這一新興學科。
3.智能控制的基本概念和特點
傳統(tǒng)的控制方法建立在被控對象的精確數(shù)學模型之上,智能控制是針對系統(tǒng)的復雜性、非線性、不確定性等提出來的。ieee控制系統(tǒng)協(xié)會把智能控制歸納為:智能控制系統(tǒng)必須具有模擬人類學習和自適應(yīng)的能力。一個智能控制系統(tǒng)一般應(yīng)具有以下一些特點。
1)能對復雜系統(tǒng)(如非線性、多變量、時變、環(huán)境擾動等)進行有效的全局控制,并具有較強的容錯能力;
2)具有以只是表示的非數(shù)學廣義模型和以數(shù)學模型表示的混合控制過程,能根據(jù)被控對象的動態(tài)過程進行辨識,采用開閉環(huán)控制和定性與定量相結(jié)合的多模態(tài)控制方式;
3)能對獲取的信息進行實時處理并給出控制決策,通過不斷優(yōu)化參數(shù)和尋找控制器的最佳結(jié)構(gòu)形式,以獲得整體最優(yōu)控制性能。
4)具有自學習、自適應(yīng)、自組織能力,能從系統(tǒng)的功能和整體優(yōu)化的角度來分析和綜合系統(tǒng),以實現(xiàn)預期的控制目標。
4.智能控制理論的基本內(nèi)容
4.1 專家控制(ec-expert control)
由人工智能領(lǐng)域發(fā)展起來的專家控制是一種基于知識的智能計算機程序的技術(shù)。專家控制的實質(zhì)是基于控制對象和控制規(guī)律的各種知識,并且要以智能的方式利用這些知識,以求得控制系統(tǒng)盡可能的優(yōu)化和實用化。專家系統(tǒng)一般由知識庫、推理機、解釋機制和知識獲取系統(tǒng)等組成。知識庫用于存儲某一領(lǐng)域?qū)<业慕?jīng)驗性知識、原理性知識、可行操作與規(guī)則等??赏ㄟ^知識獲取系統(tǒng)對原有知識進行修改和擴充。推理機根據(jù)系統(tǒng)信息并利用知識庫中知識按一定的推理策略來解決當前的問題。解釋機制對找到的知識進行解釋,為用戶提供了一個人機界面。專家控制的特點為:
1)具有領(lǐng)域?qū)<壹壍膶I(yè)知識,能進行符號處理和啟發(fā)式推理。
2)具有獲取知識能力,具有靈活性、透明性和交互性。
4.2模糊控制(fc-fuzzy control)
模糊控制是以模糊集合論、模糊邏輯推理和模糊語言變量為基礎(chǔ)的一種計算機數(shù)字控制。對于無法建立數(shù)學模型或難以建立數(shù)學模型的場合,可以用模糊控制技術(shù)來解決。模糊控制就是在被控對象模糊模型的基礎(chǔ)上,利用模糊控制器,采用推理的手段進行系統(tǒng)控制的一種方法。模糊模型是用模糊語言和規(guī)則描述的一個系統(tǒng)的動態(tài)特性及性能指標。模糊控制器由模糊化、規(guī)則庫、模糊推理和清晰化四個功能模塊組成。模糊化模塊實現(xiàn)對系統(tǒng)變量論域的模糊劃分和對清晰輸入值的模糊化處理。規(guī)則庫用于存儲系統(tǒng)的基于語言變量的控制規(guī)則和系統(tǒng)參數(shù)。模糊推理是一種從輸入空間到輸出空間的非線性映射關(guān)系,控制規(guī)則形式為if{控制輸入a}then{控制輸出b},即如果已知控制輸入a,則通過模糊推理得出控制輸出b。清晰化模塊將推出的模糊推理推出的控制輸出轉(zhuǎn)化為清晰的輸出值。模糊控制的特點為:
1)提供了一種實現(xiàn)基于自然語言描述規(guī)則的控制規(guī)律的新機制。
2)提供了一種非線性控制器,這種控制器一般用于控制含有不確定性和難以用傳統(tǒng)非線性理論處理的場合。
4.3 神經(jīng)網(wǎng)絡(luò)控制(nnc-neural networks control)
神經(jīng)網(wǎng)絡(luò)控制是在控制系統(tǒng)中采用神經(jīng)網(wǎng)絡(luò)這一工具,對難以通過常規(guī)方法進行描述的復雜非線性對象進行建模,或充當控制器,或信息處理,或模式識別,或故障診斷等,或以上幾種功能的組合,這種神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)的控制方式即為神經(jīng)網(wǎng)絡(luò)控制。神經(jīng)網(wǎng)絡(luò)控制采用仿生學的觀點對智能系統(tǒng)中的高級信息處理問題進行研究,神經(jīng)網(wǎng)絡(luò)控制的特點為:
1)能充分逼近任意非線性特性。
2)分布式并行處理機制。
3)自學習和自適應(yīng)能力。
4)數(shù)據(jù)融合能力。
5)適合于多變量系統(tǒng),可進行多變量處理。
4.4 遺傳算法(ga-genetic algorithm)
遺傳算法是一種基于生物進化模擬的啟發(fā)式智能算法,它的基本策略是:將待優(yōu)化函數(shù)的自變量編碼成類似基因的離散數(shù)值碼,然后通過類似基因進化的交叉、變異、繁殖等操作獲得待優(yōu)化函數(shù)的最優(yōu)或近似最優(yōu)解。在智能控制中,遺傳算法廣泛應(yīng)用于各類優(yōu)化問題,遺傳算法可以用于復雜的非線性系統(tǒng)的辨識,多變量系統(tǒng)控制規(guī)則的優(yōu)化,智能控制參數(shù)的優(yōu)化等常規(guī)控制方法難以奏效的問題。遺傳算法具有可擴展性,可以同專家系統(tǒng)、模糊控制和神經(jīng)網(wǎng)絡(luò)結(jié)合,為智能控制的研究注入新的活力。如可用遺傳算法對模糊控制的控制規(guī)則和隸屬度函數(shù)進行優(yōu)化,對神經(jīng)網(wǎng)絡(luò)的權(quán)值進行優(yōu)化等。遺傳算法的特點為:
1)以決策變量的編碼作為運算對象。
2)直接以目標函數(shù)值作為搜索信息。
3)同時進行解空間的多點搜索。
4)使用自適應(yīng)的概率搜索技術(shù)。
5.結(jié)束語
智能控制已廣泛應(yīng)用于工業(yè)、農(nóng)業(yè)、軍事等眾多領(lǐng)域,已經(jīng)解決了大量的傳統(tǒng)控制無法解決的實際控制應(yīng)用問題,呈現(xiàn)出強大的生命力和發(fā)展前景。它將隨著專家系統(tǒng)、模糊控制、神經(jīng)網(wǎng)絡(luò)等控制技術(shù)的發(fā)展而不斷發(fā)展。
參考文獻:
[1]師黎,陳鐵軍,李曉媛等,智能控制理論及應(yīng)用[m].北京:清華大學出版社.2009.
[2]黃志高,徐成金,譚斌.智能控制理論綜述[j].土木機床,2004 (3):30-32.
[3]宋勝利.智能控制技術(shù)概論[m].北京:國防工業(yè)出版社,2008.
[4]王永驥,涂健,神經(jīng)元網(wǎng)絡(luò)控制[m].北京:機械工業(yè)出版社,1998.
[5] rubaai a,kotaru r,kankam m d.a continually online - trained neural network controller for brushless dc motor drives [j].lndustry applications,ieee transactions ,2000 ,36(2):475 - 483.
篇7
關(guān)鍵詞:智能控制;應(yīng)用;探討;
前言:
隨著時代的發(fā)展,科學技術(shù)的進步,計算機技術(shù)已經(jīng)逐漸成為人們?nèi)粘I钪胁豢煞指畹囊徊糠?,而自人工智能的概念被提出后,各國將更多的精力投入到智能的研究上,隨著信息化時代的到來,自動化技術(shù)與智能控制技術(shù)的結(jié)合越來越符合當前工業(yè)的發(fā)展。智能控制作為以眾多學科為基礎(chǔ)的過程控制中最為重要的一部分,在社會上的各行各業(yè)都有著十分重要的作用。除此之外,智能控制同樣是當今社會處于前沿的科學技術(shù),因此,如何將智能控制更好地應(yīng)用于實際具有十分重要的社會意義。
1 智能控制綜述
隨著科學技術(shù)的發(fā)展,人們生活質(zhì)量的提高,對工業(yè)生產(chǎn)的需求越來越旺盛,從而導致了過程控制也就是控制科學這一項技術(shù)的誕生。智能控制是指通過控制智能機器完成目標的控制過程,智能控制作為控制過程的重要組成部分,隨著各界人士不斷的鉆研,目前智能控制的理論已相對成熟。智能控制是人工智能、控制論、信息論與運籌學等技術(shù)相互交叉所形成的符合當展的一項新型的理論與技術(shù),也因此其應(yīng)用領(lǐng)域正在不斷的擴大。目前主要通過兩種研究方法來研究智能控制,提高智能控制所具備的一些能力,如學習能力、組織綜合能力、適應(yīng)能力以及優(yōu)化能力,從而保證智能控制能更好地發(fā)揮其相應(yīng)的社會作用。
2 智能控制所采用的手段
2.1 專家控制
專家控制其實就是將專家系統(tǒng)引入控制領(lǐng)域的一種新型的智能控制,而隨著時間的發(fā)展,專家控制逐漸成為智能控制的重要組成部分。專家系統(tǒng)通過知識庫采集相關(guān)知識進行推理,從而使專家控制能最大限度地模仿專家的經(jīng)驗推理出解決對策以及方案,專家控制最大的優(yōu)點便是它是通過各種知識進行推理從而得出最終的解決對策,而不是通過一個固定的規(guī)則或數(shù)據(jù)模型得到的結(jié)果。目前專家系統(tǒng)的應(yīng)用極其廣泛,但是仍有許多問題值得進一步的研究,以便專家控制系統(tǒng)具備自主學習能力,從而能使智能控制更加完善。
2.2 模糊控制
自1956年模糊控制被第一次提出以后,就成為了智能控制中的重要組成部分,并被廣泛地應(yīng)用于實際中。模糊控制相對于其它智能控制手段最主要的特點就是算法簡單、執(zhí)行速度快、容易實現(xiàn)目標,也因此,模糊控制被廣泛地應(yīng)用于較為復雜的領(lǐng)域解決較為復雜的問題。所謂的模糊控制是基于模糊推理等理論,從而使機器能以較為接近人類思維的語言邏輯進行分析,從而控制系統(tǒng)進行工作,以便達到無人控制的目標。到目前為止,雖然作為智能控制的重要組成部分的模糊控制已經(jīng)發(fā)展得相當不錯了,但是仍然存在著一定的問題需要改善。
2.3 神經(jīng)網(wǎng)絡(luò)控制
所謂的神經(jīng)網(wǎng)路控制就是將神經(jīng)系統(tǒng)融入智能控制中,是基于結(jié)構(gòu)模擬人腦生理結(jié)構(gòu)而形成的智能控制和辨識方法,其中BP網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)控制的主要網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)控制在控制領(lǐng)域具有十分重要的作用,這主要是因為神經(jīng)網(wǎng)絡(luò)控制在理論上是非線性函數(shù)且能執(zhí)行并行分布處理,具有較強的學習能力與適應(yīng)能力,可以進行多變量的處理。但是神經(jīng)網(wǎng)絡(luò)控制同樣具有不可忽視的缺陷,目前正在進一步研發(fā)將神經(jīng)網(wǎng)絡(luò)理論應(yīng)用到具體的控制系統(tǒng),以便提高智能控制的性能。
2.4 混沌控制
混沌控制同樣也是智能控制的重要組成部分,于1963年被氣象學家所提出,是非線性動力系統(tǒng)的理論,而且由于混沌控制在工業(yè)上所具有的重要應(yīng)用價值,使得混沌控制成為了當代社會的重要研究方向。目前常用的混沌控制方法包括OGY法、連續(xù)反饋控制法等控制方法。混沌,顧名思義就是在確定的系統(tǒng)中出現(xiàn)的貌似隨機的現(xiàn)象,是一種十分普遍的運動情況。近幾年,混沌控制逐漸成為了非線性系統(tǒng)領(lǐng)域重點研究對象,但是由于其發(fā)展時間較短,仍舊需要進一步的研究。
3 智能控制的應(yīng)用
3.1 智能機器人
智能控制現(xiàn)階段被廣泛地應(yīng)用于各個領(lǐng)域。自人工智能理念被提出以后,智能機器人的研究便成為了各界學者關(guān)注的重點,而現(xiàn)在的智能機器人研究相對成熟,主要是因為賦予“思維能力”的相應(yīng)控制系統(tǒng)十分完善,能準確地對周圍的環(huán)境等情況進行檢測,同時進行定位,而智能控制系統(tǒng)強大的學習能力也提高了智能機器人對環(huán)境的適應(yīng)能力。目前智能機器人在社會上有著十分廣泛的應(yīng)用,其中多數(shù)都是危險作業(yè),如挖礦、水下運載器、水下無人機等的作業(yè)都是通過智能控制實現(xiàn)的。
3.2 智能監(jiān)控
智能監(jiān)控是智能控制的主要應(yīng)用領(lǐng)域。在工業(yè)生產(chǎn)中,智能監(jiān)控是必不可少的,這主要是為了保證加工的效率和準確度,同時由于目前將智能控制技術(shù)與自動化技術(shù)相結(jié)合以成為工業(yè)生產(chǎn)的主要方式,而利用智能控制不僅可以提高控制精度與工作效率,避免了工作人員的操作,降低了操作的難度,避免了客觀因素對電氣設(shè)備的干擾,提高了電氣設(shè)備的自動化程度,促進了工業(yè)的發(fā)展。除此之外,智能控制同樣被應(yīng)用行器的過程控制以及醫(yī)療過程控制中,從而保證飛行器的飛行安全,合理地評估用藥,可以看出智能監(jiān)控對社會的發(fā)展十分重要。
3.3 智能檢測
設(shè)備具有一定的使用壽命,并且極易受到外界因素的干擾,從而降低機器的使用壽命,造成大量的損失,因此必須采取一定的措施延長設(shè)備預期使用壽命,而智能檢測在這方面具有得天獨厚的優(yōu)點。智能檢測是通過合理的分析設(shè)備所運行的情況,從而判斷設(shè)備可能出現(xiàn)故障的地方及原因,并發(fā)出警告,以便維修人員能及時地檢修,及時地排除故障,從而保障設(shè)備的正常運行,延長機器的使用壽命,并在一定程度上降低損失。目前智能故障檢測廣泛地應(yīng)用于雷達以及火電站鍋爐給水過程等方面。
3.4 智能儀器
隨著電子技術(shù)的發(fā)展,微電子元件具有十分廣闊的市場,而隨著微電子元件的發(fā)展,人工智能與智能控制技術(shù)正朝著更高的集成化、網(wǎng)絡(luò)化、模塊化的方向發(fā)展,從而與工業(yè)生產(chǎn)相結(jié)合,形成自動化程度更高的設(shè)備,從而實現(xiàn)無人控制與遠程控制的目標。
4 智能控制的應(yīng)用前景
到現(xiàn)在為止,智能控制的發(fā)展歷史極其短暫,僅僅只有六十年,但是在這短短的六十年間,智能控制逐漸成為了各個領(lǐng)域的主要應(yīng)用技術(shù)。雖然智能控制的發(fā)展十分迅速,但是由于發(fā)展時間較短,仍然存在很多的問題,因此需要加強對智能控制的研究,從而使其應(yīng)用更為安全且廣泛。這就需要相關(guān)的學者繼續(xù)完善智能控制的相關(guān)理論,并且在一定程度上提高智能控制系統(tǒng)的穩(wěn)定性、可控性等性能,并且解決當前智能控制中所遇到的問題,從而使智能控制應(yīng)用于更廣的領(lǐng)域。
5 結(jié)語
綜上所述,隨著經(jīng)濟的發(fā)展,科學技術(shù)的進步,當今社會的IT行業(yè)正處于蓬勃發(fā)展的時期,而智能控制更是基于人工智能理論所衍生的更符合當今社會發(fā)展的一項新型的學科。人工智能控制是一項基于運籌學、人工智能以及控制理論等所衍生的一項交叉技術(shù),目前為止,應(yīng)用最為廣泛的智能控制手段包括模糊控制、專家控制、神經(jīng)網(wǎng)絡(luò)控制以及混沌控制,并且逐漸在社會中發(fā)揮著重要的作用,從而為我國的發(fā)展做出一份貢獻。
參考文獻
篇8
人工智能作為一門課程[1],開設(shè)時間距今只有40多年,但發(fā)展極為迅猛。人工智能課程的內(nèi)容涉及計算機科學、數(shù)學、系統(tǒng)科學、控制科學、信息科學、心理學、電子學、生物學、語言學等等,幾乎所有科學工作者都可以在人工智能中找到自己感興趣的問題。目前,國內(nèi)外已有眾多高校指定人工智能為計算機科學與技術(shù)及其相關(guān)專業(yè)的主修專業(yè)基礎(chǔ)課程,它在拓展計算機和自動控制的研究和應(yīng)用領(lǐng)域方面有著極其誘人的學科發(fā)展前景。自2003年起,國內(nèi)諸多高等院校陸續(xù)開設(shè)“智能科學與技術(shù)”本科專業(yè),同時也有更多高校在傳統(tǒng)信息類專業(yè)中加大了人工智能課程的課時比重,因此如何提高人工智能課程的教學質(zhì)量顯得尤為重要。?
本文結(jié)合人工智能課程的特點以及自己教學與研究的實踐,對本課程的教學進行一些探討,以期改進人工智能課程教學方法,達到提高本課程教學質(zhì)量的目的。??
一、兼顧課程內(nèi)容的統(tǒng)一性和差異性??
人工智能課程的核心內(nèi)容主要集中在對基本概念、基本原理、基本方法和重要算法及其應(yīng)用的認識和理解上,盡管各種基本概念、原理、方法和算法在一定程度上自成體系,但是它們之間又存在著許多內(nèi)在聯(lián)系和規(guī)律。從這一點來看,人工智能課程與其他很多計算機課程是不同的,這就要求人工智能課程的授課要具有自己的特色。?
知識表示、知識推理、知識應(yīng)用是人工智能課程的三大內(nèi)容,解決任何一個人工智能問題都離不開兩個步驟,即知識表示和問題求解。由此,人工智能課程從總體結(jié)構(gòu)上就有了一個比較清晰的脈絡(luò),即首先必然要學習各種知識表示方法,然后是利用這些知識進行推理,進而實現(xiàn)知識應(yīng)用,最終達到問題求解的目的。問題求解又分為基本的問題求解方法和高級問題求解方法。圖搜索策略、啟發(fā)式搜索、消解原理以及規(guī)則演繹系統(tǒng)等都屬于基本的問題求解方法。計算智能、專家系統(tǒng)、機器學習、自動規(guī)劃等屬于高級問題求解方法。?
同時,人工智能課程某些章節(jié)或者某些方法算法在一定程度上又自成體系。例如,各種不同的知識表示方法不管是數(shù)據(jù)結(jié)構(gòu)還是表示形式都完全不相同。又例如,人工智能有許多不同的學派[2],本課程往往同時會介紹不同學派的算法,這些學派在人工智能的基礎(chǔ)理論和方法、技術(shù)路線等方面是完全不同的,甚至是對立的。?
這些都要求我們在教學過程中不僅要強調(diào)人工智能課程理論的統(tǒng)一性和完整性,又要兼顧各學派的特點,尊重甚至調(diào)動學生們對不同人工智能學派及其方法的興趣。在編寫和選用教材時也要注重這一點,我們選用的是蔡自興教授編寫的《人工智能及其應(yīng)用》系列教材[1,2],該教材以邏輯主義學派為主線,兼顧引進其他學派的精華內(nèi)容,具有較強的科學性。
??二、實施分層次教學??
各高校一般同時為計算機相關(guān)專業(yè)的本科生和研究生開設(shè)了人工智能課程,甚至有的非計算機類專業(yè)也開設(shè)有人工智能課程。不同層次的學生對人工智能課程要求掌握的程度不同,我們首先明確本科生和研究生以及非計算機類專業(yè)學生的教學目的和教學內(nèi)容,做到分層次設(shè)計人工智能課程教學?過程。?
本科階段的人工智能課程課時量較少,本科層次只需要做到對大部分人工智能概念和算法了解、認識,少部分達到理解層次。本科生一般都是在高年級(三年級下期或者四年級上期)開設(shè)人工智能課程,這時已有不少學生準備繼續(xù)讀研或者已經(jīng)被保研,因此在兼顧全體學生教學層次的同時,要注意給這部分學生足夠的相關(guān)參考書目,讓他們能夠利用課余時間廣泛深入了解人工智能相關(guān)算法,老師在課后還應(yīng)和他們進行充分討論,培養(yǎng)他們對人工智能的特別興趣。?
非計算機類專業(yè)的學生往往需要學習如何利用人工智能知識解決該專業(yè)領(lǐng)域內(nèi)的問題,因此在教學中要盡量有專業(yè)針對性地進行教學。例如針對農(nóng)科類專業(yè),在教學專家系統(tǒng)過程中,我們要求學生參考北京農(nóng)業(yè)信息技術(shù)研究中心開發(fā)的農(nóng)業(yè)專家系統(tǒng)開發(fā)平臺(paid5?0)理解并開發(fā)與本專業(yè)領(lǐng)域相關(guān)的簡易農(nóng)業(yè)專家系統(tǒng)。?
給研究生開設(shè)人工智能課程要求做到概念理解,基本算法精通,即要求全面、系統(tǒng)地掌握人工智能的基本概念、基本原理、典型方法和若干應(yīng)用實例,并且能靈活運用所學知識闡述解決實際問題的方法和途徑。課程教學中要致力于培養(yǎng)學生分析問題與解決問題的能力,要求研究生將人工智能方法與自己的研究方向相結(jié)合,用人工智能方法解決所研究課題中的實際問題,并撰寫相關(guān)的課程論文,以小型研討會的形式進行報告交流。實踐證明,我們的研究生的人工智能教學效果明顯提升,成效突出。
??三、案例驅(qū)動,寓教于樂??
采用案例教學是為了充分調(diào)動學生的學習興趣,增強學生學習的自覺性[3]。通過案例教學能把枯燥的人工智能理論知識具體化、形象化,可以使學生更加感性地理解課堂教學內(nèi)容。這些案例都是以教師所從事的科研項目中的實際應(yīng)用環(huán)境為背景進行闡述的,讓學生能在實際環(huán)境中理解概念和知識,學會利用人工智能知識去分析和解決實際問題。在教學過程中要選擇學生容易接受的案例,體現(xiàn)理論聯(lián)系實際的特色,激發(fā)學生的興趣。?
例如,在講授“計算智能”內(nèi)容時,我們結(jié)合黃河三門峽和小浪底水庫水沙聯(lián)合智能調(diào)度系統(tǒng)[4]進行講解。綜合三門峽水庫和小浪底水庫防洪運用的基本原則、歷年調(diào)度方案、專家的經(jīng)驗、歷年數(shù)據(jù)和現(xiàn)有的調(diào)水調(diào)沙數(shù)學模型,分別利用模糊決策、神經(jīng)網(wǎng)絡(luò)、遺傳算法及綜合集成方法來實現(xiàn)三門峽、小浪底水庫水沙聯(lián)合調(diào)度。?
又例如為了讓學生走近機器人,我們進行了一場機器人展示課,將研究所現(xiàn)有的MOROCS?1(中南一號智能移動機器人)、ASR(廣茂達)、AmigoBot(自主移動機器人)、CanDroid(罐頭機器人)、MD?375 Rover(人控漫游車)、Fokker D7(人控飛機,1:72)、Rockit OWI?769K(聲按、壓控火牛機器人)、Hexapod Monster(六足爬行機器人)、Hubo(多機能歌舞機器人)等各類機器人全部拿出來給學生做了功能演示[5]。親眼看到這么多機器人,同學們都非常興奮,對人工智能課程的興趣高漲。?
在進行案例教學時,引導學生帶著問題和求知欲望深入理論的學習,讓學生在案例中尋找問題的答案并獲取知識。在講授利用神經(jīng)網(wǎng)絡(luò)進行水庫調(diào)度時,引導學生分析如何確定神經(jīng)網(wǎng)絡(luò)的輸入端數(shù)據(jù),什么是泛化能力以及如何提高神經(jīng)網(wǎng)絡(luò)的泛化能力。?
為了鞏固所學內(nèi)容,可以讓學生組成討論小組對教師提出的論題進行討論,分小組闡述自己的觀點,這樣有助于提高學生學習的主動性,還有助于培養(yǎng)學生思考問題的能力和提高理論教學的效果。案例教學的關(guān)鍵在于引導學生利用所學到的理論知識去解釋、分析和解決現(xiàn)實案例中的問題,以達到訓練學生理論運用和深入理解理論知識的目的。?
此外,我們挑選了機器人足球、拖拉機撲克牌、中國象棋、五子棋等普遍受人喜愛的智能游戲,讓學生親手設(shè)計小型智能游戲軟件,在設(shè)計的過程中掌握高深的人工智能理論知識,讓學生學得會、用得上、記得牢。
??四、結(jié)語??
以上談到的一些教學方法是我們在教學過程中總結(jié)體會比較深刻的方面,以供探討。事實上,要進一步提高人工智能課程的教學質(zhì)量,還有很多方面需要改革和加強。如不斷強調(diào)人工智能教師的專業(yè)素質(zhì),要求他們在講授好人工智能課程的同時,努力提升出自身的專業(yè)素質(zhì),給學生一個良好的專業(yè)素質(zhì)導向。其次,在人工智能課程教學過程中還需要有培養(yǎng)實用型人才的教學理念,特別是注重培養(yǎng)有創(chuàng)新意識的實用型人才。注重培養(yǎng)學生的質(zhì)疑能力,只有通過質(zhì)疑和提出問題,學生的創(chuàng)新意識才能夠得到不斷強化,創(chuàng)新思維能力才能夠得以不斷提高。?
人工智能學科是一門非常年輕、又非常前沿的學科,有其自身的突出特點,人工智能課程教學必然與其他計算機專業(yè)課程教學不同,需要更多的從事人工智能教學的教師在自身的教學實踐中不斷積累經(jīng)驗,進行廣泛的教學交流。
參考文獻?
[1]
蔡自興, 徐光祐. 人工智能及其應(yīng)用(第三版)(研究生用書)[M]. 北京: 清華大學出版社, 2004(8): 1-4.?
[2]蔡自興, 徐光祐. 人工智能及其應(yīng)用(第三版)(本科生用書)[M]. 北京: 清華大學出版社, 2003(8):288-290.?
[3]雷煥貴, 段云青. 中美案例教學的比較[J]. 教育探索, 2010(6): 150-151.?
篇9
關(guān)鍵詞:音樂檢索;音樂分類;音樂信息檢索系統(tǒng)
1.序言
隨著多媒體和Internet的技術(shù)的發(fā)展和深入普及,推動著各種基于Internet 的音頻應(yīng)用逐步走向?qū)嵱谩8鞣N音頻數(shù)據(jù)的數(shù)量正在呈指數(shù)增長,其信息量也在迅速膨脹。語音和音樂是兩類最重要的音頻信息。如何快速有效地在大量的音樂數(shù)據(jù)中查詢到所需要的內(nèi)容,已經(jīng)成為現(xiàn)代信息檢索領(lǐng)域的一個研究重點。
目前現(xiàn)有絕大多數(shù)的音樂搜索平臺都只支持文本的檢索,比如www.baibu.com。用戶可以通過歌名、歌詞等信息搜索到相關(guān)的音頻文件。但是,許多情況下,人們只記得一部分音樂內(nèi)容,比如旋律。他們希望可以通過這些信息直接搜索到相關(guān)的歌曲。如何基于實際音樂內(nèi)容快速查找到音樂信息成為當前的一個研究熱點。
2.數(shù)字音頻
要對音樂信息進行搜索,首先就需要了解音頻信息的記錄方式。當前音頻信息聲音可通過多種格式進行存儲,總結(jié)下來基本上可以分為兩類:記錄聲音波形變化的格式(如WAV格式)和記錄聲音指令的格式(以MIDI格式為代表)。
波形音頻文件是以數(shù)字方式來表示波形,使用采樣位數(shù)、采樣頻率和聲道數(shù)這三個參數(shù):對聲波進行采樣、量化、編碼,最后轉(zhuǎn)換成數(shù)字形式,并壓縮儲存的聲音文件。
而與波形文件相MIDI是Musical Instrument Digital Interface的縮寫,又稱作樂器數(shù)字接口,是數(shù)字音樂/電子合成樂器的統(tǒng)一國際標準。MIDI文件相對波形文件來說較小,它記錄的內(nèi)容是一系列可以被 PC 的聲卡解釋的數(shù)字音樂指令(音符)。
波形音頻文件是對實時播放的音樂信號進行采樣和數(shù)字編碼,記錄了實際的演奏效果。而MIDI格式則是記錄的一系列音符的演奏信息,如音符的起始、結(jié)束、控制變化等等信息。
另外隨著網(wǎng)絡(luò)和多媒體技術(shù)的進一步發(fā)展,人們對于數(shù)字音頻技術(shù)的研究進一步深入,又出現(xiàn)了多種有損壓縮的編碼格式,這些編碼格式,以極小的聲音失真換取了較高的壓縮比,比如在因特網(wǎng)上廣泛流傳的.MP3格式就是其中的代表。
正是由于不同的音頻記錄格式,并且在每一種格式下又各自有著一系列不同的格式,如何使不同的格式能夠統(tǒng)一為一種能夠為計算機檢索所識別的代碼就成為了音樂信息檢索面臨的主要問題。
3.音樂信息檢索
鑒于音樂信息的多種多樣,目前針對音樂信息的提取也提出的了多種方法。其中大致可以分為基于旋律和基于內(nèi)容兩種方法。
由于MIDI音樂的編碼方式較為簡單,記錄的文件相對較小,目前音樂信息檢索的一個方向就是把復雜的波形文件進行一定的處理,使之成為一段類似于MIDI音樂文件的旋律編碼。目前有一些音樂信息檢索的研究方向就是以MIDI文件為核心,把一系類不同格式的音樂文件通過系統(tǒng)自動分析和處理,轉(zhuǎn)化成為以記錄音樂文件旋律為主的MIDI文件,再通過與其他MIDI文件之間的相互匹配,最終達到查找出相似旋律文件的目的。
而基于內(nèi)容的音頻信息檢索技術(shù)則直接對音頻進行分析,從中抽取內(nèi)容特征,然后利用這些內(nèi)容特征建立索引并進行檢索,避免了用MIDI文件作為音頻信息的轉(zhuǎn)化過程。因而基于內(nèi)容的音頻數(shù)據(jù)信息檢索是目前發(fā)展比較迅速,研究較為深入的一個方向,它可以成為其他許多應(yīng)用研究的基礎(chǔ)。
4.基于內(nèi)容的音樂信息檢索
4.1音頻的抽?。?/p>
對數(shù)字音樂進行搜索的前提條件,就需要明確那一段音樂是我們要進行搜索的目標,有的搜索是針對整個一個音樂文件而言,需要做到所有整個音樂文件的匹配,這樣的搜索相對費時,而有些搜索只要求搜索內(nèi)容相近,或者部分相似的內(nèi)容,這樣我們就不需要對整個音樂文件都去進行信息的抽取。在明確信息搜索的目標后,我們就需要對信息進行提取,目前提取特征有兩種方法:一是提取感性特征,如音高、響度、節(jié)奏;二是計算非感性屬性或稱物理特性,如Mel頻率倒頻譜系數(shù)、平均過零率、線性預測系數(shù)等
4.2音頻的分類:
由于目前的數(shù)字音樂文件數(shù)量龐大,要將所有的文件都遍歷之后進行查詢顯然不可能。因此目前常用的方法主要是實現(xiàn)按一定的方法將音樂文件進行分類,如分為然后根據(jù)特征文件的分類按圖索驥去進行有針對的查找。
目前常用的音頻分類方法主要有:
(1)基于決策樹的分類方法
所謂決策樹是一個類似流程圖的樹型結(jié)構(gòu),樹的每個結(jié)點代表一個屬性(取值) 的測試,其分支代表測試結(jié)果,樹的每個葉結(jié)點代表-個類別。樹的最高層結(jié)點是根結(jié)點。
(2)神經(jīng)網(wǎng)絡(luò)分類算法
神經(jīng)網(wǎng)絡(luò)是一組相互連接的輸入輸出單元,這些單元之間的每個連接都關(guān)聯(lián)一個權(quán)重。 在網(wǎng)絡(luò)學習階段,網(wǎng)絡(luò)通過調(diào)整權(quán)重來實現(xiàn)輸入樣本與其相應(yīng)(正確) 類別的對應(yīng)。 由于網(wǎng)絡(luò)學習主要是針對其中的連接權(quán)重進行,因此神經(jīng)網(wǎng)絡(luò)的學習有時也稱為連接學習。
(3)貝葉斯分類方法
貝葉斯分類算法是統(tǒng)計學分類方法,它是一類利用概率統(tǒng)計知識進行分類的算法。在許多場合,樸素貝葉斯分類算法可以與決策樹和神經(jīng)網(wǎng)絡(luò)分類算法相媲美,該算法能運用到大型數(shù)據(jù)庫中,且方法簡單、分類準確率高、速度快。[5]
(4)近鄰算法
用該方法進行預測的基本概念就是相互之間"接近"的對象具有相似的預測值。如果知道其中一個對象的預測值后,可以預測其最近的鄰居對象。
5.基于內(nèi)容的音樂信息檢索系統(tǒng)
由于目前音樂信息檢索還不能做到完全自動化,因此目前的音樂信息檢索系統(tǒng)應(yīng)該包含以下一些步驟:
第一步,建立數(shù)據(jù)庫。對數(shù)字音樂進行分析,并提取特征,再通過音頻分割,識別分類以后將音樂數(shù)據(jù)裝入數(shù)據(jù)庫的原始音頻庫,將特征裝入音頻特征庫。數(shù)據(jù)庫建立以后就可以進行音樂信息檢索。
第二步,確定查詢特征矢量。即用戶通過查詢界面確定樣本并設(shè)定屬性值,可以是一段哼唱的聲音,可以是具體的數(shù)字音樂文件,然后提交查詢,系統(tǒng)對樣本提取特征,結(jié)合屬性值確定查詢特征矢量。
篇10
關(guān)鍵詞:數(shù)據(jù)挖掘;Web數(shù)據(jù)挖掘;Web內(nèi)容挖掘;Web使用挖掘;Web結(jié)構(gòu)挖掘
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2012)32-7636-03
基于Internet的服務(wù)也飛速產(chǎn)生并發(fā)展起來,企業(yè)急需從Internet這個巨大的信息源中分析客戶行為,尋找商機。就是從這樣的商業(yè)角度考慮,在20世紀80年代末的時候數(shù)據(jù)挖掘(Data Mining)技術(shù)被開發(fā)出來。Web數(shù)據(jù)挖掘就是在Web網(wǎng)絡(luò)基礎(chǔ)上引入數(shù)據(jù)挖掘的思想和方法。通過這一方法解決在Web網(wǎng)絡(luò)中遇到的一些問題,從而形成了Web數(shù)據(jù)挖掘?;赪eb網(wǎng)絡(luò)的數(shù)據(jù)挖掘是數(shù)據(jù)挖掘領(lǐng)域的一個新的重要研究方向,它可以滿足電子商務(wù)未來發(fā)展趨勢的需要。
1 Web數(shù)據(jù)挖掘的研究背景和國內(nèi)外現(xiàn)狀
有統(tǒng)計指出,我國境內(nèi)的Web站點已將近有200萬個,全國現(xiàn)有網(wǎng)民3億7千萬人。網(wǎng)上的信息量已經(jīng)遠遠超過人們的處理能力。Web站點每天都在發(fā)生著不斷的變化,網(wǎng)上的內(nèi)容在不斷的擴大和更新。龐大的快速增長的數(shù)據(jù)中一定有許多有價值的信息,如何發(fā)現(xiàn)并利用這些信息變成了擺在我們面前的一道難題?,F(xiàn)在利用數(shù)據(jù)挖掘技術(shù)與Web技術(shù)相結(jié)合形成Web挖掘,就是用來解決這個難題的有效方法。
2 Web數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘是指從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱含的、未知的、非平凡的及有潛在應(yīng)用價值的信息或模式。數(shù)據(jù)挖掘是一種綜合了數(shù)據(jù)庫、人工智能以及統(tǒng)計學等多個學科技術(shù)的信息處理方法。通過對歷史積累的大量數(shù)據(jù)的有效挖掘,試圖從這些數(shù)據(jù)中提取出先前未知但有效和有用的知識[1-2]。
web挖掘是Web數(shù)據(jù)挖掘(Web Data Mining)的簡稱,也可以被稱為Web知識發(fā)現(xiàn)(WebKnowledge Discovery),他是在數(shù)據(jù)挖掘的基礎(chǔ)上研究發(fā)展而來的,是數(shù)據(jù)挖掘技術(shù)在Web技術(shù)中應(yīng)用的體現(xiàn)。Web挖掘技術(shù)涉及眾多學科的知識,如數(shù)據(jù)庫技術(shù)、網(wǎng)絡(luò)技術(shù)、統(tǒng)計數(shù)學、人工智能等,是一個交叉性的研究領(lǐng)域。[7]
數(shù)據(jù)挖掘所需要的豐富的信息資源其實就蘊藏在Web中。Web中蘊藏了許多豐富和動態(tài)的超鏈接信息以及Web 頁面的訪問和使用信息。而Web挖掘的主要工作就是從Web 文檔和Web 活動中發(fā)現(xiàn)并取得感興趣的潛在的有用模式和隱藏信息。
3 Web 數(shù)據(jù)挖掘的分類
Web數(shù)據(jù)挖掘可以被分為Web內(nèi)容挖掘(Web Content Mining)、Web結(jié)構(gòu)挖掘(Web Structure Mining)、Web使用記錄挖掘(Web Usage Mining),這三大類。這三大類在實際使用過程中并不是獨立使用的,而是相互聯(lián)系、相互交叉和相互滲透的。關(guān)系如圖1所示。
(1) Web內(nèi)容挖掘
從Web頁面文檔內(nèi)容及后臺交易數(shù)據(jù)庫中發(fā)現(xiàn)有價值信息的過程稱為Web內(nèi)容挖掘。其實Web內(nèi)容挖掘我們可以理解為是從浩瀚無際的Web資源中發(fā)現(xiàn)信息、取得信息或資源的過程。Web內(nèi)容挖掘發(fā)現(xiàn)Web資源中的有效數(shù)據(jù)的方法是先對Web網(wǎng)頁上的內(nèi)容做資料挖掘,然后對Web的資源實行自動檢索。Web資源的形式是豐富多樣的,Web上的資源內(nèi)容主要包括網(wǎng)絡(luò)頁面上的內(nèi)容信息和頁面后臺在數(shù)據(jù)庫中發(fā)生的交易記錄等。頁面上的信息是非常豐富的,它包括文本、動畫、超鏈接、圖片、音頻/視頻之類的多媒體數(shù)據(jù)。Web內(nèi)容挖掘主要使用兩種方法:Web頁面內(nèi)容信息挖掘和搜索結(jié)果再次挖掘(即對初步搜索或挖掘的結(jié)果作進一步的改進挖掘處理)。
(2) Web結(jié)構(gòu)挖掘
WSM(Web Structure Mining)是Web挖掘中的一個重要分類方向,它的主要工作方法是通過研究和分析各個網(wǎng)絡(luò)頁面之間的結(jié)構(gòu)信息,從而找到隱藏在頁面內(nèi)容之外有價值的信息的過程。
網(wǎng)頁正文,網(wǎng)頁所含的超文本標記以及網(wǎng)頁間的超鏈接,這三個部分組成了Web頁面中的有效信息。其實實際上,僅僅網(wǎng)頁之間的超鏈接,并不能代表Web的結(jié)構(gòu):
從廣義上講,Web的結(jié)構(gòu)包含有:
① URL字符串中的目錄路徑結(jié)構(gòu)信息;
② 網(wǎng)頁內(nèi)部內(nèi)容的可以用HTML、XML表示成的樹形結(jié)構(gòu);
③ 網(wǎng)頁之間的超鏈接結(jié)構(gòu)。
Web結(jié)構(gòu)挖掘涉及到海量的計算信息數(shù)據(jù),怎樣解決大量信息數(shù)據(jù)和有限的計算存儲空間之間的矛盾,怎樣提升數(shù)據(jù)挖掘算法的效率和實時性將是一個有待大家繼續(xù)深入探討研究的問題。
(3) Web使用記錄的挖掘[3]
網(wǎng)絡(luò)上的原始數(shù)據(jù)是Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘的對象。但是Web使用記錄的挖掘則卻和前兩者并不相同,它是對web上第二類數(shù)據(jù)即Web日志數(shù)據(jù)及相關(guān)數(shù)據(jù)的挖掘。Web使用記錄是通過挖掘Web訪問記錄發(fā)現(xiàn)有價值的數(shù)據(jù),提取感興趣,有價值的模式。
通過分析這些信息數(shù)據(jù),我們可以理解并且分析用戶的行為,從而發(fā)現(xiàn)電子商務(wù)的潛在客戶,幫助我們不斷地改善Web站點的結(jié)構(gòu)或為用戶提供個性化的服務(wù),并且對Web服務(wù)器系統(tǒng)的性能進行改進。
Web使用記錄挖掘應(yīng)用的技術(shù)主要有路徑分析、關(guān)聯(lián)規(guī)則分析、序列模式分析、聚類分析、統(tǒng)計分析等。Web使用記錄挖掘可以發(fā)現(xiàn)潛在的用戶、改進電子商務(wù)網(wǎng)站的建設(shè),增加個性化服務(wù)等。
這方面的研究主要有兩個方向:一般訪問模式挖掘和個性化的使用記錄挖掘。
4 數(shù)據(jù)挖掘的主要技術(shù)
數(shù)據(jù)挖掘技術(shù)是多個不同學科領(lǐng)域的技術(shù)與成果結(jié)合的成果,現(xiàn)今的數(shù)據(jù)挖掘技術(shù)主要有人工智能、數(shù)據(jù)庫技術(shù)、概率與數(shù)理統(tǒng)計三個主要方面。以下是幾種比較常用的技術(shù):
(1)關(guān)聯(lián)分析
關(guān)聯(lián)分析是指如果兩個或多個事物之間存在一定的關(guān)聯(lián),那么其中一個事物就能通過其他事物進行預測[7]。它的目的是為了挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。從大量的數(shù)據(jù)中發(fā)現(xiàn)其關(guān)聯(lián)知識在市場定位、決策分析和商業(yè)管理等領(lǐng)域是極為有用的。例如,網(wǎng)絡(luò)中的電子商店收集存儲了大量的客戶銷售數(shù)據(jù),這些數(shù)據(jù)清晰地記錄了每個客戶的購買事務(wù);比如交易的受理時間、顧客選擇購買的物品、物品的數(shù)量及金額等。商家可以通過利用這些數(shù)據(jù)使用關(guān)聯(lián)分析知道每個顧客進入電子商場購物時,商家想知道的是顧客會購買哪些商品?除了這個商品以外還會買什么,它們之間的聯(lián)系時什么?購買這些商品的顧客有什么共同的特點?通過得到的這些信息可以很好的幫助店家,制訂出針對商品和顧客管理的一系列商業(yè)決策,從而提高銷售額。
(2) 聚類分析
數(shù)據(jù)庫中的數(shù)據(jù)可以規(guī)則分為一系列有意義的子集,稱為聚類。將由聚類所生成的一組數(shù)據(jù)對象的集合,他們之間的相似度比較高,每一個個體之間的;離得較近;不同組中的對象差異較大,個體之間距離則較遠。在實際情況的使用中,可以根據(jù)已有顧客的數(shù)據(jù),可以利用聚類分析將掌握的客戶數(shù)據(jù)根據(jù)客戶之間的共同特點來細分的市場,比如追求相似利益的人群、具有相同愛好的人群、相同年齡層次的人群、相同收入水平的人群、相同職業(yè)特征的人群等等,制定正確的市場策略,使企業(yè)在如此激烈的競爭環(huán)境中取得有利位置。
(3) 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)的工作原理是對人類大腦思維系統(tǒng)的一個簡單的結(jié)構(gòu)模擬。人腦神經(jīng)元的基本功能是多個神經(jīng)元連接而成的多層網(wǎng)絡(luò)模仿而成。神經(jīng)網(wǎng)絡(luò)是仿照生理神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立的非線性預測模型,通過學習進行模式識別。正是它的出現(xiàn)為許多傳統(tǒng)信息難以解決的問題提供了一種較為簡單有效的方法,所以近年來人工神經(jīng)網(wǎng)絡(luò)技術(shù)得到不斷成熟和發(fā)展。
(4) 分類分析
數(shù)據(jù)挖掘中應(yīng)用比較頻繁的方法就是分類。分類是找出一組類別,能夠描述數(shù)據(jù)集合典型特征的模型,它具有此類數(shù)據(jù)的共同特點,可以用它來分類識別未知數(shù)據(jù)的歸屬或類別。
分類一般用于預測有限離散值。但某些情況下,需要預測某數(shù)值屬性的值(連續(xù)數(shù)值),在這種情況下分類就稱為預測。
(5) 決策樹
決策樹從它的名字就不難發(fā)現(xiàn)它的結(jié)構(gòu)就像一棵樹。它利用樹的結(jié)構(gòu)將數(shù)據(jù)記錄進行分類,是一種預測模型。決策樹分類方法是一種通過構(gòu)造決策樹來發(fā)現(xiàn)訓練集中分類知識的數(shù)據(jù)挖掘方法,其關(guān)鍵是能夠構(gòu)造出規(guī)模小、精度高的決策樹。例如,我們要分析一個公司的客戶接受某項新產(chǎn)品的情況,我們可以從中選取50 個客戶,其中25 個愿意接受并購買這個新產(chǎn)品的,25 個不愿意接受并購買這個新產(chǎn)品的。我們通過建立決策樹的方法來來分析客戶的情況,并從中分析和尋找到一些潛藏的規(guī)則信息,然后幫助企業(yè)銷售。
5 結(jié)束語
該文討論了Web數(shù)據(jù)挖掘的基本概念、基礎(chǔ)工作原理和所使用的關(guān)鍵技術(shù)。在未來隨著電子商務(wù)的迅速發(fā)展,Web數(shù)據(jù)挖掘有了更廣闊的舞臺。Web挖掘技術(shù)能夠幫助我們發(fā)現(xiàn)一些與用戶檢索的關(guān)鍵詞密切相關(guān)的有價值網(wǎng)頁,從而實現(xiàn)個性化檢索。它可以幫助商家發(fā)現(xiàn)和獲取客戶,對商家的市場策略進行調(diào)整和改進,并對其進行正確的決策指導,促進電子商務(wù)的發(fā)展。
參考文獻:
[1] L Wu,P.S.Yu,A.Baliman.Speed Tracer:A Web usagemining andanalysist001.IBM Systems Journal,37(1):89-105,1998.
[2] N.Good,B.Schafer,J.Konstan,A.Borchers,B.Sarwar,J.Herlocker,and J.Riedl,(1999).Combining Collaborative Filtering With Personal Agents forBetter Recommendations.In Proceedings of the conference,439-446.
[3] 韓家煒,孟小峰,王靜,等.Web挖掘研究[J].計算機研究與發(fā)展,2001,38(4):405-414.
[4] Jiawei Han and Micheline Kamber.Data Mining:Technique and Concepts,Morgan Kaufmann Publishers,2001.
[5] 李鳳慧.面向電子商務(wù)的web數(shù)據(jù)挖掘的研究[D].山東:山東科技大學,2004,6.