神經(jīng)網(wǎng)絡(luò)在信息安全的應(yīng)用
時間:2022-11-28 10:42:50
導(dǎo)語:神經(jīng)網(wǎng)絡(luò)在信息安全的應(yīng)用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
目前信息安全問題已經(jīng)得到社會的廣泛關(guān)注,目前在信息安全管理中主要依靠現(xiàn)有的病毒庫,采用病毒查殺的方法來保證系統(tǒng)安全。但是在實際上,這種病毒查殺方法并不具有高效、預(yù)先防御的功能,導(dǎo)致很多新型病毒出現(xiàn)后系統(tǒng)的安全保護出現(xiàn)滯后性。而PCA技術(shù)的出現(xiàn)進一步強化信息安全管理能力,可以有效避免信息安全事件發(fā)生,具有先進性,值得關(guān)注。
1PCA技術(shù)分析1.1PCA技術(shù)概括
在當(dāng)前的實時網(wǎng)絡(luò)環(huán)境下,網(wǎng)絡(luò)數(shù)據(jù)的流通數(shù)量越來越大,并表現(xiàn)出高度的數(shù)據(jù)維度特征,尤其是在業(yè)務(wù)的高峰時期,有效的識別數(shù)據(jù)特征并對異常數(shù)據(jù)進行隔離是保證信息安全的關(guān)鍵。在這種情況下,基于統(tǒng)計學(xué)中的PCA技術(shù)(主成分分析方法)出現(xiàn),并成為現(xiàn)階段處理網(wǎng)絡(luò)數(shù)據(jù)的常見方法,與傳統(tǒng)技術(shù)相比,該技術(shù)能夠進一步降低數(shù)據(jù)維度,并最大程度上保證了數(shù)據(jù)所具有的原始特征。在這種情況下,數(shù)據(jù)量減少且維度降低有助于提高異常數(shù)據(jù)的監(jiān)測性能,這是傳統(tǒng)技術(shù)所不具備的。1.2主動成分分析方法的降維原理PCA技術(shù)是一種可以將高緯度數(shù)據(jù)的不同數(shù)據(jù)映射成為少數(shù)幾個能夠代表元數(shù)據(jù)特征值的降維方法,在經(jīng)過這種數(shù)據(jù)處理之后,這些少數(shù)的特征值可以反映出原有數(shù)據(jù)的特征屬性,并且為了保證數(shù)據(jù)處理效果,這些處理之后的數(shù)據(jù)是沒有關(guān)聯(lián)性的。在PCA的數(shù)學(xué)表達過程中,假設(shè)待處理的網(wǎng)絡(luò)異常源數(shù)據(jù)具有n個維數(shù)特征值,表述為:x1、x2……xn,在經(jīng)過PCA處理之后,就可以將其轉(zhuǎn)變?yōu)閚個綜合變量,通過這種計算方法可以確定不同綜合指標(biāo)因子y的維度數(shù),并且從第一個變量開始一直到第n個變量數(shù),且方差呈現(xiàn)出依次遞減的特征。
2基于主成分分析法的BP神經(jīng)網(wǎng)絡(luò)信息安全管理分析
2.1BP神經(jīng)網(wǎng)絡(luò)信息分析。BP神經(jīng)網(wǎng)絡(luò)最初是對人類大腦的工作進行抽象模擬的技術(shù),其中涉及到了計算機科學(xué)、生物學(xué)、數(shù)學(xué)等內(nèi)容,目前已經(jīng)在廣泛應(yīng)用在人工智能機器學(xué)中。從功能來看,BP神經(jīng)網(wǎng)絡(luò)可以通過學(xué)習(xí)與訓(xùn)練過程來調(diào)整網(wǎng)絡(luò)的連接權(quán)值,最終達到從輸入到輸出過程的完整收斂狀態(tài)。所以在當(dāng)前的數(shù)據(jù)處理中,BP圣經(jīng)網(wǎng)絡(luò)具有滿意的網(wǎng)絡(luò)信息處理能力,針對網(wǎng)絡(luò)信息傳輸過程中存在的信息變形失真或者信息丟失不完整情況進行抽象補充。最后,BP神經(jīng)網(wǎng)絡(luò)具有一定的自主學(xué)習(xí)能力,能夠識別訓(xùn)練樣本中各種異常數(shù)據(jù),且對于異常數(shù)據(jù)的變形形式也有一定的識別效果。2.2基于BP的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)步驟。在BP神經(jīng)網(wǎng)絡(luò)中,在學(xué)習(xí)樣本從輸入層輸入到網(wǎng)絡(luò)中之后,神經(jīng)元的激活值開始從輸入層一直想輸出層傳遞,這個過程中,各層的神經(jīng)元在數(shù)據(jù)上否會得到相應(yīng);之后根據(jù)減少目標(biāo)情況,可以反向從輸出層到隱含層再到輸入層,通過一層一層的修正權(quán)值,保證了數(shù)據(jù)處理過程。而在實際上,這種反向誤差的持續(xù)修正,可以提高網(wǎng)絡(luò)對輸入模式相應(yīng)的正確率。
3仿真分析
3.1實驗數(shù)據(jù)源的確定。本次仿真實驗中采用了KDDCUP99數(shù)據(jù)集,該數(shù)據(jù)集主要包含4898431條記錄,本文在該數(shù)據(jù)集的基礎(chǔ)上,基于10%的測試子集與訓(xùn)練自己進行仿真實驗,實驗中不僅包含了各種正常數(shù)據(jù),也包含異常數(shù)據(jù),并且每個異常數(shù)據(jù)中都包含不同的入侵攻擊行為。3.2仿真準(zhǔn)備階段。3.2.1選擇仿真平臺。本次研究中選擇了MATLAB仿真平臺,該平臺是一款在圖像處理、系統(tǒng)仿真以及計算機等領(lǐng)域應(yīng)用十分廣泛的軟件平臺,經(jīng)過長時間的發(fā)展,仿真平臺可以提供大量的便捷工具,因此在科研領(lǐng)域得到充分運用。3.2.2PCA相關(guān)函數(shù)的提取。本文所界定的PCA相關(guān)函數(shù)的資料與表1所示。3.2.3攻擊類型與數(shù)目的確定在本次仿真分析過程中所使用的Kddcup文件中包含494021條源數(shù)據(jù),在這些數(shù)據(jù)處理中,通過SQL數(shù)據(jù)庫進行處理,篩除其中的重復(fù)數(shù)據(jù),得到了攻擊數(shù)據(jù)的詳細資料,相關(guān)內(nèi)容如表2所示。同時在數(shù)據(jù)處理階段,考慮仿真過程中由于MATLAB環(huán)境下無法識別費數(shù)據(jù)化資料,因此數(shù)據(jù)中的234維度都需要轉(zhuǎn)變?yōu)榉菙?shù)值化數(shù)據(jù),采用1代替。3.3數(shù)據(jù)的歸一化處理與仿真實施。3.3.1數(shù)據(jù)歸一化處理。數(shù)據(jù)歸一化處理在實際上就是數(shù)據(jù)標(biāo)準(zhǔn)化處理,本文為了進一步提高數(shù)據(jù)質(zhì)量水平,在保證數(shù)據(jù)集不丟失自身特征的基礎(chǔ)上轉(zhuǎn)變?yōu)橐环N更緊湊的形式,所以在數(shù)據(jù)處理過程中,將詭異處理后的數(shù)據(jù)集進行集中處理,使整個仿真分析所需要的資源與時間更少,效率更高,則處理過程為:(1)計算帶訓(xùn)練數(shù)據(jù)集中的源數(shù)據(jù)集,提取數(shù)據(jù)集中的所有元素的平均值,記為P0;(2)將源數(shù)據(jù)集中的所有元素標(biāo)準(zhǔn)化,獲得標(biāo)準(zhǔn)差;(3)將源數(shù)據(jù)集歸一化處理。3.3.2仿真處理。考慮到實驗結(jié)果是未知的,并且基于PCA的BP神經(jīng)網(wǎng)絡(luò)安全中存在不同分量特征的數(shù)目,這些神經(jīng)元數(shù)量無法確定,因此在數(shù)據(jù)處理過程中,可以在分類模擬訓(xùn)練的基礎(chǔ)上通過多次連續(xù)的實驗來保證PCA的模型仿真結(jié)果實現(xiàn)最優(yōu)化。因此在本次研究中,本文將結(jié)合訓(xùn)練數(shù)據(jù)集Train.txt與測試數(shù)據(jù)集進行降維處理,這樣可以獲得不同主分量,之后獲取完成的主分量加入到BP神經(jīng)網(wǎng)絡(luò)中,將測試集通過的PCA對BP神經(jīng)網(wǎng)絡(luò)進行識別,經(jīng)過多次反復(fù)的數(shù)據(jù)處理,可以得到基于PCA的BP神經(jīng)網(wǎng)絡(luò)安全管理結(jié)果。在數(shù)據(jù)處理過程中,基于PCA的BP神經(jīng)網(wǎng)絡(luò)信息安全管理直接與未改進的BP神經(jīng)網(wǎng)絡(luò)上進行對比,通過對比兩種方法對信息安全數(shù)據(jù)的識別效果,評價PCA技術(shù)的優(yōu)勢。3.4識別結(jié)果與分析。從本次仿真實驗來看,基于PCA的BP神經(jīng)網(wǎng)絡(luò)對于不同攻擊類型具有更強的識別率,相關(guān)資料如表3所示。根據(jù)表3的相關(guān)資料可知,結(jié)果相比基于PCA改進的BP神經(jīng)網(wǎng)絡(luò)對于各類網(wǎng)絡(luò)攻擊具有更高的識別率,整體信息安全管理能力要顯著高于傳統(tǒng)方法。根據(jù)這一結(jié)果,共得出以下結(jié)論:(1)與傳統(tǒng)的檢測方法相比,PCA改進的BP神經(jīng)網(wǎng)絡(luò)誤報率顯著下降,證明該方法可以在BP神經(jīng)網(wǎng)絡(luò)信息安全管理中提高了安全事件的信息識別率;(2)在五種攻擊類型中,系統(tǒng)對NORMAL攻擊類型的識別率最好,對U2R攻擊類型的識別率較差。這一結(jié)果在一定程度上說明了人工神經(jīng)網(wǎng)絡(luò)在訓(xùn)練樣本充足的情況下,系統(tǒng)對閾值的調(diào)節(jié)更細致,所以網(wǎng)絡(luò)信息安全管理的效果好,且識別率更高;相反訓(xùn)練樣本不足,在一定程度上會影響識別率。因此可以認為基于PCA的BP神經(jīng)網(wǎng)絡(luò)通過處理對于異常數(shù)據(jù)具有很高的識別率,因此面對海量異常數(shù)據(jù)也保持著滿意的識別率,這是傳統(tǒng)技術(shù)所具備的,該方法通過主成分分析保證了原有數(shù)據(jù)的特征,提高了數(shù)據(jù)識別的準(zhǔn)確率。
4結(jié)束語
本文詳細分析了基于PCA的BP神經(jīng)網(wǎng)絡(luò)信息安全管理問題,從本文的實驗仿真結(jié)果來看,PCA方法滿足BP神經(jīng)網(wǎng)絡(luò)信息安全管理要求,與傳統(tǒng)方法相比,該方法對于安全信息具有更高的識別率,因此值得推廣。
參考文獻
[1]劉凱崢,王振國.高速公路收購價值研究——基于非線性主成分分析和RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型[J].中國市場,2019(30):159-160.
作者:白軼 車宇 單位:中國核動力研究設(shè)計院