數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒防御的應(yīng)用

時(shí)間:2022-09-19 08:56:26

導(dǎo)語(yǔ):數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒防御的應(yīng)用一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒防御的應(yīng)用

1前言

隨著信息技術(shù)的發(fā)展和科技的進(jìn)步,信息安全在人們的日常工作、生活中起到了非常重要的作用??v觀國(guó)內(nèi)外,由信息安全問(wèn)題引起的信息泄露、竊取、財(cái)產(chǎn)損失等事件頻發(fā),雖然現(xiàn)在計(jì)算機(jī)的防御病毒侵害的性能有了很大的提高和改善,但在防御過(guò)程中還是會(huì)有很多不足之處。因此,提出一種能夠較好地防御計(jì)算機(jī)網(wǎng)絡(luò)病毒攻擊的方法顯得至關(guān)重要。針對(duì)該問(wèn)題,提出了一種數(shù)據(jù)挖掘技術(shù)來(lái)提升計(jì)算機(jī)的整體防御性能,并有效地避免網(wǎng)絡(luò)病毒的入侵。

2數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘,簡(jiǎn)稱KDD,一般是指從大量的數(shù)據(jù)中通過(guò)算法搜索隱藏于其中的、未知的且有價(jià)值的信息和知識(shí)的一個(gè)過(guò)程。它所需要用到的知識(shí)很多,包括計(jì)算機(jī)技術(shù)、統(tǒng)計(jì)學(xué)、情報(bào)檢索、機(jī)器學(xué)習(xí)、模糊識(shí)別等。在挖掘過(guò)程中,主要分為三個(gè)步驟:數(shù)據(jù)準(zhǔn)備、尋找數(shù)據(jù)規(guī)律、表示數(shù)據(jù)規(guī)律。數(shù)據(jù)挖掘的結(jié)構(gòu)如圖1所示。當(dāng)確定數(shù)據(jù)挖掘后,相關(guān)引擎啟動(dòng),開(kāi)始收索需要挖掘的數(shù)據(jù),找出其中數(shù)據(jù)的規(guī)律。完整的數(shù)據(jù)挖掘包括了很多工作,重點(diǎn)在于數(shù)據(jù)的預(yù)處理,這里面主要包括了數(shù)據(jù)的凈化、格式轉(zhuǎn)換、變量整合和鏈接數(shù)據(jù)表等。只有做好了數(shù)據(jù)的預(yù)處理工作,才能為后期數(shù)據(jù)的分析做好鋪墊。

3網(wǎng)絡(luò)病毒概述及特征

3.1網(wǎng)絡(luò)病毒特征。3.1.1種類繁多。計(jì)算機(jī)網(wǎng)絡(luò)病毒的種類繁多,一般都是通過(guò)人為編寫(xiě)的程序入侵使用者電腦,并且改變幾條程序代碼就可以生成多種新的病毒,具有不確定性。3.1.2可通過(guò)多種方式傳播。計(jì)算機(jī)網(wǎng)絡(luò)病毒可通過(guò)多種方式傳播,常見(jiàn)的有系統(tǒng)漏洞傳播、網(wǎng)頁(yè)傳播和電子郵件傳播等[1]。3.1.3傳播速度快、破壞性、針對(duì)性強(qiáng)。計(jì)算機(jī)網(wǎng)絡(luò)病毒有些比較復(fù)雜,往往還結(jié)合了其他的技術(shù),如木馬技術(shù)、黑客技術(shù)等[3],將這些技術(shù)融合在一種病毒上,就具有極強(qiáng)的破壞性,且它的隱蔽性也很好,不易發(fā)現(xiàn)。除此以外,計(jì)算機(jī)網(wǎng)絡(luò)病毒還具有較強(qiáng)的針對(duì)性。這一病毒,往往是設(shè)計(jì)者針對(duì)某一特點(diǎn)或特有的現(xiàn)象編寫(xiě)的一類特定程序,通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)有針對(duì)性地破壞,從而謀取利益。3.1.4具有潛伏性。一旦網(wǎng)絡(luò)中感染了計(jì)算機(jī)病毒,即使病毒被清除,還是具有一定的潛伏性,有可能會(huì)存在再次染毒的風(fēng)險(xiǎn)[4]。3.2防御網(wǎng)絡(luò)病毒的重要性。網(wǎng)絡(luò)病毒感染速度快,具有較大的破壞性,且恢復(fù)遭到病毒破壞的網(wǎng)絡(luò)很麻煩,需要相當(dāng)?shù)臅r(shí)間和精力。因此,防御網(wǎng)絡(luò)病毒就顯得尤為重要[5]。

4數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用

4.1計(jì)算機(jī)網(wǎng)絡(luò)病毒與數(shù)據(jù)挖掘之間的關(guān)系。計(jì)算機(jī)網(wǎng)絡(luò)病毒一旦侵入使用者電腦,會(huì)迅速傳播和破壞,入侵到計(jì)算機(jī)核心——操作系統(tǒng),然后會(huì)對(duì)計(jì)算機(jī)中的所有信息進(jìn)行整合和有針對(duì)性、有破壞性的破壞。而利用數(shù)據(jù)挖掘技術(shù),就可以在病毒入侵時(shí)獲取病毒的相關(guān)信息,分析網(wǎng)絡(luò)運(yùn)行中的數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行有效的處理,從而來(lái)抵御病毒的破壞,保障用戶計(jì)算機(jī)的安全[6]。4.2數(shù)據(jù)挖掘技術(shù)的組成。數(shù)據(jù)挖掘技術(shù)集合了多門技術(shù),在應(yīng)用中將其功能劃分為多個(gè)功能模塊來(lái)分析,主要通過(guò)這些模塊來(lái)構(gòu)建計(jì)算機(jī)網(wǎng)絡(luò)病毒的防御系統(tǒng)[7]。第一,數(shù)據(jù)源模塊。抓包程序是數(shù)據(jù)源模塊的主要來(lái)源,它主要是指截獲數(shù)據(jù)包,這個(gè)數(shù)據(jù)包是通過(guò)網(wǎng)絡(luò)來(lái)截獲的。最原始的數(shù)據(jù)包就存在于數(shù)據(jù)源模塊中,并且還涉及有關(guān)某個(gè)特定數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)。當(dāng)抓包程序被數(shù)據(jù)源模塊截獲后,就會(huì)交由下一個(gè)模塊預(yù)處理模塊來(lái)處理[8]。第二,預(yù)處理模塊。預(yù)處理模塊是整個(gè)數(shù)據(jù)挖掘中較關(guān)鍵的一個(gè)模塊,在這一模塊中,將對(duì)各種數(shù)據(jù)進(jìn)行變換、分析、歸類、處理等,將它們轉(zhuǎn)換為能夠被識(shí)別的數(shù)據(jù),從而有效地縮短挖掘的時(shí)間,提高效率。第三,規(guī)則庫(kù)模塊。規(guī)則庫(kù)模塊的主要作用是找到一個(gè)規(guī)則集。這個(gè)規(guī)則集主要是通過(guò)一定的聚類分析、識(shí)別等來(lái)檢測(cè)出各種網(wǎng)絡(luò)病毒的數(shù)據(jù)特點(diǎn)或者連接點(diǎn)的規(guī)律。這個(gè)模塊也是數(shù)據(jù)挖掘中的關(guān)鍵因素之一。通過(guò)聚類分析,不僅可以有效完善數(shù)據(jù)挖掘的規(guī)則庫(kù),還可以為后期病毒數(shù)據(jù)特征的選擇和收集提供有效的依據(jù)。第四,數(shù)據(jù)挖掘模塊。數(shù)據(jù)挖掘模塊主要由兩大部分組成,一是數(shù)據(jù)挖掘算法,二是事件庫(kù)。它的工作過(guò)程主要是通過(guò)算法來(lái)對(duì)事件庫(kù)進(jìn)行數(shù)據(jù)的分析和分類,得出相應(yīng)的數(shù)據(jù),交給決策模塊執(zhí)行[9]。第五,決策模塊。在這一模塊中,主要是將數(shù)據(jù)挖掘的結(jié)果與規(guī)則中的規(guī)則和數(shù)據(jù)進(jìn)行匹配,當(dāng)結(jié)果相匹配時(shí),就說(shuō)明網(wǎng)絡(luò)病毒已存在于數(shù)據(jù)包中;當(dāng)結(jié)果不匹配時(shí),則發(fā)出發(fā)現(xiàn)未知網(wǎng)絡(luò)病毒數(shù)據(jù)的警報(bào),并將這一病毒加入規(guī)則庫(kù)中。4.3數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒防御系統(tǒng)中的應(yīng)用。(1)關(guān)聯(lián)規(guī)則。在關(guān)聯(lián)分析中,主要是為了找出數(shù)據(jù)庫(kù)中存在的關(guān)聯(lián)網(wǎng),在兩個(gè)或兩個(gè)以上的變量值中如果具有一定的規(guī)律性,那就說(shuō)明這些數(shù)據(jù)間可能存在一定的關(guān)聯(lián)關(guān)系。通過(guò)關(guān)聯(lián)網(wǎng),就能夠挖掘到整個(gè)數(shù)據(jù)庫(kù)中的關(guān)系,從而較快抓到病毒[10]。(2)分類規(guī)則。分類的目的就是將數(shù)據(jù)分門別類,然后通過(guò)機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等方法分類構(gòu)建模型的過(guò)程。(3)聚類規(guī)則。聚類的原則是先將不同的數(shù)據(jù)包進(jìn)行分解和分組,分組的原則是將相似特征的數(shù)據(jù)分在一組中,通過(guò)聚類,能夠識(shí)別出數(shù)據(jù)的不同特征,以便能呈現(xiàn)出不同的數(shù)據(jù)分布模式和屬性關(guān)系。(4)異類規(guī)則。異類規(guī)則是查找出數(shù)據(jù)中的偏離點(diǎn),或者是不同規(guī)律和特征的數(shù)據(jù),通過(guò)分析這些偏離點(diǎn)或孤立點(diǎn),可以挖掘出其中的更有價(jià)值的數(shù)據(jù),為后續(xù)工作提供更有力的參考。(5)序列分析規(guī)則。通過(guò)序列分析規(guī)則,可以找出隨機(jī)數(shù)據(jù)中存在的某些病毒的數(shù)據(jù)排列規(guī)律,并構(gòu)建序列模型,應(yīng)用數(shù)據(jù)挖掘算法,查找出頻繁出現(xiàn)的數(shù)據(jù),分析其關(guān)聯(lián)性,判斷其是否屬于病毒數(shù)據(jù)序列。序列分析規(guī)則實(shí)際上就是一種統(tǒng)計(jì)方法。

5結(jié)語(yǔ)

隨著信息時(shí)代的不斷發(fā)展,網(wǎng)絡(luò)已成為人們生活、學(xué)習(xí)、工作中密不可分的一部分,要想保證網(wǎng)絡(luò)環(huán)境安全,就必須維護(hù)網(wǎng)絡(luò)的性能和系統(tǒng),這其中重要的就是避免計(jì)算機(jī)網(wǎng)絡(luò)病毒入侵,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到計(jì)算機(jī)網(wǎng)絡(luò)病毒的防御中來(lái),能夠有效抵制和預(yù)防計(jì)算機(jī)網(wǎng)絡(luò)病毒的入侵,從而保障計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)的安全。

參考文獻(xiàn)

[1]劉春娟.數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用分析[J].電子測(cè)試,2014(5).

[2]黨紅恩,趙爾平,劉煒,等.利用數(shù)據(jù)變換與并行運(yùn)算的閉頻繁項(xiàng)集挖掘方法[J].湘潭大學(xué)自然科學(xué)學(xué)報(bào),2018,40(1):119-122.

[3]潘大勝.論數(shù)據(jù)挖掘在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用[J].西南農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2012(12).

[4]呂睿.數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用分析[J].電子測(cè)試,2014(5).

[5]欒志福.數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用分析[J].赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版),2015(15).

[6]茍?jiān)?數(shù)據(jù)挖掘在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用[J].湖北函授大學(xué)學(xué)報(bào),2016(14).

[7]鄭卓遠(yuǎn),周婭.數(shù)據(jù)挖掘?qū)π畔踩挠绊慬J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2008(3).

[8]李森,胡學(xué)鋼,李正吉.Web數(shù)據(jù)挖掘研究綜述[J].山東紡織經(jīng)濟(jì),2008(1).

[9]賀蓉,趙振西,周學(xué)海,等.聯(lián)合挖掘發(fā)現(xiàn)網(wǎng)絡(luò)安全事件[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2006(2).

[10]張仁斌.計(jì)算機(jī)病毒與反病毒技術(shù)[M].北京:清華大學(xué)出社,2006.—154—

作者:鄭黎 單位:四川工程職業(yè)技術(shù)學(xué)院