數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒預(yù)防的應(yīng)用

時間:2022-02-22 08:33:14

導(dǎo)語:數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒預(yù)防的應(yīng)用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒預(yù)防的應(yīng)用

摘要:在網(wǎng)絡(luò)不斷普及的過程中,其逐漸被應(yīng)用于金融、財產(chǎn)、人際關(guān)系等多種領(lǐng)域,在網(wǎng)絡(luò)的應(yīng)用過程中所產(chǎn)生的大量數(shù)據(jù)會造成網(wǎng)絡(luò)病毒,因此,對海量網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行挖掘不僅能夠幫助用戶更好使用數(shù)據(jù),同時能夠預(yù)防使用過程中的網(wǎng)絡(luò)病毒。數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用,首先提出挖掘原理,建立數(shù)據(jù)開采模型和挖掘過程,同時在挖掘過程中建立數(shù)據(jù)倉庫,利用貝葉斯算法預(yù)防病毒,幫助提高網(wǎng)絡(luò)安全性。

關(guān)鍵詞:數(shù)據(jù)挖掘;網(wǎng)絡(luò)病毒預(yù)防;貝葉斯

1引言

隨著數(shù)據(jù)庫、數(shù)據(jù)倉庫等數(shù)據(jù)倉儲技術(shù)的發(fā)展,信息系統(tǒng)逐漸被金融、財產(chǎn)、人際關(guān)系等多種領(lǐng)域運用。數(shù)據(jù)化時代的來臨,給人們帶來便利的同時,如此海量的數(shù)據(jù)也讓人難以消化。從表面來看,海量數(shù)據(jù)中蘊含著許多有用信息,但是這些數(shù)據(jù)不能運用到實際工作中。同時隨著數(shù)據(jù)的增加,負(fù)面作用也越來越明顯[1]。巨大的信息量難以處理,同時真?zhèn)坞y辨,為信息安全帶來威脅。在這種情況下,人們開始意識到數(shù)據(jù)挖掘的重要性。信息挖掘技術(shù)能夠被應(yīng)用于網(wǎng)絡(luò)防護(hù)、危險評估等,有效檢測網(wǎng)絡(luò)病毒和入侵行為。挖掘是一門混合型的學(xué)科,其中涉及數(shù)據(jù)庫技術(shù)、統(tǒng)計學(xué)知識、可視化、信息學(xué)科等。數(shù)據(jù)挖掘技術(shù)能夠?qū)⒁延械臄?shù)據(jù)進(jìn)行整理,同時對其中隱藏數(shù)據(jù)進(jìn)行提取。數(shù)據(jù)挖掘技術(shù)能夠有效監(jiān)測出網(wǎng)絡(luò)病毒的活動并進(jìn)行預(yù)防[2]。數(shù)據(jù)挖掘技術(shù)能夠?qū)崿F(xiàn)病毒的預(yù)防與檢測,對入侵病毒的數(shù)量和形式進(jìn)行反饋。數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)起到重要的保護(hù)作用,在實際生活中得到廣泛應(yīng)用。

2數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用原理

數(shù)據(jù)庫在數(shù)據(jù)挖掘過程中被作為數(shù)據(jù)管理系統(tǒng)廣泛使用,隨著數(shù)據(jù)庫中數(shù)據(jù)的不斷儲存,數(shù)據(jù)分析處理技術(shù)需要不斷發(fā)展。數(shù)據(jù)庫中,人們能夠利用的數(shù)據(jù)僅僅是其中的一小部分,其中大部分有用數(shù)據(jù),由于使用工具的局限性不能被人們很好利用。數(shù)據(jù)庫中的數(shù)據(jù)被人們所利用的僅僅是很小一部分,但是這些信息在決策生成的過程中具有重要的參考價值。為此,研究數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用[3]。數(shù)據(jù)挖掘就是“對數(shù)據(jù)庫中蘊涵的、未知的、有潛在應(yīng)用價值的、非平凡的模式的提取”。數(shù)據(jù)挖掘基本原理可分為六個過程,具體如下。(1)明確任務(wù):了解應(yīng)用領(lǐng)域與知識背景,并且明確所要完成的數(shù)據(jù)挖掘任務(wù);(2)數(shù)據(jù)選擇:從大數(shù)據(jù)中提取需要的數(shù)據(jù),對其進(jìn)行數(shù)據(jù)挖掘;(3)數(shù)據(jù)預(yù)處理與轉(zhuǎn)換:對數(shù)據(jù)進(jìn)行挖掘,提取所需要的數(shù)據(jù),處理后轉(zhuǎn)變成為有效數(shù)據(jù),方便后期進(jìn)一步進(jìn)行數(shù)據(jù)挖掘;(4)數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)挖掘的任務(wù)要求,選擇合適的數(shù)據(jù)挖掘方式,將挖掘結(jié)果轉(zhuǎn)變成為易理解的形式;(5)模式解釋:對發(fā)現(xiàn)的模式進(jìn)行解釋與評估,需要精確數(shù)據(jù)時,重復(fù)以上步驟處理數(shù)據(jù);(6)知識評價:將挖掘處理過后的數(shù)據(jù),轉(zhuǎn)變成為用戶能夠理解的方式,方便使用。

3網(wǎng)絡(luò)數(shù)據(jù)挖掘目標(biāo)和方法

在網(wǎng)絡(luò)信息數(shù)據(jù)挖掘過程中,根據(jù)挖掘任務(wù)和目標(biāo)的不同,在挖掘數(shù)據(jù)過程中,將主要能夠?qū)l(fā)現(xiàn)的典型知識分為以下幾類。(1)關(guān)聯(lián)規(guī)則(AssociationRule):根據(jù)數(shù)據(jù)之間的關(guān)聯(lián),從數(shù)據(jù)庫中發(fā)現(xiàn)那些確信度(Confidence)和支持度(Support)都大于給定值的強壯規(guī)則。目前,從數(shù)據(jù)庫中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的概念已從單一概念層次發(fā)展到多個概念層次[4]。在實際的網(wǎng)絡(luò)數(shù)據(jù)中,需要用到的相關(guān)規(guī)則數(shù)量都較大,并且其中一些規(guī)則會影響用戶的判斷。(2)分類(Classification):分類作為網(wǎng)絡(luò)數(shù)據(jù)挖掘中最基本的認(rèn)知形式,就是對網(wǎng)絡(luò)數(shù)據(jù)庫中的每一項數(shù)據(jù)進(jìn)行分類。通過數(shù)據(jù)庫的建立,作為數(shù)據(jù)挖掘的重要基礎(chǔ)。(3)聚類(Clustering):聚類方法區(qū)別于機器學(xué)習(xí)中將數(shù)據(jù)分類的監(jiān)督學(xué)習(xí),被稱為非監(jiān)督學(xué)習(xí)[5]。數(shù)據(jù)聚類通常會采用將對象分成幾個群體的方法,每一個群體中都存在較高相似度,不同群體中相似度較低。

4數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用

數(shù)據(jù)挖掘在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用有著多變、需要管理、信息豐富、需要進(jìn)行決策等領(lǐng)域特點[6]。所以首先需要對網(wǎng)絡(luò)數(shù)據(jù)建立數(shù)據(jù)倉庫,利用數(shù)據(jù)挖掘和分析工具,將網(wǎng)絡(luò)數(shù)據(jù)中需要的信息進(jìn)行挖掘。通過對系統(tǒng)中相關(guān)數(shù)據(jù)的抽取、加工、整理以及加載到數(shù)據(jù)倉庫中,形成數(shù)據(jù)庫中基礎(chǔ)的數(shù)據(jù)。在建立數(shù)據(jù)倉庫后,利用貝葉斯算法,它可以很好地從任務(wù)的分類中進(jìn)行區(qū)劃,能夠很好地對網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行挖掘和檢測保護(hù)。在計算過程中,以A1,A2,A3,A4,A5,…,Am作為m的屬性,屬性分類為V,讓每個屬性A,有一個領(lǐng)域(a1,a2,a3,a4,a5,…,ad)和分類V領(lǐng)域(v1,v2,v3,v4,v5,…,vd),其中的分類數(shù)據(jù)點更加傾向于(a1,a2,a3,a4,a5,…,Am+v1),得到公式:()1111arg()miv=manPv∏Pav=丨(1)()()()11111#,arg##miavvmanvv=∏=(2)這個方法能夠有效應(yīng)用于數(shù)據(jù)挖掘的網(wǎng)絡(luò)病毒預(yù)防中。

5結(jié)語

隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)逐漸被應(yīng)用到生活的各個領(lǐng)域中。網(wǎng)絡(luò)信息安全變得尤為重要,這不僅關(guān)系到網(wǎng)絡(luò)安全,更關(guān)系到各個領(lǐng)域的隱私問題。利用信息挖掘技術(shù)能夠有效提高互聯(lián)網(wǎng)信息安全系數(shù),做到更加具有針對性的網(wǎng)絡(luò)信息安全保護(hù)和病毒預(yù)防。在數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)病毒預(yù)防中的應(yīng)用過程中,首先建立開采模型,并且提出數(shù)據(jù)挖掘過程,建立網(wǎng)絡(luò)數(shù)據(jù)倉庫,通過關(guān)聯(lián)工具和解構(gòu)對計算機數(shù)據(jù)進(jìn)行挖掘,對數(shù)據(jù)挖掘算法進(jìn)行描述,利用貝葉斯算法預(yù)防網(wǎng)絡(luò)病毒的入侵,解決網(wǎng)絡(luò)病毒防御中的問題,有效提高網(wǎng)絡(luò)安全性。

參考文獻(xiàn)

[1]錢維揚,王俊義,仇洪冰.基于Hadoop的數(shù)據(jù)挖掘技術(shù)在測光紅移上的研究[J].電子技術(shù)應(yīng)用,2016,42(9):111-114.

[2]張子昂,黃震方,靳誠,等.基于微博簽到數(shù)據(jù)的景區(qū)旅游活動時空行為特征研究——以南京鐘山風(fēng)景名勝區(qū)為例[J].地理與地理信息科學(xué),2015,31(4):121-126.

[3]張加余,蔡偉,李云,等.HPLC/LTQ-OrbitrapMSn結(jié)合MDF數(shù)據(jù)挖掘技術(shù)快速鑒定藏白蒿綠原酸類似物[J].質(zhì)譜學(xué)報,2015,36(4):321-327.

[4]和敬涵,劉琳.基于冗余信息的智能變電站協(xié)同后備保護(hù)及故障預(yù)判算法研究[J].電力科學(xué)與技術(shù)學(xué)報,2015(2):3-8.

[5]萬祥,胡念蘇,韓鵬飛,等.大數(shù)據(jù)挖掘技術(shù)應(yīng)用于汽輪機組運行性能優(yōu)化的研究[J].中國電機工程學(xué)報,2016,36(2):459-467.

[6]潘鴻,王洪峰,王宇峰,等.基于數(shù)據(jù)挖掘技術(shù)探究治療糖尿病周圍神經(jīng)病變的針灸取穴規(guī)律[J].中國針灸,2016,36(10):1111-1114.

作者:張凱斐 王翠娥 單位:呂梁學(xué)院