數(shù)據(jù)挖掘技術(shù)在高校網(wǎng)站信息的應(yīng)用

時(shí)間:2022-06-28 03:29:07

導(dǎo)語(yǔ):數(shù)據(jù)挖掘技術(shù)在高校網(wǎng)站信息的應(yīng)用一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘技術(shù)在高校網(wǎng)站信息的應(yīng)用

摘要:隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的日益發(fā)展,而數(shù)據(jù)挖掘技術(shù)高校網(wǎng)站信息當(dāng)中的實(shí)踐應(yīng)用已經(jīng)到了一個(gè)比較成熟的階段。網(wǎng)站作為信息傳播的主要載體,運(yùn)用其直觀形象的使用方式,見(jiàn)證網(wǎng)絡(luò)信息的快速發(fā)展,在既能夠給予人們便利的情況下,也相應(yīng)的給相關(guān)機(jī)構(gòu)帶來(lái)了巨大挑戰(zhàn)。本文將針對(duì)高校針對(duì)網(wǎng)站規(guī)劃以及網(wǎng)站建設(shè)方面,運(yùn)用數(shù)據(jù)挖掘技術(shù)進(jìn)行實(shí)踐應(yīng)用的內(nèi)容,做相關(guān)闡述。

關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);高校;網(wǎng)站信息;實(shí)踐應(yīng)用

隨著教育信息化的發(fā)展,高校網(wǎng)站建設(shè)已經(jīng)從形象建設(shè)轉(zhuǎn)變?yōu)楝F(xiàn)如今的信息建設(shè),這主要是因?yàn)楫?dāng)今社會(huì)是信息時(shí)代,高校用戶對(duì)于信息的需求量也在與日俱增。也就是說(shuō)在內(nèi)容和數(shù)據(jù)方面都被要求需要達(dá)到較高的水平,在高校信息化建設(shè)的目標(biāo)前提下,使用數(shù)據(jù)挖掘技術(shù)來(lái)幫助設(shè)計(jì)人員針對(duì)高校網(wǎng)站數(shù)據(jù)進(jìn)行挖掘,從而找到適合高校網(wǎng)站建設(shè)的一種模式,在大量的信息中為人們提供有價(jià)值的信息以保證良好的服務(wù)。

1相關(guān)概念

1.1數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)在實(shí)踐中體現(xiàn)出一種較強(qiáng)的綜合性,它既能夠針對(duì)網(wǎng)站設(shè)計(jì)來(lái)對(duì)數(shù)據(jù)實(shí)現(xiàn)有效采集,還能夠通過(guò)技術(shù)本身來(lái)對(duì)網(wǎng)站數(shù)據(jù)來(lái)進(jìn)行初步整理。也就是說(shuō)數(shù)據(jù)挖掘技術(shù)能夠在歸納式的推測(cè)前提下來(lái)針對(duì)用戶進(jìn)行預(yù)測(cè),從而使得決策更加準(zhǔn)確。數(shù)據(jù)挖掘技術(shù)涵蓋眾多學(xué)科方面的內(nèi)容知識(shí),不僅包含數(shù)據(jù)庫(kù)技術(shù)和信息獲取技術(shù),在某些時(shí)候還會(huì)使用到統(tǒng)計(jì)學(xué)的相關(guān)技術(shù)[1]。根據(jù)數(shù)據(jù)挖掘技術(shù)所面對(duì)的處理對(duì)象的不同,它分別有三種應(yīng)用模式,其在各個(gè)行業(yè)發(fā)揮著不同的重要作用,第一個(gè)就是結(jié)構(gòu)挖掘,第二個(gè)則是內(nèi)容挖掘,第三個(gè)是使用挖掘。在數(shù)據(jù)挖掘技術(shù)實(shí)踐過(guò)程中比較常用的,有關(guān)聯(lián)規(guī)則技術(shù),序列模式技術(shù)以及數(shù)據(jù)挖掘當(dāng)中特有的路徑分析技術(shù)[2]。網(wǎng)站數(shù)據(jù)本身相對(duì)于傳統(tǒng)的數(shù)據(jù)庫(kù),其有著數(shù)據(jù)內(nèi)容龐大且復(fù)雜的特性,并且它并沒(méi)有以規(guī)定的數(shù)據(jù)模型呈現(xiàn)出來(lái),所以網(wǎng)站數(shù)據(jù)內(nèi)容當(dāng)中,每一個(gè)站點(diǎn)都必須采取獨(dú)立設(shè)計(jì),這也就導(dǎo)致了,在網(wǎng)站數(shù)據(jù)背景下的數(shù)據(jù)挖掘技術(shù)也比每個(gè)結(jié)構(gòu)化數(shù)據(jù)都要更加復(fù)雜[2]。1.2數(shù)據(jù)處理。針對(duì)現(xiàn)實(shí)的網(wǎng)站數(shù)據(jù),可以發(fā)現(xiàn)半結(jié)構(gòu)化是網(wǎng)站數(shù)據(jù)的典型特點(diǎn),所以要想解決半結(jié)構(gòu)化數(shù)據(jù)源模型,在數(shù)據(jù)挖掘技術(shù)當(dāng)中已經(jīng)成為了最重要的問(wèn)題之一[3]。這將對(duì)網(wǎng)站的數(shù)據(jù)模型進(jìn)行重新定義,也就是說(shuō)需要針對(duì)半結(jié)構(gòu)化模型當(dāng)中所需的相關(guān)數(shù)據(jù)進(jìn)行自動(dòng)檢索,通過(guò)數(shù)據(jù)挖掘來(lái)應(yīng)用半結(jié)構(gòu)化數(shù)據(jù)模型抽取技術(shù)和半結(jié)構(gòu)化模型,這也是數(shù)據(jù)挖掘技術(shù)當(dāng)中的重要環(huán)節(jié)[4]。半結(jié)構(gòu)化的數(shù)據(jù)模型是以一種xml的新型元標(biāo)注語(yǔ)言為數(shù)據(jù)基礎(chǔ)的,其數(shù)據(jù)描述與對(duì)應(yīng)的關(guān)系,數(shù)據(jù)庫(kù)當(dāng)中的屬性可以實(shí)現(xiàn)1對(duì)1,并且在這個(gè)過(guò)程中的網(wǎng)站建設(shè)是相對(duì)來(lái)說(shuō)較為容易的,可以在這樣的基礎(chǔ)上針對(duì)數(shù)據(jù)模型進(jìn)行精確查詢。與此同時(shí),該新型元標(biāo)注語(yǔ)言的開(kāi)源代碼也是較為豐富的,在它的應(yīng)用下將大大的降低網(wǎng)站工作人員的工作成本,通過(guò)相應(yīng)的技術(shù)與條件幫助解決網(wǎng)站數(shù)據(jù)半結(jié)構(gòu)化分析困難的主要問(wèn)題。

2具體應(yīng)用

2.1數(shù)據(jù)的收集與整理。對(duì)數(shù)據(jù)進(jìn)行大量的收集是數(shù)據(jù)挖掘當(dāng)中的重點(diǎn)組成部分,但是因?yàn)楸磉_(dá)方式不同,往往會(huì)造成數(shù)據(jù)挖掘當(dāng)中存在一定的不確定性。所以就需要針對(duì)數(shù)據(jù)來(lái)做好相應(yīng)的簡(jiǎn)單處理,確保數(shù)據(jù)能夠受到專業(yè)化的提取與進(jìn)凈化。為相關(guān)設(shè)計(jì)人員提供網(wǎng)站數(shù)據(jù)基礎(chǔ),讓他們能夠獲得應(yīng)有的有用信息,從而在數(shù)據(jù)挖掘過(guò)程中提高工作的質(zhì)量效率與水平。綜上所述,數(shù)據(jù)預(yù)處理就是用戶針對(duì)網(wǎng)站進(jìn)行訪問(wèn)時(shí)所需要的最原始的數(shù)據(jù)庫(kù)內(nèi)容。高校網(wǎng)站的服務(wù)器能夠針對(duì)用戶訪問(wèn)的次數(shù)跟時(shí)間來(lái)進(jìn)行記錄,用戶訪問(wèn)的數(shù)據(jù)將會(huì)被網(wǎng)站日志進(jìn)行記錄,所以網(wǎng)站日志就是得到數(shù)據(jù)最簡(jiǎn)單直接的方法之一。可以通過(guò)網(wǎng)站日志來(lái)對(duì)這些內(nèi)容做好簡(jiǎn)單記錄,其中包含用戶名、瀏覽日期等方面的內(nèi)容。但是在實(shí)踐操作過(guò)程中,會(huì)發(fā)現(xiàn)網(wǎng)站日志,對(duì)于他自身所收集到的信息也有存在不準(zhǔn)確的情況,所以如果直接的對(duì)其進(jìn)行利用往往是不可取的,所以需要針對(duì)相應(yīng)數(shù)據(jù)做好一定的處理才可以確定相關(guān)內(nèi)容。其中包含針對(duì)瀏覽界面的確定以及用戶與用戶的訪問(wèn)序列的確定,還有對(duì)用戶的訪問(wèn)路徑進(jìn)行完善等方面的內(nèi)容,如果對(duì)信息的質(zhì)量要求較高的話還需要高校網(wǎng)站能夠形成專門的數(shù)據(jù)庫(kù)。2.2數(shù)據(jù)模式的發(fā)現(xiàn)。要想發(fā)現(xiàn)數(shù)據(jù)模型,就必須運(yùn)用數(shù)據(jù)挖掘的算法,可以通過(guò)針對(duì)頁(yè)面的網(wǎng)頁(yè)瀏覽量設(shè)計(jì)來(lái)確定網(wǎng)頁(yè)的瀏覽數(shù)。產(chǎn)生的結(jié)果,在相關(guān)人員對(duì)此進(jìn)行有效測(cè)量的情況下,能夠?qū)r(shí)間序列建模和時(shí)間序列的預(yù)測(cè)情況進(jìn)行具體了解,從而分析出時(shí)間序列的主要目標(biāo)。整體的趨勢(shì)與長(zhǎng)期運(yùn)動(dòng)的規(guī)律都是需要觀察的點(diǎn),在時(shí)間序列當(dāng)中周期運(yùn)動(dòng)又或者是周期性變動(dòng),也是需要重點(diǎn)關(guān)注的要點(diǎn)之一。上述內(nèi)容都是趨勢(shì)分析當(dāng)中的關(guān)鍵所在。此外在針對(duì)頁(yè)面訪問(wèn)進(jìn)行統(tǒng)計(jì)的過(guò)程中能夠發(fā)現(xiàn),往往排名靠前的都是對(duì)于高校網(wǎng)站首頁(yè)的訪問(wèn),也就是說(shuō)大部分的高校用戶都是通過(guò)瀏覽器收藏夾的資源定位來(lái)對(duì)網(wǎng)站進(jìn)行訪問(wèn)的。在此情況下進(jìn)入到高校網(wǎng)站訪問(wèn)當(dāng)中,只能基本上就是對(duì)第一個(gè)頁(yè)面進(jìn)行大致的瀏覽。當(dāng)然也有小部分用戶在對(duì)網(wǎng)站進(jìn)行訪問(wèn)時(shí)是從其他頁(yè)面進(jìn)入的,不過(guò)占比并不高。但是根據(jù)網(wǎng)站各個(gè)網(wǎng)頁(yè)被訪問(wèn)的次數(shù)和瀏覽時(shí)間,可以得出哪些頁(yè)面內(nèi)容是網(wǎng)站當(dāng)中最受關(guān)注的,而哪些頁(yè)面內(nèi)容又是網(wǎng)站當(dāng)中最不受關(guān)注的,其中重點(diǎn)內(nèi)容部分是否包含用戶訪問(wèn)網(wǎng)站的主要目標(biāo)具體內(nèi)容,哪些內(nèi)容又是屬于高校用戶一點(diǎn)都不會(huì)關(guān)心的無(wú)用內(nèi)容,從而針對(duì)用戶訪問(wèn)網(wǎng)站的主要目的進(jìn)行具體分析。2.3網(wǎng)站改進(jìn)。對(duì)于網(wǎng)站改進(jìn),可以運(yùn)用模式分析的方法來(lái)進(jìn)行模式分析,其本身就是針對(duì)已經(jīng)產(chǎn)生的模式來(lái)進(jìn)行分析和優(yōu)化的,它是在原有的基礎(chǔ)上,針對(duì)被發(fā)現(xiàn)的數(shù)據(jù)模式和統(tǒng)計(jì)資料來(lái)進(jìn)行轉(zhuǎn)化的,通過(guò)這種方式為用戶實(shí)現(xiàn)更優(yōu)質(zhì)的服務(wù)體驗(yàn)。也就是說(shuō),可以把現(xiàn)有的數(shù)據(jù)模式和統(tǒng)計(jì)資料轉(zhuǎn)化成所需的知識(shí),從而在其中尋找到最有價(jià)值的數(shù)據(jù)模式加以應(yīng)用。在數(shù)據(jù)挖掘過(guò)程中,需要了解到用戶趨勢(shì),才是反映用戶對(duì)網(wǎng)站訪問(wèn)的主要內(nèi)容,也是后期改變和提升的主要方向所在。在用戶趨勢(shì)上可以看出城市人員是針對(duì)高校網(wǎng)站進(jìn)行訪問(wèn)的主力軍,所以應(yīng)當(dāng)通過(guò)采取相關(guān)的措施,在能夠覆蓋到城市人員的網(wǎng)站上進(jìn)行推廣,并且采取多種宣傳手段來(lái)加大推廣力度,從而使得用戶能夠更為直觀更為方便的訪問(wèn)到高校網(wǎng)站。此外還需要意識(shí)到網(wǎng)站本身不僅僅可以作為外界了解高校具體情況的一個(gè)展示平臺(tái),也可以成為內(nèi)部學(xué)生獲取信息的主要通道,將教學(xué)資源整合到網(wǎng)站當(dāng)中,也有助于更好的展示學(xué)校的教育資源水平。但是為了防止內(nèi)部教育資源,泄露或者是重要的實(shí)驗(yàn)資料被竊取,同樣也要做好相應(yīng)的數(shù)據(jù)加密工作。針對(duì)高校內(nèi)的優(yōu)質(zhì)師生資源進(jìn)行數(shù)據(jù)挖掘,讓他們也參與到高校網(wǎng)站建設(shè)工作當(dāng)中,能夠在校內(nèi)達(dá)到教學(xué)資源共享,幫助更多的學(xué)生提升自身的學(xué)業(yè)水平,這才是努力辦學(xué),嚴(yán)謹(jǐn)辦學(xué)的最終目的,數(shù)據(jù)挖掘技術(shù)對(duì)于高校網(wǎng)站信息建設(shè)方面的貢獻(xiàn),不僅僅是為了通過(guò)淺層的數(shù)據(jù)挖掘來(lái)保證高校形象的建設(shè),更是要讓高校自身成為一個(gè)具有關(guān)鍵作用的信息平臺(tái)。

3結(jié)語(yǔ)

在數(shù)據(jù)挖掘技術(shù)與高校網(wǎng)站建設(shè)的結(jié)合應(yīng)用當(dāng)中,逐漸在實(shí)踐過(guò)程中尋找到了解決問(wèn)題的方法,也就是根據(jù)網(wǎng)站建設(shè)的指導(dǎo)內(nèi)容來(lái)實(shí)現(xiàn)解決策略優(yōu)化,從而提升高效用戶的訪問(wèn)質(zhì)量。針對(duì)網(wǎng)站建設(shè)重點(diǎn)進(jìn)行明確,并且將高校網(wǎng)站頁(yè)面做好優(yōu)化設(shè)計(jì),同時(shí)根據(jù)信息采集內(nèi)容來(lái)針對(duì)網(wǎng)站的結(jié)構(gòu)內(nèi)容做好及時(shí)的調(diào)整與設(shè)計(jì),從而提升高校網(wǎng)站的總體使用質(zhì)量。

參考文獻(xiàn)

[1]付蓉,何毅.Web數(shù)據(jù)挖掘在高校網(wǎng)站建設(shè)中的運(yùn)用[J].信息與電腦:理論版,2015(10):89-90.

[2]陳金菊.基于數(shù)據(jù)挖掘的讀者個(gè)性化服務(wù)研究[J].圖書館學(xué)研究,2016(23):84-91.

[3]穆榮.Web數(shù)據(jù)挖掘在高校網(wǎng)站建設(shè)中的運(yùn)用研究[J].中國(guó)戰(zhàn)略新興產(chǎn)業(yè),2017(16):89.

[4]孫永輝,周宏.數(shù)據(jù)挖掘技術(shù)在高校成績(jī)分析中的應(yīng)用研究[J].科技創(chuàng)新導(dǎo)報(bào),2015,12(33):157-159.

作者:呂紹鑫 單位:湖南工藝美術(shù)職業(yè)學(xué)院