智能化數(shù)據(jù)挖掘系統(tǒng)設計及實現(xiàn)
時間:2022-05-06 09:34:29
導語:智能化數(shù)據(jù)挖掘系統(tǒng)設計及實現(xiàn)一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
1引言
現(xiàn)代化科技水平的不斷進步導致人們對互聯(lián)網(wǎng)數(shù)據(jù)挖掘技術的應用有了更高的要求。如今,互聯(lián)網(wǎng)數(shù)據(jù)挖掘技術具有相對獨特的特點,尤其在電子銀行、電子商務、企業(yè)、政府之間有著愈發(fā)重要的作用,作為不同類型用戶關系的重要處理通道,智能化數(shù)據(jù)挖掘系統(tǒng)的設計有助于企業(yè)根據(jù)用戶的數(shù)據(jù)請求實現(xiàn)更好的商業(yè)服務,借助于先進的數(shù)據(jù)挖掘技術,企業(yè)同樣能根據(jù)用戶重心發(fā)展相應的業(yè)務類型。智能化數(shù)據(jù)挖掘系統(tǒng)的應用能夠縮小人工成本,依賴其智能化的特點,企業(yè)也能夠確定更好的未來發(fā)展趨勢,提升綜合競爭水平,在互聯(lián)網(wǎng)市場份額中占據(jù)較大比例。
2Web數(shù)據(jù)挖掘系統(tǒng)架構
互聯(lián)網(wǎng)作為包含龐大數(shù)據(jù)信息、用戶聯(lián)系廣泛的集合體,現(xiàn)存的數(shù)據(jù)管理信息系統(tǒng)無法有效處理大規(guī)模的半結構化信息數(shù)據(jù),由于用戶類型也呈現(xiàn)復雜化、多樣化,這些對相對傳統(tǒng)的信息管理系統(tǒng)來說有一定執(zhí)行難度。其中,對于企業(yè)之間的電子商務運行而言,為數(shù)據(jù)倉庫的應用提供了有效支撐,在此基礎上更為優(yōu)良的智能化數(shù)據(jù)挖掘系統(tǒng)也有了更為廣闊的應用前景。本文以B/S架構為基礎進行互聯(lián)網(wǎng)數(shù)據(jù)挖掘系統(tǒng)的設計,并且,電子商務的潛在模式需要充分借助于數(shù)據(jù)倉庫管理技術進行合理挖掘,繼而對相關企業(yè)知識庫進行構建,實現(xiàn)供企業(yè)發(fā)揮指導作用的智能化綜合系統(tǒng)。該系統(tǒng)的整體架構有三個層次組成,即數(shù)據(jù)訪問層、業(yè)務邏輯層、用戶操作界面管理層。通過業(yè)務處理邏輯層可以實現(xiàn)對不同用戶的數(shù)據(jù)請求進行有效處理,通過互聯(lián)網(wǎng)服務器對相關用戶網(wǎng)站請求傳送至應用服務器,依賴于應用服務器中的程序算法、分析技術對數(shù)據(jù)管理倉庫中的數(shù)據(jù)進行有效挖掘提取;對于數(shù)據(jù)訪問層而言,其有如下部分組成,即知識儲存庫、數(shù)據(jù)集、數(shù)據(jù)倉庫三個方面,數(shù)據(jù)倉庫是至關重要的一部分,其由針對數(shù)據(jù)主題的動態(tài)變化集成數(shù)據(jù)集合工程,企業(yè)中不同類型的數(shù)據(jù)處理系統(tǒng)、數(shù)據(jù)文庫、企業(yè)之間或者企業(yè)政府之間的商務文件記錄提供了倉庫中的數(shù)據(jù)源[1]。
3系統(tǒng)主要模塊設計
智能化數(shù)據(jù)挖掘系統(tǒng)中的功能模塊設計主要依據(jù)不同用戶的數(shù)據(jù)請求頻率、數(shù)據(jù)查詢興趣重點,繼而進行功能模式的分析與實現(xiàn),這也有助于企業(yè)對既存的互聯(lián)網(wǎng)界面結構進行優(yōu)化改進,更好地提供企業(yè)服務,其基本流程如下,首先對企業(yè)面臨的商業(yè)問題進行定義分析,繼而對相關數(shù)據(jù)進行采集,對數(shù)據(jù)進行歸一化預先處理,最終獲取評定結果,為此,系統(tǒng)功能模塊可以分為如下,即數(shù)據(jù)采集、數(shù)據(jù)預處理、數(shù)據(jù)模式挖掘功能模塊。對于數(shù)據(jù)采集模塊的設計而言,其主要包含如下兩個方面內(nèi)容,用戶訪問查詢活動數(shù)據(jù)信息、互聯(lián)網(wǎng)界面文檔拓撲結構,其數(shù)據(jù)來源可以進行兩個方面的分類,首先是互聯(lián)網(wǎng)服務器的log文件、錯誤日志、cks;其次是在線用戶的網(wǎng)站注冊信息、交易活動數(shù)據(jù)、請求反饋信息等,數(shù)據(jù)挖掘可直接以信息記錄的方式進行。其中,常見的互聯(lián)網(wǎng)服務器日志內(nèi)容有如下方面,即不同用戶的網(wǎng)站瀏覽數(shù)據(jù)、鏈接相關聯(lián)的序列數(shù)據(jù),涉及到的字段信息為事件、日期、現(xiàn)有狀態(tài)、字節(jié)發(fā)送、數(shù)據(jù)請求的種類、IP地址等。數(shù)據(jù)采集工作主要為了后續(xù)的數(shù)據(jù)倉庫構建提供必要的基礎準備,數(shù)據(jù)分析過程中工作是對數(shù)據(jù)進行預處理,數(shù)據(jù)預處理主要包括數(shù)據(jù)清理、數(shù)據(jù)轉換、數(shù)據(jù)聚集等[2]。模式挖掘經(jīng)過收集、清理、轉換、集成而形成的數(shù)據(jù)倉庫的數(shù)據(jù)上應用數(shù)據(jù)挖掘的算法,挖掘出有用的模式和規(guī)則來幫助企業(yè)決策,這是企業(yè)開發(fā)數(shù)據(jù)挖掘系統(tǒng)的主要目的。路徑分析技術利用鏈接日志文件項中訪問者的訪問路徑,并將路徑按時間排序。這種分析對企業(yè)在布置web站點頁面內(nèi)容有指導意義;也可以通過關聯(lián)規(guī)則分析挖掘出頻繁頁面集,比如某購書網(wǎng)站,對于書A的頁面A和書B的頁面B,通過關聯(lián)規(guī)則分析得出頻繁頁面集{A,B},在用戶訪問A時,將頁面B調(diào)入緩存,從而改善web緩存,提高性能,并且還能說明書A,B的相關性,企業(yè)可以實踐一些更有效的廣告策略[3]。
4小結
總而言之,隨著互聯(lián)網(wǎng)信息技術的高速發(fā)展,數(shù)據(jù)新的膨脹化導致數(shù)據(jù)挖掘技術的優(yōu)化勢在必行,智能化數(shù)據(jù)挖掘系統(tǒng)的應用有助于企業(yè)在業(yè)務開展過程中能夠獲取更大的客戶源,提升自身的綜合水平,優(yōu)化業(yè)務處理效率,智能化數(shù)據(jù)挖掘系統(tǒng)的研發(fā)在未來有著更為客觀的前景。作者簡介:周小春,1975年生,男,助理工程師,研究方向:智能化系統(tǒng)集成。
參考文獻
[1]楊金勞.Web數(shù)據(jù)挖掘技術在電子商務中的應用研究[J].電子技術與軟件工程,2018(2):188.
[2]王向.大數(shù)據(jù)時代數(shù)據(jù)挖掘技術對管理會計職能的影響[J].經(jīng)貿(mào)實踐,2018(5):22.
[3]許兆新.基于元知識的數(shù)據(jù)挖掘系統(tǒng)研究[D].哈爾濱:哈爾濱工程大學,2003.
作者:周小春 單位:江蘇展揚系統(tǒng)集成有限公司