數(shù)據(jù)挖掘技術(shù)在高校圖書館中運用

時間:2022-10-08 05:44:38

導語:數(shù)據(jù)挖掘技術(shù)在高校圖書館中運用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘技術(shù)在高校圖書館中運用

[摘要]闡述了數(shù)據(jù)挖掘技術(shù)的概念,提出了數(shù)據(jù)挖掘技術(shù)在高校圖書館中應用的必要性,并對數(shù)據(jù)挖掘在高校圖書館四個方面的應用進行了分析,旨在為高校圖書館個性化信息服務拋磚引玉。

[關(guān)鍵詞]數(shù)據(jù)挖掘;高校圖書館

1數(shù)據(jù)挖掘技術(shù)

1.1數(shù)據(jù)挖掘技術(shù)概念

隨著科技日新月異的發(fā)展,信息加工和處理也成為信息化的主要技術(shù)支撐,目前,許多領(lǐng)域的問題都是通過數(shù)據(jù)挖掘來解決的,數(shù)據(jù)挖技術(shù)在人們?nèi)粘I钪袘靡苍絹碓綇V泛。數(shù)據(jù)挖掘技術(shù)幫助人們對各個領(lǐng)域的信息處理。數(shù)據(jù)挖掘是什么?目前,人們對信息需求遠遠大于過去任何一個時代,傳統(tǒng)的統(tǒng)計工具無法滿足現(xiàn)階段人們的需求,數(shù)據(jù)挖掘技術(shù)也隨著數(shù)字化、信息化的飛速發(fā)展應運而生。數(shù)據(jù)挖掘就是根據(jù)已有的不清晰、雜亂無章的海量信息,提取出所需信息的過程。通過數(shù)據(jù)挖掘,大量無規(guī)范的數(shù)據(jù)通過統(tǒng)計進行數(shù)據(jù)分類管理,從而將數(shù)據(jù)的規(guī)律和數(shù)據(jù)模式挖掘出來,并對未來數(shù)據(jù)的走向進行有效分析和預測。數(shù)據(jù)挖掘技術(shù)與很多學科領(lǐng)域相互交叉應用,涉及的知識面比較廣泛,相比傳統(tǒng)的信息處理方法,從表面上沒有任何相互關(guān)聯(lián)的數(shù)據(jù)中,挖掘出事情的關(guān)聯(lián)原因,找出事物發(fā)展的規(guī)律,并用數(shù)據(jù)作為支撐,為決策者提供切實可靠的參考。

1.2數(shù)據(jù)挖掘類型

按照數(shù)據(jù)結(jié)構(gòu)的方式來劃分,通常可以分為文本數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘和數(shù)值數(shù)據(jù)挖掘。

1.2.1文本數(shù)據(jù)挖掘

文本數(shù)據(jù)挖掘,顧名思義就是從文本數(shù)據(jù)中通過計算機處理技術(shù)挖掘出有效、有價值的信息。文本信息挖掘主要包含兩類,一是文本信息;二是文檔類信息挖掘。數(shù)據(jù)挖掘的對象均為文本信息數(shù)據(jù)。文本信息挖掘方法主要有:文本分類、文本聚類、信息抽取、摘要及壓縮。挖掘文本數(shù)據(jù),主要包含對文本信息特征提取與文本信息分類、分析文本數(shù)據(jù)等。在對文本數(shù)據(jù)挖掘進行應用時,主要是以詞串表示法、貝葉斯分類算法、詞集合算法等技術(shù)手段為輔助,以便于完成信息數(shù)據(jù)相關(guān)工作。

1.2.2Web數(shù)據(jù)挖掘

Web數(shù)據(jù)挖掘,從字面上來解讀,是挖掘技術(shù)在Web頁面上的應用。包括針對Web數(shù)據(jù)等信息,如Web頁面結(jié)構(gòu)、用戶信息等等信息數(shù)據(jù),進行提取、優(yōu)化頁面設置,掌握訪問用戶的內(nèi)容和行為。為用戶提供更多優(yōu)質(zhì)服務,根據(jù)服務目的和內(nèi)容的差異,對不同個體進行差異性的挖掘,具體包括挖掘Web日志、內(nèi)容和結(jié)構(gòu)。

1.2.3數(shù)值數(shù)據(jù)挖掘

數(shù)值數(shù)據(jù)挖掘,從字面上來看,主要是對數(shù)值數(shù)據(jù)的挖掘。主要的任務有描述數(shù)值數(shù)據(jù)和預測數(shù)值數(shù)據(jù)兩種。數(shù)值數(shù)據(jù)挖掘功能為概念描述,重點進行分類分析和預測分析。常見的方法,有歸納法、模糊數(shù)學方法、遺傳算法等。

2數(shù)據(jù)挖掘技術(shù)在高校圖書館建設中的必要性

2.1館藏建設的需要

圖書館作為高??蒲泻椭R的前沿陣地,它不僅擁有濃郁的書香文化氛圍,豐富的館藏資源也是必不可少的?,F(xiàn)代圖書館,不光需要滿足讀者用戶翻閱紙質(zhì)書籍的需求,也需要滿足數(shù)字資源的需求?,F(xiàn)代科技和互聯(lián)網(wǎng)的發(fā)展,改變了人們的閱讀模式,便利、快捷的碎片化閱讀成為人們首選的閱讀方式。數(shù)字化閱讀越來越受廣大讀者用戶喜愛,人們可以通過搜索引擎迅速查閱到所需圖書的相關(guān)信息,具有時效性和便捷性。計算機應用技術(shù)的發(fā)展在數(shù)據(jù)挖掘技術(shù)領(lǐng)域,結(jié)合圖書館原有的館藏資源,分析館藏已有資源,將紙質(zhì)書籍做可視化處理,挖掘出信息數(shù)據(jù)中館藏建設的優(yōu)勢和劣勢,良好結(jié)合圖書館現(xiàn)有館藏情況進行分析,將分析結(jié)果進行評估,這對豐富館藏建設有著建設性意義。高校圖書館館藏必須滿足科研和學科需要,學生用戶處于積累知識階段,所需要的信息資源也是各種各樣,對讀者信息的挖掘,能夠有效有針對性的節(jié)省開支,館藏內(nèi)容都通過數(shù)據(jù)挖掘技術(shù)來推算和評估,以供指導未來采購書籍和學科建設。

2.2滿足用戶多樣化需求

高校圖書館的用戶類型,主要是教師讀者和學生讀者。讀者用戶的不同,需要提供的信息也大不相同。這就要求圖書館對讀者多樣化需求進行數(shù)據(jù)挖掘,并根據(jù)讀者用戶的個性化需求來推送信息。首先,根據(jù)已知基本讀者信息,得出不同讀者的個性化需求。其次,分析不同讀者信息需求和獲取信息的多樣化途徑。最后,根據(jù)已有信息內(nèi)容和信息獲取方式,進行數(shù)據(jù)挖掘分析對比,從而實現(xiàn)因人而異的服務方式,提升圖書館信息服務質(zhì)量。根據(jù)讀者信息和訪問等數(shù)據(jù)挖掘,可以反映出讀者用戶的需求,從而更好地服務讀者。

2.3符合圖書館未來發(fā)展

現(xiàn)代高校圖書館的重要競爭力是數(shù)字圖書館,這一點符合“互聯(lián)網(wǎng)+圖書館”的發(fā)展。高校圖書館的應用信息系統(tǒng)擁有大量數(shù)字資源,并通過網(wǎng)絡技術(shù)等資源進行組織和整合,滿足用戶的需求。只有將大量數(shù)據(jù)資源和互聯(lián)網(wǎng)關(guān)聯(lián)信息進行有效的數(shù)據(jù)挖掘,才能挖掘出其中的最大價值,數(shù)據(jù)挖掘技術(shù)在圖書館信息化發(fā)展和信息服務建設方面有著無可替代的優(yōu)勢。

3數(shù)據(jù)挖掘技術(shù)在高校圖書館中的應用

3.1數(shù)據(jù)挖掘技術(shù)在文獻推薦中的應用

文獻利用率是考核高校圖書館服務質(zhì)量的一項重要的指標,如何為讀者用戶提供可參考有價值的圖書文獻,做好文獻推薦工作是高校圖書館個性化服務的重要組成部分。數(shù)據(jù)挖掘技術(shù)在圖書館借閱率中的應用,主要是根據(jù)讀者用戶進出圖書館的數(shù)據(jù)與借閱、瀏覽圖書數(shù)據(jù)、進行分類分析與關(guān)聯(lián)分析。通過數(shù)據(jù)分析,得出讀者用戶所借閱的數(shù)據(jù)與相關(guān)類別圖書,呈現(xiàn)出一定的關(guān)聯(lián)性,根據(jù)其中的規(guī)律,可以用于后臺熱點推薦和個性化推送。如讀者在借閱卡耐基的《人性的優(yōu)點》時候,又借閱了相關(guān)心理學書籍,說明這個讀者喜歡書籍類型,具有一定關(guān)聯(lián),那么適當推薦心理學相關(guān)書籍、勵志書籍給該讀者,可以幫助讀者節(jié)約查閱書籍的時間,提高對圖書館的利用率。

3.2可視化信息服務

數(shù)據(jù)挖掘技術(shù)比傳統(tǒng)數(shù)據(jù)統(tǒng)計和表格更加清晰地體現(xiàn)出直觀效果。人工智能技術(shù)和可視化設備大量引進圖書館后,圖書館不僅僅可以將讀者借閱數(shù)據(jù)、館藏數(shù)據(jù)、個性化偏好等數(shù)據(jù),用直觀可視化的圖表清晰表現(xiàn)出來。還為圖書館建設提供一些參考。通過收集數(shù)據(jù)-數(shù)據(jù)挖掘-數(shù)據(jù)評價,將圖書館各項數(shù)據(jù)指標,實時記錄高校圖書館各個部門人員圖書借閱情況、到館情況、讀者密集度和習慣,用圖表方式展現(xiàn)出來,為圖書館管理者提供服務和管理重要依據(jù)。

3.3閱讀推廣服務

高校圖書館閱讀推廣服務,為保證廣大讀者用戶更加充分利用圖書館資源,激發(fā)讀者興趣,推廣校園讀書文化有重要意義。數(shù)據(jù)挖掘技術(shù)結(jié)合圖書館閱讀推廣活動,首先對讀者用戶的瀏覽圖書館界面和借閱記錄進行數(shù)據(jù)采集,根據(jù)讀者偏好,結(jié)合圖書館現(xiàn)有館藏資源,篩選讀者用戶可能感興趣的內(nèi)容,并通過網(wǎng)絡手段推送給讀者用戶;其次,根據(jù)搜索數(shù)據(jù)進行統(tǒng)計,如將熱門關(guān)鍵詞與館藏資源進行數(shù)據(jù)信息匹配,以評價最好、熱度最大等排列組合推薦給讀者,如熱門當紅讀者、出版社、話題最熱等內(nèi)容。再次,根據(jù)深度挖掘信息數(shù)據(jù),找到相關(guān)規(guī)律,如世界讀書日等熱門節(jié)日,以這些為指標為讀者推廣工作提供一些依據(jù)。

3.4學科信息服務

高校圖書館的資源具有豐富的學術(shù)性特點,數(shù)據(jù)挖掘技術(shù)應用于圖書館,為學院發(fā)展、學科建設和服務提供了特色化服務。高校圖書館應主動結(jié)合用戶的實際需求和專業(yè)特色,進行信息服務。如根據(jù)熱點專業(yè)、精品課程、課堂研究等已有的內(nèi)容,進行深度挖掘,使其具有更高價值,為讀者用戶提供的前沿研究領(lǐng)域和熱點動態(tài)。如建筑行業(yè)高校圖書館,重點關(guān)注建筑設計、建筑工程、建筑設備、橋梁等相關(guān)領(lǐng)域前沿研究信息和動態(tài),通過熱點和館內(nèi)資源進行深度數(shù)據(jù)挖掘,為讀者用戶從海量數(shù)據(jù)中挑選出隱含的知識信息,為研究提供正確方向,實現(xiàn)學科信息服務功能。

4展望

數(shù)據(jù)挖掘技術(shù)在高校圖書館中除了在文中提到的文獻推薦、可視化信息、學科信息服務、閱讀推廣工作中應用,在其他圖書館管理工作和建設中也應用得相當廣泛。在圖書館未來發(fā)展中,數(shù)據(jù)挖掘技術(shù)還將進一步應用于信息服務中,服務于高校讀者用戶。如何做好數(shù)據(jù)挖掘工作關(guān)系到高校圖書館信息化的發(fā)展。

主要參考文獻

[1]馬婷婷,李濤.基于數(shù)據(jù)挖掘的高校圖書館信息服務.[J].信息與電腦,2017(22):145-151.

[2]楊建明,劉芳.基于數(shù)據(jù)挖掘的高校圖書館服務優(yōu)化研究[J].情報與探索,2014(4):25-32.

作者:李雅 單位:湖南城建職業(yè)技術(shù)學院