檔案信息資源平臺構建與應用

時間:2022-07-08 08:41:17

導語:檔案信息資源平臺構建與應用一文來源于網友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

檔案信息資源平臺構建與應用

“用戶生成內容”(User-GeneratedContent,UGC)即在“Web2.0環(huán)境下出現(xiàn)的一種新興的網絡信息資源創(chuàng)作與組織模式,泛指以任何形式在網絡上發(fā)表的由用戶創(chuàng)作的文字、圖片、音頻、視頻等內容”。2005年,有“互聯(lián)網女皇”之稱的摩根士丹利首席分析師MaryMeeker首次提出這一術語。其產生后受到PC、IP端用戶的廣泛喜愛,涌現(xiàn)出好友社交、視頻分享、照片分享、知識分享等多類型UGC網站,且擁有廣泛的受眾基礎,蘊含巨大的經濟、社會效益。

用戶生成內容理念給檔案工作帶來的改變

1.UGC為檔案資源體系優(yōu)化帶來“來而不可失”之時由于身份性格、知識結構、學歷層次、專業(yè)背景、創(chuàng)造內容動機不同等原因,用戶生成的信息資源具有多元的風格與特色,其有利于豐富館藏資源,助推檔案資源體系的優(yōu)化。如美國華盛頓州數(shù)字檔案館在門戶網站為用戶開通檔案傳送渠道,用于收集本州的檔案、照片等,并在整理后形成正式的官方資料;中國人民大學人文北京研究中心建構的“我的北京記憶”網站,鼓勵公眾捕捉、記錄與北京有關的珍貴瞬間和記憶,目前已添加1041篇文集、8671張圖片、426個視頻。2.UGC為檔案利用服務升級帶來“蹈而不可失”之機UGC的應用開拓了檔案利用新思路,如廣東省檔案館官網“公眾參與”欄下設的“智能互動”和“我要提問”版塊,強化了檔案館與用戶的聯(lián)系與溝通,豐富了檔案利用形式。隨著多元化互動實踐的開展,檔案部門能夠獲取用戶的偏好和行為習慣,有針對性地推送相關信息,使用戶更加高效地利用檔案資源,提高檔案利用的質量與水平,進而實現(xiàn)檔案利用服務升級。如檔案管理人員對某些檔案關鍵詞的提取并不一定符合大眾的檢索習慣,導致部分檔案查準率不高,UGC應用中,用戶可參與部分檔案信息資源的著錄過程,使檢索詞更加貼近大眾檢索需求,有助于提高檔案的查準率。3.UGC為公民檔案員培育帶來“欲流之遠”之源公民檔案員即“沒有經過專門的檔案管理訓練,或不是專門從事檔案事業(yè)但是參與到與檔案管理相關任務的志愿者或志愿者團體”。傳統(tǒng)的線下公民檔案員實踐需要公民到館參與,UGC應用中的公民檔案員實踐打破了時空限制,更多依托于互聯(lián)網展開,如遼寧省檔案館的“社會檔案人”項目,倡導公眾通過網絡平臺參與檔案相關詞條的編輯。用戶通過強趣味性、娛樂性和互動性的方式廣泛參與檔案的收集、整理、利用等環(huán)節(jié),從檔案的被動接受者變成主動創(chuàng)造者,為公民檔案員培育帶來“欲流之遠”之源。

檔案信息資源平臺建構

檔案部門的UGC實踐多依托于門戶網站、微博、微信等平臺展開,UGC平臺“具有宣傳、互動交流、支付及申訴等附屬功能,允許網絡大眾對數(shù)字檔案進行轉錄、貼標簽、編輯等,允許參與者建言獻策,利用網絡的發(fā)散性思維促進檔案學學科的創(chuàng)新”。為構建具備這一功能的UGC平臺,中國海洋大學的UGC平臺建設走過了一個從無到有、從面向“小眾”到面向“大眾”的初建、進階過程,現(xiàn)已建構出獨立的專門UGC平臺。1.從無到有:檔案歸檔UGC平臺的初建21世紀初,為探索檔案數(shù)字化實踐,中國海洋大學推進檔案管理系統(tǒng)的建設。該系統(tǒng)基于SQLServer數(shù)據庫,采用SQL、VB編目語言開發(fā)的C/S結構,能夠實現(xiàn)Windows操作系統(tǒng)下的檔案收集、整理、移交、歸檔、統(tǒng)計等過程的管理和控制,定向UGC用戶可在此平臺完成檔案著錄。2.從面向“小眾”到面向“大眾”:檔案歸檔UGC平臺的進階隨著電子文件的大量產生,原管理平臺已無法滿足工作需求,中國海洋大學于2017年搭建了新一代檔案管理平臺。檔案管理系統(tǒng)以Java+MVC+Mybatis進行開發(fā),作為全B/S結構的數(shù)字檔案管理系統(tǒng),支持Linux、Windows等操作系統(tǒng),提供完備API外部接口,支持多系統(tǒng)之間的集成和數(shù)據推送,實現(xiàn)對檔案的收集、整理、移交、歸檔、統(tǒng)計、利用等進行全過程可視化管理和監(jiān)控。與原檔案管理系統(tǒng)面向“小眾”的C/S結構相比,現(xiàn)檔案管理系統(tǒng)的B/S結構有助于實現(xiàn)面向“大眾”的UGC應用。3.從附屬到獨立:專門UGC平臺的落成為多元化UGC參與者、豐富UGC內容、優(yōu)化館藏結構,中國海洋大學檔案館在檔案管理系統(tǒng)之外開辟了獨立UGC平臺—信息征集系統(tǒng)。(1)技術層面信息征集系統(tǒng)基于Java開發(fā),采用SpringMVC技術框架,運用Redis數(shù)據緩存、全文檢索、圖片檢索等技術。系統(tǒng)的開發(fā)嚴格基于MVC的三層體系企業(yè)級架構,即視圖層、控制層和數(shù)據層相互分離。Web服務采用Apache直接面向用戶,支持用戶的網站頁面訪問和內容下載;應用服務采用Tomcat,是系統(tǒng)的核心。運用這一架構將“業(yè)務邏輯”部分從Web服務器中分出,在應用服務器中采用獨立和完整的編程語言開發(fā)應用程序,同時使系統(tǒng)支持任意HTML的顯示工具。利用應用服務器作為訪問數(shù)據庫請求的“緩沖區(qū)”,可提高系統(tǒng)響應訪問數(shù)據庫請求的速度和效率,并能與其他應用有效和無縫集成。(2)應用層面信息征集系統(tǒng)包含系統(tǒng)管理、文件管理等模塊,各模塊功能如圖1所示:第一,系統(tǒng)管理模塊下設資源管理、角色管理等8個子模塊。資源管理子模塊可管理系統(tǒng)后臺所有資源,用于新增、調整模塊結構、層次及功能模塊URL配置。角色管理子模塊可進行角色新增、修改、刪除等操作,目前系統(tǒng)中設有管理員、教師、班級、在校生用戶及社會人員5類角色,根據角色特點動態(tài)分配角色權限。用戶管理子模塊,對通過與業(yè)務集成自動生成的用戶,可對其進行編輯、刪除、啟用/禁用等操作,并根據需求新增用戶。菜單管理子模塊管理前臺首頁菜單,通過菜單通知UGC生成文件分類及對應的檔案分類號。水印管理設置水印參數(shù)。系統(tǒng)參數(shù)子模塊可動態(tài)設置平臺基本參數(shù)。數(shù)據字典子模塊可管理系統(tǒng)基本數(shù)據信息,并根據需要自定義設置。上傳管理子模塊,用于控制平臺用戶上傳圖片、視頻、音頻等文件的格式及大小。第二,文件管理。該模塊用于查看平臺所有文件并按專題有序化UGC內容。第三,綜合審核。包含4個子模塊——征集審核、下載審核、標簽審核、用戶審核,管理員可對UGC內容進行查看并提出審核意見。第四,專題管理。管理員將通過審核的UGC內容發(fā)布到“專題”,發(fā)布成功后支持用戶的瀏覽、搜索、下載、收藏等操作。第五,聲像歸檔。即將信息征集系統(tǒng)中通過審核的UGC內容按照預定規(guī)則歸檔保存至檔案管理系統(tǒng)。第六,日志管理。主要用于記錄用戶登錄日志、用戶數(shù)據操作日志以及用戶數(shù)據審核日志。第七,數(shù)據統(tǒng)計。包含專題統(tǒng)計、工作統(tǒng)計、系統(tǒng)監(jiān)測3個子模塊,即對專題收藏數(shù)、專題下載數(shù)、數(shù)據審核工作量、用戶登錄次數(shù)、用戶角色分布、上傳文件類型的統(tǒng)計。具體操作流程如圖2所示:校內UGC參與者使用信息門戶單點登錄,校外UGC參與者需在系統(tǒng)注冊賬戶,經系統(tǒng)管理員審核通過后,用戶根據操作權限上傳符合像素、時長要求的圖片、音頻、視頻等UGC文件,并為內容添加標簽、著錄背景信息。UGC內容上傳成功后,管理員通過審核,對適于發(fā)布的內容按專題發(fā)布至網站,對符合歸檔標準的UGC內容進行歸檔操作。

檔案信息資源平臺應用

檔案UGC實踐為公眾參與檔案著錄、轉錄、編纂、上傳與分享信息、參與添加標簽、業(yè)務糾錯等,現(xiàn)已滲透至檔案工作的多個環(huán)節(jié),漸呈立體化的應用趨勢。中國海洋大學的UGC實踐從面向單一教師群體的檔案著錄開始,現(xiàn)已升級至面向多元群體的著錄、上傳圖片與音視頻、參與添加標簽等應用并行的階段。1.科研成果核實倒逼教師業(yè)績類檔案著錄的UGC實踐教師業(yè)績類檔案即教師在教學、科研工作中產生的論文、著作、專利、獲獎證書等科研成果檔案。20世紀末分配制度改革以來,教職工收入與崗位職責、工作業(yè)績和貢獻直接掛鉤,教師的科研成果由檔案館來核實,教師業(yè)績類檔案的歸檔量和工作量隨之劇增。因之開始了該類檔案目錄著錄的UGC實踐,即檔案館工作人員在原檔案管理系統(tǒng)中為有歸檔需求的教師分配賬號、賦予賬戶權限,教師可在安裝系統(tǒng)客戶端的電腦中錄入檔案目錄信息。2.全門類檔案著錄和原文上傳的常態(tài)化UGC實踐教師業(yè)績類檔案著錄UGC實踐不僅化解了檔案館工作量超負問題,而且提高了該類檔案的歸檔效率、著錄質量。因而這一著錄模式逐漸滲透至其他門類檔案的錄入過程,檔案管理系統(tǒng)啟動前即已拓展出黨群、行政、外事3個門類檔案的目錄著錄UGC實踐,新系統(tǒng)使用后開啟了所有門類檔案目錄著錄和原文上傳的常態(tài)化UGC模式?,F(xiàn)檔案管理系統(tǒng)中,檔案館通過系統(tǒng)與信息門戶人員庫的集成,自動獲取用戶信息、創(chuàng)建用戶賬號并分配相應的操作權限,如錄入、檢索、查閱原文權限等。用戶可在互聯(lián)網環(huán)境下登錄虛擬專用網絡,或在局域網(即校園網)環(huán)境下直接訪問系統(tǒng),根據實際需要著錄檔案信息、上傳原文數(shù)據。3.以“時間膠囊”為濫觴,依托專門UGC平臺的多元化實踐UGC內容具有形式多樣、個性化強等優(yōu)點,也因之衍生出信息離散冗余和良莠混雜等問題。為保障UGC質量,專門UGC平臺—信息征集系統(tǒng)的UGC實踐以班級為單位開展。2019年畢業(yè)季,中國海洋大學檔案館與學生處聯(lián)合發(fā)布通知,針對2019屆畢業(yè)生開展了“時間膠囊”活動,并開始了依托征集系統(tǒng)以班級為單位的信息征集活動?;顒訛閬碜怨こ?、文新等多個學院的500余名本科、碩士、博士生分發(fā)了信封和光盤,并為參加信息征集活動的班級分配了賬號?;顒咏Y束時收回了數(shù)百封信和10多G的圖片、音像資源。此次活動與UGC實踐初行和常態(tài)行的不同之處為UGC實踐面向群體、生成內容、生成方式、內容利用方式等的多元化:第一,UGC面向群體的多元化。原有、現(xiàn)行檔案管理系統(tǒng)的UGC面向群體為在校教師和固定歸檔部門,信息征集系統(tǒng)的面向群體則是在校師生、歷屆校友、社會人士等,上述信息征集活動即已將UGC實踐面向群體拓展至畢業(yè)生。第二,UGC生成內容的多元化。原有、現(xiàn)行檔案管理系統(tǒng)的UGC生成內容多為檔案目錄和原文,信息征集系統(tǒng)的生成內容有圖片、音頻、視頻、文檔等。2019年征集活動中收回了多種格式的UGC內容,文檔、視頻為“致十年后的自己”時間膠囊、經濟學院合唱節(jié)視頻;音頻為經濟學院的院歌—愛在海經;圖片數(shù)量最多、內容最豐富,如研究生英語口譯班生成的300余張照片,內容包含學生的日??谧g訓練照片、上合峰會志愿者照片和口譯、筆譯專業(yè)資格證書照片,以及參加全國口譯大賽、山東省首屆翻譯大賽獲獎證書照片等;2015級物流管理學生參加合唱、紅歌會比賽、體育節(jié)活動、班建活動、健美操啦啦操比賽、團支部創(chuàng)新立項活動之智慧物流大作戰(zhàn)等活動照片,以及班級學生于圖書館、體育館擺出“畢業(yè)了!”“20152019”圖案的特色畢業(yè)寫真等。第三,UGC上傳方式的多元化。原有、現(xiàn)行檔案管理系統(tǒng)的UGC生成方式為系統(tǒng)錄入、上傳,信息征集系統(tǒng)的生成方式有上傳、刻盤、U盤拷貝等。囿于畢業(yè)班學生信息征集系統(tǒng)操作水平的差異性,本著尊重學生意愿、最大量化捕獲UGC內容的原則,信息征集活動的UGC內容通過多渠道捕獲,用戶可通過賬號上傳內容、添加標簽、著錄目錄,如經濟學院應用經濟學專業(yè)的UGC實踐;可通過來館移交、光盤刻錄、U盤拷貝來館光盤刻錄的方式完成UGC內容和目錄的移交,移交結束后由校檔案館工作人員完成UGC內容、目錄的上傳操作,如基礎教學中心教育技術學專業(yè)、經濟學院金融保險研究專業(yè)等的UGC實踐。第四,UGC實踐生成內容利用方式的多元化。UGC內容生成后,經過審核,對于符合檔案標準的內容可通過歸檔操作導入檔案管理系統(tǒng),作為檔案加以保存利用,也可以與檔案管理系統(tǒng)中該班級相關的檔案—錄取大表、成績單、畢業(yè)生名單等檔案內容組合形成該班級的班級檔案、宿舍檔案或個人檔案信息資源集。檔案領域因UGC的泛在式應用迎來了檔案資源體系優(yōu)化的“來而不可失”之時、檔案利用服務升級的“蹈而不可失”之機、公民檔案員培育的“欲流之遠”之源。因之,中國海洋大學構建了從附屬到獨立的檔案UGC平臺,探索了面向全門類檔案歸檔人員和畢業(yè)班學生的目錄著錄、信息上傳、參與添加標簽等UGC實踐。未來之檔案UGC實踐將以平臺協(xié)同并行為依托,漸進開展面向多元UGC群體—在校師生、歷屆校友、社會人士等,包含優(yōu)質UGC內容—“四性”俱全的文檔、圖片、音頻、視頻等,具備立體化UGC生成方式—檔案著錄、轉錄、編纂、上傳與分享信息、參加添加標簽、業(yè)務糾錯等的生成、利用實踐。

作者:孟薔 韓宇亮