檔案編撰數(shù)據(jù)庫開發(fā)利用研究論文
時間:2022-11-27 10:28:00
導語:檔案編撰數(shù)據(jù)庫開發(fā)利用研究論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:在檔案編研工作的各個階段都會形成大量的原始信息,特別是在編研題目確定之后,編研人員要進行廣泛的編研素材的查找、篩選和研究工作,這個階段會形成大量的原始信息,信息量豐富而且復雜,如果對其加以有效的分類、整合、積累、保存,建立編研選材專題數(shù)據(jù)庫,就能為今后的編研工作提供參考和借鑒。
一、建立檔案編研選材數(shù)據(jù)庫的必要性
(一)檔案編研工作實際的需要。目前,各級檔案館在進行編研選題的時候,普遍存在主觀隨意性較大的問題,其中一個重要原因就是沒有充分了解館藏內(nèi)容,致使編研選題與館藏內(nèi)容相脫離,因而編出的編研材料價值不大、參考性不強、實用性不高。在館藏數(shù)量巨大而且逐年上升的形勢下,建立編研選材數(shù)據(jù)庫,可以幫助我們深入了解館藏檔案內(nèi)容,更加科學合理地確定編研選題,真實準確、齊全完整、系統(tǒng)豐富地選擇材料進行編輯加工等工作。
(二)開展網(wǎng)絡檔案編研的前提。網(wǎng)絡環(huán)境下,我們可以將編研選材數(shù)據(jù)庫在網(wǎng)上,為編者提供材料線索。部分網(wǎng)絡編輯系統(tǒng)還可提供“虛擬編輯室”,使得不同地域的編研人員共同完成同一個編研材料,這樣,異地聯(lián)合編研就可成為現(xiàn)實。同時,瀏覽者通過上網(wǎng)瀏覽得到所需的線索,也可以提高到檔案館進行實地查檔的查檔率。
(三)檔案工作新形勢的要求。建立編研選材數(shù)據(jù)庫,為開發(fā)檔案編研管理軟件提供了數(shù)據(jù)支持,是檔案編研工作向現(xiàn)代化、信息化、網(wǎng)絡化邁進的基礎。
二、建立檔案編研選材數(shù)據(jù)庫的形式
(一)檔案文件目錄數(shù)據(jù)庫。就是把有研究參考價值、編研價值以及用于辦展的檔案的目錄,按照一定的專題錄入數(shù)據(jù)庫,類似于我們常用的檔案專題文件級目錄數(shù)據(jù)庫,比如我們檔案館的婚姻檔案、房基地批示檔案、招工檔案等專題目錄數(shù)據(jù)庫。
(二)檔案內(nèi)容簡介數(shù)據(jù)庫。就是在目錄數(shù)據(jù)庫的基礎上,增加檔案內(nèi)容簡介字段,把一份文件中有價值的信息,利用主題詞、關鍵詞或內(nèi)容概要等形式全部反映出來。這樣不但可以檢索到所需文件的題名,還可以對文件的內(nèi)容進行全面的了解。
(三)檔案原文檢索數(shù)據(jù)庫。在數(shù)據(jù)庫中設置檔案原文字段,檔案原文的錄入可分為嵌入式和鏈接式兩種,嵌入式是直接在數(shù)據(jù)庫中輸入檔案原文;鏈接式則是利用已建好的檔案原文數(shù)據(jù)庫,把檔案原文鏈接到數(shù)據(jù)庫中。這樣當檢索到所需文件后,不但可以查看檔案內(nèi)容概要,還可以直接打開檔案原文,有用的內(nèi)容可以直接下載、編輯加工利用,這樣,編研工作效率就會大大提高。
從以上編研選材數(shù)據(jù)庫的三種形式不難看出,建立文件目錄數(shù)據(jù)庫雖然簡單,工作量也較少,但所含信息量也較少。比如北京市平谷區(qū)檔案館的文件級目錄數(shù)據(jù)庫中,一些早期形成的文件題名不很規(guī)范,不能準確全面地概括文件內(nèi)容,檢索利用時有些內(nèi)容重要的檔案就可能被遺漏。而檔案全文數(shù)據(jù)庫信息量大,如果沒有已建好的全文檢索數(shù)據(jù)庫,建立這種全文數(shù)據(jù)庫十分困難。隨著文檔一體化進程的加快,大量電子文件形成,為全文數(shù)據(jù)庫的建立提供了便利。比如,目前我館的文件目錄數(shù)據(jù)庫中已有條目近120萬條,而且還會逐年增加,從實際出發(fā),我覺得可以分階段進行,首先建立文件目錄數(shù)據(jù)庫,然后逐漸擴充,添加內(nèi)容,逐步形成檔案內(nèi)容簡介數(shù)據(jù)庫,乃至最終形成檔案原文檢索數(shù)據(jù)庫。
三、建立檔案編研選材數(shù)據(jù)庫的步驟和方法
(一)對數(shù)據(jù)庫的功能需求的調(diào)研。編研選材數(shù)據(jù)庫一般容量較大,因此要具有較快的檢索速度和較高的查全率、查準率,這樣才能真正提高編研效率。將來開展網(wǎng)絡編研是編研工作的趨勢,不同的檔案館之間,檔案館、室之間,檔案館與社會有關部門之間都可以進行廣泛的聯(lián)合編研,因此編研選材數(shù)據(jù)庫要適合在網(wǎng)絡環(huán)境下使用,要具備較高的檢索性能,便于實現(xiàn)數(shù)據(jù)庫資源的信息共享。
(二)準備數(shù)據(jù)庫材料。編研選材數(shù)據(jù)庫的數(shù)據(jù)來源主要是館藏檔案和資料,現(xiàn)行文件中心的現(xiàn)行文件資料,檔案室保存的檔案信息,其他檔案館保存的資料,通過網(wǎng)絡、公開出版物等途徑獲得的資料信息等。比如,目前我們已收集了檔案館的90多萬條目錄的綜合數(shù)據(jù)庫,基層檔案室報送的30多萬條的電子目錄,為建立選材數(shù)據(jù)庫做好了準備。
(三)數(shù)據(jù)庫選型。數(shù)據(jù)庫的類型有很多,比如Access、Datebase、SQLserver等,一般應選擇功能齊全、通用性強、兼容性能好的數(shù)據(jù)庫。比如根據(jù)我館的實際,可采用Access數(shù)據(jù)庫格式,一是編研人員使用操作比較熟練,二是區(qū)檔案館、各單位檔案室已建立的數(shù)據(jù)庫也是這種格式,我們可以直接在原數(shù)據(jù)庫上進行操作。
(四)數(shù)據(jù)庫的設計。主要是設計字段和設置字段類型。根據(jù)實際需要可以設置檔號、類別、文件題名、內(nèi)容簡介、時間、保管單位、檔案原文等字段,其中要注意以下幾點:
1、類別的設置是關鍵??梢园磳n}設置類別,如可以設置歷史、地理、人文、自然、政治、經(jīng)濟、科技、教育、文化、綜合類等專題。專題的設置要以實用為主,如果專題分得太多,就不容易辨別區(qū)分,不容易歸類;如果專題分得太少,檢索使用起來就不方便。因此,設計專題要做好廣泛的調(diào)研并通過實踐修改完善,也可以參考縣志、百科全書的類目設置。由于類別字段較多,可以用代字或代號表示,并編制字段設計說明。
2、內(nèi)容簡介字段要設計成文本型。它是對文件內(nèi)容進行準確、簡要的概括,內(nèi)容較單一的文件可以用主題詞、關鍵詞進行標注,內(nèi)容較多的文件,可以編寫摘要。標注內(nèi)容簡介是建立數(shù)據(jù)庫的難點,工作量巨大不說,單就一份文件的內(nèi)容來看,有的可能涉及政治、經(jīng)濟、文化、教育、體育等各個方面的重要信息,綜合性文件可能還包含著歷史、地理、自然等社會各個方面的信息,標注起來非常復雜。這就要求編研人員具備較高的判斷、分析、研究能力,從一份文件材料中查找有利用價值信息,同時還要具備較好的總結(jié)、提煉、文字加工功底,全面細致準確地標注檔案內(nèi)容。
3、檔案原文字段要設計成超級鏈接型。由于嵌入式檔案原文所占空間較大,影響檢索速度。檔案的載體、類型又有文本、照片、聲像等多種形式,因此,應采用超級鏈接方式鏈接檔案原文。
(五)窗體界面的設計。設計窗體界面表文件,是為了方便輸入文件內(nèi)容簡介和檔案原文等字段的內(nèi)容,主要設計類別、文件題名、內(nèi)容簡介、時間、檔案原文等字段。
(六)數(shù)據(jù)庫的實施。從實際情況來看,數(shù)據(jù)庫的建立可以分步實施。
第一步是從原目錄數(shù)據(jù)庫中挑選出可用的條目,建立選材目錄數(shù)據(jù)庫。具體方法:可以在原數(shù)據(jù)庫中設置“是否存留”和“類型”兩個新的字段,然后就需要從頭至尾瀏覽數(shù)據(jù)庫,從中找出可用的條目,并在是否存留字段中標注“1”,同時在類型字段中標注應屬于哪個類型,比如政治、經(jīng)濟、文化等類或用代號表示。數(shù)據(jù)庫錄入完成后,為方便使用,可以用檢索工具,檢索出所有“是否存留”字段中是“1”的條目,另建新庫保存,也就是新建一個有用的數(shù)據(jù)庫。公務員之家
第二步是在新建數(shù)據(jù)庫中,添加內(nèi)容簡介。由于填寫檔案內(nèi)容簡介的工作量非常巨大,可以有針對性、有側(cè)重點地進行文件內(nèi)容簡介錄入。從館藏來看,早年形成的檔案文件標題不很規(guī)范,比如革命歷史檔案,敵偽檔案,縣委、人委、革委、五大公社檔案,六大區(qū)委檔案、四清檔案等,而這些檔案又往往是編研或者辦展利用的重點,可以先從這些檔案入手,邊調(diào)研邊錄入內(nèi)容簡介。
第三步是錄入檔案原文。目前我館還沒有檔案原文數(shù)據(jù)庫,基層檔案室電子檔案還沒有接受進館,只能靠我們?nèi)粘7e累。比如我們在編研或是辦展過程中要注意積累,對已形成的電子文件、數(shù)碼照片等隨時鏈接到數(shù)據(jù)庫中。
- 上一篇:建立心理健康檔案的必要性研究論文
- 下一篇:交通肇事犯罪處理法則探究論文