學(xué)籍檔案數(shù)據(jù)庫建立論文

時間:2022-02-22 03:47:00

導(dǎo)語:學(xué)籍檔案數(shù)據(jù)庫建立論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

學(xué)籍檔案數(shù)據(jù)庫建立論文

一建立學(xué)籍檔案數(shù)據(jù)庫的必要性

1.建立學(xué)籍檔案數(shù)據(jù)庫使學(xué)籍檔案的管理效率、檢索速度和查準率有了明顯的提高。面對日積月累的檔案,沿用傳統(tǒng)的手工目錄查詢檔案已經(jīng)不能適應(yīng)形勢的要求,傳統(tǒng)的案卷目錄檢索點單一,不支持模糊查詢,檢索起來費勁費時,而且查全率和查準率很難得到保障。以復(fù)旦大學(xué)1960年以后形成的學(xué)生學(xué)籍檔案為例,如本??粕膶W(xué)生成績表、畢業(yè)生登記表,不以個人為單位立卷的,而是以年度、院系或?qū)I(yè)為單位裝訂成冊,學(xué)生的學(xué)籍變更如休學(xué)、退學(xué)、復(fù)學(xué)、轉(zhuǎn)學(xué)不能在案卷目錄上體現(xiàn)出來,這樣難免會降低檔案的查準率。我們將學(xué)生的個人信息輸入計算機,建立學(xué)生信息數(shù)據(jù)庫,只要定義任一檢索條件或組合查詢,即可迅速準確地篩選出符合條件的記錄。

2.采用學(xué)籍檔案數(shù)據(jù)庫管理緩解了檔案保存與利用之間的矛盾。學(xué)籍檔案的形成年度跨度較大,尤其是具有百年歷史的高校,學(xué)籍檔案對于研究高校教育史具有重要的參考價值,而檔案不同于一般的歷史文物,具有記錄性和原始性的特點,隨著社會的發(fā)展,學(xué)籍檔案的利用率在不斷提高,檔案的破損速度也在加快,這樣就產(chǎn)生了學(xué)籍檔案“保存”與“利用”之間的矛盾。將學(xué)籍檔案原文數(shù)字化,存入數(shù)據(jù)庫,不僅可以解決“保存”與“利用”的矛盾,而且還大大提高了查檢速度。

3.學(xué)籍檔案數(shù)字化是檔案信息上網(wǎng)的基礎(chǔ)。網(wǎng)絡(luò)化已成為時代的主旋律,網(wǎng)絡(luò)技術(shù)的應(yīng)用更推動了檔案事業(yè)邁上新的層次。檔案信息是重要的信息資源,檔案信息只有上網(wǎng)才能體現(xiàn)它的價值,才能為更多人所利用。大量的檔案信息寓于紙質(zhì)的案卷、文件之中,雖然電子文件已經(jīng)達到相當(dāng)程度的普及,但大量較早時期形成的檔案都還是紙質(zhì)的,這是檔案信息上網(wǎng)的一大障礙。只有將這些紙質(zhì)檔案轉(zhuǎn)化為電子文件,才能真正成為電子信息。

2、建設(shè)學(xué)籍檔案數(shù)據(jù)庫

1.學(xué)生信息數(shù)據(jù)庫的基本結(jié)構(gòu)

學(xué)生信息數(shù)據(jù)庫由10個輸入字段組成,分別是:學(xué)號、姓名、字、號、籍貫、院、系、專業(yè)、入學(xué)年月、畢業(yè)年月,同時,這些字段又是多途徑組合查詢的檢索入口。

我們用Access2000來開發(fā)學(xué)籍檔案信息管理系統(tǒng),Access是一種關(guān)系型數(shù)據(jù)庫,它為用戶提供了數(shù)據(jù)庫管理的工具集和應(yīng)用程序開發(fā)環(huán)境,是中小型數(shù)據(jù)庫應(yīng)用領(lǐng)域中最通用的數(shù)據(jù)庫軟件。由于Access數(shù)據(jù)庫和VB(VisualBasic)語言結(jié)合得比較好,對于數(shù)據(jù)庫開發(fā)人員,利用VB語言以及Access數(shù)據(jù)庫提供的可視化工具和向?qū)?,便可以設(shè)計出具有一定規(guī)模、功能強大的數(shù)據(jù)庫應(yīng)用系統(tǒng)。Access還具有數(shù)據(jù)訪問的功能,可以創(chuàng)建用來添加、編輯、查看、處理學(xué)籍檔案數(shù)據(jù)庫當(dāng)前記錄的Web頁,也可以通過電子郵件發(fā)送數(shù)據(jù)。

2.制作掃描文件

采用掃描錄入方式將學(xué)籍檔案按原貌逐頁存儲為圖像文件,學(xué)籍檔案原件有5項基本內(nèi)容:畢業(yè)照、學(xué)生學(xué)籍表、分年課程學(xué)分表、畢業(yè)資格審查表、中學(xué)畢業(yè)證書,以學(xué)號作為文件名標(biāo)識,例如某人學(xué)號為13561,那么他的掃描文件分別為13561a、13561b、13561c、13561d、13561e,依次類推。

計算機圖像文件的格式很多,常見的圖像格式有:BMP、JPEG、TIFF等,使用上各有長短。不同的格式其文件大小、打開速度、支持顏色、壓縮耗損等參數(shù)均不相同。BMP格式的圖像沒有壓縮、最能體現(xiàn)實物的原貌,大多數(shù)瀏覽器如IE、Netscape等都支持這種格式。然而其文件大,占用系統(tǒng)資源最多,打開速度慢,特別是在網(wǎng)絡(luò)上傳輸時,其打開和下載速度更難適應(yīng)要求。因此在圖像格式的選擇上必須考慮Web圖像的要求。JPEG格式的圖像壓縮比例大,圖像文件做得小,網(wǎng)絡(luò)下載速度也最快,支持顏色也多。TIFF格式的文件適合做動態(tài)圖形,但是色彩層次的還原性比較差。所以,建設(shè)大量圖片形式的掃描文件庫選擇以*.JPG格式保存比較好。

經(jīng)過比較和測試,用100dpi的掃描分辨率掃描的圖像在清晰度和文件大小之間達到較好的平衡。

3.學(xué)籍檔案數(shù)據(jù)庫系統(tǒng)的設(shè)計

對所有的掃描文件編制目錄索引,目錄索引用數(shù)據(jù)庫方式建立,每一圖像文件以其存儲地址與其在目錄索引中的記錄相鏈接。利用目錄索引可檢出所需檔案之圖像文件的存放地址,通過地址借助鏈接顯示該檔案原文的圖像。

我們設(shè)計的復(fù)旦大學(xué)學(xué)生學(xué)籍檔案信息管理系統(tǒng)由數(shù)據(jù)庫文件,掃描文件,超文本文件及程序文件組成。分別開設(shè)四個子目錄存放這四部分的文件。

數(shù)據(jù)庫文件即學(xué)籍信息數(shù)據(jù)庫,由手工錄入的學(xué)生信息組成,一人一條記錄,是檢索的依據(jù),也是鏈接的基礎(chǔ)。

掃描文件即學(xué)籍檔案的原文掃描件,由于數(shù)量多,必需用一個大容量的硬盤來存放,為了保證數(shù)據(jù)的安全,還應(yīng)分期分批進行數(shù)據(jù)備份。

超文本文件即*.html文件,通過程序生成,通過學(xué)號建立超文本鏈接。

程序文件由輸入界面、查詢界面組成,并分別嵌入IE控件。程序啟動后,歷讀學(xué)籍檔案文件夾中的掃描圖形文件,依學(xué)號自動編寫相應(yīng)的HTML文件,供輸入、查詢中的瀏覽器閱讀。

系統(tǒng)采用先掃描后輸入的方式。在輸入界面內(nèi),選擇學(xué)號,程序調(diào)用對應(yīng)的HTML文件,瀏覽器顯示對應(yīng)學(xué)籍表,依據(jù)學(xué)籍表輸入相關(guān)信息,使數(shù)據(jù)庫的輸入工作簡潔直觀,可方便完成數(shù)據(jù)的保存、編輯和打印等工作。

在查詢界面內(nèi),可按各字段進行獨立或組合檢索,并在網(wǎng)頁內(nèi)給出結(jié)果集合。點擊學(xué)號,瀏覽器給出該學(xué)生的全部檔案資料。并可直接打印,郵寄各文件。

3、建設(shè)學(xué)籍檔案數(shù)據(jù)庫的難點和解決辦法

1.學(xué)籍檔案具有原始性的特點。雖然文檔一體化管理在信息系統(tǒng)技術(shù)上已逐步走向成熟,但是大量歸檔后的文件卻不能做到全部數(shù)字化。自動文字識別軟件OCR技術(shù)的應(yīng)用大大提高了數(shù)字化的效率,但是這種軟件要求印刷體的規(guī)范化文字,而對歷史檔案原始資料中大量形形色色的手寫字體很難識別。由于時代所限,早期形成的歷史檔案都是紙質(zhì)的,這也是實現(xiàn)檔案數(shù)字化的瓶頸。所以,通過掃描技術(shù),將原始的學(xué)籍檔案材料,轉(zhuǎn)換為圖像文件存儲在計算機中,是一種比較現(xiàn)實可行的辦法。通過學(xué)籍檔案數(shù)據(jù)庫可以快速調(diào)用原文數(shù)據(jù)庫即掃描文件庫中的文件,也省卻了調(diào)卷的繁復(fù)。

2.學(xué)籍檔案材料不統(tǒng)一。學(xué)籍檔案是散頁的,各種材料大小不一,有些材料甚至有缺損,在掃描時需要對有殘缺和破損的照片在進行修補,我們可以用圖像處理技術(shù)對掃描的圖像文件進行加工,使之達到滿意的效果。

3.建設(shè)學(xué)籍檔案數(shù)據(jù)庫數(shù)據(jù)庫是一項費時的工作。學(xué)籍檔案的原始性決定了它的數(shù)字化必須通過掃描來實現(xiàn),而學(xué)籍材料的不統(tǒng)一性又降低了掃描的效率。這樣,學(xué)籍檔案的全部數(shù)字化在短時間是不可能實現(xiàn)的。數(shù)據(jù)庫管理系統(tǒng)的功能完善需要測試,而系統(tǒng)測試需要一定數(shù)量的數(shù)據(jù),也就是學(xué)籍檔案的原件掃描件。短時間里,檔案的完全數(shù)字化很難實現(xiàn),因為掃描是一項費時的工作,而檔案數(shù)字化最基礎(chǔ)的工作也就是掃描。

建立學(xué)籍檔案數(shù)據(jù)庫是建設(shè)數(shù)字化檔案館的一種探索,按照辦公自動化、檔案信息化、保管科學(xué)化、利用現(xiàn)代化的要求,通過建立學(xué)籍檔案數(shù)據(jù)庫可以實現(xiàn)檔案信息數(shù)字化,達到利用現(xiàn)代化的要求,并最終實現(xiàn)學(xué)生學(xué)籍檔案的信息共享和有效利用。檔案數(shù)據(jù)庫的建立是網(wǎng)絡(luò)時代的要求,也是檔案工作現(xiàn)代化的主要標(biāo)志。只有將檔案全文信息數(shù)字化了,才能在網(wǎng)上公布,構(gòu)建現(xiàn)代意義上的數(shù)字化檔案館,使檔案用戶在足不出戶的情況下借助網(wǎng)絡(luò)查閱檔案,獲取信息。