圖書館數(shù)字化內(nèi)容選擇原則闡釋

時(shí)間:2022-07-15 06:14:00

導(dǎo)語:圖書館數(shù)字化內(nèi)容選擇原則闡釋一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

圖書館數(shù)字化內(nèi)容選擇原則闡釋

【內(nèi)容提要】內(nèi)容選擇是圖書館信息資源數(shù)字化項(xiàng)目的一個(gè)重要步驟。文章在對信息資源數(shù)字化內(nèi)容選擇原因分析的基礎(chǔ)上,闡明了數(shù)字化內(nèi)容選擇應(yīng)該遵循的基本原則。

【摘要題】信息資源建設(shè)與管理

【關(guān)鍵詞】數(shù)字化/信息資源數(shù)字化/數(shù)字化內(nèi)容/圖書館

【正文】

由于計(jì)算機(jī)技術(shù)、數(shù)字存儲技術(shù)、現(xiàn)代通訊技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展及有機(jī)結(jié)合,信息存貯和檢索的地理界限已經(jīng)被打破,人們能通過計(jì)算機(jī)網(wǎng)絡(luò),查詢分布于世界各地的數(shù)據(jù)、圖表、文獻(xiàn)等信息。圖書館作為信息資源的收集、整理、存貯和交流的中心,要改變以往的工作模式,能夠在任何空間、任何時(shí)間,準(zhǔn)確、快捷地為任何用戶提供所需信息,需要圖書館將自己的信息資源數(shù)字化,由于各圖書館資金有限,不得不對數(shù)字化內(nèi)容進(jìn)行選擇。圖書館信息資源數(shù)字化內(nèi)容選擇是依據(jù)確定的標(biāo)準(zhǔn)進(jìn)行相符性判斷,將符合條件的原始資源遴選出來,繼而進(jìn)行數(shù)字化加工的一個(gè)過程。良好的選擇原則有助于確保以盡可能低的成本將最重要和最有用的信息資源進(jìn)行數(shù)字化,避免知識產(chǎn)權(quán)糾紛,產(chǎn)生良好的社會效益和盡可能高的投資回報(bào)。

1進(jìn)行數(shù)字化內(nèi)容選擇的原因

數(shù)字化內(nèi)容選擇的原因有很多,概括起來主要有:(1)存儲空間的原因。數(shù)字化的產(chǎn)品是通過網(wǎng)絡(luò)被廣大用戶存取利用,而大家都知道數(shù)字化產(chǎn)品是存放在磁盤陣列上的,磁盤陣列由服務(wù)器來管理,磁盤空間是有限的,服務(wù)器的能力也是有限的,不可能無限量地存入數(shù)字資源,這就需要我們對文獻(xiàn)資源數(shù)字化內(nèi)容進(jìn)行選擇。(2)解決數(shù)字化生產(chǎn)高成本和圖書館經(jīng)費(fèi)有限性之間矛盾的需要。幾乎沒有圖書館有充足的資源來對整個(gè)館藏進(jìn)行數(shù)字化,內(nèi)容選擇不可避免。(3)數(shù)字資源管理的需要。技術(shù)的快速發(fā)展使數(shù)字化項(xiàng)目所生成的數(shù)字資源的生命周期越來越短,投入巨資進(jìn)行數(shù)字遷移是延長數(shù)字資源生命的一個(gè)重要途徑,昂貴的維護(hù)成本就必須考慮數(shù)字化的內(nèi)容選擇。(4)產(chǎn)權(quán)保護(hù)的需要。圖書館對絕大多數(shù)館藏都缺乏產(chǎn)權(quán)的擁有,只能選擇那些能夠得到產(chǎn)權(quán)許可的館藏進(jìn)行數(shù)字化。(5)特殊文獻(xiàn)的考慮。圖書館大都收藏一些對文化倫理乃至民族問題敏感的信息資源,對這些資源進(jìn)行數(shù)字化就要考慮很多因素。(6)殘缺文獻(xiàn)處理成本的考慮。圖書館館藏文獻(xiàn)中有一部分是殘缺不全的,對這些文獻(xiàn)進(jìn)行數(shù)字化之前就要進(jìn)行補(bǔ)缺或作相應(yīng)的說明,其費(fèi)用較多。(7)圖書館信譽(yù)的需要。圖書館作為責(zé)任機(jī)構(gòu),要對所數(shù)字化且的信息資源的可靠性和準(zhǔn)確性負(fù)責(zé)。

2高校圖書館數(shù)字化內(nèi)容選擇應(yīng)遵循的基本原則

不同的數(shù)字化項(xiàng)目其內(nèi)容選擇原則不盡相同,西南政法大學(xué)圖書館現(xiàn)在正在籌備兩個(gè)數(shù)字化項(xiàng)目:一個(gè)是法律古籍的數(shù)字化;另一個(gè)是法律經(jīng)典圖書的數(shù)字化。選擇這兩個(gè)項(xiàng)目是因?yàn)檫@是一個(gè)政法大學(xué)的圖書館,它面對的讀者是政法院校的學(xué)生,故選擇的內(nèi)容都是法律方面的。重慶大學(xué)圖書館選擇的數(shù)字化內(nèi)容主要是理工科類的和建筑類的文獻(xiàn)資源;重慶師范大學(xué)選擇的數(shù)字化內(nèi)容是教育類的文獻(xiàn)資源。無論哪個(gè)高校在數(shù)字化內(nèi)容選擇的時(shí)候都遵循了以下八個(gè)原則:

2.1原始文獻(xiàn)知識價(jià)值原則

影響原始信息資源的知識價(jià)值因素有很多,但主要包括資源的唯一性、相關(guān)價(jià)值、對相關(guān)主題領(lǐng)域理解的重要性、對相關(guān)主題領(lǐng)域覆蓋的廣度和深度、實(shí)用性和準(zhǔn)確度、特定主題領(lǐng)域中其他載體記錄質(zhì)量差的信息內(nèi)容、具有強(qiáng)化項(xiàng)目實(shí)施的歷史價(jià)值以及數(shù)字化產(chǎn)品潛在的長期價(jià)值等。另外,文獻(xiàn)知識價(jià)值也可能包括管理價(jià)值、藝術(shù)價(jià)值、證據(jù)價(jià)值和市場價(jià)值,文獻(xiàn)知識價(jià)值的判斷具有很大程度的主觀性。圖書館不同,對文獻(xiàn)知識價(jià)值的判斷也不相同,在國內(nèi),每個(gè)高校的圖書館都有自己的基本館情,他們都積極對館內(nèi)自己認(rèn)為有特色的東西進(jìn)行數(shù)字化。例如,同樣是法律文獻(xiàn),在政法院校的圖書館可能認(rèn)為這些法律文獻(xiàn)是很有價(jià)值的,數(shù)字化之后可以給更多學(xué)生訪問下載。而法律文獻(xiàn)不是理工科院校的重點(diǎn),數(shù)字化的意義不大。

2.2知識產(chǎn)權(quán)原則

館藏資源的產(chǎn)權(quán)狀態(tài)識別與數(shù)字化項(xiàng)目實(shí)施和數(shù)字資源所在的國家地區(qū)有關(guān),每個(gè)國家都有自己的知識產(chǎn)權(quán)保護(hù)法律。學(xué)者針對圖書館信息資源數(shù)字化項(xiàng)目制訂了產(chǎn)權(quán)狀態(tài)識別模型,比如,美國北卡羅萊納州立大學(xué)法律圖書館主任LauraN.Gasaway建立并維護(hù)的用于圖書產(chǎn)權(quán)狀態(tài)識別模型;康奈爾大學(xué)PeterHitle教授構(gòu)建了用于手稿產(chǎn)權(quán)狀態(tài)的識別模型;印第安納州立大學(xué)和得克薩斯州立大學(xué)的產(chǎn)權(quán)管理中心也分別提供了圖書館信息資源產(chǎn)權(quán)狀態(tài)識別框架[3,4]。館藏資源的產(chǎn)權(quán)歸屬有四種情況:第一,館藏文獻(xiàn)是通過接收的方式,把原本屬于國家所有的文獻(xiàn)收進(jìn)館中,這種文獻(xiàn)的所有權(quán)和著作權(quán)都屬于國家所有,圖書館代為行使,在這種情況下圖書館在遵守有關(guān)法律的前提下,有權(quán)根據(jù)需要自主進(jìn)行數(shù)字化。第二,圖書館通過購買集體或個(gè)人所有的受著作權(quán)保護(hù)的作品,在這種情況下,如果圖書館沒有購買其著作權(quán),則著作權(quán)仍屬于原所有者,因此圖書館要對此類檔案進(jìn)行數(shù)字化,必須在征得原所有者的同意,并向其支付一定的報(bào)酬后方可進(jìn)行,否則就構(gòu)成侵權(quán)。第三,館藏中的一些文獻(xiàn)資源是通過受捐贈的方式得來的,這種情況下,捐贈人一般只是將文獻(xiàn)實(shí)體所有權(quán)贈給圖書館,自己仍保留著作權(quán),所以在數(shù)字化這類文獻(xiàn)時(shí),與通過購買方式得來的文獻(xiàn)一樣,同樣要征得文獻(xiàn)著作權(quán)人的法定許可,并向其支付一定的報(bào)酬后方可進(jìn)行。但也有在捐贈時(shí),聲明將所有權(quán)和著作權(quán)一并捐贈給圖書館的情況,這種情況除外。第四,一些寄存在圖書館里的文獻(xiàn)資源,寄存只是由圖書館代為保存,不發(fā)生所有權(quán)和著作權(quán)的轉(zhuǎn)移,這種情況下,圖書館在進(jìn)行數(shù)字化之前,必須征得文獻(xiàn)資源所有者的同意,否則就侵犯文獻(xiàn)所有者的權(quán)益[2]。目前數(shù)字化項(xiàng)目中保護(hù)產(chǎn)權(quán)的主要技術(shù)有:對每個(gè)數(shù)字圖像添加可視水印或版權(quán)戳;給每個(gè)數(shù)字圖像添加不可視水印,這種水印標(biāo)志可以用來證實(shí)數(shù)字圖像的版權(quán)身份,也可用來跟蹤這個(gè)數(shù)字圖像在因特網(wǎng)上的傳播軌跡;對數(shù)字圖像加密,并僅把密鑰發(fā)送給注冊用戶,這種方法會限制公共存取;將公共瀏覽的圖像限制在低分辨率;將公共存取限制在截取數(shù)字圖像的一小部分之中,這種方法在一些項(xiàng)目中應(yīng)用得非常成功;將圖像的瀏覽權(quán)僅限定在一些注冊或被授權(quán)的用戶。

2.3能獲得更多的用戶原則

用戶利用的本質(zhì)就是館藏文獻(xiàn)的利用率,從理論上講,圖書館信息資源數(shù)字化項(xiàng)目應(yīng)把有限的資金用在利用率高的資源的數(shù)字化上,但一些問題需特別關(guān)注:其一是要對利用率高的文獻(xiàn)的原因進(jìn)行分析,如果主要用戶群體分布在本地,且類似文獻(xiàn)又不存在,這類文獻(xiàn)的利用率自然可能高,但數(shù)字化后在網(wǎng)絡(luò)上,其利用率如何就比較難以判斷,因?yàn)檫@時(shí)的用戶就不僅局限于本地了。其二是文獻(xiàn)的利用率有時(shí)與文獻(xiàn)的知識價(jià)值并不一致,有些具有高知識價(jià)值的文獻(xiàn)由于存放地點(diǎn)和圖書館存取方針的限制或目錄的不完整等因素,可能導(dǎo)致利用率偏低,比如說,西南政法大學(xué)的法律外文圖書,其實(shí)它對讀法律的學(xué)生來說是非常有知識價(jià)值的,由于這些書經(jīng)濟(jì)成本很高,一般每本書就是幾十上百美元,折合人民幣就是幾百上千,為了降低這些圖書的丟失率和預(yù)防別人翻版這些外文圖書,以至于這些圖書只能復(fù)印,并且不用復(fù)印全本圖書。其三是利用率也會與文獻(xiàn)的物理狀態(tài)有關(guān),一些文獻(xiàn)的物理狀態(tài)限制了用戶對其的訪問,比如易碎載體的文獻(xiàn)、古舊的手稿等。如西南政法大學(xué)圖書館的法律古籍,許多都是線裝書,并且紙張都已經(jīng)發(fā)黃,很容易被損壞,如果開放由讀者隨意借閱,會使這些珍貴的古籍被損壞,以致消失,這對西南政法大學(xué)圖書館乃至整個(gè)法律界都是一個(gè)不可估量的損失。其四是在多館合作數(shù)字化項(xiàng)目中,一些大部頭的系列文獻(xiàn)分散在各成員單位,對這些文獻(xiàn)的訪問率可能較低,但數(shù)字化后可以形成完整的虛擬館藏,其訪問率可能就會提高。其五是一些技術(shù)因素不應(yīng)該成為阻止一些文獻(xiàn)數(shù)字化的原因,比如,一些文獻(xiàn)的數(shù)字化文件的格式或像素導(dǎo)致在網(wǎng)上傳播速度慢,乃至用戶難以瀏覽,但網(wǎng)絡(luò)技術(shù)的快速發(fā)展(如帶寬的不斷提高)可能在數(shù)字化周期之內(nèi)就能得到解決,另外文獻(xiàn)數(shù)字化后的格式改變也是促進(jìn)技術(shù)發(fā)展的一個(gè)重要動因。

2.4原始文獻(xiàn)存在狀態(tài)原則

在數(shù)字化內(nèi)容選擇過程中,需要考慮的與原始文獻(xiàn)存在狀態(tài)相關(guān)的問題有:原始文獻(xiàn)的存在狀態(tài)是否有利于數(shù)字化?其內(nèi)容是否能被目前的數(shù)字化技術(shù)完全和充分地抓???物理材質(zhì)和形狀是否會對數(shù)字化過程構(gòu)成障礙?是否有保存良好的替代品(如縮微膠片)?最常見的物理材質(zhì)有一般紙張、牛皮紙、草紙、微縮膠片、光學(xué)材料、三維物體、玻璃器皿、記錄音頻的盒帶光盤和磁帶、視頻等。不同物理材質(zhì)的文獻(xiàn)需要不同的技術(shù)進(jìn)行數(shù)字化,比如,一般紙張可以采用數(shù)字掃描,但三維物體只能采用數(shù)碼拍照。存在狀態(tài)對其內(nèi)容的充分抓取也有重大影響,比如,一般紙張中內(nèi)容的抓取要比草紙充分得多,甚至,有些物理材質(zhì)的內(nèi)容數(shù)字化目前還難以實(shí)施。所以,只能選擇那些當(dāng)前技術(shù)條件下適合于數(shù)字化的載體材質(zhì)館藏資源,載體的物理尺寸也是影響內(nèi)容選擇的一個(gè)重要因素。比如,常見掃描設(shè)備對大型地圖和海報(bào)進(jìn)行數(shù)字化很困難,這時(shí),也許對其替代物(如照片)進(jìn)行掃描是一種較好的選擇[1]。載體的健壯性對數(shù)字化內(nèi)容選擇也會產(chǎn)生影響,比如,一些珍貴或易損的資源需要在特殊環(huán)境中數(shù)字化。牛津大學(xué)的“難民研究數(shù)字化項(xiàng)目”和耶魯大學(xué)的“開放圖書項(xiàng)目”支持資源載體的拆分,以提高數(shù)字化設(shè)備的吞吐量。健壯性的另一個(gè)體現(xiàn)是對數(shù)字化處理的特殊要求,如牛津大學(xué)的“塞爾特語和中世紀(jì)手抄本數(shù)字化項(xiàng)目”要求設(shè)計(jì)一種特殊的保護(hù)托架來放置手稿。

2.5對文獻(xiàn)資源進(jìn)行保存原則

為了保存的需要,數(shù)字化內(nèi)容選擇的原則之一是安全數(shù)字化(safedigitiza2tion),包括原始信息資源的狀態(tài)允許被完全數(shù)字化;數(shù)字化實(shí)施過程需要搬運(yùn)原始資源時(shí),其狀態(tài)適合于搬運(yùn);盡可能掃描原始資源的替代品(如照片),從而減少對原始資源的損傷;數(shù)字化的產(chǎn)品必須建檔,并制訂由于時(shí)間和技術(shù)變化等因素導(dǎo)致的長期維護(hù)策略。數(shù)字保存的另一層含義是保護(hù)易碎載體的原始資源,數(shù)字資源的本身就是原始資源的新版本,可以代替原始資源供用戶訪問,并由此減少對原始文獻(xiàn)的操作從而使其得到保護(hù)。如對古籍來說,由于它極其容易被損壞,從這個(gè)原則上來講它是應(yīng)該拿來數(shù)字化的,但在數(shù)字化過程中,特別要注意不要將這些珍貴的圖書損壞,這也將對數(shù)字化帶來很多麻煩。

2.6經(jīng)濟(jì)效益原則

館藏文獻(xiàn)的數(shù)字化成本受眾多因素影響。分辨率越高的圖像所需的成本也越高,彩色圖像的成本要比黑白圖像的成本高,數(shù)字化生成純文本文件有助于全文檢索,且占用較少的存儲空間,但需要OCR識別,并需要大量的人工校對,如果生成帶標(biāo)記的文本文件(如XML文件),雖然有助于各種分析乃至納入數(shù)據(jù)庫管理,但成本必然增加。成本也取決于數(shù)字化過程,比如,單頁掃描比裝訂在一起掃描成本要低,保存狀態(tài)良好的資源掃描要比保存狀態(tài)差的資源掃描所需成本要低,因?yàn)楹笳咝枰嗟娜斯ぬ幚?。從效益角度看,受益最大的是用戶。另外,?shù)字化也便于圖書館管理人員對館藏資源的管理,并能更高效地提供服務(wù),盡可能提高成本效益是數(shù)字化內(nèi)容選擇的宗旨。實(shí)現(xiàn)相同功能而采用不同方法的成本會有所不同,比如,數(shù)字化生成文本文件與生成圖像文件,后者加入元數(shù)據(jù)與圖像文件鏈接,兩種方法得到的效果可能差不多,但很明顯后者的成本要低些。另外,規(guī)模很大的項(xiàng)目單件數(shù)字化成本要低,長期保存的費(fèi)用也會降低。

2.7避免重復(fù)數(shù)字化原則

對于已有數(shù)字化版本的館藏避免再次數(shù)字化是目前內(nèi)容選擇的一個(gè)基本原則。目前,都覺得數(shù)字圖書館有利可圖,于是國家圖書館、各地區(qū)各行業(yè)圖書館甚至是一些企業(yè),都一哄而上,從自身利益出發(fā),紛紛建立自己的數(shù)據(jù)系統(tǒng),在內(nèi)容上缺乏明確的分工,相互之間在技術(shù)上、數(shù)據(jù)格式和標(biāo)準(zhǔn)并不兼容,往往好大喜功,力圖“最大”、“最全”,無法實(shí)現(xiàn)資源共享,實(shí)際上形成一種“信息割據(jù)”的局面[5]。但要考慮已有數(shù)字化版本的質(zhì)量、記錄狀況和功能是否能夠滿足用戶的需要,以及獲取數(shù)字化版本的條件,甚至還要評估獲取數(shù)字化版本與重新數(shù)字化兩者所需費(fèi)用。一般來講,自己再數(shù)字化的成本要比獲取數(shù)字化版本的費(fèi)用要高,如果我們確實(shí)需要這部分?jǐn)?shù)字化資源,我們可以向這部分?jǐn)?shù)字化資源的所有者購買使用權(quán)。這樣就可以節(jié)省自己圖書館的開支,也達(dá)到了目的。在其它條件都允許的情況下,最好不要重復(fù)數(shù)字化,因?yàn)橹貜?fù)數(shù)字化,是對金錢、時(shí)間、人力、物力的一種浪費(fèi)。

2.8技術(shù)條件限制原則

數(shù)字化內(nèi)容選擇將受現(xiàn)有技術(shù)條件的限制,我們在選擇數(shù)字化內(nèi)容的時(shí)候必須要考慮現(xiàn)在的技術(shù)是不是能夠順利地把這個(gè)內(nèi)容數(shù)字化??紤]的主要因素有:數(shù)字化過程中對原始資料識別技術(shù)方面的問題,會導(dǎo)致數(shù)字技術(shù)生成的文獻(xiàn)數(shù)字版與原始文獻(xiàn)包含信息相比出錯率很大;數(shù)字資源顯示在用戶終端的質(zhì)量;圖書館支持的現(xiàn)行平臺和網(wǎng)絡(luò)環(huán)境對數(shù)字資源的存取能力;數(shù)字資源網(wǎng)絡(luò)傳播速度的合理性;對未來用戶使用先進(jìn)設(shè)備的預(yù)測,以免日后需重新掃描;搜索引擎對圖書館數(shù)字資源的索引能力。另外,還要考慮一些特殊資源數(shù)字化的技術(shù)可行性,如,需要超高分辨率的文獻(xiàn)資源、顏色至關(guān)重要的原始資源、超大尺寸的資源、三維形態(tài)的資源以及易讀性很差的資源載體等。

圖書館在進(jìn)行數(shù)字化內(nèi)容選擇的時(shí)候,只有滿足了以上的原則,數(shù)字化才有價(jià)值,才能給圖書館和讀者都帶來好處。

【參考文獻(xiàn)】

[1]臧國全.圖書館信息資源數(shù)字化內(nèi)容選擇原則研究.圖書情報(bào)知識,2006(1):21-24

[2]向立文.檔案數(shù)字化建設(shè)中若干問題的研究.湘潭大學(xué)碩士學(xué)位論文,2004

[3]CopyrightManagementCenter.[2005-07-30].www.copyright.iupui.edu/

[4]CopyrightCrashCourse.[2005-07-30].www.copyright.iupui.edu/

[5]陸娜,李綱.論我國數(shù)字信息資源建設(shè).情報(bào)科學(xué),2006(2):204-205

a