網(wǎng)絡(luò)資源信息老化研究論文

時(shí)間:2022-03-12 08:51:00

導(dǎo)語:網(wǎng)絡(luò)資源信息老化研究論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

網(wǎng)絡(luò)資源信息老化研究論文

科學(xué)文獻(xiàn)老化的探索源于1944年美國紐約大學(xué)的戈斯內(nèi)爾(C.F.Gosnell)在美國《大學(xué)與研究機(jī)構(gòu)圖書館》雜志上發(fā)表的題為《大學(xué)圖書館中文獻(xiàn)老化問題》的論文,在傳統(tǒng)文獻(xiàn)老化規(guī)律研究領(lǐng)域,已經(jīng)形成了以半衰期(Half-Life)和普賴斯指數(shù)(PriceIndex)為主要指標(biāo),以負(fù)指數(shù)模型、巴爾頓—?jiǎng)P普勒老化方程、布魯克斯老化方程等為方法的研究體系。但是,這些指標(biāo)和模型是否同樣適用于網(wǎng)絡(luò)信息資源的老化研究,目前還沒有得到充分的論證。以下的部分,我們在分析網(wǎng)絡(luò)信息資源老化原因的基礎(chǔ)上,通過比較傳統(tǒng)文獻(xiàn)資源和網(wǎng)絡(luò)信息資源老化的差異,從理論上初步探討衡量網(wǎng)絡(luò)信息資源老化的指標(biāo)。

1網(wǎng)絡(luò)信息資源老化的原因及特征

1.1網(wǎng)絡(luò)信息資源老化的原因

網(wǎng)絡(luò)信息資源的老化是指網(wǎng)絡(luò)信息資源中情報(bào)的有效價(jià)值隨著時(shí)間的流逝逐漸衰減,利用率逐步降低。這與傳統(tǒng)文獻(xiàn)的老化一樣,是一種普遍存在的現(xiàn)象。造成網(wǎng)絡(luò)信息資源老化的因素很多,我們大致可以將其歸納為以下幾個(gè)方面:

(1)網(wǎng)絡(luò)信息資源的增長。情報(bào)學(xué)家M.勞恩曾說過:“文獻(xiàn)增長得越快,文獻(xiàn)的半衰期就越短?!毙畔①Y源的增長和老化是同一事物的兩個(gè)方面,它們從不同的角度反映信息資源的動(dòng)態(tài)變化。眾所周知,網(wǎng)絡(luò)信息資源的增長速度極其驚人。以我國為例,據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心的統(tǒng)計(jì),2002年12月31日,全國網(wǎng)頁總數(shù)為157,091,220個(gè),字節(jié)總數(shù)為2,877,754,095KB[1];2003年12月31日,全國網(wǎng)頁總數(shù)為311,864,590個(gè),字節(jié)總數(shù)為6,059,431,526KB[2];到2004年12月31日,全國網(wǎng)頁總數(shù)就達(dá)到了650,682,300個(gè),字節(jié)總數(shù)增長到20,537,214,718KB,與2003年相比,增幅分別為108.6%和238%[3]。

(2)網(wǎng)絡(luò)信息資源的更新。網(wǎng)絡(luò)信息資源的更新是指網(wǎng)絡(luò)信息資源在載體形態(tài)、數(shù)據(jù)組織方式、網(wǎng)址等外在特征不變的情況下,所含知識(shí)和情報(bào)在內(nèi)容上的變化。1998和1999年,Bar-Ilan和Peritz對(duì)信息計(jì)量學(xué)領(lǐng)域網(wǎng)絡(luò)信息的生命周期研究表明,在6個(gè)月內(nèi)近50%的網(wǎng)頁發(fā)生了變化[4];而WallaceKoehler的觀察結(jié)果更為顯著,他發(fā)現(xiàn)97%的網(wǎng)站6個(gè)月內(nèi)會(huì)發(fā)生變化,如觀察時(shí)間為1年,則比例上升為99%。對(duì)于網(wǎng)頁而言,這組數(shù)據(jù)分別為98.3%和99.1%[5]。應(yīng)該指出的是,網(wǎng)絡(luò)信息資源更新并沒有引起網(wǎng)絡(luò)信息資源總量的增長。

(3)網(wǎng)絡(luò)信息資源的消失。網(wǎng)絡(luò)信息資源的消失是指網(wǎng)絡(luò)信息資源無論出于何種原因,被從系統(tǒng)中刪除,不能再被訪問和利用。文獻(xiàn)[4]表明,68%的網(wǎng)頁1年內(nèi)將被從網(wǎng)上移除;而文獻(xiàn)[5]發(fā)現(xiàn),有12.2%的網(wǎng)站和20.5%的網(wǎng)頁6個(gè)月后不能再被訪問到。1年后,分別上升到17.7%和31.8%。并且,每周有0.5%的網(wǎng)頁和網(wǎng)站消失。與網(wǎng)絡(luò)信息資源的更新不同,網(wǎng)絡(luò)信息資源的消失意味著網(wǎng)絡(luò)信息資源總量的減少。

(4)替代性網(wǎng)絡(luò)信息資源的出現(xiàn)。隨著人類對(duì)客觀事物和社會(huì)運(yùn)動(dòng)規(guī)律認(rèn)識(shí)水平的提高,原有的知識(shí)不斷被完善和突破。同時(shí),由于技術(shù)的進(jìn)步和社會(huì)信息需求的共同推動(dòng),網(wǎng)上信息的加工深度越來越大,原有的知識(shí)和情報(bào)被包含在新的知識(shí)和情報(bào)之中,因而,原來不完善、不全面的陳舊信息資源逐漸不再被利用。替代性網(wǎng)絡(luò)信息資源的出現(xiàn)并不意味著原有信息資源的更新和消失,而表現(xiàn)為網(wǎng)絡(luò)信息資源中,蘊(yùn)含新知識(shí)和情報(bào)的信息的出現(xiàn)和信息總量的增長。

(5)網(wǎng)絡(luò)信息資源的吸引力。網(wǎng)絡(luò)信息資源的吸引力主要來自兩個(gè)方面:一是網(wǎng)絡(luò)信息資源所揭示和反映的對(duì)象所處的發(fā)展階段。處于誕生和發(fā)展初期的事物,相關(guān)網(wǎng)絡(luò)信息資源的數(shù)量往往呈指數(shù)增長,老化遵循負(fù)指數(shù)函數(shù)關(guān)系。進(jìn)入成熟期后,信息的增長速率變小,老化曲線也變得平緩,半衰期加長。當(dāng)對(duì)該事物的認(rèn)識(shí)積累到一定程度,將出現(xiàn)質(zhì)的飛躍,相關(guān)信息的增長進(jìn)入新一輪的指數(shù)增長階段,相應(yīng)的,老化曲線也恢復(fù)成負(fù)指數(shù)曲線。二是網(wǎng)絡(luò)信息資源的受關(guān)注程度。對(duì)于網(wǎng)絡(luò)信息資源所揭示和反映的對(duì)象而言,受關(guān)注程度越高,往往意味著知識(shí)更新越快,半衰期越短,反之則越長。對(duì)于網(wǎng)絡(luò)信息資源自身而言,其受關(guān)注程度遵循“Winnertakesall”法則,受關(guān)注程度越高的網(wǎng)絡(luò)信息資源半衰期越短,也就是說信息更新越快,質(zhì)量和數(shù)量也穩(wěn)步提升。

1.2網(wǎng)絡(luò)信息資源老化的特征

網(wǎng)絡(luò)信息資源老化與傳統(tǒng)文獻(xiàn)資源老化既有相同之處,又有顯著的差異,其獨(dú)特之處主要表現(xiàn)在:

(1)非累積性。傳統(tǒng)文獻(xiàn)資源的重要特征之一就是其存在的永續(xù)性,即使這些載體上的知識(shí)和情報(bào)完全失去了使用價(jià)值,它也不會(huì)消失。原有信息的修正與更新、替代信息的生產(chǎn)以及新信息的產(chǎn)生必須依靠新的載體。因此,傳統(tǒng)文獻(xiàn)資源從數(shù)量上來說,總是不斷增長的。而網(wǎng)絡(luò)信息資源則不然。網(wǎng)絡(luò)環(huán)境中的信息是介于產(chǎn)生后永續(xù)存在與即刻消失兩種狀態(tài)之間的第三類信息,它的更新和消亡是其存在和運(yùn)動(dòng)的常態(tài)。在網(wǎng)絡(luò)環(huán)境下,新信息的出現(xiàn)并不一定意味著信息總量的增長,而且,相當(dāng)一部分信息在喪失其使用價(jià)值之后會(huì)徹底消失,引起信息總量的減少,呈現(xiàn)負(fù)增長狀態(tài)。所以,我們認(rèn)為網(wǎng)絡(luò)信息資源具有非累積性,這表明網(wǎng)絡(luò)信息資源的老化研究往往只能基于特定時(shí)間點(diǎn)或時(shí)間段,難以系統(tǒng)地回溯其歷史狀態(tài)。

(2)動(dòng)態(tài)性。動(dòng)態(tài)性與非累積性是內(nèi)在統(tǒng)一的。任何信息都是外在形態(tài)與所含內(nèi)容的統(tǒng)一體。記錄信息的載體和信息的組織方式是信息資源的外在形態(tài),而內(nèi)容,即其所蘊(yùn)含的知識(shí)和情報(bào)才是核心。傳統(tǒng)文獻(xiàn)資源的外部形態(tài)和內(nèi)容是不可分割的,因而必然具有累積性。而網(wǎng)絡(luò)信息資源的外部形態(tài)和內(nèi)容可以是相互獨(dú)立的,因此,在網(wǎng)絡(luò)信息資源載體的形態(tài)、信息組織方式、網(wǎng)址等保持不變的情況下,內(nèi)容可以不斷更新,甚至刪除,這就體現(xiàn)為它的非累積性。眾所周知,半衰期、普賴斯指數(shù)的測定都是依據(jù)特定領(lǐng)域文獻(xiàn)資源的被利用情況,而網(wǎng)絡(luò)信息資源的動(dòng)態(tài)性使其老化規(guī)律的研究增加了新的內(nèi)容,即對(duì)網(wǎng)絡(luò)信息資源自身生命周期的研究。

(3)不完全性。傳統(tǒng)文獻(xiàn),的生產(chǎn)和傳播是受控的,由相關(guān)機(jī)構(gòu)統(tǒng)一審核和管理。因此,在傳統(tǒng)文獻(xiàn)資源老化研究中,研究對(duì)象的范圍一般相當(dāng)清晰,在數(shù)量上也是可數(shù)的。而在網(wǎng)絡(luò)信息資源的老化研究中,研究對(duì)象的不完全性卻是無法回避的問題。導(dǎo)致該問題出現(xiàn)的原因主要來自兩個(gè)方面:一是網(wǎng)絡(luò)的開放性決定了網(wǎng)上信息的基本上處于不受控制的狀態(tài),因此,任何研究者都無法確知網(wǎng)絡(luò)信息資源的精確構(gòu)成和分布狀況,在研究特定領(lǐng)域的網(wǎng)絡(luò)信息資源時(shí),也就不可能準(zhǔn)確地劃定研究對(duì)象的范圍和數(shù)量。二是網(wǎng)絡(luò)信息資源的非累積性和動(dòng)態(tài)性造成了研究對(duì)象在時(shí)間維度上的缺失,因此,在研究中也就難以系統(tǒng)地回溯研究對(duì)象的歷史狀態(tài)。

2衡量網(wǎng)絡(luò)信息資源老化狀況的指標(biāo)

根據(jù)網(wǎng)絡(luò)信息資源老化的原因及其特征,我們從網(wǎng)絡(luò)信息資源自身的生命周期和網(wǎng)絡(luò)信息資源被利用情況兩個(gè)方面,建立衡量網(wǎng)絡(luò)信息資源老化狀況的指標(biāo)。

2.1網(wǎng)絡(luò)信息資源的生命周期

網(wǎng)絡(luò)信息資源的生命周期反映的是網(wǎng)絡(luò)信息資源自身的老化狀況,可以采用半衰期和生存期兩項(xiàng)指標(biāo)衡量。

2.1.1半衰期

半衰期源于物理學(xué)領(lǐng)域,原指放射性元素的原子核有半數(shù)發(fā)生衰變所需的時(shí)間。我們借用這一概念,將網(wǎng)絡(luò)信息資源的半衰期定義為網(wǎng)絡(luò)信息資源的基本構(gòu)成元素有半數(shù)發(fā)生變化所需的時(shí)間。根據(jù)是否考慮網(wǎng)絡(luò)信息資源的增量部分,網(wǎng)絡(luò)信息資源的半衰期又可以分為靜態(tài)半衰期和動(dòng)態(tài)半衰期。

(1)靜態(tài)半衰期。靜態(tài)半衰期是指在不考慮增長的情況下,網(wǎng)絡(luò)信息資源的基本構(gòu)成元素有半數(shù)發(fā)生變化(含消失)的時(shí)間。例如,以網(wǎng)頁為基本構(gòu)成元素,考察網(wǎng)站A的靜態(tài)半衰期。假設(shè)網(wǎng)站A有10000個(gè)網(wǎng)頁,每個(gè)月有1000個(gè)不同的網(wǎng)頁發(fā)生變化,并且有100個(gè)網(wǎng)頁消失。根據(jù)上述定義,網(wǎng)站A的靜態(tài)半衰期為10000÷2÷(1000+100)=4.55(月)或0.38(年)。

(2)動(dòng)態(tài)半衰期。動(dòng)態(tài)半衰期是在考慮增長的情況下,網(wǎng)絡(luò)信息資源的基本構(gòu)成元素中較新的一半產(chǎn)生于多長時(shí)間內(nèi)。例如,在上例的基礎(chǔ)上,假設(shè)網(wǎng)站A每個(gè)月新增500個(gè)網(wǎng)頁。根據(jù)動(dòng)態(tài)半衰期的定義,網(wǎng)站A的動(dòng)態(tài)半衰期為10000÷[2×(1000+500)-(500-100)]=3.85(月)或0.32(年)。

當(dāng)然,半衰期的計(jì)算在實(shí)際研究中情況會(huì)復(fù)雜得多。首先,網(wǎng)頁不會(huì)勻速地發(fā)生變化、消失和增長;其次,一個(gè)網(wǎng)頁可能連續(xù)多次發(fā)生變化,由于我們考察的基本元素是網(wǎng)頁,因此只能將其計(jì)為一次;第三,在計(jì)算動(dòng)態(tài)半衰期時(shí)必須認(rèn)識(shí)到,新增網(wǎng)頁也會(huì)發(fā)生變化;最后,出于研究的需要,我們可能會(huì)選擇在信息組織上比網(wǎng)頁粒度更細(xì)的單元作為基本構(gòu)成元素,譬如知識(shí)單元、網(wǎng)絡(luò)鏈接、單詞等。

2.1.2生存期

網(wǎng)絡(luò)信息資源的生存期是指特定網(wǎng)絡(luò)信息資源的URL存續(xù)時(shí)間。如同人的遺傳密碼一樣,URL是區(qū)分不同網(wǎng)絡(luò)信息資源的唯一標(biāo)識(shí),因此,我們認(rèn)為URL是判定網(wǎng)絡(luò)信息資源生存期最理想的依據(jù)。根據(jù)該定義,只要URL保持不變,無論內(nèi)容如何變化,都視為同一個(gè)網(wǎng)絡(luò)信息資源。在極端情況下,特定URL所對(duì)應(yīng)的網(wǎng)絡(luò)信息資源內(nèi)容甚至可以為空反之,即使內(nèi)容沒有發(fā)生任何變化,只要URL被改動(dòng),我們就視為原信息資源“生命”的終結(jié)和新網(wǎng)絡(luò)信息資源的誕生。當(dāng)然,如果特定網(wǎng)絡(luò)信息資源及其URL同時(shí)被刪除,同樣也意味著該網(wǎng)絡(luò)信息資源生存期的終止。

2.2網(wǎng)絡(luò)信息資源的價(jià)值周期

網(wǎng)絡(luò)信息資源的價(jià)值周期的計(jì)量依據(jù)是其被利用的狀況,這與傳統(tǒng)文獻(xiàn)資源老化規(guī)律的研究思路基本相同。文獻(xiàn)半衰期的研究可以分為學(xué)科文獻(xiàn)的半衰期和論文的半衰期。學(xué)科文獻(xiàn)的半衰期是指某學(xué)科(專業(yè))現(xiàn)時(shí)尚在利用的全部文獻(xiàn)中較新的一半是在多長一段時(shí)間內(nèi)發(fā)表的;論文半衰期是指引用這篇論文的全部其他論文的二分之一是在這篇后的多長時(shí)間內(nèi)發(fā)表的。需要強(qiáng)調(diào)的是,學(xué)科文獻(xiàn)的半衰期是相對(duì)于被引文獻(xiàn)而言,而論文的半衰期是相對(duì)于引用文獻(xiàn)而言的[6]。與此相對(duì)應(yīng),我們?nèi)匀灰浴鞍胨テ凇睘橹笜?biāo)衡量網(wǎng)絡(luò)信息資源的價(jià)值周期,并按研究對(duì)象分為宏觀網(wǎng)絡(luò)信息資源半衰期和微觀網(wǎng)絡(luò)信息資源半衰期。

(1)宏觀網(wǎng)絡(luò)信息資源半衰期。根據(jù)學(xué)科文獻(xiàn)半衰期的概念,我們將宏觀網(wǎng)絡(luò)信息資源半衰期定義為某主題領(lǐng)域網(wǎng)絡(luò)信息資源所含鏈接的鏈宿所指資源中較新的一半是在多長時(shí)間內(nèi)產(chǎn)生的。例如,如果我們說網(wǎng)絡(luò)信息計(jì)量學(xué)的網(wǎng)絡(luò)信息資源半衰期是1.2年,就表明在我們進(jìn)行統(tǒng)計(jì)研究的那一年里,在網(wǎng)上的網(wǎng)絡(luò)信息計(jì)量學(xué)文獻(xiàn)中的鏈接所指資源的50%是在最近1.2年內(nèi)發(fā)表的。

宏觀網(wǎng)絡(luò)信息資源半衰期的研究是基于網(wǎng)絡(luò)信息資源中的鏈接。由于網(wǎng)絡(luò)信息資源中的鏈接與文獻(xiàn)的被引文獻(xiàn)是性質(zhì)完全不同的兩類事物,因此,在借鑒其研究思路的同時(shí),我們應(yīng)該注意自身的特殊性。筆者認(rèn)為,最重要的幾個(gè)需要解決的問題是:第一,必須明確鏈接的目的,也就是鏈源與鏈宿之間的關(guān)系;第二,當(dāng)鏈宿的時(shí)間晚于鏈源所在網(wǎng)絡(luò)信息資源的時(shí)間時(shí)應(yīng)當(dāng)如何計(jì)算;第三,是應(yīng)該采用網(wǎng)絡(luò)信息資源中所有的鏈接,還是只考察出鏈;第四,從理論上來說,我們需要獲得該主題領(lǐng)域的所有網(wǎng)絡(luò)信息資源,并提取其所含有的鏈接。由于網(wǎng)絡(luò)信息資源的不完全性,研究結(jié)果可能與客觀實(shí)際存在相當(dāng)程度的差異。

(2)微觀網(wǎng)絡(luò)信息資源半衰期。參照論文半衰期的概念,微觀網(wǎng)絡(luò)信息資源半衰期是指指向該網(wǎng)絡(luò)信息資源的全部其他網(wǎng)絡(luò)信息資源的二分之一是在其后的多長時(shí)間內(nèi)出現(xiàn)的。例如,網(wǎng)上某文檔的半衰期是1.5年,就意味著該文檔所獲得入鏈的鏈源所在網(wǎng)絡(luò)信息資源的50%出現(xiàn)于其后的1.5年內(nèi)。

與宏觀網(wǎng)絡(luò)信息資源半衰期的研究相比,微觀網(wǎng)絡(luò)信息資源半衰期研究所面臨的問題相對(duì)較少。根據(jù)上述定義,微觀網(wǎng)絡(luò)信息資源半衰期的研究不涉及自鏈,并且基本不會(huì)出現(xiàn)入鏈的鏈源所在資源的時(shí)間早于研究對(duì)象出現(xiàn)時(shí)間這樣的情況。因此,需要考慮的問題中最主要的就是解決或盡量縮小網(wǎng)絡(luò)信息資源的不完全性。盡管有研究表明,網(wǎng)絡(luò)鏈接的使用動(dòng)機(jī)與文獻(xiàn)引用動(dòng)機(jī)存在巨大差異,但筆者認(rèn)為,無論處于何種動(dòng)機(jī),網(wǎng)絡(luò)信息資源獲得入鏈就意味著其使用價(jià)值的實(shí)現(xiàn),我們在計(jì)量其半衰期時(shí)不必做過多的區(qū)分[7]。

3網(wǎng)絡(luò)信息資源老化研究展望

網(wǎng)絡(luò)信息資源的老化研究與網(wǎng)絡(luò)信息資源的增長、分布與利用研究共同構(gòu)成了網(wǎng)絡(luò)信息計(jì)量學(xué)研究的基本框架,對(duì)豐富與完善網(wǎng)絡(luò)信息計(jì)量學(xué)的學(xué)科體系具有極高的理論價(jià)值。同時(shí),網(wǎng)絡(luò)信息資源老化研究的成果也是網(wǎng)絡(luò)信息資源建設(shè)、管理和利用的依據(jù),具有重要的現(xiàn)實(shí)意義。

目前,國內(nèi)對(duì)網(wǎng)絡(luò)信息資源的老化研究才剛剛起步,所見文獻(xiàn)僅有2004年王宏鑫和邱均平在《情報(bào)理論與實(shí)踐》第4期所發(fā)表的《關(guān)于網(wǎng)絡(luò)信息老化研究的若干問題》一文[8]。因此,在現(xiàn)階段應(yīng)該借鑒文獻(xiàn)計(jì)量學(xué)的研究成果,在充分認(rèn)識(shí)網(wǎng)絡(luò)信息資源與傳統(tǒng)文獻(xiàn)資源所存在差異的基礎(chǔ)上,建立網(wǎng)絡(luò)信息資源老化研究的理論與方法體系,為探索網(wǎng)絡(luò)信息資源老化規(guī)律和實(shí)踐應(yīng)用奠定基礎(chǔ)。

【參考文獻(xiàn)】

12002年中國互聯(lián)網(wǎng)絡(luò)信息資源數(shù)量調(diào)查報(bào)告./html/Dir/2003/11/22/1393.htm

22003年中國互聯(lián)網(wǎng)絡(luò)信息資源數(shù)量調(diào)查報(bào)告./download/manual/report20030330.pdf

32004年中國互聯(lián)網(wǎng)絡(luò)信息資源數(shù)量調(diào)查報(bào)告./download/2005/2005041401.pdf

4Bar-Ilan,PeritzB.C.ThelifespanofaspecifictopicontheWeb:thecaseof"informatrics"aquantitativeanalysis.Scientometrics.1999,46(3):371-382

5WallaceKoehler.AnAnalysisofWebPageandWebSiteConstancyandPermanence.JournaloftheAmericanSocietyforInformationScience.1999,50(2).

6邱均平編著.文獻(xiàn)計(jì)量學(xué).北京:科學(xué)技術(shù)文獻(xiàn)出版社,1988.

7HakJoonKim.Motivationsforhyperlinkinginscholarlyelectronicarticles:Aqualitativestudy.JournaloftheAmericanSocietyforInformationScience.2000,51(10)

8王宏鑫,邱均平.關(guān)于網(wǎng)絡(luò)信息老化研究的若干問題.情報(bào)理論與實(shí)踐.2004(4)