網(wǎng)絡(luò)信息組織分類研究論文

時間:2022-03-12 08:46:00

導(dǎo)語:網(wǎng)絡(luò)信息組織分類研究論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

網(wǎng)絡(luò)信息組織分類研究論文

1網(wǎng)絡(luò)信息分類組織面臨的問題

分類組織方式是網(wǎng)絡(luò)信息資源組織的一種重要方式。目前,大多數(shù)提供網(wǎng)絡(luò)信息服務(wù)的搜索引擎或門戶網(wǎng)站都采用自編的分類體系進行信息組織。這些分類體系雖然充分考慮了用戶的需求和網(wǎng)絡(luò)信息的特點,突出了個性,方便了使用,但這些體系仍然存在許多有待改進的問題。

1.1學(xué)科大類設(shè)置不全,知識體系不完整

以中文雅虎(Yahoo)為例,它將網(wǎng)絡(luò)信息分為14個寬泛的類目,每個大類又分出若干二級類,二級類目下細分出三級類目,可根據(jù)需要細分出四、五級類目??梢哉f,Yahoo采取的是一種逐層擴充的方法,以使知識的覆蓋面越來越全。但是,從Yahoo分類每年都發(fā)生的明顯變化和迅速增長的網(wǎng)絡(luò)信息資源我們可以看到,僅僅設(shè)置這14個大類是難以涵蓋人類社會生產(chǎn)生活的各個方面的。又如搜狐(sohu),將網(wǎng)絡(luò)信息分為18個大類,網(wǎng)易()將網(wǎng)絡(luò)信息分為19個大類,都有類似情況??傊?,由于各種原因,現(xiàn)在的網(wǎng)站分類設(shè)置還不完善。知識覆蓋不全,體系過于簡單。幾乎所有的中文搜索引擎的分類體系都存在著知識殘缺不全、體系設(shè)計不完整的通病。

1.2類目劃分標準不夠合理

信息資源在同一層次下劃分的標準不夠統(tǒng)一,有時出現(xiàn)兩個或兩個以上劃分標準的現(xiàn)象。具體來講,同一層次類目在選擇上存在的問題有:一方面,網(wǎng)站為了突出當今的熱門和主流信息,將一些下級類目提升到大類中,如大多數(shù)中文網(wǎng)站把“電腦網(wǎng)絡(luò)”或“計算機與網(wǎng)絡(luò)技術(shù)”與“科學(xué)技術(shù)”并列為大類;又如網(wǎng)易將“體育競技”和“少兒樂園”放在大類中。另一方面,子類的設(shè)置的標準問題,如Yahoo的“科學(xué)”這一大類下設(shè)有“電腦與信息技術(shù)”、“活動”、“教育”、“科普”、“酷站”、“能源”、“字典”、“組織”等等的二級類目。此外,在大類的展開中常出現(xiàn)整體不包含局部的違反邏輯規(guī)則的現(xiàn)象。

1.3各網(wǎng)站采用的分類標準不同,各行其是,導(dǎo)致了用戶在使用時無所適從

以網(wǎng)絡(luò)信息資源為基礎(chǔ)建立類目體系,雖有較好的實用性,但類目劃分的規(guī)律性不強,從而造成了各搜索引擎的分類不一致,體系也不太嚴密、科學(xué),類名不規(guī)范,各個搜索引擎設(shè)立分類目錄時力圖突出的是自己的特色。

如新浪設(shè)立了“少兒搜索”大類,搜狐把“公司企業(yè)”單獨列為一個大類,這就使得用戶在使用時必須對某個搜索引擎的類目比較熟悉,否則當人工的分類有時與某些用戶的習(xí)慣不一致時,會造成這些用戶無法在正常的路徑中找到資料。

1.4類目名稱設(shè)置不夠規(guī)范合理,不能全面反映類目的內(nèi)容,給用戶查找易造成誤解

類名有時不能確切地概括類目的內(nèi)涵,有時只有象征意義。此外,由于類目的下位類范圍較寬,上位類有時很難有效限定其含義,再加上網(wǎng)絡(luò)自編分類體系一般不使用注釋揭示類目內(nèi)涵,容易使一些類目的含義和范圍難以確定。

設(shè)置好類目名稱關(guān)鍵是選好類日用詞。很多網(wǎng)絡(luò)分類體系中采用一些含義模糊的語詞,而且沒有注釋,這就使用戶很難判斷該類目的外延。如“網(wǎng)易”的“另類科學(xué)”,“搜狐”的“生活情趣”等類名,如果沒有注釋,根本就無法明白該類的內(nèi)容包括什么。

1.5類目排列缺乏邏輯性

目前,中文網(wǎng)站總的來講類目排列比較隨意,外延常常有交叉重疊。幾乎所有的中文搜索引擎的分類體系都存在著類目排列混亂的通病。如新浪、網(wǎng)易、搜狐、中華網(wǎng)在線等,都把“文學(xué)”與“藝術(shù)”、“電腦網(wǎng)絡(luò)”與“科學(xué)技術(shù)”、“經(jīng)濟”與“文化”及“政治”等原本密切的大類,卻人為地分割開來。又如網(wǎng)易對“文學(xué)”大類之下15個二級類目的排列,邏輯性不是很強。再如新浪對”文學(xué)”大類之下30個二級類目的排列,即便是按類目的使用頻率或訪問量序列排列,也使人感到排列次序不規(guī)律,不易查找。

1.6從事網(wǎng)絡(luò)信息分類組織的人員都大多是非專業(yè)的分類人員,缺乏專業(yè)知識

隨著網(wǎng)絡(luò)信息資源的迅速增長以及信息需求的不斷加大,網(wǎng)站業(yè)務(wù)量也快速攀升,而建立一個優(yōu)秀的中文搜索引擎是一項龐大復(fù)雜的系統(tǒng)工程,在技術(shù)、設(shè)備、人力、財力的投入上都有比較高的要求。因此,許多網(wǎng)站擴大了工作人員的招收數(shù)量和范圍,與此同時,許多網(wǎng)站卻忽視了引進有信息處理專業(yè)知識的人才,因此造成了許多諸如以上提到的網(wǎng)絡(luò)信息分類組織方面的問題。

面對海量網(wǎng)絡(luò)信息,其分類體系的諸多弊端為用戶充分利用網(wǎng)絡(luò)信息、開發(fā)共享網(wǎng)絡(luò)資源帶來嚴重困難。因此,構(gòu)建規(guī)范合理的網(wǎng)絡(luò)信息分類體系,實現(xiàn)網(wǎng)絡(luò)信息分類組織標準化已是大勢所趨。

2國內(nèi)有關(guān)學(xué)者的研究觀點

從1998年開始,國內(nèi)對網(wǎng)絡(luò)信息分類組織的研究此起彼伏。其中,有許多學(xué)者表達了網(wǎng)絡(luò)信息組織“標準化”的思想。如黃如花在文獻1中指出要“信息描述標準化”;又如鄭福根在文獻2中認為網(wǎng)絡(luò)信息組織的原則之一就是“標準化原則”;再如張林龍在文獻3中指出“建立統(tǒng)一的網(wǎng)絡(luò)信息分類標準成為網(wǎng)絡(luò)信息分類組織的迫切需要”等等。此外,從近幾年的研究成果來看,要編制一部適用于網(wǎng)絡(luò)信息分類組織的分類法已具備了一定的理論基礎(chǔ),此說法可從劉延章、余義芳在文獻4中對1998年~2002年這5年間160余篇有關(guān)網(wǎng)絡(luò)信息分類組織研究的一些結(jié)果中略見一二。下面是文獻4中的部分觀點:

(1)關(guān)于網(wǎng)絡(luò)信息、網(wǎng)絡(luò)信息用戶、網(wǎng)絡(luò)信息技術(shù)環(huán)境特點方面的研究成果極大地提高了我們對網(wǎng)絡(luò)信息分類檢索工具的標引對象、使用對象、所處環(huán)境的認識,為編制高質(zhì)量的網(wǎng)絡(luò)信息分類法打下了認識基礎(chǔ)。

(2)關(guān)于網(wǎng)絡(luò)信息分類法與傳統(tǒng)文獻分類法方面的比較研究為我們借鑒二者各自的特點、編表的理論、方法和技術(shù)提供了便利,從而為編制高質(zhì)量的網(wǎng)絡(luò)信息分類法打下了理論基礎(chǔ)。

(3)關(guān)于傳統(tǒng)分類法應(yīng)用于網(wǎng)絡(luò)信息分類組織方面的研究雖然有助于傳統(tǒng)分類法特別是《中圖法》自身的調(diào)整和改造,使之適應(yīng)于網(wǎng)絡(luò)信息分類組織的需要,但也為更好地編制網(wǎng)絡(luò)信息分類法打下了方法基礎(chǔ)。

(4)關(guān)于現(xiàn)代技術(shù)應(yīng)用于網(wǎng)絡(luò)信息分類組織方面的研究為編制高質(zhì)量的網(wǎng)絡(luò)信息分類法奠定了堅實的技術(shù)基礎(chǔ)。

(5)關(guān)于中文網(wǎng)絡(luò)信息分類體系的特點、問題及其改進方面的研究對于編制高質(zhì)量的網(wǎng)絡(luò)信息分類法具有現(xiàn)實的借鑒意義。

(6)關(guān)于統(tǒng)一的中文網(wǎng)絡(luò)信息分類法編制方面的研究對編制高質(zhì)量的網(wǎng)絡(luò)信息分類法奠定了扎實的基礎(chǔ)。

從上述研究結(jié)果可以看出,我國編制一部高質(zhì)量的網(wǎng)絡(luò)信息分類法具備了一定的理論研究基礎(chǔ)和技術(shù)實現(xiàn)條件,為實現(xiàn)網(wǎng)絡(luò)信息分類組織標準化提供了強有力的保障。

3對網(wǎng)絡(luò)信息組織標準化的構(gòu)想

通過以上分析,要實現(xiàn)網(wǎng)絡(luò)信息組織標準化,編制一部適于網(wǎng)絡(luò)信息組織的《分類法》是非常緊迫,也是切實可行的。但網(wǎng)絡(luò)環(huán)境下的信息分類體系與傳統(tǒng)文獻分類體系相比存在著許多差異:①網(wǎng)絡(luò)分類是以事物為中心,而不是以學(xué)科為中心列類;②網(wǎng)絡(luò)信息分類是以網(wǎng)絡(luò)資源為分類的基本對象,類目收錄對象的范圍更廣;③采用了更多的信息技術(shù);④直接采用語詞進行信息標引;⑤傳統(tǒng)分類是以線性方式展開類目,而網(wǎng)絡(luò)分類是以網(wǎng)狀方式進行超文本鏈接;⑥更新速度快。因此,編制網(wǎng)絡(luò)信息分類法應(yīng)考慮以下兩大方面。

3.1宏觀構(gòu)想

編制網(wǎng)絡(luò)信息分類法,實現(xiàn)網(wǎng)絡(luò)信息組織標準化,應(yīng)體現(xiàn)以下主要原則:

(1)科學(xué)性原則。網(wǎng)絡(luò)信息分類法應(yīng)結(jié)合網(wǎng)絡(luò)信息資源的特點,在充分揭示各學(xué)科之間內(nèi)在聯(lián)系和相互關(guān)系的基礎(chǔ)上,將學(xué)科分類與事物分類相結(jié)合,構(gòu)建一套科學(xué)合理的網(wǎng)絡(luò)分類體系。

(2)繼承性原則。網(wǎng)絡(luò)信息分類法應(yīng)吸收傳統(tǒng)分類法的精華,吸收目前各中文網(wǎng)站分類體系的優(yōu)點,結(jié)合現(xiàn)代信息技術(shù)來共同建造。對傳統(tǒng)的東西不能全盤拋棄,也不能全盤吸收,應(yīng)在吸收借鑒的基礎(chǔ)上有所創(chuàng)新,有所發(fā)展。

(3)動態(tài)性原則。由于互聯(lián)網(wǎng)是一個多元、開放的信息系統(tǒng),因此,網(wǎng)絡(luò)信息資源具有范圍廣、數(shù)量大、動態(tài)性強的特點。這就要求網(wǎng)絡(luò)信息分類也要隨著互聯(lián)網(wǎng)內(nèi)容的變化及時調(diào)整,使各種類型的網(wǎng)絡(luò)信息資源都能在分類法中找到自己的位置。

(4)實用性原則。網(wǎng)絡(luò)信息分類法應(yīng)考慮網(wǎng)絡(luò)環(huán)境下用戶需求的特點。在類目的設(shè)置上,既要體現(xiàn)分類體系的相對穩(wěn)定性,又要方便用戶快速查詢。類目數(shù)量控制在20~25個,類目層次展開至3~4級為宜。

(5)多維性原則。傳統(tǒng)分類法以線性方式揭示文獻信息內(nèi)容,而網(wǎng)絡(luò)信息分類法要盡可能全面而深入地揭示網(wǎng)絡(luò)信息的內(nèi)容和形式,多層次、多途徑、全方位、多角度地進行信息揭示和描述,用超文本鏈接技術(shù),變線性方式為網(wǎng)狀方式,構(gòu)建新型網(wǎng)絡(luò)信息分類體系。

(6)開放性原則。網(wǎng)絡(luò)信息分類體系具有相對的穩(wěn)定性,但網(wǎng)絡(luò)信息資源的開放性和動態(tài)性決定了網(wǎng)絡(luò)分類體系也要隨時增添新的內(nèi)容。同時,不斷吸收新思想、新技術(shù),進一步滿足和適應(yīng)社會以及科技發(fā)展的需要。

3.2微觀構(gòu)想

根據(jù)上述對網(wǎng)絡(luò)信息分類法宏觀構(gòu)想原則,結(jié)合傳統(tǒng)分類法和現(xiàn)有網(wǎng)絡(luò)信息分類體系的研究成果,筆者針對網(wǎng)絡(luò)信息資源中的一類資源——綜合性網(wǎng)站的框架構(gòu)建了5大板塊,對其中內(nèi)容相對穩(wěn)定的休閑娛樂、社會科學(xué)、自然科學(xué)和綜合信息四大板快設(shè)計了22個一級類目。該分類體系以主題為主要聚類標準,充分體現(xiàn)網(wǎng)絡(luò)信息組織分類——主題一體化思想。具體如下:

一級類目

熱門追蹤板塊:考研聊天室游戲同學(xué)錄人物明星下載專區(qū)招聘彩票動漫flash......

休閑娛樂板塊:新聞與媒體娛樂與休閑體育與健康旅游與交通生活與服務(wù)

社會科學(xué)板塊:社會文化哲學(xué)與宗教政治與法律軍事與戰(zhàn)爭經(jīng)濟與金融教育與就業(yè)人文與藝術(shù)歷史與地理

自然科學(xué)板塊:自然科學(xué)醫(yī)療與衛(wèi)生農(nóng)業(yè)科學(xué)計算機與網(wǎng)絡(luò)工程技術(shù)環(huán)境科學(xué)

綜合信息板塊:國家與地區(qū)參考資料綜合網(wǎng)站

上述各板塊中,熱門追蹤板塊內(nèi)容不固定,根據(jù)網(wǎng)上熱點話題的變化而變化,其余四個板塊的內(nèi)容相對穩(wěn)定,即休閑娛樂板塊包括5個一級類目;社會科學(xué)板塊包括8個一級類目;自然科學(xué)板塊包括6個一級類目;綜合信息板塊包括3個一級類目。

Internet是一個開放、動態(tài)的網(wǎng)絡(luò)體系,對其分類體系的構(gòu)建,實現(xiàn)網(wǎng)絡(luò)信息分類組織標準化是一個逐步完善的過程。本文所探討的分類體系也需要進一步細化和發(fā)展,相信經(jīng)過不斷的努力和實踐,實現(xiàn)網(wǎng)絡(luò)信息分類組織標準化的這一天不會太晚。

【參考文獻】

1黃如花.網(wǎng)絡(luò)信息組織的發(fā)展趨勢.中國圖書館學(xué)報,2003(4)

2鄭福根.網(wǎng)絡(luò)信息組織的理論與方法探討.現(xiàn)代情報,2004(6)

3張林龍.網(wǎng)絡(luò)環(huán)境下的信息組織.情報雜志,2003(10)

4劉延章,余義芳.近五年來網(wǎng)絡(luò)信息分類組織研究的現(xiàn)狀及其展望.情報學(xué)報,2004(4)

5王知津,肖洪.網(wǎng)絡(luò)信息組織對傳統(tǒng)信息組織的借鑒.圖書館工作與研究,2003(4)

6陳樹年.搜索引擎及網(wǎng)絡(luò)信息資源的分類組織.圖書情報工作,2000(4)

7董琳.網(wǎng)絡(luò)信息分類組織的發(fā)展趨勢與標準化.圖書情報知識,2004(4)

8王本欣.網(wǎng)絡(luò)信息資源組織研究.圖書館學(xué)研究,2004(5).

9宋劍祥.從國外分類法看《中圖法》對網(wǎng)絡(luò)信息資源的組織.圖書與情報,2004(2)

10宋蓓玲.淺析構(gòu)建網(wǎng)絡(luò)信息分類體系.情報業(yè)務(wù)研究,2004(8)

11張文波.淺述網(wǎng)絡(luò)信息資源組織.現(xiàn)代情報,2004(7)

12王艷.從YAHOO!分類系統(tǒng)探索網(wǎng)絡(luò)信息組織的發(fā)展.圖書館學(xué)刊,2003(6)