語義網(wǎng)知識管理研究論文

時(shí)間:2022-03-12 10:04:00

導(dǎo)語:語義網(wǎng)知識管理研究論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

語義網(wǎng)知識管理研究論文

摘要隨著知識型企業(yè)的出現(xiàn),知識己逐漸成為企業(yè)首要的生產(chǎn)要素。企業(yè)如何通過對知識實(shí)施有效管理來效益最大化,增強(qiáng)競爭能力,已經(jīng)引起人們的普遍重視。本文從知識管理目前存在的問題出發(fā),提出了語義網(wǎng)相關(guān)技術(shù)在知識管理中的作用,給出基于語義網(wǎng)的知識管理方法。

關(guān)鍵詞語義Web;知識管理;信息查詢

在人類社會進(jìn)入新世紀(jì)的同時(shí),人類也進(jìn)入了一個(gè)全新的時(shí)代——知識經(jīng)濟(jì)時(shí)代。隨著知識型企業(yè)的出現(xiàn),知識逐漸成為首要的生產(chǎn)要素。企業(yè)如何通過對知識實(shí)施有效管理來效益最大化,增強(qiáng)競爭能力,已經(jīng)引起人們的普遍重視。企業(yè)知識管理已成為當(dāng)今管理學(xué)界和企業(yè)管理者們最為關(guān)注的課題之一。

1知識管理

1.1知識管理的出現(xiàn)

所謂“知識經(jīng)濟(jì)”,就是“以知識為基礎(chǔ)的經(jīng)濟(jì)”,這個(gè)術(shù)語來自于對知識和技術(shù)在經(jīng)濟(jì)增長中所起作用的充分了解,體現(xiàn)了人力資本和技術(shù)中的知識是經(jīng)濟(jì)發(fā)展的核心,強(qiáng)調(diào)了知識作為一種資源在新的經(jīng)濟(jì)社會形態(tài)中所具有的基礎(chǔ)特征。就企業(yè)管理來講,知識管理的影響主要有四個(gè)方面:

(1)經(jīng)濟(jì)全球化給組織(企業(yè))產(chǎn)生了巨大壓力。

(2)知識密集型產(chǎn)業(yè)成為現(xiàn)代經(jīng)濟(jì)增長的主導(dǎo)力量。對傳統(tǒng)產(chǎn)業(yè)來說“知識化”將是其維持現(xiàn)有地位或?qū)崿F(xiàn)創(chuàng)新的惟一出路。

(3)知識作為一種獨(dú)立的生產(chǎn)要素在各種要素投入中占據(jù)主導(dǎo)地位,與此相應(yīng)地“知識工人”在企業(yè)中的地位不斷強(qiáng)化。

(4)信息技術(shù)的飛速發(fā)展和信息基礎(chǔ)設(shè)施的極大改善為組織運(yùn)作提供了與工業(yè)化時(shí)代在本質(zhì)上不同的基本環(huán)境。

在上述背景下,管理學(xué)家和企業(yè)管理者們?nèi)找嬲J(rèn)識到,知識及其學(xué)習(xí)代表著企業(yè)(組織)競爭優(yōu)勢的重要源泉,“企業(yè)知識管理”便由此應(yīng)運(yùn)而生。

1.2目前存在的問題

在互連網(wǎng)上有數(shù)以百億計(jì)的文檔被超過上億的用戶使用,這些文檔中有很多是在企業(yè)或組織內(nèi)部的Intranet上。隨著網(wǎng)絡(luò)的不斷發(fā)展,這些為企業(yè)服務(wù)的文檔會越來越多地出現(xiàn)在網(wǎng)絡(luò)上,所以我們有理由相信未來企業(yè)對于信息和知識的管理都會偏向于網(wǎng)絡(luò)。但是目前基于網(wǎng)絡(luò)知識管理系統(tǒng)都存在著明顯的不足:

1)信息檢索

目前的信息檢索方式主要是基于關(guān)鍵詞的檢索而并非語義。顯然這種方式缺點(diǎn)在于它并不能處理同義詞。造成這種結(jié)果的原因是傳統(tǒng)的基于關(guān)鍵詞的檢索只關(guān)注檢索與數(shù)據(jù)存儲之間的關(guān)系。這種檢索是不涉及詞匯的語義的。

2)信息的集成

目前對于網(wǎng)絡(luò)上的信息集成主要靠人工處理。存在這個(gè)問題的主要原因是目前的自動軟件不能處理文本代表的常識知識,并且它們不能處理分布式的資源。

3)維護(hù)半結(jié)構(gòu)化文件

目前組織的很多文檔都是半結(jié)構(gòu)化的,但維護(hù)這種信息的準(zhǔn)確和一致是一件既困難又費(fèi)時(shí)的工作,所以我們需要有某種自動化的機(jī)制幫助我們自動監(jiān)測錯誤。

1.3語義Web在知識管理中的應(yīng)用

以前對于信息集成的研究主要集中在如何整合不同的數(shù)據(jù)庫和知識庫,這些數(shù)據(jù)庫和知識庫都是結(jié)構(gòu)化的,所以這些集成方法并不能很好的適應(yīng)目前互聯(lián)網(wǎng)上的半結(jié)構(gòu)化數(shù)據(jù),我們需要的知識管理工具必要整合分布在網(wǎng)上的半結(jié)構(gòu)化的信息資源。

語義Web是對當(dāng)前互連網(wǎng)的擴(kuò)展。語義Web上的信息具良好的含義,使計(jì)算機(jī)之間以及人類能夠更好的協(xié)同合作。語義Web有這樣的定義:機(jī)器可以理解數(shù)據(jù)含義的下一代互連網(wǎng),稱之為語義Web。語義Web的目的就在于把互聯(lián)網(wǎng)變成一個(gè)巨大的知識庫,這個(gè)知識庫不僅可以被人理解而且還可以被機(jī)器理解。如果它實(shí)現(xiàn)的話,我們可以想象這樣的互聯(lián)網(wǎng)將會怎樣影響我們的生活。

2相關(guān)技術(shù)

2.1傳統(tǒng)的知識表示方法

所謂知識的表示實(shí)際上就是對知識的一種描述,或者說是一組約定,一種計(jì)算機(jī)可以接受的用于描述知識的數(shù)據(jù)結(jié)構(gòu)。對知識進(jìn)行表示的過程就是把知識編碼成某種數(shù)據(jù)結(jié)構(gòu)的過程。知識的表示方法多種多樣,主要有:①一階謂詞邏輯表示法;②產(chǎn)生式表示法;③框表示法;④語義網(wǎng)絡(luò)表示法;⑤腳本表示法;⑥過程表示法;⑦Petri網(wǎng)表示法;⑧面向?qū)ο蟊硎痉ǖ取?/p>

對同一知識的表示可以用多種方法,但各自的效果卻不相同。因此我們常把幾種表示形式并用,以取得優(yōu)勢互補(bǔ)的效果。例如一階謂詞、產(chǎn)生式規(guī)則、框架和語義網(wǎng)絡(luò)等己經(jīng)應(yīng)用于知識管理系統(tǒng)的開發(fā)中。隨著面向?qū)ο蠹夹g(shù)的發(fā)展,面向?qū)ο蟮闹R表示方法也被應(yīng)用于知識管理系統(tǒng)的設(shè)計(jì)之中。

2.2語義Web的框架

姆·伯納斯·李(Tim.Berners-Lee)一直致力于語義Web技術(shù)的研究,并一直關(guān)注語義Web技術(shù)的發(fā)展,在綜合了語義Web研究領(lǐng)域的最新成果的基礎(chǔ)上,提出了語義Web模型。這一模型得到了語義Web研究者的認(rèn)同,圖1就是伯納斯·李提出的語義Web分層結(jié)構(gòu)圖。圖1中,XML層作為語法層;RDF(ResourceDescriptionFramework)層作為數(shù)據(jù)層;本體層(Onto1ogyLayer)作為語義層;邏輯層(LogicLayer)提供了智能推理的規(guī)則;證據(jù)層(ProofLayer)支持間通訊的證據(jù)交換。

2.3RDF和RDFSchema

RDF是ResourceDescriptionFramework(資源描述框架)的縮寫,提供了用于描述元數(shù)據(jù),特別是Web元數(shù)據(jù)的技術(shù)。而RDFSchema(簡稱RDFS)則是用來定義描述所用到的“主語”、“謂詞”、“賓語”的。這里可以用面向?qū)ο蟮乃枷雭眍惐人鼈冎g的關(guān)系。如果說RDF是用來完成實(shí)際工作的對象,那么RDFSchema就是用來定義對象的類。

RDF通過三元組的方式來描述資源,包括“主語”,“謂詞”,“賓語”。描述三元組有很多方式,其中最重要的是以XML方式。以XML方式描述的好處就在于,這種方式不僅可以使人理解,而且可以使機(jī)器自動處理,更重要的是它可以在網(wǎng)絡(luò)上自由的交互。

RDFS定義RDF詞匯采用一種類似于面向?qū)ο蟮臋C(jī)制,也就是說我們需要定義的類都是預(yù)先定義的rdfs:Resource的子類,也可以是某個(gè)我們已經(jīng)定義好的某個(gè)類的子類。這樣做的好處就是任何人都可以利用現(xiàn)有的詞匯來定義新詞匯,從而大大節(jié)省工作量,并成為一種面向?qū)ο笾兄赜盟枷氲捏w現(xiàn)。

2.4Ontology和OWL

Ontology的概念最初起源于哲學(xué)領(lǐng)域,可以追溯到公元前古希臘哲學(xué)家亞里士多德它在哲學(xué)中的定義為“對世界上客觀存在物的系統(tǒng)地描述,即存在論”,是客觀存在的一個(gè)系統(tǒng)的解釋或說明,關(guān)心的是客觀現(xiàn)實(shí)的抽象本質(zhì)。近年來,計(jì)算機(jī)界關(guān)于本體論研究的成果數(shù)量正逐步增多,質(zhì)量也逐漸提高。并且在1998年6月召開了關(guān)于本體論的第一次國際會議—“信息系統(tǒng)中的形式化本體論國際會議”,標(biāo)志著這一研究領(lǐng)域正在走向繁榮和成熟。

語義網(wǎng)是對未來網(wǎng)絡(luò)的一個(gè)設(shè)想,在這樣的網(wǎng)絡(luò)中,信息都被賦予了明確的含義,機(jī)器能夠自動地處理和集成網(wǎng)上可用的信息。語義網(wǎng)使用XML來定義定制的標(biāo)簽格式以及用RDF的靈活性來表達(dá)數(shù)據(jù),下一步需要的就是一種Ontology的網(wǎng)絡(luò)語言(比如OWL)來描述網(wǎng)絡(luò)文檔中的術(shù)語的明確含義和它們之間的關(guān)系。OWL是w3c推薦的語義網(wǎng)絡(luò)“?!敝械囊徊糠?,這個(gè)“?!北槐磉_(dá)如下:

名稱描述

XML結(jié)構(gòu)化文檔的表層語法,對文檔沒有任何語義約束。

XMLSchema定義XML文檔的結(jié)構(gòu)約束的語言。

RDF對象(或者資源)以及它們之間關(guān)系的數(shù)據(jù)模型,為數(shù)據(jù)模型提供了簡單的語義,這些數(shù)據(jù)模型能夠用XML語法進(jìn)行表達(dá)。

RDFSchema描述RDF資源的的屬性和類型的詞匯表,提供了對這些屬性和類型的普遍層次的語義。

OWL添加了更多的用于描述屬性和類型的詞匯,例如類型之間的不相交性(disjointness),基數(shù)(cardinality),等價(jià)性,屬性的更豐富的類型,屬性特征(例如對稱性,symmetry),以及枚舉類型(enumeratedclasses)。

3基于Ontology的知識管理

3.1Ontology在知識管理中的作用

Ontology是語義Web中的一項(xiàng)關(guān)鍵技術(shù),它的理論基礎(chǔ)是人工智能。Ontology被廣泛應(yīng)用主要是因?yàn)椤八梢允谷撕蜋C(jī)器之間進(jìn)行有效的溝通”,對于一個(gè)組織來說(特別是比較大的組織)運(yùn)用本體思想和相應(yīng)的工具就可以更有效的對知識進(jìn)行管理。Ontology主要應(yīng)用于智能信息集成、企業(yè)信息系統(tǒng)、信息恢復(fù)、電子商務(wù)等領(lǐng)域。我們用以下三個(gè)步驟應(yīng)用本體思想對知識進(jìn)行管理:

(1)首先我們要建立各個(gè)領(lǐng)域內(nèi)的本體,然后把這些相對孤立的本體鏈接起來。這里的各個(gè)領(lǐng)域應(yīng)在較小的范圍內(nèi),在建立本體的時(shí)候我們基于人工智能和自然語言處理的知識,并有相應(yīng)的開發(fā)工具。

(2)存儲與表示本體。對于本體的描述方法有很多,但是我們要解決的問題是如何在當(dāng)今的網(wǎng)絡(luò)環(huán)境下進(jìn)行知識管理,所以描述本體的方法必須適合于網(wǎng)絡(luò)的傳輸。正如前文提到的,XML是一個(gè)解決這個(gè)問題很好的方法,在XML的基礎(chǔ)上我們建立了RDF和RDFS對本體進(jìn)行描述,這樣我們就可以很好的對本體進(jìn)行管理。

(3)搜索和瀏覽本體的信息。在對本體描述和儲存之后我們要建立相應(yīng)的搜索引擎對本體進(jìn)行查詢,當(dāng)然這種查詢不是我們現(xiàn)在基于關(guān)鍵詞的查詢,而是基于語意的查詢。

3.2RDF的語法簡介

RDF一般的表示形式有三種:XML形式、標(biāo)示圖、三元組。它們雖然表示方法不同,但表示的模型都是一樣的,既包括主語、謂詞和賓語。如:

<rdf:RDF

xmlns:rd=”http:///1999/02/22-rdf-syntax-ns#”

xmlns:dc=”http:///metadata/Dublin_core#”

>

<rdf:Descriptionabout=”http://www.spided-/Articles/00054c3.htm”>

<dc:creator>MickHume</dc:creator>

</rdf:Description>

<rdf:Descriptionabout=”http://www.spided-/Articles/00054E9.htm”>

<dc:creator>MickHume</dc:creator>

</rdf:Description>

</rdf:RDF>

這個(gè)聲明的意思很明顯,就是列出了MickHume所寫的兩篇文章。我們可以完整地看一下使用這個(gè)語法的不同的元數(shù)據(jù)模型。

首先使用這個(gè)句型:

MickHumeisthecreatorof

http://www.spided-/Articles/00054c3.htm

MickHumeisthecreatorof

http://www.spided-/Articles/00054e9.htm

其次標(biāo)示如圖2所示。

圖2

最后是作為三元組集合的本質(zhì)的元數(shù)據(jù)模型:

{author,[http://www.spided-/Articles/00054c3.htm],“MickHume”}

{author,[http://www.spided-/Articles/00054e9.htm],“MickHume”}

下面是構(gòu)成語法的元素:

元素rdf:Description

屬性元素

容器

關(guān)于聲明的聲明

3.3RDFS簡介

RDFSchema的作用就是允許用戶自定義一些詞匯來描述資源,并且使用某些特定屬性來描述資源和資源之間的關(guān)系。例如Spiked公司想描述一個(gè)類ex:book,并且使用屬性spiked:Name、spiked:Author、spiked:Pages等來描述這個(gè)類的若干個(gè)實(shí)例。類似的還有那些對圖書資源比較感興趣的RDF開發(fā)人員可能會描述ex2:Book或者ex2:MagazineArtical這樣的類,并使用ex2:author、ex2:title、ex2:subject之類的屬性來描述這些類。這些類和屬性被稱為RDF詞匯,它們需要通過RDF詞匯描述語言:RDFSchema來定義。

3.4RDF/RDFS查詢

對RDF/RDFS的查詢有三個(gè)層次:在語法層次上的查詢;在結(jié)構(gòu)層次上的查詢;在語意層次上的查詢。

3.4.1語法層次上的查詢

任何一個(gè)格式正確的RDF或是RDFS文檔都是一個(gè)XML文件,所以在對于語法這個(gè)層次上的查詢,本質(zhì)上與在不理解語義的情況下對XML文件的查詢沒有什么不同,所以現(xiàn)在比較成熟的XQuery技術(shù)完全可以解決這個(gè)層次上的查詢。

XQuery是一個(gè)從XML格式的文檔中獲取數(shù)據(jù)的查詢語言,起源于XML數(shù)據(jù)查詢語言Quilt。并將XPath版本2.0作為其子集。Quilt有很多非常優(yōu)秀的特性,集SQL、ODMG、XPath1.0、XQL以及XML-QL的諸多特性于一身。隨著存儲在XML文檔中的信息量的增長,對于能高效的存取和查詢XML的信息,Quilt顯示出了它的不足,于是全新的XQuery數(shù)據(jù)查詢語言誕生了。

3.4.2結(jié)構(gòu)層次上的查詢

這種方法的好處在于它是直接基于模型,可獨(dú)立于特定的語法。只要是符合模型的數(shù)據(jù)都可以查詢出來。RDQL是RDFDataQueryLanguage的縮寫,是一種以模型為向?qū)У念愃朴赟QL的專門用于檢索RDF的查詢語言。目前一些實(shí)際的應(yīng)用已經(jīng)使用了RDQL。RDQL的發(fā)展是由多種語言演進(jìn)而來,包含由R.V.Guha、OraLassila、EricMiller及DanBrickley等人于1998年所撰寫的W3C查詢語言會議報(bào)告:EnablingInference。

首先查詢Wrox公司有一些什么文章:

SELECT?x

WHERE(?x“Wrox”"JohnSmith")

結(jié)果是:

x

=============================

……/Articles/00064d3.htm

然后是一個(gè)復(fù)雜的查詢,查詢文章和作者的對應(yīng)關(guān)系:

SELECT?article?Name

WHERE(?article“Author”?z)

(?z“Name”?Name)

article|Name

============================================

……/Articles/00054c3.htm|"MickHume"

……/Articles/00064d3.htm|"Hellen"

這種查詢方式對比與第一種方式有優(yōu)點(diǎn),但也有不足,例如我們用RDFS定義FirstAuthor是Autor的一個(gè)SubProperty,如果我們想查詢一本書的作者是誰的時(shí)候我們只能知道他的Author是誰,而他的第一作者可能就查不到。這是因?yàn)閷τ贔irstAuthor與Author之間的關(guān)系我們只在RDFS中定義,而在RDF文件中沒有。

4結(jié)束語

語義Web是未來Web的發(fā)展方向,目前基于Web的一切應(yīng)用的未來也必然基于語義Web,由于語義Web是一個(gè)比較新的思想,目前的研究還不是很成熟,我們所做的是一些有益的探索,希望能對今后的研究給予幫助和啟發(fā)。

參考文獻(xiàn)

[1]RDF/XMLSyntaxSpecification(Revised).W3CRecommendation10February2004:http:///TR/rdf-syntax-grammar

[2]RDFVocabularyDescriptionLanguage1.0:RDFSchema.W3CRecommendation10February2006,http:///TR/rdf-primer

[3]RDFPrimer.W3CRecommendation10February2004,

http:///TR/rdf-primer/

[4]RDQL-AQueryLanguageforRDF.W3CMemberSubmission9January2004,http:///Submission/RDQL/

[5]AProgrammer''''sIntroductiontoRDQL.AndySeaborne2005,JenaTutorial

[6]MarkBirbeck等.XML高級編程(第二版).機(jī)械工業(yè)出版社,2002

[7]DrJohnDavies,TheSemanticWebAGuidetotheFutureofXMLWebServicesandKnowledgeManagement