基于本體的電子商務(wù)思索

時(shí)間:2022-04-13 04:50:00

導(dǎo)語(yǔ):基于本體的電子商務(wù)思索一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

基于本體的電子商務(wù)思索

一、引言

隨著全球信息化的發(fā)展,電子商務(wù)(E-commerce-EC)已經(jīng)成為世界經(jīng)濟(jì)市場(chǎng)必不可少的組成部分。有預(yù)測(cè)表明,2009年全球電子商貿(mào)的總量將超過(guò)18000億美元。伴隨電子商貿(mào)的蓬勃發(fā)展,EC模式呈現(xiàn)出自動(dòng)化、智能化和移動(dòng)化的新趨勢(shì)。而傳統(tǒng)基于HTML的EC平臺(tái)缺乏語(yǔ)義信息,無(wú)法將顯示信息與數(shù)據(jù)分離,難以滿足EC新需要。Web元信息處理和語(yǔ)義化發(fā)展,特別是AI成熟的理論、方法和技術(shù),將對(duì)EC的發(fā)展起到關(guān)鍵的作用。

電子商務(wù)平臺(tái)是使交易雙方的需求及供給信息都可以良好交流和交換的地方,所以構(gòu)建一個(gè)良好的電子商務(wù)平臺(tái)首要的要求就是交易雙方的信息可以充分地交換和互用。但是,由于交易雙方所使用的計(jì)算機(jī)系統(tǒng)等一些方面的不同,會(huì)產(chǎn)生互用性問(wèn)題,特別是通過(guò)Internet進(jìn)行商業(yè)活動(dòng)時(shí)。計(jì)算機(jī)系統(tǒng)相互作用時(shí)存在的問(wèn)題大體可以劃分為以下四種類(lèi)型:系統(tǒng)異構(gòu)、語(yǔ)法層異構(gòu)、結(jié)構(gòu)層異構(gòu)和語(yǔ)義層異構(gòu)。系統(tǒng)異構(gòu)包括硬件和操作系統(tǒng)之間的不相容;語(yǔ)法異構(gòu)指的是不同語(yǔ)言和不同的數(shù)據(jù)表示;結(jié)構(gòu)層異構(gòu)指使用不同的數(shù)據(jù)模型;語(yǔ)義層異構(gòu)指系統(tǒng)間交換信息時(shí)所用術(shù)語(yǔ)的含義不同,如同義詞。其中,隨著技術(shù)的發(fā)展,前三種類(lèi)型的問(wèn)題已逐漸得到更好的解決,如使用CORBA,DCOM和不同的中間件產(chǎn)品。XML的出現(xiàn)在一定程度上解決了最后一類(lèi)問(wèn)題。XML本身具有的許多優(yōu)點(diǎn)為電子商務(wù)特別是B2B的發(fā)展帶來(lái)了很大的變化,如XML持國(guó)際語(yǔ)言編碼標(biāo)準(zhǔn)Unicode,把業(yè)務(wù)規(guī)則和數(shù)據(jù)內(nèi)容、結(jié)構(gòu)分離開(kāi)來(lái),用戶只需協(xié)商數(shù)據(jù)內(nèi)容和結(jié)構(gòu),從而可以自由定義和實(shí)現(xiàn)各自的業(yè)務(wù)規(guī)則,企業(yè)之間可以靈活方便地建立多對(duì)多的連接等。本文著重描述數(shù)據(jù)內(nèi)容和結(jié)構(gòu)的元語(yǔ)言XML[1],憑借其強(qiáng)大的定義和表示標(biāo)記語(yǔ)言能力,正成為互聯(lián)網(wǎng)信息表示與交換的標(biāo)準(zhǔn)格式。采用XML作為表示語(yǔ)法,W3C開(kāi)發(fā)了在Web上進(jìn)行元數(shù)據(jù)處理和交換的標(biāo)準(zhǔn)RDF(S)[2],RDF(S)的出現(xiàn)使得本體建模技術(shù)可以應(yīng)用于EC內(nèi)容定義和信息交換,使得開(kāi)發(fā)自動(dòng)化、智能化和移動(dòng)化的EC平臺(tái)成為可能。然而,XML雖然在定義數(shù)據(jù)結(jié)構(gòu)和語(yǔ)義方面提供了標(biāo)準(zhǔn)的語(yǔ)法,但它并沒(méi)有提供描述商業(yè)過(guò)程和商品交換的標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)和術(shù)語(yǔ)。因此,使用XML進(jìn)行交易方之間的數(shù)據(jù)交換時(shí),首先必須在使用的詞匯,以及用法和語(yǔ)義方面達(dá)成一致,這在一定程度上抑制了電子商務(wù)特別是B2B的跨領(lǐng)域、跨地區(qū)甚至跨國(guó)家的擴(kuò)展性發(fā)展。為了更好地解決電子商務(wù)中的語(yǔ)義異構(gòu)問(wèn)題,引入了人工智能領(lǐng)域中的Ontology(本體)技術(shù)。它是不同領(lǐng)域、不同應(yīng)用系統(tǒng)之間進(jìn)行交流、協(xié)定的可以共享理解的表示。這種協(xié)定有助于對(duì)內(nèi)容意義的精確、高效通信,同時(shí)又反過(guò)來(lái)促使系統(tǒng)的交互式操作、重用和共享等一系列的性能得以提高[3]。

二、Ontology的概念及相關(guān)理論

Ontology在人工智能領(lǐng)域用于知識(shí)的共享,從20世紀(jì)90年代初以來(lái),Ontology就已成為許多人工智能研究領(lǐng)域中如知識(shí)工程、自然語(yǔ)言處理與知識(shí)表示的研究主題。經(jīng)過(guò)多年的發(fā)展,如今Ontology在智能信息集成、協(xié)作信息系統(tǒng)(CooperativeInformationSystems)、信息檢索、知識(shí)管理及電子商務(wù)等方面的應(yīng)用越來(lái)越廣泛。其中主要原因就是Ontology提供了對(duì)某一領(lǐng)域(Domain)可共享的、通用的理解,從而使不同人員、不同應(yīng)用系統(tǒng)之間可以進(jìn)行通信。因?yàn)镺ntology針對(duì)的是領(lǐng)域中達(dá)成一致的知識(shí),所以它的發(fā)展也常常是參與其中不同的人、不同組織(可能分布在不同地方)之間的協(xié)作過(guò)程。

(一)Ontology的概念

Ontology作為從哲學(xué)領(lǐng)域借鑒過(guò)來(lái)的術(shù)語(yǔ),在哲學(xué)中它是一種存在的系統(tǒng)化解釋。Ontology的概念有很多,但是目前基本上得到認(rèn)同并能夠較好表明它的本質(zhì)的概念是:Ontology是對(duì)一個(gè)共享的概念化的形式的、顯式的規(guī)格說(shuō)明。“概念化”指的是世界上某些現(xiàn)象的抽象模型,該模型能夠識(shí)別現(xiàn)象的相關(guān)概念?!帮@示的”指所使用概念的類(lèi)型及這些概念在使用上的約束要顯式定義?!靶问降摹敝窸ntology是機(jī)器可以處理的。當(dāng)然,這種形式化的程度可以不同,例如WordNet提供了超過(guò)100000的使用自然語(yǔ)言解釋的術(shù)語(yǔ),而CYC提供了常識(shí)知識(shí)許多方面的形式化、公理化理論?!肮蚕怼闭f(shuō)明Ontology表明的是達(dá)成一致的知識(shí),也就是說(shuō),它并不是局限于某幾個(gè)個(gè)體而是被整體所接受。

1、Ontology的語(yǔ)言有許多語(yǔ)言可用于表示Ontology,其中一些語(yǔ)言是基于XML語(yǔ)法并用于語(yǔ)義Web的,如:OXL(OntologyeXchangeLanguage),SHOE(SimpleHTMLOntologyExtension,最初基于HTML),OML(OntologyMarkupLanguage),以及由W3C工作組創(chuàng)建的RDF(ResourceDescriptionFramework)與RDFSchema。最后,還有建立在RDF與RDF之上的、較為完善的Ontology語(yǔ)言O(shè)IL(OntologyInferenceLayer)和DAML+OIL(圖1)。當(dāng)然,還有其它創(chuàng)建Ontology的語(yǔ)言如傳統(tǒng)的OKBC,OCML等。選擇何種語(yǔ)言表示,要根據(jù)具體的應(yīng)用來(lái)定。

2、RDF框架的概念本體需要某種語(yǔ)言來(lái)說(shuō)明,該語(yǔ)言應(yīng)能以機(jī)器可理解的方式準(zhǔn)確地定義概念以及概念之間豐富的關(guān)系。RDF框架由三個(gè)部分構(gòu)成:①RDFDataModel。其形成對(duì)資源的形式描述。它包括三個(gè)對(duì)象類(lèi)型:資源、屬性、陳述。任何可以通過(guò)URI(UniversalResourceIdentifier)來(lái)表示的對(duì)象都是RDF資源,它的屬性由屬性類(lèi)型來(lái)標(biāo)識(shí),每一個(gè)屬性類(lèi)型都有對(duì)應(yīng)的屬性值。RDF采用對(duì)象-屬性-值的三元組來(lái)描述資源間的相互關(guān)系,記為A(O,V),分別對(duì)應(yīng)上面的資源、屬性和屬性值,或者稱(chēng)為主題、謂詞和對(duì)象,意為對(duì)象O擁有值為V的屬性A。②RDFSchema。定義描述資源時(shí)需要的屬性類(lèi)及其意義、特性。RDFSchema使用一種機(jī)器可以理解的體系來(lái)定義描述資源的詞匯。如:rdfs:Resource、rdfs:Class和rdfs:Property類(lèi),rdfs:subClassof和rdfs:subPropertyof屬性關(guān)系,以及rdfs:domain和rdfs:range的屬性約束關(guān)系。該詞匯集構(gòu)成了一種基本類(lèi)型系統(tǒng)及該系統(tǒng)的基礎(chǔ)類(lèi),這些基礎(chǔ)類(lèi)包括了定義新類(lèi)必需的元對(duì)象類(lèi)型,因此RDF具有擴(kuò)展特性,適合于EC本體建模。③RDFSyntax。盡管RDFDataModel提供了一個(gè)抽象的框架來(lái)描述資源,Schema定義和聲明了一些屬性類(lèi),但要形成人機(jī)可讀的具體文件,還需要一個(gè)具體的語(yǔ)法體系來(lái)完成。RDFSyntax借助其宿主語(yǔ)言XML,把形式化描述轉(zhuǎn)換成機(jī)器可以理解和處理的文件。

(二)Ontology在B2B電子商務(wù)信息集成中的應(yīng)用

電子商務(wù)中的B2B[4]主要從事企業(yè)與企業(yè)之間在線進(jìn)行商業(yè)合作的交易,Internet和基于Web的電子商務(wù)為優(yōu)化商業(yè)關(guān)系提供了較高水平的靈活性和開(kāi)放性。這些電子商務(wù)B2B平臺(tái)為他們的客戶提供了新的機(jī)會(huì),可以幫助客戶不需要通過(guò)大量的通訊渠道,就可以聯(lián)系到許多潛在的商業(yè)伙伴。譬如中國(guó)的阿里巴巴以全球領(lǐng)先的B2B電子商務(wù)網(wǎng)上貿(mào)易平臺(tái)為許多企業(yè)帶來(lái)了商機(jī)和利潤(rùn)。當(dāng)然,B2B電子商務(wù)網(wǎng)上貿(mào)易平臺(tái)在帶來(lái)優(yōu)于傳統(tǒng)商務(wù)交易的許多特點(diǎn)的同時(shí)也帶來(lái)了一些問(wèn)題,其中成指數(shù)增加的交易方提供的大量產(chǎn)品描述、目錄和文檔等,由它們帶來(lái)的異構(gòu)問(wèn)題成為了B2B電子商務(wù)發(fā)展的瓶頸,因而對(duì)這些不同類(lèi)型描述信息的有效管理成為B2B電子商務(wù)的主要任務(wù)。B2B電子商務(wù)中包含了三種不同類(lèi)型的標(biāo)準(zhǔn)之間的相互作用:

(1)描述像購(gòu)買(mǎi)合同等可交換商業(yè)文檔的不同標(biāo)準(zhǔn)(如:XMLCommonBusinessLibraryxCBLandCommerceXMLcXML)。

(2)使用產(chǎn)品種類(lèi)等級(jí)和每一種類(lèi)的屬性對(duì)產(chǎn)品進(jìn)行詳細(xì)說(shuō)明的內(nèi)容標(biāo)準(zhǔn)(如:UN/SPSC,ecl@ss4和UCEC)。

(3)根據(jù)某個(gè)內(nèi)容標(biāo)準(zhǔn)對(duì)產(chǎn)品進(jìn)行詳細(xì)說(shuō)明的產(chǎn)品目錄,它可以被可交換商業(yè)文檔引用(如:Ariba和CommerceOne)。從技術(shù)的角度來(lái)看B2B的信息集成任務(wù),它主要包括兩種:商業(yè)文檔的集成和內(nèi)容標(biāo)準(zhǔn)管理。其中的關(guān)鍵技術(shù)是基于本體(Ontology)來(lái)實(shí)現(xiàn)的。

1、B2B文檔集成隨著XML技術(shù)的不斷成熟,大多數(shù)進(jìn)行B2B電子商務(wù)的企業(yè)使用XML編碼的文檔,從而產(chǎn)生了許多基于XML的電子商務(wù)標(biāo)準(zhǔn)。如:CommerceOne提出的xCBL(XMLCommonBusinessLibrary)標(biāo)準(zhǔn),包含了B2B中進(jìn)行交互使用的約600種不同文檔類(lèi)型。雖然在一定應(yīng)用范圍內(nèi),這些文檔具有一致性,可以進(jìn)行互操作,但是它們?cè)谖臋n的結(jié)構(gòu)、信息分解、復(fù)雜性和應(yīng)用背景上不同。傳統(tǒng)的轉(zhuǎn)換技術(shù)在效率和應(yīng)用范圍上均不能滿足要求,但使用具有發(fā)展前景的Ontology技術(shù),能夠較好地解決電子商務(wù)中的這一問(wèn)題。以O(shè)ntology為中介的信息集成提供了進(jìn)行文檔集成、將概念結(jié)構(gòu)引入文檔和對(duì)基于知識(shí)的文檔查詢、檢索進(jìn)一步集成的良好架構(gòu)。XSL-T與Xpath結(jié)合使用可以轉(zhuǎn)換任意XML文件,但由于進(jìn)行的是直接映射,所以規(guī)則比較復(fù)雜,程序編寫(xiě)困難、復(fù)雜,維護(hù)起來(lái)不容易,而且實(shí)現(xiàn)的映射重用性差。基于Ontology的多層次集成可以解決以上的問(wèn)題,該方法中將信息的表示分為三個(gè)層次:語(yǔ)法層、數(shù)據(jù)模型層和Ontology層。

(1)語(yǔ)法層對(duì)應(yīng)使用XML序列化表示的文檔實(shí)例,該序列化主要說(shuō)明使用到的XML元素和屬性以及它們的順序。

(2)數(shù)據(jù)模型層可以看作是語(yǔ)法層與Ontology層之間的橋梁,該層將在語(yǔ)法層中的差異抽取出來(lái)進(jìn)行表示,并用對(duì)象—屬性—值對(duì)產(chǎn)品進(jìn)行描述。標(biāo)準(zhǔn)化(Normalization)的進(jìn)行是根據(jù)相應(yīng)的Ontology進(jìn)行的,因?yàn)樵贠ntology中表明了按所要求粒度進(jìn)行元素分解后的元素的語(yǔ)義。該層使用的術(shù)語(yǔ)由相應(yīng)的Ontology進(jìn)行定義,并且通常必須與在語(yǔ)法層使用到的相符合。然而,前者比后者要詳細(xì)得多,如在XML文件描述中,街道名稱(chēng)與門(mén)牌號(hào)可以作為一個(gè)元素,而在Ontology中,兩者肯定是分開(kāi)的。該層次可以使用RDF進(jìn)行描述,也可使用SOAP(SimpleObjectAccessProtocol)。

(3)Ontology層包含每一種文檔類(lèi)型通用的文檔Ontology,如產(chǎn)品目錄Ontology、購(gòu)買(mǎi)合同的Ontology等。這些Ontology提供了電子商務(wù)B2B中的使用到的術(shù)語(yǔ)及術(shù)語(yǔ)的形式化語(yǔ)義。如地址在運(yùn)輸文檔中可能是指運(yùn)輸?shù)刂?,而在?cái)務(wù)文檔中可能是指賬單地址,在Ontology層這兩種類(lèi)型的地址必須明確地分開(kāi)。另外,Ontology中還包含了在一些文檔標(biāo)準(zhǔn)中可選或忽略的元素。按照上述層次描述,可實(shí)現(xiàn)電子商務(wù)B2B中的較復(fù)雜的文檔集成,結(jié)構(gòu)如圖2所示,總的來(lái)說(shuō)可以分為三步:①按照從語(yǔ)法層到數(shù)據(jù)模型層的轉(zhuǎn)換要求,從XML描述中抽象出源文檔的RDF數(shù)據(jù)模型,這樣解決了由于XML語(yǔ)法的多樣性和復(fù)雜性帶來(lái)的轉(zhuǎn)換規(guī)則的復(fù)雜性。②把文檔的數(shù)據(jù)模型轉(zhuǎn)化為電子商務(wù)B2B中的使用的術(shù)語(yǔ),并在相應(yīng)的文檔Ontology中詳細(xì)說(shuō)明。在該步驟中,數(shù)據(jù)模型的粒度水平需要與電子商務(wù)B2B中的使用的粒度水平平齊。這意味著可能需要進(jìn)行一對(duì)多的轉(zhuǎn)化。③電子商務(wù)B2B的按照目標(biāo)文檔標(biāo)準(zhǔn)的術(shù)語(yǔ)生成一個(gè)相應(yīng)的文檔,其中由于原子概念的粒度水平的不一致,需要對(duì)該文檔進(jìn)行多對(duì)一的到RDF表示的轉(zhuǎn)換。

2、內(nèi)容管理內(nèi)容標(biāo)準(zhǔn)提供了產(chǎn)品描述的等級(jí),并定義了產(chǎn)品類(lèi)別之間的Subclass-of關(guān)系。產(chǎn)品目錄中的每一個(gè)產(chǎn)品鏈接到某一特定產(chǎn)品類(lèi)別,該產(chǎn)品類(lèi)別對(duì)產(chǎn)品進(jìn)行了詳細(xì)描述。內(nèi)容標(biāo)準(zhǔn)可以分類(lèi)為“水平型”標(biāo)準(zhǔn)和“垂直型”標(biāo)準(zhǔn)?!八叫汀睒?biāo)準(zhǔn)提供了高層次的所有可能產(chǎn)品的分類(lèi)并覆蓋了多個(gè)領(lǐng)域。每一個(gè)“垂直型”標(biāo)準(zhǔn)提供了某一領(lǐng)域的深入和細(xì)致的分類(lèi)。通?!?,垂直型”一個(gè)“水平型”標(biāo)準(zhǔn)的幾個(gè)低層次種類(lèi)的擴(kuò)展。較著名的“水平型”內(nèi)容標(biāo)準(zhǔn)UNSPSC,具有超過(guò)12000種類(lèi)的五層分類(lèi)模式,但它不是描述性的,也就是說(shuō),它不包含產(chǎn)品的屬性描述,僅僅只有產(chǎn)品名稱(chēng)的層次描述。該標(biāo)準(zhǔn)的層次是從產(chǎn)品供應(yīng)方的角度進(jìn)行分類(lèi)的,如打印紙與書(shū)寫(xiě)紙均屬于印刷產(chǎn)品一類(lèi),筆則屬于辦公用品這一類(lèi),因?yàn)閺墓?yīng)方的角度考慮它們完全屬于不同的類(lèi)別。另一“水平型”內(nèi)容標(biāo)準(zhǔn)ecl@ss,支持工業(yè)企業(yè)供應(yīng)鏈的產(chǎn)品和信息流,是德國(guó)企業(yè)中主要使用的標(biāo)準(zhǔn)。它根據(jù)工業(yè)用戶及供應(yīng)商的需要,提供了約為12700以上的種類(lèi),層次的劃分是按照購(gòu)貨方的需要進(jìn)行的,如書(shū)寫(xiě)紙與筆都?xì)w于辦公用品供應(yīng)方一類(lèi)。ISO,RosettaNe(t主要是為IT產(chǎn)品)是“垂直型”標(biāo)準(zhǔn)的典型例子。從本質(zhì)上說(shuō),內(nèi)容標(biāo)準(zhǔn)也就是產(chǎn)品Ontology,它們提供產(chǎn)品分類(lèi)層次和相關(guān)產(chǎn)品屬性。因此,電子集市需要進(jìn)行的內(nèi)容管理任務(wù)實(shí)際上是Ontology的管理任務(wù)。它包括:①產(chǎn)品分類(lèi)。按產(chǎn)品Ontology中的類(lèi)別,對(duì)產(chǎn)品進(jìn)行分類(lèi)。②產(chǎn)品再分類(lèi)。由于不同企業(yè)有自己不同的需求,因此,往往會(huì)造成不同的產(chǎn)品分類(lèi),因此這就要求B2B電子商務(wù)網(wǎng)上貿(mào)易平臺(tái)具有根據(jù)新的分類(lèi)模式再分類(lèi)的能力,根據(jù)新的產(chǎn)品Ontology將新類(lèi)型分配給某一產(chǎn)品。在該任務(wù)中需要解決水平型標(biāo)準(zhǔn)之間、垂直型標(biāo)準(zhǔn)之間,以及水平型標(biāo)準(zhǔn)與垂直型標(biāo)準(zhǔn)之間的映射問(wèn)題。③產(chǎn)品描述層次的個(gè)性化并根據(jù)不同產(chǎn)品Ontology產(chǎn)生視圖。不同的用戶希望得到不同的產(chǎn)品分類(lèi)視圖,根據(jù)用戶的描述,內(nèi)容管理過(guò)程可半自動(dòng)化地產(chǎn)生用戶需要的產(chǎn)品目錄視圖。為了更好地實(shí)現(xiàn)面向用戶,需要設(shè)計(jì)和實(shí)現(xiàn)兩個(gè)產(chǎn)品Ontologies:客觀的與主觀的產(chǎn)品Ontology??陀^的Ontology用于描述被討論域內(nèi)典型產(chǎn)品目錄中的元素,如打印機(jī)重量;主觀Ontology描述有關(guān)用戶喜好的產(chǎn)品信息元素,如打印機(jī)的打印分辨率。分類(lèi)規(guī)則可以發(fā)展成為根據(jù)一定主觀的類(lèi)別對(duì)產(chǎn)品信息進(jìn)行分類(lèi),如便宜的家用打印機(jī)。Ontologies可以用于模仿(Model)每一產(chǎn)品特性的協(xié)商。④不同版本Ontology的維護(hù),確保Ontology的一致性。這主要是由于內(nèi)容標(biāo)準(zhǔn)的經(jīng)常變化,如UNSPSC每?jī)蓚€(gè)星期需要進(jìn)行一次更新。

三、結(jié)論

本文介紹了Ontology的概念和相關(guān)理論,從較高的層面上研究分析了它在B2B電子商務(wù)產(chǎn)品信息集成中特別是文檔集成和內(nèi)容管理中的作用,在一定程度上幫助解決了B2B電子商務(wù)發(fā)展的瓶頸問(wèn)題。隨著Ontology技術(shù)(如Ontology表示語(yǔ)言、Ontology學(xué)習(xí)方法、Ontology庫(kù)系統(tǒng)及Ontology工程工具等)的不斷完善,以及語(yǔ)義Web技術(shù)的日臻成熟,Ontology技術(shù)在B2B電子商務(wù)中的應(yīng)用將更加廣泛。