語義信息論文:小議語義的信息空間關(guān)系

時(shí)間:2022-01-28 02:58:39

導(dǎo)語:語義信息論文:小議語義的信息空間關(guān)系一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

語義信息論文:小議語義的信息空間關(guān)系

本文作者:劉偉顧和和工作單位:江蘇師范大學(xué)測(cè)繪學(xué)院

地理信息語義分析與關(guān)系構(gòu)建

地理信息除了在數(shù)據(jù)結(jié)構(gòu)上存在異構(gòu),在語義上也存在異構(gòu)。地理信息語義上的異構(gòu)可以分為空間數(shù)據(jù)的異構(gòu)和非空間數(shù)據(jù)的異構(gòu),以下分別對(duì)這兩種語義異構(gòu)進(jìn)行討論。2.1空間數(shù)據(jù)語義分析與空間關(guān)系構(gòu)建地理信息中空間數(shù)據(jù)的語義關(guān)系在本文主要可分為以下3種。1)拓?fù)潢P(guān)系:本文中拓?fù)潢P(guān)系主要指地理對(duì)象間相離(DT)、相接(TO)、重疊(OV)、覆蓋(CO)、包含(CT)、相等(EQ)、被覆蓋(CB)、在內(nèi)部(IN)八種關(guān)系。其中覆蓋(CO)與被覆蓋(CB),包含(CT)與在內(nèi)部(IN)為逆反關(guān)系。2)方位關(guān)系:方位關(guān)系主要指一個(gè)地理實(shí)體相對(duì)于另一個(gè)地理實(shí)體的方向關(guān)系。眾所周知的8個(gè)方位關(guān)系為:北(N)、西北(NW)、西(W)、西南(SW)、南(S)、東南(SE)、東(E)、東北(NE)。本文中以圖形(像)中央的地理實(shí)體作為第一個(gè)起始位置來確定其它地理實(shí)體相對(duì)于此起始位置地理實(shí)體的方位關(guān)系;然后以第一個(gè)起始位置為圓心,在周圍找一個(gè)地理實(shí)體作為參照,依此類推,確定地理實(shí)體之間的相互位置關(guān)系。如圖1所示,首先選A作為第一個(gè)起始參照實(shí)體,建立其他地理實(shí)體與A地理實(shí)體的空間方位關(guān)系;然后在地理實(shí)體(F、G、H)中在選擇一個(gè)作為下一個(gè)參照實(shí)體,本文依順時(shí)針方向選擇F作為第二個(gè)參照實(shí)體,建立其他地理實(shí)體(除去已經(jīng)建立方位關(guān)系的A實(shí)體)與F地理實(shí)體之間的空間方位關(guān)系,依此類推,用同樣的方法建立地理實(shí)體之間的空間方位關(guān)系。ABCDEGFHB/東北B/東B/東南B/南B/西南B/西B/西北B/北A北東南西北北南南西西東東東北西南東南西北東北西南圖1地理實(shí)體的參照關(guān)系圖2空間方位之間的推理關(guān)系在方位關(guān)系中,A實(shí)體和B實(shí)體的空間方位存在以下關(guān)系,如圖2所示。①若B位于A的北方向,則A位于B的南方向;②若B位于A的西北方向,則A位于B的東南方向;③若B位于A的西方向,則A位于B的東方向;④若B位于A的西南方向,則A位于B的東北方向;⑤若B位于A的南方向,則A位于B的北方向;⑥若B位于A的東南方向,則A位于B的西北方向;⑦若B位于A的東方向,則A位于B的西方向;⑧若B位于A的東北方向,則A位于B的西南方向。以上方位關(guān)系在空間推理時(shí)會(huì)用到。用OWL建立其相互關(guān)系后,就可以用Jena(/)推理出相互關(guān)系。3)距離關(guān)系:通常人們用遠(yuǎn)、近、較遠(yuǎn)和較近等來形容兩個(gè)地理實(shí)體之間的距離,但這樣的形容不準(zhǔn)確且容易引起歧義。本文中對(duì)于距離關(guān)系,我們采用對(duì)象質(zhì)心之間的標(biāo)準(zhǔn)歐氏距離。針對(duì)上述空間數(shù)據(jù)的語義異構(gòu)問題,我們提出用屬性關(guān)系圖(ARG)來描述地理實(shí)體及其空間關(guān)系信息。參照?qǐng)D3的圖形和它的ARG,ARG的結(jié)點(diǎn)標(biāo)有對(duì)象的標(biāo)號(hào)。兩個(gè)結(jié)點(diǎn)之間的邊標(biāo)有兩個(gè)結(jié)點(diǎn)間的關(guān)系信息。結(jié)點(diǎn)N1與N2之間的邊標(biāo)有(N1,D,203,8.9,N2),這表明N1與N2之間的拓?fù)潢P(guān)系為相離(Disjoint),它們之間的角度為203˚(按照逆時(shí)針、結(jié)點(diǎn)下標(biāo)遞增順序測(cè)量(結(jié)點(diǎn)下標(biāo)遞增順序測(cè)量:假設(shè)N1為起始參照實(shí)體(可以是點(diǎn)或面中心),首先量算N1與N2、N3等的方位,然后是N2與N3、N4等的方位,依次類推,直至建立完整的方位關(guān)系。)),它們之間的距離為8.9個(gè)單位。N1N2N3N1N2N3AGR(N2,CO,315,2.3,N3)(N1,D,203,8.9,N2)(N1,D,274,10.7,N3)(N1,D,D,SW,SW,8.9,10.7,N2,CO,SE,2.3,N3)特征點(diǎn)圖3圖形與其屬性關(guān)系圖ARG的映射過程為每幅圖形創(chuàng)建ARG之后,ARG要映射到特征空間的一個(gè)多維點(diǎn),特征空間中的點(diǎn)按照某種預(yù)先指定的順序進(jìn)行組織(本文中以中央地理實(shí)體為第一個(gè)起始參照實(shí)體)。首先是第一個(gè)地理實(shí)體,其后是該地理實(shí)體與所有其它地理實(shí)體之間的關(guān)系;然后是第二個(gè)地理實(shí)體以及第二個(gè)地理實(shí)體與隨后所有地理實(shí)體間的關(guān)系,依此類推,直至建立完整的ARG。在這個(gè)階段,對(duì)象之間的方位角也轉(zhuǎn)換為方位謂詞。如圖3,N1與N2之間的角度203˚就映射為西南方位(SW)。2.2非空間數(shù)據(jù)語義分析與關(guān)系構(gòu)建非空間數(shù)據(jù)中的語義異構(gòu)主要由于人們對(duì)同一或相同類的地理實(shí)體在表述概念上存在差異,如對(duì)于南京,有人稱之為金陵,又有人稱之為石頭城;而一些國(guó)家地理劃分中的州在中國(guó)等同于省的概念。非空間數(shù)據(jù)中表示相等或相似的語義關(guān)系又稱為同主體語義關(guān)系。非空間數(shù)據(jù)的語義異構(gòu)一般分為以下兩種:異形同義詞,既不同的詞匯表達(dá)同一個(gè)含義,如南京,又可稱為金陵或石頭城;同形異義詞,即同一個(gè)詞匯表達(dá)不同的含義。其中同形異義詞間的關(guān)系可以用OWL中的以下語義標(biāo)簽描述:differentFrom(個(gè)體不同),兩個(gè)個(gè)體可以顯式聲明為不同;allDifferent(全不同)和distinctMembers(不同成員),這兩個(gè)詞配合使用表示一定數(shù)量的個(gè)體兩兩不同。異形同義詞的關(guān)系可以用以下標(biāo)簽描述:equivalentClass(等價(jià)類),兩個(gè)類可以聲明為等價(jià),即使它們盡管名字不同,但擁有相同的實(shí)例,等價(jià)類可以用來創(chuàng)建同義類;sameAs(個(gè)體相同),兩個(gè)個(gè)體可以聲明為相同,用它可以創(chuàng)建一系列指向同一個(gè)個(gè)體的不同名字。對(duì)于一些屬性關(guān)系可以用equivalentProperty(等價(jià)屬性),inverseOf(逆反屬性),TransitiveProperty(傳遞屬性),SymmetricProperty(對(duì)稱屬性),F(xiàn)unctionalProperty(函數(shù)屬性),inverseFunctionalProperty(反函數(shù)屬性)等來描述。在建立非空間數(shù)據(jù)的語義關(guān)系時(shí),本文按照ARG中地理實(shí)體出現(xiàn)的順序構(gòu)建非空間數(shù)據(jù)語義關(guān)系,這樣便于利用第3部分的算法自動(dòng)生成應(yīng)用本體實(shí)例。

數(shù)據(jù)提取與本體實(shí)例生成

分別建立起空間數(shù)據(jù)的屬性關(guān)系圖ARG和非空間數(shù)據(jù)的語義關(guān)系后,可以參照?qǐng)D4所示的應(yīng)用本體實(shí)例生成算法AOGA自動(dòng)生成應(yīng)用本體實(shí)例。創(chuàng)建一個(gè)空OWL文檔按特征空間中特征點(diǎn)的先后順序抽出一個(gè)空間對(duì)象如N1該空間對(duì)象是何種地理實(shí)體創(chuàng)建該空間對(duì)象對(duì)應(yīng)地理實(shí)體的一個(gè)實(shí)例從該空間對(duì)象對(duì)應(yīng)的特征點(diǎn)中抽取一個(gè)屬性創(chuàng)建這個(gè)幾何屬性對(duì)應(yīng)的實(shí)例從該空間對(duì)象對(duì)應(yīng)的非幾何屬性中抽取一個(gè)屬性創(chuàng)建這個(gè)非幾何屬性對(duì)應(yīng)的實(shí)例有新空間對(duì)象輸出創(chuàng)建的OWL文檔有新屬性有新屬性是否是否否是圖4應(yīng)用本體實(shí)例生成算法AOGA首先創(chuàng)建一個(gè)新OWL空文檔并在其中插入根結(jié)點(diǎn);然后按ARG的特征空間中特征點(diǎn)的先后順序抽出一個(gè)空間對(duì)象如N1,根據(jù)這個(gè)空間對(duì)象的類型創(chuàng)建新節(jié)點(diǎn)并插入到根節(jié)點(diǎn)下,在創(chuàng)建空間對(duì)象節(jié)點(diǎn)的同時(shí),需要?jiǎng)?chuàng)建這個(gè)空間對(duì)象的屬性:從該空間對(duì)象N1對(duì)應(yīng)的特征點(diǎn)中抽取一個(gè)幾何屬性,并創(chuàng)建這個(gè)幾何屬性對(duì)應(yīng)的實(shí)例插入到新節(jié)點(diǎn)N1下,進(jìn)行判斷直至所有的空間屬性創(chuàng)建完畢,同理創(chuàng)建這個(gè)空間對(duì)象的非空間屬性,直至所有的非空間屬性創(chuàng)建完畢。一旦空間對(duì)象創(chuàng)建完畢后,還需要進(jìn)行判斷,看是否還有其他空間對(duì)象。如果還有其他空間對(duì)象未創(chuàng)建,則重復(fù)上述過程,直至所有的地理對(duì)象和相應(yīng)的空間屬性與非空間屬性全部轉(zhuǎn)換成應(yīng)用本體實(shí)例。應(yīng)用本體實(shí)例創(chuàng)建完畢后,將所創(chuàng)建的OWL文檔輸出,第四部分將要使用生成的OWL文檔。

試驗(yàn)說明

下面以具體試驗(yàn)來說明,由算法生成的大連灣區(qū)域(DALIANRegion)土地利用應(yīng)用本體實(shí)例描述了大連灣地區(qū)土地利用方面的信息,包含空間數(shù)據(jù)和非空間數(shù)據(jù)的語義信息,圖5是對(duì)應(yīng)土地利用本體的樹狀結(jié)構(gòu)圖。本體構(gòu)建過程參照《國(guó)家資源環(huán)境遙感宏觀調(diào)查土地資源分類系統(tǒng)》和中國(guó)科學(xué)院地理科學(xué)與資源研究所數(shù)據(jù)中心土地利用本體分類體系。當(dāng)用戶提出查找在大連灣東北方向,并位于大連灣50km內(nèi)包含湖泊的所有林地地理實(shí)體時(shí),此查詢語句較為復(fù)雜包括方位關(guān)系(大連灣東北方向)、距離關(guān)系(大連灣50km內(nèi))、拓?fù)潢P(guān)系(林地包含湖泊)和語義關(guān)系(林地是有林地、灌木林、疏林地和宜林地的父類)。傳統(tǒng)的方法很難實(shí)現(xiàn)這種復(fù)雜的查詢請(qǐng)求,通過創(chuàng)建DALIANRegion應(yīng)用本體就可以很好的解決這種復(fù)雜的查詢請(qǐng)求。本試驗(yàn)是基于Jena和ArcServer開發(fā)的,首先在服務(wù)器端調(diào)用編寫的本體查詢函數(shù)(用Jena解析),利用應(yīng)用本體實(shí)例中的空間語義關(guān)系進(jìn)行推理。如圖5,“有林地”、“灌木林”、“疏林地”和“宜林地”是林地的子類,宜林地和草山草坡是同義關(guān)系,灌木林和疏林地是林間草地的父類。利用Jena工具很容易就可以把對(duì)林地的查詢自動(dòng)的推理到“有林地”、“灌木林”、“疏林地”、“宜林地”、“草山草坡”和林間草地中去;對(duì)空間關(guān)系的查詢,應(yīng)用本體中已經(jīng)描述了拓?fù)潢P(guān)系(Contain)、方位關(guān)系(EastNorth)和距離關(guān)系(11.7,36.5)只需要用Xpath、Xquery查詢語言進(jìn)行查詢轉(zhuǎn)換即可。然后將查詢到的DALIANRegion土地利用應(yīng)用本體的結(jié)果,組織成SQL語句傳遞給ArcServer的GetFeatureClass類,由ArcServer返回查詢結(jié)果,在客戶端顯示。5結(jié)束語空間信息的查詢與檢索是空間信息共享的前提條件。但由于用戶認(rèn)知和概念世界中的概念與系統(tǒng)模型中的概念之間存在語義異質(zhì)性,用戶檢索出來的數(shù)據(jù)往往并不是他們真正想要的。通過建立等價(jià)關(guān)系、繼承關(guān)系、逆反關(guān)系以及拓?fù)?、方位和距離等空間關(guān)系的地理本體并將之用于檢索請(qǐng)求可以解決這種語義異質(zhì)性,從而實(shí)現(xiàn)更高級(jí)別的檢索。本文在檢索處理過程中,以空間數(shù)據(jù)的屬性關(guān)系圖ARG作為描述地理實(shí)體空間關(guān)系的基礎(chǔ),基于應(yīng)用本體實(shí)例生成算法AOGA和語義推理工具Jena實(shí)現(xiàn)異構(gòu)消解和語義擴(kuò)展,極大地提高了檢索準(zhǔn)確率。以下是本解決方案的優(yōu)點(diǎn)和將來的工作。①提出了描述空間關(guān)系的ARG模型,利用ARG可以方便的查詢?nèi)我鈨蓚€(gè)地理實(shí)體的空間關(guān)系,改進(jìn)以往空間關(guān)系查詢時(shí)SQL擴(kuò)展的不便性;②建立了非空間數(shù)據(jù)之間的語義關(guān)系,可以更全面的檢索出所需數(shù)據(jù);③提出了應(yīng)用本體實(shí)例生成方法,可以較為方便的生成所需應(yīng)用本體實(shí)例。作為將來的工作,我們將集中在以下兩點(diǎn):①建立ARG模型時(shí),需花費(fèi)大量的時(shí)間,且容易出錯(cuò),下一步我們將研究更自動(dòng)化的方法建立所需的ARG;②本體建立層次還較低,只是建立到大類,后續(xù)工作,需要在建立地理本體時(shí),建立到具體地理實(shí)例一級(jí),要具體到地理實(shí)體的名稱。