量化容差關(guān)系研究論文
時(shí)間:2022-10-11 11:06:00
導(dǎo)語(yǔ):量化容差關(guān)系研究論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要對(duì)量化容差關(guān)系中由于容差度閾值的變化而引起的論域覆蓋的粒度、粗糙集的近似精度與粗糙熵、知識(shí)的粗糙熵的度量變化進(jìn)行了討論。建立了量化容差關(guān)系下知識(shí)依賴的概念,并探討了容差度閾值和知識(shí)的變化對(duì)知識(shí)依賴度量的影響。對(duì)量化容差關(guān)系所產(chǎn)生的覆蓋進(jìn)行修正,以使得新覆蓋的任一模塊里的任意元素均兩兩滿足量化容差關(guān)系,并進(jìn)行了相關(guān)性質(zhì)的證明。
關(guān)鍵字粗糙集;量化容差關(guān)系;不完備信息系統(tǒng);熵;知識(shí)依賴
1引言
粗糙集理論[1](RoughSetsTheory,簡(jiǎn)稱RST)是一種用于處理含糊和不精確性問(wèn)題而又不同于模糊集理論的新型數(shù)學(xué)工具。Pawlak提出的RST僅僅適用于所有屬性值都已知的完備信息系統(tǒng),然而現(xiàn)實(shí)世界中由于各種原因存在著大量的不完備信息系統(tǒng)(IncompleteInformationSystems[2],簡(jiǎn)稱IIS),因此如何使用RST處理IIS正逐漸成為RST研究領(lǐng)域的一個(gè)熱點(diǎn)問(wèn)題。使用RST處理IIS,大致可以分為兩種方式:1、間接處理,即數(shù)據(jù)補(bǔ)齊或數(shù)據(jù)刪除方法;2、直接處理,對(duì)基于不可分辨關(guān)系(等價(jià)關(guān)系)的RST模型進(jìn)行擴(kuò)充。由于間接處理方法會(huì)損害到數(shù)據(jù)的原有分布特征,挖掘出的規(guī)則往往帶有不確定性,因此使用直接方法處理IIS就具有其獨(dú)特的優(yōu)勢(shì)。
隨著理論研究的不斷深入,目前已經(jīng)涌現(xiàn)出了很多擴(kuò)展RST模型以處理IIS,如容差關(guān)系模型[2]、量化容差關(guān)系模型[3]、限制容差關(guān)系模型[4]、相似關(guān)系模型[3]等等。由于量化容差關(guān)系是一種推廣的容差關(guān)系,量化容差類是一個(gè)用關(guān)于參考元素的容差度作為成員函數(shù)的模糊集合,因此文中主要圍繞量化容差關(guān)系在RST中的若干問(wèn)題進(jìn)行討論。
2量化容差關(guān)系
2.1容差關(guān)系
一個(gè)IIS是一個(gè)二元組:,其中U是一個(gè)被稱為論域的非空有限的對(duì)象集合;AT是一個(gè)非空有限的屬性集合。
對(duì)于任意a∈AT,有a:U→Va,其中Va是屬性a的值域(可包含空值,文中用〝*〞表示);V為全體屬性值域,即;定義f為信息函數(shù),對(duì)于,有f(x,a)∈Va.
定義1.1令S為一IIS,屬性集合,則由A決定的容差關(guān)系如下表示:
2.2量化容差關(guān)系
量化容差關(guān)系是容差關(guān)系的推廣,在容差關(guān)系中加入了描述對(duì)象之間的相似程度這一參考因素。
令S為一IIS,其中.假設(shè)對(duì)于,x在屬性a上取值的概率為(表示集合Va的基數(shù)).
定義1.2令S為一IIS,對(duì)于,x,y在屬性集合上取等值的概率(容差度)為,
其中表示x,y在屬性a上取等值的概率,其取值如下所示:
定義1.3令S為一IIS,,容差度閾值λ∈[0,1],則量化容差關(guān)系定義如下:
若假定容差度為1,量化容差關(guān)系就退化成定義1.1中的容差關(guān)系。
定義1.4令S為一IIS,,容差度閾值λ∈[0,1],對(duì)于,x關(guān)于的量化容差類定義為:
.
一般來(lái)說(shuō),在IIS中,量化容差關(guān)系對(duì)于論域構(gòu)成了一個(gè)覆蓋而非劃分,若令表示覆蓋,則.
3基本概念
a)近似精度及粗糙熵
定義2.1令S為一IIS,,容差度閾值λ∈[0,1],對(duì)于,X關(guān)于的上、下近似集合可表示為和,其中
定理2.1令S為一IIS,屬性集合,若容差度閾值λ1,λ2∈[0,1],且,則
證明:對(duì)于,因?yàn)?,所?若,則必定有;反之則不一定成立。所以.同理可以證得.
定理2.1說(shuō)明粗糙集合的下近似集隨著容差度閾值的減小而不斷減小,上近似集卻隨著容差度閾值的減小而不斷增大。
定義2.2令S為一IIS,且,容差度閾值λ∈[0,1],則X關(guān)于的近似精度,粗糙性分別如下所示:
定理2.2令S為一IIS,屬性集合,容差度閾值λ1,λ2∈[0,1]且,則對(duì)于,有.
證明:利用定理2.1的結(jié)果,易證。
定理2.2說(shuō)明隨著容差度閾值的減小,粗糙集合的近似精度在不斷減小,粗糙性在不斷增大。
定義2.3令S為一IIS,屬性集合,容差度閾值λ∈[0,1],則知識(shí)A的粗糙熵定義為:
定理2.3令S為一IIS,,若容差度閾值λ1,λ2∈[0,1]且,則.
證明:對(duì)于,因?yàn)椋?于是可以得到不等式
.
擴(kuò)充這個(gè)不等式就可以得到.
為了對(duì)粗糙集的不確定性進(jìn)行更為精確的測(cè)量,已有學(xué)者開(kāi)始研究各種不同的粗糙集的粗糙熵[5]。根據(jù)量化容差關(guān)系,可以定義如下兩種不同形式的粗糙集的粗糙熵。
定義2.4令S為一IIS,屬性集合,容差度閾值λ∈[0,1],對(duì)于,X關(guān)于知識(shí)A的粗糙熵定義為:
定理2.4令S為一IIS,屬性集合,若容差度閾值λ1,λ2∈[0,1]且,則對(duì)于有.
證明:利用定理2.2及2.3的結(jié)果,易證。
作為一種特殊的容差關(guān)系,量化容差關(guān)系當(dāng)然也滿足容差關(guān)系下的一些性質(zhì),如定理2.5所示。
定理2.5令為一IIS,屬性集合,若容差度閾值λ∈[0,1],則,,,.
b)知識(shí)依賴
利用對(duì)象的分類,可以方便地研究?jī)蓚€(gè)不同屬性子集,即知識(shí)之間的依賴關(guān)系[6]。
定義2.5令S為一IIS,容差度閾值λ1,λ2∈[0,1],屬性集合B對(duì)于屬性集合A的依賴關(guān)系表示為,當(dāng)且僅當(dāng)對(duì)于,若,則必定有.
定義2.6令S為一IIS,容差度閾值λ1,λ2∈[0,1],則知識(shí)A與B之間存在等價(jià)依賴當(dāng)且僅當(dāng)且.
知識(shí)的部分依賴表示知識(shí)之間的推理可以是部分的,換言之,只有部分關(guān)于B的知識(shí)可以從A推導(dǎo)出來(lái)。知識(shí)的部分依賴一般用知識(shí)的正區(qū)域來(lái)表示。
定義2.7令S為一IIS,,容差度閾值λ1,λ2∈[0,1],則知識(shí)A對(duì)于知識(shí)B的正區(qū)域表示為:
.
定義2.8令S為一IIS,,容差度閾值λ1,λ2∈[0,1],知識(shí)B以程度k依賴于知識(shí)A,表示為,其中.
當(dāng)k=0時(shí),知識(shí)依賴表示為;當(dāng)k=1時(shí),知識(shí)依賴表示為.
定理2.6令S為一IIS,,容差度閾值λ1,λ2,λ3∈[0,1]且,如果有知識(shí)依賴,,那么.
證明:對(duì)于,根據(jù)定理2.1,因?yàn)?,所以,?所以.
定理2.6說(shuō)明隨著知識(shí)依賴的被依賴部分的容差度閾值逐漸減少,依賴部分對(duì)于被依賴部分的依賴程度逐漸減小。
定理2.7令S為一IIS,,容差度閾值λ1,λ2,λ3∈[0,1]且,如
果有知識(shí)依賴,,那么.
證明:對(duì)于,因?yàn)?,所?
對(duì)于,若,則,反之則不一定成立,所以,即.
定理2.7說(shuō)明隨著知識(shí)依賴的依賴部分的容差度閾值逐漸減少,依賴部分對(duì)于被依賴部分的依賴程度逐漸增大。
定理2.8令S為一IIS,若且容差度閾值λ∈[0,1],則有知識(shí)依賴.
證明:對(duì)于,若,則.因?yàn)?,所以,?滿足定義2.5,所以.
定理2.9令S為一IIS,,容差度閾值λ1,λ2∈[0,1],如果有知識(shí)依賴,那么.
證明:對(duì)于,若,則,即.對(duì)于,可以得到,于是有,即.
定理2.10令S為一IIS,,容差度閾值λ1,λ2∈[0,1],如果有知識(shí)依賴,,那么.
證明:類似于定理2.9的證明,對(duì)于,有.
對(duì)于,若,則,反之則不一定,所以,即.
4基于量化容差關(guān)系的覆蓋
1)覆蓋粒度
定義3.1在一IIS中,,分別為論域U的兩種不同覆蓋,若對(duì)于,必定使得,并且對(duì)于,必定使得,則稱覆蓋比覆蓋更為精細(xì),或者說(shuō)比更為粗糙,表示為<.
定理3.1令S為一IIS,,若容差度閾值λ1,λ2∈[0,1]且,則<.
證明:對(duì)于,因?yàn)?,所?滿足定義3.1,所以.
定理3.2令S為一IIS,容差度閾值λ∈[0,1],若,則.
證明:對(duì)于,因?yàn)?,所以,即,滿足定義3.1,所以<
定理3.1和3.2說(shuō)明在量化容差關(guān)系下,隨著容差度閾值的減小,覆蓋的精細(xì)程度也在不斷地減小;隨著知識(shí)的不斷增加,覆蓋的精細(xì)程度不斷地增大。
2)覆蓋修正
令,由定義1.4可知,中的所有元素都只是與x之間存在量化容差關(guān)系,而對(duì)于,并不一定能保證m,n之間也存在著量化容差關(guān)系。因此有必要重新定義由量化容差關(guān)系所產(chǎn)生的論域覆蓋,以保證覆蓋中任一模塊中的任意兩個(gè)元素之間都具有量化容差關(guān)系。
定義3.2令S為一IIS,屬性集合,容差度閾值λ∈[0,1],則論域的覆蓋表示如下:
.
3)相關(guān)性質(zhì)
定理3.3令S為一IIS,屬性集合,容差度閾值λ∈[0,1],則
證明:(1)對(duì)于,有,于是,使得.所以.
又因?yàn)閥為中任意取得,所以
(2)對(duì)于,必定使得且.而此時(shí)根據(jù)量化容差類的定義,有.又因?yàn)閥為中任意取得,所以有綜合(1)(2),定理得證。
由定理3.3可得看出,覆蓋相比于覆蓋更為精細(xì),即.
定理3.4令S為一IIS,,容差度閾值λ1,λ2∈[0,1]且,則對(duì)于,必定,使得.
證明:對(duì)于,令,則,因?yàn)?,所以,即必定有使?因?yàn)閤,y為M中任意取得,所以.
定理3.5令S為一IIS,,容差度閾值λ∈[0,1],對(duì)于,必定,使得.
證明:對(duì)于,令,則.因?yàn)?,所以,即必定存在使?因?yàn)閤,y為M中任意取得,所以.
定義3.3令S為一IIS,,容差度閾值λ∈[0,1],對(duì)于,論域覆蓋為,X的上、下近似集合可表示為,其中
定理3.6,.
證明:(1)令,則∩.根據(jù)定理3.3,必定,使得且M∩X≠Φ,即.所以.
令,則使得x∈M且M∩X≠Φ.由定理3.3可知,,即∩,.所以.
(2)令,則.由定理3.3,對(duì)于且x∈M,必定,即.所以.
5結(jié)束語(yǔ)
作為一種RST擴(kuò)展模型以便于直接處理IIS,量化容差關(guān)系用容差度描述對(duì)象之間的相似程度,是容差關(guān)系的進(jìn)一步拓展。
本文對(duì)基于量化容差關(guān)系的RST中的一些基本概念,如覆蓋的精細(xì)程度、粗糙集的近似精度、粗糙熵、知識(shí)的粗糙熵以及函數(shù)依賴進(jìn)行了討論,研究了容差度閾值的變化對(duì)這些概念的度量的影響。分析了由量化容差關(guān)系產(chǎn)生的論域的覆蓋,發(fā)現(xiàn)在這個(gè)覆蓋里,任一模塊中的元素都只是與模塊的生成元素存在量化容差關(guān)系,于是重新定義了基于量化容差關(guān)系的覆蓋,使得任一模塊中的任意兩個(gè)元素之間都具有量化容差關(guān)系,并聯(lián)系原有覆蓋進(jìn)行了相關(guān)性質(zhì)的討論。
參考文獻(xiàn)
[1]Pawlak.Z.Roughsetsandintelligentdataanalysis[J].JournalofInformationSciences.2002,(147):1-12
[2]Kryszkiewicz.M.Roughsetapproachtoincompleteinformationsystems[J].JournalofInformationSciences.1998,(112):39-49
[3]Jerzy.Stefanowski.Incompleteinformationtablesandroughclassification[J].JournalofComputationalIntelligence.2001,(17):545-566
[4]王國(guó)胤.Rough集理論不完備信息系統(tǒng)中的擴(kuò)充.計(jì)算機(jī)研究與發(fā)展.2002,39(10):1238-1243
[5]QiangLi,JianhuaLi,XiangLi,andShenghongLi.Evaluationincompletenessofknowledgeindatamining[J].Springer-Verlag,LNCS(3309).2004,278-284
[6]D.A.Bell,putationalmethodsforroughclassificationanddiscovery[J].JournaloftheAmericanSocietyforInformationScience.1998,(49):403-414
熱門(mén)標(biāo)簽
量化管理 量化設(shè)計(jì)論文 量化分級(jí) 量化價(jià)值投資 心理培訓(xùn) 人文科學(xué)概論