模式識(shí)別技術(shù)范文

時(shí)間:2023-03-22 22:48:25

導(dǎo)語(yǔ):如何才能寫好一篇模式識(shí)別技術(shù),這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

模式識(shí)別技術(shù)

篇1

關(guān)鍵詞:模式識(shí)別;特征提??;分類器;刑事科學(xué)技術(shù)

中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)34-1855-02

Theory andApplications of Pattern Recognition in Criminal Science and Technology

ZHANG Song-lin1, GAO Pei-pei2

(1.Department of Electronics of Henan Mechanical and Electrical Engineering College, Xinxiang 453003,China;2.Department of Forensic of Xinxiang Medical university, Xinxiang 453002, China)

Abstract: Pattern Recognition in recent years in criminal science and technology has been widely applied,Summary of the identification process of pattern recognition and identification method commonly used,and application of pattern recognition in criminal science and technology.

Key words: pattern recognition; feature extracting; classifier; criminal science and technology

1 引言

模式識(shí)別(Pattern Recognition)是一種從大量信息和數(shù)據(jù)出發(fā),在已有認(rèn)識(shí)和經(jīng)驗(yàn)的基礎(chǔ)上,利用計(jì)算機(jī)及數(shù)學(xué)推理的方法對(duì)信息特征自動(dòng)完成識(shí)別的過(guò)程。模式識(shí)別屬計(jì)算機(jī)科學(xué)中人工智能的研究范疇[1],內(nèi)容非常廣泛。20世紀(jì)70年達(dá)國(guó)家開始將模式識(shí)別廣泛技術(shù)應(yīng)用于刑事偵察部門[2],近年來(lái),模式識(shí)別在我國(guó)刑事技術(shù)的應(yīng)用也取得長(zhǎng)足發(fā)展,模式識(shí)別在刑事技術(shù)中的應(yīng)用不僅提高了刑事科學(xué)技術(shù)水平,也極大地提高了刑事科學(xué)技術(shù)現(xiàn)代化的建設(shè)。

2 模式識(shí)別與模式識(shí)別系統(tǒng)

模式識(shí)別是對(duì)表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的或邏輯關(guān)系的等)特征信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過(guò)程。

模式識(shí)別的研究主要集中在兩方面[3-4],一方面研究生物體(包括人)是如何感知對(duì)象的,另一方面是在給定的任務(wù)下,如何用計(jì)算機(jī)實(shí)現(xiàn)模式識(shí)別的理論和方法。前者屬于認(rèn)知科學(xué)的范疇;后者則是通過(guò)數(shù)學(xué)家、信息學(xué)專家和計(jì)算機(jī)科學(xué)工作者研究的范圍,目前已經(jīng)取得了系統(tǒng)的研究成果。

模式識(shí)別通常包括相互關(guān)聯(lián)的兩個(gè)階段:學(xué)習(xí)階段和實(shí)現(xiàn)階段,前者是對(duì)樣本進(jìn)行特征選擇,尋找分類的規(guī)律構(gòu)筑分類器,后者是根據(jù)分類規(guī)律對(duì)未知樣本集進(jìn)行分類和識(shí)別,模式識(shí)別系統(tǒng)框圖如圖1所示。

圖1 模式識(shí)別系統(tǒng)框圖

1) 數(shù)據(jù)采集及預(yù)處理:

數(shù)據(jù)采集是指把被研究對(duì)象的各種信息轉(zhuǎn)換為機(jī)器可以接受的數(shù)值或符號(hào)集合。這種數(shù)值或符號(hào)所組成的空間為模式空間。為了從這些數(shù)字或符號(hào)中抽取出對(duì)識(shí)別有效的信息,必須進(jìn)行預(yù)處理,包括進(jìn)行二值化處理、數(shù)字濾波進(jìn)行平滑去噪處理及規(guī)范化處理等。

2) 特征提?。?/p>

預(yù)處理后的信息送入特征提取模塊抽取特征用于分類器的設(shè)計(jì)。特征提取的目的是從原始信息中抽取出用于區(qū)分類型的本質(zhì)特征。無(wú)論是識(shí)別過(guò)程還是訓(xùn)練學(xué)習(xí)過(guò)程,都要對(duì)研究對(duì)象固有的、本質(zhì)的重要特征或?qū)傩赃M(jìn)行量測(cè)并將結(jié)果數(shù)值化或符號(hào)化,形成特征矢量。比如,指紋識(shí)別時(shí),提取的特征有紋理、交叉點(diǎn)、形狀等。特征的提取和選擇對(duì)識(shí)別過(guò)程是至關(guān)重要的,如果模式選擇得好,對(duì)不同類的模式就能表現(xiàn)出很大的差別,就能比較容易地設(shè)計(jì)出性能較高的分類器。因此特征的選擇會(huì)直接影響到分類器的構(gòu)造和識(shí)別的效果。

雖然特征的提取和選擇在模式識(shí)別中占有如此重要的地位,但是迄今沒(méi)有特征提取和選擇的一般方法,大多數(shù)的方法都是面向問(wèn)題的。有人可能認(rèn)為在處理識(shí)別問(wèn)題時(shí),模式特征取得越多越好,或者說(shuō),模式向量的維數(shù)越高,對(duì)分類器的設(shè)計(jì)越是有利。經(jīng)常有這樣的情況,當(dāng)用一組特征做出來(lái)的分類器不能滿足要求的話,自然就會(huì)想到增加新的特征。雖然知道特征的增加同樣也會(huì)增加特征提取的困難和分類計(jì)算的復(fù)雜性,但總認(rèn)為這樣可以改進(jìn)分類器的性能。但是,在實(shí)際工作中,往往會(huì)發(fā)現(xiàn)當(dāng)特征的數(shù)目達(dá)到某個(gè)限度后,不但不能改善分類器的性能,反而使它的工作惡化,產(chǎn)生這個(gè)問(wèn)題的基本原因是用以設(shè)計(jì)分類器的樣本數(shù)目是有限的。為了使模式識(shí)別的結(jié)果滿意,在增加特征的同時(shí),必須增加供學(xué)習(xí)的樣本數(shù)量。

3) 分類器設(shè)計(jì)及分類識(shí)別:

生成的模式特征空間,就可以進(jìn)行模式識(shí)別的最后一部分:分類器設(shè)計(jì)及分類識(shí)別。該階段最后輸出的可能是對(duì)象所屬的類型,也可能是模型數(shù)據(jù)庫(kù)中與對(duì)象最相似的模式編號(hào)。分類器設(shè)計(jì)及分類識(shí)別通常是基于已經(jīng)得到分類或描述的模式集合而進(jìn)行的。這個(gè)模式集合稱為訓(xùn)練集,由此產(chǎn)生的學(xué)習(xí)策略稱為監(jiān)督學(xué)習(xí)。學(xué)習(xí)也可以是非監(jiān)督性學(xué)習(xí),在此意義下產(chǎn)生的系統(tǒng)不需要提供模式類的先驗(yàn)知識(shí),而是基于模式的統(tǒng)計(jì)規(guī)律或模式的相似性學(xué)習(xí)判斷模式的類別。分類器設(shè)計(jì)及分類識(shí)別的方法有很多,常見(jiàn)的模式識(shí)別方法:模板匹配、統(tǒng)計(jì)模式識(shí)別、句法(或結(jié)構(gòu))模式識(shí)別、模糊模式識(shí)別和神經(jīng)元網(wǎng)絡(luò)模式識(shí)別。

3 模式識(shí)別方法

3.1 模板匹配

模板匹配是一種相對(duì)簡(jiǎn)單的也是早期常用的模式識(shí)別方法之一。匹配是模式識(shí)別的一種分類操作,主要是判斷同一類的兩個(gè)實(shí)體特征間的相似性。模板匹配的基本思想主是利用實(shí)體的特征進(jìn)行模板匹配。但是該方法計(jì)算量非常大,同時(shí)該方法的識(shí)別率嚴(yán)重依賴于已知模板,如果已知模板產(chǎn)生變形,會(huì)導(dǎo)致錯(cuò)誤的識(shí)別結(jié)果。

3.2 統(tǒng)計(jì)模式識(shí)別

統(tǒng)計(jì)模式識(shí)別理論是一種相對(duì)較為完善和成熟的識(shí)別理論。統(tǒng)計(jì)模式識(shí)別,又稱決策理論識(shí)別,該方法基于模式的統(tǒng)計(jì)特征,用一個(gè)n維特征空間(特征集)來(lái)描述每個(gè)模式,然后基于概率論矩陣?yán)碚摰戎R(shí),利用合適的判別函數(shù),將這個(gè)n維特征空間劃分為m個(gè)區(qū)域,即類別。特征值分布函數(shù)可以通過(guò)指定或?qū)W習(xí)得到。統(tǒng)計(jì)模式識(shí)別經(jīng)常用于解決分類問(wèn)題?,F(xiàn)在研究的一個(gè)熱點(diǎn)-支持向量機(jī)就是基于統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的一個(gè)新的模式識(shí)別方法。

3.3 結(jié)構(gòu)(句法)模式識(shí)別

結(jié)構(gòu)(句法)模式識(shí)別主要是基于特征的結(jié)構(gòu)相關(guān)性將復(fù)雜的模式用簡(jiǎn)單的子模式或基元遞歸來(lái)描述,這種描述與文字中的句子通過(guò)多個(gè)單詞來(lái)描述相似。

3.4 神經(jīng)網(wǎng)絡(luò)模式識(shí)別

神經(jīng)網(wǎng)絡(luò)可看作是由大量交互的神經(jīng)元構(gòu)成的計(jì)算系統(tǒng)[5],神經(jīng)模式識(shí)別即是利用神經(jīng)元網(wǎng)絡(luò)中出現(xiàn)的神經(jīng)計(jì)算模式進(jìn)行。神經(jīng)元網(wǎng)絡(luò)允許模式可以有噪聲,若訓(xùn)練得當(dāng),神經(jīng)元網(wǎng)絡(luò)會(huì)對(duì)未知模式的類別做出正確的響應(yīng)。

4 模式識(shí)別在刑事科學(xué)技術(shù)中的應(yīng)用

經(jīng)過(guò)多年的發(fā)展,模式識(shí)別已被廣泛應(yīng)用在了刑事科學(xué)技術(shù)領(lǐng)域[6],如痕跡檢驗(yàn)、票證印章識(shí)別、相貌識(shí)別等。

4.1 痕跡鑒別

痕跡鑒別是在刑事科學(xué)技術(shù)中廣泛應(yīng)用于查證、披露和確認(rèn)罪犯的一種十分有效的技術(shù)手段。主要包括指紋鑒別、足跡鑒別、掌紋及皮膚紋鑒別、槍彈痕跡鑒別、兇器及作案工具鑒別和汽車輪胎等其它痕跡的鑒別。其中指紋識(shí)別[7,8]最為常用,經(jīng)專家證實(shí),每個(gè)人的手指、腳、腳趾內(nèi)側(cè)表面的皮膚凸凹不平產(chǎn)生的紋路會(huì)形成各樣的圖案,而這些皮膚的紋路在圖案、斷點(diǎn)和交叉點(diǎn)上各不相同,是唯一的。依靠這種唯一性,就可將一個(gè)人同他的指紋對(duì)應(yīng)起來(lái),從而識(shí)別出對(duì)應(yīng)的案犯。現(xiàn)代公安系統(tǒng)中的指紋自動(dòng)識(shí)別系統(tǒng)即是利用計(jì)算機(jī)進(jìn)行自動(dòng)識(shí)別,并與人工認(rèn)定相結(jié)合,效果十分顯著。這種識(shí)別技術(shù)還可以用于金融、保險(xiǎn)、出入境安全通道、醫(yī)療卡、安全系統(tǒng)等重要業(yè)務(wù)的身份鑒別。

4.2 票證印章識(shí)別

票證包括護(hù)照、支票、銀行信用卡、股票、國(guó)庫(kù)券、發(fā)貨票、產(chǎn)權(quán)證、工作證等有價(jià)證券、證件和票據(jù),一般票證均采取相應(yīng)的高新技術(shù)防偽措施如在票證上印刷上有特殊花紋、加金屬線和熒光粉材料等。除了用一些簡(jiǎn)易的紫外線方法檢驗(yàn)外,通常可將形成防護(hù)信息轉(zhuǎn)換成代碼均勻散布在票證上[2],鑒別時(shí)只需將防護(hù)信息代碼提取出來(lái)由計(jì)算機(jī)進(jìn)行自動(dòng)識(shí)別,如直接通過(guò)刷卡、掃描等方式即可鑒別真?zhèn)巍?/p>

4.3 生物特征識(shí)別

所謂生物特征識(shí)別是指通過(guò)計(jì)算機(jī)與生物統(tǒng)計(jì)學(xué)等手段利用人體所固有的生理特征或行為特征來(lái)進(jìn)行個(gè)人身份鑒別[9,10]。生理特征多為先天性的;行為特征則多為后天性的。同時(shí)用于身份鑒別的生物特征應(yīng)具有普遍性、唯一性和可接受性等特點(diǎn)。

基于生理特征的識(shí)別技術(shù)包括人臉識(shí)別、虹膜識(shí)別、視網(wǎng)膜識(shí)別、掌紋識(shí)別、手形識(shí)別、人耳識(shí)別、基因識(shí)別及紅外溫譜圖識(shí)別等?;谛袨樘卣鞯淖R(shí)別技術(shù)主要有步態(tài)識(shí)別、擊鍵識(shí)別和簽名識(shí)別等。

5 結(jié)束語(yǔ)

隨著計(jì)算機(jī)軟硬件技術(shù)的快速發(fā)展,模式識(shí)別得到了更多的關(guān)注,模式識(shí)別技術(shù)越來(lái)越完善,應(yīng)用領(lǐng)域也越來(lái)越廣泛。模式識(shí)別技術(shù)在刑事科學(xué)技術(shù)領(lǐng)域中的應(yīng)用,將為刑事科學(xué)技術(shù)的發(fā)展,刑事科學(xué)的現(xiàn)代化進(jìn)程推向一個(gè)新的高度。

參考文獻(xiàn):

[1] 邊肇祺,張學(xué)工.模式識(shí)別[M].2版.北京:清華大學(xué)出版社,2000.

[2] 賈鐵軍,李錦.人工智能在刑事技術(shù)中的應(yīng)用[J].刑事技術(shù),2002,(6):56-60.

[3] 嚴(yán)紅平,潘春洪.模式識(shí)別簡(jiǎn)述[J].自動(dòng)化博覽.2006(2):22-26.

[4] 熊超.模式識(shí)別理論及其應(yīng)用綜述[J].中國(guó)科技信息,2006(6):171-172.

[5] 潘盛輝,韓峻峰.基于神經(jīng)網(wǎng)絡(luò)的模式識(shí)別及其應(yīng)用[J].廣西工學(xué)院學(xué)報(bào),2000,11(4):33-36.

[6] 賈玉文,張書杰.刑事科學(xué)技術(shù)[M].2版.北京:人民衛(wèi)生出版社,1999.

[7] 楊宏林,吳陳.指紋識(shí)別方法綜述[J].華東船舶工業(yè)學(xué)院學(xué)報(bào),2003,17(3):37-42.

[8] 謝健陽(yáng),李鐵才,唐降龍,等.指紋識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].微計(jì)算機(jī)信息,2006,22(3):156-157.

[9] 周激流,張曄.人臉識(shí)別理論研究進(jìn)展[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),1999,11(2):180-184.

篇2

關(guān)鍵詞:模式;模式識(shí)別;模式識(shí)別的應(yīng)用

1 引言

人們?cè)谟^察事物或現(xiàn)象的時(shí)候,常常要根據(jù)一定需求尋找觀察目標(biāo)與其他事物或現(xiàn)象的相同或不同之處,并在此特定需求下將具有相同或相似之處的事物或現(xiàn)象組成一類。例如字母‘A’、‘B’、‘a(chǎn)’、‘b’,如果從大小寫上來(lái)分,會(huì)將‘A’、‘B’ 劃分為一類,‘a(chǎn)’、‘b’劃分為另一類;但是如果從英文字母發(fā)音上來(lái)分,則又將‘A’、‘a(chǎn)’劃分為一類,而‘B’、‘b’則為另一類。人們也可以正確地區(qū)分出它們,并根據(jù)需要將它們進(jìn)行準(zhǔn)確歸類,當(dāng)然, 前提條件是人們需要對(duì)‘A’、‘B’、‘a(chǎn)’、‘b’一般的書寫格式、發(fā)音方式等有所了解。人腦的這種思維能力就構(gòu)成了“模式識(shí)別”的概念。那么,什么是模式?什么是模式識(shí)別呢?

2 模式和模式識(shí)別

從以上的例子可以看出,對(duì)字符的準(zhǔn)確識(shí)別首先需要在頭腦中對(duì)相應(yīng)字符有個(gè)準(zhǔn)確的認(rèn)識(shí)。當(dāng)人們看到某物或現(xiàn)象時(shí),人們首先會(huì)收集該物體或現(xiàn)象的所有信息,然后將其行為特征與頭腦中已有的相關(guān)信息相比較,如果找到一個(gè)相同或相似的匹配,人們就可以將該物體或現(xiàn)象識(shí)別出來(lái)。因此,某物體或現(xiàn)象的相關(guān)信息,如空間信息、時(shí)間信息等,就構(gòu)成了該物體或現(xiàn)象的模式。Watanabe定義模式“與混沌相對(duì)立,是一個(gè)可以命名的模糊定義的實(shí)體”。比如,一個(gè)模式可以是指紋圖像、手寫草字、人臉、或語(yǔ)言符號(hào)等。廣義地說(shuō),存在于時(shí)間和空間中可觀察的事物,如果可以區(qū)別它們是否相同或相似,都可以稱之為模式;狹義地說(shuō),模式是通過(guò)對(duì)具體的個(gè)別事物進(jìn)行觀測(cè)所得到的具有時(shí)間和空間分布的信息;把模式所屬的類別或同一類中模式的總體稱為模式類(或簡(jiǎn)稱為類)。模式識(shí)別則是在某些一定量度或觀測(cè)基礎(chǔ)上把待識(shí)模式劃分到各自的模式類中去。計(jì)算機(jī)模式識(shí)別就是是指利用計(jì)算機(jī)等裝置對(duì)物體、圖像、圖形、語(yǔ)音、字形等信息進(jìn)行自動(dòng)識(shí)別。

模式識(shí)別的研究主要集中在兩方面,一是研究生物體( 包括人) 是如何感知對(duì)象的,二是在給定的任務(wù)下,如何用計(jì)算機(jī)實(shí)現(xiàn)模式識(shí)別的理論和方法。前者是生理學(xué)家、心理學(xué)家、生物學(xué)家、神經(jīng)生理學(xué)家的研究?jī)?nèi)容,屬于認(rèn)知科學(xué)的范疇;后者通過(guò)數(shù)學(xué)家、信息學(xué)專家和計(jì)算機(jī)科學(xué)工作者近幾十年來(lái)的努力,已經(jīng)取得了系統(tǒng)的研究成果。

3模式識(shí)別的方法

現(xiàn)在有兩種基本的模式識(shí)別方法,即統(tǒng)計(jì)模式識(shí)別方法和結(jié)構(gòu)(句法)模式識(shí)別方法。統(tǒng)計(jì)模式識(shí)別是對(duì)模式的統(tǒng)計(jì)分類方法,即結(jié)合統(tǒng)計(jì)概率論的貝葉斯決策系統(tǒng)進(jìn)行模式識(shí)別的技術(shù),又稱為決策理論識(shí)別方法。利用模式與子模式分層結(jié)構(gòu)的樹狀信息所完成的模式識(shí)別工作,就是結(jié)構(gòu)模式識(shí)別或句法模式識(shí)別。

4.模式識(shí)別的應(yīng)用

經(jīng)過(guò)多年的研究和發(fā)展,模式識(shí)別技術(shù)已廣泛被應(yīng)用于人工智能、計(jì)算機(jī)工程、機(jī)器學(xué)、神經(jīng)生物學(xué)、醫(yī)學(xué)、偵探學(xué)以及高能物理、考古學(xué)、地質(zhì)勘探、宇航科學(xué)和武器技術(shù)等許多重要領(lǐng)域,如語(yǔ)音識(shí)別、語(yǔ)音翻譯、人臉識(shí)別、指紋識(shí)別、手寫體字符的識(shí)別、工業(yè)故障檢測(cè)、精確制導(dǎo)等。模式識(shí)別技術(shù)的快速發(fā)展和應(yīng)用大大促進(jìn)了國(guó)民經(jīng)濟(jì)建設(shè)和國(guó)防科技現(xiàn)代化建設(shè)。

4.1 字符識(shí)別

字符識(shí)別處理的信息可分為兩大類:一類是文字信息,處理的主要是用各國(guó)家、各民族的文字( 如: 漢字,英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機(jī)手寫方面技術(shù)已趨向成熟,并推出了很多應(yīng)用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯?dāng)?shù)字及少量特殊符號(hào)組成的各種編號(hào)和統(tǒng)計(jì)數(shù)據(jù),如:郵政編碼、統(tǒng)計(jì)報(bào)表、財(cái)務(wù)報(bào)表、銀行票據(jù)等等,處理這類信息的核心技術(shù)是手寫數(shù)字識(shí)別。

4.2 語(yǔ)音識(shí)別

語(yǔ)音識(shí)別技術(shù)技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽覺(jué)機(jī)理、人工智能等等。近年來(lái),在生物識(shí)別技術(shù)領(lǐng)域中,聲紋識(shí)別技術(shù)以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢(shì)受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌踩?yàn)證方式。而且利用基因算法訓(xùn)練連續(xù)隱馬爾柯夫模型的語(yǔ)音識(shí)別方法現(xiàn)已成為語(yǔ)音識(shí)別的主流技術(shù)。該方法在語(yǔ)音識(shí)別時(shí)識(shí)別速度較快,也有較高的識(shí)別率。

4.3 指紋識(shí)別

我們手掌及其手指、腳、腳趾內(nèi)側(cè)表面的皮膚凹凸不平產(chǎn)生的紋路會(huì)形成各種各樣的圖案。而這些皮膚的紋路在圖案、斷點(diǎn)和交叉點(diǎn)上各不相同,是唯一的。依靠這種唯一性,就可以將一個(gè)人同他的指紋對(duì)應(yīng)起來(lái),通過(guò)比較他的指紋和預(yù)先保存的指紋進(jìn)行比較,便可以驗(yàn)證他的真實(shí)身份。一般的指紋5個(gè)大的類別:左旋型(leftloop),右旋型(right loop),雙旋型(twinloop),螺旋型(whorl),弓型(arch)和帳型(tented arch),這樣就可以將每個(gè)人的指紋分別歸類,進(jìn)行檢索。指紋實(shí)現(xiàn)的方法有很多,大致可以分為4 類:基于神經(jīng)網(wǎng)絡(luò)的方法、基于奇異點(diǎn)的方法、語(yǔ)法分析的方法和其他的方法。

4.4細(xì)胞識(shí)別

細(xì)胞識(shí)別是最近在識(shí)別技術(shù)中比較熱門的一個(gè)話題。以前,對(duì)疾病的診斷僅僅通過(guò)表面現(xiàn)象,經(jīng)驗(yàn)在診斷中起到了主導(dǎo)作用,錯(cuò)判率始終占有一定的比例;而今,通過(guò)對(duì)顯微細(xì)胞圖像的研究和分析來(lái)診斷疾病,不僅可以了解疾病的病因、研究醫(yī)療方案,還可以觀測(cè)醫(yī)療療效。如果通過(guò)人工辨識(shí)顯微細(xì)胞診斷疾病也得不償失,費(fèi)力費(fèi)時(shí)不說(shuō),還容易耽誤治療?;趫D像區(qū)域特征,利用計(jì)算機(jī)技術(shù)對(duì)顯微細(xì)胞圖像進(jìn)行自動(dòng)識(shí)別愈來(lái)愈受到大家的關(guān)注,并且現(xiàn)在也獲得了不錯(cuò)的效果。但實(shí)際中,細(xì)胞的組成是復(fù)雜的,應(yīng)該選擇更多的特征,建立更為完善的判別函數(shù),可能會(huì)進(jìn)一步提高分類精度。

參考文獻(xiàn):

[1] 邊肇祺,張學(xué)工等編著. 《模式識(shí)別》(第二版). 北京:清華大學(xué)出版社,2000.

[2] 王碧泉,陳祖蔭. 《模式識(shí)別理論、方法和應(yīng)用》. 北京:地震出版社,1989.

篇3

關(guān)鍵詞:實(shí)體識(shí)別; 屬性模式; 擴(kuò)展性; 框架

中圖分類號(hào):TP319.9 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-2163(2014)01-0065-04

0引言

實(shí)體識(shí)別就是判別來(lái)自一個(gè)數(shù)據(jù)源或多個(gè)數(shù)據(jù)源的描述是否指向同一個(gè)實(shí)體。此問(wèn)題由來(lái)已久,現(xiàn)已提出很多方法。解決實(shí)體識(shí)別問(wèn)題所利用的信息可分為兩類,屬性特征信息和關(guān)系信息?;趯傩蕴卣鞯姆椒ㄗ詈?jiǎn)單、使用得也最多,但卻因?qū)傩孕畔⒂邢蓿谀承┣闆r下并不足以提供高置信度的判斷結(jié)論。越來(lái)越多的方法開始利用屬性的關(guān)系或規(guī)則進(jìn)行實(shí)體識(shí)別,但利用這種關(guān)系的方式卻各不相同,導(dǎo)致缺乏通用性。對(duì)每個(gè)實(shí)體識(shí)別問(wèn)題都需要重新設(shè)計(jì)解決方案也必將是低效的,因而需要開展研究,予以改進(jìn)。

本文將不同屬性與實(shí)體的關(guān)系模式概括為四種類型,通過(guò)模式類型決定相似度計(jì)算策略,再根據(jù)屬性的格式?jīng)Q定基本的相似度計(jì)算函數(shù)。系統(tǒng)將多個(gè)屬性的相似度組織成向量的形式表示,通過(guò)監(jiān)督學(xué)習(xí)的方法形成判決器,最后在實(shí)體關(guān)系圖上完成迭代劃分。

1相關(guān)研究

文獻(xiàn)[1,2]研究了相似函數(shù)選擇和閾值確定問(wèn)題。通過(guò)發(fā)現(xiàn)相似函數(shù)和閾值的冗余,去除不合適的相似函數(shù)和閾值設(shè)置。為了有效整合多種方法的優(yōu)點(diǎn),文獻(xiàn)[3]提出了一種按有監(jiān)督學(xué)習(xí)的結(jié)果聚類分配權(quán)重的方法,為權(quán)重分配提供了新的思路,但選擇作為聚類的特征是經(jīng)驗(yàn)性的,是否可以推廣尚未確定。文獻(xiàn)[4]設(shè)計(jì)了一個(gè)領(lǐng)域無(wú)關(guān)的實(shí)體識(shí)別系統(tǒng),可以通過(guò)學(xué)習(xí)的方式對(duì)數(shù)據(jù)的格式進(jìn)行轉(zhuǎn)化,以滿足識(shí)別系統(tǒng)進(jìn)行比較的需要。文獻(xiàn)[5]研究了利用合作者集合的相關(guān)性的方法,實(shí)驗(yàn)證明其優(yōu)于一般的非整體分析的方法。

2基于屬性模式的實(shí)體識(shí)別框架介紹

系統(tǒng)結(jié)構(gòu)如圖1所示,主要分為以下幾個(gè)部分:

(1)相似度度量策略形成模塊。該模塊通過(guò)屬性的模式和數(shù)據(jù)格式自動(dòng)地選擇相似度函數(shù),形成相似度度量策略。

(2)相似度計(jì)算模塊。該模塊按照選擇的相似度函數(shù)計(jì)算實(shí)體對(duì)的相似度。

(3)判決器模塊。該模塊在訓(xùn)練階段統(tǒng)計(jì)實(shí)體對(duì)的相似度分布情況,在實(shí)體劃分階段輔助判斷。

(4)實(shí)體關(guān)系圖。實(shí)體劃分階段在實(shí)體關(guān)系圖上迭代進(jìn)行,每次完成實(shí)體合并以后,重新計(jì)算經(jīng)過(guò)調(diào)整的實(shí)體對(duì)的相似度,直到所有相似邊都處理完畢,實(shí)體劃分結(jié)束。

3系統(tǒng)各部分的實(shí)現(xiàn)

3.1相似度計(jì)算策略的形成

為了實(shí)現(xiàn)系統(tǒng)的通用性,相似度計(jì)算策略必須領(lǐng)域無(wú)關(guān)地進(jìn)行。為此分析了實(shí)體與屬性間的關(guān)系,按其特點(diǎn)進(jìn)行了分類。利用各屬性的模式可以確定相似度計(jì)算的方法。

3.3實(shí)體劃分算法

實(shí)體劃分在實(shí)體關(guān)系圖上進(jìn)行。實(shí)體關(guān)系圖的頂點(diǎn)表示記錄,邊表示實(shí)體對(duì)間的相似度,通過(guò)邊的操作進(jìn)行實(shí)體劃分。

關(guān)系圖的頂點(diǎn)分為兩類,一類是原始頂點(diǎn),其中只包含一條記錄;另一類是劃分過(guò)程中新形成的點(diǎn),稱為超點(diǎn),超點(diǎn)帶有表示實(shí)體的標(biāo)簽,且包含此實(shí)體的記錄的集合。邊e代表的是實(shí)體對(duì)間存在相似,邊的權(quán)值為相似向量。原始關(guān)系圖中僅含原始頂點(diǎn),當(dāng)所有實(shí)體對(duì)的相似向量計(jì)算完畢,并建立起原始關(guān)系圖后,就可開始進(jìn)行實(shí)體劃分了。

實(shí)體劃分算法主要過(guò)程為:從未標(biāo)記邊中選擇相似度最大的邊,查詢判決器,若大于判斷閾值,則判為同一實(shí)體,合并相關(guān)頂點(diǎn),即CLUSTER操作,有關(guān)邊的相似度則需要進(jìn)行重新計(jì)算;否則即對(duì)邊做暫時(shí)標(biāo)記。繼續(xù)在剩下未標(biāo)記邊中尋找相似度值最大的邊,重復(fù)此過(guò)程。當(dāng)沒(méi)有未標(biāo)記邊剩余時(shí),再對(duì)標(biāo)記邊進(jìn)行拆分操作SPLIT,直到無(wú)邊剩余。

CLUSTER操作主要是對(duì)頂點(diǎn)進(jìn)行合并或創(chuàng)建。當(dāng)邊的對(duì)象(e.O)與端點(diǎn)標(biāo)簽相同時(shí)進(jìn)行合并,否則就需要新建頂點(diǎn)。具體操作如表2所示。其中,邊所連接的記錄為x和y,記錄所在的頂點(diǎn)分別為u,v。頂點(diǎn)調(diào)整過(guò)程中,特別當(dāng)頂點(diǎn)包含的記錄增多后,頂點(diǎn)的屬性集合增大,此屬性的相關(guān)度也可能增大,此時(shí)需要重新計(jì)算有關(guān)邊的相似度。

5結(jié)束語(yǔ)

本文提出了一種基于模式的實(shí)體識(shí)別方法,針對(duì)模式特點(diǎn)的相似度計(jì)算方法更具有通用性。以向量表示屬性的相似度,通過(guò)監(jiān)督學(xué)習(xí)形成判決器。實(shí)體劃分階段每次選擇最相似的實(shí)體對(duì),通過(guò)查詢判斷單元進(jìn)行判斷,更新相關(guān)實(shí)體對(duì)的相似向量,并迭代進(jìn)行實(shí)體劃分。實(shí)驗(yàn)結(jié)果表明能自動(dòng)有效地進(jìn)行實(shí)體劃分?,F(xiàn)存的問(wèn)題包括平均劃分相似空間的方法不夠精細(xì),用戶要求的準(zhǔn)確率較高時(shí),召回率較低。下一步的研究重點(diǎn)包括判斷器的劃分方式以及當(dāng)用戶輸入較高判斷閾值情況下如何提高系統(tǒng)的召回率。

參考文獻(xiàn):

[1]MENESTRINA D, WHANG S E, GARCIA-MOLINA H. Evaluation of entity resolution approaches on real-world match problems[C]//VLDB, 2010:208-219.

[2]WANG Jiannan, LI Guoliang, YU Xu , et al. Entity matching: how similar is similar[C]//VLDB,2011:622-633.

[3]CHEN Z, KALASHNIKOV D V, MEHROTRA S.Exploiting context analysis for combining multiple entity resolution systems[C]//SIGMOD,2009:207-218.

篇4

關(guān)鍵詞:虹膜識(shí)別;防偽;互聯(lián)網(wǎng)金融

一、引言

互聯(lián)網(wǎng)金融防偽技術(shù)最常見(jiàn)的就是二維碼。隨著二維碼的發(fā)展,“掃一掃”這個(gè)簡(jiǎn)單的動(dòng)作可以完成人們?nèi)粘I钪性S多事情,其中,二維碼防偽就是二維碼在互聯(lián)網(wǎng)金融的主要應(yīng)用之一,用戶可以用手機(jī)掃描二維碼來(lái)登陸P2P平臺(tái)進(jìn)行交易,又因二維碼是隨機(jī)生成,不易被竊取,所以防偽效果顯著。

指紋防偽技術(shù)識(shí)別作為最成熟的生物識(shí)別技術(shù),主要應(yīng)用于互聯(lián)網(wǎng)交易支付方面,比之普通的圖案識(shí)別和密碼識(shí)別,指紋防偽具有較高的安全性和快捷性,也是當(dāng)前人們比較依賴和慣用的防偽方式。

當(dāng)然,還有其他一些防偽技術(shù),就不多做介紹了。總之,防偽技術(shù)的出現(xiàn)是為了解決在互聯(lián)網(wǎng)金融中的詐騙造假問(wèn)題,這不僅是廣大互聯(lián)網(wǎng)金融參與者所關(guān)注的焦點(diǎn),政府對(duì)此也保持高度重視,在2016年政府工作報(bào)告中,總理提出“規(guī)范互聯(lián)網(wǎng)金融,大力發(fā)展綠色金融”??梢钥闯龌ヂ?lián)網(wǎng)金融的防偽工作并不完善,仍需繼續(xù)努力。

二、虹膜識(shí)別防偽技術(shù)的優(yōu)點(diǎn)

(1)識(shí)別度高

每個(gè)人眼睛里的虹膜都是獨(dú)特的,絕無(wú)僅有的。甚至同一個(gè)體左右眼睛的虹膜也有所差別。所謂的虹膜識(shí)別技術(shù),就是讀取虹膜的細(xì)節(jié)表象特征,經(jīng)識(shí)別后,轉(zhuǎn)化為特殊的虹膜密碼,再儲(chǔ)存到計(jì)算機(jī)內(nèi)連網(wǎng)錄入數(shù)據(jù)庫(kù)。虹膜識(shí)別的出錯(cuò)率極低,是因?yàn)楹缒そM織紋路復(fù)雜且細(xì)節(jié)繁多,一個(gè)虹膜的讀取點(diǎn)數(shù)量大約是其他傳統(tǒng)生物識(shí)別的20~30倍。如此龐大的信息量汲取確保了虹膜識(shí)別的精確程度,極大地提高了安全性。

(2)永久不變性

虹膜生長(zhǎng)地很快,是人身體最早成熟的器官之一。從嬰兒時(shí)期開始,只需3年時(shí)間就可以發(fā)育成熟,一旦成熟就終身不變。而且,普通疾?。ㄈ纾毫鞲校┎粫?huì)對(duì)虹膜造成傷害,虹膜也不會(huì)因特殊職業(yè)(如:跳水運(yùn)動(dòng)員等長(zhǎng)期眼睛接觸水的工作)或者特殊喜好(如:長(zhǎng)期戴美瞳,隱形眼鏡)等因素造成磨損。

(3)高防偽性

虹膜是“最難偽造的”人體生物特征,因?yàn)樗鼧O強(qiáng)的生物活性與人體生命現(xiàn)象是相呼應(yīng)的。比如,在生活中,虹膜會(huì)對(duì)光線敏感,會(huì)隨光線強(qiáng)弱變化而變化;在生理上,瞳孔會(huì)自我無(wú)意識(shí)地縮放,虹膜也相應(yīng)地自然變化;在醫(yī)學(xué)上,醫(yī)生會(huì)用聚光手電筒照病人的眼睛也是因?yàn)楹缒?huì)隨身體狀況變化而呈現(xiàn)不同的特征。所以,若有非法分子想用剝離人體的眼球、照片等死物來(lái)代替活體虹膜識(shí)別都是絕對(duì)不可行的,從而保證了虹膜防偽的高執(zhí)行力和高辨識(shí)率。

(4)非接觸性

虹膜識(shí)別需要使用專門的檢測(cè)儀器,用戶只需眼睛對(duì)著儀器的特殊鏡頭,無(wú)需觸碰到儀器就可以完成識(shí)別檢測(cè)。所以,在虹膜識(shí)別與個(gè)人信息錄入時(shí),全過(guò)程可高效快速地完成。沒(méi)有直接的身體接觸,也不會(huì)冒犯他人。

三、虹膜識(shí)別防偽技術(shù)的基本原理

虹膜防偽技術(shù)是基于虹膜識(shí)別技術(shù)與個(gè)人信息庫(kù)相結(jié)合的一項(xiàng)防偽技術(shù)。為了更好的運(yùn)用這種技術(shù),有三個(gè)方面比較重要。

第一部分重點(diǎn)是虹膜圖像的定位,虹膜的歸一化(盡量消除由于旋轉(zhuǎn)、位移、圖片的放大縮小以及一些采集圖像過(guò)程中的外部光線、像素等因素對(duì)每個(gè)人的虹膜特征的模糊與改變),將虹膜的圖像(如圖3.1)的分辨率提高以便于更好的識(shí)別不同個(gè)體的虹膜圖像的特征,提取這些精化的虹膜圖片以及將這些信息集合起來(lái)創(chuàng)立一個(gè)虹膜的大數(shù)據(jù)信息庫(kù)。

第二部分的重點(diǎn)主要是采集現(xiàn)有利用互聯(lián)網(wǎng)金融平臺(tái)進(jìn)行投資與理財(cái)?shù)目蛻舻纳锾卣髯R(shí)別的數(shù)據(jù)――左右眼虹膜。同時(shí),將這些金融平臺(tái)的客戶信息與自身的虹膜圖像相鏈接。將個(gè)人的投資信息、信用信息等個(gè)人財(cái)務(wù)類信息的信息庫(kù)和之前采集的虹膜信息庫(kù)結(jié)合,達(dá)到虹膜信息匹配時(shí)可以調(diào)出個(gè)人信息的目的。

第三部分重點(diǎn)是防偽技術(shù)。由于與虹膜系統(tǒng)鏈接的是需要安全度高的金融財(cái)務(wù)等信息,因此要最大程度上降低偽造虹膜盜取信息的可能性。外置的采集虹膜的機(jī)器需要能夠識(shí)別所采集到的虹膜圖像是否是活體虹膜。內(nèi)部的采集虹膜特征的算法能夠更加精確的提取不同個(gè)體的虹膜特征。

四、虹膜識(shí)別防偽技術(shù)在互聯(lián)網(wǎng)金融的應(yīng)用

近年來(lái),中國(guó)的互聯(lián)網(wǎng)金融發(fā)展十分迅速,證券公司、基金公司、銀行以及其他網(wǎng)上的小型P2P平臺(tái)等等都開通了網(wǎng)上直接投資理財(cái),自行贖回等業(yè)務(wù)。盡管這極大便利了廣大投資者,但是存在較大的網(wǎng)上信息安全隱患。違法人員盜用他人的身份信息致使投資者財(cái)務(wù)損失的情況屢有發(fā)生。這使得現(xiàn)有的僅憑借數(shù)字字母組合密碼以及身份證號(hào)碼或是短信驗(yàn)證碼等方式即可操作個(gè)人的網(wǎng)上賬戶極不安全。雖然現(xiàn)在已有一些平臺(tái)例如螞蟻聚寶等能夠使用指紋解鎖或是刷臉支付,但這些生物識(shí)別方式相對(duì)于虹膜識(shí)別精度欠缺,并且有比較大的局限性。虹膜識(shí)別技術(shù)因其特有的極高的不可復(fù)制性以及穩(wěn)定性等能夠有效防止他人使用違法手段偽造虹膜圖像竊取個(gè)人的重要金融財(cái)務(wù)信息。虹膜識(shí)別防偽技術(shù)作為一種比指紋、臉部識(shí)別更加精準(zhǔn)的方式,將其與蓬勃發(fā)展的互聯(lián)網(wǎng)金融相結(jié)合是發(fā)展的必然趨勢(shì)。

五、虹膜識(shí)別防偽技術(shù)的未來(lái)發(fā)展

由基因與外部環(huán)境共同決定的虹膜的獨(dú)一無(wú)二的性質(zhì)(每個(gè)人的左右眼虹膜也有較大的區(qū)別)使得其在生物識(shí)別技術(shù)中獨(dú)樹一幟。當(dāng)下,已經(jīng)有許多公司將虹膜技術(shù)運(yùn)用到產(chǎn)品中,如三星公司決定Galaxy Note 7手機(jī)將采用虹膜識(shí)別技術(shù)、微軟Lumia950/950*L搭載基于Windows Hello的虹膜識(shí)別功能以及中興Grand S3利用虹膜識(shí)別技術(shù)安全支付或是訪問(wèn)機(jī)密文件等。不僅是這些公司將虹膜識(shí)別技術(shù)運(yùn)用到生產(chǎn)的產(chǎn)品中,許多其他公司也在研制與開發(fā)虹膜識(shí)別技術(shù),力圖降低虹膜技術(shù)運(yùn)用的成本。使得虹膜識(shí)別技術(shù)在我們的日常生活中得到普及。

六、結(jié)束語(yǔ)

隨著技術(shù)的發(fā)展,虹膜作為一種人體固有的生物特征,終身不變以及準(zhǔn)確度高和識(shí)別速度快的特點(diǎn),虹膜防偽技術(shù)在這個(gè)信息爆炸的時(shí)代的需求增加將會(huì)是不可阻擋的趨勢(shì)。同時(shí),虹膜防偽技術(shù)為人們?nèi)蘸笊顜?lái)的便利以及創(chuàng)造的經(jīng)濟(jì)價(jià)值也是不可估量的。

參考文獻(xiàn):

[1].2016年國(guó)務(wù)院政府工作報(bào)告[R].新華網(wǎng),2016-03-05.

[2]王蘊(yùn)紅,朱勇,譚鐵牛.基于虹膜識(shí)別的身份鑒別[J].自動(dòng)化學(xué)報(bào),2002(01).

[3]Boles W, Boashah B. A human identification technique using images of the iris and vavelet transform. IEEE Trans.On Signal Processing,1998(04).

[4]李海青,孫哲南,譚鐵牛,等.虹膜識(shí)別技術(shù)進(jìn)展與趨勢(shì)信息安全研究[J].2016(01).

[5]田啟川,劉正光.虹膜識(shí)別綜述[J].計(jì)算機(jī)應(yīng)用研究,2008(05).

[6]尚睿.虹膜識(shí)別技術(shù)的最新進(jìn)展綜述[J].電腦知識(shí)與技術(shù),2015(22).

篇5

【摘要】 目的: 建立適用于社區(qū)中腦膜炎與其他中樞神經(jīng)系統(tǒng)疾病的鑒別診斷模型。方法:采用不等帶寬核密度估計(jì)的非參數(shù)判別分析,對(duì)中國(guó)典型病例大全近四年內(nèi)符合納入標(biāo)準(zhǔn)的161例腦膜炎和161例非腦膜炎患者完整的病例資料進(jìn)行分析。結(jié)果: 經(jīng)交叉證實(shí)法得到腦膜炎組的判別正確率為83.95 %,對(duì)照組為71.25 %,總的判斷正確率87.64 %。同時(shí)對(duì)資料進(jìn)行l(wèi)ogistic回歸和人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行分析,并進(jìn)行與人工神經(jīng)網(wǎng)絡(luò)和logistic回歸所建立的模型進(jìn)行比較。結(jié)論: 非參數(shù)判別分析建立的腦膜炎診斷模型是理想模型。

【關(guān)鍵詞】 非參數(shù)判別; 交叉證實(shí); 診斷模型; 腦膜炎

腦膜炎是由病原體引起的中樞神經(jīng)系統(tǒng)嚴(yán)重的感染性疾病。由于發(fā)病原因復(fù)雜,診斷難度大,病程兇險(xiǎn)且可造成流行,因此,在亞洲一些地區(qū),流行性腦膜炎是15歲以下的孩子死亡的主要原因之一。流行性腦膜炎在流行強(qiáng)度較大的時(shí)候會(huì)導(dǎo)致3000~10000人死亡[1]。腦膜炎早期的癥狀不具有特異性,因此在社區(qū)醫(yī)生水平有限的情況下很難得到重視,而大部分的腦膜炎都是急性的,尤其是流行性腦脊髓膜炎,一旦沒(méi)有及時(shí)診斷,對(duì)病人的生命和愈后都會(huì)造成很大的影響。因此,建立適合于社區(qū)的腦膜炎初篩診斷模型對(duì)提高社區(qū)衛(wèi)生服務(wù)能力是很有意義的。

1 資料和方法

1.1 資料來(lái)源

在互聯(lián)網(wǎng)上系統(tǒng)檢索國(guó)內(nèi)信息量最大且有高影響力的《中國(guó)期刊全文數(shù)據(jù)庫(kù)》(CNKI) 及其新近開發(fā)的含有100多萬(wàn)病例的醫(yī)學(xué)數(shù)據(jù)庫(kù)《中國(guó)典型病例大全》(Medical Case),以醫(yī)學(xué)主題詞表中的“腦膜炎”為關(guān)鍵詞,以“病例報(bào)告、病例分析”為副關(guān)鍵詞,檢索2005年1月~2009年3月的相關(guān)臨床病例。

1.1.1 腦膜炎病人納入標(biāo)準(zhǔn) ①數(shù)據(jù)庫(kù)中有完整癥狀、體征和實(shí)驗(yàn)室檢查記錄,及臨床診斷明確的腦膜炎病例、病案;②年齡≥3周歲;③首次發(fā)病或首次因腦膜炎住院的患者;④發(fā)病前無(wú)肢體癱瘓或腦與腦神經(jīng)功能障礙等的患者。

1.1.2 對(duì)照組病人選擇標(biāo)準(zhǔn) ①數(shù)據(jù)庫(kù)中有完整癥狀、體征和實(shí)驗(yàn)室檢查記錄及臨床診斷明確,并有治療記錄的其他相關(guān)的同期非腦膜炎的中樞神經(jīng)系統(tǒng)病例、病案;②病人≥3周歲且與腦膜炎病例年齡相近。

1.1.3 病例排除標(biāo)準(zhǔn) ①患有嚴(yán)重并發(fā)癥;②患有嚴(yán)重精神疾病、癡呆者;③交叉重復(fù)的病案;④多臟器功能衰竭等嚴(yán)重病人;⑤由其他醫(yī)院轉(zhuǎn)院過(guò)來(lái)的病人;⑥醫(yī)院獲得性腦膜炎病人(如因手術(shù)感染所致)。

1.1.4 質(zhì)量控制 對(duì)病例篩選和數(shù)據(jù)錄入進(jìn)行質(zhì)量控制:①制定統(tǒng)一標(biāo)準(zhǔn)選擇病例;②建立數(shù)據(jù)庫(kù),統(tǒng)一調(diào)查項(xiàng)目;③雙錄入,及時(shí)糾錯(cuò);④注明資料出處,從病例篩選、數(shù)據(jù)錄入、統(tǒng)計(jì)分析等各步分別進(jìn)行核準(zhǔn)。

1.2 研究方法

1.2.1 數(shù)據(jù)挖掘 數(shù)據(jù)挖掘是一個(gè)利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系的過(guò)程[2]。臨床醫(yī)學(xué)上大量的數(shù)據(jù)中蘊(yùn)含著豐富的信息。利用數(shù)據(jù)挖掘技術(shù), 通過(guò)數(shù)據(jù)訓(xùn)練集所訓(xùn)練得到的算法模型能夠有效應(yīng)用于疾病診斷, 并獲得很高的準(zhǔn)確率。尤其是臨床上大量的數(shù)據(jù)都還為得到挖掘利用,本研究對(duì)《中國(guó)期刊全文數(shù)據(jù)庫(kù)》和《中國(guó)典型病例大全》兩個(gè)數(shù)據(jù)庫(kù)中收集回顧近四年符合納入標(biāo)準(zhǔn)的161例腦膜炎和161例非腦膜炎患者完整的病例資料進(jìn)行判別分析研究。

1.2.2 判別分析 判別分析是根據(jù)已得到的一批分類明確的樣品,建立較好的判別函數(shù),使產(chǎn)生錯(cuò)判的事例最少,進(jìn)而對(duì)給定的一個(gè)新樣品,判斷它來(lái)自哪個(gè)總體。判別分析近年來(lái)在自然科學(xué)、社會(huì)學(xué)及經(jīng)濟(jì)管理學(xué)科中都有廣泛的應(yīng)用。在醫(yī)學(xué)上也已逐步用于疾病的診斷。本研究采用不等帶寬核密度估計(jì)的非參數(shù)逐步判別分析。下面介紹不等帶寬核密度估計(jì)的非參數(shù)判別分析的主要步驟:

首先建立判別對(duì)象x 與j 類中判別對(duì)象Y間的平方距離函數(shù):

D2(X,Y)=(X-Y)COV-1j(X-Y)

(X-Y) :對(duì)象X與j 類中對(duì)象Y的各相同指標(biāo)差值向量;COV-1j(X-Y) :對(duì)象X與j 類中各對(duì)象Y的各相同指標(biāo)差值的協(xié)方差矩陣之逆矩陣。

其次求出判別函數(shù):

F(X / j)=n-1jSUiMexp(-5D2(X,Yji/ |R2)

D2(X,Yji) :對(duì)象 X與j 類中第i 個(gè)對(duì)象Yji 間的平方距離;R2 :各指標(biāo)分別與分類變量間相關(guān)系數(shù)的平方之均值。

然后計(jì)算后驗(yàn)概率:

Pr(j / j)=PRIOPjF(X| j) / SUkMPRIORkF(X|k)

PRIORk 為k 類的先驗(yàn)概率。

最后將判別對(duì)象判入后驗(yàn)概率大的類別中[3]。

1.2.3 統(tǒng)計(jì)學(xué)方法 應(yīng)用SAS9.0軟件編程建立非參數(shù)判別分析模型,對(duì)322例病例組和對(duì)照組資料進(jìn)行判別歸類,最后采用交叉驗(yàn)證法來(lái)驗(yàn)證判別函數(shù)的功效。

轉(zhuǎn)貼于   2 結(jié)果

2.1 變量賦值和單因素結(jié)果

單因素分析與判別指標(biāo)的選擇,首先選取以下癥狀或體征作為自變量進(jìn)行數(shù)據(jù)錄入和單因素分析。表1 判別分析引入變量賦值表

分類變量(病案中明確檢查診斷為依據(jù)) g :g = 1 (腦膜炎) 、g= 0(非腦膜炎) 。對(duì)上述癥狀體征采用單因素卡方檢驗(yàn)進(jìn)行比較,在腦膜炎患者中,多數(shù)病人具有發(fā)熱、頭痛、腦膜刺激征,在病例組中發(fā)生頻率均比對(duì)照組高,差異有統(tǒng)計(jì)學(xué)意義(P

2.2 判別分析中訓(xùn)練集和測(cè)試集的選擇

訓(xùn)練樣本為322例數(shù)據(jù)中按年齡排序,然后每間隔一例取一例為訓(xùn)練樣本,病例組中81例,對(duì)照組中80例共161例數(shù)據(jù)。測(cè)試樣本為:322例數(shù)據(jù)中除去161例訓(xùn)練樣本剩余的161例數(shù)據(jù),其中病例組80例,對(duì)照組81例。

2.3 交叉證實(shí)結(jié)果

2.3.1 本研究采用不等帶寬核密度估計(jì)的非參數(shù)判別分析,對(duì)訓(xùn)練樣本進(jìn)行判別分析,采用交叉證實(shí)法(Cross validation)來(lái)檢驗(yàn)判別函數(shù)所建立的模型的判別效果,可以得到診斷模型的靈敏度為65.4%,特異度為76.3%,陽(yáng)性預(yù)測(cè)值為73.6%,陰性預(yù)測(cè)值為68.5%,調(diào)整一致性為71.0%。判別結(jié)果見(jiàn)表2。表2 判別分析模型診斷模型腦膜炎訓(xùn)練樣本

2.3.2 應(yīng)用判別結(jié)果 用根據(jù)訓(xùn)練樣本所建立的判別函數(shù)對(duì)剩下的161例測(cè)試集進(jìn)行判別分析,得出測(cè)試樣本的靈敏度為71.3%,特異度為84.0%,陽(yáng)性預(yù)測(cè)值是81.4%,陰性預(yù)測(cè)值是74.7%,調(diào)整一致性為77.9%。得到判別結(jié)果見(jiàn)表3。表3 判別分析模型診斷腦膜炎測(cè)試樣本與金標(biāo)準(zhǔn)比較

3 討論

國(guó)外已有的輔助醫(yī)生進(jìn)行快速篩檢的腦膜炎診斷三聯(lián)征有:澳大利亞的“發(fā)熱、嘔吐、頭痛”[4];而國(guó)際上更多用的是“發(fā)熱、頸強(qiáng)直、意識(shí)狀態(tài)改變”[5]。本研究將發(fā)熱、頭痛及腦膜刺激征作為診斷腦膜炎的三聯(lián)征,并用非參數(shù)判別的方法建立判別函數(shù)來(lái)檢測(cè)“發(fā)熱、頭痛和腦膜刺激征”作為腦膜炎診斷三聯(lián)征的效果,得出此診斷模型的靈敏度是71.3%,特異度是84.0%,陽(yáng)性預(yù)測(cè)值是81.4%,陰性預(yù)測(cè)值是74.7%;與金標(biāo)準(zhǔn)的診斷符合率為77.9%,說(shuō)明該三聯(lián)征的診斷效果已比較理想。但實(shí)際效力如何還有待于臨床實(shí)踐的檢驗(yàn)。

非參數(shù)判別分析方法的應(yīng)用并不多見(jiàn),但是對(duì)于自變量主要為二分類的資料,作者認(rèn)為應(yīng)選用非參數(shù)的判別分析,本研究采用不等帶寬核密度估計(jì)的非參數(shù)判別分析,對(duì)訓(xùn)練樣本判別對(duì)象,采用交叉證實(shí)法(Cross validation)來(lái)檢驗(yàn)判別效果:在161測(cè)試樣本中,80 例腦膜炎病人有68例判為腦膜炎,13 例錯(cuò)判為非腦膜炎,判別正確率為83.95 %;81 例非腦膜炎病人有57例判斷為非腦膜炎,有23 例錯(cuò)判為腦膜炎,判別正確率為71.25 %;總判別正確率=87.64 %,判別效果良好。

以上研究結(jié)果表明,基于網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的資料進(jìn)行三聯(lián)征的研究是可行的,應(yīng)深入進(jìn)行有關(guān)的研究工作。然而,用網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的資料進(jìn)行研究也有一定的缺點(diǎn),例如在病歷報(bào)告或病例分析中的癥狀、體征常不描述,或雖已描述但不完整,且易受作者主觀取舍的影響。另外由于發(fā)表在中國(guó)典型病例大全上的腦膜炎病例數(shù)量有限,在以后研究的過(guò)程中應(yīng)盡量增大樣本量來(lái)減小偏倚。

參考文獻(xiàn)

1 R′emy Teyssou , Erwan MurosLe Rouzic. Meningitis epidemics in Africa: A brief overview. Vaccine2007,25: A3~A7.

2 David Martens, Liesbeth Bruynseels, Bart Baesens. Predicting going concern opinion with data mining. Decision Support Systems, 2008, 45: 765~777.

3 高歌, 王艾麗, 曹曉韻. 非參數(shù)逐步判別分析在腦中風(fēng)分類診斷中的應(yīng)用.數(shù)理統(tǒng)計(jì)與管理, 2004, 23(5): 48~51.

篇6

好的體驗(yàn)

觸摸不是新鮮的概念,但是在iOS設(shè)備帶來(lái)大跨越之前,它沒(méi)有在與鍵盤加鼠標(biāo)的競(jìng)爭(zhēng)中占到便宜,觸摸板、電阻屏、單點(diǎn)觸摸都是其發(fā)展過(guò)程中所經(jīng)歷的步驟。Windows系統(tǒng)統(tǒng)治了30年的PC領(lǐng)域,“焦點(diǎn)”概念從面向?qū)ο蟮木幊汤砟铋_始滲透,多點(diǎn)概念一直被忽略,直到Windows 8的出現(xiàn),由多個(gè)手指(尖)所呈現(xiàn)的所謂手勢(shì),成為重要性與鼠標(biāo)指針等價(jià)的人機(jī)互動(dòng)信息。

電腦如何知道人的意圖?如果電腦知道,并且理解正確,還能及時(shí)反饋,那么對(duì)用戶來(lái)說(shuō)就是好的使用體驗(yàn)??此坪?jiǎn)單、說(shuō)起來(lái)容易的“好”,實(shí)現(xiàn)起來(lái)并不容易,這需要在電腦設(shè)計(jì)和制造的過(guò)程中,上至操作系統(tǒng)、驅(qū)動(dòng)程序,下至硬件調(diào)試和軟件開發(fā)等產(chǎn)業(yè)鏈的通力合作。精度、靈敏度、響應(yīng)速度、誤觸識(shí)別等幾項(xiàng)是考察觸摸技術(shù)的基本指標(biāo),而壓力識(shí)別、多指手勢(shì)、觸控兼容性則對(duì)觸摸技術(shù)提出了更多的挑戰(zhàn)。

精度差異

相對(duì)于顯示面積狹小的手機(jī)等智能終端,筆記本電腦上的觸摸屏硬件結(jié)構(gòu)限制較少,但是考慮到與屏幕面積、感應(yīng)網(wǎng)格密度線性相關(guān)的成本,目前大尺寸的觸摸屏定位的絕對(duì)精度仍遜色于手機(jī)。甚至在入門產(chǎn)品上,32×18的觸摸傳感器矩陣仍在使用,對(duì)14英寸、1366×768(點(diǎn)距0.225mm)分辨率的主流屏幕來(lái)說(shuō),剛剛能夠滿足微軟所規(guī)定的觸摸感應(yīng)區(qū)域9mm直徑的精度下限。而對(duì)主流產(chǎn)品來(lái)說(shuō),觸摸精度為30個(gè)像素的水平,折合觸摸響應(yīng)區(qū)域直徑也達(dá)到了6mm以上。

隨著觸摸屏幕參數(shù)規(guī)格的提升,用手指操作的體驗(yàn)仍舊能夠得到提升,本次CHIP選取的屏幕尺寸為11.6英寸的華碩VivoBook S200E就是其中的代表,該產(chǎn)品觸控芯片、傳感器網(wǎng)絡(luò)和驅(qū)動(dòng)程序,與主流華碩筆記本電腦相同,具有一定代表性。在測(cè)試中,S200E的觸摸屏表現(xiàn)出良好的靈敏度和精度,在使用2mm厚硬幣進(jìn)行測(cè)試的過(guò)程中,該機(jī)依舊保持了準(zhǔn)確的接觸位置識(shí)別能力,而主流機(jī)型需要使用厚度近5mm的硬幣方可實(shí)現(xiàn)定位識(shí)別。使用硬質(zhì)金屬材料在電容式觸摸屏上慢速劃動(dòng),所繪制的線條會(huì)呈現(xiàn)特有的抖動(dòng)現(xiàn)象,其中水平和垂直線條可保持筆直,而斜線條的抖動(dòng)距離與傳感器分布密度相關(guān)。S200E的每個(gè)抖動(dòng)波浪斜向距離約7mm,映射至水平及垂直方向約為5mm,即傳感器矩陣密度,由此推算其有效感應(yīng)區(qū)域直徑不大于2.5mm,精度兩倍于主流產(chǎn)品。

隨著硬幣滑動(dòng)速度提高,曾經(jīng)彎曲的線條逐漸變得平滑,靈敏度越高的屏幕線條從彎曲到平滑的速度越低,出現(xiàn)“斷線”情況的滑動(dòng)速度越高。在這個(gè)測(cè)試中,S200E的表現(xiàn)非常出色,使用手指滑動(dòng)從未出現(xiàn)過(guò)斷線現(xiàn)象。

改進(jìn)軟件

S200E觸摸屏采用了Atmel maXTouch Digitizer感應(yīng)芯片,除了硬件規(guī)格高之外,其驅(qū)動(dòng)程序還經(jīng)過(guò)特殊調(diào)教,提升了USB接口的默認(rèn)采樣速度,以及觸摸感應(yīng)的優(yōu)先級(jí)。因而它有著較其他產(chǎn)品更高的靈敏度就不足為奇了。除了常規(guī)的觸摸屏增強(qiáng)外,S200E對(duì)觸摸板特性也進(jìn)行了增強(qiáng)。Windows 8內(nèi)置的多點(diǎn)觸摸特性僅支持觸摸屏,而觸摸板的多點(diǎn)觸摸功能并未進(jìn)一步開發(fā)。利用華碩開發(fā)的ASUS Smart Gesture軟件,其觸摸板增加了1至3指的手勢(shì)操作和類似于觸摸屏的邊緣手勢(shì)操作功能,無(wú)論用戶習(xí)慣使用哪個(gè)觸控設(shè)備,都能獲得一致的使用體驗(yàn)。

手的表達(dá)

篇7

 

模式識(shí)別技術(shù)的應(yīng)用,使微電子封裝工藝得到迅猛的發(fā)展。如引線腳數(shù)逐年提高,平均每年増加16%,PGA的引線腳數(shù)己由300?400條増到1000條,QFP>400條,BGA>60條,引線節(jié)距逐年下降,己由2.54—1.27—0.65—0.5—0.4—0.3—0.15—0.1mm。

 

1基本概念

 

1.1模式識(shí)別技術(shù)

 

模式是對(duì)某些感興趣的客體的定量或結(jié)構(gòu)的描述,模式類是具有某些共同特性的模式的集合。模式識(shí)別就是用計(jì)算機(jī)來(lái)模擬和實(shí)現(xiàn)人的識(shí)別與理解功能(包括視覺(jué)信息與聽覺(jué)信息),依靠這種自動(dòng)技術(shù),機(jī)器將自動(dòng)地(或人盡量少地干涉)把待識(shí)別模式分配到各自的模式類中去。模式識(shí)別技術(shù)有統(tǒng)計(jì)模式識(shí)別(幾何方法),句法模式識(shí)別(結(jié)構(gòu)方法),模糊模式識(shí)別與智能模式識(shí)別。模式識(shí)別技術(shù)廣泛地應(yīng)用于軍事(目標(biāo)識(shí)別,定位),公安安全(指紋,聲紋,身份證實(shí)與識(shí)別),地質(zhì),石油,資源,農(nóng)業(yè),醫(yī)療衛(wèi)生與自動(dòng)化控制中,在微電子工業(yè)生產(chǎn)中己得到越來(lái)越廣泛的應(yīng)用。

 

1.2模式識(shí)別的系統(tǒng)結(jié)構(gòu)

 

模式識(shí)別的系統(tǒng)結(jié)構(gòu)如圖1所示,分為識(shí)別模式與訓(xùn)練模式兩部分。先設(shè)定訓(xùn)練模式,對(duì)訓(xùn)練樣本數(shù)據(jù)采集后把不同特征的非電量,如圖像、聲音、灰度等轉(zhuǎn)變?yōu)殡娦盘?hào),使計(jì)算機(jī)能夠辨識(shí)。后經(jīng)預(yù)處理可以濾除干擾、噪聲,再經(jīng)特征提取與選擇后進(jìn)入分類器,提供分類決策。在待識(shí)別模式中對(duì)待識(shí)別樣本同樣經(jīng)過(guò)數(shù)據(jù)采集、預(yù)處理、特征提取與選擇后,從訓(xùn)練模式中的分類器中提取分類決策,得到識(shí)別結(jié)果。若分類器不能提供目前的分類決策,則得到錯(cuò)誤檢測(cè),需要更新訓(xùn)練模式,直到重新獲得正確的分類決策。

 

其中最重要的一個(gè)環(huán)節(jié)就是特征(基元)的提取與選擇。這是一個(gè)去粗取精,由量測(cè)空間經(jīng)過(guò)變換降維到特征空間的過(guò)程。具體到微電子封裝工藝中,就是識(shí)別元件的圖案并確定切割線、粘取點(diǎn)與焊接點(diǎn)等的過(guò)程。

 

2模式識(shí)別技術(shù)在微電子封裝工藝中的應(yīng)用

 

2.1SOT—23塑封工藝的流程及模板匹配法

 

SOT—23工藝是一種二極管、三極管或其他元器件表面貼片塑封工藝。其工藝流程如圖2所示。

 

其中前幾道工序,如劃片、粘片與焊線對(duì)整個(gè)流程的質(zhì)量與產(chǎn)量影響很大,而其中所依賴的關(guān)鍵技術(shù)就是模式識(shí)別技術(shù)。在自動(dòng)化日益發(fā)展的今天,任何形式的模式識(shí)別技術(shù)與人工智能,都能使生產(chǎn)力更上一個(gè)新的臺(tái)階,實(shí)際上,我們剖析開來(lái),在整套貌似先進(jìn)的SOT—23生產(chǎn)線的工藝過(guò)程中,采用的都是比較原始、比較基本的模板匹配法。

 

模板匹配法基本上是一種統(tǒng)計(jì)識(shí)別方法,就是定義一個(gè)標(biāo)準(zhǔn)樣本作為模板,輸入待識(shí)別模式與之比較,也就是看兩者是否匹配在一定的誤差范圍內(nèi)判斷結(jié)果。因?yàn)槊恳荒0迮c未知樣品匹配得好壞,取決于模板上各單元與樣品上各相應(yīng)單元的匹配與否,若分別處于模板與樣品上的絕大多數(shù)單元均相匹配,則稱該模板與樣品“匹配得好”,反之則稱“匹配不好”,并取匹配最好的作為識(shí)別結(jié)果。采用比較多的有光學(xué)模板匹配、模擬灰度和數(shù)字灰度。SOT—23工藝中采用的就是這種灰度匹配法,提取圖像的灰度作為特征基元來(lái)作匹配。

 

2.2劃片工序中的模式識(shí)別技術(shù)

 

由于生產(chǎn)的線寬微細(xì)化(0.5?0.25/mm,開發(fā)水平0.18?0.07/mm),并且每四年縮小1/2,為保證數(shù)以萬(wàn)計(jì)的芯片得到正確、無(wú)偏離、無(wú)損傷的切割,就需要高標(biāo)準(zhǔn)的采用模式識(shí)別技術(shù)的劃片機(jī)。劃片工序的流程如圖3所示。

 

此工序中,關(guān)鍵是預(yù)先對(duì)灰度與芯片和間隔寬度的調(diào)整與設(shè)置,即劃片機(jī)的核心技術(shù)就是運(yùn)用模式識(shí)別中對(duì)灰度特征基元的提取與識(shí)別,達(dá)到自動(dòng)識(shí)別的目的。一般采用手工與自動(dòng)配置相結(jié)合的方法,隔一定的時(shí)間進(jìn)行人工檢查以免意外損傷。即使是劃片機(jī)的一些枝節(jié)技術(shù)也離不開模式識(shí)別技術(shù),如對(duì)芯片字符、碼確認(rèn)的字符識(shí)別裝置,就是對(duì)最典型最通用的模板識(shí)別技術(shù)的應(yīng)用。

 

2.3粘片工序中的模式識(shí)別技術(shù)

 

粘片工序在SOT—23工藝流程中尤為重要,是承前啟后的關(guān)鍵工序,因?yàn)檎称某晒?shù)量決定了產(chǎn)品的產(chǎn)量,粘片的質(zhì)量直接影響焊線工序的質(zhì)量,所以粘片工序要解決的問(wèn)題就是把歪粘、錯(cuò)粘、漏粘數(shù)目降到最低水平。由于芯片生產(chǎn)的差異,使不同的廠家的產(chǎn)品在圖案灰度與邊緣界定上都有很大的差異,所以提高模式識(shí)別的能力更為必要。粘片工序的流程如圖4所示。

 

選好標(biāo)準(zhǔn)圖案后存儲(chǔ)到系統(tǒng)中,存儲(chǔ)圖案灰度就是提取一個(gè)特征,其中包括了芯片的大小尺寸和灰度等特征,以此作為模式識(shí)別的一個(gè)標(biāo)準(zhǔn)模板《,在粘取一個(gè)目標(biāo)與模板比較中,就要處理歪斜、灰度過(guò)低等現(xiàn)象。設(shè)一個(gè)待識(shí)別目標(biāo)的某項(xiàng)指標(biāo)為石,則內(nèi)-乃|<(/=1,2,3..,為對(duì)應(yīng)此項(xiàng)的閾值)時(shí)可以判斷此

 

項(xiàng)指標(biāo)在所限制的閾值范圍內(nèi),符合(或基本符合)決策要求。如果各項(xiàng)指標(biāo)都在其限定的閾值范圍內(nèi),可以判定此目標(biāo)與標(biāo)準(zhǔn)模板匹配,即各項(xiàng)指標(biāo)的總和使機(jī)器判斷是丟棄或粘取此目標(biāo)。

 

粘片工序中,在注意熔化溫度的同時(shí),隨時(shí)調(diào)整標(biāo)準(zhǔn)模板與選擇適當(dāng)?shù)幕叶纫灿葹橹匾?/p>

 

2.4焊線工序中的模式識(shí)別技術(shù)

 

用焊線機(jī)把芯片的極點(diǎn)與引線框架焊接起來(lái),引出管腿。由于芯片極點(diǎn)區(qū)域窄小,必須保證焊點(diǎn)在極點(diǎn)區(qū)域內(nèi)部,不能有一絲的越出極點(diǎn)邊界和拉絲現(xiàn)象,否則,極點(diǎn)間就會(huì)短路。與粘片機(jī)相比,焊線機(jī)必須具有更強(qiáng)的識(shí)別能力,并且在一個(gè)芯片上面有不同的極點(diǎn),識(shí)別的區(qū)域更為多樣和細(xì)微。

 

焊線工序的識(shí)別過(guò)程類似于粘片工序。

 

對(duì)于小尺度芯片,除了正確地把握金線的熔化溫度和焊點(diǎn)大小外,對(duì)焊點(diǎn)區(qū)域識(shí)別的精確把握也是焊線成品質(zhì)量提高的重要一環(huán),如果對(duì)標(biāo)準(zhǔn)模板灰度和坐標(biāo)位置選擇不當(dāng),就會(huì)導(dǎo)致大量半成品的浪費(fèi)。

 

同時(shí),焊線工序?qū)φ称ば蛴泻艽蟮囊蕾囆?,如果粘片工序中的漏、歪片和熔化過(guò)度片很多,自動(dòng)匹配就無(wú)法進(jìn)行。若設(shè)置為忽略不能匹配的芯片,勢(shì)必造成很大的浪費(fèi);若用手工單個(gè)焊接不能匹配的芯片,會(huì)影響流水線的進(jìn)程。因此,粘片機(jī)與焊線機(jī)在某些參數(shù)的設(shè)置上必須協(xié)調(diào)統(tǒng)一。

 

3結(jié)束語(yǔ)

 

模式識(shí)別技術(shù)在微電子封裝工藝中得到了廣泛的應(yīng)用,在更為復(fù)雜的封裝工藝中,幾乎每一個(gè)自動(dòng)化進(jìn)程都與模式識(shí)別技術(shù)相結(jié)合。模式識(shí)別技術(shù)的應(yīng)用對(duì)于提高半導(dǎo)體分立元器件和集成電路的產(chǎn)量與質(zhì)量,提高集成化和智能化進(jìn)程具有重大的意義。

 

參考文獻(xiàn):

 

[1]沈青,湯霖.模式識(shí)別導(dǎo)論[M].長(zhǎng)沙:國(guó)防科技大學(xué)出版社,1991.

 

[2]李介谷,蔡國(guó)廉.計(jì)算機(jī)模式識(shí)別技術(shù)[M].上海:上海交通大學(xué)出版社,1986.

篇8

關(guān)鍵詞:仿生;模式識(shí)別;神經(jīng)網(wǎng)絡(luò);分類器

中圖分類號(hào): F224-39 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1673-1069(2017)02-154-2

1 仿生模式識(shí)別的引入

為了適應(yīng)現(xiàn)實(shí)需要,人們開始希望機(jī)器能夠代替人類完成某些繁重的識(shí)別工作。我們通常所說(shuō)的模式識(shí)別就是指運(yùn)用機(jī)器進(jìn)行分類識(shí)別。以往的識(shí)別方法,多數(shù)是建立在“分類劃分”的基礎(chǔ)上,根據(jù)給定的分類準(zhǔn)則來(lái)找尋“最優(yōu)的分類界面”,具體的實(shí)現(xiàn)算法也都是注重于不同類樣本的區(qū)別,即,一類樣本與有限種類已知樣本之間的區(qū)分?;诖顺霭l(fā)點(diǎn)的局限性,識(shí)別當(dāng)中出現(xiàn)的問(wèn)題是顯而易見(jiàn)的:首先,如果遇見(jiàn)未學(xué)習(xí)過(guò)的新事物,常常會(huì)牽強(qiáng)地認(rèn)為它是某一類已學(xué)過(guò)的舊事物;其次是對(duì)未學(xué)習(xí)過(guò)的新事物進(jìn)行學(xué)習(xí)時(shí),往往會(huì)破壞掉原來(lái)的規(guī)矩,打亂舊事物的識(shí)別。針對(duì)以上的缺陷,才有了仿生模式識(shí)別的概念。仿生模式的目標(biāo)是找到同類事物的最佳覆蓋面。

2 仿生模式識(shí)別在神經(jīng)網(wǎng)絡(luò)中的超曲面劃分

2.1 多權(quán)值神經(jīng)網(wǎng)絡(luò)的高維封閉曲面

(5)式中Wji和W′ji是方向權(quán)值,它們決定了曲面的方向,W′ji是核心權(quán)值,它決定了曲面的幾何中心。Xj為第j個(gè)輸入端的輸入;n是輸入空間維數(shù);p為冪參數(shù),用以控制曲面的彎曲程度;s表示單項(xiàng)正負(fù)號(hào)方法的參數(shù),若S=0單項(xiàng)符號(hào)只能為正,若S=1時(shí)單項(xiàng)的符號(hào)和Wji的符號(hào)相同;若設(shè)置了S=0,則該式就變成了一個(gè)封閉超曲面的神經(jīng)元。f函數(shù)的基設(shè)置為一個(gè)定值時(shí),輸入點(diǎn)的軌跡是一個(gè)封閉的超曲面,其核心位置由決定。

用p值來(lái)改變封閉超曲面的形狀,如圖1~圖8所示。若使權(quán)值取不同的值,就相當(dāng)于將封閉曲面在不同方向進(jìn)行拉伸或壓縮,θ取值不同,則偏離核心位置的程度也不同。

2.2 通用超曲面神經(jīng)網(wǎng)絡(luò)的計(jì)算式

上式中,Ymi(t+1)是輸入空間的第i個(gè)神經(jīng)元在輸入第m個(gè)對(duì)象,在t+1時(shí)間的輸出狀態(tài)值。i是神經(jīng)元數(shù)量,最大是1024。Wji與W′ji是第j個(gè)輸入節(jié)點(diǎn)至第i個(gè)神經(jīng)元的“方向”權(quán)值和“核心”權(quán)值;fki是第i個(gè)神經(jīng)元的輸出非線性函數(shù),下標(biāo)ki是第i個(gè)神經(jīng)元的非線性函數(shù)在函數(shù)庫(kù)中的序號(hào);Imj表示的是第m個(gè)輸入對(duì)象中的第j個(gè)輸入值;W′cgi和是Wcgi第cg個(gè)(取值范圍[1,256])神經(jīng)元輸出到第i個(gè)(取值范圍[1,1024])神經(jīng)元的權(quán)值“核心”和“方向”權(quán)值;p表示的是冪參數(shù);而S是單項(xiàng)正負(fù)符號(hào)規(guī)則;(t)為當(dāng)輸入為第m個(gè)對(duì)象時(shí)第cg個(gè)神經(jīng)元在時(shí)間t的輸出狀態(tài)值,θ([1,1024])是第i個(gè)神經(jīng)元的閾值;λi是神經(jīng)元非線性函數(shù)坐標(biāo)比例因子;Ci是神經(jīng)元輸入規(guī)模比例因子。

由傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)和經(jīng)向基RBF神經(jīng)網(wǎng)絡(luò)及超曲面神經(jīng)網(wǎng)絡(luò)對(duì)圖9中三類事物的分類邊界分別為折線和圓環(huán)及橢圓的并,可見(jiàn)超曲面神經(jīng)網(wǎng)絡(luò)具有更準(zhǔn)確的分類效果。

3 總結(jié)

仿生模式識(shí)別是對(duì)事物逐類分別訓(xùn)練“認(rèn)識(shí)”的過(guò)程。它的顯著優(yōu)點(diǎn)是對(duì)于沒(méi)有經(jīng)過(guò)訓(xùn)練的對(duì)象會(huì)拒識(shí),而新增加樣本的訓(xùn)練不會(huì)影響到原有的識(shí)別。因此,仿生模式識(shí)別,較之原有的識(shí)別模式識(shí)別效果更佳,可以廣泛應(yīng)用在人臉識(shí)別,語(yǔ)音識(shí)別等眾多領(lǐng)域。

參 考 文 獻(xiàn)

[1] 覃鴻,王守覺(jué).多權(quán)值神經(jīng)元網(wǎng)絡(luò)仿生模式識(shí)別方法在低訓(xùn)練樣本數(shù)量非特定人語(yǔ)音識(shí)別中與HMM及DTW的比較研究[J].電子學(xué)報(bào),2005(5).

篇9

關(guān)鍵詞:動(dòng)作捕捉技術(shù);三維人體動(dòng)作;智能舞蹈教學(xué);運(yùn)用

中圖分類號(hào):G642 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1007-0125(2013)11-0247-01

一、動(dòng)作捕捉技術(shù)

動(dòng)作捕捉(Motion capture)技術(shù)所涉及的內(nèi)容較為廣泛,主要包含有尺寸的測(cè)量、物理空間內(nèi)的物體定位以及方位的測(cè)定等。就其技術(shù)角度而言,運(yùn)動(dòng)捕捉的實(shí)質(zhì)就是對(duì)物體在三維空間之中的運(yùn)動(dòng)軌跡進(jìn)行一定程度的測(cè)量、跟蹤以及記錄。一般情況下,具有典型性的運(yùn)動(dòng)捕捉設(shè)備主要包含了四個(gè)組件,分別是傳感器、信號(hào)捕捉設(shè)備、數(shù)據(jù)傳輸設(shè)備以及數(shù)據(jù)處理設(shè)備。下面就這四個(gè)組件進(jìn)行簡(jiǎn)要闡述:

(一)傳感器:傳感器就是一種跟蹤裝置,一般情況下,它是被設(shè)置在運(yùn)動(dòng)物體的關(guān)鍵位置,其功能主要是對(duì)運(yùn)動(dòng)物體的運(yùn)動(dòng)位置信息進(jìn)行提供;

(二)信號(hào)捕捉設(shè)備:一般情況下,如果動(dòng)作捕捉系統(tǒng)具有一定的差異性,那么信號(hào)捕捉設(shè)備也會(huì)有多不同,其主要功能是對(duì)傳感器所提供的位置信號(hào)進(jìn)行有效捕捉;

(三)數(shù)據(jù)傳輸設(shè)備:對(duì)于動(dòng)作捕捉系統(tǒng)而言,它需要將大量的運(yùn)動(dòng)數(shù)據(jù)從數(shù)據(jù)捕捉設(shè)備傳輸?shù)接?jì)算機(jī)系統(tǒng)之中進(jìn)行處理,同時(shí),這一過(guò)程還需要保證傳輸?shù)臏?zhǔn)確性與高效性,數(shù)據(jù)傳輸設(shè)備便是負(fù)責(zé)這項(xiàng)工作的設(shè)備;

(四)數(shù)據(jù)處理設(shè)備:一般情況下,當(dāng)捕捉到相關(guān)的數(shù)據(jù)之后需要進(jìn)行一定程度上的修正與處理,在這項(xiàng)工作完成之后,還需要將其余三位模型向進(jìn)行有效的結(jié)合,這樣才能完成接下來(lái)的操作。

二、三維人體動(dòng)作的識(shí)別

一般情況下,三維人體動(dòng)作的識(shí)別主要包含了三種模式,分別為已分割的動(dòng)作模式識(shí)別、連續(xù)的動(dòng)作模式識(shí)別以及實(shí)時(shí)動(dòng)作數(shù)據(jù)流識(shí)別。

(一)已分割的動(dòng)作模式識(shí)別:它首先進(jìn)行一個(gè)假設(shè),即每一個(gè)動(dòng)作樣本都是事先由人工或者運(yùn)動(dòng)機(jī)器方法進(jìn)行分割,同時(shí),它僅僅只包含有一個(gè)動(dòng)作模式。因此,對(duì)于已分割的動(dòng)作模式識(shí)別就是要對(duì)各個(gè)未知的動(dòng)作模式進(jìn)行一定程度上的分類,使其歸類到已經(jīng)定義的動(dòng)作類別當(dāng)中去。

(二)連續(xù)的動(dòng)作模式識(shí)別:對(duì)于未知的數(shù)據(jù)動(dòng)作而言,它一般都包含了多個(gè)動(dòng)作模式,除此之外,這些動(dòng)作模式的類型以及首尾幀都是未知的。所以,對(duì)于連續(xù)的動(dòng)作模式識(shí)別,不能像已分割動(dòng)作模式的識(shí)別一樣,僅僅對(duì)未知?jiǎng)幼髦苯油?xùn)練數(shù)據(jù)進(jìn)行匹配識(shí)別。相反,連續(xù)的動(dòng)作模式識(shí)別應(yīng)該先對(duì)未知?jiǎng)幼鬟M(jìn)行一定程度上的自動(dòng)分割,并使其成為獨(dú)立的動(dòng)作模式,然后再對(duì)其進(jìn)行一定程度的識(shí)別。

(三)實(shí)時(shí)動(dòng)作數(shù)據(jù)流識(shí)別:這一模式的數(shù)據(jù)識(shí)別最為復(fù)雜,一般情況下,它是發(fā)生在實(shí)際的實(shí)時(shí)應(yīng)用當(dāng)中。對(duì)于實(shí)時(shí)動(dòng)作數(shù)據(jù)流的識(shí)別之所以如此復(fù)雜,主要是以為內(nèi)其待識(shí)別的數(shù)據(jù)流都是通過(guò)現(xiàn)場(chǎng)捕捉而得到的,除此之外,他還要求能夠在捕捉的同時(shí)進(jìn)行一定程度上的識(shí)別處理,這樣一來(lái),識(shí)別系統(tǒng)就能夠以處理結(jié)果為依據(jù),對(duì)用戶的輸入動(dòng)作進(jìn)行及時(shí)的反應(yīng)。

三、三維人體動(dòng)作在智能舞蹈教學(xué)中的運(yùn)用

對(duì)于動(dòng)作捕捉數(shù)據(jù)而言,它可以對(duì)先后動(dòng)作進(jìn)行一定程度上的比較,然后再再將比較所得到的信息進(jìn)行相應(yīng)的反饋。針對(duì)這一情況,本文介紹一種智能舞蹈教學(xué)系統(tǒng),這一系統(tǒng)主要是由C++編程語(yǔ)言以及OpenGL軟件包共同實(shí)現(xiàn),在對(duì)這一系統(tǒng)進(jìn)行使用時(shí),有兩種模式可以供用戶選擇,這兩種模式分別為訓(xùn)練模式以及舞蹈模式。

訓(xùn)練模式:訓(xùn)練模式主要是供用戶進(jìn)行自主學(xué)習(xí)。首先系統(tǒng)對(duì)相關(guān)動(dòng)作進(jìn)行一定程度上的捕捉,然后系統(tǒng)根據(jù)所捕捉到的動(dòng)作進(jìn)行處理,使其以三維動(dòng)畫的形式向用戶進(jìn)行呈現(xiàn),用戶就可以根據(jù)系統(tǒng)所提供的三維動(dòng)畫進(jìn)行自主學(xué)習(xí)。

舞蹈模式:舞蹈模式全稱為自由舞蹈模式。在這一模式之下,用戶可以在一定的時(shí)間內(nèi)進(jìn)行自由舞蹈,在用戶舞蹈的同時(shí),系統(tǒng)也會(huì)對(duì)其動(dòng)作進(jìn)行實(shí)時(shí)捕捉,然后將捕捉到的信息由識(shí)別引擎進(jìn)行識(shí)別,這樣一來(lái),不僅提高了這一系統(tǒng)的有效性,同時(shí)也增添了一些樂(lè)趣。

四、結(jié)束語(yǔ)

隨著動(dòng)作捕捉技術(shù)與三位人體動(dòng)作識(shí)別技術(shù)的發(fā)展,使得它們?cè)谠絹?lái)越多的領(lǐng)域中得到廣泛使用。本文主要針對(duì)三維人體動(dòng)作及其在智能舞蹈教學(xué)中的運(yùn)用進(jìn)行研究與分析,希望我們的研究能夠給讀者提供參考并帶來(lái)幫助。

參考文獻(xiàn):

[1] 楊洋.三維人體動(dòng)作分析及其在智能舞蹈教學(xué)系統(tǒng)中的

應(yīng)用[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2012.

[2] 孫運(yùn)達(dá).多視點(diǎn)非接觸式人體運(yùn)動(dòng)捕捉的研究[D].北京:

北京交通大學(xué),2006.

篇10

設(shè)計(jì)模式識(shí)別是對(duì)程序源代碼信息進(jìn)行分析,抽取出其中所運(yùn)用的設(shè)計(jì)模式,是軟件逆向工程的一部分。因此,設(shè)計(jì)模式識(shí)別的對(duì)象一般為面向?qū)ο蟪绦蛳到y(tǒng)的源代碼信息。本文以Java源代碼為設(shè)計(jì)模式識(shí)別目標(biāo),結(jié)合Java語(yǔ)言的特點(diǎn)進(jìn)行源代碼信息的抽取。

1.1源代碼信息抽取

根據(jù)DPDLXS語(yǔ)言的定義規(guī)則,將設(shè)計(jì)模式的特征信息描述為類角色Roles、類之間關(guān)系Relations和自定義類型TypeRep3個(gè)部分。源代碼信息的抽取也遵循DPDLXS語(yǔ)言的定義規(guī)則,解析為類角色Roles和類之間關(guān)系Relations。其中,一個(gè)類角色Roles又分為類屬性Attribute和類操作Operation子元素以及各自的屬性。根據(jù)Java語(yǔ)言的特點(diǎn)和設(shè)計(jì)模式描述語(yǔ)言DPDLXS的定義規(guī)則,給出了源代碼信息抽取流程,如圖1所示。

1.2類無(wú)向圖和連通分量

對(duì)源代碼進(jìn)行設(shè)計(jì)模式的識(shí)別往往都是以一個(gè)工程或一個(gè)面向?qū)ο蟪绦蛳到y(tǒng)為一個(gè)整體進(jìn)行分析,其中包含了數(shù)量龐大的類文件。然而,一個(gè)設(shè)計(jì)模式所參與的類角色只有3-5個(gè)左右,為了匹配一個(gè)設(shè)計(jì)模式的特征而去遍歷整個(gè)工程的類文件顯然是不可取的。根據(jù)設(shè)計(jì)模式的結(jié)構(gòu)特征,構(gòu)成一個(gè)設(shè)計(jì)模式的每個(gè)角色類至少與其他角色類存在一種關(guān)系,包括一般化關(guān)系(Generation)、關(guān)聯(lián)關(guān)系(Association)、聚合關(guān)系(Aggrega-tion)、合成關(guān)系(Composition)和依賴關(guān)系(Dependency)。從圖論的角度上來(lái)說(shuō),如果把每一個(gè)類角色看成是一個(gè)頂點(diǎn)(Vertex),類角色之間的任何一種關(guān)系看成是兩個(gè)頂點(diǎn)之間的一條邊(Edge),整個(gè)設(shè)計(jì)模式類圖就可以看成是一個(gè)無(wú)向圖,而且是一個(gè)任意兩個(gè)頂點(diǎn)都連通的連通圖(ConnectedGraph)[11]。同理,待識(shí)別的整個(gè)工程的源代碼類圖就可以看成是一個(gè)龐大的無(wú)向圖,如圖2所示;無(wú)向圖中的每一個(gè)極大連通子圖都是一個(gè)連通分量(ConnectedComponent)[11],如圖3所示。因此,匹配的某一設(shè)計(jì)模式特征的待識(shí)別類候選集合一定是該工程無(wú)向圖中一個(gè)頂點(diǎn)數(shù)目大于等于設(shè)計(jì)模式角色類數(shù)目的連通分量。2.3關(guān)聯(lián)度通過(guò)引用圖論中無(wú)向圖和連通分量的概念,將設(shè)計(jì)模式的識(shí)別從源代碼中匹配特定設(shè)計(jì)模式特征轉(zhuǎn)化成在無(wú)向圖中查找滿足頂點(diǎn)數(shù)目的連通分量。通過(guò)過(guò)濾不滿足該設(shè)計(jì)模式角色類數(shù)目的連通分量可以減小候選集合,從而減小搜索空間,提高識(shí)別效率。然而,在信息抽取的初級(jí)階段并不知道待識(shí)別工程源代碼無(wú)向圖的連通分量。為了方便遍歷無(wú)向圖從而得到該無(wú)向圖的連通分量,本文將待識(shí)別源代碼的無(wú)向圖表示成一種鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)———鄰接表[11]。本文根據(jù)從源代碼信息中抽取出的類之間關(guān)系信息來(lái)構(gòu)建無(wú)向圖,得到無(wú)向圖的頂點(diǎn)集合V和代表類之間關(guān)系的邊集合VR。將集合V中的每一個(gè)頂點(diǎn)都表示成一個(gè)頭結(jié)點(diǎn),如圖4(a)所示;根據(jù)集合VR中頂點(diǎn)之間的關(guān)系構(gòu)建該頭結(jié)點(diǎn)包含的表結(jié)點(diǎn),如圖4(b)所示,從而得到圖2中無(wú)向圖對(duì)應(yīng)的鄰接表,如圖5所示。運(yùn)用鄰接表這種鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu),從第一個(gè)頭結(jié)點(diǎn)開始遍歷可以得到無(wú)向圖的所有連通分量。無(wú)向圖連通分量的具體深度遍歷算法如下:Step1遍歷頭結(jié)點(diǎn),設(shè)置該頭結(jié)點(diǎn)的visited為true;若該頭結(jié)點(diǎn)的鏈域?yàn)榭斩沂堑谝粋€(gè)頭結(jié)點(diǎn),則結(jié)束;若不是第一個(gè)頭結(jié)點(diǎn)則返回上一層表結(jié)點(diǎn),跳到Step4;若鏈域不為空則繼續(xù)下一步。Step2遍歷鏈域所指向的表結(jié)點(diǎn),根據(jù)表結(jié)點(diǎn)的鄰接點(diǎn)域找到下一個(gè)頭結(jié)點(diǎn)。Step3若該頭結(jié)點(diǎn)的visited為true,則返回上一層表結(jié)點(diǎn),跳到Step4;否則跳到Step1。Step4遍歷表結(jié)點(diǎn)的鏈域,若鏈域不為空則跳到Step2;若鏈域?yàn)榭眨瑒t返回上一層表結(jié)點(diǎn)并判斷是否存在上一層,若存在則跳到Step4;否則結(jié)束。該算法一次遍歷結(jié)束后,所有遍歷到的頂點(diǎn)集合就是一個(gè)連通分量。然后尋找下一個(gè)visited為false的頭結(jié)點(diǎn)作為第一個(gè)結(jié)點(diǎn)繼續(xù)遍歷,直到遍歷完所有頭結(jié)點(diǎn)。利用該算法對(duì)圖5所示鄰接表進(jìn)行遍歷可以得到兩個(gè)連通分量,其頂點(diǎn)集合分別為:S1{A,C,B,E}和S2{D}。每一次遍歷都可以得到一個(gè)連通分量,每個(gè)連通分量都是待識(shí)別源代碼類圖中至少與其他類存在一個(gè)關(guān)系的所有類集合。該集合中的類彼此之間存在著可能構(gòu)成某種設(shè)計(jì)模式的類關(guān)系。因此,本文提出用關(guān)聯(lián)度(Correlation)的概念來(lái)衡量和唯一標(biāo)識(shí)待識(shí)別源代碼之間的這種聯(lián)系。每一個(gè)關(guān)聯(lián)度值標(biāo)識(shí)了一個(gè)連通分量,連通分量中的各個(gè)類擁有相同的關(guān)聯(lián)度值,其集合稱為關(guān)聯(lián)類集合。

2設(shè)計(jì)模式識(shí)別

在完成源代碼信息抽?。ò愋畔?、類的屬性和操作,特別是根據(jù)類之間的關(guān)系構(gòu)建了關(guān)聯(lián)類集合)之后,需要根據(jù)具體設(shè)計(jì)模式特征來(lái)檢測(cè)和識(shí)別源代碼中運(yùn)用的設(shè)計(jì)模式。

2.1設(shè)計(jì)模式識(shí)別流程

為了減小設(shè)計(jì)模式識(shí)別的搜索空間,本文在源代碼信息抽取階段將待識(shí)別源代碼類組合成一個(gè)個(gè)關(guān)聯(lián)類集合。根據(jù)設(shè)計(jì)模式角色類之間的關(guān)系特征可以得出:只有同一個(gè)關(guān)聯(lián)類集合中存在該設(shè)計(jì)模式的所有角色類,并且關(guān)聯(lián)類之間符合對(duì)應(yīng)角色類之間的所有關(guān)系特征,才能判定關(guān)聯(lián)類集合運(yùn)用該設(shè)計(jì)模式。因此,首先可以根據(jù)設(shè)計(jì)模式角色類數(shù)目過(guò)濾類數(shù)目不足的關(guān)聯(lián)類集合;其次可以根據(jù)設(shè)計(jì)模式所蘊(yùn)含的角色類之間的關(guān)系特征過(guò)濾不滿足類之間關(guān)系類型和關(guān)系數(shù)目的集合;最后根據(jù)設(shè)計(jì)模式的具體特征約束遍歷滿足條件的候選關(guān)聯(lián)類集合,得出最終的識(shí)別結(jié)果。具體的識(shí)別流程如圖6所示。

2.2基于關(guān)聯(lián)度和特征約束的設(shè)計(jì)模式識(shí)別算法

根據(jù)本文提出的源代碼類角色信息間關(guān)聯(lián)度的概念以及設(shè)計(jì)模式識(shí)別的流程,充分利用關(guān)聯(lián)類集合和設(shè)計(jì)模式特征約束來(lái)減小設(shè)計(jì)模式識(shí)別的搜索空間,可以得出基于關(guān)聯(lián)度和特征約束的設(shè)計(jì)模式識(shí)別算法DETECT_DESIGNPA=TTERNS,具體描述如算法1所示。

3結(jié)果和分析

根據(jù)所提出的源代碼信息抽取流程以及基于關(guān)聯(lián)度和特征約束的設(shè)計(jì)模式識(shí)別算法,本文對(duì)Junit、JHotDraw和Jrefactory3個(gè)開源應(yīng)用程序進(jìn)行信息抽取和部分設(shè)計(jì)模式的識(shí)別。

3.1工廠方法模式

基于提出的源代碼信息抽取流程(見(jiàn)圖1),本文從源代碼文件數(shù)目、類、屬性、方法和類之間的關(guān)系數(shù)目以及源代碼行數(shù)等方面對(duì)3個(gè)開源應(yīng)用程序源代碼進(jìn)行信息抽取。其抽取結(jié)果如表1所列。從表1的抽取結(jié)果可以看出,這3個(gè)開源應(yīng)用程序在文件數(shù)目以及代碼復(fù)雜性等方面各不相同。類之間存在的關(guān)系越多,體現(xiàn)了源代碼結(jié)構(gòu)復(fù)雜度越高,同時(shí)也意味著可能運(yùn)用了更多的設(shè)計(jì)模式。

3.2設(shè)計(jì)模式識(shí)別結(jié)果