計算機視覺的展望范文
時間:2024-01-04 17:47:19
導(dǎo)語:如何才能寫好一篇計算機視覺的展望,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞:計算機視覺技術(shù);食品工業(yè);分級;圖像處理
中圖分類號: TS207 文獻標識碼:A
隨著微型個人計算機應(yīng)用的越來越廣泛,以及計算機在綜合學(xué)科中應(yīng)用的深入研究,現(xiàn)如今在工農(nóng)業(yè)、軍事國防、醫(yī)學(xué)衛(wèi)生等眾多領(lǐng)域的使用和研究方面計算機視覺技術(shù)都起到了至關(guān)重要的作用,為了節(jié)省人力、降低成本、減少誤差,該項技術(shù)在食品企業(yè)、科研院所、檢測機構(gòu)中的應(yīng)用更加普遍。如今,在農(nóng)產(chǎn)品藥物殘留檢測、水果重量分級、等級篩選、質(zhì)量監(jiān)管等方面計算機視覺技術(shù)有眾多應(yīng)用。
1 計算機視覺技術(shù)概述
計算機視覺技術(shù)是利用計算機、攝像機、圖像卡以及相關(guān)處理技術(shù)來模擬人的視覺,用以識別、感知和認識我們生活的世界[1]。該技術(shù)是模擬識別人工智能、心理物理學(xué)、圖像處理、計算機科學(xué)及神經(jīng)生物學(xué)等多領(lǐng)域的綜合學(xué)科。計算機視覺技術(shù)用攝像機模擬人眼,用計算機模擬大腦,用計算機程序和算法來模擬人對事物的認識和思考,替代人類完成程序為其設(shè)定的工作。該技術(shù)由多個相關(guān)的圖像處理系統(tǒng)組成,主要包括光源提供系統(tǒng)、圖像提取系統(tǒng)、計算機數(shù)據(jù)運算系統(tǒng)等。原理是:首先通過攝像機獲得所需要的圖像信息,然后利用信號轉(zhuǎn)換將獲得的圖像信息轉(zhuǎn)變?yōu)閿?shù)字圖像以便計算機正確識別[2]。隨著科學(xué)技術(shù)的發(fā)展,計算機技術(shù)在各個領(lǐng)域得到廣泛應(yīng)用,計算機視覺技術(shù)不僅在代替人類視覺上取得了重大成就,而且在很多具體工作方便超越了人的視覺功能。計算機視覺計算有如此快速的發(fā)展,是因為與人類的視覺相比該技術(shù)具有以下顯著優(yōu)勢[3]。
1.1 自動化程度高
計算機視覺可以實現(xiàn)對農(nóng)產(chǎn)品的多個外形和內(nèi)在品質(zhì)指標進行同時檢測分析,可以進行整體識別、增強對目標識別的準確性。
1.2 實現(xiàn)無損檢測
由于計算機視覺技術(shù)對農(nóng)產(chǎn)品的識別是通過掃描、攝像,而不需要直接接觸,可以減少對所檢測食品的傷害。
1.3 穩(wěn)定的檢測精度
設(shè)計的運行程序確定后,計算機視覺技術(shù)的識別功能就會具有統(tǒng)一的識別標準,具有穩(wěn)定的檢測精度,避免了人工識別和檢測時主觀因素所造成的差異。
2 計算機視覺技術(shù)在食品檢測中的應(yīng)用
20世紀70年代初,學(xué)者開始研究計算機視覺技術(shù)在食品工業(yè)中的應(yīng)用,近幾十年電子技術(shù)得到快速發(fā)展,計算機視覺技術(shù)也越來越成熟。國內(nèi)外學(xué)者在研究計算機視覺技術(shù)在食品工業(yè)中的應(yīng)用方面主要集中在該技術(shù)對果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識別、內(nèi)部無損檢測等方面。國內(nèi)有關(guān)計算機視覺技術(shù)在食品業(yè)中的應(yīng)用研究起始于90年代,比國外發(fā)達國家晚多達20a,但是發(fā)展很快。
2.1 計算機視覺技術(shù)在果蔬分級中的應(yīng)用研究
計算機視覺技術(shù)在食品檢測中的應(yīng)用研究相當(dāng)廣泛,從外部直徑、成熟度的檢測到內(nèi)部腐爛程度的檢測都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計算機算法計算水果的半徑,進而得出果蔬的最大直徑。研究表明,該算法不僅降低了計算量而且提高了計算精度,此方法用于水果分級的誤差不超過2mm,高于國際水果分級標準所規(guī)定的5mm分類標準差,可在工業(yè)生產(chǎn)中很好應(yīng)用。李慶中[5]也利用圖像的缺陷分割算法研究了計算機視覺技術(shù)在蘋果檢測與分級中的應(yīng)用,結(jié)果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎(chǔ),結(jié)合模糊聚類知識利用計算機視覺技術(shù)來檢測蘋果缺陷域,檢測不僅快速而且結(jié)果精確。劉禾等[7]通過研究認為蘋果的表面缺陷可以利用計算機視覺技術(shù)進行檢測,計算機視覺技術(shù)還可以將蘋果按照檢測結(jié)果進行分級,把檢測過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級的重要特征之一,應(yīng)義斌等[8]通過計算機視覺技術(shù)、圖像處理技術(shù)、傅立葉描述子的方法來描述和識別果形以及有無果柄,其識別率達到90%。楊秀坤等[9]綜合運用計算機視覺技術(shù)、遺傳算法、多層前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng),實現(xiàn)了具有精確度高、靈活性強和速度快等優(yōu)點的蘋果成熟度自動判別。陳育彥等[10]采用半導(dǎo)體激光技術(shù)、計算機視覺技術(shù)和圖像分析技術(shù)相結(jié)合的方法檢測蘋果表面的機械損傷和果實內(nèi)部的腐爛情況,初步驗證了計算機視覺技術(shù)檢測蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過計算機視覺技術(shù)對水果圖像的邊緣進行檢測,然后確定水果的大小用以水果分級。試驗表明,該方法比傳統(tǒng)的檢測方法速度快、準確率高,適用于計算機視覺的實時檢測。朱偉[12]在模糊顏色的基礎(chǔ)上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對西紅柿的缺陷進行分割,結(jié)果顯示準確率高達96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實可滴定酸含量以及糖分含量之間的相關(guān)性,然而根據(jù)相關(guān)性,樣品檢測的正確識別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個方向獲取蘋果的圖像,并通過計算機自動分析圖像數(shù)據(jù),對蘋果的外徑、體積、以及圓形度等參數(shù)進行處理,與人工檢測相比,計算機視覺技術(shù)具有檢測效率高,檢測標準統(tǒng)一性好等優(yōu)點。Blasco. J [15]通過計算機視覺技術(shù)分析柑橘果皮的缺陷,進而對其在線分級,正確率約為95%。趙廣華等[16]人綜合計算機視覺識別系統(tǒng)、輸送轉(zhuǎn)換系統(tǒng)、輸送翻轉(zhuǎn)系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實時監(jiān)測、品質(zhì)動態(tài)的智能分級系統(tǒng),能夠很好地實現(xiàn)蘋果分級。王江楓等[17]建立了芒果重量與攝影圖像的相互關(guān)系,應(yīng)用計算機視覺技術(shù)檢測桂香芒果和紫花芒果的重量和果面損傷,按重量分級其準確率均為92%,按果面損傷分級的準確率分別為76%和80%。
2.2 計算機視覺技術(shù)在禽蛋檢測中的應(yīng)用研究
禽蛋企業(yè)在生產(chǎn)過程中,產(chǎn)品的分級、品質(zhì)檢測主要采用人工方法,不僅需要大量的物力人力,而且存在勞動強度大、人為誤差大、工作效率低等缺點,計算機視覺技術(shù)可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽靜怡等[18]利用計算機視覺技術(shù)來檢測雞蛋蛋殼裂紋,利用攝像機獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術(shù),獲得裂紋形狀并判斷,試驗結(jié)果表明,計算機視覺技術(shù)對雞蛋蛋殼裂紋的檢測準確率高達98%。汪俊德等[19]以計算機視覺技術(shù)為基礎(chǔ),設(shè)計出一套雙黃雞蛋檢測系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設(shè)計的數(shù)學(xué)模型對比來實現(xiàn)雙黃雞蛋的檢測和識別,檢測準確率高達95%。鄭麗敏等[20]人通過高分辨率的數(shù)字攝像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學(xué)模型來預(yù)測雞蛋的新鮮度和貯藏期,結(jié)果表明,計算機視覺技術(shù)對雞蛋的新鮮度、貯藏期進行預(yù)測的結(jié)果準確率為94%。潘磊慶等[21]通過計算機視覺技術(shù)和聲學(xué)響應(yīng)信息技術(shù)相結(jié)合的方法檢測裂紋雞蛋,其檢測準確率達到98%。Mertens K等[22]人基于計算機視覺技術(shù)研發(fā)了雞蛋的分級檢測系統(tǒng),該系統(tǒng)識別帶污漬雞蛋的正確率高達99%。
2.3 計算機視覺技術(shù)在檢測食品中微生物含量中的應(yīng)用研究
計算機技術(shù)和圖像處理技術(shù)在綜合學(xué)科中的應(yīng)用得到快速發(fā)展,在微生物快速檢測中的應(yīng)用也越來越多,主要是針對微生物微菌落的處理。食品工業(yè)中計算機視覺技術(shù)在微生物檢測方面的研究和應(yīng)用以研究單個細胞為主,并在個體細胞的研究上取得了一定的進展。殷涌光等[23]以顏色特征分辨技術(shù)為基礎(chǔ),設(shè)計了一套應(yīng)用計算機視覺技術(shù)快速定量檢測食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測結(jié)果與傳統(tǒng)方法的檢測結(jié)果具有很好的相關(guān)性,但與傳統(tǒng)方法相比,可以節(jié)省5d時間,檢測時間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質(zhì)。Lawless等[24]人等時間段測定培養(yǎng)基上的細胞密度,然后通過計算機技術(shù)建立時間和細胞密度之間的動態(tài)關(guān)聯(lián),利用該關(guān)聯(lián)可以預(yù)測和自動檢測微生物的生長情況,如通過計算機控制自動定量采集檢測對象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計算機可以顯示被檢測菌落的具置,并且根據(jù)動態(tài)關(guān)聯(lián)計算機視覺系統(tǒng)可以同時處理多個不同的樣品。郭培源等[25]人對計算機視覺技術(shù)用于豬肉的分級進行了研究,結(jié)果顯示計算機視覺技術(shù)在識別豬肉表面微生物數(shù)量上與國標方法檢測的結(jié)果顯著相關(guān),該技術(shù)可以有效地計算微生物的數(shù)量。Bayraktar. B等[26]人采用計算機視覺技術(shù)、光散射技術(shù)(BARDOT)和模式識別技術(shù)相結(jié)合的方法來快速檢測李斯特菌,在獲取該菌菌落中的形態(tài)特征有對圖像進行分析處理達到對該菌的分類識別。殷涌光等[27]人綜合利用計算機視覺、活體染色、人工神經(jīng)網(wǎng)絡(luò)、圖像處理等技術(shù),用分辨率為520萬像素的數(shù)字攝像機拍攝細菌內(nèi)部的染色效果,并結(jié)合新的圖像處理算法,對細菌形態(tài)學(xué)的8個特征參數(shù)進行檢測,檢測結(jié)果與傳統(tǒng)檢測結(jié)果顯著相關(guān)(相關(guān)系數(shù)R=0.9987),和傳統(tǒng)檢測方法相比該方法具有操作簡單、快速、結(jié)果準確、適合現(xiàn)場快速檢測等特點。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征,識別出微生物數(shù)量,并以此作為衡量乳制品質(zhì)量是否達標的依據(jù),并對產(chǎn)品進行分級。
2.4計算機視覺技術(shù)在其他食品產(chǎn)業(yè)中的應(yīng)用研究
里紅杰等[30]通過提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對照數(shù)學(xué)模型,采用數(shù)字圖像處理技術(shù)、計算機識別技術(shù)實現(xiàn)了對貝類和蝦類等海產(chǎn)品的無損檢測和自動化分類、分級和質(zhì)量評估,并通過實例詳細闡述了該技術(shù)的實現(xiàn)方法,證實了此項技術(shù)的有效性。計算機視覺技術(shù)還可以檢驗玉米粒形和玉米種子質(zhì)量、識別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運用計算機視覺技術(shù)對圖像進行分析評估,毛葉棗可食率的評估結(jié)果與運用物理方法測得的結(jié)果平均誤差僅為1.47%,因此得出結(jié)論:計算機視覺技術(shù)可以應(yīng)用于毛葉棗的自動分級。Gokmen,V等通用對薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數(shù)來研究薯片中丙烯酰胺的含量和褐變率也關(guān)系,結(jié)果顯示兩項參數(shù)相關(guān)性為0.989,從而可以應(yīng)用計算機視覺技術(shù)來預(yù)測加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應(yīng)用。韓仲志等人拍攝和掃描11類花生籽粒,每類100顆不同等級的花生籽粒的正反面圖像,利用計算機視覺技術(shù)對花生內(nèi)部和外部采集圖像,并通過圖像對其外在品質(zhì)和內(nèi)在品質(zhì)進行分析,并建立相應(yīng)的數(shù)學(xué)模型,該技術(shù)在對待檢樣品進行分級檢測時的正確率高達92%。另外,郭培源等人以國家標準為依據(jù),通過數(shù)字攝像技術(shù)獲取豬肉的細菌菌斑面積、脂肪細胞數(shù)、顏色特征值以及氨氣等品質(zhì)指標來實現(xiàn)豬肉新鮮程度的分級辨認。
3 展望
新技術(shù)的研究與應(yīng)用必然伴隨著坎坷,從70年代初計算機視覺技術(shù)在食品工業(yè)中進行應(yīng)用開始,就遇到了很多問題。計算機視覺技術(shù)在食品工業(yè)中的研究及應(yīng)用主要存在以下幾方面的問題。
3.1 檢測指標有限
計算機視覺技術(shù)在檢測食品單一指標或者以一個指標作為分級標準進行分級時具有理想效果,但以同一食品的多個指標共同作為分級標準進行檢測分級,則分級結(jié)果誤差較大。例如,Davenel等通過計算機視覺對蘋果的大小、重量、外觀損傷進行分析,但研究結(jié)果顯示,系統(tǒng)會把花粵和果梗標記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復(fù)雜,造成分級誤差很大,分級正確率只有69%。Nozer等以計算機視覺為主要技術(shù)手段,獲取水果的圖像,進而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進行分級,其正確率僅為85.1%。
3.2 兼容性差
計算機視覺技術(shù)針對單一種類的果蔬分級檢測效果顯著,但是同一套系統(tǒng)和設(shè)備很難用于其他種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計算機視覺設(shè)備。Reyerzwiggelaar等利用計算機視覺檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測桃子的準確率顯著高于杏的。Majumdar.S等利用計算機視覺技術(shù)區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識別正確率有明顯差異。
3.3 檢測性能受環(huán)境制約
現(xiàn)階段的計算機視覺技術(shù)和配套的數(shù)學(xué)模型適用于簡單的環(huán)境,在復(fù)雜環(huán)境下工作時會產(chǎn)生較大的誤差。Plebe等利用計算機視覺技術(shù)對果樹上的水果進行識別定位,但研究發(fā)現(xiàn)由于光照條件以及周邊環(huán)境的影響,水果的識別和定位精度不高,不能滿足實際生產(chǎn)的需要。
綜上所述,可看出國內(nèi)外學(xué)者對計算機視覺技術(shù)在食品工業(yè)中的應(yīng)用進行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個學(xué)科,在研究和應(yīng)用的過程中,取得了較大的經(jīng)濟效益,也遇到了很多問題,在新的形勢下,計算機視覺技術(shù)和數(shù)碼拍攝、圖像處理、人工神經(jīng)網(wǎng)絡(luò),數(shù)學(xué)模型建設(shè)、微生物快速計量等高新技術(shù)相融合的綜合技術(shù)逐漸成為了各個領(lǐng)域?qū)W者的研究熱點,以計算機視覺為基礎(chǔ)的綜合技術(shù)也將在食品工業(yè)中發(fā)揮更加重要的作用。
參考文獻
[1] 寧紀鋒,龍滿生,何東健.農(nóng)業(yè)領(lǐng)域中的計算機視覺研究[J].計算機與農(nóng)業(yè),2001(01):1-3.
[2] 李崢.基于計算機視覺的蔬菜顏色檢測系統(tǒng)研究[D].吉林:吉林大學(xué),2004.
[3] 曾愛群.基于計算機視覺與神經(jīng)網(wǎng)絡(luò)的芒果等級分類研究[D].桂林:桂林工學(xué)院,2008.
[4] 韓偉,曾慶山.基于計算機視覺的水果直徑檢測方法的研究[J].中國農(nóng)機化,2011(05):25-29.
[5] 李慶中.蘋果自動分級中計算機視覺信息快速獲取與處理技術(shù)的研究[D].北京:中國農(nóng)業(yè)大學(xué),2000.
[6] 孫洪勝,李宇鵬,王成,等.基于計算機視覺的蘋果在線高效檢測與分級系統(tǒng)[J].儀表技術(shù)與傳感器,2011(06):62-65.
[7] 劉禾,汀慰華.水果果形判別人工神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)的研究[J].農(nóng)業(yè)工程學(xué)報,1996,12(0l):171-176.
[8] 應(yīng)義斌,景寒松,馬俊福.用計算機視覺進行黃花梨果梗識別的新方法[J].農(nóng)業(yè)工程學(xué)報,1998,14(02):221-225.
[9] 楊秀坤,陳曉光,馬成林,等.用遺傳神經(jīng)網(wǎng)絡(luò)方法進行蘋果顏色白動檢測的研究[J].農(nóng)業(yè)工程學(xué)報,1997,13(02):193-176.
[10] 陳育彥,屠康,柴麗月,等.基于激光圖像分析的蘋果表面損傷和內(nèi)部腐爛檢測[J].農(nóng)業(yè)機械學(xué)報,2009,40(07):133-137.
[11] 馮斌,汪憋華.基于計算機視覺的水果大小檢測方法[J].農(nóng)業(yè)機械學(xué)報,2003,34(01):73-75.
[12] 朱偉,曹其新.基于模糊彩色聚類方法的西紅柿缺陷分割[J].農(nóng)業(yè)工程學(xué)報,2003,19(03):133-136.
[13] 曹樂平,溫芝元,沈陸明.基于色調(diào)分形維數(shù)的柑橘糖度和有效酸度檢測[J].農(nóng)業(yè)機械學(xué)報,2009,41(03):143-148.
[14] 劉剛,王立香,柳兆君.基于計算機視覺的蘋果質(zhì)量檢測[J].安徽農(nóng)業(yè)科學(xué),2012,40(08):5014-5016.
[15] Blasco J,Aleixos N,Molto puter vision detection of peel defects in citrus by means of a region oriented segmentation algorithm[J].Journal of Food Engineering,2007,81(03):535-543.
[16] 趙廣華,飛,陸奎榮,等.智能化蘋果品質(zhì)實時分選系統(tǒng)[J].中國科技信息.
[17] 王江楓,羅錫文,洪添勝,等.計算機視覺技術(shù)在芒果重量及果面壞損檢測中的應(yīng)用[J].農(nóng)業(yè)工程學(xué)報,1998(12):186-189.
[18] 歐陽靜怡,劉木華.基于計算機視覺的雞蛋裂紋檢測方法研究[J].農(nóng)機化研究,2012(03):91-93.
[19] 汪俊德,鄭麗敏,徐桂云,等.基于計算機視覺技術(shù)的雙黃雞蛋檢測系統(tǒng)研究[J].農(nóng)機化研究,2012(09):195-199.
[20] 鄭麗敏,楊旭,徐桂云,等.基于計算機視覺的雞蛋新鮮度無損檢測[J].農(nóng)業(yè)工程學(xué)報,2009,25(03):335-339.
[21] 潘磊慶,屠康,詹歌,等.基于計算機視覺和聲學(xué)響應(yīng)信息融合的雞蛋裂紋檢測[J].農(nóng)業(yè)工程學(xué)報,2010,26(11):332-337.
[22] Mertens K,De Ketelaere B,Kamers B,et al.Dirt detection on brown eggs by means of colorcomputer vision[J]. Poultry Science,2005,84(10):1653-1659.
[23] 殷涌光,丁筠.基于計算機視覺的食品中大腸桿菌快速定量檢測[J].吉林大學(xué)學(xué)報(工學(xué)版),2009,39(02):344-348.
[24] Lawless C,Wilkinson DJ,Young A,et al.Colonyzer: automated quantification of micro-organism growth characteristics on solid agar[J].BMC Bioinformatics,2010(08):38-44.
[25] 郭培源,畢松,袁芳.豬肉新鮮度智能檢測分級系統(tǒng)研究[J].食品科學(xué),2010,31(15):68-72.
[26] Bayraktar B,Banada PP,Hirleman ED,et al.Feature extraction from light-scatter patterns of Listeria colonies for identification and classification [J].Journal of Biomedical Optics,2006,11(03):34- 36.
[27] 殷涌光,丁筠.基于計算機視覺的蔬菜中活菌總數(shù)的快速檢測[J].農(nóng)業(yè)工程學(xué)報,2009,25(07):249-254.
[28] 魯靜.乳品微生物自動檢測系統(tǒng)的設(shè)計[J].湖北第二師范學(xué)院學(xué)報,2010,27(08):115-117.
[29] 劉侃.鮮奶含菌量快速檢測系統(tǒng)[D].華中科技大學(xué),2008.
[30] 里紅杰,陶學(xué)恒,于曉強.計算機視覺技術(shù)在海產(chǎn)品質(zhì)量評估中的應(yīng)用[J].食品與機械,2012,28(04):154-156.
篇2
關(guān)鍵詞:數(shù)據(jù)融合傳感器無損檢測精確林業(yè)應(yīng)用
多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數(shù)據(jù)可信度和分辨能力,已廣泛應(yīng)用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機器人、海洋監(jiān)視和管理、目標跟蹤和慣性導(dǎo)航等領(lǐng)域[1,2]。筆者在分析數(shù)據(jù)融合技術(shù)概念和內(nèi)容的基礎(chǔ)上,對該技術(shù)在林業(yè)工程中的應(yīng)用及前景進行了綜述。
1數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。70年代末,在公開的技術(shù)文獻中開始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。
1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。
Wald定義的數(shù)據(jù)融合的概念原理中,強調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標,這正是很多關(guān)于數(shù)據(jù)融合的文獻中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等[3]。
1.2基本內(nèi)容
信息融合是生物系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當(dāng)運用各種現(xiàn)代信息處理方法,通過計算機實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術(shù)。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準則進行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:
(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標。
(2)多傳感器ID/軌跡估計。假設(shè)多傳感器的報告反映的是同源目標,對這些數(shù)據(jù)進行綜合,改進對該目標的估計,或?qū)φ麄€當(dāng)前或未來情況的估計。
(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標探測、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識別、情況評估和預(yù)測[4]。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進行關(guān)聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。
(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務(wù),然后進行關(guān)聯(lián),再送入融合中心處理。這種方法的實質(zhì)是根據(jù)一定的準則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術(shù)也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等[5,6]。
1.3處理模型
美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型[7],當(dāng)時僅應(yīng)用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。
源數(shù)據(jù)預(yù)處理。進行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計算負擔(dān),有時需要為融合中心提供最重要的數(shù)據(jù)。目標評估。融合目標的位置、速度、身份等參數(shù),以達到對這些參數(shù)的精確表達。主要包括數(shù)據(jù)配準、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識。
態(tài)勢評估。根據(jù)當(dāng)前的環(huán)境推斷出檢測目標與事件之間的關(guān)系,以判斷檢測目標的意圖。威脅評估。結(jié)合當(dāng)前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時考慮當(dāng)前的政治環(huán)境和對敵策略等因素,所以較為困難。
處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導(dǎo)和評價、多媒體功能等。
2多傳感器在林業(yè)中的應(yīng)用
2.1在森林防火中的應(yīng)用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數(shù)據(jù)測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結(jié)果不理想。余啟剛運用數(shù)據(jù)融合技術(shù),在空間分辨率為1000m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250m的可見光通道的數(shù)據(jù),較好地進行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準確度[8]。為進一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機獲得GPS接收機輸出的有關(guān)信息通過與RS實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準確度和敏感性。
2.2森林蓄積特征的估計
HampusHolmstrom等在瑞典南部的試驗區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-IIVHFSAR傳感器的雷達數(shù)據(jù)進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計[9]。
KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權(quán)來估計目標樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達數(shù)據(jù)融合技術(shù)對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數(shù)據(jù)方法進行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調(diào)查數(shù)據(jù)
森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森林資源調(diào)查的工作量巨大,且要花費大量的人力、物力和資金。國內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對應(yīng)的GIS數(shù)據(jù)信息實現(xiàn)森林調(diào)查數(shù)據(jù)的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機側(cè)面裝上可視的數(shù)字攝像裝置,利用GPS對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應(yīng)的GIS數(shù)據(jù)進行融合,做出資源變化的估計或影像的修正[10]。
試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠、地形復(fù)雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。
3數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望
3.1在木材檢測中的應(yīng)用
3.1.1木材缺陷及其影響
木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進行在線識別和自動剔除技術(shù),以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機械調(diào)整時間長等問題。
3.1.2單一傳感器在木材檢測中的應(yīng)用
對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應(yīng)力、震動、沖擊應(yīng)力波、快速傅立葉變換分析等檢測方法[11,12]。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等[13]。
隨著計算機視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測中。新西蘭科學(xué)家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結(jié)合力,并動態(tài)地觀察木材纖維在材料中的結(jié)合機理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現(xiàn)的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。
美國林產(chǎn)品實驗室利用計算機視覺技術(shù)對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進行了定向刨花板內(nèi)刨花定向程度的檢測,從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強度。
在制材加工過程中,利用計算機視覺技術(shù)在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質(zhì)量進行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機視覺技術(shù)在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現(xiàn)自動化生產(chǎn)過程。Wengert等在綜合了大量的板材分類經(jīng)驗的基礎(chǔ)上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計算機視覺技術(shù)對刨花板施膠效果進行了定量分析[14]。
X射線對木材及木質(zhì)復(fù)合材料的性能檢測已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對木材密度、含水率、纖維素相對結(jié)晶度和結(jié)晶區(qū)大小、纖維的化學(xué)結(jié)構(gòu)和性質(zhì)等進行檢測,并對木材內(nèi)部的各種缺陷進行檢測。
3.1.3數(shù)據(jù)融合在木材檢測中的應(yīng)用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當(dāng)成節(jié)子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測部分表面缺陷,而無法檢測到內(nèi)部缺陷;超聲、微波、核磁共振和X射線技術(shù)均能測量密度及內(nèi)部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準確、可靠地檢測到木材的缺陷[15,16]。
基于多傳感器(機器視覺及X射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術(shù),更可靠、準確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎(chǔ),同時為集裁除鋸、自動調(diào)整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設(shè)備提供技術(shù)支持。
3.2在精確林業(yè)中的應(yīng)用
美國華盛頓大學(xué)研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學(xué)的生物系統(tǒng)工程系和USDA南方林業(yè)實驗站與有關(guān)公司合作開展用GPS和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產(chǎn)效率。
目前單項的GPS、RS、GIS正從“自動化孤島”形式應(yīng)用于林業(yè)生產(chǎn)向集成技術(shù)轉(zhuǎn)變。林業(yè)生產(chǎn)系統(tǒng)作為一個多組分的復(fù)雜系統(tǒng),是由能量流動、物質(zhì)循環(huán)、信息流動所推動的具有一定的結(jié)構(gòu)和功能的復(fù)合體,各組分間的關(guān)系和結(jié)合方式影響系統(tǒng)整體的結(jié)構(gòu)和功能。因此應(yīng)該在計算機集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時間上的質(zhì)的差異及空間數(shù)據(jù)類型的多樣性,如地理統(tǒng)計數(shù)據(jù)、柵格數(shù)據(jù)、點數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術(shù))等,使林業(yè)生產(chǎn)成為一個高效、柔性和開放的體系,從而實現(xiàn)林業(yè)生產(chǎn)的標準化、規(guī)范化、開放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。
南京林業(yè)大學(xué)提出了“精確林業(yè)工程系統(tǒng)”[17]。研究包括精確林業(yè)工程系統(tǒng)的領(lǐng)域體系結(jié)構(gòu)、隨時空變化的數(shù)據(jù)采集處理與融合技術(shù)、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術(shù)等,實現(xiàn)基于自然界生物及其所賴以生存的環(huán)境資源的時空變異性的客觀現(xiàn)實,以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標,建立關(guān)于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。
[參考文獻]
[1]高翔,王勇.數(shù)據(jù)融合技術(shù)綜述[J].計算機控制與測量,2002,10(11):706-709.
[2]龔元明,蕭德云,王俊杰.多傳感器數(shù)據(jù)融合技術(shù)(上)[J].冶金自動化,2002(4):4-7.
[3]錢永蘭,楊邦杰,雷廷武.數(shù)據(jù)融合及其在農(nóng)情遙感監(jiān)測中的應(yīng)用與展望[J].農(nóng)業(yè)工程學(xué)報,2004,20(4):286-290.
[4]高德平,黃雪梅.多傳感器和數(shù)據(jù)融合(一)[J].紅外與激光工程,1999,28(1):1-4.
[5]王耀南,李樹濤.多傳感器信息融合及其應(yīng)用綜述[J].控制與決策,2001,16(5):518-52.
[6]許軍,羅飛路,張耀輝.多傳感器信息融合技術(shù)在無損檢測中的應(yīng)用研究[J].無損檢測,2000,22(8):342-344.
[7]WhiteFE.Datafusionlexicon:DatafusionsubpanelofthejointdirectorsoflaboratoriestechnicalpanelforC3[R].SanDiego,1991.
[8]余啟剛.數(shù)據(jù)融合技術(shù)在“3S”森林防火中的應(yīng)用[J].森林工程,2003,19(4):5-6.
[9]HampusHolmstrom,biningremotelysensedopticalandradardatainKNN-estimationofforest[J].ForestScience,2003,49(3):409-418.
[10]TrevorJDavis,BrianKlinkenberg,PeterKellerC.Updatinginventory:Usingobliquevideogrammetry&datafusion[J].JournalofForestry,2002,100(2):45-50.
[11]楊春梅,胡萬義,白帆,等.木材缺陷檢測理論及方法的發(fā)展[J].林業(yè)機械與木工設(shè)備,2004,32(3):8-10.
[12]胡英成,顧繼友,王逢瑚.木材及人造板物理力學(xué)性能無損檢測技術(shù)研究的發(fā)展與展望[J].世界林業(yè)研究,2002,15(4):39-46.
[13]肖忠平,盧曉寧,陸繼圣.木質(zhì)材料X射線與超聲檢測技術(shù)研究的發(fā)展與展望[J].木材加工機械,2004,15(1):25-27.
[14]王金滿,周秀榮.刨花板施膠效果計算機視覺分析方法[J].東北林業(yè)大學(xué)學(xué)報,1994,22(3):25-26.
[15]KlinkhachornP.Prototypinganautomatedlumberprocessingsystem[J].ForestProductsJournal,1993(2):11-18.
篇3
一、數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。
7年代末,在公開的技術(shù)文獻中開始出現(xiàn)基于多系統(tǒng)的整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(dfs)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。
1998年1月,buchroithner和wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。
wald定義的數(shù)據(jù)融合的概念原理中,強調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標,這正是很多關(guān)于數(shù)據(jù)融合的文獻中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等。
1.2基本內(nèi)容
信息融合是系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當(dāng)運用各種現(xiàn)代信息處理方法,通過計算機實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術(shù)。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準則進行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:
(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標。
(2)多傳感器id/軌跡估計。假設(shè)多傳感器的報告反映的是同源目標,對這些數(shù)據(jù)進行綜合,改進對該目標的估計,或?qū)φ麄€當(dāng)前或未來情況的估計。
(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標探測、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識別、情況評估和預(yù)測。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進行關(guān)聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。
(3)決策層融合。首先
每一傳感器分別獨立地完成特征提取和決策等任務(wù),然后進行關(guān)聯(lián),再送入融合中心處理。這種方法的實質(zhì)是根據(jù)一定的準則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術(shù)也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等。
1.3處理模型
美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當(dāng)時僅應(yīng)用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。
源數(shù)據(jù)預(yù)處理。進行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計算負擔(dān),有時需要為融合中心提供最重要的數(shù)據(jù)。目標評估。融合目標的位置、速度、身份等參數(shù),以達到對這些參數(shù)的精確表達。主要包括數(shù)據(jù)配準、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識。
態(tài)勢評估。根據(jù)當(dāng)前的環(huán)境推斷出檢測目標與事件之間的關(guān)系,以判斷檢測目標的意圖。威脅評估。結(jié)合當(dāng)前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時考慮當(dāng)前的環(huán)境和對敵策略等因素,所以較為困難。
處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導(dǎo)和評價、多媒體功能等。
二、多傳感器在林業(yè)中的應(yīng)用
2.1在森林防火中的應(yīng)用
在用modis(moderateresolutionimagingspectroradiometer)數(shù)據(jù)測定森林火點時的2、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結(jié)果不理想。余啟剛運用數(shù)據(jù)融合技術(shù),在空間分辨率為1m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為25m的可見光通道的數(shù)據(jù),較好地進行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準確度。為進一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機獲得gps接收機輸出的有關(guān)信息通過與rs實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準確度和敏感性。
2.2森林蓄積特征的估計
hampusholmstrom等在瑞典南部的試驗區(qū)將spot-4×s衛(wèi)星數(shù)據(jù)和carabas-iivhfsar傳感器的雷達數(shù)據(jù)進行了融合,采用knn(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計。
knn方法就是采用目標樣地鄰近k個(k=1)最近樣地的加權(quán)來估計目標樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達數(shù)據(jù)融合技術(shù)對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數(shù)據(jù)方法進行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合gis信息更新調(diào)查數(shù)據(jù)
森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森
林資源調(diào)查的工作量巨大,且要花費大量的人力、物力和資金。國內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計方法。 trevorjdavis等22年提出采用非垂直的航空攝影數(shù)據(jù)融合對應(yīng)的gis數(shù)據(jù)信息實現(xiàn)森林調(diào)查數(shù)據(jù)
的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機側(cè)面裝上可視的數(shù)字攝像裝置,利用gps對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應(yīng)的gis數(shù)據(jù)進行融合,做出資源變化的估計或影像的修正。
試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠、地形復(fù)雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。
三、數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望
3.1在木材檢測中的應(yīng)用
3.1.1木材缺陷及其影響
木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進行在線識別和自動剔除技術(shù),以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機械調(diào)整時間長等問題。
3.1.2單一傳感器在木材檢測中的應(yīng)用
對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應(yīng)力、震動、沖擊應(yīng)力波、快速傅立葉變換分析等檢測方法。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等。
隨著計算機視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測中。新西蘭科學(xué)家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結(jié)合力,并動態(tài)地觀察木材纖維在材料中的結(jié)合機理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現(xiàn)的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。
美國林產(chǎn)品實驗室利用計算機視覺技術(shù)對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進行了定向刨花板內(nèi)刨花定向程度的檢測,從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強度。
在制材加工過程中,利用計算機視覺技術(shù)在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質(zhì)量進行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機視覺技術(shù)在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現(xiàn)自動化生產(chǎn)過程。wengert等在綜合了大量的板材分類經(jīng)驗的基礎(chǔ)上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計算機視覺技術(shù)對刨花板施膠效果進行了定量分析。
x射線對木材及木質(zhì)復(fù)合材料的性能檢測已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對木材密度、含水率、纖維素相對結(jié)晶度和結(jié)晶區(qū)大小、纖維的結(jié)構(gòu)和性質(zhì)等進行檢測,并對木材內(nèi)部的各種缺陷進行檢測。
3.1.3數(shù)據(jù)融合在木材檢測中的應(yīng)用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當(dāng)成節(jié)子,
造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測部分表面缺陷,而無法檢測到內(nèi)部缺陷;超聲、微波、核磁共振和x射線技術(shù)均能測量密度及內(nèi)部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準確、可靠地檢測到木材的缺陷。
基于多傳感器(機器視覺及x射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術(shù),更可靠、準確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎(chǔ),同時為集裁除鋸、自動調(diào)整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設(shè)備提供技術(shù)支持。
3.2在精確林業(yè)中的應(yīng)用
美國華盛頓大學(xué)研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;auburn大學(xué)的生物系統(tǒng)工程系和usda南方林業(yè)實驗站與有關(guān)公司合作開展用gps和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產(chǎn)效率。
篇4
【關(guān)鍵詞】:電力系統(tǒng);新技術(shù)應(yīng)用;未來展望
1、新技術(shù)在電力系統(tǒng)自動化中的應(yīng)用
通過上文對電力系統(tǒng)的解讀可知,該系統(tǒng)是一個規(guī)模比較龐大的系統(tǒng),其中涵蓋了諸多的電力設(shè)備設(shè)施,想要實現(xiàn)對這些設(shè)備的自動化控制,就必須對相關(guān)的技術(shù)加以運用。下面本文重點分析幾種新技術(shù)在電力系統(tǒng)自動化中的應(yīng)用。
1.1智能控制技術(shù)的應(yīng)用
自電力系統(tǒng)自動化這一概念被提出之后,電力系統(tǒng)自動化與新技術(shù)應(yīng)用文/周觀春柴宇馮浩銘文章首先對電力系統(tǒng)自動化進行了解讀,在此基礎(chǔ)上對幾種新技術(shù)在電力系統(tǒng)自動化中的應(yīng)用進行論述。期望通過本文的研究能夠?qū)Υ_保電力系統(tǒng)的安全、穩(wěn)定、可靠、經(jīng)濟運行有所幫助。摘要智能控制技術(shù)便成為其研究的一個重要領(lǐng)域,相對于傳統(tǒng)的人工控制方式而言,智能控制更具優(yōu)越性,將之應(yīng)用于復(fù)雜程度高、非線性較強的電力系統(tǒng)當(dāng)中,可以_保系統(tǒng)的安全、穩(wěn)定、可靠、經(jīng)濟運行。智能控制技術(shù)的核心是計算機,所有的控制功能都是憑借相關(guān)的軟件程序來實現(xiàn)的,借助這些控制功能可對電力系統(tǒng)運行過程中產(chǎn)生的狀態(tài)數(shù)據(jù)進行實時監(jiān)測和自動分析與處理,并從中找出電力系統(tǒng)運行時存在的問題,然后參考數(shù)據(jù)庫中的故障處理指令,自動對故障問題進行解決處理,再利用通信網(wǎng)絡(luò)將處理指令下發(fā)至電力系統(tǒng)的設(shè)備當(dāng)中,從而實現(xiàn)對系統(tǒng)的調(diào)整,由此便可確保系統(tǒng)始終處于相對穩(wěn)定的運行狀態(tài)。
1.2計算機視覺技術(shù)的應(yīng)用
該技術(shù)是一門綜合性較強的學(xué)科,主要包括計算機、信號處理、物理學(xué)等等,它是各種智能系統(tǒng)不可或缺的重要組成部分之一,應(yīng)用該技術(shù)可對電力系統(tǒng)進行有效的監(jiān)測。隨著業(yè)內(nèi)專家學(xué)者對該技術(shù)的研究不斷深入,出現(xiàn)了諸多新的技術(shù),其中較具代表性的有以下幾類:在線監(jiān)測技術(shù)、環(huán)境監(jiān)測技術(shù)、無人機監(jiān)測技術(shù)等等,這些技術(shù)能夠通過各種不同的方式獲取電力系統(tǒng)的狀態(tài)信息。
1.3動態(tài)安全監(jiān)控系統(tǒng)的應(yīng)用
隨著社會生產(chǎn)生活對供電穩(wěn)定性的要求不斷提高,電力系統(tǒng)有必要應(yīng)用動態(tài)安全監(jiān)控系統(tǒng),減少供電故障,保障電力系統(tǒng)可靠運行,滿足供電需求。在動態(tài)安全監(jiān)控系統(tǒng)中,要引入GPS和EMS技術(shù),通過全面檢測電氣設(shè)備,實時掌握電氣設(shè)備的運行情況,可及時發(fā)現(xiàn)并處理故障隱患,做到防患于未然,從而大幅度降低事故發(fā)生的可能性?;贕PS定位技術(shù)的動態(tài)安全監(jiān)控系統(tǒng),可通過衛(wèi)星提供所需數(shù)據(jù),加之EMS系統(tǒng)可對整個電力系統(tǒng)進行實時監(jiān)控,從而實現(xiàn)了動態(tài)監(jiān)控與靜態(tài)監(jiān)控相結(jié)合,從多個方向入手對電力系統(tǒng)運行進行綜合分析,若發(fā)現(xiàn)電力系統(tǒng)存在不穩(wěn)定運行的因素,則可及時提出補救措施。
1.4 DFACTS技術(shù)
FACTS技術(shù)和DFACTS技術(shù)是應(yīng)用于電力系統(tǒng)的新技術(shù),其中FACTS技術(shù)即柔流輸電,能夠?qū)﹄娏ο到y(tǒng)的相關(guān)參數(shù)進行及時調(diào)控,保證電壓維持在穩(wěn)定狀況,從而提高電力系統(tǒng)的可靠性。DFACTS技術(shù)則可有效解決電力系統(tǒng)的各類質(zhì)量問題,有效管控電力系統(tǒng)運行質(zhì)量,保障電氣設(shè)備始終處于良好運行狀態(tài),減少不利因素對電氣設(shè)備的干擾和損害,從而促使電力系統(tǒng)運行的自動化水平大幅度提升。
1.5微機保護技術(shù)
電力系統(tǒng)應(yīng)用微機保護技術(shù),能夠在發(fā)生故障時自動啟動保護措施,減少電力系統(tǒng)受到的損害。隨著電力系統(tǒng)對微機保護技術(shù)的應(yīng)用要求不斷提高,微機保護技術(shù)必須及時更新。當(dāng)前,在電力系統(tǒng)中常用基于C/C++語言的微機設(shè)備,該微機設(shè)備具備良好的可移植性和靈活性,能夠滿足電力系統(tǒng)保護的多種需求。
2、電力系統(tǒng)新技術(shù)發(fā)展的未來展望
2.1電力系統(tǒng)將向著自動化和智能化的方向邁進
目前,電力系統(tǒng)的整體發(fā)展趨勢是向著自動化和智能化的方向發(fā)展,其智能控制手段將由研究逐漸走向?qū)嵱?,通過對計算機技術(shù)的不斷學(xué)習(xí),將能夠幫助電力工作者找到新的發(fā)展電力的道路和方向,也能夠使得一些系統(tǒng)達到新的發(fā)展高度。計算機技術(shù)、控制技術(shù)和現(xiàn)代通信技術(shù)將會對電能的產(chǎn)生、控制、傳輸?shù)雀鱾€環(huán)節(jié)產(chǎn)生影響,使得電力系統(tǒng)實現(xiàn)智能化和自動化的新高度。當(dāng)前電力系統(tǒng)正處在大數(shù)據(jù)的時代,各種高科技的技術(shù)頻發(fā),電力系統(tǒng)的安全運行程度高。同時,電力系統(tǒng)還有高效率運行、降低成本和對環(huán)境負面影響小的優(yōu)點,將不斷的提升系統(tǒng)的可靠性和自愈性,達到更高的發(fā)展高度。
2.2太陽能等可再生資源發(fā)電比例和對儲能設(shè)備要求增高
隨著全國經(jīng)濟和文化的發(fā)展,電力系統(tǒng)領(lǐng)域也迎來了新的發(fā)展方向,太陽能和風(fēng)能成為可再生資源的發(fā)展重點。根據(jù)研究資料表明,地球上接受的太陽能如果有效的利用和供給是足夠地球上的人類實現(xiàn)總需求的。在能源評價、技術(shù)服務(wù)和創(chuàng)新等方面,光伏發(fā)電也成為了新的發(fā)展趨勢,現(xiàn)階段需要重點光電池、多晶硅提煉等技術(shù),不斷推廣新的發(fā)展渠道,解決更多的技術(shù)問題和障礙,實現(xiàn)包括太陽能在內(nèi)的可再生資源的合理利用,為電力能源的生產(chǎn)提供充足的保障。另一方面,隨著電力系統(tǒng)信息化和新技術(shù)的發(fā)展,電力儲能系統(tǒng)就像計算機網(wǎng)絡(luò)中的信息存儲系統(tǒng)一樣,有著重要的影響力。隨著儲能裝置的不斷改進,新型高性能的電極材料和電介質(zhì)材料將不斷被應(yīng)用在各個領(lǐng)域,推動電力系統(tǒng)的全方位發(fā)展。此外,電力電氣設(shè)備的性能還需要不斷的研究其材料,提高電氣設(shè)備的極限容量,確保電力系統(tǒng)的安全穩(wěn)定,滿足電網(wǎng)的運行需求。新型高性能電極材料、儲能材料和新技術(shù)的應(yīng)用,推動了大容量電池儲能等技術(shù)的發(fā)展和大容量儲能設(shè)備興起和實踐運用。
結(jié)論
電力系統(tǒng)的運行穩(wěn)定與否,直接關(guān)系到供電可靠性,為了確保系統(tǒng)運行的穩(wěn)定性,可將智能控制技術(shù)、計算機視覺技術(shù)、動態(tài)安全監(jiān)控技術(shù)等,合理運用到電力系統(tǒng)自動化當(dāng)中,由此不但能夠?qū)﹄娏ο到y(tǒng)進行全面的監(jiān)視和控制,而且還能使系統(tǒng)的重要設(shè)備始終處于受控狀態(tài)。
篇5
關(guān)鍵詞:機器視覺;三維重建;圖像處理
中圖分類號:TP301
文獻標識碼:A 文章編號:1672-7800(2014)003-0013-02
作者簡介:羅尤春(1989-),男,華中科技大學(xué)機械科學(xué)與工程學(xué)院碩士研究生,研究方向為機器視覺。
1 Marr機器視覺框架
在漫漫進化歷程中,人類和大部分動物通過視覺、聽覺、觸覺等來獲取周圍世界的信息,并通過大腦處理這些信息。而根據(jù)調(diào)查,人類大腦處理的信息有80%是來自視覺,我們通過雙目感受深度信息,通過對不同頻率光信號進行判別來獲取顏色信息[1]。通過運用攝像機來達到模擬人眼的識別和測量功能,機器視覺成為人工智能研究的重要環(huán)節(jié)。機器視覺區(qū)別于計算機視覺,更偏向于應(yīng)用,一個機器視覺系統(tǒng)一般通過攝像機之類的光學(xué)儀器以圖像的形式獲取周圍世界的信息,通過計算機進行圖像處理和圖像理解,再根據(jù)相應(yīng)的控制程序和機械驅(qū)動設(shè)備對智能輸出設(shè)備發(fā)出操作指令,實現(xiàn)智能控制和操作功能。
早期的機器視覺局限于對二維圖像的分析、識別和理解上[2]。20世紀80年代初,Marr第一次融合圖像處理、神經(jīng)科學(xué)的相關(guān)研究,提出了里程碑式的視覺系統(tǒng)框架。具體來說,Marr框架包括三個層次:計算理論層次、表達與算法層次、硬件實現(xiàn)層次。計算理論層次,可以理解為通過對二維圖像的理解來重建三維客觀世界的視覺三維重建理論研究。因為現(xiàn)實世界是復(fù)雜多變的,如何建立一種通過二維圖像來實現(xiàn)三維重建的普適性方法成為機器視覺系統(tǒng)中最重要也是終極的目的。Marr提出的這一層次是想通過建立某種普適性模型來獲取客觀世界任何物體的形狀、位置以及運動的信息;表達與算法層次低于計算理論層次,是要解決“軟件”的問題,即如何實現(xiàn)機器視覺系統(tǒng)各個模塊之間信息輸入、輸出和信息表達的問題,亦即各種算法的實現(xiàn);硬件實現(xiàn)層次可理解為如何組建機器視覺系統(tǒng)的硬件實體設(shè)備,與表達與算法層次一起為計算理論層次服務(wù)。
Marr提出的視覺框架中研究最多的是計算理論層次和表達與算法層次,分別對應(yīng)下節(jié)要介紹的三維重建理論和圖像處理。
2 三維重建
視覺三維重建理論是整個視覺領(lǐng)域研究的重點和前沿??陀^世界的物體都是由基本的幾何要素組成的:點、直線、二次曲線等。因此,要實現(xiàn)對客觀世界的描繪,利用這些最基本的幾何要素來組建客觀世界是可以實現(xiàn)的。在很多研究中,通過大量的點對匹配得到三維世界中物體的三維點云模型,從而模擬出真實物體的形狀。在三維重建研究中,立體視覺或稱雙目(多目)視覺是最重要的手段。仿照人眼的原理,要獲得對周圍三維世界的認知,必須知道深度信息,最少需要兩個眼睛。與此同理,立體視覺一般都需要兩個或者多個攝像機同時工作,才能較好地得到周圍世界的三維信息。
2.1 攝像機針孔模型
攝像機的普適模型——針孔模型來源于小孔成像現(xiàn)象。簡單地說,針孔模型是指空間中一點P與攝像機中一特定點C(稱為光心)的連線交攝像機的圖像平面于點p,這個點p便是空間點P的成像點,蘊含了空間點P的幾何信息。從數(shù)學(xué)的觀點,攝像機的成像模型是一個從三維到二維的映射f:Pp,是一個降維映射,丟失掉了深度信息,即處于光心C—空間點P的直線上任意一點Q的投影也都是p。從數(shù)學(xué)上可以證明,至少需要兩幅或以上圖像才能重建出空間點P的深度信息zP。
2.2 空間點三維重建
采用兩個不同的攝像機位拍攝空間中同一點P的圖像,分別得到P在左右攝像機圖像平面上的投影點p\-L和p\-R,如果事先知道左右攝像機的相對位置關(guān)系——稱為雙目攝像機標定,那么就知道了左右攝像機的光心C\-L和C\-R的位置。簡而言之,雙目視覺系統(tǒng)能夠提供給我們一個坐標系(左或者右攝像機坐標系),在這個坐標系下通過攝像機標定知道兩個光心C\-L和C\-R的位置以及投影點p\-L和p\-R的位置,直線C\-Lp\-L和C\-Rp\-R的交點就是要重建的空間點P。
2.3 空間直線三維重建
空間直線的重建原理和空間點的重建類似,假如要重建空間直線L,得到L在左右攝像機圖像平面上的投影直線l\-L和l\-R,那么左攝像機光心C\-L和左投影l(fā)\-L形成一個平面S\-L,同理右攝像機光心C\-R和右投影l(fā)\-R形成一個平面S\-R,則空間直線L就是平面S\-L和S\-R的相交直線。
2.4 二次曲線三維重建
實二次曲線一般包括橢圓、雙曲線、拋物線和圓[3]。關(guān)于二次曲線的三維重建,司少華等[4]在1993年提出了一種特征值的方法,其開創(chuàng)性貢獻在于首先將二次曲線視為一個幾何元素來進行重建,而非利用二次曲線由其上的若干點(至少5個點)決定的原理,更不是利用點云的思想來重建二次曲線。將要重建的對象視作整體而非利用局部元素(點)去擬合逼近的思想是視覺理論更進一步的發(fā)展。圓作為最常見的二次曲線特征被廣泛應(yīng)用在物體空間定位上[5]。
3 圖像處理
圖像處理是指利用計算機對圖像進行分析,得到需要的信息。所謂圖像,其數(shù)學(xué)模型即一個二元向量函數(shù)f(x,y),其坐標(x,y)表示圖像的橫縱坐標。對于灰度圖像,這個向量函數(shù)成為一個標量函數(shù),f(x,y)表示對應(yīng)平面坐標(x,y)的灰度值。對于彩色圖像,一般使用RGB三原色來表征,即f=[R,G,B]\+T。圖像處理的內(nèi)容非常豐富,包括了圖像濾波去噪、邊緣檢測、圖像復(fù)原、形態(tài)學(xué)處理、圖像分割等。其中,為了得到三維重建所必須知道的點、直線、二次曲線等圖像信息,邊緣檢測至關(guān)重要。所謂邊緣檢測,目的是要識別出圖像中灰度值變化明顯的圖像點。圖像中突變的位置一般代表了三維世界中的不同屬性?,F(xiàn)有的邊緣檢測算子包括Canny算子[6]、Sobel算子、Prewitt算子、Roberts Cross算子、羅盤算子、Marr-Hildreth算子等。
A=imread('Beach.jpg');
B=rgb2gray(A);
C=edge(B,'canny',0.1);
imshow(C)
4 機器視覺應(yīng)用及前景
機器視覺技術(shù)廣泛應(yīng)用于機器人、工業(yè)檢測等領(lǐng)域。由于機器視覺系統(tǒng)是一套光學(xué)系統(tǒng),因此具有非接觸式測量的優(yōu)點。由于計算機的運算速度不斷刷新紀錄,使得圖像處理效率也不斷提升,運用機器視覺系統(tǒng)能夠為工業(yè)中的不同應(yīng)用提供實時數(shù)據(jù)。加載視覺系統(tǒng)的智能機器人不僅擁有靈活、快捷的操作手臂,而且配置了靈敏的攝像機充當(dāng)“眼睛”,還有超強計算能力的計算機充當(dāng)“大腦”,真正實現(xiàn)了手—眼—腦同體。在工業(yè)檢測以及測量領(lǐng)域,機器視覺利用自身的獨特優(yōu)勢在質(zhì)量缺陷、生產(chǎn)監(jiān)控等方面占據(jù)了重要地位。機器視覺是一種人工智能技術(shù),在未來的智能化時代,視覺技術(shù)必定能成為人機交互的最重要途徑之一。
參考文獻:
[1] 張廣軍.機器視覺[M].北京:科學(xué)出版社,2005.
[2] 馬頌德,張正友.計算機視覺:計算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,2003.
[3] 呂林根,許子道.解析幾何[M].北京:高等教育出版社,2006.
[4] 司少華,馬頌德.基于二次曲線的立體視覺[J].自動化學(xué)報,1993,19(4):420-427.
篇6
關(guān)鍵詞:ICA-HMAX模型;視覺相似度;卷積核;語義相似度
中圖分類號:TP317 文獻標識碼:A 文章編號:1009-3044(2016)08-0177-05
Abstract: This paper firstly introduces a multi-level convolutional ICA-HMAX model; then propose visualization methods of the convolution kernel convolution kernel to achieve different levels of understanding. Proposed using S3 layer feature of the ICA-HMAX model to achieve visual similarity calculation of different categories. By implementing different categories of visual similarity between calculated on Caltech 101 datasets, and compared with the semantic similarity between categories and further explore the relationship between semantic similarity and visual similarity between.
Key words: ICA-HMAX model ;visual similarity; kernel convolution kernel; semantic similarity
1 概述
21世紀以來,數(shù)字成像技術(shù)和存儲技術(shù)得到了空前的發(fā)展;使得每天有數(shù)量巨大的數(shù)字圖像進入人們的生活,成為人類生活、工作、娛樂中的組成部分。另一方面,互聯(lián)網(wǎng)技術(shù)的發(fā)展給圖像的迅速傳播提供了有利的條件。此外,圖像是視覺信息的重要來源之一,蘊含豐富的語義信息。圖像理解是人工智能領(lǐng)域中的一個新的方向,其核心問題是研究如何使計算機能夠像人腦一樣有效正確理解圖像中所表達的高層語義信息。
仿生多層模型在計算機視覺和人工智能鄰域取得了顯著的成果。20世紀末,Poggio和Riesenhuber根據(jù)IT皮層的生理學(xué)數(shù)據(jù)提出了標準HMAX模型[1],該模型模擬視皮層中腹側(cè)通路中簡單細胞(Simple Cell)和復(fù)雜細胞(Complex Cell)的交替處理的功能,實現(xiàn)多層次特征提取。在此基礎(chǔ)上,Serre等人提出一種具有隨著層次的增加復(fù)雜度和不變性逐漸增強的圖像特征表達[2],并將其應(yīng)用到真實場景的目標識別中,其識別性能明顯優(yōu)于傳統(tǒng)的特征表達(如SIFT特征[3]);Hu等人根據(jù)大腦神經(jīng)元響應(yīng)的稀疏特性進一步擴展HMAX模型,提出了Sparse-HMAX模型[4],在分類性能上遠遠優(yōu)于HMAX模型,同時較好模擬和解釋神經(jīng)元對視覺信號的稀疏響應(yīng)。
本文內(nèi)容章節(jié)安排如下:第2節(jié)首先簡要描述了本文的ICA-HMAX模型;然后介紹卷積核的可視化方法;第3節(jié)介紹基于WordNet的語義相似度計算和基于ICA-HMAX的視覺相似度計算方法。第4節(jié)實驗結(jié)果和分析。第5節(jié)總結(jié)與展望。
2 ICA-HMAX模型與卷積核可視化
2.1 ICA-HMAX模型簡介
前饋ICA-HMAX模型由五層構(gòu)成如圖1所示。自底向上依次為S1C1S2C2S3五層,其中S1層卷積核(W1、V1)由獨立成分析(Independent Component Analysis,ICA)方法從彩色圖像的數(shù)據(jù)塊中學(xué)習(xí)獲得,為了使得C1層具有局部空間平移不變性,在S1層的每個二維平面響應(yīng)圖上進行局部最大值匯聚(max pooling)操作;同理,S2層卷積核(W2、V2)也是采用ICA方法從C1層采樣塊中學(xué)習(xí)獲得;同樣,為了使得C2層也具有局部空間平移不變性,在S2層的每個二維平面響應(yīng)圖上進行最大值匯聚(max pooling)操作;同理可以獲得S3層的卷積核(W3、V3)以及S3層的特征表達。值得注意的是該前饋模型的卷積核均為單尺度。
2.2 卷積核的可視化
若要實現(xiàn)對多層模型ICA-HMAX的深入的了解,需要知道不同層次的卷積核編碼的圖像信息。由于S1層特征卷積核是在彩色圖像的原始像素層上學(xué)習(xí),可以在像素空間上直接觀察S1層卷積核編碼的圖像信息。而S2、S3層的卷積核是在圖像C1、C2層的響應(yīng)圖上經(jīng)過ICA學(xué)習(xí)獲得高維數(shù)據(jù),因此不能直接觀察其卷積核編碼的圖像信息。為了觀察S2、S3層的卷積核所編碼的圖像信息,當(dāng)給定一個某個類別的卷積核的條件下,本文提出在該類別的圖像上找出使得該卷積核的刺激最大的前50個感受野區(qū)域,并將這些區(qū)域與其刺激的響應(yīng)值進行加權(quán)求和,然后取平均;所得結(jié)果具有表示S2、S3層卷積核所編碼的圖像信息從而作為S2、S3層的卷積核可視化。
3 相似度計算
3.1 基于WordNet的語義相似度計算
WordNet是由普林斯頓大學(xué)心理學(xué)家,語言學(xué)家和計算機工程師聯(lián)合設(shè)計的一種基于認知語言學(xué)的英語詞典。它不是光把單詞以字母順序排列,而且按照單詞的意義組成一個“單詞的網(wǎng)絡(luò)”。一般來講,國內(nèi)外的研究學(xué)者將經(jīng)典的基于語義的相似度的計算方法分為三個類型[6,7]:基于距離的相似度計算(Path Counting Measures)、基于信息內(nèi)容的相似度計算(Information Content Measures)和基于特性的相似度計算(Feature-based Measures)。本文主要介紹基于距離的相似度計算方法――Shortest Path算法和Leacock and Chodorow算法。
3.2 基于視覺的類別相似度
眾所周知,不同類別之間存在部分外觀相似性,比如山貓和豹、狼和哈士奇、浣熊和果子貍等等??梢?,分別在兩個類別的訓(xùn)練集上訓(xùn)練ICA-HMAX模型,若兩個類別視覺相似度越高,則這兩個類別的S3層卷積核相似的基元個數(shù)越多;反之,兩類別的S3層卷積核中的相似的基元個數(shù)越多,兩個類別的視覺相似度越高。
我們知道兩個類別的相似度越高,則兩個類別的ICA-HMAX模型越能較好地實現(xiàn)對異類圖像的相互表達。因此采用配對字典的方法[10]實現(xiàn)對S3特征表達的重構(gòu)。然后,將重構(gòu)圖像與輸入圖的結(jié)構(gòu)相似度[11](SSIM)作為衡量S3層特征對輸入圖像描述的好壞。若重構(gòu)圖像與輸入圖的結(jié)構(gòu)相似度越高,則兩個類別的視覺語義相似度越高,反之亦然。基于目標類別的視覺語義相似度算法流程如表1所示:
4 實驗結(jié)果與分析
實驗設(shè)置:實驗所使用的PC機配置為Intel(R) Core(TM) i7-4770、CPU 3.4GHz × 8 cores、RAM 16 GB、Windows 7操作系統(tǒng)。為了探索不同類別之間的語義相似度和基于ICA-HMAX模型S3層的特征描述子的視覺語義相似度之間的關(guān)系,本文選擇了Caltech 101數(shù)據(jù)集[12]進行實驗,該數(shù)據(jù)集以彩色自然場景圖像為主(包含一定數(shù)量的人造圖像)。包括動物、花、人臉等101個目標類別以及一個背景類別。除背景類別之外,每個類別中的每張圖片只包括一個類別中的一個實例,這有利于本實驗進行。在進行實驗之前,首先對數(shù)據(jù)集中每張圖像做如下預(yù)測處理:統(tǒng)一圖像高度為140個像素,保持圖像的長寬比不變,采用雙三次插值對其進行縮放。將每個類別中的圖片按照4:1的比例分成訓(xùn)練集和測試集,在訓(xùn)練上訓(xùn)練各個類別的ICA-HMAX模型,采用3.2節(jié)介紹的視覺語義相似度方法在測試集上測試不同類別之間的視覺相似度。
4.1卷積核的可視化
圖3(b)、(c)、(d)分別給出了S1、S2和S3層卷積核的可視化結(jié)果。結(jié)果表明,不同層次的卷積核編碼了圖像不同類型的特征。圖3(b)中的S1層卷積核均編碼了圖像底層特征(如彩色邊緣、彩色表面、拐角等結(jié)構(gòu)信息等),并且不同類別的底層特征具有相似的結(jié)構(gòu)特征;值得注意的是,通過ICA在彩色圖像上的學(xué)習(xí),獲得了重要的顏色信息如彩色邊緣、彩色表面等。S2層卷積核編碼了各類別的中層部件特征,例如face_easy類別的S2層編碼了人臉的眼睛、嘴巴、鼻子等信息,如圖3(c)所示。由圖3(d)可以看出,由于S3層卷積核的感受野比S2層大,編碼信息更趨于類別信息。研究表明:這符合圖像理解的層次特性[13]。
4.2 相似度
數(shù)據(jù)集Caltech101圖像部分類別之間的基于路徑的Shortest Path算法和Leacock and Chodorow的相似度矩陣分別如圖4和圖5所示。由圖4和圖5可以看出這兩個矩陣都是對稱矩陣。與一個類別最相似的類別有的不止一個,如與ant類別最相近的類別是butterfly、dragonfly、mayfly。值得注意的是圖5中基于路徑的Leacock and Chodorow算法的類別相似度數(shù)據(jù)是經(jīng)過歸一化處理后的數(shù)據(jù)。
本文采用基于ICA-HMAX模型的S3層的特征計算視覺相似,其視覺相似度矩陣的結(jié)果如圖6所示。在該相似度矩陣中,把同一類別之間的視覺相似度設(shè)置為1作參考,來衡量不同類別之間的視覺相對度。在圖6中橫軸表示ICA-HMAX模型的類別。縱軸表示測試圖像的類別。由圖6可見,不同類別之間的視覺相似度矩陣不是對稱。比如用airplane的ICA-HMAX模型對helicopter類別的圖像進行表達,并計算其視覺相似度其值為0.506;而當(dāng)用helicopter的ICA-HMAX模型對airplane類別的圖像進行表達,并計算其視覺相似度其值為0.253。且與一個類別最相似的類別只有一個。在Caltech101數(shù)據(jù)集中helicopter類別的直升機的實例圖片上都存在較為明顯的螺旋槳。在airplane類別的飛機圖像沒有明顯的螺旋槳。而在忽略helicopter類別的直升機螺旋槳后,直升機的機體形狀與airplane類別的機體在視覺上存在相似?;谡Z義和視覺的相似度統(tǒng)計如表2所示。
兩種相似度之間的差異性分析:由表2可知,基于語言的語義的相似度與基于視覺的相似度之間存在一致性和差異性。一致性:由表2可知,20個類別中基于語義和視覺的相似度一致有5對,分別sunflower和bonsai、rhino和llama、airplane和helicopter、ant和mayfly、hedgehog和llama。比如airplane和helicopter這兩個類別的實例如圖7所示。由圖可見,不同類別之間存在視覺相似,兩個類別實例在的某些局部形狀、顏色、紋理等方面具有視覺上的相似性。差異性:由表2可知:20個類別中基于語義和視覺的相似度不一致的較多。如圖8所示,ant、butterfly和dragonfly這三個類別的語義相對度很高但是它們的視覺相似度相差較大。原因在于:語義即語言意義,是人腦對客觀上事物的認識和理解,它具有高度的概括性和抽象性。類別之間的語義往往根據(jù)類別所屬范疇、關(guān)系、屬性、功能等綜合特性來進行劃分。而僅僅從事物的視覺外觀上無法體現(xiàn)出上述種種關(guān)系。
5 結(jié)論與展望
通過ICA-HMAX不同層次卷積核的可視化分析可知:自底層到高層不同層次的卷積編碼規(guī)律如下:不同層次的卷積核編碼了圖像不同類型的特征。模型的層次越高,卷積核編碼的信息越趨向于反映目標類別的特性,S1層卷積核編碼體現(xiàn)底層共享特征(如拐角、 彩色邊緣、彩色表面等)。S2層卷積核編碼中層部件特征,比如face_easy類別的S2層編碼了人臉的眼睛、嘴巴、鼻子等局部信息。S3層編碼信息更趨于類別的全局信息。研究表明:這符合圖像理解的層次特性。
通過視覺的相似和語義的相似度分析可知,基于ICA-HMAX模型的S3層特性的視覺相似度與語義相似之間存在一致性和差異性。這種一致性和差異性在計算機視覺和人工智能領(lǐng)域具有互補性。比如對于那些語義和視覺的相似度一致的類別,尤其是視覺相似度較高的類別之間可以進行遷移學(xué)習(xí),使得計算機實現(xiàn)人類的類比學(xué)習(xí)能力。對于語義和視覺的相似度差異性在圖像的檢索和圖像理解等方面可以實現(xiàn)互補。通過語義的相似度我們可以檢索到較多的相似類別,如與ant語義相似的有ant、dragonfly、butterfly。這樣我們可以實現(xiàn)大范圍的查找。然后在通過視覺的相似度進一步篩選正確的類別圖片。反之,通過語義可以指導(dǎo)基于視覺的機器學(xué)習(xí)。
參考文獻:
[1] Riesenhuber M, Poggio T. Hierarchical models of object recognition in cortex [J]. Nature neuroscience, 1999, 2(11): 1019-1025.
[2] Serre T, Wolf L, Bileschi S, et al. Robust object recognition with cortex-like mechanisms [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2007, 29(3): 411-426.
[3] Lowe D G. Distinctive image features from scale-invariant keypoints [J]. International journal of computer vision, 2004, 60(2): 91-110.
[4] Hu X, Zhang J, Li J, et al. Sparsity-regularized HMAX for visual recognition [J]. PloS one, 2013, 9(1): e81813-e81813
[5] Nair V, Hinton G E. Rectified linear units improve restricted boltzmann machines [C] //Proceedings of the 27th International Conference on Machine Learning (ICML-10). 2010: 807-814.
[6] Hliaoutakis A. Semantic Similarity Measures in MeSH Ontology and their application to Information Retrieval on Medline [J]. 2005.
[7] Raftopoulou P, Petrakis E. Semantic similarity measures: A comparison study [J]. Technical University of Crete, Department of Electronic and Computer Engineering, Tech. Rep. TR-TUC-ISL-04-2005, 2005.
[8] R. Rada, H. Mili, E. Bicknell and M. Blettner, “Development and Application of a Metric on Semantic Nets”, IEEE Transactions on Systems, Man and Cybernetics, vol. 19, Issue 1, (1989) January-February, pp. 17 - 30.
[9] H. Bulskov, R. Knappe and T. Andreasen, “On Measuring Similarity for Conceptual Querying”, Proceedings of the 5th International Conference on Flexible Query Answering Systems, (2002) October 27-29, Copenhagen, Denmark.
[10] Vondrick C, Khosla A, Malisiewicz T, et al. HOGgles: Visualizing Object Detection Features[C]//Proceedings of the IEEE International Conference on Computer Vision. 2013: 1-8.
[11] Wang Z, Bovik A C, Sheikh H R, et al. Image quality assessment: from error visibility to structural similarity [J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612.
篇7
關(guān)鍵詞:虛擬現(xiàn)實技術(shù);校園環(huán)境設(shè)計;分析
DOI:10.16640/ki.37-1222/t.2016.23.108
0 前言
隨著社會和科學(xué)技術(shù)的發(fā)展,基于圖像繪制的虛擬現(xiàn)實技術(shù)已經(jīng)成為計算機視覺,圖像處理,計算機圖形學(xué),人工智能研究的熱點。雖然虛擬現(xiàn)實技術(shù)目前在很多領(lǐng)域中的實際應(yīng)用已有很大進展,例如虛擬現(xiàn)實技術(shù)己經(jīng)廣泛地應(yīng)用于軍事、醫(yī)學(xué)、建筑、商業(yè)等領(lǐng)域。
伴隨著虛擬現(xiàn)實技術(shù)(VR技術(shù))的日益成熟和飛速發(fā)展,在園林景觀設(shè)計中,對虛擬現(xiàn)實技術(shù)的應(yīng)用也不斷加強。
1 虛擬現(xiàn)實技術(shù)的簡介
虛擬現(xiàn)實技術(shù)又稱VR技術(shù),是20世紀90年代伴隨著計算機技術(shù)而興起的新興技術(shù),主要特點是可沉浸式的與虛擬場景進行交流互動,它的基礎(chǔ)媒介和載體是計算機和互聯(lián)網(wǎng),利用計算機生成一種仿真系統(tǒng)來模擬真實環(huán)境,利用互聯(lián)網(wǎng)充分傳播虛擬現(xiàn)實技術(shù),虛擬現(xiàn)實技術(shù)被應(yīng)用在軍事、醫(yī)學(xué)、商業(yè)、建筑規(guī)劃等多個領(lǐng)域,具有廣泛的發(fā)展前景。
而近幾年隨著虛擬現(xiàn)實技術(shù)的不斷發(fā)展,人機交互技術(shù)成為了虛擬現(xiàn)實領(lǐng)域的一項重要研究方向,由此而引發(fā)了一系列的交互性硬件載體的出現(xiàn),如3D虛擬眼鏡、浮動鼠標器、頭盔式虛擬顯示器、數(shù)據(jù)手套、數(shù)據(jù)衣、語音識別器等,通過這些傳感設(shè)備,體驗者可以對虛擬世界中的物體進行觀察和操作,使體驗者擁有沉浸式的體驗感受,融入五感體驗(視覺、嗅覺、聽覺、味覺、觸覺)的虛擬現(xiàn)實技術(shù)與以前的單純通過視覺來刺激體驗者的模式發(fā)生了質(zhì)的變化。
2 虛擬現(xiàn)實技術(shù)在校園環(huán)境設(shè)計領(lǐng)域的應(yīng)用
2.1 虛擬現(xiàn)實軟件
虛擬現(xiàn)實技術(shù)所應(yīng)用的軟件主要分為前期建模階段的軟件和后期渲染的軟件,前期建模階段的主流軟件有:MAYA、3Dsmax、犀牛、Google Sketchup,后期渲染的軟件主要有l(wèi)umion、unity3D、C4D、Vray、光輝城市、酷家樂。
2.2 應(yīng)用特點介紹
(1)準確性:利用計算機輔助系統(tǒng)下的虛擬現(xiàn)實技術(shù),在虛擬場景建立方面具有很強的精準度,根據(jù)實際設(shè)計中的真實尺寸可以創(chuàng)造出真實建立之后的效果感受,供使用者觀察。(2)實時渲染:利用虛擬現(xiàn)實軟件生成的實時渲染場景,具有良好的可視化效果,通過實時渲染技術(shù),生成真實的陽光、風(fēng)向、天氣、季節(jié),模擬大自然的真實光照,使體驗者沉浸于場景的游覽交互中,而且無需像傳統(tǒng)渲染那樣耗費大量時間。(3)想象力:除了虛擬現(xiàn)實校園環(huán)境具有模擬真實場景外,還可以進行模擬某些不可能發(fā)生的場景環(huán)境,使得游覽體驗過程中的趣味性得到極大的提高,超越體驗者的想象。
2.3 虛擬現(xiàn)實技術(shù)與3D動畫的區(qū)別
傳統(tǒng)的3D動畫與虛擬現(xiàn)實表現(xiàn)技術(shù)表面上看起來都具有動態(tài)效果,但實質(zhì)卻完全不同。虛擬現(xiàn)實技術(shù)可以進行人機交互,由人控制虛擬場景的鏡頭,具有實時渲染的效果,而3D動畫雖然也是動態(tài)效果,卻是不可操控的,由設(shè)計師事先做好播放的,更不能進行場景切換和鏡頭操控等動作。在虛擬場景下操控者可以對設(shè)計方案進行創(chuàng)作、修改和優(yōu)化,而3D動畫無法進行二次修改,只能重新制作而耗費了大量人力物力和時間成本。
2.4 虛擬現(xiàn)實技術(shù)在景觀設(shè)計中的應(yīng)用特色
傳統(tǒng)校園景觀設(shè)計的表現(xiàn)多側(cè)重于手繪圖和平面CAD圖和PS效果圖,在對外宣傳過程中,CAD圖和PS效果圖這些表現(xiàn)方法,無法提供給體驗者沉浸感和真實的3維感受,也無法根據(jù)意愿自由旋轉(zhuǎn)視角,通過平面圖推敲想象方案,無法以人的視角進行活動。而在虛擬現(xiàn)實系統(tǒng)中的校園景觀,我們利用計算機可以對不同人物的視線高度進行設(shè)置調(diào)整,體驗者可以隨意觀察場景內(nèi)的任意角度,讓體驗者有親臨現(xiàn)場的真實感受。
3 交互性設(shè)備在校園環(huán)境設(shè)計中的應(yīng)用發(fā)展
虛擬現(xiàn)實技術(shù)經(jīng)過十幾年的快速發(fā)展,在傳統(tǒng)的建模方法、效果表現(xiàn)等方面,已經(jīng)有了較大的突破和發(fā)展,隨著交互性設(shè)備在虛擬現(xiàn)實技術(shù)中的應(yīng)用,校園環(huán)境設(shè)計領(lǐng)域的效果表現(xiàn)也迎來了新的改變。lumion6.3結(jié)合虛擬3D眼鏡,把lumion中的場景導(dǎo)出全景模式,將3D眼鏡與lumion連接,就可以進行3維全景觀看效果圖,伴隨著頭部的晃動,3D眼鏡內(nèi)的的場景也會隨之變化。利用3D眼鏡觀察虛擬校園場景方案,相比傳統(tǒng)2維效果圖和平面圖,有了質(zhì)的飛越,對于校園方案的效果感受將會更強烈。國內(nèi)新晉軟件光輝城市也在虛擬現(xiàn)實表達領(lǐng)域有所發(fā)展,可以通過該軟件進行虛擬場景內(nèi)的互動,漫游和修改場景,利用外接鼠標可以對場景內(nèi)的鏡頭進行控制,利用鍵盤可以實現(xiàn)場景內(nèi)的移動與行走,全方位觀察場景內(nèi)的物體??峒覙纷鳛樾滦突ヂ?lián)網(wǎng)+的設(shè)計軟件,在室內(nèi)設(shè)計領(lǐng)域的虛擬場景表現(xiàn)上技術(shù)很成熟,通過該軟件制作的虛擬校園室內(nèi)實時渲染場景,體驗用戶可以通過鼠標進行3維角度旋轉(zhuǎn)進行瀏覽,比傳統(tǒng)3Dsmax渲染效果更直觀,最重要的是通過該軟件進行實時渲染效果好,速度快,節(jié)省了大量的渲染時間,從而節(jié)約了時間成本。
4 發(fā)展展望
伴隨著電腦和手機客戶端的日益強大、交互性硬件設(shè)施越來越完善,虛擬現(xiàn)實技術(shù)也將會越來越成熟,虛擬現(xiàn)實技術(shù)未來的兩大發(fā)展方向便是手機客戶端和交互性硬件的應(yīng)用,伴隨著虛擬現(xiàn)實技術(shù)的發(fā)展,在校園景觀環(huán)境設(shè)計中,也將更多的被應(yīng)用于方案設(shè)計階段、方案表達階段、以及后期虛擬校園運營服務(wù)階段,在21世紀,可視化的表達已經(jīng)不僅限于傳統(tǒng)二維平面的形式。
參考文獻:
[1]李國松.虛擬現(xiàn)實(VR)技術(shù)在風(fēng)景園林規(guī)劃與設(shè)計中的應(yīng)用研究[D].中南林業(yè)科技大學(xué)碩士學(xué)位論文,2007.
[2]蘆建國,蘇同向.虛擬現(xiàn)實技術(shù)與風(fēng)景園林設(shè)計[A].南京林業(yè)大學(xué),2007.
篇8
關(guān)鍵詞:目標跟蹤 視頻圖像 機器視覺
中圖分類號:TP3 文獻標識碼:A 文章編號:1672-3791(2012)06(a)-0007-01
隨著計算機技術(shù)的飛速發(fā)展,視頻圖像中的運動目標跟蹤作為計算機科學(xué)、人工智能、數(shù)學(xué)等多學(xué)科的結(jié)晶,逐漸成為圖像處理和計算機視覺領(lǐng)域的研究熱點,其應(yīng)用范圍也逐漸拓展,目前,運動目標跟蹤已經(jīng)運用到了智能人機交互、醫(yī)療診斷、軍事制導(dǎo)、天文觀測、安全監(jiān)控等眾多領(lǐng)域。因此,在實際應(yīng)用中,對運動目標跟蹤算法的研究具有重要的理論價值和現(xiàn)實意義。
1 基于區(qū)域的跟蹤
基于區(qū)域的跟蹤方法首先要得到包含目標的區(qū)域模板,模板的提取一般通過圖像分割獲得或者是預(yù)先人為確定,模板通常為略大于目標的矩形,也可以是不規(guī)則形狀,然后設(shè)定一個相似性度量,在序列圖像中搜索目標,把度量取極值時對應(yīng)的區(qū)域作為對應(yīng)幀中的目標區(qū)域。由于提取的目標模板是以目標整體作為對象,它包含了較完整的目標信息,因而具有較高的可信度。
由于該方法以目標的整體特征信息作為跟蹤依據(jù),所以在目標發(fā)生較小形變等情況下仍然可以準確的對目標進行跟蹤;在目標未被遮擋時,跟蹤的準確性和魯棒性也較好。其缺點首先是這種方法需要對整個圖像區(qū)域進行搜索,要求獲取的信息較多,因此比較耗時,不能滿足實際應(yīng)用中視頻監(jiān)控實時性的要求,這種方法一般用于跟蹤較小的目標或者對比度較低的目標;而且跟蹤的目標變形不能太大,否則會導(dǎo)致跟蹤精度下降甚至目標丟失;而且,當(dāng)目標出現(xiàn)太大遮擋時,也容易造成跟蹤目標的丟失。針對這些缺陷,近年來,對于基于區(qū)域跟蹤方法研究最多的是如何處理包含目標的模板更新,以保證跟蹤的連續(xù)性和穩(wěn)定性。
2 基于活動輪廓的跟蹤
基于活動輪廓跟蹤的基本思想是提取物體的邊界輪廓作為輪廓模板,利用封閉的曲線輪廓來表達運動目標,在后繼幀的二值邊緣圖像中跟蹤目標輪廓。由于這種方法所使用的模板是目標輪廓,并且匹配過程是在二值圖像中進行,所以相對基于區(qū)域的跟蹤算法來說,它的優(yōu)點是計算量較小,而且在目標被部分遮擋的情況下也能連續(xù)的進行跟蹤。近來發(fā)展很快的兩種基于輪廓匹配的跟蹤算法:一是主動輪廓線跟蹤算法(Snake模型),Kass[1]等人在1987 年提出了主動輪廓模型,也稱其為蛇模型,它是一條可變形曲線(Snake曲線),可任意調(diào)整曲線形狀使其與目標輪廓保持一致。另一種是基于Hausdorff距離的輪廓跟蹤算法?;贖ausdorff距離的形狀匹配不同于其他的形狀匹配,一方面,Hausdorff距離不需要建立兩個點集中的點之間一一對應(yīng)的關(guān)系,并且對圖像噪聲和晃動具有較好的魯棒性。其缺點是當(dāng)所匹配的點的數(shù)目比較大時,匹配效率會迅速降低,通常計算量也較大。
在基于活動輪廓方法中,初始化輪廓是整個算法的核心和關(guān)鍵,如何準確的獲取運動目標的初始輪廓也是算法研究中的一個難題,而且運動物體輪廓的更新比較困難,這也決定了基于活動輪廓的方法無法在目標跟蹤中得到普遍應(yīng)用。
3 基于特征的跟蹤算法
基于特征的跟蹤方法基本思想是,在跟蹤過程中首先提取目標的某個或某些具有不變性的特征,然后利用相關(guān)算法實現(xiàn)對運動目標的跟蹤。該方法包括特征提取和特征匹配兩個過程。目前常見的特征選擇有角點、紋理、色彩等,但在序列圖像中,單一的特征選取往往無法實現(xiàn)跟蹤的準確性。因此,基于多特征融合的目標跟蹤成為當(dāng)前研究的趨勢?;谔卣鞯姆椒ㄆ鋬?yōu)點是能夠在部分遮擋的情況下,仍舊實現(xiàn)目標跟蹤,在準確選取特征點的前提下,還可以克服關(guān)照改變以及目標發(fā)生幾何形變時帶來的跟蹤障礙。同時,該方法還可以將與粒子濾波器[2]、mean-shift算法[3]等結(jié)合使用,提高跟蹤的實時性和魯棒性。
4 基于模型的跟蹤
基于模型的跟蹤方法首先是對目標物體的外形特征進行建模,然后通過一定的匹配方法跟蹤目標,并進行模型的實時更新。常用的表征物體模型的形式一般分為三類:線圖模型、2D模型和3D模型。目前應(yīng)用較多的是利用物體的三維立體模型?;谀P偷母櫡椒词乖谀繕俗藨B(tài)變化和部分遮擋的情況下,仍舊可以精確分析目標的運動軌跡,實現(xiàn)可靠的跟蹤,因而它有較強的魯棒性。但是由于在現(xiàn)實生活中獲得所有運動目標的精確模型是非常困難的,因此限制了基于模型的跟蹤算法的使用。其次,該跟蹤方法需要大量的時間來計算復(fù)雜的模型,比較耗時,不能滿足跟蹤過程中的實時性和迅速性要求。
5 結(jié)語
視頻圖像跟蹤作為機器視覺領(lǐng)域研究的一個重要內(nèi)容,融合了多個學(xué)科的知識,具有很大的理論和應(yīng)用價值,盡管目前對視頻圖像中運動目標跟蹤的研究取得了較多的成果,但仍有很多亟待解決的問題,比如怎樣解決算法實時性和準確度之間的矛盾,同時,算法研究的通用性也始終未能取得全面性的突破和進展,因而研究進程中將會面臨許多的挑戰(zhàn)。伴隨著多媒體技術(shù)、生物學(xué)技術(shù)以及神經(jīng)理論知識的不斷進步,同時基于社會各行各業(yè)對于目標跟蹤技術(shù)的不斷增長的需求,相信不久之后,運動目標的跟蹤技術(shù)將會得到飛速的發(fā)展。
參考文獻
[1] KASS M,WITKIN A.Snakes:active contour models[J].International J of Computer Vision,1988,1:321~331.
篇9
關(guān)鍵字:多投影面;教學(xué)系統(tǒng);沉浸式環(huán)境
中圖分類號:G434 文獻標志碼:B 文章編號:1673-8454(2014)02-0070-03
虛擬現(xiàn)實技術(shù)的發(fā)展使得計算機技術(shù)不再是完成某一項工作的重要工具,而是朝著更人性化的一面發(fā)展,它可以使用戶足不出戶就享受到計算機虛擬世界給我們帶來的真實感覺。顯示技術(shù)是最終形成虛擬環(huán)境的關(guān)鍵步驟。目前沉浸式顯示技術(shù)正處于蓬勃發(fā)展的階段。
多投影面沉浸式虛擬環(huán)境是由多臺投影儀拼接而組成的大規(guī)模顯示設(shè)備,加上各種人機交互設(shè)備,能夠更加清晰地模擬現(xiàn)實世界場景以及對歷史的逼真反映,給用戶帶來更佳的視野范圍和更強的沉浸感,[1]它可以是對高性能計算結(jié)果或數(shù)據(jù)庫的可視化,也可以是純粹的虛擬空間。多投影面沉浸式虛擬環(huán)境為學(xué)校教學(xué)中創(chuàng)設(shè)鮮活的情境提供了技術(shù)支持,可以成為一種全新的教學(xué)平臺,學(xué)習(xí)者可以以各種自然的交互手段與虛擬世界進行交互獲取知識,改變了傳統(tǒng)學(xué)習(xí)環(huán)境下學(xué)習(xí)者被動接受的學(xué)習(xí)方式,讓學(xué)習(xí)者有一種主動學(xué)習(xí)的環(huán)境。
一、多投影面沉浸式虛擬環(huán)境的實現(xiàn)
1.系統(tǒng)總體設(shè)計
多投影面沉浸式虛擬環(huán)境按系統(tǒng)結(jié)構(gòu)主要分為:投影系統(tǒng)、用戶交互系統(tǒng)、圖形與計算系統(tǒng)。投影系統(tǒng)主要包括投影儀陣列以及投影屏幕,用來顯示大范圍畫面,實現(xiàn)沉浸式體驗;用戶交互系統(tǒng)是讓用戶通過各種虛擬現(xiàn)實交互設(shè)備與系統(tǒng)應(yīng)用程序之間進行自然的交互;圖形與計算系統(tǒng)是負責(zé)生成虛擬環(huán)境并對用戶的交互信息進行處理。
在投影系統(tǒng)搭建的過程中,圖1所示的多投影面沉浸式虛擬環(huán)境的系統(tǒng)設(shè)計方案如下:使用多臺PC機、多臺投影儀、一個攝像機,將其中一臺PC機作為圖像校正服務(wù)器(Client PC),負責(zé)捕獲投影儀的反饋信息,計算校準數(shù)據(jù);另外幾臺PC機(Server PC)作為客戶端,分別連接一臺投影儀,用于負責(zé)讀取、處理并根據(jù)相應(yīng)位置分布繪制各顯示區(qū)域的數(shù)據(jù);最后分別通過相應(yīng)的投影儀輸出到投影屏幕,構(gòu)成一個完整的無縫的顯示畫面,各計算機通過局域網(wǎng)進行連接和通信,采用鼠標或鍵盤等方式與系統(tǒng)進行交互。
2.關(guān)鍵技術(shù)
在多投影面沉浸式虛擬環(huán)境的構(gòu)建過程中,為了保證高清晰、實時流暢、邏輯上完整的顯示效果,幾何校正和顏色校正是最為關(guān)鍵的問題。技術(shù)流程如圖2所示。
幾何校正是為了解決單個投影在投影屏幕上產(chǎn)生畸變問題以及多個投影儀之間的畫面對齊問題,使得整個投影畫面看起來具有連續(xù)性。[2]
在本系統(tǒng)中,我們在前人研究的基礎(chǔ)之上,采用一臺反饋照相機來獲取投影圖像的幾何位置信息,根據(jù)圖像處理技術(shù)對原始圖像進行幾何畸變校正,使得各投影儀投出的圖像能形成一幅完整的畫面,使使用者完全沉浸在由多個投影儀創(chuàng)建的虛擬環(huán)境中。在實驗過程中考慮到由照相機鏡頭自身畸變而造成的扭曲,所以在幾何校正之前,我們采用張正友[3]提出的攝像機標定的方法對數(shù)碼相機進行標定,從而對拍攝出的圖像進行預(yù)校正。
幾何校正方案如下:
第一步,特征點采集與處理。對每臺投影儀以此投影一組特征圖案,利用數(shù)碼相機進行特征圖案采集。再利用圖像處理技術(shù)對拍攝圖像進行處理,對投影儀依次編號記為Hi,與Hi對應(yīng)的幀緩存中的特征點記為Fi;
第二步,求出所有投影儀顯示區(qū)域的最大有效顯示區(qū)域,并按等距離原則細分最大有效區(qū)域,記為Pi;
第三步,利用最小二乘法計算相機圖像到投影儀幀緩存圖像的映射關(guān)系,記為M。并求出映射矩陣M的逆矩陣M-1,再利用投影儀的有效顯示區(qū)域預(yù)校正緩存區(qū)的圖像。
為了真正地實現(xiàn)畫面的完整性,還有一個必須解決的問題就是顏色校正問題。顏色校正主要用來解決不同投影儀表現(xiàn)在顏色上的差異而導(dǎo)致畫面整體上的顏色不一致問題。所以要采用有效的方法盡可能地消除或縮小這種顏色差異,給人更好的視覺效果,具體算法本文不做詳細介紹。
二、多投影面沉浸式虛擬環(huán)境的特點及應(yīng)用實例
1.多投影面沉浸式虛擬環(huán)境的特點
①逼真性
在多投影面沉浸式虛擬環(huán)境中,逼真性主要表現(xiàn)在環(huán)境的真實性、視野范圍的無限擴充和對象動作的流暢展示。通過增加投影儀的數(shù)量,使用超大的物理尺寸屏幕,可以體現(xiàn)出真實的圖像質(zhì)量,實現(xiàn)單個投影所不能獲得的視覺效果,給用戶帶來身臨其境的感覺。
②沉浸感
理想的虛擬環(huán)境是使用戶達到難以分辨真假的程度。在多投影面沉浸式虛擬環(huán)境中,沉浸感主要是用戶對由計算機創(chuàng)造和顯示出來的虛擬環(huán)境的感知和認識。當(dāng)用戶置身在多投影面沉浸式虛擬環(huán)境中時,其感覺系統(tǒng)在處理來自虛擬環(huán)境中的視覺和其他感知數(shù)據(jù)時的方式如同在真實環(huán)境下一樣。
③交互性
在多投影面沉浸式虛擬環(huán)境中,用戶可以與計算機生成的虛擬環(huán)境進行自然交互,能夠用人類自然的感知能力與虛擬環(huán)境中的對象進行實時交互,讓我們很容易地進入角色,大大增強了參與其中的趣味性。
2.應(yīng)用實例
根據(jù)多投影面沉浸式虛擬環(huán)境的特點以及其他領(lǐng)域的廣泛應(yīng)用,在教學(xué)系統(tǒng)中的應(yīng)用可以分為兩大類別的學(xué)科:①結(jié)構(gòu)演示和位置信息展示等學(xué)科的學(xué)習(xí)。包括工程中的結(jié)構(gòu)圖、地理學(xué)習(xí)中的信息圖示、模型演示等。如化學(xué)學(xué)習(xí)過程中,通過多投影面沉浸式虛擬環(huán)境真實地展示出物質(zhì)分子結(jié)構(gòu)模型。②動作演示類的科目。主要包括具體的操作以及與操作相關(guān)的位置信息等。其在醫(yī)療手術(shù)、化學(xué)實驗的具體操作當(dāng)中有很好的應(yīng)用價值。
三、多投影面沉浸式虛擬環(huán)境對教學(xué)的促進作用
1.創(chuàng)建逼真的實習(xí)場,為情境學(xué)習(xí)提供更真實的學(xué)習(xí)環(huán)境
根據(jù)情境學(xué)習(xí)理論的觀點,實踐不是獨立于學(xué)習(xí)的,意義也不是與實踐和情境脈絡(luò)相分離的,真正的意義是在實踐和情境脈絡(luò)中加以協(xié)商的。[4]情境學(xué)習(xí)的關(guān)鍵是創(chuàng)設(shè)學(xué)習(xí)環(huán)境,在教學(xué)場所與空間內(nèi)必須有真實的情境作為學(xué)習(xí)活動的目標,即實習(xí)場的創(chuàng)建。然而學(xué)校的學(xué)習(xí)環(huán)境與現(xiàn)實生活中的環(huán)境是完全不一樣的。如何創(chuàng)建這樣的實習(xí)場就成為我們要考慮的問題。傳統(tǒng)的拋錨式教學(xué)是通過真實化的錄像境脈來呈現(xiàn)與解決問題相關(guān)的信息。然而,這樣只能使學(xué)習(xí)者被動地觀看,不能導(dǎo)致學(xué)習(xí)的發(fā)生。多投影面沉浸式虛擬環(huán)境通過無限擴充學(xué)習(xí)者的視角視野,為學(xué)習(xí)者營造出身臨其境的感覺,將整個學(xué)習(xí)活動都拋錨在真實的情境之中。它構(gòu)建出的實習(xí)場,不僅高度接近真實情境,將抽象化的知識具體化為可視化信息,而且其學(xué)習(xí)過程也與現(xiàn)實生活中的問題解決過程類似。學(xué)習(xí)者可以直接參與到“真實”的情境中,從而接觸許多平時不易接觸的場景。學(xué)生受到多感官強烈的刺激,增加了學(xué)習(xí)者體驗的真實性,改變了學(xué)習(xí)者僅僅面對靜態(tài)文字的傳統(tǒng)學(xué)習(xí)方式。
2.沉浸式的學(xué)習(xí)體驗,提高了學(xué)習(xí)者的參與性
人類學(xué)學(xué)家Lave在他的代表著作 《情境學(xué)習(xí):合法的邊緣性參與》中指出:學(xué)習(xí)應(yīng)該從參與實際活動的過程中學(xué)習(xí)知識。[5]也就是學(xué)習(xí)者不是被動的觀察者,而是主動參與其中的過程,那么如何使學(xué)習(xí)者主動參與其中而不偏離主題,這也是我們需要考慮的問題。另外,還有一些學(xué)者擔(dān)心學(xué)習(xí)者參與到真實情境中可能會帶來一些危險。多投影面沉浸式虛擬環(huán)境具有高仿真、寬屏幕、大視角、宏大震撼的效果,不再是傳統(tǒng)的書本教育和普通的多媒體教學(xué),能極大地提高學(xué)習(xí)者的學(xué)習(xí)熱情和參與度,將學(xué)習(xí)者完全吸引并投入到當(dāng)前情境中去,而忘卻了計算機設(shè)備的存在,過濾掉很多不相關(guān)的知覺,使注意力完全集中到學(xué)習(xí)任務(wù)中去。為學(xué)習(xí)者提供了豐富的情感虛擬體驗,使整個學(xué)習(xí)過程充滿樂趣,親身體驗更加強化了學(xué)習(xí)者的記憶和知識的建構(gòu)。
3.交互式學(xué)習(xí)環(huán)境,豐富了情境學(xué)習(xí)的趣味性
特洛伊?威廉姆斯(Troy Williams)在回顧了教育信息化發(fā)展的歷程之后,提出為了給予學(xué)生力量,讓我們把交互式學(xué)習(xí)技術(shù)帶進教室吧。[6]其中就講到了如何實現(xiàn)課堂教學(xué)中的交互活動最大化。多投影面沉浸式虛擬環(huán)境應(yīng)用于教學(xué)的過程中,為學(xué)習(xí)者提供了更加直接的交互環(huán)境,學(xué)習(xí)者在與虛擬信息的交互中獲得知識和經(jīng)驗,超越了傳統(tǒng)的以知識接受為主的間接獲取學(xué)習(xí)經(jīng)驗的方式,有助于培養(yǎng)學(xué)習(xí)者的動手實踐能力和自主探索問題的能力。學(xué)習(xí)者通過與系統(tǒng)進行交互,置身于“超越現(xiàn)實、身臨其境”的學(xué)習(xí)環(huán)境中。同時,多投影面沉浸式虛擬環(huán)境還是一個支持合作的協(xié)同環(huán)境,合作學(xué)習(xí)也是情境學(xué)習(xí)的重要方面,學(xué)習(xí)者可以以小組的形式參與到真實境脈中來,大大地改善了傳統(tǒng)的課堂學(xué)習(xí)氛圍,提高了學(xué)習(xí)者的學(xué)習(xí)積極性。在多投影面沉浸式虛擬環(huán)境中,學(xué)習(xí)者之間、學(xué)習(xí)者與教師之間進行協(xié)作,提出問題、討論結(jié)果、分享發(fā)現(xiàn)、探索未知的領(lǐng)域。
四、總結(jié)
本文探討了多投影面沉浸式虛擬環(huán)境對教學(xué)的重要作用,它所創(chuàng)造的逼真情境使學(xué)習(xí)者可以在課堂的實習(xí)場中體驗到現(xiàn)實生活的經(jīng)驗,并且支持交互操作、學(xué)習(xí)的交流合作等,學(xué)習(xí)者沉浸在虛擬環(huán)境中,實現(xiàn)知識的建構(gòu)和遷移,并還原到實際生活中去。多投影面沉浸式虛擬環(huán)境由于其高度沉浸感和交互性,在遙感技術(shù)、展覽、工業(yè)設(shè)計、計算機可視化中具有非常好的應(yīng)用前景。隨著虛擬現(xiàn)實技術(shù)的發(fā)展以及在教學(xué)中的應(yīng)用,多投影面沉浸式虛擬環(huán)境的教育意義也備受關(guān)注,其在教育領(lǐng)域仍有很大的發(fā)展空間,有待于我們積極開發(fā)和應(yīng)用。
參考文獻:
[1]林柏偉.PC架構(gòu)的多投影面沉浸式虛擬環(huán)境及其應(yīng)用[D].杭州:浙江大學(xué),2003.
[2]黃淼,周志光,陶煜波,林海.基于數(shù)碼相機參數(shù)還原的多屏拼接幾何校正技術(shù)[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2010(10).
[3]馬頌德,張正友.計算機視覺[M].北京:科學(xué)出版社,1998.
[4]俞貞.情境學(xué)習(xí)和學(xué)校環(huán)境中實習(xí)場的建構(gòu)[J].全球教育展望,2006(5):35.
[5]王文靜.人類學(xué)視野中的情境學(xué)習(xí)[J].外國中小學(xué)教育,2004(4).
篇10
關(guān)鍵詞:顯著區(qū)域檢測; 視覺顯著性檢測; 評測
中圖分類號:TP301 文獻標識碼:A文章編號:2095-2163(2014)01-0038-03
0引言
人類可以快速準確地識別視覺場中的顯著區(qū)域。在機器上模擬人類的這種能力對于使機器能夠像人類一樣處理視覺內(nèi)容是至關(guān)重要的。在過去的幾十年內(nèi),已有大量的顯著性檢測方法進入了公開發(fā)表。這些方法中的大部分[1-4]都趨向于預(yù)測人眼視覺注視點。然而這些人眼視覺注視點只是一些空間中的離散點,并不能準確地標識整個顯著區(qū)域[5-6]。
近些年來,一些科研單位和研究人員已經(jīng)開始密切關(guān)注于顯著區(qū)域檢測方法的構(gòu)建工作,如洛桑聯(lián)邦理工學(xué)院的Sabine Süsstrunk研究員,以色列理工學(xué)院的Ayellet Tal教授,微軟亞洲研究院的研究人員,清華大學(xué)的胡世民教授等。顯著區(qū)域檢測方法對以下領(lǐng)域發(fā)揮著重大的助益作用:圖像分割[7]、物體檢測[8]、內(nèi)容保持的圖像縮放[9]等。本文將對顯著區(qū)域檢測算法的研究現(xiàn)狀進行介紹,同時對典型的顯著區(qū)域檢測算法進行分析。
文章內(nèi)容組織結(jié)構(gòu)為:第2節(jié)對現(xiàn)有的顯著區(qū)域檢測算法進行了分類和分析;第3節(jié)對典型的顯著區(qū)域檢測算法進行了評測;最后在第4節(jié)給出了總結(jié),并展望了下一步的研究工作。
1顯著區(qū)域檢測算法分類及分析
感知方面的研究成果表明[10]:在低層視覺顯著性中,對比度是最重要的影響因素?,F(xiàn)有的顯著區(qū)域檢測算法通過計算每個圖像子區(qū)域同其一定范圍內(nèi)的相鄰區(qū)域的對比度來度量該圖像子區(qū)域的顯著性。而依據(jù)用于計算對比度的相鄰區(qū)域空間范圍的不同,現(xiàn)有的顯著區(qū)域檢測算法可分為兩類:基于局部對比的算法[6,11-12]和基于全局對比的算法[13-18]。下面分別對其探討如下。
1.1基于局部對比的顯著區(qū)域檢測算法
基于局部對比的顯著區(qū)域檢測算法通過計算每個圖像子區(qū)域或像素同其周圍一個小的局部領(lǐng)域的對比度來度量該圖像子區(qū)域或像素的顯著性。Ma等人[11]提出了一種基于局部對比和模糊生長的顯著區(qū)域檢測算法。該方法首先對輸入圖像進行均值濾波和降采樣。然后,該方法對新產(chǎn)生的低分辨率圖像中的每個像素計算其與周圍N個像素的LUV顏色向量的歐幾里得距離之和, 并將此值作為該像素的顯著值。為了從產(chǎn)生的顯著圖中提取顯著區(qū)域,Ma等人[11]運用模糊生長(fuzzy growing)的方法提取顯著區(qū)域。Liu等人[6]為了更加準確地檢測顯著區(qū)域,提出了一系列新的局部區(qū)域和全局特征用于計算顯著性。這些特征包括:多尺度對比,中心-周圍直方圖和顏色空間分布。該方法通過學(xué)習(xí)一個條件隨機場來高效地結(jié)合上述這些特征用于檢測顯著區(qū)域。由上可知,因為只是通過局部對比來檢測顯著區(qū)域,所以基于局部對比的方法趨向于關(guān)注邊緣周圍的區(qū)域,而不會突出整個顯著區(qū)域(在生成的顯著圖中即表現(xiàn)為邊緣周圍的區(qū)域具有高的顯著值,而顯著區(qū)域內(nèi)部的顯著值則較低)。這個問題可以稱其為“不一致突出顯著區(qū)域”問題。
1.2基于全局對比的顯著區(qū)域檢測算法
基于全局對比的顯著區(qū)域檢測算法將整幅圖像作為對比區(qū)域來計算每個圖像子區(qū)域或像素的顯著值。Achanta 等人[13]從頻率域角度出發(fā),首次提出了一種基于全局對比的顯著區(qū)域檢測的方法。該方法將經(jīng)過高斯低通濾波圖像中的每個像素值和整幅圖像的平均像素值之間的歐幾里得距離作為該點的顯著值。該方法非常簡單,時間消耗非常低,且實驗結(jié)果在查準率-差全率方面的效果也堪稱優(yōu)良。該方法使得顯著區(qū)域檢測向?qū)嵱没姆较蚋斑M了一步。然而Achanta 等人提出的方法[13]在以下兩種情況下會失效:
(1)顯著區(qū)域的顏色占圖像中的大部分,通過方法[11]計算后,背景會具有更高的顯著值;
(2)背景中含有少量突出的顏色,這樣背景中的這部分顏色的顯著值也會非常高。第1期景慧昀,等:顯著區(qū)域檢測算法綜述智能計算機與應(yīng)用第4卷
針對以上缺陷,作者又在文章[18]中將此方法完成了進一步的改進。作者發(fā)現(xiàn)檢測顯著區(qū)域邊緣和檢測顯著區(qū)域中心所需要的圖像頻段是不同的,由此而依據(jù)像素點越在圖像中心越可能接近區(qū)域中心這樣一個假設(shè),來調(diào)整均值濾波的帶寬,使得位于顯著區(qū)域不同位置的像素點則有不同的均值濾波帶寬。而且,即將經(jīng)過濾波后的圖像中每個像素值和該像素所在的對稱子窗口內(nèi)的像素平均值的歐幾里得空間距離作為該點的顯著值。經(jīng)過這樣的調(diào)整,算法的時間復(fù)雜度有所提高,但是實驗結(jié)果性能卻有較大提升。
Cheng等人在文章[15]中提出了兩種簡單快速且更為準確的顯著區(qū)域檢測方法。第一種方法只采用顏色的全局對比,作者將每個像素點和圖像中其它所有像素的Lab顏色向量的歐幾里得距離之和的1 / N(N為該圖的像素點個數(shù))作為該點的顯著值。為了更快速地開展計算,作者對圖像中的顏色進行了量化,以顏色為單位計算每種顏色和圖像中其它所有顏色的歐幾里得距離。第一種方法中只考慮了顏色的全局對比,并未考慮空間位置關(guān)系,使得和顯著區(qū)域顏色接近的背景區(qū)域的顯著值也較高。作者在加入空間位置關(guān)系后又一次提出了方法二:首先對圖像進行分割,獲得一定數(shù)量的子區(qū)域?;谧訁^(qū)域,將子區(qū)域之間的空間位置關(guān)系作為權(quán)值計算該子區(qū)域與圖像其它所有子區(qū)域之間的相似度之和。方法2比方法1的時間復(fù)雜度略高(主要是由于引入了圖像分割操作,該操作比較耗時),但是實驗結(jié)果得到了較大提高。通過仿真驗證,Cheng等人[15]提出的方法簡單高效。
He等人[17]在Cheng的研究基礎(chǔ)上,提出了結(jié)合全局對比和顏色空間分布的顯著區(qū)域檢測方法。作者指出顏色的空間分布越緊湊,該類顏色就應(yīng)具有更高的顯著性,反之亦然。該方法將每類顏色所屬像素空間位置的方差作為衡量顏色空間分布的指標,生成顏色空間顯著圖。其后將顏色空間顯著圖和直方圖對比度顯著圖或區(qū)域?qū)Ρ榷蕊@著圖進行疊加得到最終的顯著圖。Perazzi等人[16]也提出了一個基于對比度和空間分布的顯著區(qū)域檢測方法。
上述這些基于全局對比的顯著區(qū)域檢測方法可以在一定程度上消減“不一致突出顯著區(qū)域”問題。但是當(dāng)顯著區(qū)域非常大或者圖像背景非常復(fù)雜時,這些基于全局對比的方法就趨向于突出背景區(qū)域而不是顯著區(qū)域了。因而該問題可以稱之為“突出圖像背景”問題。
2顯著區(qū)域檢測算法測試
本節(jié)使用Achanta等人[13]提出的公開可用的測試圖像庫來評價現(xiàn)有典型的顯著區(qū)域檢測算法的性能。該測試圖像庫包含了1 000幅自然圖像以及與其相對應(yīng)標識顯著區(qū)域的二值基準圖像,并將查準率-查全率曲線作為衡量顯著區(qū)域檢測算法性能的評價指標。
圖1顯示了近期6個性能最先進的顯著區(qū)域檢測方法(MZ[11]、 LC[14]、 FT[13]、 HC[15]、 RC[15]、 SF[16])在Achanta數(shù)據(jù)集上的評測結(jié)果。這些方法中,對于FT、HC、RC和SF,本節(jié)使用作者的原始的實現(xiàn)程序來生成對應(yīng)的顯著圖。而對于MZ和LC方法,本節(jié)直接使用Ma等人[11]和Cheng等人[15]所提供的顯著圖。由圖1可以看出SF在Achanta等人[13]提供的測試集上取得了最好的檢測性能。
3結(jié)論與展望
本文對現(xiàn)有的顯著區(qū)域檢測方法進行概述。現(xiàn)有的顯著區(qū)域檢測方法是利用局部鄰域或者整幅圖像作為對比區(qū)域來計算顯著性的。從本質(zhì)上而言,現(xiàn)有方法使用的并不恰當(dāng)?shù)膶Ρ葏^(qū)域?qū)е铝似湎鄳?yīng)具有的“不一致突出顯著區(qū)域”和“突出圖像背景”兩個問題。在進行對比度計算之前,首先實現(xiàn)對比區(qū)域預(yù)估計的顯著區(qū)域檢測方法將成為下一步的發(fā)展趨勢。
參考文獻:
[1]ITTI L, KOCH C, NIEBUR E. A model of saliency-based visual attention for rapid scene analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(11):1254–1259.
[2]MURRAY N, VANRELL M, OTAZU X, et al. Saliency estimation using a non-parametric low-level vision model[C] // IEEE Conference on Computer Vision and Pattern Recognition. 2011:433–440.
[3]HOU X, ZHANG L. Saliency detection: A spectral residual approach[C] // IEEE Conference on Computer Vision and Pattern Recognition. 2007:1–8.
[4]BAN S, JANG Y, LEE M. A?ective saliency map considering psychological distance[J]. Neurocomputing, 2011, 74(11):1916–1925.
[5]LIU T, SUN J, ZHENG N, et al. Learning to detect a salient object[C] // IEEE Conference on Computer Vision and Pattern Recognition. 2007:1–8.
[6]LIU T, YUAN Z, SUN J, et al. Learning to detect a salient object[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 33 (2) (2011) 353–367. , 2011, 33(2):353–367.
[7]KO B C, NAM J Y. Object-of-interest image segmentation based on human attention and semantic region clustering[J]. Journal of Optical Society of America A, 2006, 23(10):2462–2470.
[8]RUTISHAUSER U, WALTHER D, KOCH C, et al. Is bottom-up attention useful for object recognition?[C] // IEEE Conference on Computer Vision and Pattern Recognition, 2004:30–37.
[9]ZHANG G X, CHENG M M, HU S M, et al. A shape-preserving approach to image resizing[C] // Computer Graphics Forum, 2009:1897–1906.
[10]EINHAS?ER W, KO^ENIG P. Does luminance-contrast contribute to a saliency map for overt visual attention?[J]. European Journal of Neuroscience, 2003, 17 (5):1089–1097.
[11]Y. Ma, H. Zhang, Contrast-based image attention analysis by using fuzzy growing[C] // ACM International Conference on Multimedia, 2003:374–381.
[12]KLEIN D, FRINTROP S. Center-surround divergence of feature statistics for salient object detection[C] // IEEE International Conference on Computer Vision, 2011:2214–2219.
[13]ACHANTA R, HEMAMI S, ESTRADA F, et al. Frequency-tuned salient region detection[C] // IEEE Conference on Computer Vision and Pattern Recognition, 2009:1597–1604.
[14]ZHAI Y, SHAH M. Visual attention detection in video sequences using spatiotemporal cues[C] // ACM International Conference on Multimedia, 2006:815–824.
[15]CHENG M, ZHANG G, MITRA N, et al. Global contrast based salient region detection[C] // IEEE Conference on Computer Vision and Pattern Recognition, 2011:409–416.
[16]PERAZZI F, KRAHENBUHL P, PRITCH Y, et al. Saliency ?lters: Contrast based ?ltering for salient region detection [C] // IEEE Conference on Computer Vision and Pattern Recognition, 2012:733–740.