計(jì)算機(jī)視覺(jué)的展望范文

時(shí)間:2024-01-04 17:47:19

導(dǎo)語(yǔ):如何才能寫好一篇計(jì)算機(jī)視覺(jué)的展望,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

篇1

關(guān)鍵詞:計(jì)算機(jī)視覺(jué)技術(shù);食品工業(yè);分級(jí);圖像處理

中圖分類號(hào): TS207 文獻(xiàn)標(biāo)識(shí)碼:A

隨著微型個(gè)人計(jì)算機(jī)應(yīng)用的越來(lái)越廣泛,以及計(jì)算機(jī)在綜合學(xué)科中應(yīng)用的深入研究,現(xiàn)如今在工農(nóng)業(yè)、軍事國(guó)防、醫(yī)學(xué)衛(wèi)生等眾多領(lǐng)域的使用和研究方面計(jì)算機(jī)視覺(jué)技術(shù)都起到了至關(guān)重要的作用,為了節(jié)省人力、降低成本、減少誤差,該項(xiàng)技術(shù)在食品企業(yè)、科研院所、檢測(cè)機(jī)構(gòu)中的應(yīng)用更加普遍。如今,在農(nóng)產(chǎn)品藥物殘留檢測(cè)、水果重量分級(jí)、等級(jí)篩選、質(zhì)量監(jiān)管等方面計(jì)算機(jī)視覺(jué)技術(shù)有眾多應(yīng)用。

1 計(jì)算機(jī)視覺(jué)技術(shù)概述

計(jì)算機(jī)視覺(jué)技術(shù)是利用計(jì)算機(jī)、攝像機(jī)、圖像卡以及相關(guān)處理技術(shù)來(lái)模擬人的視覺(jué),用以識(shí)別、感知和認(rèn)識(shí)我們生活的世界[1]。該技術(shù)是模擬識(shí)別人工智能、心理物理學(xué)、圖像處理、計(jì)算機(jī)科學(xué)及神經(jīng)生物學(xué)等多領(lǐng)域的綜合學(xué)科。計(jì)算機(jī)視覺(jué)技術(shù)用攝像機(jī)模擬人眼,用計(jì)算機(jī)模擬大腦,用計(jì)算機(jī)程序和算法來(lái)模擬人對(duì)事物的認(rèn)識(shí)和思考,替代人類完成程序?yàn)槠湓O(shè)定的工作。該技術(shù)由多個(gè)相關(guān)的圖像處理系統(tǒng)組成,主要包括光源提供系統(tǒng)、圖像提取系統(tǒng)、計(jì)算機(jī)數(shù)據(jù)運(yùn)算系統(tǒng)等。原理是:首先通過(guò)攝像機(jī)獲得所需要的圖像信息,然后利用信號(hào)轉(zhuǎn)換將獲得的圖像信息轉(zhuǎn)變?yōu)閿?shù)字圖像以便計(jì)算機(jī)正確識(shí)別[2]。隨著科學(xué)技術(shù)的發(fā)展,計(jì)算機(jī)技術(shù)在各個(gè)領(lǐng)域得到廣泛應(yīng)用,計(jì)算機(jī)視覺(jué)技術(shù)不僅在代替人類視覺(jué)上取得了重大成就,而且在很多具體工作方便超越了人的視覺(jué)功能。計(jì)算機(jī)視覺(jué)計(jì)算有如此快速的發(fā)展,是因?yàn)榕c人類的視覺(jué)相比該技術(shù)具有以下顯著優(yōu)勢(shì)[3]。

1.1 自動(dòng)化程度高

計(jì)算機(jī)視覺(jué)可以實(shí)現(xiàn)對(duì)農(nóng)產(chǎn)品的多個(gè)外形和內(nèi)在品質(zhì)指標(biāo)進(jìn)行同時(shí)檢測(cè)分析,可以進(jìn)行整體識(shí)別、增強(qiáng)對(duì)目標(biāo)識(shí)別的準(zhǔn)確性。

1.2 實(shí)現(xiàn)無(wú)損檢測(cè)

由于計(jì)算機(jī)視覺(jué)技術(shù)對(duì)農(nóng)產(chǎn)品的識(shí)別是通過(guò)掃描、攝像,而不需要直接接觸,可以減少對(duì)所檢測(cè)食品的傷害。

1.3 穩(wěn)定的檢測(cè)精度

設(shè)計(jì)的運(yùn)行程序確定后,計(jì)算機(jī)視覺(jué)技術(shù)的識(shí)別功能就會(huì)具有統(tǒng)一的識(shí)別標(biāo)準(zhǔn),具有穩(wěn)定的檢測(cè)精度,避免了人工識(shí)別和檢測(cè)時(shí)主觀因素所造成的差異。

2 計(jì)算機(jī)視覺(jué)技術(shù)在食品檢測(cè)中的應(yīng)用

20世紀(jì)70年代初,學(xué)者開(kāi)始研究計(jì)算機(jī)視覺(jué)技術(shù)在食品工業(yè)中的應(yīng)用,近幾十年電子技術(shù)得到快速發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)也越來(lái)越成熟。國(guó)內(nèi)外學(xué)者在研究計(jì)算機(jī)視覺(jué)技術(shù)在食品工業(yè)中的應(yīng)用方面主要集中在該技術(shù)對(duì)果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識(shí)別、內(nèi)部無(wú)損檢測(cè)等方面。國(guó)內(nèi)有關(guān)計(jì)算機(jī)視覺(jué)技術(shù)在食品業(yè)中的應(yīng)用研究起始于90年代,比國(guó)外發(fā)達(dá)國(guó)家晚多達(dá)20a,但是發(fā)展很快。

2.1 計(jì)算機(jī)視覺(jué)技術(shù)在果蔬分級(jí)中的應(yīng)用研究

計(jì)算機(jī)視覺(jué)技術(shù)在食品檢測(cè)中的應(yīng)用研究相當(dāng)廣泛,從外部直徑、成熟度的檢測(cè)到內(nèi)部腐爛程度的檢測(cè)都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計(jì)算機(jī)算法計(jì)算水果的半徑,進(jìn)而得出果蔬的最大直徑。研究表明,該算法不僅降低了計(jì)算量而且提高了計(jì)算精度,此方法用于水果分級(jí)的誤差不超過(guò)2mm,高于國(guó)際水果分級(jí)標(biāo)準(zhǔn)所規(guī)定的5mm分類標(biāo)準(zhǔn)差,可在工業(yè)生產(chǎn)中很好應(yīng)用。李慶中[5]也利用圖像的缺陷分割算法研究了計(jì)算機(jī)視覺(jué)技術(shù)在蘋果檢測(cè)與分級(jí)中的應(yīng)用,結(jié)果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎(chǔ),結(jié)合模糊聚類知識(shí)利用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)檢測(cè)蘋果缺陷域,檢測(cè)不僅快速而且結(jié)果精確。劉禾等[7]通過(guò)研究認(rèn)為蘋果的表面缺陷可以利用計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行檢測(cè),計(jì)算機(jī)視覺(jué)技術(shù)還可以將蘋果按照檢測(cè)結(jié)果進(jìn)行分級(jí),把檢測(cè)過(guò)的蘋果分成裂果、刺傷果、碰傷果和蟲(chóng)傷果等類別。梨的果梗是否存在是梨類分級(jí)的重要特征之一,應(yīng)義斌等[8]通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)、圖像處理技術(shù)、傅立葉描述子的方法來(lái)描述和識(shí)別果形以及有無(wú)果柄,其識(shí)別率達(dá)到90%。楊秀坤等[9]綜合運(yùn)用計(jì)算機(jī)視覺(jué)技術(shù)、遺傳算法、多層前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng),實(shí)現(xiàn)了具有精確度高、靈活性強(qiáng)和速度快等優(yōu)點(diǎn)的蘋果成熟度自動(dòng)判別。陳育彥等[10]采用半導(dǎo)體激光技術(shù)、計(jì)算機(jī)視覺(jué)技術(shù)和圖像分析技術(shù)相結(jié)合的方法檢測(cè)蘋果表面的機(jī)械損傷和果實(shí)內(nèi)部的腐爛情況,初步驗(yàn)證了計(jì)算機(jī)視覺(jué)技術(shù)檢測(cè)蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)對(duì)水果圖像的邊緣進(jìn)行檢測(cè),然后確定水果的大小用以水果分級(jí)。試驗(yàn)表明,該方法比傳統(tǒng)的檢測(cè)方法速度快、準(zhǔn)確率高,適用于計(jì)算機(jī)視覺(jué)的實(shí)時(shí)檢測(cè)。朱偉[12]在模糊顏色的基礎(chǔ)上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對(duì)西紅柿的缺陷進(jìn)行分割,結(jié)果顯示準(zhǔn)確率高達(dá)96%。曹樂(lè)平等[13]人研究了溫州蜜柑的果皮顏色與果實(shí)可滴定酸含量以及糖分含量之間的相關(guān)性,然而根據(jù)相關(guān)性,樣品檢測(cè)的正確識(shí)別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個(gè)方向獲取蘋果的圖像,并通過(guò)計(jì)算機(jī)自動(dòng)分析圖像數(shù)據(jù),對(duì)蘋果的外徑、體積、以及圓形度等參數(shù)進(jìn)行處理,與人工檢測(cè)相比,計(jì)算機(jī)視覺(jué)技術(shù)具有檢測(cè)效率高,檢測(cè)標(biāo)準(zhǔn)統(tǒng)一性好等優(yōu)點(diǎn)。Blasco. J [15]通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)分析柑橘果皮的缺陷,進(jìn)而對(duì)其在線分級(jí),正確率約為95%。趙廣華等[16]人綜合計(jì)算機(jī)視覺(jué)識(shí)別系統(tǒng)、輸送轉(zhuǎn)換系統(tǒng)、輸送翻轉(zhuǎn)系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實(shí)時(shí)監(jiān)測(cè)、品質(zhì)動(dòng)態(tài)的智能分級(jí)系統(tǒng),能夠很好地實(shí)現(xiàn)蘋果分級(jí)。王江楓等[17]建立了芒果重量與攝影圖像的相互關(guān)系,應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)檢測(cè)桂香芒果和紫花芒果的重量和果面損傷,按重量分級(jí)其準(zhǔn)確率均為92%,按果面損傷分級(jí)的準(zhǔn)確率分別為76%和80%。

2.2 計(jì)算機(jī)視覺(jué)技術(shù)在禽蛋檢測(cè)中的應(yīng)用研究

禽蛋企業(yè)在生產(chǎn)過(guò)程中,產(chǎn)品的分級(jí)、品質(zhì)檢測(cè)主要采用人工方法,不僅需要大量的物力人力,而且存在勞動(dòng)強(qiáng)度大、人為誤差大、工作效率低等缺點(diǎn),計(jì)算機(jī)視覺(jué)技術(shù)可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽(yáng)靜怡等[18]利用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)檢測(cè)雞蛋蛋殼裂紋,利用攝像機(jī)獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術(shù),獲得裂紋形狀并判斷,試驗(yàn)結(jié)果表明,計(jì)算機(jī)視覺(jué)技術(shù)對(duì)雞蛋蛋殼裂紋的檢測(cè)準(zhǔn)確率高達(dá)98%。汪俊德等[19]以計(jì)算機(jī)視覺(jué)技術(shù)為基礎(chǔ),設(shè)計(jì)出一套雙黃雞蛋檢測(cè)系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設(shè)計(jì)的數(shù)學(xué)模型對(duì)比來(lái)實(shí)現(xiàn)雙黃雞蛋的檢測(cè)和識(shí)別,檢測(cè)準(zhǔn)確率高達(dá)95%。鄭麗敏等[20]人通過(guò)高分辨率的數(shù)字?jǐn)z像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學(xué)模型來(lái)預(yù)測(cè)雞蛋的新鮮度和貯藏期,結(jié)果表明,計(jì)算機(jī)視覺(jué)技術(shù)對(duì)雞蛋的新鮮度、貯藏期進(jìn)行預(yù)測(cè)的結(jié)果準(zhǔn)確率為94%。潘磊慶等[21]通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)和聲學(xué)響應(yīng)信息技術(shù)相結(jié)合的方法檢測(cè)裂紋雞蛋,其檢測(cè)準(zhǔn)確率達(dá)到98%。Mertens K等[22]人基于計(jì)算機(jī)視覺(jué)技術(shù)研發(fā)了雞蛋的分級(jí)檢測(cè)系統(tǒng),該系統(tǒng)識(shí)別帶污漬雞蛋的正確率高達(dá)99%。

2.3 計(jì)算機(jī)視覺(jué)技術(shù)在檢測(cè)食品中微生物含量中的應(yīng)用研究

計(jì)算機(jī)技術(shù)和圖像處理技術(shù)在綜合學(xué)科中的應(yīng)用得到快速發(fā)展,在微生物快速檢測(cè)中的應(yīng)用也越來(lái)越多,主要是針對(duì)微生物微菌落的處理。食品工業(yè)中計(jì)算機(jī)視覺(jué)技術(shù)在微生物檢測(cè)方面的研究和應(yīng)用以研究單個(gè)細(xì)胞為主,并在個(gè)體細(xì)胞的研究上取得了一定的進(jìn)展。殷涌光等[23]以顏色特征分辨技術(shù)為基礎(chǔ),設(shè)計(jì)了一套應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)快速定量檢測(cè)食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測(cè)結(jié)果與傳統(tǒng)方法的檢測(cè)結(jié)果具有很好的相關(guān)性,但與傳統(tǒng)方法相比,可以節(jié)省5d時(shí)間,檢測(cè)時(shí)間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質(zhì)。Lawless等[24]人等時(shí)間段測(cè)定培養(yǎng)基上的細(xì)胞密度,然后通過(guò)計(jì)算機(jī)技術(shù)建立時(shí)間和細(xì)胞密度之間的動(dòng)態(tài)關(guān)聯(lián),利用該關(guān)聯(lián)可以預(yù)測(cè)和自動(dòng)檢測(cè)微生物的生長(zhǎng)情況,如通過(guò)計(jì)算機(jī)控制自動(dòng)定量采集檢測(cè)對(duì)象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計(jì)算機(jī)可以顯示被檢測(cè)菌落的具置,并且根據(jù)動(dòng)態(tài)關(guān)聯(lián)計(jì)算機(jī)視覺(jué)系統(tǒng)可以同時(shí)處理多個(gè)不同的樣品。郭培源等[25]人對(duì)計(jì)算機(jī)視覺(jué)技術(shù)用于豬肉的分級(jí)進(jìn)行了研究,結(jié)果顯示計(jì)算機(jī)視覺(jué)技術(shù)在識(shí)別豬肉表面微生物數(shù)量上與國(guó)標(biāo)方法檢測(cè)的結(jié)果顯著相關(guān),該技術(shù)可以有效地計(jì)算微生物的數(shù)量。Bayraktar. B等[26]人采用計(jì)算機(jī)視覺(jué)技術(shù)、光散射技術(shù)(BARDOT)和模式識(shí)別技術(shù)相結(jié)合的方法來(lái)快速檢測(cè)李斯特菌,在獲取該菌菌落中的形態(tài)特征有對(duì)圖像進(jìn)行分析處理達(dá)到對(duì)該菌的分類識(shí)別。殷涌光等[27]人綜合利用計(jì)算機(jī)視覺(jué)、活體染色、人工神經(jīng)網(wǎng)絡(luò)、圖像處理等技術(shù),用分辨率為520萬(wàn)像素的數(shù)字?jǐn)z像機(jī)拍攝細(xì)菌內(nèi)部的染色效果,并結(jié)合新的圖像處理算法,對(duì)細(xì)菌形態(tài)學(xué)的8個(gè)特征參數(shù)進(jìn)行檢測(cè),檢測(cè)結(jié)果與傳統(tǒng)檢測(cè)結(jié)果顯著相關(guān)(相關(guān)系數(shù)R=0.9987),和傳統(tǒng)檢測(cè)方法相比該方法具有操作簡(jiǎn)單、快速、結(jié)果準(zhǔn)確、適合現(xiàn)場(chǎng)快速檢測(cè)等特點(diǎn)。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征,識(shí)別出微生物數(shù)量,并以此作為衡量乳制品質(zhì)量是否達(dá)標(biāo)的依據(jù),并對(duì)產(chǎn)品進(jìn)行分級(jí)。

2.4計(jì)算機(jī)視覺(jué)技術(shù)在其他食品產(chǎn)業(yè)中的應(yīng)用研究

里紅杰等[30]通過(guò)提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對(duì)照數(shù)學(xué)模型,采用數(shù)字圖像處理技術(shù)、計(jì)算機(jī)識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)貝類和蝦類等海產(chǎn)品的無(wú)損檢測(cè)和自動(dòng)化分類、分級(jí)和質(zhì)量評(píng)估,并通過(guò)實(shí)例詳細(xì)闡述了該技術(shù)的實(shí)現(xiàn)方法,證實(shí)了此項(xiàng)技術(shù)的有效性。計(jì)算機(jī)視覺(jué)技術(shù)還可以檢驗(yàn)玉米粒形和玉米種子質(zhì)量、識(shí)別玉米品種和玉米田間雜草[31]。晁德起等[32]通過(guò)x射線照射獲取毛葉棗的透視圖像后,運(yùn)用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)圖像進(jìn)行分析評(píng)估,毛葉棗可食率的評(píng)估結(jié)果與運(yùn)用物理方法測(cè)得的結(jié)果平均誤差僅為1.47%,因此得出結(jié)論:計(jì)算機(jī)視覺(jué)技術(shù)可以應(yīng)用于毛葉棗的自動(dòng)分級(jí)。Gokmen,V等通用對(duì)薯片制作過(guò)程中圖像像素的變化來(lái)研究薯片的褐變率,通過(guò)分析特色參數(shù)來(lái)研究薯片中丙烯酰胺的含量和褐變率也關(guān)系,結(jié)果顯示兩項(xiàng)參數(shù)相關(guān)性為0.989,從而可以應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)預(yù)測(cè)加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應(yīng)用。韓仲志等人拍攝和掃描11類花生籽粒,每類100顆不同等級(jí)的花生籽粒的正反面圖像,利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)花生內(nèi)部和外部采集圖像,并通過(guò)圖像對(duì)其外在品質(zhì)和內(nèi)在品質(zhì)進(jìn)行分析,并建立相應(yīng)的數(shù)學(xué)模型,該技術(shù)在對(duì)待檢樣品進(jìn)行分級(jí)檢測(cè)時(shí)的正確率高達(dá)92%。另外,郭培源等人以國(guó)家標(biāo)準(zhǔn)為依據(jù),通過(guò)數(shù)字?jǐn)z像技術(shù)獲取豬肉的細(xì)菌菌斑面積、脂肪細(xì)胞數(shù)、顏色特征值以及氨氣等品質(zhì)指標(biāo)來(lái)實(shí)現(xiàn)豬肉新鮮程度的分級(jí)辨認(rèn)。

3 展望

新技術(shù)的研究與應(yīng)用必然伴隨著坎坷,從70年代初計(jì)算機(jī)視覺(jué)技術(shù)在食品工業(yè)中進(jìn)行應(yīng)用開(kāi)始,就遇到了很多問(wèn)題。計(jì)算機(jī)視覺(jué)技術(shù)在食品工業(yè)中的研究及應(yīng)用主要存在以下幾方面的問(wèn)題。

3.1 檢測(cè)指標(biāo)有限

計(jì)算機(jī)視覺(jué)技術(shù)在檢測(cè)食品單一指標(biāo)或者以一個(gè)指標(biāo)作為分級(jí)標(biāo)準(zhǔn)進(jìn)行分級(jí)時(shí)具有理想效果,但以同一食品的多個(gè)指標(biāo)共同作為分級(jí)標(biāo)準(zhǔn)進(jìn)行檢測(cè)分級(jí),則分級(jí)結(jié)果誤差較大。例如,Davenel等通過(guò)計(jì)算機(jī)視覺(jué)對(duì)蘋果的大小、重量、外觀損傷進(jìn)行分析,但研究結(jié)果顯示,系統(tǒng)會(huì)把花粵和果梗標(biāo)記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復(fù)雜,造成分級(jí)誤差很大,分級(jí)正確率只有69%。Nozer等以計(jì)算機(jī)視覺(jué)為主要技術(shù)手段,獲取水果的圖像,進(jìn)而通過(guò)分析圖像來(lái)確定水果的形狀、大小、顏色和重量,并進(jìn)行分級(jí),其正確率僅為85.1%。

3.2 兼容性差

計(jì)算機(jī)視覺(jué)技術(shù)針對(duì)單一種類的果蔬分級(jí)檢測(cè)效果顯著,但是同一套系統(tǒng)和設(shè)備很難用于其他種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計(jì)算機(jī)視覺(jué)設(shè)備。Reyerzwiggelaar等利用計(jì)算機(jī)視覺(jué)檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測(cè)桃子的準(zhǔn)確率顯著高于杏的。Majumdar.S等利用計(jì)算機(jī)視覺(jué)技術(shù)區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識(shí)別正確率有明顯差異。

3.3 檢測(cè)性能受環(huán)境制約

現(xiàn)階段的計(jì)算機(jī)視覺(jué)技術(shù)和配套的數(shù)學(xué)模型適用于簡(jiǎn)單的環(huán)境,在復(fù)雜環(huán)境下工作時(shí)會(huì)產(chǎn)生較大的誤差。Plebe等利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)果樹(shù)上的水果進(jìn)行識(shí)別定位,但研究發(fā)現(xiàn)由于光照條件以及周邊環(huán)境的影響,水果的識(shí)別和定位精度不高,不能滿足實(shí)際生產(chǎn)的需要。

綜上所述,可看出國(guó)內(nèi)外學(xué)者對(duì)計(jì)算機(jī)視覺(jué)技術(shù)在食品工業(yè)中的應(yīng)用進(jìn)行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個(gè)學(xué)科,在研究和應(yīng)用的過(guò)程中,取得了較大的經(jīng)濟(jì)效益,也遇到了很多問(wèn)題,在新的形勢(shì)下,計(jì)算機(jī)視覺(jué)技術(shù)和數(shù)碼拍攝、圖像處理、人工神經(jīng)網(wǎng)絡(luò),數(shù)學(xué)模型建設(shè)、微生物快速計(jì)量等高新技術(shù)相融合的綜合技術(shù)逐漸成為了各個(gè)領(lǐng)域?qū)W者的研究熱點(diǎn),以計(jì)算機(jī)視覺(jué)為基礎(chǔ)的綜合技術(shù)也將在食品工業(yè)中發(fā)揮更加重要的作用。

參考文獻(xiàn)

[1] 寧紀(jì)鋒,龍滿生,何東健.農(nóng)業(yè)領(lǐng)域中的計(jì)算機(jī)視覺(jué)研究[J].計(jì)算機(jī)與農(nóng)業(yè),2001(01):1-3.

[2] 李崢.基于計(jì)算機(jī)視覺(jué)的蔬菜顏色檢測(cè)系統(tǒng)研究[D].吉林:吉林大學(xué),2004.

[3] 曾愛(ài)群.基于計(jì)算機(jī)視覺(jué)與神經(jīng)網(wǎng)絡(luò)的芒果等級(jí)分類研究[D].桂林:桂林工學(xué)院,2008.

[4] 韓偉,曾慶山.基于計(jì)算機(jī)視覺(jué)的水果直徑檢測(cè)方法的研究[J].中國(guó)農(nóng)機(jī)化,2011(05):25-29.

[5] 李慶中.蘋果自動(dòng)分級(jí)中計(jì)算機(jī)視覺(jué)信息快速獲取與處理技術(shù)的研究[D].北京:中國(guó)農(nóng)業(yè)大學(xué),2000.

[6] 孫洪勝,李宇鵬,王成,等.基于計(jì)算機(jī)視覺(jué)的蘋果在線高效檢測(cè)與分級(jí)系統(tǒng)[J].儀表技術(shù)與傳感器,2011(06):62-65.

[7] 劉禾,汀慰華.水果果形判別人工神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)的研究[J].農(nóng)業(yè)工程學(xué)報(bào),1996,12(0l):171-176.

[8] 應(yīng)義斌,景寒松,馬俊福.用計(jì)算機(jī)視覺(jué)進(jìn)行黃花梨果梗識(shí)別的新方法[J].農(nóng)業(yè)工程學(xué)報(bào),1998,14(02):221-225.

[9] 楊秀坤,陳曉光,馬成林,等.用遺傳神經(jīng)網(wǎng)絡(luò)方法進(jìn)行蘋果顏色白動(dòng)檢測(cè)的研究[J].農(nóng)業(yè)工程學(xué)報(bào),1997,13(02):193-176.

[10] 陳育彥,屠康,柴麗月,等.基于激光圖像分析的蘋果表面損傷和內(nèi)部腐爛檢測(cè)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,40(07):133-137.

[11] 馮斌,汪憋華.基于計(jì)算機(jī)視覺(jué)的水果大小檢測(cè)方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2003,34(01):73-75.

[12] 朱偉,曹其新.基于模糊彩色聚類方法的西紅柿缺陷分割[J].農(nóng)業(yè)工程學(xué)報(bào),2003,19(03):133-136.

[13] 曹樂(lè)平,溫芝元,沈陸明.基于色調(diào)分形維數(shù)的柑橘糖度和有效酸度檢測(cè)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,41(03):143-148.

[14] 劉剛,王立香,柳兆君.基于計(jì)算機(jī)視覺(jué)的蘋果質(zhì)量檢測(cè)[J].安徽農(nóng)業(yè)科學(xué),2012,40(08):5014-5016.

[15] Blasco J,Aleixos N,Molto puter vision detection of peel defects in citrus by means of a region oriented segmentation algorithm[J].Journal of Food Engineering,2007,81(03):535-543.

[16] 趙廣華,飛,陸奎榮,等.智能化蘋果品質(zhì)實(shí)時(shí)分選系統(tǒng)[J].中國(guó)科技信息.

[17] 王江楓,羅錫文,洪添勝,等.計(jì)算機(jī)視覺(jué)技術(shù)在芒果重量及果面壞損檢測(cè)中的應(yīng)用[J].農(nóng)業(yè)工程學(xué)報(bào),1998(12):186-189.

[18] 歐陽(yáng)靜怡,劉木華.基于計(jì)算機(jī)視覺(jué)的雞蛋裂紋檢測(cè)方法研究[J].農(nóng)機(jī)化研究,2012(03):91-93.

[19] 汪俊德,鄭麗敏,徐桂云,等.基于計(jì)算機(jī)視覺(jué)技術(shù)的雙黃雞蛋檢測(cè)系統(tǒng)研究[J].農(nóng)機(jī)化研究,2012(09):195-199.

[20] 鄭麗敏,楊旭,徐桂云,等.基于計(jì)算機(jī)視覺(jué)的雞蛋新鮮度無(wú)損檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2009,25(03):335-339.

[21] 潘磊慶,屠康,詹歌,等.基于計(jì)算機(jī)視覺(jué)和聲學(xué)響應(yīng)信息融合的雞蛋裂紋檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(11):332-337.

[22] Mertens K,De Ketelaere B,Kamers B,et al.Dirt detection on brown eggs by means of colorcomputer vision[J]. Poultry Science,2005,84(10):1653-1659.

[23] 殷涌光,丁筠.基于計(jì)算機(jī)視覺(jué)的食品中大腸桿菌快速定量檢測(cè)[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2009,39(02):344-348.

[24] Lawless C,Wilkinson DJ,Young A,et al.Colonyzer: automated quantification of micro-organism growth characteristics on solid agar[J].BMC Bioinformatics,2010(08):38-44.

[25] 郭培源,畢松,袁芳.豬肉新鮮度智能檢測(cè)分級(jí)系統(tǒng)研究[J].食品科學(xué),2010,31(15):68-72.

[26] Bayraktar B,Banada PP,Hirleman ED,et al.Feature extraction from light-scatter patterns of Listeria colonies for identification and classification [J].Journal of Biomedical Optics,2006,11(03):34- 36.

[27] 殷涌光,丁筠.基于計(jì)算機(jī)視覺(jué)的蔬菜中活菌總數(shù)的快速檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2009,25(07):249-254.

[28] 魯靜.乳品微生物自動(dòng)檢測(cè)系統(tǒng)的設(shè)計(jì)[J].湖北第二師范學(xué)院學(xué)報(bào),2010,27(08):115-117.

[29] 劉侃.鮮奶含菌量快速檢測(cè)系統(tǒng)[D].華中科技大學(xué),2008.

[30] 里紅杰,陶學(xué)恒,于曉強(qiáng).計(jì)算機(jī)視覺(jué)技術(shù)在海產(chǎn)品質(zhì)量評(píng)估中的應(yīng)用[J].食品與機(jī)械,2012,28(04):154-156.

篇2

關(guān)鍵詞:數(shù)據(jù)融合傳感器無(wú)損檢測(cè)精確林業(yè)應(yīng)用

多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時(shí)間和空間的觀測(cè)范圍,較強(qiáng)的數(shù)據(jù)可信度和分辨能力,已廣泛應(yīng)用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機(jī)器人、海洋監(jiān)視和管理、目標(biāo)跟蹤和慣性導(dǎo)航等領(lǐng)域[1,2]。筆者在分析數(shù)據(jù)融合技術(shù)概念和內(nèi)容的基礎(chǔ)上,對(duì)該技術(shù)在林業(yè)工程中的應(yīng)用及前景進(jìn)行了綜述。

1數(shù)據(jù)融合

1.1概念的提出

1973年,數(shù)據(jù)融合技術(shù)在美國(guó)國(guó)防部資助開(kāi)發(fā)的聲納信號(hào)理解系統(tǒng)中得到了最早的體現(xiàn)。70年代末,在公開(kāi)的技術(shù)文獻(xiàn)中開(kāi)始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術(shù)。1984年美國(guó)國(guó)防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對(duì)多源的數(shù)據(jù)和信息進(jìn)行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進(jìn)行定位與估計(jì),并完全能對(duì)態(tài)勢(shì)及帶來(lái)的威脅進(jìn)行實(shí)時(shí)評(píng)估”。

1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個(gè)框架里人們闡明如何使用特定的手段和工具來(lái)整合來(lái)自不同渠道的數(shù)據(jù),以獲得實(shí)際需要的信息”。

Wald定義的數(shù)據(jù)融合的概念原理中,強(qiáng)調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標(biāo),這正是很多關(guān)于數(shù)據(jù)融合的文獻(xiàn)中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過(guò)數(shù)據(jù)融合后獲得的信息對(duì)用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開(kāi)發(fā)項(xiàng)目的資金、人力資源等[3]。

1.2基本內(nèi)容

信息融合是生物系統(tǒng)所具備的一個(gè)基本功能,人類本能地將各感官獲得的信息與先驗(yàn)知識(shí)進(jìn)行綜合,對(duì)周圍環(huán)境和發(fā)生的事件做出估計(jì)和判斷。當(dāng)運(yùn)用各種現(xiàn)代信息處理方法,通過(guò)計(jì)算機(jī)實(shí)現(xiàn)這一功能時(shí),就形成了數(shù)據(jù)融合技術(shù)。

數(shù)據(jù)融合就是充分利用多傳感器資源,通過(guò)對(duì)這些多傳感器及觀測(cè)信息的合理支配和使用,把多傳感器在空間或時(shí)間上的冗余或互補(bǔ)信息依據(jù)某些準(zhǔn)則進(jìn)行組合,以獲得被測(cè)對(duì)象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:

(1)數(shù)據(jù)關(guān)聯(lián)。確定來(lái)自多傳感器的數(shù)據(jù)反映的是否是同源目標(biāo)。

(2)多傳感器ID/軌跡估計(jì)。假設(shè)多傳感器的報(bào)告反映的是同源目標(biāo),對(duì)這些數(shù)據(jù)進(jìn)行綜合,改進(jìn)對(duì)該目標(biāo)的估計(jì),或?qū)φ麄€(gè)當(dāng)前或未來(lái)情況的估計(jì)。

(3)采集管理。給定傳感器環(huán)境的一種認(rèn)識(shí)狀態(tài),通過(guò)分配多個(gè)信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標(biāo)探測(cè)、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識(shí)別、情況評(píng)估和預(yù)測(cè)[4]。

根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個(gè)層次:

(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進(jìn)行關(guān)聯(lián)后,送入融合中心,完成對(duì)被測(cè)對(duì)象的綜合評(píng)價(jià)。其優(yōu)點(diǎn)是保持了盡可能多的原始信號(hào)信息,但是該種融合處理的信息量大、速度慢、實(shí)時(shí)性差,通常只用于數(shù)據(jù)之間配準(zhǔn)精度較高的圖像處理。

(2)特征層融合。從原始數(shù)據(jù)中提取特征,進(jìn)行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進(jìn)行分析與綜合,完成對(duì)被測(cè)對(duì)象的綜合評(píng)價(jià)。這種融合既保留了足夠數(shù)量的原始信息,又實(shí)現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實(shí)時(shí)處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯(cuò)性與可靠性有待進(jìn)一步改善。

(3)決策層融合。首先每一傳感器分別獨(dú)立地完成特征提取和決策等任務(wù),然后進(jìn)行關(guān)聯(lián),再送入融合中心處理。這種方法的實(shí)質(zhì)是根據(jù)一定的準(zhǔn)則和每個(gè)決策的可信度做出最優(yōu)的決策。其優(yōu)點(diǎn)是數(shù)據(jù)通訊量小、實(shí)時(shí)性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個(gè)或幾個(gè)傳感器失效時(shí),系統(tǒng)仍能繼續(xù)工作,具有良好的容錯(cuò)性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個(gè)熱點(diǎn)。但是這種技術(shù)也有不足,如原始信息的損失、被測(cè)對(duì)象的時(shí)變特征、先驗(yàn)知識(shí)的獲取困難,以及知識(shí)庫(kù)的巨量特性等[5,6]。

1.3處理模型

美國(guó)數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型[7],當(dāng)時(shí)僅應(yīng)用于軍事方面,但該模型對(duì)人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個(gè)模塊的基本功能如下:

數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫(kù)和人的先驗(yàn)知識(shí)等)。

源數(shù)據(jù)預(yù)處理。進(jìn)行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計(jì)算負(fù)擔(dān),有時(shí)需要為融合中心提供最重要的數(shù)據(jù)。目標(biāo)評(píng)估。融合目標(biāo)的位置、速度、身份等參數(shù),以達(dá)到對(duì)這些參數(shù)的精確表達(dá)。主要包括數(shù)據(jù)配準(zhǔn)、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識(shí)。

態(tài)勢(shì)評(píng)估。根據(jù)當(dāng)前的環(huán)境推斷出檢測(cè)目標(biāo)與事件之間的關(guān)系,以判斷檢測(cè)目標(biāo)的意圖。威脅評(píng)估。結(jié)合當(dāng)前的態(tài)勢(shì)判斷對(duì)方的威脅程度和敵我雙方的攻擊能力等,這一過(guò)程應(yīng)同時(shí)考慮當(dāng)前的政治環(huán)境和對(duì)敵策略等因素,所以較為困難。

處理過(guò)程評(píng)估。監(jiān)視系統(tǒng)的性能,辨識(shí)改善性能所需的數(shù)據(jù),進(jìn)行傳感器資源的合理配置。人機(jī)接口。提供人與計(jì)算機(jī)間的交互功能,如人工操作員的指導(dǎo)和評(píng)價(jià)、多媒體功能等。

2多傳感器在林業(yè)中的應(yīng)用

2.1在森林防火中的應(yīng)用

在用MODIS(ModerateResolutionImagingSpectroradiometer)數(shù)據(jù)測(cè)定森林火點(diǎn)時(shí)的20、22、23波段的傳感器輻射值已達(dá)飽和狀態(tài),用一般圖像增強(qiáng)處理方法探測(cè)燃燒區(qū)火點(diǎn)的結(jié)果不理想。余啟剛運(yùn)用數(shù)據(jù)融合技術(shù),在空間分辨率為1000m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250m的可見(jiàn)光通道的數(shù)據(jù),較好地進(jìn)行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對(duì)火點(diǎn)位置的判斷準(zhǔn)確度[8]。為進(jìn)一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準(zhǔn)確性與可靠性,利用原有森林防火用的林區(qū)紅外探測(cè)器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計(jì)算機(jī)獲得GPS接收機(jī)輸出的有關(guān)信息通過(guò)與RS實(shí)現(xiàn)高效互補(bǔ)性融合,從而彌補(bǔ)衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點(diǎn)信息準(zhǔn)確度和敏感性。

2.2森林蓄積特征的估計(jì)

HampusHolmstrom等在瑞典南部的試驗(yàn)區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-IIVHFSAR傳感器的雷達(dá)數(shù)據(jù)進(jìn)行了融合,采用KNN(knearestneighbor)方法對(duì)森林的蓄積特征(林分蓄積、樹(shù)種組成與年齡)進(jìn)行了估計(jì)[9]。

KNN方法就是采用目標(biāo)樣地鄰近k個(gè)(k=10)最近樣地的加權(quán)來(lái)估計(jì)目標(biāo)樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達(dá)數(shù)據(jù)融合技術(shù)對(duì)試驗(yàn)區(qū)的不同林分的蓄積特征進(jìn)行估計(jì),并對(duì)三種不同的數(shù)據(jù)方法進(jìn)行誤差分析。試驗(yàn)表明,融合后的數(shù)據(jù)作出的估計(jì)比單一的衛(wèi)星數(shù)據(jù)或雷達(dá)數(shù)據(jù)的精度高且穩(wěn)定性好。

2.3用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調(diào)查數(shù)據(jù)

森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國(guó)5年復(fù)查一次。由于森林資源調(diào)查的工作量巨大,且要花費(fèi)大量的人力、物力和資金。國(guó)內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計(jì)方法。

TrevorJDavis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對(duì)應(yīng)的GIS數(shù)據(jù)信息實(shí)現(xiàn)森林調(diào)查數(shù)據(jù)的快速更新,認(rèn)為對(duì)森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機(jī)側(cè)面裝上可視的數(shù)字?jǐn)z像裝置,利用GPS對(duì)測(cè)點(diǎn)進(jìn)行定位,對(duì)特殊地區(qū)的攝像進(jìn)行拍攝,同時(shí)與對(duì)應(yīng)的GIS數(shù)據(jù)進(jìn)行融合,做出資源變化的估計(jì)或影像的修正[10]。

試驗(yàn)表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費(fèi)少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠(yuǎn)、地形復(fù)雜、不易操作、成本高的區(qū)域,同時(shí)可避免遙感圖像受云層遮蓋。

3數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望

3.1在木材檢測(cè)中的應(yīng)用

3.1.1木材缺陷及其影響

木材是天然生長(zhǎng)的有機(jī)體,生長(zhǎng)過(guò)程中不可避免地有尖削度、彎曲度、節(jié)子等生長(zhǎng)缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強(qiáng)度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過(guò)程中,主要依靠人的肉眼來(lái)識(shí)別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識(shí)別起來(lái)非常困難,勞動(dòng)強(qiáng)度大,效率低,同時(shí)由于熟練程度、標(biāo)準(zhǔn)掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識(shí)別嚴(yán)重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開(kāi)發(fā)一種能夠?qū)Π宀碾p面缺陷進(jìn)行在線識(shí)別和自動(dòng)剔除技術(shù),以解決集成材加工中節(jié)子人工識(shí)別誤差大、難以實(shí)現(xiàn)雙面識(shí)別、剔除機(jī)械調(diào)整時(shí)間長(zhǎng)等問(wèn)題。

3.1.2單一傳感器在木材檢測(cè)中的應(yīng)用

對(duì)木材及人造板進(jìn)行無(wú)損檢測(cè)的方法很多,如超聲波、微波、射線、機(jī)械應(yīng)力、震動(dòng)、沖擊應(yīng)力波、快速傅立葉變換分析等檢測(cè)方法[11,12]。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過(guò)程分析等[13]。

隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,人們也將視覺(jué)傳感器應(yīng)用于木材檢測(cè)中。新西蘭科學(xué)家用視頻傳感器研究和測(cè)量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時(shí)準(zhǔn)確地測(cè)量單個(gè)纖維和全部纖維的幾何尺寸及其變化趨勢(shì),能夠區(qū)分不同紙漿類型,測(cè)定木材纖維材料加固結(jié)合力,并動(dòng)態(tài)地觀察木材纖維在材料中的結(jié)合機(jī)理。

新西蘭的基于視覺(jué)傳感器的板材缺陷識(shí)別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機(jī)或激光掃描儀采集板材的圖像,自動(dòng)識(shí)別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進(jìn)行原木三維模型真實(shí)再現(xiàn)的計(jì)算機(jī)視覺(jué)識(shí)別功能,利用激光掃描儀自動(dòng)采集原木的三維幾何數(shù)據(jù)。

美國(guó)林產(chǎn)品實(shí)驗(yàn)室利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)木材刨花的尺寸大小進(jìn)行分級(jí),確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺(jué)傳感器進(jìn)行了定向刨花板內(nèi)刨花定向程度的檢測(cè),從而可以通過(guò)調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來(lái)提高定向刨花板的強(qiáng)度。

在制材加工過(guò)程中,利用計(jì)算機(jī)視覺(jué)技術(shù)在線實(shí)時(shí)檢測(cè)原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時(shí)可對(duì)鋸材的質(zhì)量進(jìn)行分級(jí),實(shí)現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過(guò)程中,利用計(jì)算機(jī)視覺(jué)技術(shù)在線實(shí)時(shí)檢測(cè)單板上的各種缺陷,實(shí)現(xiàn)單板的智能和自動(dòng)剪切,并可測(cè)量在剪切過(guò)程中的單板破損率,對(duì)單板進(jìn)行分等分級(jí),實(shí)現(xiàn)自動(dòng)化生產(chǎn)過(guò)程。Wengert等在綜合了大量的板材分類經(jīng)驗(yàn)的基礎(chǔ)上,建立了板材分級(jí)分類的計(jì)算機(jī)視覺(jué)專家系統(tǒng)。在國(guó)內(nèi)這方面的研究較少,王金滿等用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)刨花板施膠效果進(jìn)行了定量分析[14]。

X射線對(duì)木材及木質(zhì)復(fù)合材料的性能檢測(cè)已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對(duì)木材密度、含水率、纖維素相對(duì)結(jié)晶度和結(jié)晶區(qū)大小、纖維的化學(xué)結(jié)構(gòu)和性質(zhì)等進(jìn)行檢測(cè),并對(duì)木材內(nèi)部的各種缺陷進(jìn)行檢測(cè)。

3.1.3數(shù)據(jù)融合在木材檢測(cè)中的應(yīng)用展望

單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項(xiàng)技術(shù)在應(yīng)用上存在一定的局限性。如視覺(jué)傳感器不能檢測(cè)到有些與木材具有相同顏色的節(jié)子,有時(shí)會(huì)把木板上的臟物或油脂當(dāng)成節(jié)子,造成誤判,有時(shí)也會(huì)受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測(cè)部分表面缺陷,而無(wú)法檢測(cè)到內(nèi)部缺陷;超聲、微波、核磁共振和X射線技術(shù)均能測(cè)量密度及內(nèi)部特征,但是它們不能測(cè)定木材的顏色和瑕疵,因?yàn)檫@些缺陷的密度往往同木板相同。因此,一個(gè)理想的檢測(cè)系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準(zhǔn)確、可靠地檢測(cè)到木材的缺陷[15,16]。

基于多傳感器(機(jī)器視覺(jué)及X射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測(cè),可以集成多個(gè)傳統(tǒng)單項(xiàng)技術(shù),更可靠、準(zhǔn)確地實(shí)時(shí)檢測(cè)出木材表面的各種缺陷,為實(shí)現(xiàn)木材分級(jí)自動(dòng)化、智能化奠定基礎(chǔ),同時(shí)為集裁除鋸、自動(dòng)調(diào)整、自動(dòng)裁除節(jié)子等為一身的新型視頻識(shí)別集成材雙面節(jié)子數(shù)控自動(dòng)剔除成套設(shè)備提供技術(shù)支持。

3.2在精確林業(yè)中的應(yīng)用

美國(guó)華盛頓大學(xué)研究人員開(kāi)展了樹(shù)形自動(dòng)分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學(xué)的生物系統(tǒng)工程系和USDA南方林業(yè)實(shí)驗(yàn)站與有關(guān)公司合作開(kāi)展用GPS和其他傳感器研究林業(yè)機(jī)器系統(tǒng)的性能和生產(chǎn)效率。

目前單項(xiàng)的GPS、RS、GIS正從“自動(dòng)化孤島”形式應(yīng)用于林業(yè)生產(chǎn)向集成技術(shù)轉(zhuǎn)變。林業(yè)生產(chǎn)系統(tǒng)作為一個(gè)多組分的復(fù)雜系統(tǒng),是由能量流動(dòng)、物質(zhì)循環(huán)、信息流動(dòng)所推動(dòng)的具有一定的結(jié)構(gòu)和功能的復(fù)合體,各組分間的關(guān)系和結(jié)合方式影響系統(tǒng)整體的結(jié)構(gòu)和功能。因此應(yīng)該在計(jì)算機(jī)集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時(shí)間上的質(zhì)的差異及空間數(shù)據(jù)類型的多樣性,如地理統(tǒng)計(jì)數(shù)據(jù)、柵格數(shù)據(jù)、點(diǎn)數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術(shù))等,使林業(yè)生產(chǎn)成為一個(gè)高效、柔性和開(kāi)放的體系,從而實(shí)現(xiàn)林業(yè)生產(chǎn)的標(biāo)準(zhǔn)化、規(guī)范化、開(kāi)放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。

南京林業(yè)大學(xué)提出了“精確林業(yè)工程系統(tǒng)”[17]。研究包括精確林業(yè)工程系統(tǒng)的領(lǐng)域體系結(jié)構(gòu)、隨時(shí)空變化的數(shù)據(jù)采集處理與融合技術(shù)、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術(shù)等,實(shí)現(xiàn)基于自然界生物及其所賴以生存的環(huán)境資源的時(shí)空變異性的客觀現(xiàn)實(shí),以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標(biāo),建立關(guān)于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。

[參考文獻(xiàn)]

[1]高翔,王勇.數(shù)據(jù)融合技術(shù)綜述[J].計(jì)算機(jī)控制與測(cè)量,2002,10(11):706-709.

[2]龔元明,蕭德云,王俊杰.多傳感器數(shù)據(jù)融合技術(shù)(上)[J].冶金自動(dòng)化,2002(4):4-7.

[3]錢永蘭,楊邦杰,雷廷武.數(shù)據(jù)融合及其在農(nóng)情遙感監(jiān)測(cè)中的應(yīng)用與展望[J].農(nóng)業(yè)工程學(xué)報(bào),2004,20(4):286-290.

[4]高德平,黃雪梅.多傳感器和數(shù)據(jù)融合(一)[J].紅外與激光工程,1999,28(1):1-4.

[5]王耀南,李樹(shù)濤.多傳感器信息融合及其應(yīng)用綜述[J].控制與決策,2001,16(5):518-52.

[6]許軍,羅飛路,張耀輝.多傳感器信息融合技術(shù)在無(wú)損檢測(cè)中的應(yīng)用研究[J].無(wú)損檢測(cè),2000,22(8):342-344.

[7]WhiteFE.Datafusionlexicon:DatafusionsubpanelofthejointdirectorsoflaboratoriestechnicalpanelforC3[R].SanDiego,1991.

[8]余啟剛.數(shù)據(jù)融合技術(shù)在“3S”森林防火中的應(yīng)用[J].森林工程,2003,19(4):5-6.

[9]HampusHolmstrom,biningremotelysensedopticalandradardatainKNN-estimationofforest[J].ForestScience,2003,49(3):409-418.

[10]TrevorJDavis,BrianKlinkenberg,PeterKellerC.Updatinginventory:Usingobliquevideogrammetry&datafusion[J].JournalofForestry,2002,100(2):45-50.

[11]楊春梅,胡萬(wàn)義,白帆,等.木材缺陷檢測(cè)理論及方法的發(fā)展[J].林業(yè)機(jī)械與木工設(shè)備,2004,32(3):8-10.

[12]胡英成,顧繼友,王逢瑚.木材及人造板物理力學(xué)性能無(wú)損檢測(cè)技術(shù)研究的發(fā)展與展望[J].世界林業(yè)研究,2002,15(4):39-46.

[13]肖忠平,盧曉寧,陸繼圣.木質(zhì)材料X射線與超聲檢測(cè)技術(shù)研究的發(fā)展與展望[J].木材加工機(jī)械,2004,15(1):25-27.

[14]王金滿,周秀榮.刨花板施膠效果計(jì)算機(jī)視覺(jué)分析方法[J].東北林業(yè)大學(xué)學(xué)報(bào),1994,22(3):25-26.

[15]KlinkhachornP.Prototypinganautomatedlumberprocessingsystem[J].ForestProductsJournal,1993(2):11-18.

篇3

一、數(shù)據(jù)融合

1.1概念的提出

1973年,數(shù)據(jù)融合技術(shù)在美國(guó)國(guó)防部資助開(kāi)發(fā)的聲納信號(hào)理解系統(tǒng)中得到了最早的體現(xiàn)。

7年代末,在公開(kāi)的技術(shù)文獻(xiàn)中開(kāi)始出現(xiàn)基于多系統(tǒng)的整合意義的融合技術(shù)。1984年美國(guó)國(guó)防部數(shù)據(jù)融合小組(dfs)定義數(shù)據(jù)融合為:“對(duì)多源的數(shù)據(jù)和信息進(jìn)行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進(jìn)行定位與估計(jì),并完全能對(duì)態(tài)勢(shì)及帶來(lái)的威脅進(jìn)行實(shí)時(shí)評(píng)估”。

1998年1月,buchroithner和wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個(gè)框架里人們闡明如何使用特定的手段和工具來(lái)整合來(lái)自不同渠道的數(shù)據(jù),以獲得實(shí)際需要的信息”。

wald定義的數(shù)據(jù)融合的概念原理中,強(qiáng)調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標(biāo),這正是很多關(guān)于數(shù)據(jù)融合的文獻(xiàn)中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過(guò)數(shù)據(jù)融合后獲得的信息對(duì)用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開(kāi)發(fā)項(xiàng)目的資金、人力資源等。

1.2基本內(nèi)容

信息融合是系統(tǒng)所具備的一個(gè)基本功能,人類本能地將各感官獲得的信息與先驗(yàn)知識(shí)進(jìn)行綜合,對(duì)周圍環(huán)境和發(fā)生的事件做出估計(jì)和判斷。當(dāng)運(yùn)用各種現(xiàn)代信息處理方法,通過(guò)計(jì)算機(jī)實(shí)現(xiàn)這一功能時(shí),就形成了數(shù)據(jù)融合技術(shù)。

數(shù)據(jù)融合就是充分利用多傳感器資源,通過(guò)對(duì)這些多傳感器及觀測(cè)信息的合理支配和使用,把多傳感器在空間或時(shí)間上的冗余或互補(bǔ)信息依據(jù)某些準(zhǔn)則進(jìn)行組合,以獲得被測(cè)對(duì)象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:

(1)數(shù)據(jù)關(guān)聯(lián)。確定來(lái)自多傳感器的數(shù)據(jù)反映的是否是同源目標(biāo)。

(2)多傳感器id/軌跡估計(jì)。假設(shè)多傳感器的報(bào)告反映的是同源目標(biāo),對(duì)這些數(shù)據(jù)進(jìn)行綜合,改進(jìn)對(duì)該目標(biāo)的估計(jì),或?qū)φ麄€(gè)當(dāng)前或未來(lái)情況的估計(jì)。

(3)采集管理。給定傳感器環(huán)境的一種認(rèn)識(shí)狀態(tài),通過(guò)分配多個(gè)信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標(biāo)探測(cè)、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識(shí)別、情況評(píng)估和預(yù)測(cè)。

根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個(gè)層次:

(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進(jìn)行關(guān)聯(lián)后,送入融合中心,完成對(duì)被測(cè)對(duì)象的綜合評(píng)價(jià)。其優(yōu)點(diǎn)是保持了盡可能多的原始信號(hào)信息,但是該種融合處理的信息量大、速度慢、實(shí)時(shí)性差,通常只用于數(shù)據(jù)之間配準(zhǔn)精度較高的圖像處理。

(2)特征層融合。從原始數(shù)據(jù)中提取特征,進(jìn)行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進(jìn)行分析與綜合,完成對(duì)被測(cè)對(duì)象的綜合評(píng)價(jià)。這種融合既保留了足夠數(shù)量的原始信息,又實(shí)現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實(shí)時(shí)處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯(cuò)性與可靠性有待進(jìn)一步改善。

(3)決策層融合。首先

每一傳感器分別獨(dú)立地完成特征提取和決策等任務(wù),然后進(jìn)行關(guān)聯(lián),再送入融合中心處理。這種方法的實(shí)質(zhì)是根據(jù)一定的準(zhǔn)則和每個(gè)決策的可信度做出最優(yōu)的決策。其優(yōu)點(diǎn)是數(shù)據(jù)通訊量小、實(shí)時(shí)性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個(gè)或幾個(gè)傳感器失效時(shí),系統(tǒng)仍能繼續(xù)工作,具有良好的容錯(cuò)性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個(gè)熱點(diǎn)。但是這種技術(shù)也有不足,如原始信息的損失、被測(cè)對(duì)象的時(shí)變特征、先驗(yàn)知識(shí)的獲取困難,以及知識(shí)庫(kù)的巨量特性等。

1.3處理模型

美國(guó)數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當(dāng)時(shí)僅應(yīng)用于軍事方面,但該模型對(duì)人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個(gè)模塊的基本功能如下:

數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫(kù)和人的先驗(yàn)知識(shí)等)。

源數(shù)據(jù)預(yù)處理。進(jìn)行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計(jì)算負(fù)擔(dān),有時(shí)需要為融合中心提供最重要的數(shù)據(jù)。目標(biāo)評(píng)估。融合目標(biāo)的位置、速度、身份等參數(shù),以達(dá)到對(duì)這些參數(shù)的精確表達(dá)。主要包括數(shù)據(jù)配準(zhǔn)、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識(shí)。

態(tài)勢(shì)評(píng)估。根據(jù)當(dāng)前的環(huán)境推斷出檢測(cè)目標(biāo)與事件之間的關(guān)系,以判斷檢測(cè)目標(biāo)的意圖。威脅評(píng)估。結(jié)合當(dāng)前的態(tài)勢(shì)判斷對(duì)方的威脅程度和敵我雙方的攻擊能力等,這一過(guò)程應(yīng)同時(shí)考慮當(dāng)前的環(huán)境和對(duì)敵策略等因素,所以較為困難。

處理過(guò)程評(píng)估。監(jiān)視系統(tǒng)的性能,辨識(shí)改善性能所需的數(shù)據(jù),進(jìn)行傳感器資源的合理配置。人機(jī)接口。提供人與計(jì)算機(jī)間的交互功能,如人工操作員的指導(dǎo)和評(píng)價(jià)、多媒體功能等。

二、多傳感器在林業(yè)中的應(yīng)用

2.1在森林防火中的應(yīng)用

在用modis(moderateresolutionimagingspectroradiometer)數(shù)據(jù)測(cè)定森林火點(diǎn)時(shí)的2、22、23波段的傳感器輻射值已達(dá)飽和狀態(tài),用一般圖像增強(qiáng)處理方法探測(cè)燃燒區(qū)火點(diǎn)的結(jié)果不理想。余啟剛運(yùn)用數(shù)據(jù)融合技術(shù),在空間分辨率為1m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為25m的可見(jiàn)光通道的數(shù)據(jù),較好地進(jìn)行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對(duì)火點(diǎn)位置的判斷準(zhǔn)確度。為進(jìn)一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準(zhǔn)確性與可靠性,利用原有森林防火用的林區(qū)紅外探測(cè)器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計(jì)算機(jī)獲得gps接收機(jī)輸出的有關(guān)信息通過(guò)與rs實(shí)現(xiàn)高效互補(bǔ)性融合,從而彌補(bǔ)衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點(diǎn)信息準(zhǔn)確度和敏感性。

2.2森林蓄積特征的估計(jì)

hampusholmstrom等在瑞典南部的試驗(yàn)區(qū)將spot-4×s衛(wèi)星數(shù)據(jù)和carabas-iivhfsar傳感器的雷達(dá)數(shù)據(jù)進(jìn)行了融合,采用knn(knearestneighbor)方法對(duì)森林的蓄積特征(林分蓄積、樹(shù)種組成與年齡)進(jìn)行了估計(jì)。

knn方法就是采用目標(biāo)樣地鄰近k個(gè)(k=1)最近樣地的加權(quán)來(lái)估計(jì)目標(biāo)樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達(dá)數(shù)據(jù)融合技術(shù)對(duì)試驗(yàn)區(qū)的不同林分的蓄積特征進(jìn)行估計(jì),并對(duì)三種不同的數(shù)據(jù)方法進(jìn)行誤差分析。試驗(yàn)表明,融合后的數(shù)據(jù)作出的估計(jì)比單一的衛(wèi)星數(shù)據(jù)或雷達(dá)數(shù)據(jù)的精度高且穩(wěn)定性好。

2.3用非垂直航空攝像數(shù)據(jù)融合gis信息更新調(diào)查數(shù)據(jù)

森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國(guó)5年復(fù)查一次。由于森

林資源調(diào)查的工作量巨大,且要花費(fèi)大量的人力、物力和資金。國(guó)內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計(jì)方法。 trevorjdavis等22年提出采用非垂直的航空攝影數(shù)據(jù)融合對(duì)應(yīng)的gis數(shù)據(jù)信息實(shí)現(xiàn)森林調(diào)查數(shù)據(jù)

的快速更新,認(rèn)為對(duì)森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機(jī)側(cè)面裝上可視的數(shù)字?jǐn)z像裝置,利用gps對(duì)測(cè)點(diǎn)進(jìn)行定位,對(duì)特殊地區(qū)的攝像進(jìn)行拍攝,同時(shí)與對(duì)應(yīng)的gis數(shù)據(jù)進(jìn)行融合,做出資源變化的估計(jì)或影像的修正。

試驗(yàn)表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費(fèi)少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠(yuǎn)、地形復(fù)雜、不易操作、成本高的區(qū)域,同時(shí)可避免遙感圖像受云層遮蓋。

三、數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望

3.1在木材檢測(cè)中的應(yīng)用

3.1.1木材缺陷及其影響

木材是天然生長(zhǎng)的有機(jī)體,生長(zhǎng)過(guò)程中不可避免地有尖削度、彎曲度、節(jié)子等生長(zhǎng)缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強(qiáng)度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過(guò)程中,主要依靠人的肉眼來(lái)識(shí)別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識(shí)別起來(lái)非常困難,勞動(dòng)強(qiáng)度大,效率低,同時(shí)由于熟練程度、標(biāo)準(zhǔn)掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識(shí)別嚴(yán)重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開(kāi)發(fā)一種能夠?qū)Π宀碾p面缺陷進(jìn)行在線識(shí)別和自動(dòng)剔除技術(shù),以解決集成材加工中節(jié)子人工識(shí)別誤差大、難以實(shí)現(xiàn)雙面識(shí)別、剔除機(jī)械調(diào)整時(shí)間長(zhǎng)等問(wèn)題。

3.1.2單一傳感器在木材檢測(cè)中的應(yīng)用

對(duì)木材及人造板進(jìn)行無(wú)損檢測(cè)的方法很多,如超聲波、微波、射線、機(jī)械應(yīng)力、震動(dòng)、沖擊應(yīng)力波、快速傅立葉變換分析等檢測(cè)方法。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過(guò)程分析等。

隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,人們也將視覺(jué)傳感器應(yīng)用于木材檢測(cè)中。新西蘭科學(xué)家用視頻傳感器研究和測(cè)量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時(shí)準(zhǔn)確地測(cè)量單個(gè)纖維和全部纖維的幾何尺寸及其變化趨勢(shì),能夠區(qū)分不同紙漿類型,測(cè)定木材纖維材料加固結(jié)合力,并動(dòng)態(tài)地觀察木材纖維在材料中的結(jié)合機(jī)理。

新西蘭的基于視覺(jué)傳感器的板材缺陷識(shí)別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機(jī)或激光掃描儀采集板材的圖像,自動(dòng)識(shí)別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進(jìn)行原木三維模型真實(shí)再現(xiàn)的計(jì)算機(jī)視覺(jué)識(shí)別功能,利用激光掃描儀自動(dòng)采集原木的三維幾何數(shù)據(jù)。

美國(guó)林產(chǎn)品實(shí)驗(yàn)室利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)木材刨花的尺寸大小進(jìn)行分級(jí),確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺(jué)傳感器進(jìn)行了定向刨花板內(nèi)刨花定向程度的檢測(cè),從而可以通過(guò)調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來(lái)提高定向刨花板的強(qiáng)度。

在制材加工過(guò)程中,利用計(jì)算機(jī)視覺(jué)技術(shù)在線實(shí)時(shí)檢測(cè)原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時(shí)可對(duì)鋸材的質(zhì)量進(jìn)行分級(jí),實(shí)現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過(guò)程中,利用計(jì)算機(jī)視覺(jué)技術(shù)在線實(shí)時(shí)檢測(cè)單板上的各種缺陷,實(shí)現(xiàn)單板的智能和自動(dòng)剪切,并可測(cè)量在剪切過(guò)程中的單板破損率,對(duì)單板進(jìn)行分等分級(jí),實(shí)現(xiàn)自動(dòng)化生產(chǎn)過(guò)程。wengert等在綜合了大量的板材分類經(jīng)驗(yàn)的基礎(chǔ)上,建立了板材分級(jí)分類的計(jì)算機(jī)視覺(jué)專家系統(tǒng)。在國(guó)內(nèi)這方面的研究較少,王金滿等用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)刨花板施膠效果進(jìn)行了定量分析。

x射線對(duì)木材及木質(zhì)復(fù)合材料的性能檢測(cè)已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對(duì)木材密度、含水率、纖維素相對(duì)結(jié)晶度和結(jié)晶區(qū)大小、纖維的結(jié)構(gòu)和性質(zhì)等進(jìn)行檢測(cè),并對(duì)木材內(nèi)部的各種缺陷進(jìn)行檢測(cè)。

3.1.3數(shù)據(jù)融合在木材檢測(cè)中的應(yīng)用展望

單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項(xiàng)技術(shù)在應(yīng)用上存在一定的局限性。如視覺(jué)傳感器不能檢測(cè)到有些與木材具有相同顏色的節(jié)子,有時(shí)會(huì)把木板上的臟物或油脂當(dāng)成節(jié)子,

造成誤判,有時(shí)也會(huì)受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測(cè)部分表面缺陷,而無(wú)法檢測(cè)到內(nèi)部缺陷;超聲、微波、核磁共振和x射線技術(shù)均能測(cè)量密度及內(nèi)部特征,但是它們不能測(cè)定木材的顏色和瑕疵,因?yàn)檫@些缺陷的密度往往同木板相同。因此,一個(gè)理想的檢測(cè)系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準(zhǔn)確、可靠地檢測(cè)到木材的缺陷。

基于多傳感器(機(jī)器視覺(jué)及x射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測(cè),可以集成多個(gè)傳統(tǒng)單項(xiàng)技術(shù),更可靠、準(zhǔn)確地實(shí)時(shí)檢測(cè)出木材表面的各種缺陷,為實(shí)現(xiàn)木材分級(jí)自動(dòng)化、智能化奠定基礎(chǔ),同時(shí)為集裁除鋸、自動(dòng)調(diào)整、自動(dòng)裁除節(jié)子等為一身的新型視頻識(shí)別集成材雙面節(jié)子數(shù)控自動(dòng)剔除成套設(shè)備提供技術(shù)支持。

3.2在精確林業(yè)中的應(yīng)用

美國(guó)華盛頓大學(xué)研究人員開(kāi)展了樹(shù)形自動(dòng)分析、林業(yè)作業(yè)規(guī)劃等研究工作;auburn大學(xué)的生物系統(tǒng)工程系和usda南方林業(yè)實(shí)驗(yàn)站與有關(guān)公司合作開(kāi)展用gps和其他傳感器研究林業(yè)機(jī)器系統(tǒng)的性能和生產(chǎn)效率。

篇4

【關(guān)鍵詞】:電力系統(tǒng);新技術(shù)應(yīng)用;未來(lái)展望

1、新技術(shù)在電力系統(tǒng)自動(dòng)化中的應(yīng)用

通過(guò)上文對(duì)電力系統(tǒng)的解讀可知,該系統(tǒng)是一個(gè)規(guī)模比較龐大的系統(tǒng),其中涵蓋了諸多的電力設(shè)備設(shè)施,想要實(shí)現(xiàn)對(duì)這些設(shè)備的自動(dòng)化控制,就必須對(duì)相關(guān)的技術(shù)加以運(yùn)用。下面本文重點(diǎn)分析幾種新技術(shù)在電力系統(tǒng)自動(dòng)化中的應(yīng)用。

1.1智能控制技術(shù)的應(yīng)用

自電力系統(tǒng)自動(dòng)化這一概念被提出之后,電力系統(tǒng)自動(dòng)化與新技術(shù)應(yīng)用文/周觀春柴宇馮浩銘文章首先對(duì)電力系統(tǒng)自動(dòng)化進(jìn)行了解讀,在此基礎(chǔ)上對(duì)幾種新技術(shù)在電力系統(tǒng)自動(dòng)化中的應(yīng)用進(jìn)行論述。期望通過(guò)本文的研究能夠?qū)Υ_保電力系統(tǒng)的安全、穩(wěn)定、可靠、經(jīng)濟(jì)運(yùn)行有所幫助。摘要智能控制技術(shù)便成為其研究的一個(gè)重要領(lǐng)域,相對(duì)于傳統(tǒng)的人工控制方式而言,智能控制更具優(yōu)越性,將之應(yīng)用于復(fù)雜程度高、非線性較強(qiáng)的電力系統(tǒng)當(dāng)中,可以_保系統(tǒng)的安全、穩(wěn)定、可靠、經(jīng)濟(jì)運(yùn)行。智能控制技術(shù)的核心是計(jì)算機(jī),所有的控制功能都是憑借相關(guān)的軟件程序來(lái)實(shí)現(xiàn)的,借助這些控制功能可對(duì)電力系統(tǒng)運(yùn)行過(guò)程中產(chǎn)生的狀態(tài)數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)測(cè)和自動(dòng)分析與處理,并從中找出電力系統(tǒng)運(yùn)行時(shí)存在的問(wèn)題,然后參考數(shù)據(jù)庫(kù)中的故障處理指令,自動(dòng)對(duì)故障問(wèn)題進(jìn)行解決處理,再利用通信網(wǎng)絡(luò)將處理指令下發(fā)至電力系統(tǒng)的設(shè)備當(dāng)中,從而實(shí)現(xiàn)對(duì)系統(tǒng)的調(diào)整,由此便可確保系統(tǒng)始終處于相對(duì)穩(wěn)定的運(yùn)行狀態(tài)。

1.2計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用

該技術(shù)是一門綜合性較強(qiáng)的學(xué)科,主要包括計(jì)算機(jī)、信號(hào)處理、物理學(xué)等等,它是各種智能系統(tǒng)不可或缺的重要組成部分之一,應(yīng)用該技術(shù)可對(duì)電力系統(tǒng)進(jìn)行有效的監(jiān)測(cè)。隨著業(yè)內(nèi)專家學(xué)者對(duì)該技術(shù)的研究不斷深入,出現(xiàn)了諸多新的技術(shù),其中較具代表性的有以下幾類:在線監(jiān)測(cè)技術(shù)、環(huán)境監(jiān)測(cè)技術(shù)、無(wú)人機(jī)監(jiān)測(cè)技術(shù)等等,這些技術(shù)能夠通過(guò)各種不同的方式獲取電力系統(tǒng)的狀態(tài)信息。

1.3動(dòng)態(tài)安全監(jiān)控系統(tǒng)的應(yīng)用

隨著社會(huì)生產(chǎn)生活對(duì)供電穩(wěn)定性的要求不斷提高,電力系統(tǒng)有必要應(yīng)用動(dòng)態(tài)安全監(jiān)控系統(tǒng),減少供電故障,保障電力系統(tǒng)可靠運(yùn)行,滿足供電需求。在動(dòng)態(tài)安全監(jiān)控系統(tǒng)中,要引入GPS和EMS技術(shù),通過(guò)全面檢測(cè)電氣設(shè)備,實(shí)時(shí)掌握電氣設(shè)備的運(yùn)行情況,可及時(shí)發(fā)現(xiàn)并處理故障隱患,做到防患于未然,從而大幅度降低事故發(fā)生的可能性?;贕PS定位技術(shù)的動(dòng)態(tài)安全監(jiān)控系統(tǒng),可通過(guò)衛(wèi)星提供所需數(shù)據(jù),加之EMS系統(tǒng)可對(duì)整個(gè)電力系統(tǒng)進(jìn)行實(shí)時(shí)監(jiān)控,從而實(shí)現(xiàn)了動(dòng)態(tài)監(jiān)控與靜態(tài)監(jiān)控相結(jié)合,從多個(gè)方向入手對(duì)電力系統(tǒng)運(yùn)行進(jìn)行綜合分析,若發(fā)現(xiàn)電力系統(tǒng)存在不穩(wěn)定運(yùn)行的因素,則可及時(shí)提出補(bǔ)救措施。

1.4 DFACTS技術(shù)

FACTS技術(shù)和DFACTS技術(shù)是應(yīng)用于電力系統(tǒng)的新技術(shù),其中FACTS技術(shù)即柔流輸電,能夠?qū)﹄娏ο到y(tǒng)的相關(guān)參數(shù)進(jìn)行及時(shí)調(diào)控,保證電壓維持在穩(wěn)定狀況,從而提高電力系統(tǒng)的可靠性。DFACTS技術(shù)則可有效解決電力系統(tǒng)的各類質(zhì)量問(wèn)題,有效管控電力系統(tǒng)運(yùn)行質(zhì)量,保障電氣設(shè)備始終處于良好運(yùn)行狀態(tài),減少不利因素對(duì)電氣設(shè)備的干擾和損害,從而促使電力系統(tǒng)運(yùn)行的自動(dòng)化水平大幅度提升。

1.5微機(jī)保護(hù)技術(shù)

電力系統(tǒng)應(yīng)用微機(jī)保護(hù)技術(shù),能夠在發(fā)生故障時(shí)自動(dòng)啟動(dòng)保護(hù)措施,減少電力系統(tǒng)受到的損害。隨著電力系統(tǒng)對(duì)微機(jī)保護(hù)技術(shù)的應(yīng)用要求不斷提高,微機(jī)保護(hù)技術(shù)必須及時(shí)更新。當(dāng)前,在電力系統(tǒng)中常用基于C/C++語(yǔ)言的微機(jī)設(shè)備,該微機(jī)設(shè)備具備良好的可移植性和靈活性,能夠滿足電力系統(tǒng)保護(hù)的多種需求。

2、電力系統(tǒng)新技術(shù)發(fā)展的未來(lái)展望

2.1電力系統(tǒng)將向著自動(dòng)化和智能化的方向邁進(jìn)

目前,電力系統(tǒng)的整體發(fā)展趨勢(shì)是向著自動(dòng)化和智能化的方向發(fā)展,其智能控制手段將由研究逐漸走向?qū)嵱?,通過(guò)對(duì)計(jì)算機(jī)技術(shù)的不斷學(xué)習(xí),將能夠幫助電力工作者找到新的發(fā)展電力的道路和方向,也能夠使得一些系統(tǒng)達(dá)到新的發(fā)展高度。計(jì)算機(jī)技術(shù)、控制技術(shù)和現(xiàn)代通信技術(shù)將會(huì)對(duì)電能的產(chǎn)生、控制、傳輸?shù)雀鱾€(gè)環(huán)節(jié)產(chǎn)生影響,使得電力系統(tǒng)實(shí)現(xiàn)智能化和自動(dòng)化的新高度。當(dāng)前電力系統(tǒng)正處在大數(shù)據(jù)的時(shí)代,各種高科技的技術(shù)頻發(fā),電力系統(tǒng)的安全運(yùn)行程度高。同時(shí),電力系統(tǒng)還有高效率運(yùn)行、降低成本和對(duì)環(huán)境負(fù)面影響小的優(yōu)點(diǎn),將不斷的提升系統(tǒng)的可靠性和自愈性,達(dá)到更高的發(fā)展高度。

2.2太陽(yáng)能等可再生資源發(fā)電比例和對(duì)儲(chǔ)能設(shè)備要求增高

隨著全國(guó)經(jīng)濟(jì)和文化的發(fā)展,電力系統(tǒng)領(lǐng)域也迎來(lái)了新的發(fā)展方向,太陽(yáng)能和風(fēng)能成為可再生資源的發(fā)展重點(diǎn)。根據(jù)研究資料表明,地球上接受的太陽(yáng)能如果有效的利用和供給是足夠地球上的人類實(shí)現(xiàn)總需求的。在能源評(píng)價(jià)、技術(shù)服務(wù)和創(chuàng)新等方面,光伏發(fā)電也成為了新的發(fā)展趨勢(shì),現(xiàn)階段需要重點(diǎn)光電池、多晶硅提煉等技術(shù),不斷推廣新的發(fā)展渠道,解決更多的技術(shù)問(wèn)題和障礙,實(shí)現(xiàn)包括太陽(yáng)能在內(nèi)的可再生資源的合理利用,為電力能源的生產(chǎn)提供充足的保障。另一方面,隨著電力系統(tǒng)信息化和新技術(shù)的發(fā)展,電力儲(chǔ)能系統(tǒng)就像計(jì)算機(jī)網(wǎng)絡(luò)中的信息存儲(chǔ)系統(tǒng)一樣,有著重要的影響力。隨著儲(chǔ)能裝置的不斷改進(jìn),新型高性能的電極材料和電介質(zhì)材料將不斷被應(yīng)用在各個(gè)領(lǐng)域,推動(dòng)電力系統(tǒng)的全方位發(fā)展。此外,電力電氣設(shè)備的性能還需要不斷的研究其材料,提高電氣設(shè)備的極限容量,確保電力系統(tǒng)的安全穩(wěn)定,滿足電網(wǎng)的運(yùn)行需求。新型高性能電極材料、儲(chǔ)能材料和新技術(shù)的應(yīng)用,推動(dòng)了大容量電池儲(chǔ)能等技術(shù)的發(fā)展和大容量?jī)?chǔ)能設(shè)備興起和實(shí)踐運(yùn)用。

結(jié)論

電力系統(tǒng)的運(yùn)行穩(wěn)定與否,直接關(guān)系到供電可靠性,為了確保系統(tǒng)運(yùn)行的穩(wěn)定性,可將智能控制技術(shù)、計(jì)算機(jī)視覺(jué)技術(shù)、動(dòng)態(tài)安全監(jiān)控技術(shù)等,合理運(yùn)用到電力系統(tǒng)自動(dòng)化當(dāng)中,由此不但能夠?qū)﹄娏ο到y(tǒng)進(jìn)行全面的監(jiān)視和控制,而且還能使系統(tǒng)的重要設(shè)備始終處于受控狀態(tài)。

篇5

關(guān)鍵詞:機(jī)器視覺(jué);三維重建;圖像處理

中圖分類號(hào):TP301

文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2014)003-0013-02

作者簡(jiǎn)介:羅尤春(1989-),男,華中科技大學(xué)機(jī)械科學(xué)與工程學(xué)院碩士研究生,研究方向?yàn)闄C(jī)器視覺(jué)。

1 Marr機(jī)器視覺(jué)框架

在漫漫進(jìn)化歷程中,人類和大部分動(dòng)物通過(guò)視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等來(lái)獲取周圍世界的信息,并通過(guò)大腦處理這些信息。而根據(jù)調(diào)查,人類大腦處理的信息有80%是來(lái)自視覺(jué),我們通過(guò)雙目感受深度信息,通過(guò)對(duì)不同頻率光信號(hào)進(jìn)行判別來(lái)獲取顏色信息[1]。通過(guò)運(yùn)用攝像機(jī)來(lái)達(dá)到模擬人眼的識(shí)別和測(cè)量功能,機(jī)器視覺(jué)成為人工智能研究的重要環(huán)節(jié)。機(jī)器視覺(jué)區(qū)別于計(jì)算機(jī)視覺(jué),更偏向于應(yīng)用,一個(gè)機(jī)器視覺(jué)系統(tǒng)一般通過(guò)攝像機(jī)之類的光學(xué)儀器以圖像的形式獲取周圍世界的信息,通過(guò)計(jì)算機(jī)進(jìn)行圖像處理和圖像理解,再根據(jù)相應(yīng)的控制程序和機(jī)械驅(qū)動(dòng)設(shè)備對(duì)智能輸出設(shè)備發(fā)出操作指令,實(shí)現(xiàn)智能控制和操作功能。

早期的機(jī)器視覺(jué)局限于對(duì)二維圖像的分析、識(shí)別和理解上[2]。20世紀(jì)80年代初,Marr第一次融合圖像處理、神經(jīng)科學(xué)的相關(guān)研究,提出了里程碑式的視覺(jué)系統(tǒng)框架。具體來(lái)說(shuō),Marr框架包括三個(gè)層次:計(jì)算理論層次、表達(dá)與算法層次、硬件實(shí)現(xiàn)層次。計(jì)算理論層次,可以理解為通過(guò)對(duì)二維圖像的理解來(lái)重建三維客觀世界的視覺(jué)三維重建理論研究。因?yàn)楝F(xiàn)實(shí)世界是復(fù)雜多變的,如何建立一種通過(guò)二維圖像來(lái)實(shí)現(xiàn)三維重建的普適性方法成為機(jī)器視覺(jué)系統(tǒng)中最重要也是終極的目的。Marr提出的這一層次是想通過(guò)建立某種普適性模型來(lái)獲取客觀世界任何物體的形狀、位置以及運(yùn)動(dòng)的信息;表達(dá)與算法層次低于計(jì)算理論層次,是要解決“軟件”的問(wèn)題,即如何實(shí)現(xiàn)機(jī)器視覺(jué)系統(tǒng)各個(gè)模塊之間信息輸入、輸出和信息表達(dá)的問(wèn)題,亦即各種算法的實(shí)現(xiàn);硬件實(shí)現(xiàn)層次可理解為如何組建機(jī)器視覺(jué)系統(tǒng)的硬件實(shí)體設(shè)備,與表達(dá)與算法層次一起為計(jì)算理論層次服務(wù)。

Marr提出的視覺(jué)框架中研究最多的是計(jì)算理論層次和表達(dá)與算法層次,分別對(duì)應(yīng)下節(jié)要介紹的三維重建理論和圖像處理。

2 三維重建

視覺(jué)三維重建理論是整個(gè)視覺(jué)領(lǐng)域研究的重點(diǎn)和前沿??陀^世界的物體都是由基本的幾何要素組成的:點(diǎn)、直線、二次曲線等。因此,要實(shí)現(xiàn)對(duì)客觀世界的描繪,利用這些最基本的幾何要素來(lái)組建客觀世界是可以實(shí)現(xiàn)的。在很多研究中,通過(guò)大量的點(diǎn)對(duì)匹配得到三維世界中物體的三維點(diǎn)云模型,從而模擬出真實(shí)物體的形狀。在三維重建研究中,立體視覺(jué)或稱雙目(多目)視覺(jué)是最重要的手段。仿照人眼的原理,要獲得對(duì)周圍三維世界的認(rèn)知,必須知道深度信息,最少需要兩個(gè)眼睛。與此同理,立體視覺(jué)一般都需要兩個(gè)或者多個(gè)攝像機(jī)同時(shí)工作,才能較好地得到周圍世界的三維信息。

2.1 攝像機(jī)針孔模型

攝像機(jī)的普適模型——針孔模型來(lái)源于小孔成像現(xiàn)象。簡(jiǎn)單地說(shuō),針孔模型是指空間中一點(diǎn)P與攝像機(jī)中一特定點(diǎn)C(稱為光心)的連線交攝像機(jī)的圖像平面于點(diǎn)p,這個(gè)點(diǎn)p便是空間點(diǎn)P的成像點(diǎn),蘊(yùn)含了空間點(diǎn)P的幾何信息。從數(shù)學(xué)的觀點(diǎn),攝像機(jī)的成像模型是一個(gè)從三維到二維的映射f:Pp,是一個(gè)降維映射,丟失掉了深度信息,即處于光心C—空間點(diǎn)P的直線上任意一點(diǎn)Q的投影也都是p。從數(shù)學(xué)上可以證明,至少需要兩幅或以上圖像才能重建出空間點(diǎn)P的深度信息zP。

2.2 空間點(diǎn)三維重建

采用兩個(gè)不同的攝像機(jī)位拍攝空間中同一點(diǎn)P的圖像,分別得到P在左右攝像機(jī)圖像平面上的投影點(diǎn)p\-L和p\-R,如果事先知道左右攝像機(jī)的相對(duì)位置關(guān)系——稱為雙目攝像機(jī)標(biāo)定,那么就知道了左右攝像機(jī)的光心C\-L和C\-R的位置。簡(jiǎn)而言之,雙目視覺(jué)系統(tǒng)能夠提供給我們一個(gè)坐標(biāo)系(左或者右攝像機(jī)坐標(biāo)系),在這個(gè)坐標(biāo)系下通過(guò)攝像機(jī)標(biāo)定知道兩個(gè)光心C\-L和C\-R的位置以及投影點(diǎn)p\-L和p\-R的位置,直線C\-Lp\-L和C\-Rp\-R的交點(diǎn)就是要重建的空間點(diǎn)P。

2.3 空間直線三維重建

空間直線的重建原理和空間點(diǎn)的重建類似,假如要重建空間直線L,得到L在左右攝像機(jī)圖像平面上的投影直線l\-L和l\-R,那么左攝像機(jī)光心C\-L和左投影l(fā)\-L形成一個(gè)平面S\-L,同理右攝像機(jī)光心C\-R和右投影l(fā)\-R形成一個(gè)平面S\-R,則空間直線L就是平面S\-L和S\-R的相交直線。

2.4 二次曲線三維重建

實(shí)二次曲線一般包括橢圓、雙曲線、拋物線和圓[3]。關(guān)于二次曲線的三維重建,司少華等[4]在1993年提出了一種特征值的方法,其開(kāi)創(chuàng)性貢獻(xiàn)在于首先將二次曲線視為一個(gè)幾何元素來(lái)進(jìn)行重建,而非利用二次曲線由其上的若干點(diǎn)(至少5個(gè)點(diǎn))決定的原理,更不是利用點(diǎn)云的思想來(lái)重建二次曲線。將要重建的對(duì)象視作整體而非利用局部元素(點(diǎn))去擬合逼近的思想是視覺(jué)理論更進(jìn)一步的發(fā)展。圓作為最常見(jiàn)的二次曲線特征被廣泛應(yīng)用在物體空間定位上[5]。

3 圖像處理

圖像處理是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行分析,得到需要的信息。所謂圖像,其數(shù)學(xué)模型即一個(gè)二元向量函數(shù)f(x,y),其坐標(biāo)(x,y)表示圖像的橫縱坐標(biāo)。對(duì)于灰度圖像,這個(gè)向量函數(shù)成為一個(gè)標(biāo)量函數(shù),f(x,y)表示對(duì)應(yīng)平面坐標(biāo)(x,y)的灰度值。對(duì)于彩色圖像,一般使用RGB三原色來(lái)表征,即f=[R,G,B]\+T。圖像處理的內(nèi)容非常豐富,包括了圖像濾波去噪、邊緣檢測(cè)、圖像復(fù)原、形態(tài)學(xué)處理、圖像分割等。其中,為了得到三維重建所必須知道的點(diǎn)、直線、二次曲線等圖像信息,邊緣檢測(cè)至關(guān)重要。所謂邊緣檢測(cè),目的是要識(shí)別出圖像中灰度值變化明顯的圖像點(diǎn)。圖像中突變的位置一般代表了三維世界中的不同屬性?,F(xiàn)有的邊緣檢測(cè)算子包括Canny算子[6]、Sobel算子、Prewitt算子、Roberts Cross算子、羅盤算子、Marr-Hildreth算子等。

A=imread('Beach.jpg');

B=rgb2gray(A);

C=edge(B,'canny',0.1);

imshow(C)

4 機(jī)器視覺(jué)應(yīng)用及前景

機(jī)器視覺(jué)技術(shù)廣泛應(yīng)用于機(jī)器人、工業(yè)檢測(cè)等領(lǐng)域。由于機(jī)器視覺(jué)系統(tǒng)是一套光學(xué)系統(tǒng),因此具有非接觸式測(cè)量的優(yōu)點(diǎn)。由于計(jì)算機(jī)的運(yùn)算速度不斷刷新紀(jì)錄,使得圖像處理效率也不斷提升,運(yùn)用機(jī)器視覺(jué)系統(tǒng)能夠?yàn)楣I(yè)中的不同應(yīng)用提供實(shí)時(shí)數(shù)據(jù)。加載視覺(jué)系統(tǒng)的智能機(jī)器人不僅擁有靈活、快捷的操作手臂,而且配置了靈敏的攝像機(jī)充當(dāng)“眼睛”,還有超強(qiáng)計(jì)算能力的計(jì)算機(jī)充當(dāng)“大腦”,真正實(shí)現(xiàn)了手—眼—腦同體。在工業(yè)檢測(cè)以及測(cè)量領(lǐng)域,機(jī)器視覺(jué)利用自身的獨(dú)特優(yōu)勢(shì)在質(zhì)量缺陷、生產(chǎn)監(jiān)控等方面占據(jù)了重要地位。機(jī)器視覺(jué)是一種人工智能技術(shù),在未來(lái)的智能化時(shí)代,視覺(jué)技術(shù)必定能成為人機(jī)交互的最重要途徑之一。

參考文獻(xiàn):

[1] 張廣軍.機(jī)器視覺(jué)[M].北京:科學(xué)出版社,2005.

[2] 馬頌德,張正友.計(jì)算機(jī)視覺(jué):計(jì)算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,2003.

[3] 呂林根,許子道.解析幾何[M].北京:高等教育出版社,2006.

[4] 司少華,馬頌德.基于二次曲線的立體視覺(jué)[J].自動(dòng)化學(xué)報(bào),1993,19(4):420-427.

篇6

關(guān)鍵詞:ICA-HMAX模型;視覺(jué)相似度;卷積核;語(yǔ)義相似度

中圖分類號(hào):TP317 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)08-0177-05

Abstract: This paper firstly introduces a multi-level convolutional ICA-HMAX model; then propose visualization methods of the convolution kernel convolution kernel to achieve different levels of understanding. Proposed using S3 layer feature of the ICA-HMAX model to achieve visual similarity calculation of different categories. By implementing different categories of visual similarity between calculated on Caltech 101 datasets, and compared with the semantic similarity between categories and further explore the relationship between semantic similarity and visual similarity between.

Key words: ICA-HMAX model ;visual similarity; kernel convolution kernel; semantic similarity

1 概述

21世紀(jì)以來(lái),數(shù)字成像技術(shù)和存儲(chǔ)技術(shù)得到了空前的發(fā)展;使得每天有數(shù)量巨大的數(shù)字圖像進(jìn)入人們的生活,成為人類生活、工作、娛樂(lè)中的組成部分。另一方面,互聯(lián)網(wǎng)技術(shù)的發(fā)展給圖像的迅速傳播提供了有利的條件。此外,圖像是視覺(jué)信息的重要來(lái)源之一,蘊(yùn)含豐富的語(yǔ)義信息。圖像理解是人工智能領(lǐng)域中的一個(gè)新的方向,其核心問(wèn)題是研究如何使計(jì)算機(jī)能夠像人腦一樣有效正確理解圖像中所表達(dá)的高層語(yǔ)義信息。

仿生多層模型在計(jì)算機(jī)視覺(jué)和人工智能鄰域取得了顯著的成果。20世紀(jì)末,Poggio和Riesenhuber根據(jù)IT皮層的生理學(xué)數(shù)據(jù)提出了標(biāo)準(zhǔn)HMAX模型[1],該模型模擬視皮層中腹側(cè)通路中簡(jiǎn)單細(xì)胞(Simple Cell)和復(fù)雜細(xì)胞(Complex Cell)的交替處理的功能,實(shí)現(xiàn)多層次特征提取。在此基礎(chǔ)上,Serre等人提出一種具有隨著層次的增加復(fù)雜度和不變性逐漸增強(qiáng)的圖像特征表達(dá)[2],并將其應(yīng)用到真實(shí)場(chǎng)景的目標(biāo)識(shí)別中,其識(shí)別性能明顯優(yōu)于傳統(tǒng)的特征表達(dá)(如SIFT特征[3]);Hu等人根據(jù)大腦神經(jīng)元響應(yīng)的稀疏特性進(jìn)一步擴(kuò)展HMAX模型,提出了Sparse-HMAX模型[4],在分類性能上遠(yuǎn)遠(yuǎn)優(yōu)于HMAX模型,同時(shí)較好模擬和解釋神經(jīng)元對(duì)視覺(jué)信號(hào)的稀疏響應(yīng)。

本文內(nèi)容章節(jié)安排如下:第2節(jié)首先簡(jiǎn)要描述了本文的ICA-HMAX模型;然后介紹卷積核的可視化方法;第3節(jié)介紹基于WordNet的語(yǔ)義相似度計(jì)算和基于ICA-HMAX的視覺(jué)相似度計(jì)算方法。第4節(jié)實(shí)驗(yàn)結(jié)果和分析。第5節(jié)總結(jié)與展望。

2 ICA-HMAX模型與卷積核可視化

2.1 ICA-HMAX模型簡(jiǎn)介

前饋ICA-HMAX模型由五層構(gòu)成如圖1所示。自底向上依次為S1C1S2C2S3五層,其中S1層卷積核(W1、V1)由獨(dú)立成分析(Independent Component Analysis,ICA)方法從彩色圖像的數(shù)據(jù)塊中學(xué)習(xí)獲得,為了使得C1層具有局部空間平移不變性,在S1層的每個(gè)二維平面響應(yīng)圖上進(jìn)行局部最大值匯聚(max pooling)操作;同理,S2層卷積核(W2、V2)也是采用ICA方法從C1層采樣塊中學(xué)習(xí)獲得;同樣,為了使得C2層也具有局部空間平移不變性,在S2層的每個(gè)二維平面響應(yīng)圖上進(jìn)行最大值匯聚(max pooling)操作;同理可以獲得S3層的卷積核(W3、V3)以及S3層的特征表達(dá)。值得注意的是該前饋模型的卷積核均為單尺度。

2.2 卷積核的可視化

若要實(shí)現(xiàn)對(duì)多層模型ICA-HMAX的深入的了解,需要知道不同層次的卷積核編碼的圖像信息。由于S1層特征卷積核是在彩色圖像的原始像素層上學(xué)習(xí),可以在像素空間上直接觀察S1層卷積核編碼的圖像信息。而S2、S3層的卷積核是在圖像C1、C2層的響應(yīng)圖上經(jīng)過(guò)ICA學(xué)習(xí)獲得高維數(shù)據(jù),因此不能直接觀察其卷積核編碼的圖像信息。為了觀察S2、S3層的卷積核所編碼的圖像信息,當(dāng)給定一個(gè)某個(gè)類別的卷積核的條件下,本文提出在該類別的圖像上找出使得該卷積核的刺激最大的前50個(gè)感受野區(qū)域,并將這些區(qū)域與其刺激的響應(yīng)值進(jìn)行加權(quán)求和,然后取平均;所得結(jié)果具有表示S2、S3層卷積核所編碼的圖像信息從而作為S2、S3層的卷積核可視化。

3 相似度計(jì)算

3.1 基于WordNet的語(yǔ)義相似度計(jì)算

WordNet是由普林斯頓大學(xué)心理學(xué)家,語(yǔ)言學(xué)家和計(jì)算機(jī)工程師聯(lián)合設(shè)計(jì)的一種基于認(rèn)知語(yǔ)言學(xué)的英語(yǔ)詞典。它不是光把單詞以字母順序排列,而且按照單詞的意義組成一個(gè)“單詞的網(wǎng)絡(luò)”。一般來(lái)講,國(guó)內(nèi)外的研究學(xué)者將經(jīng)典的基于語(yǔ)義的相似度的計(jì)算方法分為三個(gè)類型[6,7]:基于距離的相似度計(jì)算(Path Counting Measures)、基于信息內(nèi)容的相似度計(jì)算(Information Content Measures)和基于特性的相似度計(jì)算(Feature-based Measures)。本文主要介紹基于距離的相似度計(jì)算方法――Shortest Path算法和Leacock and Chodorow算法。

3.2 基于視覺(jué)的類別相似度

眾所周知,不同類別之間存在部分外觀相似性,比如山貓和豹、狼和哈士奇、浣熊和果子貍等等??梢?jiàn),分別在兩個(gè)類別的訓(xùn)練集上訓(xùn)練ICA-HMAX模型,若兩個(gè)類別視覺(jué)相似度越高,則這兩個(gè)類別的S3層卷積核相似的基元個(gè)數(shù)越多;反之,兩類別的S3層卷積核中的相似的基元個(gè)數(shù)越多,兩個(gè)類別的視覺(jué)相似度越高。

我們知道兩個(gè)類別的相似度越高,則兩個(gè)類別的ICA-HMAX模型越能較好地實(shí)現(xiàn)對(duì)異類圖像的相互表達(dá)。因此采用配對(duì)字典的方法[10]實(shí)現(xiàn)對(duì)S3特征表達(dá)的重構(gòu)。然后,將重構(gòu)圖像與輸入圖的結(jié)構(gòu)相似度[11](SSIM)作為衡量S3層特征對(duì)輸入圖像描述的好壞。若重構(gòu)圖像與輸入圖的結(jié)構(gòu)相似度越高,則兩個(gè)類別的視覺(jué)語(yǔ)義相似度越高,反之亦然?;谀繕?biāo)類別的視覺(jué)語(yǔ)義相似度算法流程如表1所示:

4 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)設(shè)置:實(shí)驗(yàn)所使用的PC機(jī)配置為Intel(R) Core(TM) i7-4770、CPU 3.4GHz × 8 cores、RAM 16 GB、Windows 7操作系統(tǒng)。為了探索不同類別之間的語(yǔ)義相似度和基于ICA-HMAX模型S3層的特征描述子的視覺(jué)語(yǔ)義相似度之間的關(guān)系,本文選擇了Caltech 101數(shù)據(jù)集[12]進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)集以彩色自然場(chǎng)景圖像為主(包含一定數(shù)量的人造圖像)。包括動(dòng)物、花、人臉等101個(gè)目標(biāo)類別以及一個(gè)背景類別。除背景類別之外,每個(gè)類別中的每張圖片只包括一個(gè)類別中的一個(gè)實(shí)例,這有利于本實(shí)驗(yàn)進(jìn)行。在進(jìn)行實(shí)驗(yàn)之前,首先對(duì)數(shù)據(jù)集中每張圖像做如下預(yù)測(cè)處理:統(tǒng)一圖像高度為140個(gè)像素,保持圖像的長(zhǎng)寬比不變,采用雙三次插值對(duì)其進(jìn)行縮放。將每個(gè)類別中的圖片按照4:1的比例分成訓(xùn)練集和測(cè)試集,在訓(xùn)練上訓(xùn)練各個(gè)類別的ICA-HMAX模型,采用3.2節(jié)介紹的視覺(jué)語(yǔ)義相似度方法在測(cè)試集上測(cè)試不同類別之間的視覺(jué)相似度。

4.1卷積核的可視化

圖3(b)、(c)、(d)分別給出了S1、S2和S3層卷積核的可視化結(jié)果。結(jié)果表明,不同層次的卷積核編碼了圖像不同類型的特征。圖3(b)中的S1層卷積核均編碼了圖像底層特征(如彩色邊緣、彩色表面、拐角等結(jié)構(gòu)信息等),并且不同類別的底層特征具有相似的結(jié)構(gòu)特征;值得注意的是,通過(guò)ICA在彩色圖像上的學(xué)習(xí),獲得了重要的顏色信息如彩色邊緣、彩色表面等。S2層卷積核編碼了各類別的中層部件特征,例如face_easy類別的S2層編碼了人臉的眼睛、嘴巴、鼻子等信息,如圖3(c)所示。由圖3(d)可以看出,由于S3層卷積核的感受野比S2層大,編碼信息更趨于類別信息。研究表明:這符合圖像理解的層次特性[13]。

4.2 相似度

數(shù)據(jù)集Caltech101圖像部分類別之間的基于路徑的Shortest Path算法和Leacock and Chodorow的相似度矩陣分別如圖4和圖5所示。由圖4和圖5可以看出這兩個(gè)矩陣都是對(duì)稱矩陣。與一個(gè)類別最相似的類別有的不止一個(gè),如與ant類別最相近的類別是butterfly、dragonfly、mayfly。值得注意的是圖5中基于路徑的Leacock and Chodorow算法的類別相似度數(shù)據(jù)是經(jīng)過(guò)歸一化處理后的數(shù)據(jù)。

本文采用基于ICA-HMAX模型的S3層的特征計(jì)算視覺(jué)相似,其視覺(jué)相似度矩陣的結(jié)果如圖6所示。在該相似度矩陣中,把同一類別之間的視覺(jué)相似度設(shè)置為1作參考,來(lái)衡量不同類別之間的視覺(jué)相對(duì)度。在圖6中橫軸表示ICA-HMAX模型的類別??v軸表示測(cè)試圖像的類別。由圖6可見(jiàn),不同類別之間的視覺(jué)相似度矩陣不是對(duì)稱。比如用airplane的ICA-HMAX模型對(duì)helicopter類別的圖像進(jìn)行表達(dá),并計(jì)算其視覺(jué)相似度其值為0.506;而當(dāng)用helicopter的ICA-HMAX模型對(duì)airplane類別的圖像進(jìn)行表達(dá),并計(jì)算其視覺(jué)相似度其值為0.253。且與一個(gè)類別最相似的類別只有一個(gè)。在Caltech101數(shù)據(jù)集中helicopter類別的直升機(jī)的實(shí)例圖片上都存在較為明顯的螺旋槳。在airplane類別的飛機(jī)圖像沒(méi)有明顯的螺旋槳。而在忽略helicopter類別的直升機(jī)螺旋槳后,直升機(jī)的機(jī)體形狀與airplane類別的機(jī)體在視覺(jué)上存在相似?;谡Z(yǔ)義和視覺(jué)的相似度統(tǒng)計(jì)如表2所示。

兩種相似度之間的差異性分析:由表2可知,基于語(yǔ)言的語(yǔ)義的相似度與基于視覺(jué)的相似度之間存在一致性和差異性。一致性:由表2可知,20個(gè)類別中基于語(yǔ)義和視覺(jué)的相似度一致有5對(duì),分別sunflower和bonsai、rhino和llama、airplane和helicopter、ant和mayfly、hedgehog和llama。比如airplane和helicopter這兩個(gè)類別的實(shí)例如圖7所示。由圖可見(jiàn),不同類別之間存在視覺(jué)相似,兩個(gè)類別實(shí)例在的某些局部形狀、顏色、紋理等方面具有視覺(jué)上的相似性。差異性:由表2可知:20個(gè)類別中基于語(yǔ)義和視覺(jué)的相似度不一致的較多。如圖8所示,ant、butterfly和dragonfly這三個(gè)類別的語(yǔ)義相對(duì)度很高但是它們的視覺(jué)相似度相差較大。原因在于:語(yǔ)義即語(yǔ)言意義,是人腦對(duì)客觀上事物的認(rèn)識(shí)和理解,它具有高度的概括性和抽象性。類別之間的語(yǔ)義往往根據(jù)類別所屬范疇、關(guān)系、屬性、功能等綜合特性來(lái)進(jìn)行劃分。而僅僅從事物的視覺(jué)外觀上無(wú)法體現(xiàn)出上述種種關(guān)系。

5 結(jié)論與展望

通過(guò)ICA-HMAX不同層次卷積核的可視化分析可知:自底層到高層不同層次的卷積編碼規(guī)律如下:不同層次的卷積核編碼了圖像不同類型的特征。模型的層次越高,卷積核編碼的信息越趨向于反映目標(biāo)類別的特性,S1層卷積核編碼體現(xiàn)底層共享特征(如拐角、 彩色邊緣、彩色表面等)。S2層卷積核編碼中層部件特征,比如face_easy類別的S2層編碼了人臉的眼睛、嘴巴、鼻子等局部信息。S3層編碼信息更趨于類別的全局信息。研究表明:這符合圖像理解的層次特性。

通過(guò)視覺(jué)的相似和語(yǔ)義的相似度分析可知,基于ICA-HMAX模型的S3層特性的視覺(jué)相似度與語(yǔ)義相似之間存在一致性和差異性。這種一致性和差異性在計(jì)算機(jī)視覺(jué)和人工智能領(lǐng)域具有互補(bǔ)性。比如對(duì)于那些語(yǔ)義和視覺(jué)的相似度一致的類別,尤其是視覺(jué)相似度較高的類別之間可以進(jìn)行遷移學(xué)習(xí),使得計(jì)算機(jī)實(shí)現(xiàn)人類的類比學(xué)習(xí)能力。對(duì)于語(yǔ)義和視覺(jué)的相似度差異性在圖像的檢索和圖像理解等方面可以實(shí)現(xiàn)互補(bǔ)。通過(guò)語(yǔ)義的相似度我們可以檢索到較多的相似類別,如與ant語(yǔ)義相似的有ant、dragonfly、butterfly。這樣我們可以實(shí)現(xiàn)大范圍的查找。然后在通過(guò)視覺(jué)的相似度進(jìn)一步篩選正確的類別圖片。反之,通過(guò)語(yǔ)義可以指導(dǎo)基于視覺(jué)的機(jī)器學(xué)習(xí)。

參考文獻(xiàn):

[1] Riesenhuber M, Poggio T. Hierarchical models of object recognition in cortex [J]. Nature neuroscience, 1999, 2(11): 1019-1025.

[2] Serre T, Wolf L, Bileschi S, et al. Robust object recognition with cortex-like mechanisms [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2007, 29(3): 411-426.

[3] Lowe D G. Distinctive image features from scale-invariant keypoints [J]. International journal of computer vision, 2004, 60(2): 91-110.

[4] Hu X, Zhang J, Li J, et al. Sparsity-regularized HMAX for visual recognition [J]. PloS one, 2013, 9(1): e81813-e81813

[5] Nair V, Hinton G E. Rectified linear units improve restricted boltzmann machines [C] //Proceedings of the 27th International Conference on Machine Learning (ICML-10). 2010: 807-814.

[6] Hliaoutakis A. Semantic Similarity Measures in MeSH Ontology and their application to Information Retrieval on Medline [J]. 2005.

[7] Raftopoulou P, Petrakis E. Semantic similarity measures: A comparison study [J]. Technical University of Crete, Department of Electronic and Computer Engineering, Tech. Rep. TR-TUC-ISL-04-2005, 2005.

[8] R. Rada, H. Mili, E. Bicknell and M. Blettner, “Development and Application of a Metric on Semantic Nets”, IEEE Transactions on Systems, Man and Cybernetics, vol. 19, Issue 1, (1989) January-February, pp. 17 - 30.

[9] H. Bulskov, R. Knappe and T. Andreasen, “On Measuring Similarity for Conceptual Querying”, Proceedings of the 5th International Conference on Flexible Query Answering Systems, (2002) October 27-29, Copenhagen, Denmark.

[10] Vondrick C, Khosla A, Malisiewicz T, et al. HOGgles: Visualizing Object Detection Features[C]//Proceedings of the IEEE International Conference on Computer Vision. 2013: 1-8.

[11] Wang Z, Bovik A C, Sheikh H R, et al. Image quality assessment: from error visibility to structural similarity [J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612.

篇7

關(guān)鍵詞:虛擬現(xiàn)實(shí)技術(shù);校園環(huán)境設(shè)計(jì);分析

DOI:10.16640/ki.37-1222/t.2016.23.108

0 前言

隨著社會(huì)和科學(xué)技術(shù)的發(fā)展,基于圖像繪制的虛擬現(xiàn)實(shí)技術(shù)已經(jīng)成為計(jì)算機(jī)視覺(jué),圖像處理,計(jì)算機(jī)圖形學(xué),人工智能研究的熱點(diǎn)。雖然虛擬現(xiàn)實(shí)技術(shù)目前在很多領(lǐng)域中的實(shí)際應(yīng)用已有很大進(jìn)展,例如虛擬現(xiàn)實(shí)技術(shù)己經(jīng)廣泛地應(yīng)用于軍事、醫(yī)學(xué)、建筑、商業(yè)等領(lǐng)域。

伴隨著虛擬現(xiàn)實(shí)技術(shù)(VR技術(shù))的日益成熟和飛速發(fā)展,在園林景觀設(shè)計(jì)中,對(duì)虛擬現(xiàn)實(shí)技術(shù)的應(yīng)用也不斷加強(qiáng)。

1 虛擬現(xiàn)實(shí)技術(shù)的簡(jiǎn)介

虛擬現(xiàn)實(shí)技術(shù)又稱VR技術(shù),是20世紀(jì)90年代伴隨著計(jì)算機(jī)技術(shù)而興起的新興技術(shù),主要特點(diǎn)是可沉浸式的與虛擬場(chǎng)景進(jìn)行交流互動(dòng),它的基礎(chǔ)媒介和載體是計(jì)算機(jī)和互聯(lián)網(wǎng),利用計(jì)算機(jī)生成一種仿真系統(tǒng)來(lái)模擬真實(shí)環(huán)境,利用互聯(lián)網(wǎng)充分傳播虛擬現(xiàn)實(shí)技術(shù),虛擬現(xiàn)實(shí)技術(shù)被應(yīng)用在軍事、醫(yī)學(xué)、商業(yè)、建筑規(guī)劃等多個(gè)領(lǐng)域,具有廣泛的發(fā)展前景。

而近幾年隨著虛擬現(xiàn)實(shí)技術(shù)的不斷發(fā)展,人機(jī)交互技術(shù)成為了虛擬現(xiàn)實(shí)領(lǐng)域的一項(xiàng)重要研究方向,由此而引發(fā)了一系列的交互性硬件載體的出現(xiàn),如3D虛擬眼鏡、浮動(dòng)鼠標(biāo)器、頭盔式虛擬顯示器、數(shù)據(jù)手套、數(shù)據(jù)衣、語(yǔ)音識(shí)別器等,通過(guò)這些傳感設(shè)備,體驗(yàn)者可以對(duì)虛擬世界中的物體進(jìn)行觀察和操作,使體驗(yàn)者擁有沉浸式的體驗(yàn)感受,融入五感體驗(yàn)(視覺(jué)、嗅覺(jué)、聽(tīng)覺(jué)、味覺(jué)、觸覺(jué))的虛擬現(xiàn)實(shí)技術(shù)與以前的單純通過(guò)視覺(jué)來(lái)刺激體驗(yàn)者的模式發(fā)生了質(zhì)的變化。

2 虛擬現(xiàn)實(shí)技術(shù)在校園環(huán)境設(shè)計(jì)領(lǐng)域的應(yīng)用

2.1 虛擬現(xiàn)實(shí)軟件

虛擬現(xiàn)實(shí)技術(shù)所應(yīng)用的軟件主要分為前期建模階段的軟件和后期渲染的軟件,前期建模階段的主流軟件有:MAYA、3Dsmax、犀牛、Google Sketchup,后期渲染的軟件主要有l(wèi)umion、unity3D、C4D、Vray、光輝城市、酷家樂(lè)。

2.2 應(yīng)用特點(diǎn)介紹

(1)準(zhǔn)確性:利用計(jì)算機(jī)輔助系統(tǒng)下的虛擬現(xiàn)實(shí)技術(shù),在虛擬場(chǎng)景建立方面具有很強(qiáng)的精準(zhǔn)度,根據(jù)實(shí)際設(shè)計(jì)中的真實(shí)尺寸可以創(chuàng)造出真實(shí)建立之后的效果感受,供使用者觀察。(2)實(shí)時(shí)渲染:利用虛擬現(xiàn)實(shí)軟件生成的實(shí)時(shí)渲染場(chǎng)景,具有良好的可視化效果,通過(guò)實(shí)時(shí)渲染技術(shù),生成真實(shí)的陽(yáng)光、風(fēng)向、天氣、季節(jié),模擬大自然的真實(shí)光照,使體驗(yàn)者沉浸于場(chǎng)景的游覽交互中,而且無(wú)需像傳統(tǒng)渲染那樣耗費(fèi)大量時(shí)間。(3)想象力:除了虛擬現(xiàn)實(shí)校園環(huán)境具有模擬真實(shí)場(chǎng)景外,還可以進(jìn)行模擬某些不可能發(fā)生的場(chǎng)景環(huán)境,使得游覽體驗(yàn)過(guò)程中的趣味性得到極大的提高,超越體驗(yàn)者的想象。

2.3 虛擬現(xiàn)實(shí)技術(shù)與3D動(dòng)畫的區(qū)別

傳統(tǒng)的3D動(dòng)畫與虛擬現(xiàn)實(shí)表現(xiàn)技術(shù)表面上看起來(lái)都具有動(dòng)態(tài)效果,但實(shí)質(zhì)卻完全不同。虛擬現(xiàn)實(shí)技術(shù)可以進(jìn)行人機(jī)交互,由人控制虛擬場(chǎng)景的鏡頭,具有實(shí)時(shí)渲染的效果,而3D動(dòng)畫雖然也是動(dòng)態(tài)效果,卻是不可操控的,由設(shè)計(jì)師事先做好播放的,更不能進(jìn)行場(chǎng)景切換和鏡頭操控等動(dòng)作。在虛擬場(chǎng)景下操控者可以對(duì)設(shè)計(jì)方案進(jìn)行創(chuàng)作、修改和優(yōu)化,而3D動(dòng)畫無(wú)法進(jìn)行二次修改,只能重新制作而耗費(fèi)了大量人力物力和時(shí)間成本。

2.4 虛擬現(xiàn)實(shí)技術(shù)在景觀設(shè)計(jì)中的應(yīng)用特色

傳統(tǒng)校園景觀設(shè)計(jì)的表現(xiàn)多側(cè)重于手繪圖和平面CAD圖和PS效果圖,在對(duì)外宣傳過(guò)程中,CAD圖和PS效果圖這些表現(xiàn)方法,無(wú)法提供給體驗(yàn)者沉浸感和真實(shí)的3維感受,也無(wú)法根據(jù)意愿自由旋轉(zhuǎn)視角,通過(guò)平面圖推敲想象方案,無(wú)法以人的視角進(jìn)行活動(dòng)。而在虛擬現(xiàn)實(shí)系統(tǒng)中的校園景觀,我們利用計(jì)算機(jī)可以對(duì)不同人物的視線高度進(jìn)行設(shè)置調(diào)整,體驗(yàn)者可以隨意觀察場(chǎng)景內(nèi)的任意角度,讓體驗(yàn)者有親臨現(xiàn)場(chǎng)的真實(shí)感受。

3 交互性設(shè)備在校園環(huán)境設(shè)計(jì)中的應(yīng)用發(fā)展

虛擬現(xiàn)實(shí)技術(shù)經(jīng)過(guò)十幾年的快速發(fā)展,在傳統(tǒng)的建模方法、效果表現(xiàn)等方面,已經(jīng)有了較大的突破和發(fā)展,隨著交互性設(shè)備在虛擬現(xiàn)實(shí)技術(shù)中的應(yīng)用,校園環(huán)境設(shè)計(jì)領(lǐng)域的效果表現(xiàn)也迎來(lái)了新的改變。lumion6.3結(jié)合虛擬3D眼鏡,把lumion中的場(chǎng)景導(dǎo)出全景模式,將3D眼鏡與lumion連接,就可以進(jìn)行3維全景觀看效果圖,伴隨著頭部的晃動(dòng),3D眼鏡內(nèi)的的場(chǎng)景也會(huì)隨之變化。利用3D眼鏡觀察虛擬校園場(chǎng)景方案,相比傳統(tǒng)2維效果圖和平面圖,有了質(zhì)的飛越,對(duì)于校園方案的效果感受將會(huì)更強(qiáng)烈。國(guó)內(nèi)新晉軟件光輝城市也在虛擬現(xiàn)實(shí)表達(dá)領(lǐng)域有所發(fā)展,可以通過(guò)該軟件進(jìn)行虛擬場(chǎng)景內(nèi)的互動(dòng),漫游和修改場(chǎng)景,利用外接鼠標(biāo)可以對(duì)場(chǎng)景內(nèi)的鏡頭進(jìn)行控制,利用鍵盤可以實(shí)現(xiàn)場(chǎng)景內(nèi)的移動(dòng)與行走,全方位觀察場(chǎng)景內(nèi)的物體??峒覙?lè)作為新型互聯(lián)網(wǎng)+的設(shè)計(jì)軟件,在室內(nèi)設(shè)計(jì)領(lǐng)域的虛擬場(chǎng)景表現(xiàn)上技術(shù)很成熟,通過(guò)該軟件制作的虛擬校園室內(nèi)實(shí)時(shí)渲染場(chǎng)景,體驗(yàn)用戶可以通過(guò)鼠標(biāo)進(jìn)行3維角度旋轉(zhuǎn)進(jìn)行瀏覽,比傳統(tǒng)3Dsmax渲染效果更直觀,最重要的是通過(guò)該軟件進(jìn)行實(shí)時(shí)渲染效果好,速度快,節(jié)省了大量的渲染時(shí)間,從而節(jié)約了時(shí)間成本。

4 發(fā)展展望

伴隨著電腦和手機(jī)客戶端的日益強(qiáng)大、交互性硬件設(shè)施越來(lái)越完善,虛擬現(xiàn)實(shí)技術(shù)也將會(huì)越來(lái)越成熟,虛擬現(xiàn)實(shí)技術(shù)未來(lái)的兩大發(fā)展方向便是手機(jī)客戶端和交互性硬件的應(yīng)用,伴隨著虛擬現(xiàn)實(shí)技術(shù)的發(fā)展,在校園景觀環(huán)境設(shè)計(jì)中,也將更多的被應(yīng)用于方案設(shè)計(jì)階段、方案表達(dá)階段、以及后期虛擬校園運(yùn)營(yíng)服務(wù)階段,在21世紀(jì),可視化的表達(dá)已經(jīng)不僅限于傳統(tǒng)二維平面的形式。

參考文獻(xiàn):

[1]李國(guó)松.虛擬現(xiàn)實(shí)(VR)技術(shù)在風(fēng)景園林規(guī)劃與設(shè)計(jì)中的應(yīng)用研究[D].中南林業(yè)科技大學(xué)碩士學(xué)位論文,2007.

[2]蘆建國(guó),蘇同向.虛擬現(xiàn)實(shí)技術(shù)與風(fēng)景園林設(shè)計(jì)[A].南京林業(yè)大學(xué),2007.

篇8

關(guān)鍵詞:目標(biāo)跟蹤 視頻圖像 機(jī)器視覺(jué)

中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2012)06(a)-0007-01

隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,視頻圖像中的運(yùn)動(dòng)目標(biāo)跟蹤作為計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)等多學(xué)科的結(jié)晶,逐漸成為圖像處理和計(jì)算機(jī)視覺(jué)領(lǐng)域的研究熱點(diǎn),其應(yīng)用范圍也逐漸拓展,目前,運(yùn)動(dòng)目標(biāo)跟蹤已經(jīng)運(yùn)用到了智能人機(jī)交互、醫(yī)療診斷、軍事制導(dǎo)、天文觀測(cè)、安全監(jiān)控等眾多領(lǐng)域。因此,在實(shí)際應(yīng)用中,對(duì)運(yùn)動(dòng)目標(biāo)跟蹤算法的研究具有重要的理論價(jià)值和現(xiàn)實(shí)意義。

1 基于區(qū)域的跟蹤

基于區(qū)域的跟蹤方法首先要得到包含目標(biāo)的區(qū)域模板,模板的提取一般通過(guò)圖像分割獲得或者是預(yù)先人為確定,模板通常為略大于目標(biāo)的矩形,也可以是不規(guī)則形狀,然后設(shè)定一個(gè)相似性度量,在序列圖像中搜索目標(biāo),把度量取極值時(shí)對(duì)應(yīng)的區(qū)域作為對(duì)應(yīng)幀中的目標(biāo)區(qū)域。由于提取的目標(biāo)模板是以目標(biāo)整體作為對(duì)象,它包含了較完整的目標(biāo)信息,因而具有較高的可信度。

由于該方法以目標(biāo)的整體特征信息作為跟蹤依據(jù),所以在目標(biāo)發(fā)生較小形變等情況下仍然可以準(zhǔn)確的對(duì)目標(biāo)進(jìn)行跟蹤;在目標(biāo)未被遮擋時(shí),跟蹤的準(zhǔn)確性和魯棒性也較好。其缺點(diǎn)首先是這種方法需要對(duì)整個(gè)圖像區(qū)域進(jìn)行搜索,要求獲取的信息較多,因此比較耗時(shí),不能滿足實(shí)際應(yīng)用中視頻監(jiān)控實(shí)時(shí)性的要求,這種方法一般用于跟蹤較小的目標(biāo)或者對(duì)比度較低的目標(biāo);而且跟蹤的目標(biāo)變形不能太大,否則會(huì)導(dǎo)致跟蹤精度下降甚至目標(biāo)丟失;而且,當(dāng)目標(biāo)出現(xiàn)太大遮擋時(shí),也容易造成跟蹤目標(biāo)的丟失。針對(duì)這些缺陷,近年來(lái),對(duì)于基于區(qū)域跟蹤方法研究最多的是如何處理包含目標(biāo)的模板更新,以保證跟蹤的連續(xù)性和穩(wěn)定性。

2 基于活動(dòng)輪廓的跟蹤

基于活動(dòng)輪廓跟蹤的基本思想是提取物體的邊界輪廓作為輪廓模板,利用封閉的曲線輪廓來(lái)表達(dá)運(yùn)動(dòng)目標(biāo),在后繼幀的二值邊緣圖像中跟蹤目標(biāo)輪廓。由于這種方法所使用的模板是目標(biāo)輪廓,并且匹配過(guò)程是在二值圖像中進(jìn)行,所以相對(duì)基于區(qū)域的跟蹤算法來(lái)說(shuō),它的優(yōu)點(diǎn)是計(jì)算量較小,而且在目標(biāo)被部分遮擋的情況下也能連續(xù)的進(jìn)行跟蹤。近來(lái)發(fā)展很快的兩種基于輪廓匹配的跟蹤算法:一是主動(dòng)輪廓線跟蹤算法(Snake模型),Kass[1]等人在1987 年提出了主動(dòng)輪廓模型,也稱其為蛇模型,它是一條可變形曲線(Snake曲線),可任意調(diào)整曲線形狀使其與目標(biāo)輪廓保持一致。另一種是基于Hausdorff距離的輪廓跟蹤算法?;贖ausdorff距離的形狀匹配不同于其他的形狀匹配,一方面,Hausdorff距離不需要建立兩個(gè)點(diǎn)集中的點(diǎn)之間一一對(duì)應(yīng)的關(guān)系,并且對(duì)圖像噪聲和晃動(dòng)具有較好的魯棒性。其缺點(diǎn)是當(dāng)所匹配的點(diǎn)的數(shù)目比較大時(shí),匹配效率會(huì)迅速降低,通常計(jì)算量也較大。

在基于活動(dòng)輪廓方法中,初始化輪廓是整個(gè)算法的核心和關(guān)鍵,如何準(zhǔn)確的獲取運(yùn)動(dòng)目標(biāo)的初始輪廓也是算法研究中的一個(gè)難題,而且運(yùn)動(dòng)物體輪廓的更新比較困難,這也決定了基于活動(dòng)輪廓的方法無(wú)法在目標(biāo)跟蹤中得到普遍應(yīng)用。

3 基于特征的跟蹤算法

基于特征的跟蹤方法基本思想是,在跟蹤過(guò)程中首先提取目標(biāo)的某個(gè)或某些具有不變性的特征,然后利用相關(guān)算法實(shí)現(xiàn)對(duì)運(yùn)動(dòng)目標(biāo)的跟蹤。該方法包括特征提取和特征匹配兩個(gè)過(guò)程。目前常見(jiàn)的特征選擇有角點(diǎn)、紋理、色彩等,但在序列圖像中,單一的特征選取往往無(wú)法實(shí)現(xiàn)跟蹤的準(zhǔn)確性。因此,基于多特征融合的目標(biāo)跟蹤成為當(dāng)前研究的趨勢(shì)?;谔卣鞯姆椒ㄆ鋬?yōu)點(diǎn)是能夠在部分遮擋的情況下,仍舊實(shí)現(xiàn)目標(biāo)跟蹤,在準(zhǔn)確選取特征點(diǎn)的前提下,還可以克服關(guān)照改變以及目標(biāo)發(fā)生幾何形變時(shí)帶來(lái)的跟蹤障礙。同時(shí),該方法還可以將與粒子濾波器[2]、mean-shift算法[3]等結(jié)合使用,提高跟蹤的實(shí)時(shí)性和魯棒性。

4 基于模型的跟蹤

基于模型的跟蹤方法首先是對(duì)目標(biāo)物體的外形特征進(jìn)行建模,然后通過(guò)一定的匹配方法跟蹤目標(biāo),并進(jìn)行模型的實(shí)時(shí)更新。常用的表征物體模型的形式一般分為三類:線圖模型、2D模型和3D模型。目前應(yīng)用較多的是利用物體的三維立體模型。基于模型的跟蹤方法即使在目標(biāo)姿態(tài)變化和部分遮擋的情況下,仍舊可以精確分析目標(biāo)的運(yùn)動(dòng)軌跡,實(shí)現(xiàn)可靠的跟蹤,因而它有較強(qiáng)的魯棒性。但是由于在現(xiàn)實(shí)生活中獲得所有運(yùn)動(dòng)目標(biāo)的精確模型是非常困難的,因此限制了基于模型的跟蹤算法的使用。其次,該跟蹤方法需要大量的時(shí)間來(lái)計(jì)算復(fù)雜的模型,比較耗時(shí),不能滿足跟蹤過(guò)程中的實(shí)時(shí)性和迅速性要求。

5 結(jié)語(yǔ)

視頻圖像跟蹤作為機(jī)器視覺(jué)領(lǐng)域研究的一個(gè)重要內(nèi)容,融合了多個(gè)學(xué)科的知識(shí),具有很大的理論和應(yīng)用價(jià)值,盡管目前對(duì)視頻圖像中運(yùn)動(dòng)目標(biāo)跟蹤的研究取得了較多的成果,但仍有很多亟待解決的問(wèn)題,比如怎樣解決算法實(shí)時(shí)性和準(zhǔn)確度之間的矛盾,同時(shí),算法研究的通用性也始終未能取得全面性的突破和進(jìn)展,因而研究進(jìn)程中將會(huì)面臨許多的挑戰(zhàn)。伴隨著多媒體技術(shù)、生物學(xué)技術(shù)以及神經(jīng)理論知識(shí)的不斷進(jìn)步,同時(shí)基于社會(huì)各行各業(yè)對(duì)于目標(biāo)跟蹤技術(shù)的不斷增長(zhǎng)的需求,相信不久之后,運(yùn)動(dòng)目標(biāo)的跟蹤技術(shù)將會(huì)得到飛速的發(fā)展。

參考文獻(xiàn)

[1] KASS M,WITKIN A.Snakes:active contour models[J].International J of Computer Vision,1988,1:321~331.

篇9

關(guān)鍵字:多投影面;教學(xué)系統(tǒng);沉浸式環(huán)境

中圖分類號(hào):G434 文獻(xiàn)標(biāo)志碼:B 文章編號(hào):1673-8454(2014)02-0070-03

虛擬現(xiàn)實(shí)技術(shù)的發(fā)展使得計(jì)算機(jī)技術(shù)不再是完成某一項(xiàng)工作的重要工具,而是朝著更人性化的一面發(fā)展,它可以使用戶足不出戶就享受到計(jì)算機(jī)虛擬世界給我們帶來(lái)的真實(shí)感覺(jué)。顯示技術(shù)是最終形成虛擬環(huán)境的關(guān)鍵步驟。目前沉浸式顯示技術(shù)正處于蓬勃發(fā)展的階段。

多投影面沉浸式虛擬環(huán)境是由多臺(tái)投影儀拼接而組成的大規(guī)模顯示設(shè)備,加上各種人機(jī)交互設(shè)備,能夠更加清晰地模擬現(xiàn)實(shí)世界場(chǎng)景以及對(duì)歷史的逼真反映,給用戶帶來(lái)更佳的視野范圍和更強(qiáng)的沉浸感,[1]它可以是對(duì)高性能計(jì)算結(jié)果或數(shù)據(jù)庫(kù)的可視化,也可以是純粹的虛擬空間。多投影面沉浸式虛擬環(huán)境為學(xué)校教學(xué)中創(chuàng)設(shè)鮮活的情境提供了技術(shù)支持,可以成為一種全新的教學(xué)平臺(tái),學(xué)習(xí)者可以以各種自然的交互手段與虛擬世界進(jìn)行交互獲取知識(shí),改變了傳統(tǒng)學(xué)習(xí)環(huán)境下學(xué)習(xí)者被動(dòng)接受的學(xué)習(xí)方式,讓學(xué)習(xí)者有一種主動(dòng)學(xué)習(xí)的環(huán)境。

一、多投影面沉浸式虛擬環(huán)境的實(shí)現(xiàn)

1.系統(tǒng)總體設(shè)計(jì)

多投影面沉浸式虛擬環(huán)境按系統(tǒng)結(jié)構(gòu)主要分為:投影系統(tǒng)、用戶交互系統(tǒng)、圖形與計(jì)算系統(tǒng)。投影系統(tǒng)主要包括投影儀陣列以及投影屏幕,用來(lái)顯示大范圍畫面,實(shí)現(xiàn)沉浸式體驗(yàn);用戶交互系統(tǒng)是讓用戶通過(guò)各種虛擬現(xiàn)實(shí)交互設(shè)備與系統(tǒng)應(yīng)用程序之間進(jìn)行自然的交互;圖形與計(jì)算系統(tǒng)是負(fù)責(zé)生成虛擬環(huán)境并對(duì)用戶的交互信息進(jìn)行處理。

在投影系統(tǒng)搭建的過(guò)程中,圖1所示的多投影面沉浸式虛擬環(huán)境的系統(tǒng)設(shè)計(jì)方案如下:使用多臺(tái)PC機(jī)、多臺(tái)投影儀、一個(gè)攝像機(jī),將其中一臺(tái)PC機(jī)作為圖像校正服務(wù)器(Client PC),負(fù)責(zé)捕獲投影儀的反饋信息,計(jì)算校準(zhǔn)數(shù)據(jù);另外幾臺(tái)PC機(jī)(Server PC)作為客戶端,分別連接一臺(tái)投影儀,用于負(fù)責(zé)讀取、處理并根據(jù)相應(yīng)位置分布繪制各顯示區(qū)域的數(shù)據(jù);最后分別通過(guò)相應(yīng)的投影儀輸出到投影屏幕,構(gòu)成一個(gè)完整的無(wú)縫的顯示畫面,各計(jì)算機(jī)通過(guò)局域網(wǎng)進(jìn)行連接和通信,采用鼠標(biāo)或鍵盤等方式與系統(tǒng)進(jìn)行交互。

2.關(guān)鍵技術(shù)

在多投影面沉浸式虛擬環(huán)境的構(gòu)建過(guò)程中,為了保證高清晰、實(shí)時(shí)流暢、邏輯上完整的顯示效果,幾何校正和顏色校正是最為關(guān)鍵的問(wèn)題。技術(shù)流程如圖2所示。

幾何校正是為了解決單個(gè)投影在投影屏幕上產(chǎn)生畸變問(wèn)題以及多個(gè)投影儀之間的畫面對(duì)齊問(wèn)題,使得整個(gè)投影畫面看起來(lái)具有連續(xù)性。[2]

在本系統(tǒng)中,我們?cè)谇叭搜芯康幕A(chǔ)之上,采用一臺(tái)反饋照相機(jī)來(lái)獲取投影圖像的幾何位置信息,根據(jù)圖像處理技術(shù)對(duì)原始圖像進(jìn)行幾何畸變校正,使得各投影儀投出的圖像能形成一幅完整的畫面,使使用者完全沉浸在由多個(gè)投影儀創(chuàng)建的虛擬環(huán)境中。在實(shí)驗(yàn)過(guò)程中考慮到由照相機(jī)鏡頭自身畸變而造成的扭曲,所以在幾何校正之前,我們采用張正友[3]提出的攝像機(jī)標(biāo)定的方法對(duì)數(shù)碼相機(jī)進(jìn)行標(biāo)定,從而對(duì)拍攝出的圖像進(jìn)行預(yù)校正。

幾何校正方案如下:

第一步,特征點(diǎn)采集與處理。對(duì)每臺(tái)投影儀以此投影一組特征圖案,利用數(shù)碼相機(jī)進(jìn)行特征圖案采集。再利用圖像處理技術(shù)對(duì)拍攝圖像進(jìn)行處理,對(duì)投影儀依次編號(hào)記為Hi,與Hi對(duì)應(yīng)的幀緩存中的特征點(diǎn)記為Fi;

第二步,求出所有投影儀顯示區(qū)域的最大有效顯示區(qū)域,并按等距離原則細(xì)分最大有效區(qū)域,記為Pi;

第三步,利用最小二乘法計(jì)算相機(jī)圖像到投影儀幀緩存圖像的映射關(guān)系,記為M。并求出映射矩陣M的逆矩陣M-1,再利用投影儀的有效顯示區(qū)域預(yù)校正緩存區(qū)的圖像。

為了真正地實(shí)現(xiàn)畫面的完整性,還有一個(gè)必須解決的問(wèn)題就是顏色校正問(wèn)題。顏色校正主要用來(lái)解決不同投影儀表現(xiàn)在顏色上的差異而導(dǎo)致畫面整體上的顏色不一致問(wèn)題。所以要采用有效的方法盡可能地消除或縮小這種顏色差異,給人更好的視覺(jué)效果,具體算法本文不做詳細(xì)介紹。

二、多投影面沉浸式虛擬環(huán)境的特點(diǎn)及應(yīng)用實(shí)例

1.多投影面沉浸式虛擬環(huán)境的特點(diǎn)

①逼真性

在多投影面沉浸式虛擬環(huán)境中,逼真性主要表現(xiàn)在環(huán)境的真實(shí)性、視野范圍的無(wú)限擴(kuò)充和對(duì)象動(dòng)作的流暢展示。通過(guò)增加投影儀的數(shù)量,使用超大的物理尺寸屏幕,可以體現(xiàn)出真實(shí)的圖像質(zhì)量,實(shí)現(xiàn)單個(gè)投影所不能獲得的視覺(jué)效果,給用戶帶來(lái)身臨其境的感覺(jué)。

②沉浸感

理想的虛擬環(huán)境是使用戶達(dá)到難以分辨真假的程度。在多投影面沉浸式虛擬環(huán)境中,沉浸感主要是用戶對(duì)由計(jì)算機(jī)創(chuàng)造和顯示出來(lái)的虛擬環(huán)境的感知和認(rèn)識(shí)。當(dāng)用戶置身在多投影面沉浸式虛擬環(huán)境中時(shí),其感覺(jué)系統(tǒng)在處理來(lái)自虛擬環(huán)境中的視覺(jué)和其他感知數(shù)據(jù)時(shí)的方式如同在真實(shí)環(huán)境下一樣。

③交互性

在多投影面沉浸式虛擬環(huán)境中,用戶可以與計(jì)算機(jī)生成的虛擬環(huán)境進(jìn)行自然交互,能夠用人類自然的感知能力與虛擬環(huán)境中的對(duì)象進(jìn)行實(shí)時(shí)交互,讓我們很容易地進(jìn)入角色,大大增強(qiáng)了參與其中的趣味性。

2.應(yīng)用實(shí)例

根據(jù)多投影面沉浸式虛擬環(huán)境的特點(diǎn)以及其他領(lǐng)域的廣泛應(yīng)用,在教學(xué)系統(tǒng)中的應(yīng)用可以分為兩大類別的學(xué)科:①結(jié)構(gòu)演示和位置信息展示等學(xué)科的學(xué)習(xí)。包括工程中的結(jié)構(gòu)圖、地理學(xué)習(xí)中的信息圖示、模型演示等。如化學(xué)學(xué)習(xí)過(guò)程中,通過(guò)多投影面沉浸式虛擬環(huán)境真實(shí)地展示出物質(zhì)分子結(jié)構(gòu)模型。②動(dòng)作演示類的科目。主要包括具體的操作以及與操作相關(guān)的位置信息等。其在醫(yī)療手術(shù)、化學(xué)實(shí)驗(yàn)的具體操作當(dāng)中有很好的應(yīng)用價(jià)值。

三、多投影面沉浸式虛擬環(huán)境對(duì)教學(xué)的促進(jìn)作用

1.創(chuàng)建逼真的實(shí)習(xí)場(chǎng),為情境學(xué)習(xí)提供更真實(shí)的學(xué)習(xí)環(huán)境

根據(jù)情境學(xué)習(xí)理論的觀點(diǎn),實(shí)踐不是獨(dú)立于學(xué)習(xí)的,意義也不是與實(shí)踐和情境脈絡(luò)相分離的,真正的意義是在實(shí)踐和情境脈絡(luò)中加以協(xié)商的。[4]情境學(xué)習(xí)的關(guān)鍵是創(chuàng)設(shè)學(xué)習(xí)環(huán)境,在教學(xué)場(chǎng)所與空間內(nèi)必須有真實(shí)的情境作為學(xué)習(xí)活動(dòng)的目標(biāo),即實(shí)習(xí)場(chǎng)的創(chuàng)建。然而學(xué)校的學(xué)習(xí)環(huán)境與現(xiàn)實(shí)生活中的環(huán)境是完全不一樣的。如何創(chuàng)建這樣的實(shí)習(xí)場(chǎng)就成為我們要考慮的問(wèn)題。傳統(tǒng)的拋錨式教學(xué)是通過(guò)真實(shí)化的錄像境脈來(lái)呈現(xiàn)與解決問(wèn)題相關(guān)的信息。然而,這樣只能使學(xué)習(xí)者被動(dòng)地觀看,不能導(dǎo)致學(xué)習(xí)的發(fā)生。多投影面沉浸式虛擬環(huán)境通過(guò)無(wú)限擴(kuò)充學(xué)習(xí)者的視角視野,為學(xué)習(xí)者營(yíng)造出身臨其境的感覺(jué),將整個(gè)學(xué)習(xí)活動(dòng)都拋錨在真實(shí)的情境之中。它構(gòu)建出的實(shí)習(xí)場(chǎng),不僅高度接近真實(shí)情境,將抽象化的知識(shí)具體化為可視化信息,而且其學(xué)習(xí)過(guò)程也與現(xiàn)實(shí)生活中的問(wèn)題解決過(guò)程類似。學(xué)習(xí)者可以直接參與到“真實(shí)”的情境中,從而接觸許多平時(shí)不易接觸的場(chǎng)景。學(xué)生受到多感官?gòu)?qiáng)烈的刺激,增加了學(xué)習(xí)者體驗(yàn)的真實(shí)性,改變了學(xué)習(xí)者僅僅面對(duì)靜態(tài)文字的傳統(tǒng)學(xué)習(xí)方式。

2.沉浸式的學(xué)習(xí)體驗(yàn),提高了學(xué)習(xí)者的參與性

人類學(xué)學(xué)家Lave在他的代表著作 《情境學(xué)習(xí):合法的邊緣性參與》中指出:學(xué)習(xí)應(yīng)該從參與實(shí)際活動(dòng)的過(guò)程中學(xué)習(xí)知識(shí)。[5]也就是學(xué)習(xí)者不是被動(dòng)的觀察者,而是主動(dòng)參與其中的過(guò)程,那么如何使學(xué)習(xí)者主動(dòng)參與其中而不偏離主題,這也是我們需要考慮的問(wèn)題。另外,還有一些學(xué)者擔(dān)心學(xué)習(xí)者參與到真實(shí)情境中可能會(huì)帶來(lái)一些危險(xiǎn)。多投影面沉浸式虛擬環(huán)境具有高仿真、寬屏幕、大視角、宏大震撼的效果,不再是傳統(tǒng)的書本教育和普通的多媒體教學(xué),能極大地提高學(xué)習(xí)者的學(xué)習(xí)熱情和參與度,將學(xué)習(xí)者完全吸引并投入到當(dāng)前情境中去,而忘卻了計(jì)算機(jī)設(shè)備的存在,過(guò)濾掉很多不相關(guān)的知覺(jué),使注意力完全集中到學(xué)習(xí)任務(wù)中去。為學(xué)習(xí)者提供了豐富的情感虛擬體驗(yàn),使整個(gè)學(xué)習(xí)過(guò)程充滿樂(lè)趣,親身體驗(yàn)更加強(qiáng)化了學(xué)習(xí)者的記憶和知識(shí)的建構(gòu)。

3.交互式學(xué)習(xí)環(huán)境,豐富了情境學(xué)習(xí)的趣味性

特洛伊?威廉姆斯(Troy Williams)在回顧了教育信息化發(fā)展的歷程之后,提出為了給予學(xué)生力量,讓我們把交互式學(xué)習(xí)技術(shù)帶進(jìn)教室吧。[6]其中就講到了如何實(shí)現(xiàn)課堂教學(xué)中的交互活動(dòng)最大化。多投影面沉浸式虛擬環(huán)境應(yīng)用于教學(xué)的過(guò)程中,為學(xué)習(xí)者提供了更加直接的交互環(huán)境,學(xué)習(xí)者在與虛擬信息的交互中獲得知識(shí)和經(jīng)驗(yàn),超越了傳統(tǒng)的以知識(shí)接受為主的間接獲取學(xué)習(xí)經(jīng)驗(yàn)的方式,有助于培養(yǎng)學(xué)習(xí)者的動(dòng)手實(shí)踐能力和自主探索問(wèn)題的能力。學(xué)習(xí)者通過(guò)與系統(tǒng)進(jìn)行交互,置身于“超越現(xiàn)實(shí)、身臨其境”的學(xué)習(xí)環(huán)境中。同時(shí),多投影面沉浸式虛擬環(huán)境還是一個(gè)支持合作的協(xié)同環(huán)境,合作學(xué)習(xí)也是情境學(xué)習(xí)的重要方面,學(xué)習(xí)者可以以小組的形式參與到真實(shí)境脈中來(lái),大大地改善了傳統(tǒng)的課堂學(xué)習(xí)氛圍,提高了學(xué)習(xí)者的學(xué)習(xí)積極性。在多投影面沉浸式虛擬環(huán)境中,學(xué)習(xí)者之間、學(xué)習(xí)者與教師之間進(jìn)行協(xié)作,提出問(wèn)題、討論結(jié)果、分享發(fā)現(xiàn)、探索未知的領(lǐng)域。

四、總結(jié)

本文探討了多投影面沉浸式虛擬環(huán)境對(duì)教學(xué)的重要作用,它所創(chuàng)造的逼真情境使學(xué)習(xí)者可以在課堂的實(shí)習(xí)場(chǎng)中體驗(yàn)到現(xiàn)實(shí)生活的經(jīng)驗(yàn),并且支持交互操作、學(xué)習(xí)的交流合作等,學(xué)習(xí)者沉浸在虛擬環(huán)境中,實(shí)現(xiàn)知識(shí)的建構(gòu)和遷移,并還原到實(shí)際生活中去。多投影面沉浸式虛擬環(huán)境由于其高度沉浸感和交互性,在遙感技術(shù)、展覽、工業(yè)設(shè)計(jì)、計(jì)算機(jī)可視化中具有非常好的應(yīng)用前景。隨著虛擬現(xiàn)實(shí)技術(shù)的發(fā)展以及在教學(xué)中的應(yīng)用,多投影面沉浸式虛擬環(huán)境的教育意義也備受關(guān)注,其在教育領(lǐng)域仍有很大的發(fā)展空間,有待于我們積極開(kāi)發(fā)和應(yīng)用。

參考文獻(xiàn):

[1]林柏偉.PC架構(gòu)的多投影面沉浸式虛擬環(huán)境及其應(yīng)用[D].杭州:浙江大學(xué),2003.

[2]黃淼,周志光,陶煜波,林海.基于數(shù)碼相機(jī)參數(shù)還原的多屏拼接幾何校正技術(shù)[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2010(10).

[3]馬頌德,張正友.計(jì)算機(jī)視覺(jué)[M].北京:科學(xué)出版社,1998.

[4]俞貞.情境學(xué)習(xí)和學(xué)校環(huán)境中實(shí)習(xí)場(chǎng)的建構(gòu)[J].全球教育展望,2006(5):35.

[5]王文靜.人類學(xué)視野中的情境學(xué)習(xí)[J].外國(guó)中小學(xué)教育,2004(4).

篇10

關(guān)鍵詞:顯著區(qū)域檢測(cè); 視覺(jué)顯著性檢測(cè); 評(píng)測(cè)

中圖分類號(hào):TP301 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-2163(2014)01-0038-03

0引言

人類可以快速準(zhǔn)確地識(shí)別視覺(jué)場(chǎng)中的顯著區(qū)域。在機(jī)器上模擬人類的這種能力對(duì)于使機(jī)器能夠像人類一樣處理視覺(jué)內(nèi)容是至關(guān)重要的。在過(guò)去的幾十年內(nèi),已有大量的顯著性檢測(cè)方法進(jìn)入了公開(kāi)發(fā)表。這些方法中的大部分[1-4]都趨向于預(yù)測(cè)人眼視覺(jué)注視點(diǎn)。然而這些人眼視覺(jué)注視點(diǎn)只是一些空間中的離散點(diǎn),并不能準(zhǔn)確地標(biāo)識(shí)整個(gè)顯著區(qū)域[5-6]。

近些年來(lái),一些科研單位和研究人員已經(jīng)開(kāi)始密切關(guān)注于顯著區(qū)域檢測(cè)方法的構(gòu)建工作,如洛桑聯(lián)邦理工學(xué)院的Sabine Süsstrunk研究員,以色列理工學(xué)院的Ayellet Tal教授,微軟亞洲研究院的研究人員,清華大學(xué)的胡世民教授等。顯著區(qū)域檢測(cè)方法對(duì)以下領(lǐng)域發(fā)揮著重大的助益作用:圖像分割[7]、物體檢測(cè)[8]、內(nèi)容保持的圖像縮放[9]等。本文將對(duì)顯著區(qū)域檢測(cè)算法的研究現(xiàn)狀進(jìn)行介紹,同時(shí)對(duì)典型的顯著區(qū)域檢測(cè)算法進(jìn)行分析。

文章內(nèi)容組織結(jié)構(gòu)為:第2節(jié)對(duì)現(xiàn)有的顯著區(qū)域檢測(cè)算法進(jìn)行了分類和分析;第3節(jié)對(duì)典型的顯著區(qū)域檢測(cè)算法進(jìn)行了評(píng)測(cè);最后在第4節(jié)給出了總結(jié),并展望了下一步的研究工作。

1顯著區(qū)域檢測(cè)算法分類及分析

感知方面的研究成果表明[10]:在低層視覺(jué)顯著性中,對(duì)比度是最重要的影響因素。現(xiàn)有的顯著區(qū)域檢測(cè)算法通過(guò)計(jì)算每個(gè)圖像子區(qū)域同其一定范圍內(nèi)的相鄰區(qū)域的對(duì)比度來(lái)度量該圖像子區(qū)域的顯著性。而依據(jù)用于計(jì)算對(duì)比度的相鄰區(qū)域空間范圍的不同,現(xiàn)有的顯著區(qū)域檢測(cè)算法可分為兩類:基于局部對(duì)比的算法[6,11-12]和基于全局對(duì)比的算法[13-18]。下面分別對(duì)其探討如下。

1.1基于局部對(duì)比的顯著區(qū)域檢測(cè)算法

基于局部對(duì)比的顯著區(qū)域檢測(cè)算法通過(guò)計(jì)算每個(gè)圖像子區(qū)域或像素同其周圍一個(gè)小的局部領(lǐng)域的對(duì)比度來(lái)度量該圖像子區(qū)域或像素的顯著性。Ma等人[11]提出了一種基于局部對(duì)比和模糊生長(zhǎng)的顯著區(qū)域檢測(cè)算法。該方法首先對(duì)輸入圖像進(jìn)行均值濾波和降采樣。然后,該方法對(duì)新產(chǎn)生的低分辨率圖像中的每個(gè)像素計(jì)算其與周圍N個(gè)像素的LUV顏色向量的歐幾里得距離之和, 并將此值作為該像素的顯著值。為了從產(chǎn)生的顯著圖中提取顯著區(qū)域,Ma等人[11]運(yùn)用模糊生長(zhǎng)(fuzzy growing)的方法提取顯著區(qū)域。Liu等人[6]為了更加準(zhǔn)確地檢測(cè)顯著區(qū)域,提出了一系列新的局部區(qū)域和全局特征用于計(jì)算顯著性。這些特征包括:多尺度對(duì)比,中心-周圍直方圖和顏色空間分布。該方法通過(guò)學(xué)習(xí)一個(gè)條件隨機(jī)場(chǎng)來(lái)高效地結(jié)合上述這些特征用于檢測(cè)顯著區(qū)域。由上可知,因?yàn)橹皇峭ㄟ^(guò)局部對(duì)比來(lái)檢測(cè)顯著區(qū)域,所以基于局部對(duì)比的方法趨向于關(guān)注邊緣周圍的區(qū)域,而不會(huì)突出整個(gè)顯著區(qū)域(在生成的顯著圖中即表現(xiàn)為邊緣周圍的區(qū)域具有高的顯著值,而顯著區(qū)域內(nèi)部的顯著值則較低)。這個(gè)問(wèn)題可以稱其為“不一致突出顯著區(qū)域”問(wèn)題。

1.2基于全局對(duì)比的顯著區(qū)域檢測(cè)算法

基于全局對(duì)比的顯著區(qū)域檢測(cè)算法將整幅圖像作為對(duì)比區(qū)域來(lái)計(jì)算每個(gè)圖像子區(qū)域或像素的顯著值。Achanta 等人[13]從頻率域角度出發(fā),首次提出了一種基于全局對(duì)比的顯著區(qū)域檢測(cè)的方法。該方法將經(jīng)過(guò)高斯低通濾波圖像中的每個(gè)像素值和整幅圖像的平均像素值之間的歐幾里得距離作為該點(diǎn)的顯著值。該方法非常簡(jiǎn)單,時(shí)間消耗非常低,且實(shí)驗(yàn)結(jié)果在查準(zhǔn)率-差全率方面的效果也堪稱優(yōu)良。該方法使得顯著區(qū)域檢測(cè)向?qū)嵱没姆较蚋斑M(jìn)了一步。然而Achanta 等人提出的方法[13]在以下兩種情況下會(huì)失效:

(1)顯著區(qū)域的顏色占圖像中的大部分,通過(guò)方法[11]計(jì)算后,背景會(huì)具有更高的顯著值;

(2)背景中含有少量突出的顏色,這樣背景中的這部分顏色的顯著值也會(huì)非常高。第1期景慧昀,等:顯著區(qū)域檢測(cè)算法綜述智能計(jì)算機(jī)與應(yīng)用第4卷

針對(duì)以上缺陷,作者又在文章[18]中將此方法完成了進(jìn)一步的改進(jìn)。作者發(fā)現(xiàn)檢測(cè)顯著區(qū)域邊緣和檢測(cè)顯著區(qū)域中心所需要的圖像頻段是不同的,由此而依據(jù)像素點(diǎn)越在圖像中心越可能接近區(qū)域中心這樣一個(gè)假設(shè),來(lái)調(diào)整均值濾波的帶寬,使得位于顯著區(qū)域不同位置的像素點(diǎn)則有不同的均值濾波帶寬。而且,即將經(jīng)過(guò)濾波后的圖像中每個(gè)像素值和該像素所在的對(duì)稱子窗口內(nèi)的像素平均值的歐幾里得空間距離作為該點(diǎn)的顯著值。經(jīng)過(guò)這樣的調(diào)整,算法的時(shí)間復(fù)雜度有所提高,但是實(shí)驗(yàn)結(jié)果性能卻有較大提升。

Cheng等人在文章[15]中提出了兩種簡(jiǎn)單快速且更為準(zhǔn)確的顯著區(qū)域檢測(cè)方法。第一種方法只采用顏色的全局對(duì)比,作者將每個(gè)像素點(diǎn)和圖像中其它所有像素的Lab顏色向量的歐幾里得距離之和的1 / N(N為該圖的像素點(diǎn)個(gè)數(shù))作為該點(diǎn)的顯著值。為了更快速地開(kāi)展計(jì)算,作者對(duì)圖像中的顏色進(jìn)行了量化,以顏色為單位計(jì)算每種顏色和圖像中其它所有顏色的歐幾里得距離。第一種方法中只考慮了顏色的全局對(duì)比,并未考慮空間位置關(guān)系,使得和顯著區(qū)域顏色接近的背景區(qū)域的顯著值也較高。作者在加入空間位置關(guān)系后又一次提出了方法二:首先對(duì)圖像進(jìn)行分割,獲得一定數(shù)量的子區(qū)域?;谧訁^(qū)域,將子區(qū)域之間的空間位置關(guān)系作為權(quán)值計(jì)算該子區(qū)域與圖像其它所有子區(qū)域之間的相似度之和。方法2比方法1的時(shí)間復(fù)雜度略高(主要是由于引入了圖像分割操作,該操作比較耗時(shí)),但是實(shí)驗(yàn)結(jié)果得到了較大提高。通過(guò)仿真驗(yàn)證,Cheng等人[15]提出的方法簡(jiǎn)單高效。

He等人[17]在Cheng的研究基礎(chǔ)上,提出了結(jié)合全局對(duì)比和顏色空間分布的顯著區(qū)域檢測(cè)方法。作者指出顏色的空間分布越緊湊,該類顏色就應(yīng)具有更高的顯著性,反之亦然。該方法將每類顏色所屬像素空間位置的方差作為衡量顏色空間分布的指標(biāo),生成顏色空間顯著圖。其后將顏色空間顯著圖和直方圖對(duì)比度顯著圖或區(qū)域?qū)Ρ榷蕊@著圖進(jìn)行疊加得到最終的顯著圖。Perazzi等人[16]也提出了一個(gè)基于對(duì)比度和空間分布的顯著區(qū)域檢測(cè)方法。

上述這些基于全局對(duì)比的顯著區(qū)域檢測(cè)方法可以在一定程度上消減“不一致突出顯著區(qū)域”問(wèn)題。但是當(dāng)顯著區(qū)域非常大或者圖像背景非常復(fù)雜時(shí),這些基于全局對(duì)比的方法就趨向于突出背景區(qū)域而不是顯著區(qū)域了。因而該問(wèn)題可以稱之為“突出圖像背景”問(wèn)題。

2顯著區(qū)域檢測(cè)算法測(cè)試

本節(jié)使用Achanta等人[13]提出的公開(kāi)可用的測(cè)試圖像庫(kù)來(lái)評(píng)價(jià)現(xiàn)有典型的顯著區(qū)域檢測(cè)算法的性能。該測(cè)試圖像庫(kù)包含了1 000幅自然圖像以及與其相對(duì)應(yīng)標(biāo)識(shí)顯著區(qū)域的二值基準(zhǔn)圖像,并將查準(zhǔn)率-查全率曲線作為衡量顯著區(qū)域檢測(cè)算法性能的評(píng)價(jià)指標(biāo)。

圖1顯示了近期6個(gè)性能最先進(jìn)的顯著區(qū)域檢測(cè)方法(MZ[11]、 LC[14]、 FT[13]、 HC[15]、 RC[15]、 SF[16])在Achanta數(shù)據(jù)集上的評(píng)測(cè)結(jié)果。這些方法中,對(duì)于FT、HC、RC和SF,本節(jié)使用作者的原始的實(shí)現(xiàn)程序來(lái)生成對(duì)應(yīng)的顯著圖。而對(duì)于MZ和LC方法,本節(jié)直接使用Ma等人[11]和Cheng等人[15]所提供的顯著圖。由圖1可以看出SF在Achanta等人[13]提供的測(cè)試集上取得了最好的檢測(cè)性能。

3結(jié)論與展望

本文對(duì)現(xiàn)有的顯著區(qū)域檢測(cè)方法進(jìn)行概述?,F(xiàn)有的顯著區(qū)域檢測(cè)方法是利用局部鄰域或者整幅圖像作為對(duì)比區(qū)域來(lái)計(jì)算顯著性的。從本質(zhì)上而言,現(xiàn)有方法使用的并不恰當(dāng)?shù)膶?duì)比區(qū)域?qū)е铝似湎鄳?yīng)具有的“不一致突出顯著區(qū)域”和“突出圖像背景”兩個(gè)問(wèn)題。在進(jìn)行對(duì)比度計(jì)算之前,首先實(shí)現(xiàn)對(duì)比區(qū)域預(yù)估計(jì)的顯著區(qū)域檢測(cè)方法將成為下一步的發(fā)展趨勢(shì)。

參考文獻(xiàn):

[1]ITTI L, KOCH C, NIEBUR E. A model of saliency-based visual attention for rapid scene analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(11):1254–1259.

[2]MURRAY N, VANRELL M, OTAZU X, et al. Saliency estimation using a non-parametric low-level vision model[C] // IEEE Conference on Computer Vision and Pattern Recognition. 2011:433–440.

[3]HOU X, ZHANG L. Saliency detection: A spectral residual approach[C] // IEEE Conference on Computer Vision and Pattern Recognition. 2007:1–8.

[4]BAN S, JANG Y, LEE M. A?ective saliency map considering psychological distance[J]. Neurocomputing, 2011, 74(11):1916–1925.

[5]LIU T, SUN J, ZHENG N, et al. Learning to detect a salient object[C] // IEEE Conference on Computer Vision and Pattern Recognition. 2007:1–8.

[6]LIU T, YUAN Z, SUN J, et al. Learning to detect a salient object[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 33 (2) (2011) 353–367. , 2011, 33(2):353–367.

[7]KO B C, NAM J Y. Object-of-interest image segmentation based on human attention and semantic region clustering[J]. Journal of Optical Society of America A, 2006, 23(10):2462–2470.

[8]RUTISHAUSER U, WALTHER D, KOCH C, et al. Is bottom-up attention useful for object recognition?[C] // IEEE Conference on Computer Vision and Pattern Recognition, 2004:30–37.

[9]ZHANG G X, CHENG M M, HU S M, et al. A shape-preserving approach to image resizing[C] // Computer Graphics Forum, 2009:1897–1906.

[10]EINHAS?ER W, KO^ENIG P. Does luminance-contrast contribute to a saliency map for overt visual attention?[J]. European Journal of Neuroscience, 2003, 17 (5):1089–1097.

[11]Y. Ma, H. Zhang, Contrast-based image attention analysis by using fuzzy growing[C] // ACM International Conference on Multimedia, 2003:374–381.

[12]KLEIN D, FRINTROP S. Center-surround divergence of feature statistics for salient object detection[C] // IEEE International Conference on Computer Vision, 2011:2214–2219.

[13]ACHANTA R, HEMAMI S, ESTRADA F, et al. Frequency-tuned salient region detection[C] // IEEE Conference on Computer Vision and Pattern Recognition, 2009:1597–1604.

[14]ZHAI Y, SHAH M. Visual attention detection in video sequences using spatiotemporal cues[C] // ACM International Conference on Multimedia, 2006:815–824.

[15]CHENG M, ZHANG G, MITRA N, et al. Global contrast based salient region detection[C] // IEEE Conference on Computer Vision and Pattern Recognition, 2011:409–416.

[16]PERAZZI F, KRAHENBUHL P, PRITCH Y, et al. Saliency ?lters: Contrast based ?ltering for salient region detection [C] // IEEE Conference on Computer Vision and Pattern Recognition, 2012:733–740.