卷積神經(jīng)網(wǎng)絡(luò)的特性范文

時間:2024-04-02 11:39:16

導(dǎo)語:如何才能寫好一篇卷積神經(jīng)網(wǎng)絡(luò)的特性,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

篇1

【關(guān)鍵詞】深度學(xué)習(xí) 卷積神經(jīng)網(wǎng)絡(luò) 權(quán)值共享 下采樣 R-CNN Fast-R-CNN

1 緒論

隨著電子信息技術(shù)的快速發(fā)展,芯片的設(shè)計與生產(chǎn)進入了納米時代,計算機的計算能力與計算速度得到了空前的提高,但是人們的需求是無限的,要求計算機能更加任性化的服務(wù)于我們的生活,這也就要求計算機本身能像人一樣識別與感知周圍的環(huán)境,并對復(fù)雜的環(huán)境做出正確的判斷。而圖片信息是我們周圍環(huán)境最直觀的,最容易獲取的信息,要求計算機能對為的環(huán)境做出識別與判斷也就要求計算機能夠智能的識別圖像信息。深度學(xué)習(xí)是機器學(xué)習(xí)中的一個新的研究領(lǐng)域。通過深度學(xué)習(xí)的方法構(gòu)建深度網(wǎng)絡(luò)來抽取目標特征進而識別周圍的環(huán)境。卷積神經(jīng)網(wǎng)絡(luò)對圖像的處理具有平移,旋轉(zhuǎn),扭曲不變的優(yōu)良特性。在處理圖像是更加快捷和便利。卷積神經(jīng)網(wǎng)絡(luò)使得計算機在感知識別周圍環(huán)境的能力有了巨大的提升,使得計算機更加智能。卷積神經(jīng)網(wǎng)絡(luò)擁有強大的特征提取能力,使得其在圖像分類識別,目標跟蹤等領(lǐng)域有著強大的運用。

1.1 國內(nèi)外研究現(xiàn)狀

1986年,Rumelhart和Mc Celland提出BP算法。BP算法反向傳導(dǎo)神經(jīng)網(wǎng)絡(luò)輸出誤差進行訓(xùn)練神經(jīng)網(wǎng)絡(luò)。通過BP算法,神經(jīng)網(wǎng)絡(luò)能夠從大量訓(xùn)練數(shù)據(jù)中的學(xué)習(xí)到相關(guān)統(tǒng)計信息,學(xué)習(xí)到的數(shù)據(jù)統(tǒng)計信息能夠反映關(guān)于輸入-輸出數(shù)據(jù)模型的函數(shù)映射關(guān)系。

自2006年以來,Geoffery Hinton教授提出深度信念網(wǎng)絡(luò)。從此深度學(xué)習(xí)在學(xué)術(shù)界持續(xù)升溫。深度學(xué)習(xí)不僅改變著傳統(tǒng)的機器學(xué)習(xí)方法,也影響著我們對人類感知的理解,迄今已在語音識別和圖像理解等應(yīng)用領(lǐng)域引起了突破性的變革。各種相關(guān)的算法和模型都取得了重要的突破,使得深度學(xué)習(xí)在圖像分類,語音識別,自然語言處理等領(lǐng)域有廣泛的運用。

2013年百度成立百度深度學(xué)習(xí)研究院以來我國的人工智能領(lǐng)域取得了長足的進步。在人工智能專家吳恩達的帶領(lǐng)下,百度陸續(xù)推出一系列人工智能產(chǎn)品,無人駕駛技術(shù),DuerOS語音交互計算平臺,人臉識別技術(shù),美樂醫(yī)等優(yōu)秀產(chǎn)品。此外Imagenet圖像識別大賽中也誕生了一系列經(jīng)典的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),VGG,F(xiàn)ast-R-CNN,SPP-net等等,可以說人工智能技術(shù)在近幾年得到了空前的發(fā)展。

2 深度學(xué)習(xí)概述

深度學(xué)習(xí)是機器學(xué)習(xí)的一個新方向,通過學(xué)習(xí)樣本數(shù)據(jù)內(nèi)在規(guī)律和深層特征深度,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)能夠像人一樣有分析和學(xué)的能力,尤其在文字處理,圖像識別,語音等領(lǐng)域更加突出。能夠自主學(xué)習(xí)一些新的東西。目前深度學(xué)習(xí)使用的典型技術(shù)是通過特征表達和分類器來進行目標識別等任務(wù)的。并在語音識別、圖像處理、機器翻譯等領(lǐng)域取得很多成果。

深度學(xué)習(xí)不同于以往的淺層學(xué)習(xí),淺層學(xué)習(xí)模型值包含一個隱藏層,或者不存在隱藏層,深度學(xué)習(xí)則是由很多隱藏層組成的,上一層的輸出作為下一層的輸入,實驗對輸入信息進行分級表達。目前深度學(xué)習(xí)框架主要包含三種深度學(xué)習(xí)框架,如圖1、2、3所示。

3 卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)層次比傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)復(fù)雜,卷積神經(jīng)網(wǎng)絡(luò)包含大量的隱藏層,相鄰的卷積核或者下采樣核采用局部感受野全鏈接,神經(jīng)元權(quán)值共享的規(guī)則,因此卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)的數(shù)量遠比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)少,卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練和前向測試的復(fù)雜度大幅度降低,同時也減少了神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)過擬合的幾率。卷積神經(jīng)網(wǎng)絡(luò)主要有兩部分,分別是卷積核和下采樣核。卷積核主要對上一層的圖像進行卷積運算,提取圖像特征,下采樣核則是對上層的數(shù)據(jù)進行將為處理,減少神經(jīng)網(wǎng)絡(luò)的復(fù)雜度。

卷積神經(jīng)網(wǎng)絡(luò)中每一個神經(jīng)元的輸入與前一層的局部感受野相連,提取局部感受野的特征,比如圖像的輪廓,顏色等特征,而這些特征不僅包括傳統(tǒng)人類能理解的特征,也包括神經(jīng)網(wǎng)絡(luò)自身能夠識別的特征,卷積核全職共享,因此這些特征提取與圖像的位置無關(guān)。

圖4是經(jīng)典的LeNet5卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),LeNet5架構(gòu)中卷積核和下采樣核交替出現(xiàn),下采樣核及時的將卷積核生成的特征向量進行降維,減少神經(jīng)網(wǎng)絡(luò)的運算量。LeNet5算法在1962年幼Hubel等人提出,在識別手寫數(shù)字mnist中有極高的準確率。

4 R-CNN、Fast-R-CNN對比分析

卷積神經(jīng)網(wǎng)絡(luò)在對圖像進行識別具有平移,旋轉(zhuǎn),扭曲不變的優(yōu)良特性,并且能夠?qū)崿F(xiàn)高準確率識別圖像,但是在現(xiàn)實生活運用中往往需要神經(jīng)網(wǎng)絡(luò)標記出目標的相對位置,這是傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)不具備的功能。因此在前人傳統(tǒng)卷積神經(jīng)網(wǎng)路基礎(chǔ)上對卷積神經(jīng)網(wǎng)絡(luò)進行改進,產(chǎn)生了具有對圖像中目標進行識別和定位的卷積神經(jīng)網(wǎng)絡(luò)R-CNN,F(xiàn)ast-R-CNN等改良算法。

4.1 R-CNN

R-CNN為Region Convoluntional Neural Network的縮寫即對圖像進行局部區(qū)域的卷積處理,其核心思想主要是利用候選區(qū)圖像對物體探測中位置信息進行精確處理和利用監(jiān)督式預(yù)訓(xùn)練和區(qū)域特殊化的微調(diào)方法,代替了傳統(tǒng)的非監(jiān)督式預(yù)訓(xùn)練和監(jiān)督式微調(diào)。

在CNN中,全連接層輸入是固定大小的,因此R-CNN用計算機視覺算法將每一張圖片分割成1000-2000張的候選區(qū)圖片后,要將這些候選區(qū)圖片進行變換,生成固定大小的候選圖片,在訓(xùn)練提取特征時一般采用經(jīng)過預(yù)訓(xùn)練的模型參數(shù)進行finetuning,榱嗽黽友盜費本,模型在也將生成的候選框以及標定的標簽作為訓(xùn)練樣本進行訓(xùn)練。R-CNN采用SVMs分類器對特征向量進行分類,在訓(xùn)練SVMs時將候選框經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)提取的特征和SVM標定結(jié)果輸入到SVMs分類器訓(xùn)練分類器模型。而在測試時將圖像全部候選框經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)提取的特征輸入到SVMs分類器中,得到每一類的評分結(jié)果。但是R-CNN在處理一張圖片是要處理需要對一張圖片1000-2000個候選區(qū)圖像進行前向運算,保存所有后選取圖片的特征值,要求計算硬件有大量的存儲空間,同時處理每一張圖片的時間也會增加。由于訓(xùn)練集龐大,本文采用hard negative mining method方法提高存儲的利用率。

R-CNN的體現(xiàn)出了極大的優(yōu)勢,其中MAP也可以大幅度提高,但是正如本文上述,R-CNN計算的時間成本很大,達不到實時的計算效果,R-CNN在對候選區(qū)進行處理時會使得圖像失真,部分信息丟失。

4.2 Fast-R-CNN

Fast-R-CNN則是再次改進的一種基于卷積神經(jīng)網(wǎng)絡(luò)目標跟蹤定位算法。相比于R-CNN,F(xiàn)ast-R-CNN從單輸入變?yōu)殡p輸入,在全連接層后有了兩個輸出,引入了Rol層。

Fast-R-CNN在運行的時候同樣會生成大量的候選區(qū),同時將原始的圖片用卷積神經(jīng)網(wǎng)絡(luò)進行特征提取,將原始圖片提取的特征與生成的候選區(qū)坐標送入Rol層為每一個候選區(qū)生成一個固定大小的特征向量。最后將Rol生成的特征向量全連接層產(chǎn)生最終的LOSS。Fast-R-CNN中的LOSS采用多LOSS模式,SoftMax LOSS用于計算K+1分類的損失,K為第K個目標,1為背景;Regression LOSS計算候選區(qū)的四個角的坐標。

Fast-R-CNN在MAP上有了大幅度的提升,速度也得到了提升,但是在計算候選區(qū)是仍存在瓶頸,這也是限制Fast-R-CNN速度的因素。

5 實驗測試

對于本文提出的卷積神經(jīng)網(wǎng)絡(luò)識別圖像定位圖像目標算法R-CNN,F(xiàn)ast-R-CNN,在本章給出實驗結(jié)果。實驗平臺為基于Linux系統(tǒng)的debian8下運行caffe進行訓(xùn)練,采用顯卡K620進行實驗。

訓(xùn)練模型初始化參數(shù)在是服從高斯隨機分布,R-CNN采用的網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示,F(xiàn)ast-R-CNN的網(wǎng)絡(luò)結(jié)構(gòu)如圖8所示。

本次實現(xiàn)的訓(xùn)練樣本為錄制實驗室視頻數(shù)據(jù),將視頻數(shù)據(jù)轉(zhuǎn)換成幀圖片,對每張圖片數(shù)據(jù)進行裁剪,裁剪后圖像大小在256*256,共有500張,再將裁剪后的圖片進行旋轉(zhuǎn),平移,扭曲,鏡像,加噪聲等處理,最后生成144萬張樣本圖片,其中136.8萬張圖片作為訓(xùn)練樣本,7.2萬張作為測試樣本。

6 總結(jié)

在目標識別定位領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)具有強大的圖像處理能力,對圖像的識別定位具有很高度平移,旋轉(zhuǎn),扭曲不變形的優(yōu)良性能。卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)R-CNN和Fast-R-CNN都有強大的圖像處理能力。Fast-R-CNN在識別準確率上比R-CNN高。R-CNN算法復(fù)雜,對一張圖片需要進行1000-2000次的卷積運算,特征重復(fù)提取。因此在訓(xùn)練和前向測試時,R-CNN用的時間長,不能很好的適用于處理實時圖片數(shù)據(jù),尤其視頻數(shù)據(jù)。R-CNN在對每個候選區(qū)進行特征提取之后需要將提取的特征向量存入內(nèi)存,降低訓(xùn)練測試時間的同時也需要耗費大量內(nèi)存。因此從各方面分析可知,F(xiàn)ast-R-CNN性能優(yōu)于R-CNN。

參考文獻

[1]謝寶劍.基于卷積神經(jīng)網(wǎng)絡(luò)圖像分類方法研究[D].合肥工業(yè)大學(xué),2015.

[2]鄭胤,陳權(quán)崎,章毓晉.深度學(xué)習(xí)及其在目標和行為識別中的新進展[J].中國圖象圖形學(xué)報,2014(02):175-184.

[3]陳先昌.基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與運用研究[D].杭州:浙江工商大學(xué),2006(04):603-617.

[4]李彥冬,郝宗波,雷航等.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計算機應(yīng)用,2016.

[5]Gibson.J J.The perception of the Visual World[J].Cambridge,England,1950.

[6]HORN B,SCHUNCK P.Determining optical flow[J].Artificial Intelligence, 1981,17:185-203.

[7]R.Girshick,J.Donahue,T. Darrell,and J.Malik,“Rich feature hierarchies for accurate object detection and semantic segmentation,”in CVPR,2014

[8]Ross Girshick,Wicrosoft Research. Fast R-CNN,.

[9]R.Girshick.Fast R-CNN. arXiv:1504.08083,2015.

篇2

關(guān)鍵詞:圖像復(fù)原;盲復(fù)原;逆濾波;神經(jīng)網(wǎng)絡(luò)復(fù)原

1 圖像退化及復(fù)原模型

1.1 圖像降質(zhì)的數(shù)學(xué)模型

圖像復(fù)原處理的關(guān)鍵問題在于如何建立退化模型。假定輸入圖像f(x,y)經(jīng)過某個退化系統(tǒng)后輸出的是一幅退化的圖像。為了方便討論, 把噪聲引起的退化(即噪聲)對圖像的影響一般作為加性噪聲考慮,這也與許多實際應(yīng)用情況一致,如圖像數(shù)字化時的量化噪聲、隨機噪聲等就可以作為加性噪聲,即使不是加性噪聲而是乘性噪聲,也可以用對數(shù)方式將其轉(zhuǎn)化為相加形式。原始圖像f(x,y) 經(jīng)過一個退化算子或系統(tǒng)H(x,y) 的作用,然后和噪聲n(x,y)進行疊加,形成退化后的圖像g(x,y)。圖像退化的過程可以用數(shù)學(xué)表達式寫成如下的形式:

g(x,y)=H[f(x,y)]+n(x,y)

n(x,y)是一種統(tǒng)計性質(zhì)的信息下圖表示退化過程的輸入和輸出的關(guān)系,其中H(x,y)包含了退化系統(tǒng)的物理過程,即所要尋找的退化數(shù)學(xué)模型。

1.2 圖像的退化恢復(fù)模型

數(shù)字圖像的圖像恢復(fù)問題可以看作是:根據(jù)退化圖像g(x ,y)和退化算子H(x ,y)的形式,沿著逆向過程去求解原始圖像f(x ,y), 或者說逆向地尋找原始圖像的最佳近似估計。

2 研究背景與意義

圖像復(fù)原是數(shù)字圖像處理技術(shù)的一個重要研究方向,在現(xiàn)實生活中,有著非常廣闊的應(yīng)用前景和市場。數(shù)字圖像處理研究很大部分是服務(wù)于數(shù)字圖像復(fù)原的,而運動模糊圖像的復(fù)原又是圖像復(fù)原中的重要課題之一,從六十年代起就有人研究它。初期研究的主要原因是對衛(wèi)星所拍攝的圖像進行復(fù)原,因為衛(wèi)星相對地球是運動的,所拍出的圖像是模糊的(當然衛(wèi)星所拍攝圖像的模糊原因不僅僅是相對運動而造成的,還有其他原因如大氣湍流所造的模糊等等)。美國的噴氣推進實驗室(JPL)對徘徊者飛行器發(fā)回的月球照片進行了圖像恢復(fù)處理。傳統(tǒng)的圖像恢復(fù)方法可以很好地恢復(fù)出來原始圖像,但是需要事先知道系統(tǒng)的先驗知識(例如系統(tǒng)的點擴散函數(shù))。在先驗知識不足的情況下,如何恢復(fù)出來原始圖像?這就需要模糊圖像盲恢復(fù)技術(shù)。根據(jù)不同的應(yīng)用背景和先驗知識,大致可以兩種方法恢復(fù)兩種類型的模糊圖像,以滿足不同的應(yīng)用要求。

第一種方法:如何快速恢復(fù)模糊圖像,進行適時性圖像處理?這個技術(shù)在實際生活中有著廣泛應(yīng)用。

第二種方法:如何在事先不能確定模糊系統(tǒng)點擴散函數(shù)的情況下,恢復(fù)模糊圖像,改善圖像的質(zhì)量,這就是圖像盲恢復(fù)的問題。

3 國際國內(nèi)研究發(fā)展和現(xiàn)狀

從歷史上來看,數(shù)字圖像處理研究有很大部分是在圖像恢復(fù)方面進行的,包括對算法的研究和針對特定問題的圖像處理程序的編寫。數(shù)字圖像處理中很多值得注意的成就就是在這兩方面取得的。

在六十年代中期,去卷積(逆濾波)開始被廣泛地應(yīng)用于數(shù)字圖像恢復(fù)。這一階段對模糊圖像的研究主要是把因相對運動而拍攝的模糊圖像復(fù)原過來,從而增強人們的判讀能力。早期做圖像復(fù)原研究,主要強調(diào)盡可能使模糊圖像復(fù)原到原貌,增加它的判讀性,在此發(fā)展了很多的復(fù)原方法,諸如:差分復(fù)原、維納濾波等.這些方法各有特點,較好的解決了運動模糊圖像的判讀問題,但是在應(yīng)用上均有一定的限制。

雖然經(jīng)典的圖象復(fù)原方法不少,但歸納起來大致可分為逆濾波法,或稱相關(guān)變換法( inv ersefiltering or t ransfo rm related techniques) 和代數(shù)方法( alg ebraic techniques) 兩種。

3.1 傳統(tǒng)復(fù)原法

3.1.1 逆濾波方法

逆濾波法大致有經(jīng)典逆濾波法、維納濾波法、卡爾曼濾波法等. 其中,在傅立葉變換域,經(jīng)典逆濾波的變換函數(shù)是引起圖象失真的變換函數(shù)的逆變換,其雖在沒有噪聲的情況下,可產(chǎn)生精確的復(fù)原圖象,但在有噪聲時,將對復(fù)原圖象產(chǎn)生嚴重的影響,雖然濾波函數(shù)經(jīng)過修改,有噪聲的圖象也能復(fù)原,但它僅適用于極高信噪比條件下的圖象復(fù)原問題; 維納濾波法是通過選擇變換函數(shù),同時使用圖象和噪聲的統(tǒng)計信息來極小化均方復(fù)原誤差,這雖然在一定程度上克服了逆濾波法的缺點,但是維納濾波法需要較多有關(guān)圖象的先驗知識,如需要對退化圖象進行滿足廣義平穩(wěn)過程的假設(shè),還需要知道非退化圖象的相關(guān)函數(shù)或功率譜特性等等,而在實際應(yīng)用中,要獲得這些先驗知識有較大的困難,為此,Ozkan 等人在研究圖象序列的復(fù)原問題時,提出了一種解決空間和時間相關(guān)性的多幀維納濾波法,是近年來維納濾波法的新發(fā)展; 卡爾曼濾波是一種遞歸濾波方法,其雖可用于非平穩(wěn)圖象的復(fù)原,但是因計算量過大,而限制了其實際應(yīng)用的效果。 Wu 和Kundu 又對卡爾曼濾波方法進行了改進,不僅提高了速度,并考慮了應(yīng)用于非高斯噪聲的情況; Cit rin 和Azimi-Sadjadi 也對卡爾曼濾波方法進行了改進,提出了塊卡爾曼濾波方法; Koch 等提出了擴展卡爾曼濾波( extended Kalmam filter) 復(fù)原方法,該方法可以較好地復(fù)原模糊類型不相似的退化圖象.除了上述的逆濾波方法外,還有參數(shù)估計濾波法,它實質(zhì)上是維納濾波法的變種. 20 世紀90 年代初,又提出了基于遞歸圖象濾波的自適應(yīng)圖象復(fù)原方法及合成濾波方法,它代表了濾波方法新的發(fā)展方向. 1998 年Kundur 等人首先明確提出了遞歸逆濾波( recursiv e inv er se filter ing ) 算法 ,2000 年Chow 等人又進行了改進,即在代價函數(shù)中增加了空間自適應(yīng)正則化項,從而很好地抑制了噪聲,并減少了振鈴現(xiàn)象,較好實現(xiàn)了在低SNR 條件下的盲圖象復(fù)原. 2001 年,Eng 等人結(jié)合模糊集的概念,提出了自適應(yīng)的軟開關(guān)中值濾波方法,它能在有效地去掉脈沖噪聲的同時,很好地保存圖象的細節(jié),是一種值得重視的新的圖象復(fù)原方法。

3.1 2 代數(shù)方法

Andrews 和Hunt 提出了一種基于線性代數(shù)的圖象復(fù)原方法。這種方法可能比較適合那些相對于積分運算,則更喜歡矩陣代數(shù),而相對于分析連續(xù)函數(shù),又更喜歡離散數(shù)學(xué)的人的口味。它為復(fù)原濾波器的數(shù)字計算提供了一個統(tǒng)一的設(shè)計思路。代數(shù)方法可分為偽逆法、奇異值分解偽逆法、維納估計法和約束圖象復(fù)原方法等。 其中,偽逆法,實質(zhì)上是根據(jù)圖象退化的向量空間模型來找到引起圖象退化的模糊矩陣,但由于模糊矩陣總是很大的,因此在計算上往往不可行; 而奇異值分解偽逆法則是利用矩陣可分解成特征矩陣系列的思想,將模糊矩陣進行分解,由于簡化了計算,從而有利于模糊矩陣的估計計算,但在有噪聲存在時,經(jīng)常會出現(xiàn)不穩(wěn)定的現(xiàn)象; 維納估計法雖然考慮了噪聲的情況,但它僅適合噪聲是二維隨機過程,且已知其期望和協(xié)方差的情況。前面的方法僅把圖象看成是數(shù)字的陣列,然而一個好的復(fù)原圖象應(yīng)該在空間上是平滑的,其在幅度值上是正的,而約束圖象復(fù)原方法就是將這些因素作為約束條件,如基于維納估計法和回歸技術(shù)而提出的圖象復(fù)原方法就是一種約束圖象復(fù)原方法,而且通過選取不同的約束參數(shù)和回歸方法可以得到不同的圖象復(fù)原算法。傳統(tǒng)的圖象復(fù)原算法或面臨著高維方程的計算問題,或要求恢復(fù)過程滿足廣義平穩(wěn)過程的假設(shè),這就是,使得具有廣泛應(yīng)用價值的圖象復(fù)原問題沒有得到圓滿的解決的根本原因。

3.2 神經(jīng)網(wǎng)絡(luò)圖象復(fù)原的方法

神經(jīng)網(wǎng)絡(luò)圖象復(fù)原方法的發(fā)展方向自從神經(jīng)網(wǎng)絡(luò)圖象復(fù)原首次提出十多年來,其研究在不斷地深入和發(fā)展,描述它的現(xiàn)狀已屬不易,展望它的未來更是困難,況且科學(xué)研究具有不確定性. 據(jù)筆者判斷,如下諸方面是亟待解決的問題,或研究活動已有向這些方面集中的趨勢。

3. 2.1小波神經(jīng)網(wǎng)絡(luò)用于圖象復(fù)原將是研究的重點

自1992 年Zhang 提出小波神經(jīng)網(wǎng)絡(luò)以來,如今已提出了各種類型的小波網(wǎng)絡(luò),且小波與神經(jīng)網(wǎng)絡(luò)的結(jié)合成了一個十分活躍的研究領(lǐng)域。通過學(xué)者們的理論分析和模擬實驗表明: 由于小波神經(jīng)網(wǎng)絡(luò)具有逼近能力強、可顯著降低神經(jīng)元的數(shù)目、網(wǎng)絡(luò)學(xué)習(xí)收斂的速度快、參數(shù)( 隱層結(jié)點數(shù)和權(quán)重) 的選取有理論指導(dǎo)、能有效避免局部最小值問題等優(yōu)點,因此將其用于圖象復(fù)原是一個值得研究的方向。將小波的時頻域局部性、多分辨性等性質(zhì),與神經(jīng)網(wǎng)絡(luò)的大規(guī)模并行性、自學(xué)習(xí)特性等優(yōu)點結(jié)合起來,不僅將使用于圖象復(fù)原的小波神經(jīng)網(wǎng)絡(luò)具有自適應(yīng)分辨性,也將使正則化參數(shù)的選取更具有自適應(yīng)能力. 最終使復(fù)原圖象既能保持圖象的細節(jié),又能很好地抑制圖象中的各種噪聲。

3.2.2細胞神經(jīng)網(wǎng)絡(luò)、BP 網(wǎng)絡(luò)、自組神經(jīng)網(wǎng)絡(luò)

值得進一步研究細胞神經(jīng)網(wǎng)絡(luò)( CNN ) 由于其具有易于硬件實現(xiàn)的特點,因而具有很強的商業(yè)價值,但由于其自身還有很不成熟的地方,因此值得深入地研究. 其研究方向有: 細胞神經(jīng)網(wǎng)絡(luò)理論基礎(chǔ)的進一步完善及在此基礎(chǔ)上建立細胞神經(jīng)網(wǎng)絡(luò)中鄰域系統(tǒng)的概念; 與圖象數(shù)據(jù)局部相關(guān)性等概念結(jié)合起來研究,以建立新的圖象復(fù)原理論,形成新的圖象復(fù)原技術(shù)。BP 網(wǎng)絡(luò)對受污染或帶噪聲的訓(xùn)練樣本,不僅能進行正確的映射,且與其純樣本仍相似。 正是BP 網(wǎng)絡(luò)的泛化能力強,使它在解決圖象復(fù)原問題時,可能比其他神經(jīng)網(wǎng)絡(luò)具有更好的潛在性能。 將BP 網(wǎng)絡(luò)用于圖象復(fù)原是很值得進一步研究的.大家知道,人腦的學(xué)習(xí)方式是“自主的”,即有自組織和自適應(yīng)的能力的,即人腦能在復(fù)雜、非平穩(wěn)和有“干擾”的環(huán)境及其變化的情況下,來調(diào)整自己的思維和觀念,還能根據(jù)對外界事物的觀察和學(xué)習(xí),找到其內(nèi)在的規(guī)律和本質(zhì)屬性,并能在一定的環(huán)境下,估計到可能出現(xiàn)的情況以及預(yù)期會遇到和感覺到的各種內(nèi)容及情況。 自組織神經(jīng)網(wǎng)絡(luò)(SONN) 正是基于人腦的這些功能而生成的,由于它具有能從輸入的數(shù)據(jù)中,揭示出它們之間內(nèi)在關(guān)系的能力,因此將其用于“盲圖象”的復(fù)原將是非常有利的。

3.2.3 需要提出更適合圖象復(fù)原的新神經(jīng)網(wǎng)絡(luò)模型

小波神經(jīng)網(wǎng)絡(luò)是為逼近任意非線性函數(shù)而提出來的,但為了圖象復(fù)原的需要,可考慮針對圖象復(fù)原的特殊情況,提出新的神經(jīng)網(wǎng)絡(luò)模型。 如,因為大多數(shù)圖象是由平滑區(qū)域和輪廓細節(jié)組成的,其圖象數(shù)據(jù)在平滑區(qū)域雖具有較強的相關(guān)性,但與輪廓細節(jié)相鄰的數(shù)據(jù)應(yīng)極不相關(guān),所以,提出一種專用于圖象復(fù)原的“相關(guān)性神經(jīng)網(wǎng)絡(luò)模型”是必然的期待; 再有,因為多項式具有較廣的擬合性和較好的收斂性,所以應(yīng)提出的“多項式神經(jīng)網(wǎng)絡(luò)”,將它們用于圖象復(fù)原也是值得研究的。

3.2.4 神經(jīng)網(wǎng)絡(luò)與其他理論的結(jié)合

研究是尋求新模型、新方法的重要途徑目前神經(jīng)網(wǎng)絡(luò)的研究正由單純的神經(jīng)計算轉(zhuǎn)向計算智能,并結(jié)合腦科學(xué)的研究向生物智能方向發(fā)展。 為此,神經(jīng)網(wǎng)絡(luò)圖象復(fù)原的研究也應(yīng)考慮吸收模糊、分形、混沌、進化計算、信息融合等交叉學(xué)科的研究成果。 與模糊系統(tǒng)的結(jié)合將是一個重要的研究方向,因為,神經(jīng)網(wǎng)絡(luò)與模糊系統(tǒng)有如下很多的相同之處: ( 1) 它們在處理和解決問題時,無需建立對象的精確數(shù)學(xué)模型,而只需要根據(jù)輸入的采樣數(shù)據(jù)去估計其要求的決策; ( 2) 在對信息的加工處理過程中,均表現(xiàn)出了很強的容錯能力; ( 3) 它們都可以用硬件來實現(xiàn). 由此可見,將神經(jīng)網(wǎng)絡(luò)與模糊系統(tǒng)結(jié)合,用于圖象復(fù)原將是有意義的研究工作。

4 未來展望

圖像恢復(fù)發(fā)展到現(xiàn)在,已經(jīng)有了許多成熟的算法,但是還是存在許多問題,等待著我們?nèi)ソ鉀Q。目前圖像恢復(fù)的最新發(fā)展有:

1. 非穩(wěn)圖像復(fù)原,即空間可變圖像復(fù)原。

2. 退化視頻信號的復(fù)原問題,以及攝像機拍照圖像復(fù)原,這是一個需要進一步研究的領(lǐng)域。

3. 運動補償時空復(fù)原濾波,同時將時間相關(guān)應(yīng)用到運動補償中。

4. “Telemedicine“的出現(xiàn),遠程診斷極大的依賴于遠程接受的圖像質(zhì)量,圖像恢復(fù)在醫(yī)學(xué)領(lǐng)域中有相當重要的作用。

5. 模糊 PSF 的 Identification 仍然是一個困難的問題,尤其在空間可變的 PSF 的估計中。

6. 空間可變恢復(fù)方法,可以利用 Wavelets 和 Markov 隨機場等方法進行復(fù)圖像恢復(fù),這是一個具有發(fā)展?jié)摿Φ难芯糠较颉?/p>

參考文獻

1 馮久超,黃海東. 基于神經(jīng)網(wǎng)絡(luò)的盲圖象恢復(fù)[ J ] . 計算機科學(xué),2000,27( 1) : 67~68.

2 Er ler K,Jernigan E. Adaptive image restorat ion using recursive image f ilters [ J ] . IEE E Trans actions on Signal Process ing,1994,42( 7) : 1877~1881.

篇3

關(guān)鍵詞: 超分辨率; 深度學(xué)習(xí); 卷積; 神經(jīng)網(wǎng)絡(luò); 視覺特征; 映射

中圖分類號:TP399 文獻標志碼:A 文章編號:1006-8228(2017)07-38-04

Application of deep learning in super-resolution image reconstruction

Han Sensen

(School of Computer and Information Engineering, Henan University, Kaifeng, Henan 475000, China)

Abstract: Super-resolution image reconstruction can reconstruct a high-resolution image using low-resolution images; it has become a hotspot in image processing. Deep learning is a popular branch of machine learning, which by combining low-level features to form more abstract high-level visual features, to avoid the artificial extraction of features. This paper divides the current reconstruction algorithm into three categories, which are based on interpolation, based on reconstruction and based on learning, and especially focuses on the reconstruction algorithms based on deep learning. Finally the future research direction of super-resolution image reconstruction technology is prospected.

Key words: super-resolution; deep learning; convolution; neural networks; visual feature; mapping

0 引言

單幀圖像的超分辨率(super resolution,SR)重建是指利用已知的低分辨率圖像,重構(gòu)出具有更高像素密度的圖像,并且重構(gòu)出的圖像還能夠保持豐富的紋理、質(zhì)地等細節(jié)信息。它在視頻監(jiān)控、圖像打印、醫(yī)學(xué)圖像處理、衛(wèi)星成像等領(lǐng)域有較廣泛的應(yīng)用。

超分辨率圖像的重建本質(zhì)上是一個病態(tài)(ill-posed)問題,因為不完全相同的多張圖像高分辨圖像在經(jīng)過相同的降采樣都可以產(chǎn)生相同的低分辨圖像,這是一種典型的一對多問題,因此存在惟一解,特別是在放大倍數(shù)較高的情況下該問題將變得更為復(fù)雜。

1 算法分類

當前的超分辨算法大致可分為三類:基于插值的超分辨率重建算法,基于重構(gòu)的超分辨率重建算法和基于學(xué)習(xí)的超分辨率重建算法。

基于插值的重建算法假設(shè)像素的灰度值是連續(xù)變化的,并利用鄰近像素的灰度值計算待插值像素的灰度值,然而實際應(yīng)用中許多圖像并不滿足這種假設(shè)。并且該算法通過一個預(yù)定義的數(shù)學(xué)公式直接將低分辨率圖像生成高分辨率的圖像而不考慮任何的圖像特性,也不接受任何的訓(xùn)練。所以基于差值方法得到的重建圖像容易產(chǎn)生模糊、鋸齒現(xiàn)象。常見的線性插值方法有最近鄰插值方法,雙線性插值方法,雙三次插值方法等。

基于重構(gòu)的超分辨率重建算法是依照特定的退化模型,將已知的低分辨率圖像序列中不同鼉暗男畔⒔行融合來重建出高分辨率圖像,因此該算法需要對圖像進行配準。常見重構(gòu)算法有種迭代反向投影[1](IBP)、凸集投影法[2](POCS)。

基于學(xué)習(xí)的分辨率重建算法則是通過機器學(xué)習(xí)方法從大量的低分辨圖像和高分辨圖像對中學(xué)習(xí)它們之間的映射函數(shù),利用學(xué)習(xí)到的函數(shù)對測試圖像進行預(yù)測來產(chǎn)生高分辨率圖像。常見的基于學(xué)習(xí)的分辨率重建算法有嵌套的鄰域嵌入[3](Neighbor Embedding with Locally Linear Embedding)、固定鄰域回歸[4](Anchored Neighborhood Regression)、稀疏編碼[5](Sparse Coding)。

相比較于其他兩類算法而言,基于學(xué)習(xí)的SR算法直接學(xué)習(xí)分辨率圖像與高分辨率圖像端到端的映射函數(shù),比傳統(tǒng)的插值和重構(gòu)的方法具有更突出的性能。本文著重介紹幾種基于深度學(xué)習(xí)的超分辨算法,包括SRCNN[6],DRCN[7], ESPCN[8]和SRGAN[9]等。

2 SRCNN

SRCNN(Super-Resolution Convolutional Neural Network)是較早地使用卷積神經(jīng)網(wǎng)絡(luò)來做SR的網(wǎng)絡(luò)模型。該網(wǎng)絡(luò)結(jié)構(gòu)十分簡單,僅僅用了三個卷積層。對于一張低分辨率圖像,SRCNN首先使用雙三次插值將它放大到將要放大的尺寸,再通過三層卷積神經(jīng)網(wǎng)絡(luò)做非線性映射,得到的輸出結(jié)果作為重建的高分辨率圖像。整個過程可分為三個部分:圖像塊的提取和特征表示,特征非線性映射和最終的重建。

圖像塊提取與表示:該過程從低分辨率圖像中提取出部分重疊的圖像塊,并將每個圖像塊表示為一個高維向量,這些向量包含一些特征映射,映射的個數(shù)與向量的維數(shù)相同。

非線性映射:這個功能將每個高維向量非線性地映射成另外一個高維向量。從概念上來講每個映射后的向量代表了一個高分辨率圖像塊。這些向量構(gòu)成了另外一個特征集。

重建:這個處理聚集以上高分辨率基于像素塊的替代對象,用于生成最終的高分辨率圖像。并且我們希望這個圖像能盡可能與高分辨率原圖相近。

對重建后的超分辨率圖像的質(zhì)量進行定量評價的兩個常用指標是PSNR[10](Peak Signal-to-Noise Ratio)和SSIM[11](Structure Similarity Index)。這兩個值代表重建圖像的像素值和原始圖像像素值的接近程度,具體對比結(jié)果如表1,在2、3、4的放大倍數(shù)下,SRCNN與傳統(tǒng)方法的對比,可以看出無論是在哪個放大倍數(shù)下,SRCNN的PSNR值都比其他的重建算法要高出0.4Db左右。

SRCNN的網(wǎng)絡(luò)層數(shù)較少,同時局部感受野也較小,所以從輸入圖像中提取到的信息就非常有限。因此DRCN(Deeply-Recursive Convolutional Network for Image Super-Resolution)提出在網(wǎng)絡(luò)中增加更多的卷積層增加局部感受野的大小,這樣可利用更多的鄰域像素。同時為了避免過多W絡(luò)參數(shù),DRCN提出使用遞歸神經(jīng)網(wǎng)絡(luò)RNN(Recurrent neural network)。

與SRCNN比較類似DRCN的網(wǎng)絡(luò)結(jié)構(gòu)可分為三個部分,第一個是Embedding network,相當于SRCNN中的特征提取,第二個是Inference network,相當于SRCNN中的非線性變換,第三個是Reconstruction network,即從特征圖像得到最后的重建結(jié)果。其中的Inference network是一個遞歸網(wǎng)絡(luò),即數(shù)據(jù)循環(huán)地通過該層進行多次遞歸。將這個遞歸過程展開后可以看出,它等效于多個串聯(lián)的卷積層共享同一組參數(shù),Inference network展開后的網(wǎng)絡(luò)結(jié)構(gòu)是由D個共享參數(shù)的卷積層組成。DRCN將每一層的卷積輸出都送入同一個Reconstruction Net來作為其輸入,由于遞歸的深度是D,從而一共可得到D個重建圖像,再把它們加權(quán)平均得到最終的輸出。此外DRCN受ResNet[14]的啟發(fā)通過skip connection將輸入圖像與Inference net的輸出HD疊加作為Reconstruction Net的輸入,這就相當于Inference Net學(xué)習(xí)的是高分辨率圖像與低分辨率圖像的殘差圖像,即圖像的高頻信息。

實驗部分,DRCN同樣也使用了包含91張圖像的Set91[4]數(shù)據(jù)集進行訓(xùn)練,與SRCNN不同的是DRCN使用的訓(xùn)練數(shù)據(jù)是在多個方法倍數(shù)下生成的,而不像SRCNN那樣在單一的放大倍數(shù)下生成,這樣可以利用不同尺度圖像間的信息進行互補,理論上DRCN的重建效果會由于SRCNN,具體的對比結(jié)果如表2所示,可以看出DRCN的重建圖像的PSNR與SRCNN相比有了較大提高。

4 ESPCN

在SRCNN和DRCN中,低分辨率圖像都需要先使用雙三次插值得到與高分辨率圖像大小相同的低分辨率圖像來為網(wǎng)絡(luò)輸入,這意味著卷積的計算將在較高分辨率的圖像上進行,這與在低分辨率圖像上計算卷積相比于會需要較大的計算開銷。因此ESPCN(Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network)提出在低分辨率圖像上直接計算卷積來得到高分辨率圖像。

ESPCN的核心思想是亞像素卷積層(Sub-pixel Convolutional Layer)。網(wǎng)絡(luò)的輸入是原始的低分辨率圖像,經(jīng)過兩個卷積層后得到的特征圖像大小與輸入圖像一樣,但是特征的通道數(shù)變?yōu)閞2,γ是圖像的目標放大倍數(shù)。然后將每個像素上的r2個通道重新排列成一個γ×γ的區(qū)域,該區(qū)域?qū)?yīng)于高分辨率圖像中的一個區(qū)域大小為γ×γ的子塊,從而對于一個大小為r2×H×W的特征圖像在通道上進行重新排列會形成一個大小為1×rH×rW的圖像,該圖像的尺寸是輸入圖像尺寸的r倍,從而間接地實現(xiàn)了輸入圖像的放大。

通過使用sub-pixel convolution可以間接的實現(xiàn)圖像的放大過程,即插值函數(shù)是隱含地包含在前面的卷積層中,只在網(wǎng)絡(luò)的最后一層對圖像大小做變換,前面的卷積運算由于在低分辨率圖像上進行,因此效率會有很明顯的較高。

ESPCN的訓(xùn)練與SRCNN類似,在重建效果上,以PSNR為評價指標來看ESPCN比SRCNN有進一步的提高,具體對比如表3所示。而時間效率方面對于一個1080HD的視頻圖像,對其放大四倍進行的高分辨率重建,SRCNN需要的時間為0.434s,而ESPCN只需要0.029s。

SRGAN(Photo-Realistic Single Image Super Resolution Using a Generative Adversarial Network)是將生成對抗網(wǎng)絡(luò)用于SR問題的處理。其出發(fā)點是傳統(tǒng)的方法一般只能處理的是較小的放大倍數(shù),當圖像的放大倍數(shù)在4以上時,得到的結(jié)果往往顯得過于平滑,從而重建出的圖像在視覺上卻少一些質(zhì)地細節(jié)的真實感,因此SRGAN使用GAN來生成圖像中的細節(jié)。

SRGAN網(wǎng)絡(luò)由兩部分組成:生成網(wǎng)和判別網(wǎng),生成網(wǎng)用于生成一些圖像,判別網(wǎng)用于判斷接收到的輸入圖像是由生成網(wǎng)生成的還是來自于真實樣本中的原始圖像。訓(xùn)練時如果判別網(wǎng)無法區(qū)分出來輸入的樣本來自于哪里就達到了預(yù)期的效果。

傳統(tǒng)方法一般使用圖像的最小均方差(MSE)作為誤差函數(shù),即該誤差函數(shù)使重建圖像有較高的PSNR,但是重建圖像缺少了必要的高頻信息,因而在重建后的圖像中容易出現(xiàn)過度平滑的紋理。在SRGAN的誤差函數(shù)中又增加了一個內(nèi)容誤差項和生成誤差項。

內(nèi)容誤差用于衡量重建出圖像與原始圖像在更高級的視覺特征上的差e。其具體定義由以下公式描述。

生成誤差項基于判別網(wǎng)輸出的概率,其輸出值表示輸入數(shù)據(jù)來自于真實樣本的概率大小。其具體定義由以下公式描述。

其中是一個圖像屬于真實的高分辨率圖像的概率。是重建的高分辨率圖像。

SRGAN的訓(xùn)練過程與前面的網(wǎng)絡(luò)類似,同樣使用PSNR和SSIM評價標準對算法的重建效果進行測試,SRGAN生成的高分辨率圖像看起來更真實,具體的對比如表4所示。

6 結(jié)束語

深度學(xué)習(xí)已經(jīng)在超分辨率圖像重建領(lǐng)域取得了突破性的成績,同時它仍然存在一些問題,例如它與傳統(tǒng)的機器學(xué)習(xí)方法一樣,通常假設(shè)訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)服從同樣的分布,而實際上這兩者存在一定的偏差。此外當前的重建算法仍然只使用于較小的放大倍數(shù),對于較大的放大倍數(shù)得到重建圖像仍然過于平滑模糊,因此如何充分利用深度學(xué)習(xí)來增強算法在較高的放大倍數(shù)下的重建性能是目前深度學(xué)習(xí)研究的重點。

參考文獻(References):

[1] Irani M, Peleg S. Improving resolution by image registration[J].

CVGIP: Graphical models and image processing,1991.53(3):231-239

[2] Stark H, Oskoui P. High-resolution image recovery from

image-plane arrays, using convex projections[J].JOSA A,1989.6(11):1715-1726

[3] Timofte R, De Smet V, Van Gool L. A+: Adjusted

anchored neighborhood regression for fast super-

resolution[C],2014:111-126

[4] Timofte R, De Smet V, Van Gool L. Anchored

neighborhood regression for fast example-based super-

resolution[C],2013:1920-1927

[5] Yang J, Wright J, Huang T S, et al. Image

super-resolution via sparse representation[J]. IEEE transactions on image processing,2010.19(11):2861-2873

[6] Bruna J, Sprechmann P, Lecun Y, et al. Image

Super-Resolution Using Deep Convolutional Networks[J]. Computer Science,2015.

[7] Kim J, Lee J K, Lee K M. Deeply-Recursive Convolutional

Network for Image Super-Resolution[J]. arXiv preprint arXiv:1511.04491,2015.

[8] Shi W, Caballero J, Huszár F, et al. Real-Time Single

Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network[J],2016.

[9] Ledig C, Theis L, Huszar F, et al. Photo-Realistic Single

Image Super-Resolution Using a Generative Adversarial Network[J],2016.

[10] Hore A, Ziou D. Image Quality Metrics: PSNR vs. SSIM[J],

2010:2366-2369

[11] Wang Z, Bovik A C, Sheikh H R, et al. Image quality

assessment: from error visibility to structural similarity[J].IEEE Transactions on Image Processing,2004.13(4):600-612

[12] Kim K I, Kwon Y. Single-image super-resolution using

sparse regression and natural image prior[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on,2010.32(6):1127-1133

[13] Dong C, Loy C C, He K, et al. Image super-resolution

using deep convolutional networks[J]. IEEE transactions on pattern analysis and machine intelligence,2016.38(2):295-307

篇4

關(guān)鍵詞:灰值動態(tài)學(xué)卷積模板卷積投影牌照識別

基于圖像理解的汽車牌照自動識別系統(tǒng)是智能交通系統(tǒng)一個重要分支,有著非常廣泛的應(yīng)用前景,而把汽車牌照從復(fù)雜的汽車圖像中分割出來是汽車牌照自動識別系統(tǒng)必須解決的關(guān)鍵問題。在過去的十幾年中,各國的科研人員提出了不少提取汽車牌照的方法。Choi和Kim提出利用Hough變換尋找垂直邊緣提取汽車牌照的方法,此方法由于許多汽車前部散熱器產(chǎn)生的垂直邊緣和某些牌照邊框的扭曲或某些汽車牌照沒有邊框而魯棒性較差。S.K.Kim和H.J.Kim提出的基于遺傳算法分割提取汽車牌照的方法,最大缺點是耗時長,難以進行實時處理。S.H.Park提出的一種基于神經(jīng)網(wǎng)絡(luò)提取汽車牌照的方法,使用二個時延神經(jīng)網(wǎng)絡(luò)在水平和垂直方向?qū)斎雸D像進行濾波,得到牌照的候選區(qū)域,然后利用牌照的長寬比、面積、面積與周長比來區(qū)分真正的牌照區(qū)域與類牌照區(qū)域。此方法要求圖像中的牌照尺寸基本不變,一旦圖像中的牌照尺寸發(fā)生了較大的變化,必須對神經(jīng)網(wǎng)絡(luò)重新進行訓(xùn)練。T.R.Crimmins提出了一種數(shù)字形態(tài)學(xué)方法,此方法用不同尺寸的每個可能字符作為結(jié)構(gòu)元素,采用擊中擊不中方法先提取輸入圖像中的字符,再根據(jù)牌照字符的語法得到汽車牌照,這種方法計算量非常大且易受噪聲影響。C.H.Poon提出了一種灰值形態(tài)學(xué)方法,它通過檢測字符中的直線段和字符間的空間來提取牌照,這種方法耗時較多,且沒有利用版照的尺寸信息。C.M.Hwang提出了空間頻率方法,它利用牌照區(qū)域內(nèi)空間頻率變化大的特性,對圖像進行一階差分。差分圖在牌照區(qū)域內(nèi)形成多個峰,然后利用峰的幅度、寬度和密度區(qū)分真正的牌照區(qū)域與類牌照區(qū)域。這種方法具耗時少、抗噪能力強的優(yōu)點。本文提出的灰值形態(tài)學(xué)方法僅利用了牌照區(qū)域內(nèi)空間頻率變化大的特性而且利用了牌照區(qū)域字符筆劃具有高曲的特性,因而比單純的空間頻率方法更加有效。通過建立牌照與卷積算子形態(tài)學(xué)結(jié)構(gòu)元素尺寸的相互關(guān)系。本文提出的方法對不同尺寸牌照具有很好的魯棒性。

1數(shù)字形態(tài)學(xué)

數(shù)字形態(tài)學(xué)是一種重要的數(shù)字圖像處理方法和理論。在數(shù)字形態(tài)學(xué)中,兩種最基本的變換或運算是腐蝕和膨脹,其它形態(tài)學(xué)變換都可通過它們來定義。下面列出了一些灰值形態(tài)學(xué)變換的定義。

圖像f(x,y)平移(a,b)定義為:

f(a,b)(x,y)=f(x-a,y-b)

圖像f(x,y)相對于原點的反射為:

f^(x,y)=f(-x,-y)

二幅圖像f(x,y)和g(x,y)的最小記為(f∧g)(x,y)。

當(x,y)位于圖像f的定義域D(f)和圖像g的定義域D(g)的交集D(f)∩D(g)內(nèi)時:

(f∧g)(x,y)=min{f(x,y),g(x,y)}

否則:

(f∧g)(x,y)=0

二幅圖像f(x,y)和g(x,y)的最大記為(f∨g)(x,y)。

當(x,y)位于圖像f的定義域D(f)和圖像g的定義域D(g)的交集D(f)∩D(g)內(nèi)時:

(f∨g)(x,y)=max{f(x,y),g(x,y)}

當(x,y)∈D(f)且(x,y)∈D(g)時

(f∨g)(x,y)=f(x,y)

當(x,y)∈D(g)且(x,y)∈D(f)時

(f∨g)(x,y)=g(x,y)

f(x,y)被g(x,y)膨脹定義為:

(fg)(x,y)=max{f(x-a,y-b)+g(a,b)}

(a,b)∈D(g)

f(x,y)被g(x,y)腐蝕定義為:

(fg)(x,y)=max{f(x-a,y-b)-g(a,b)}

(a,b)∈D(g)

開運算定義:

fog=(fg)g

閉運算定義:

f·g=(fg)g

Top-Hat變換定義:

Hat(f,g)=f-fog

與Top-Hat變換相對的是波谷檢測器(Valley變換),其定義為:

Valley(f,g)=(f·g)-f

形態(tài)學(xué)梯度有下面三種形式:

Grad(f)=f-(fg)

Grad(f)=(fg)-f

Grad(f)={[(fg)-(fg)]}/2

2牌照提取算法

在牌照提取算法中,需要用到卷積、模板卷積和卷積投影等概念。下面對它們進行定義。

對于圖像[aij]m×n,i=0...m-1,j=0...n-1,模板[aij]p×q。p<m,q<n,其卷積、模板卷積和卷積投影都是一維數(shù)組。

水平模板卷積

垂直模板卷積投影vmp:

水平模板卷積投影hmp:

圖1中牌照區(qū)域的長為173象素、高為36象素。從左到右、從上到下的8條曲線依次為牌照區(qū)域灰度圖第10~17條水平方向的灰度值。通過觀察發(fā)現(xiàn),在牌照區(qū)域的水平方向不令空間頻率變化大,而且具有許多陡峭的峰(欲)和高曲率點。而灰值形態(tài)學(xué)的梯度變換可以對圖像進行高通濾波,灰值形態(tài)學(xué)的Top-Hat變換和Valley變換可以撮高曲率點、波峰和波谷。

進行形態(tài)學(xué)變換,需要考慮二個因素:結(jié)構(gòu)元素和變換類型。變換類型準備采用灰值形態(tài)學(xué)的梯度變換、Top-Hat變換和Valley變換。結(jié)果元素采用n×1的維水平結(jié)構(gòu),以提取水平方向上的高頻分量、波峰和波谷。結(jié)構(gòu)元素的大小n對Top-Hat變換和Valley變換的結(jié)果結(jié)構(gòu)元素的大小n對Top-Hat變換和Valley變換的結(jié)果有著很大的影響,因此問題的關(guān)鍵是怎樣確定n。

分析圖1中水平方向的灰度曲線,發(fā)現(xiàn)在穿過字符的水平線上,灰度曲線波峰的寬度與字符垂直筆劃的寬度存在著某種線性關(guān)系。根據(jù)中國汽車牌照的一般規(guī)范,牌照上字符的垂直筆劃寬度與牌照的寬度也存在著某種線性關(guān)系。結(jié)構(gòu)元素的尺寸n與灰度曲線波峰的寬度又可建立一種線性關(guān)系。因此可建立n與牌照寬度w的一種近似線性的關(guān)系:

n=Integer{(w/k)+b}

式中的Integer()表示對括號內(nèi)的值取整。w、b都為整數(shù)。根據(jù)經(jīng)驗令w、b分別為25和0,則:

n=Integer(w/25)

由上式可知,當牌照的寬度w變化25個象素時,結(jié)構(gòu)元素的大小n才變化1個單位,也就是說n對w不是很敏感。

牌照區(qū)域提取算法包括以下幾步:

(1)縮小圖像:對輸入的灰值汽車圖像進行隔行隔列抽樣,得到一幅大小為四分之一原因的新圖像。接下列抽樣,得到一幅大小為四分之一原圖的新圖像。接下來的處理均在新圖像上進行,這樣可以大大減少處理時間,提高算法的效率。根據(jù)形態(tài)學(xué)的尺度變換兼容性原理,對圖像縮小(放大)后再進行形態(tài)學(xué)變換,只要對結(jié)構(gòu)元素做相應(yīng)的變換,結(jié)果不變。

(2)水平分割:對汽車圖像進行水平分割,得到幾個可能含牌照的水平區(qū)域。

(3)垂直分割:對第(2)步所得到的每一個水平區(qū)域進行垂直分割,得到一些牌照的候選區(qū)域。

(4)牌照區(qū)域甄別:分析各個候選區(qū)域得出真正的牌照區(qū)域。

2.1水平分割

分別對汽車圖像進行灰值形態(tài)學(xué)的梯度變換、Top-Hat變換和Valley變換,如圖2。一般來說,在大多數(shù)汽車車牌照自動識別系統(tǒng)應(yīng)用中,CCD攝取的汽車圖像中牌照的大致寬度和高度是已知的。如果牌照的寬度為w∈(a,b),則取水平模板m×1,其中m=(a+b)/2。用模板分別對圖像的梯度圖、Top-Hat變換圖和Valley變換圖進行水平模板卷積。對每幀變換圖取每一行模板水平卷積的最大值,得到1個一維數(shù)組,3幅變換圖共得到3個一維數(shù)組g1,ti和vi,其中i大于等于1,而小于等于圖像的高度,其曲線如圖2的b、c、d。觀察圖2可以發(fā)現(xiàn),由于受車體上其它字符和車前燈等因素的影響,僅僅依靠梯度圖較難對牌照進行水平定位,而結(jié)合Top-Hat變換圖和Valley變換圖,能更好地對牌照進行水平定位。據(jù)此,構(gòu)成了1個一維數(shù)組pi。

pi=gi×ti×vi

其曲線如圖3。取圖3中最高峰的位置作為牌照的水平中線,為了確保不會出錯,把次高峰也作為牌照的另一備選位置。了高峰和次高峰的位置,分割出2個寬為汽車圖像寬度,高為牌照的最大可能高度b的區(qū)域,如圖4中的a和b。

2.2垂直分割

對圖4中的a和b二個區(qū)域分別進行灰值形態(tài)學(xué)的梯度變換、Top-Hat變換和Valley變換,并在垂直方向?qū)ψ儞Q圖進行卷積得到3個一維數(shù)組gi、ti和vi,其中i大于等于1,而小于等于圖像的寬度w,其曲線如圖5和圖6。qi=gi×ti×vi

的曲線如圖7。利用下面的公式分別對圖4中的a和b進行垂直分割。

{(m,n)|qi>kT,i=m...n,n-m+1∈(a,b)}

其中:T=Max(qi),k為一經(jīng)驗值,(a,b)為牌照的寬度范圍。

i=l...w

分割結(jié)果如圖8所示。

2.3牌照區(qū)域甄別

篇5

關(guān)鍵詞: 糧蟲檢測; 特征提取; RBF神經(jīng)網(wǎng)絡(luò); 圖像識別

中圖分類號: TN911.73?34; S24 文獻標識碼: A 文章編號: 1004?373X(2017)04?0107?04

Application of image recognition processing technology in agricultural engineering

ZHOU Qingsong, TANG Xiuzhong

(School of Technology, Puer University, Puer 665000, China)

Abstract: A grain insect detection method based on image recognition processing is studied. The image recognition processing technology is applied to the agricultural engineering. The gray processing, binaryzation, smoothing and sharpening techniques are used to preprocess the grain insect image to make it easier to conduct the edge detection and image feature extraction. The commonly?used four edge detection methods are adopted to detect the edge of the grain insect image under recognition. Eight regional descriptor features of the grain insect image are taken as the input characteristics of the grain insect recognition model. Three familiar grain insects of maize weevil, tribolium and coleoptera are selected as the research objects, and the identification model based on RBF neural network is used to recognize the geometric feature of three grain insect images.

Keywords: grain insect detection; feature extraction; RBF neural network; image recognition

0 引 言

目前儲糧害蟲問題是世界上很多國家所面臨的困難,在很多國家每年都會因為糧食害蟲而損失很多糧食。在遭受到糧食害蟲的侵害以后糧食的籽粒會被破壞,容易變質(zhì)、Y塊、發(fā)熱以及發(fā)霉,另外在老化死去害蟲尸體、糞便以及有毒液體的影響下糧食會受到較為嚴重的污染[1]。

總的來說,目前主要有四種方法來檢測糧食害蟲:首先是取樣法,將所制作的扦樣器按照區(qū)域定點的方法安裝在儲糧庫內(nèi)。采用電機或者人工的方法吸取糧食樣本,然后交由技術(shù)人員分類、鑒別以及篩選,這樣就可以對庫區(qū)糧食害蟲密度進行確定。這種方法需要較大的勞動量,降低了工作效率,另外人為主觀因素容易對最后的結(jié)果產(chǎn)生影響,因此產(chǎn)生了較大的誤差。其次是誘捕法,通過對糧食害蟲生理特性以及習(xí)性的利用來采取合適的誘捕方式,主要包括糧食害蟲生理特性誘集法以及陷阱式誘集法兩種。但是在應(yīng)用誘捕法的過程中需要制作誘導(dǎo)劑以及提取糧食害蟲的信息素,由于具有較強的針對性,而且具有種類繁多的糧食害蟲,因此所消耗的成本比較大,所以以上兩種方法也存在著一定的缺陷。再次是聲測法,通過對聲音監(jiān)測裝置的應(yīng)用,分析害蟲爬行以及吃食時的聲音,進而就可以獲取糧食害蟲密度信息。在應(yīng)用這種方法的過程中會在周圍產(chǎn)生較大的噪音,同時需要花費較大的資金來制造聲音監(jiān)測裝置,所以目前這種方法并沒有得到廣泛的應(yīng)用。最后一種方法是近紅外反射光譜識別法,糧食害蟲的C,H,N成分存在著很大的差距,因此就會產(chǎn)生不同的近紅外線光譜,這種不同種類的糧食害蟲就可以通過NIR 的掃描來進行識別。但是這種方法仍然存在著一定的缺陷,例如糧食的不完整顆粒以及顆粒大小等物理因素會對掃描結(jié)果產(chǎn)生一定的影響,使得無法獲得準確和清晰的NIR 掃描圖像[2?3]。

除了使用聲音檢測方法外,其他方法不利于實現(xiàn)自動化糧蟲檢測,人工檢測方法效率低、成本高,因此本文研究一種基于圖像識別處理的糧蟲檢測方法,將圖像識別處理技術(shù)應(yīng)用于農(nóng)業(yè)工程。

1 糧蟲圖像預(yù)處理

1.1 圖像灰度化處理

在分析糧蟲圖像的過程中首先需要進行圖像顏色之間的轉(zhuǎn)換,通常是將彩色轉(zhuǎn)換為灰色,這樣既能夠加快圖像的處理速度,另外還能夠方便地將處理后的信息向原來的圖像上進行轉(zhuǎn)移。

通常利用最大值法、加權(quán)平均法以及平均值法來進行彩色圖像和灰色圖像之間的轉(zhuǎn)換。本文在進行彩色圖像灰度化處理的過程中主要采用了最大值法,這種方法比較簡單,采用三原色R,G,B來對圖像的灰度值進行描述[4]。

1.2 二值化

采用二值化手段來處理糧蟲圖像,這樣能夠重點顯示對象區(qū)域,對于后續(xù)的分析和辨別非常有利。由于在灰度上目標圖像與背景圖像存在著較大的差距,因此可以根據(jù)灰度值的不同來對目標圖像進行區(qū)分。分別用0和1來表示目標圖像和背景圖像,這樣就能夠?qū)崿F(xiàn)灰色圖像和二值圖像之間的轉(zhuǎn)換,具有較高的識別度。本文只對單個的背景和圖像進行了分析。因此在數(shù)據(jù)對比的過程中使用了一個閾值Th,達到分類像素群的目的。將圖像中的背景灰度值以及目標灰度值分別設(shè)置[5]為1和0。

1.3 圖像平滑

本文使用鄰域平均法對糧蟲圖像進行平滑處理。所應(yīng)用的均值濾波的鄰域平均法實際上就是進行空域平滑處理,首先在相同的窗口上放置圖像,平均所有的像素灰度值,通過對中心部位像素灰度值的替代就能夠達到平滑的目的。均值濾波和低通濾波器具有相同的作用,輸出的圖像可以用離散卷積來進行表示[6]。

1.4 圖像銳化

通過對圖像的銳化處理能夠達到修復(fù)外部形狀以及進行圖像邊緣聚焦的目的。通過圖像灰度顏色的加深以及外援色彩數(shù)值的對比能夠?qū)D像的清晰度進行提升。目前Sobel算子、Laplace算子以及Robert算子是圖像銳化過程中經(jīng)常采用的算子,本文在圖像銳化的過程中采用了Robert算子。

2 邊緣檢測

在經(jīng)過上述的預(yù)處理后,能夠顯著地提升圖像的質(zhì)量,但是還需要采用圖像邊緣檢測技術(shù)來對圖像中的背景和目標進行區(qū)分[7]。

(1) Roberts 邊緣檢測算子。Roberts 邊緣檢測算子是使用局部差分算法實現(xiàn)。其中原始圖像用f(x,y)表示,邊緣檢測后輸出的圖像用g(x,y)表示:

(1)

利用互相垂直方向上的差分Roberts 邊緣檢測算子就可以對梯度進行計算,另外邊緣之間的檢測可以利用對角線方向相鄰像素之差來實現(xiàn)。

通過對模板的利用能夠?qū)oberts 的梯度幅度G進行計算,進而得到合適的閾值T,當G>T時,該點就是階躍邊緣點,進而獲取邊緣圖像。

(2) Sobel 邊緣檢測算子。Sobel邊緣檢測算子考察各個像素的鄰域加權(quán)差,加權(quán)差值最大的點就是邊緣點:

(2)

算子模板為:

(3)

(3) Prewitt 邊緣檢測算子。算子和算子具有相似的特點:

(4)

算子模板為:

(5)

(4) Laplacian 邊緣檢測算子。邊緣檢測算子,通過在邊緣處產(chǎn)生陡峭的零交叉來實現(xiàn)邊緣檢測的目的[8]:

(6)

本文選取常見的玉米象、擬谷盜和鋸谷盜三種糧蟲為研究對象,使用上述四種邊緣檢測方法對糧蟲圖像邊緣進行檢測,其中檢測效果最好的是使用邊緣檢測算子,檢測效果最差的是使用邊緣檢測算子。兩種算子檢測結(jié)果如圖1所示。

圖1 兩種算子對玉米象、擬谷盜和鋸谷盜三種糧蟲的邊緣檢測

3 糧蟲圖像特征提取

區(qū)域描述子特征在圖像分析的過程中具有非常強的實用效果。因此本文使用糧蟲圖像的八種區(qū)域描述子特征作為糧蟲識別模型的輸入特征[9?10]:

(1) 面積A:圖像中待識別對象面積像素點個數(shù)總和:

(7)

(2) 周長P:待識別對象的周長:

(8)

式中,SUM(in)為4鄰域內(nèi)像素均為待識別對象的像素個數(shù)總和。

(3) 相對面積RA:待識別對象面積占圖像總體比例:

(9)

(4) 延伸率S:待R別糧蟲圖像的最小外接矩形的寬度比上長度值[11]:

(10)

(5) 復(fù)雜度C:待識別對象緊湊性:

(11)

(6) 占空比B:反應(yīng)待識別對象的復(fù)雜程度:

(12)

(7) 等效面積圓半徑R:

(13)

(8) 偏心率E:待識別對象長短軸長度之比,描述了待識別對象的緊湊性,使用Tenebaum近似計算公式對偏心率E求解:

平均向量求解:

(14)

j+k階中心矩求解:

(15)

方向角求解:

(16)

偏心率E近似求解[12?13]:

(17)

4 糧蟲識別實驗

本文選取常見的玉米象、擬谷盜和鋸谷盜三種糧蟲為研究對象,對其圖像進行處理識別。分別使用邊緣檢測算子、邊緣檢測算子、邊緣檢測算子和邊緣檢測算子對其圖像進行邊緣檢測,并提取其圖像的面積A、周長P、相對面積RA、延伸率S、復(fù)雜度C、占空比B、等效面積圓半徑R和偏心率E這八個特征用于對三種糧蟲的識別,具體特征值如表1所示。

使用基于RBF神經(jīng)網(wǎng)絡(luò)的識別模型對三種糧蟲圖像的幾何形態(tài)特征進行識別,識別原理如圖2所示。

選取50張玉米象圖像、50張擬谷盜圖像和50張鋸谷盜圖像以及20張無糧蟲圖像對基于RBF神經(jīng)網(wǎng)絡(luò)的識別模型進行訓(xùn)練,提高其識別糧蟲圖像的泛化能力。

基于RBF神經(jīng)網(wǎng)絡(luò)的識別模型的輸入向量為糧蟲圖像的八種特征,即輸入節(jié)點數(shù)為8;基于RBF神經(jīng)網(wǎng)絡(luò)的識別模型的輸出向量結(jié)果為玉米象圖像、擬谷盜圖像、鋸谷盜圖像以及無糧蟲圖像4種,即輸出節(jié)點數(shù)為4;隱含層節(jié)點數(shù)根據(jù)經(jīng)驗公式計算。

分別使用20張玉米象圖像、20張擬谷盜圖像和20張鋸谷盜圖像對訓(xùn)練后的基于RBF神經(jīng)網(wǎng)絡(luò)的識別模型進行測試。

能夠得到使用邊緣檢測算子、邊緣檢測算子、邊緣檢測算子和邊緣檢測算子對其圖像進行邊緣檢測后,以及使用基于RBF神經(jīng)網(wǎng)絡(luò)的識別模型對糧蟲圖像的識別結(jié)果如圖3所示。

從基于RBF神經(jīng)網(wǎng)絡(luò)識別模型的糧蟲識別結(jié)果可以看出,分別使用邊緣檢測算子、邊緣檢測算子、邊緣檢測算子和邊緣檢測算子對其圖像進行邊緣檢測后,識別模型對三種糧蟲的平均識別率為80.65%,81.96%,80.34%和78.56%,說明在其他情況相同情況下,使用Sobel 邊緣檢測算子對糧蟲圖像邊緣檢測對于糧蟲圖像識別準確率是最有利的,而使用Laplacian 邊緣檢測算子后糧蟲圖像的識別率最低。

5 結(jié) 論

本文研究一種基于圖像識別處理的糧蟲檢測方法,將圖像識別處理技術(shù)應(yīng)用于農(nóng)業(yè)工程。選取常見的玉米象、擬谷盜和鋸谷盜三種糧蟲為研究對象,對其圖像進行處理識別。分別使用邊緣檢測算子、邊緣檢測算子、邊緣檢測算子和邊緣檢測算子對其圖像進行邊緣檢測,并提取其圖像的面eA、周長P、相對面積RA、延伸率S、復(fù)雜度C、占空比B、等效面積圓半徑R和偏心率E這八個特征用于對三種糧蟲的識別,使用基于RBF神經(jīng)網(wǎng)絡(luò)的識別模型對三種糧蟲圖像的幾何形態(tài)特征進行識別。結(jié)果表明,在本文的研究條件下,使用邊緣檢測算子對糧蟲圖像邊緣檢測對于糧蟲圖像識別準確率是最有利的,而使用邊緣檢測算子后糧蟲圖像的識別率最低。

參考文獻

[1] 代亭.糧食害蟲智能檢測及分類方法研究[D].鄭州:河南工業(yè)大學(xué),2012.

[2] 張明真.儲糧害蟲活動聲信號識別研究[D].西安:陜西師范大學(xué),2013.

[3] 張紅濤.儲糧害蟲圖像識別中的特征抽取研究[D].鄭州:鄭州大學(xué),2002.

[4] 張成花.基于圖像識別的儲糧害蟲分類的研究[D].鄭州:鄭州大學(xué),2002.

[5] 韓瑞珍.基于機器視覺的農(nóng)田害蟲快速檢測與識別研究[D].杭州:浙江大學(xué),2014.

[6] 葛恒赫.基于機器視覺的外螺紋表面缺陷檢測技術(shù)研究[D].重慶:重慶大學(xué),2014.

[7] 王凡.基于機器視覺的螺紋缺陷檢測技術(shù)研究和系統(tǒng)開發(fā)[D].成都:電子科技大學(xué),2011.

[8] 梅雪.基于圖像識別的儲糧害蟲檢測專家系統(tǒng)的研究[D].北京:北京郵電大學(xué),2009.

[9] 張衛(wèi)芳.基于圖像處理的儲糧害蟲檢測方法研究[D].西安:陜西師范大學(xué),2010.

[10] 張紅梅,范艷峰,田耕.基于數(shù)字圖像處理技術(shù)的儲糧害蟲分類識別研究[J].河南工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2005(1):19?22.

[11] 胡祝華,趙瑤池,白勇,等.基于圖像處理技術(shù)的儲糧害蟲快速識別[J].安徽農(nóng)業(yè)科學(xué),2014(30):10784?10787.

[12] 蘇庭奕.基于圖像處理的儲糧害蟲檢測及識別方法研究[D].鄭州:河南工業(yè)大學(xué),2015.

篇6

關(guān)鍵詞:小波變換,非整數(shù)次諧波,諧波檢測

 

1 引言

近年來,隨著電力電子技術(shù)的迅速發(fā)展,各種變頻器、變流器、開關(guān)電源和電抗器等非線性設(shè)備的應(yīng)用日益增多,產(chǎn)生了大量的高次諧波,造成電力系統(tǒng)電壓、電流嚴重畸變,引發(fā)了一系列問題。

傳統(tǒng)的快速傅氏變換以求和替代積分,以降低精度為代價來提取實時性,可以得出各次諧波的幅值相位。

瞬時無功功率理論自20世紀80年代提出后,突破了傳統(tǒng)的平均值為基礎(chǔ)的功率定義,具有較好的實時性,抗干擾能力強。

神經(jīng)網(wǎng)絡(luò)方法其特點是算法基于誤差曲面上的梯度下降,權(quán)調(diào)數(shù)量與輸入量一致,并保持與誤差的負梯度方向一致,因此能保證網(wǎng)絡(luò)的收斂性。

小波變換理論適合于對局部頻域進行精確分析,它提供了一個自適應(yīng)的可調(diào)采樣窗口,具有更強的實時性。而且小波變換理論分析時頻問題的良好特性使得它在檢測非整數(shù)次諧波方面優(yōu)于其他理論。本文采用連續(xù)小波變換分析系統(tǒng)中的整數(shù)次與非整數(shù)次諧波,并通過Matlab仿真得到了較好的分析結(jié)果,表明了小波變換具有檢測電力系統(tǒng)中各種諧波的良好功能。

2 諧波檢測原理

小波變換公式:。論文格式。

其中,為小波基函數(shù),a為伸縮因子,為平移因子,x(t)為待分析信號。

由上式可知,小波變換實質(zhì)上是信號x(t)與小波母函數(shù)的卷積,是對信號滿足一定附加條件的濾波。而濾波的范圍則是由參數(shù)α, 來決定,反映在小波母函數(shù)和小波因子的選擇上??梢姡〔ㄗ儞Q是按頻帶而不是按頻點的方式處理頻域,因此信號頻率的微小波動不會對處理產(chǎn)生很大影響,且不要求對信號進行整周期采樣;其次,由小波變換的時間局部性可知,在信號局部發(fā)生波動時,它不會像傅立葉變換那樣把影響擴散到整個頻譜,而只改變當時一小段時間的頻譜分布,這使其可以跟蹤時變信號和暫態(tài)信號。

由于小波變換具有良好的時頻局部化特征,使得小波變換應(yīng)用于電力系統(tǒng)的諧波檢測有著很好的理論基礎(chǔ),可以根據(jù)不同尺度的小波變換系數(shù)的幅值來測量諧波的頻率。由連續(xù)小波變換公式可見,信號的連續(xù)小波變換相當于信號通過有限長的帶通濾波器不同的尺度因子α決定帶通濾波器的帶通特性。如果能夠使不同頻率的諧波位于不同的頻帶中,就能夠把包括整數(shù)次非整數(shù)次的不同頻率的諧波分離出來。因此,利用小波變換可以實現(xiàn)整數(shù)次和非整數(shù)次的諧波含量的測量。

本文中采用Daubechies小波對函數(shù)進行小波變換。論文格式。一般將其簡寫為dbN,N是小波的階數(shù)。dbN沒有明確的表達式(除了N=1外),但轉(zhuǎn)換函數(shù)h的平方模是很明確的。

令,其中為二項式的系數(shù),則有:

式中,。

3 仿真結(jié)果分析

對本文提出的檢測方法進行數(shù)字仿真,其中3.1是對于含有基波、2、3.4次諧波檢測信號的仿真,3.2是對含噪的的諧波信號檢測的仿真。論文格式。

3.1 含有基波、2、3.4次諧波檢測信號的仿真

由于非線性元件和電力電子器件的廣泛應(yīng)用,使電力系統(tǒng)中存在著大量的整數(shù)次與非整數(shù)次諧波。采樣一個周期,而系統(tǒng)中分別有基波、2、3.4次諧波時,采用db3小波對信號進行5層分解。

圖1 線形組合后的信號

圖2 小波分解后各層的逼近信號

圖3 小波分解后各層的細節(jié)信號

當信號中含有基波、2次、3.4次諧波時,其線形組合后的信號如圖1所示,對組合信號進行5層db3分解后的逼近信號如圖2所示,細節(jié)信號如圖3所示。從圖2可以看出,逼近信號a1顯示了3.4次諧波,逼近信號a2顯示了基波,二次諧波則出現(xiàn)在細節(jié)信號d2中。由此可知,對于常規(guī)傅立葉變換不能檢測非整數(shù)次諧波的問題,可以利用小波變換分析系統(tǒng)中存在的非整次諧波。通過分析小波變換對諧波檢測的特點,選用了db3小波變換并分析了含有非整次諧波的系統(tǒng),證明了小波變換對于解決含有非整次諧波的檢測和分析具有良好的特性。

3.2對含噪的諧波信號的仿真

在電網(wǎng)電壓中,由于各種現(xiàn)代電力電子設(shè)備的干擾,不但存在諧波信號,而且有著廣泛的噪聲信號。采樣一個周期,而系統(tǒng)中分別含有3.7次諧波和噪聲信號時,采用db3小波對信號進行5層分解。

圖4 含噪聲信號線形組合后的信號

圖5 含噪聲信號小波分解后各層的逼近信號

圖6 含噪聲信號小波分解后各層的細節(jié)信號

當信號中含有3.7次諧波和噪聲信號時,其線形組合后的信號如圖4所示,對組合信號進行5層db3分解后的逼近信號如圖5所示,細節(jié)信號如圖6所示。從圖6可以看出,3.7次諧波體現(xiàn)在逼近信號部分,而白噪聲體現(xiàn)在細節(jié)信號部分。由此可知,小波變換不但具有良好的非整次諧波的檢測能力還具有良好的噪聲分辨能力。

4 結(jié)論

小波變換是針對快速傅立葉變換在分析非穩(wěn)態(tài)信號方面的局限性形成和發(fā)展起來的一種十分有效的時頻分析工具,它克服了快速傅立葉變換的缺點,采用不同尺度的分析方法,能在信號的不同部位得到最佳的時域分辨率和頻域分辨率,為非穩(wěn)態(tài)信號的分析提供了一條新的途徑,通過本文的仿真可知,它對于含有整數(shù)次、非整數(shù)次諧波和含噪諧波的檢測有著很大的優(yōu)越性。

參考文獻

1 石國萍、田立軍. 基于小波變換的統(tǒng)一電能質(zhì)量控制器檢測方法研究. 2004,16(1):34-37

2 林易群等. 基于小波多孔算法的暫態(tài)電能質(zhì)量檢測方法. 中國電力,2002,35(10):54-57

3 張慶超. 基于小波神經(jīng)網(wǎng)絡(luò)的輸電線路故障檢測. 天津大學(xué)學(xué)報,2003,36(6):710-713

4 薛蕙、楊仁剛. 利用Morlet連續(xù)小波實現(xiàn)非整次諧波檢測. 電網(wǎng)技術(shù),2002,26(12):41-44

5 歐陽森. 基于小波原理的電能質(zhì)量檢測數(shù)據(jù)實時壓縮方法. 電網(wǎng)技術(shù),2003,27(2):37-39

篇7

關(guān)鍵詞: 數(shù)字信號處理課程 教學(xué)改革 優(yōu)化知識結(jié)構(gòu) 加強實驗教學(xué) 綜合化教學(xué)模式

數(shù)字信號處理所涉及的內(nèi)容非常繁多、廣泛。其所應(yīng)用的數(shù)學(xué)工具涉及微積分、隨機過程、數(shù)值分析、復(fù)變函數(shù)和各種變換等;其理論基礎(chǔ)包括網(wǎng)絡(luò)理論、信號與系統(tǒng)、神經(jīng)網(wǎng)絡(luò)等;其應(yīng)用領(lǐng)域包括通信、雷達、人工智能、模式識別、航空航天、圖像處理、語音處理等。在GSM手機中應(yīng)用數(shù)字信號處理技術(shù)可將語音壓縮至13kps;在語音信箱、留言電話方面也均可以采用數(shù)字信號處理技術(shù)。

學(xué)生在學(xué)習(xí)數(shù)字信號處理課程時,常常會覺得枯燥乏味,不僅覺得概念抽象,而且對其中的分析方法與基本理論不能很好地理解與掌握。為了有利于學(xué)生系統(tǒng)地理解和掌握課程中的基本內(nèi)容,充分鍛煉實驗的應(yīng)用能力,我對數(shù)字信號處理課程的教學(xué)進行了針對性的改革與探討。

1.優(yōu)化知識結(jié)構(gòu)

數(shù)字信號處理課程中知識點比較多,數(shù)學(xué)推導(dǎo)十分復(fù)雜。我通過對本門課程進行深入研究,類比各知識點,發(fā)現(xiàn)有一條線路貫穿于課程之中,只要在課程教學(xué)中把握好這條線路,復(fù)雜的數(shù)學(xué)推導(dǎo)將會變得清晰,容易識記。我將該課程優(yōu)化成兩大模塊:變換域的知識結(jié)構(gòu)和數(shù)字濾波器的知識結(jié)構(gòu)。

1.1變換域的知識結(jié)構(gòu)

變換域的知識結(jié)構(gòu)是該課程的第一大模塊結(jié)構(gòu)。先引入時域離散信號與系統(tǒng),通過時域采樣定理對模擬信號進行采樣得到離散時間信號(序列)內(nèi)容進行展開討論,對于幾種典型序列和時域離散系統(tǒng)性質(zhì):線性、時不變、因果性和穩(wěn)定性進行重點介紹。其次講述DTFT、DFS、ZT(IZT)、DFT變換的定義、性質(zhì)和定理。其中每個變換都遵循嚴密的數(shù)學(xué)推理,都圍繞著變換的定義、性質(zhì)和定理展開內(nèi)容講解。在教學(xué)過程中除了詳細講解各個知識點之外,還要建立之間的聯(lián)系,歸納出變換之間的聯(lián)系如圖1所示。在建立聯(lián)系時不僅要從數(shù)學(xué)公式上進行變換證明,而且要用物理意義進行直觀的講解,使學(xué)生能夠完全掌握。例如DTFT是單位圓上的Z變換,DFT是DTFT的等間隔采樣,等等。

1.2數(shù)字濾波器的知識結(jié)構(gòu)

數(shù)字濾波器的知識結(jié)構(gòu)是該課程的第二大模塊結(jié)構(gòu),其主要圍繞數(shù)字濾波器網(wǎng)絡(luò)結(jié)構(gòu)及其設(shè)計方法展開討論。數(shù)字濾波器的網(wǎng)絡(luò)結(jié)構(gòu)分為:IIR網(wǎng)絡(luò)結(jié)構(gòu)和FIR網(wǎng)絡(luò)結(jié)構(gòu)。通過狀態(tài)變量分析法對網(wǎng)絡(luò)結(jié)構(gòu)進行分析,確定狀態(tài)變量,求出狀態(tài)方程和輸出方程。應(yīng)用脈沖響應(yīng)不變法和雙線性變換法設(shè)計低通、帶通IIR數(shù)字濾波器,分析理解兩種具體方法的特點和區(qū)別,與分別設(shè)計的數(shù)字濾波器的頻域特性。窗函數(shù)法和頻率采樣法是設(shè)計FIR濾波器基本方法,通過實驗使學(xué)生熟悉線性相位FIR濾波器的幅頻特性和相頻特性,了解不同窗函數(shù)對濾波器性能的影響。數(shù)字濾波器的設(shè)計和網(wǎng)絡(luò)結(jié)構(gòu)分析如圖2所示。

2.加強實驗教學(xué)

數(shù)字信號處理課程中的理論和結(jié)論大都是經(jīng)過數(shù)學(xué)推導(dǎo)得來的,比較抽象,也較難理解。MATLAB語言對諸如離散線性卷積、循環(huán)卷積、抽樣定理、對Z變換進行等間隔采樣實現(xiàn)DFT、數(shù)字濾波器設(shè)計等一系列問題都可通過圖形建模使之可視化。實驗教學(xué)平臺可以選擇MATLAB軟件平臺和DSP硬件平臺,MATLAB軟件平臺主要用來演示數(shù)字信號處理的概念、性質(zhì)和原理。例如序列的傅立葉變換、Z變換、離散傅立葉變換的概念和性質(zhì)等;硬件平臺主要實現(xiàn)數(shù)字信號處理的算法,例如卷積、FFT算法、FIR濾波器和IIR濾波器設(shè)計方法等。

2.1基于MATLAB基礎(chǔ)理論實驗

數(shù)字信號處理課程具有理論性強和應(yīng)用性強等特點,在教學(xué)中教師要加強理論教學(xué)。實驗教學(xué)的設(shè)計可以更好地讓學(xué)生理解理論教學(xué)內(nèi)容,具有啟發(fā)性,能培養(yǎng)學(xué)生的思考能力和科研能力。

針對理論知識點的內(nèi)容,可將實驗各部分的內(nèi)容劃為:系統(tǒng)響應(yīng)及系統(tǒng)穩(wěn)定性;時域采樣與頻域采樣;用FFT對信號作頻譜分析;IIR數(shù)字濾波器設(shè)計及軟件實現(xiàn);FIR數(shù)字濾波器設(shè)計與軟件實現(xiàn)。對于所涉及的實驗教學(xué)內(nèi)容,要突出強調(diào)對實驗結(jié)果的“物理意義”的理解,使知識點覆蓋基本完整且重點突出。

2.2綜合性課程設(shè)計

在基礎(chǔ)理論實驗的基礎(chǔ)上,為了充分調(diào)動學(xué)生主動學(xué)習(xí)的積極性,提高學(xué)生鉆研科學(xué)的興趣,綜合性課程設(shè)計是非常有必要的。其可以充分發(fā)揮學(xué)生的主觀能動性,更有利于培養(yǎng)他們獨立思考、善于創(chuàng)造、綜合運用知識的能力。

根據(jù)數(shù)字信號處理在雙音多頻撥號系統(tǒng)中的實際應(yīng)用,我進行了綜合性、設(shè)計性實驗的探討。雙音多頻(Dual Tone Multi Frequency,DTMF)信號是音頻電話中的撥號信號。DTMF信號系統(tǒng)是一個典型的小型信號處理系統(tǒng),它用數(shù)字方法產(chǎn)生模擬信號并進行傳輸,其中還用到了D/A變換器;在接收端用A/D變換器將其轉(zhuǎn)換成數(shù)字信號,并進行數(shù)字信號處理與識別。

3.綜合化教學(xué)模式

由于數(shù)字信號處理的DTFT、DFS、ZT(IZT)、DFT變換的定義、性質(zhì)和定理和數(shù)字濾波器設(shè)計的內(nèi)容涉及的公式繁多、概念抽象,在學(xué)習(xí)過程中,學(xué)生對其都具有犯難情緒,因而在授課中需要采用形象化教學(xué)方法、多樣化教學(xué)手段、創(chuàng)造自主化學(xué)習(xí)情境,提高學(xué)生的學(xué)習(xí)興趣,幫助學(xué)生理解公式的物理意義,便于對知識的識記和應(yīng)用。

3.1形象化教學(xué)方法

數(shù)字信號處理課程中大量的抽象概念都是用繁瑣的公式來描述,其推導(dǎo)過程也相當復(fù)雜。在實際的教學(xué)中,教師需要采用課程板書的形式,讓學(xué)生跟上你的思路一步一步去解析公式,完全細化每一個變換的來源。而不是急于把最新的知識、最新的技術(shù)一股腦地塞給學(xué)生。教師在教學(xué)中,必須從公式所代表的具體意義去理解公式,注重物理意義的表達,也要相信學(xué)生在打好基礎(chǔ)后,能舉一反三,學(xué)一知十,例如:X(k)=X(e)|k=0,1,…,N-1,說明X(k)為x(n)的傅里葉變換X(e)在區(qū)間[0,2π]上的N點等間隔采樣。在講解相關(guān)抽象化的知識點時,教師可采用繪制波形圖或框圖的方法將抽象概念形象化,用直觀圖形進行解讀公式的意義。在教學(xué)中,教師可采取合理應(yīng)用形象化的方法,培養(yǎng)學(xué)生看到公式可以聯(lián)想到公式的物理意義,突破公式難懂難記的問題。

3.2多樣化教學(xué)手段

在習(xí)題課和一些基本原理、基本方法的推導(dǎo)和證明中,教師要采用課堂板書形式,解答思路清晰,在板書的過程中,也要留給學(xué)生足夠的時間進行領(lǐng)會。

對于難以理解的抽象概念,需要用形象化的圖形來進行解析,采用多媒體教學(xué)手段,可以節(jié)約大量的板書時間,可以化抽象為形象,化枯燥為生動,增加課堂信息量,使學(xué)生把重點放到加深對抽象概念的理解上。同時,PPT要有一定的吸引力,比如適當?shù)卣迟N一些圖片性內(nèi)容,遠比文字要形象和生動,還可以粘貼一些調(diào)節(jié)氣氛的有意思圖片,但不可太花哨,速度要放慢,講一行放一行,切不可地所有的一次都放出來,否則容易誤導(dǎo)學(xué)生去費勁地閱讀PPT上的文字。多媒體教學(xué)手段與傳統(tǒng)的板書教學(xué)相融合,不但可以發(fā)揮多媒體手段信息量大、形象、直觀等優(yōu)勢,而且板書可以對多媒體的推導(dǎo)細節(jié)進行補充,放慢上課節(jié)奏,使教學(xué)邏輯更嚴密、交互性更強,其實際效果比單獨使用其中的一種都要好。

3.3自主化學(xué)習(xí)情境

在實際教學(xué)中,教師要站在學(xué)生的立場上,找到學(xué)習(xí)入門的最好切入點:結(jié)合課堂提問、作業(yè)布置、習(xí)題講解等手段,使學(xué)生達到基本的教學(xué)要求。適當?shù)靥釂?,可以檢驗學(xué)生學(xué)得怎么樣,將學(xué)生的狀況及時的反饋給老師,老師再適當?shù)卦诮虒W(xué)中作調(diào)整,將取得很好的教學(xué)效果,同時也可加強與學(xué)生的雙向交流,活躍課堂氣氛。

由于該門課程比較抽象,公式又相對繁瑣,單靠課堂講解學(xué)生當時可能聽得明白,但是課后若不加以鞏固,掌握情況也不會太理想,因此每次課后要給學(xué)生布置適量的作業(yè),通過批改作業(yè)來發(fā)現(xiàn)存在的問題并及時解決。

3.4完善化考試模式

本門課程的成績考核采取傳統(tǒng)模式,即由平時表現(xiàn)成績、期末筆試成績按比例綜合計算。這樣的考核方式簡單易于操作,這也是一些學(xué)生不重視實驗、不注重如何應(yīng)用所學(xué)知識解決實際問題的原因之一,結(jié)果造成理論聯(lián)系實際和解決實際問題的能力差。

完善化考試模式,增加上機考試,要求MATLAB上機考試,這能極大地強化學(xué)生的自主學(xué)習(xí)能力及動手實踐能力。

4.結(jié)語

我針對數(shù)字信號處理課程的特點,應(yīng)用知識的連貫性,建立了各個知識點之間的聯(lián)系,便于學(xué)生理解與聯(lián)想記憶。MATLAB的引入為數(shù)字信號處理教學(xué)提供了全新的方法,激發(fā)了學(xué)生的學(xué)習(xí)興趣,變被動學(xué)習(xí)為主動探索,加強了理論與實踐相結(jié)合,提高了綜合運用知識及解決實際問題的能力。采用了傳統(tǒng)板書和多媒體教學(xué)相結(jié)合的手段,提高了學(xué)生的學(xué)習(xí)興趣,做到了用中學(xué)、學(xué)中用,使學(xué)生大大增強了學(xué)習(xí)的興趣。

參考文獻:

[1]高西全,丁玉美.數(shù)字信號處理[M].陜西:西安電子科技大學(xué)出版社,2008.

[2]A?V?奧本海姆,R?W?謝弗.離散時間信號處理[M].西安:西安交通大學(xué)出版社,2001.

[3]姜恩華.數(shù)字信號處理課程“教與學(xué)”探索[J].淮北煤炭師范學(xué)院學(xué)報,2009,30,(3):78-81.

[4]王祥春.“數(shù)字信號處理”教學(xué)方法探討[J].科技創(chuàng)新導(dǎo)報,2010,16:248.

篇8

論文關(guān)鍵詞:圖像盲恢復(fù)現(xiàn)狀前景

論文摘要:當點擴展函數(shù)未知或不確知的情況下,從觀察到的退化圖像中恢復(fù)原始圖像的過程稱為圖像盲復(fù)原。近年來,圖像盲復(fù)原算法得到了廣泛的研究。本文在介紹了盲圖像恢復(fù)算法的現(xiàn)狀的基礎(chǔ)上進一步研究其的發(fā)展方向。

一、引言

圖像恢復(fù)是圖像處理中的一大領(lǐng)域,有著廣泛的應(yīng)用,正成為當前研究的熱點。圖像恢復(fù)的主要目的是使退化圖像經(jīng)過一定的加工處理,去掉退化因素,以最大的保真度恢復(fù)成原來的圖像。傳統(tǒng)的圖像恢復(fù)假設(shè)圖像的降質(zhì)模型是己知的。而許多情況下,圖像的降質(zhì)模型未知或具有較少的先驗知識,必須進行所謂的盲恢復(fù)。其重要性和艱巨性而成為一個研究熱點。目前所能獲取的觀測圖像是真實圖像經(jīng)過觀測系統(tǒng)成像的結(jié)果。由于觀測系統(tǒng)本身物理特性的限制,同時受觀測環(huán)境的影響,觀測圖像和真實圖像之間不可避免地存在著偏差和失真,稱觀測系統(tǒng)對真實圖像產(chǎn)生了降質(zhì)。圖像恢復(fù)的目的就是根據(jù)降質(zhì)的觀測圖像分析和計算得出真實圖像。

二、圖像盲恢復(fù)算法的現(xiàn)狀

總體來說,圖像盲復(fù)原方法主要分為以下兩類:一是首先利用真實圖像的特別特征估計PSF,然后借助估計得到的PSF,采用經(jīng)典的圖像復(fù)原方法進行圖像的復(fù)原。這類方法將PSF的估計與圖像的復(fù)原過程分為2個不同的過程,因而具有較少計算量的特點;二是PSF辨識和真實圖像估計相結(jié)合,同時辨識PSF和真實圖像。這類算法較為復(fù)雜,計算量較大。另外,對于點擴展函數(shù)也考慮了空間變化的復(fù)雜情況。針對目前的盲復(fù)原算法的現(xiàn)狀,根據(jù)退化模型的特點,重新將算法分為空間不變的單通道盲復(fù)原算法、空間不變多通道盲復(fù)原算法和空間變化圖像盲復(fù)原算法3類。

(一)單通道空間不變圖像盲復(fù)原算法

在這類算法中,最為常用的是參數(shù)法和迭代法。

1)參數(shù)法。所謂參數(shù)法,即模型參數(shù)法,就是將PSF和真實圖像用某一類模型加以描述,但模型的參數(shù)需要進行辨識。在參數(shù)法中,典型的有先驗?zāi):孀R法和ARMA參數(shù)估計法,前者先辨識PSF的模型參數(shù),后辨識真實圖像,屬于第1種類型的圖像盲復(fù)原算法,因而計算量較小;后者同時辨識PSF和真實圖像模型參數(shù),屬于第2種類型圖像盲復(fù)原算法。

2)迭代法。所謂的迭代法,不是通過建立模型而是通過算法的迭代過程,加上有關(guān)真實圖像和PSF的約束來同時辨識PSF和真實圖像的方法。迭代法是單通道

圖像盲復(fù)原算法中應(yīng)用最廣泛的一類算法,它不需建立模型,也不要求PSF為最小相位系統(tǒng),因而跟實際更為接近。在這類算法中,迭代盲復(fù)原算法(IBD),基于非負性和決策域的遞歸逆濾波器算法(NAR2RIF),基于高階統(tǒng)計特性的最小

熵算法等最為典型。

(二)多通道二維圖像盲復(fù)原

多通道二維圖像盲復(fù)原,這類方法將數(shù)字通訊領(lǐng)域應(yīng)用的一維多通道盲原分離算法擴展到二維情況并用于圖像的盲恢復(fù)。這類算法中有兩種代數(shù)方法,一種是先辨識模糊函數(shù),再采用常規(guī)的恢復(fù)算法進行復(fù)原;另一種是直接對逆濾波器進行估計。此類算法的優(yōu)點在于不需對初始圖像進行估計,也不存在穩(wěn)定性和收斂性問題,對圖像以及模糊函數(shù)的約束是松弛的,算法具有一般性。但是第1種算法要求采用復(fù)原算法具有收斂性;第2種算法對噪聲敏感。

(三)空間改變的圖像盲復(fù)原方法

在許多實際的應(yīng)用中,模糊往往是空間變化的,但由于處理工作的難度,目前的研究較少,基本有相關(guān)轉(zhuǎn)換恢復(fù)和直接法兩類。

相關(guān)轉(zhuǎn)換恢復(fù)的基本思想是區(qū)域分割,即將整幅圖像分為若干局部區(qū)域,然后假設(shè)在各個局部區(qū)域模糊是空間不變的,利用空間不變的圖像復(fù)原有關(guān)算法進行復(fù)原。這類方法都是基于窗口的模糊辨識技術(shù),圖像的估計取決于窗口的大小,由于模糊參數(shù)是連續(xù)變化的,在范圍較大時空間不變的假設(shè)是不成立的,因而模糊的估計精度較差,而且這種方法只能針對部分空間變化的模糊進行處理,缺乏通用性;其次在區(qū)域的邊上存在振鈴現(xiàn)象。

直接法的基本思想是直接對圖像進行處理。如采用簡化的二維遞推卡爾曼濾波器進行圖像模型和模糊模型的直接轉(zhuǎn)換方法,其缺點是只能針對有限的模型,而且模型數(shù)增加,計算量會顯著增大;采用共軛梯度迭代算法,但只見到一個31×31的文本圖像處理的結(jié)果報道,對于大圖像處理效果尚需進一步的研究;將空間變化圖像系統(tǒng)建立成馬爾苛夫隨機模型,對復(fù)原過程,采用模擬退火算法進行最大后驗估計的方法,這種方法避免了圖像的窗口化,并能克服模糊參數(shù)不連續(xù)性造成的影響,但這種方法只能局限于將模糊過程建立成單參數(shù)的馬爾苛夫隨機模型的情況,而且計算量也較大。

三、圖像盲恢復(fù)的應(yīng)用前景

(1)現(xiàn)有算法的改進以及新的算法研究?,F(xiàn)有各種算法還存在許多不足,有必要對算法進一步改進。如IBD算法中,如何選擇初始條件才能保證算法的收斂;如何選擇算法終止條件才能保證恢復(fù)的質(zhì)量;如何選擇濾波器中的噪聲參數(shù)才能減少噪聲的影響。又如NAR2RIF算法中,如何進一步解決噪聲敏感問題,支持域的確定以及如何將算法擴展到非均勻背景的情況等。提出新的算法更好地解決圖像盲復(fù)原問題,也是今后研究的熱點。

(2)基于非線性退化模型的圖像盲復(fù)原算法。在實際應(yīng)用中,嚴格來講,所有的退化模型都是非線性的。對模型采用線性化的方法進行近似處理,雖然算法簡單,但對非線性嚴重的情況處理效果并不理想?;诙囗検揭约吧窠?jīng)網(wǎng)絡(luò)兩種參數(shù)模型處理非線性信號盲分離算法,算法擴展到二維圖像情況需要進一步研究。研究基于非線性退化模型的圖像盲復(fù)原算法也是下一步研究方向之一。

(3)去噪處理算法研究。加性噪聲的存在,使圖像的復(fù)原問題變成了一個病態(tài)問題,而且由于一般假設(shè)只知道噪聲的統(tǒng)計特性,因此要從退化圖像中完全去除噪聲是不可能的。另外,由于噪聲的存在,恢復(fù)的效果并不理想,結(jié)合降噪的圖像盲恢復(fù)的算法研究有很現(xiàn)實的意義,這方面也進行了部分工作。為克服噪聲的影響,一般采用先進行降噪,后進行復(fù)原;二是將降噪和復(fù)原同時進行這兩類方法。目前,大多數(shù)算法中將噪聲描述成高斯噪聲進行研究,在實際應(yīng)用時有較大局限性。對于非高斯情況的研究采用基于噪聲的高階統(tǒng)計特性的去噪算法研究也是很重要的研究方向,也可采用其他類型的方法進行降噪,利用自組織映射的非線性獨立組件分析方法進行圖像降噪處理算法。

篇9

關(guān)鍵詞:化學(xué)計量 化學(xué)分析 重要作用

隨著科學(xué)技術(shù)的發(fā)展,化學(xué)計量在日常生活中發(fā)揮了越來越的作用?;瘜W(xué)計量學(xué)包括了整個化學(xué)量測的過程,主要有采樣理論、實驗設(shè)計、實驗條件、選擇和優(yōu)化、數(shù)據(jù)分析以及單變量和多變量信號的處理,這些都滲透了化學(xué)計量的應(yīng)用?;瘜W(xué)計量學(xué)主要是對化學(xué)的一些測量數(shù)據(jù)進行分析和處理,通過對測量程序的設(shè)計和選擇,應(yīng)用實驗方法,將這些測量數(shù)據(jù)進行全面的解析,從而獲取更多的化學(xué)信息?;瘜W(xué)計量學(xué)的應(yīng)用,對化學(xué)實驗設(shè)計、信號解析、化學(xué)分類等都起到了很大程度的作用,打破了我國傳統(tǒng)的化學(xué)研究方法困難復(fù)雜的局面。

1、化學(xué)計量學(xué)對化學(xué)測量的作用

隨著國家的經(jīng)濟和技術(shù)的不斷發(fā)展,越來越多的化學(xué)儀器和化學(xué)技術(shù)被不斷的開發(fā)和應(yīng)用,分析化學(xué)的體系也不斷得到健全和完善,分析測試工作也開始向自動化、儀器化以及計算機化的方向進行發(fā)展。在目前,分析儀器的應(yīng)用為分析工作的研究提供了大量的測量數(shù)據(jù),具有較高的準確性和可靠性。如何將這些復(fù)雜的化學(xué)測量數(shù)據(jù)進行科學(xué)解析,也成為了分析工作者的難題之一。

化學(xué)計量在食品安全的實驗室測量過程同樣中發(fā)揮了重要作用,例如對奶粉中三氯氰胺含量的檢測,對食品中蘇丹紅的檢測等?;瘜W(xué)計量方法的應(yīng)用,使得這些食品中蘊含的有效信息能夠完整地被挖掘,使數(shù)據(jù)的利用率得到了很大的提高?;瘜W(xué)計量學(xué)的應(yīng)用,給化學(xué)測量提供了一套有效的科學(xué)方法,為化學(xué)領(lǐng)域的研究和發(fā)展注入了新的動力。

2、化學(xué)計量學(xué)在化學(xué)分析中的應(yīng)用

化學(xué)計量學(xué)與化學(xué)分析有著密切的聯(lián)系,化學(xué)計量學(xué)主要由化學(xué)分析的信息理論基礎(chǔ)、化學(xué)測量過程的試驗設(shè)計和優(yōu)化、化學(xué)測量數(shù)據(jù)的多元校正和多元分辯的定性定量解析、化學(xué)采樣理論與方法等,內(nèi)容涉及的研究和技術(shù)十分廣泛,應(yīng)用的領(lǐng)域范圍也較大。

2.1 化學(xué)定量構(gòu)效關(guān)系的應(yīng)用

化學(xué)定量構(gòu)效關(guān)系是化學(xué)科目中一個基本問題,主要是指從物質(zhì)的化學(xué)成分與構(gòu)成對其化學(xué)特性進行分析,是理論化學(xué)中一個十分重要的學(xué)習(xí)內(nèi)容和研究目標。在化學(xué)定量構(gòu)效關(guān)系的研究,主要通過圖論和數(shù)值方法對化合物分子進行分析,將其結(jié)果與實際測量化合物的特性有效結(jié)合,對其化學(xué)特性進行明確的特性定義。在目前的研究發(fā)展中,化學(xué)定量構(gòu)效關(guān)系在分子力學(xué)的尋優(yōu)中引入了最優(yōu)算法,對最佳先導(dǎo)化合物的尋找進行了有效的指導(dǎo),得到了廣泛的應(yīng)用。

2.2 模式識別法的應(yīng)用

模式識別法主要是通過對化學(xué)量測數(shù)據(jù)矩陣的分析,結(jié)合某種性質(zhì)對樣本進行有效的分類和選取。模式識別法主要包括了線性判別分析法、SMCA法以及K-最鄰近法。模式識別法的應(yīng)用和研究,為化學(xué)研究的決策和優(yōu)化提供了價值性信息,為一些較為困難的實驗研究提供了新的思路方向。

2.3波譜化學(xué)的應(yīng)用

如何通過現(xiàn)有的波譜數(shù)據(jù)庫,對定性定量進行迅速分析,這一直是一個很大的難題。智能數(shù)據(jù)庫和化學(xué)計量學(xué)的應(yīng)用,使定性定量分析工作有了新的發(fā)展。濾波、平滑、變換、卷積等技術(shù)的不斷推廣和應(yīng)用,為化學(xué)分析工作提供了新的解析途徑,同時也提供了無需分離即可對存在互向干擾關(guān)系的共存物種進行測定。波譜數(shù)據(jù)庫和專家系統(tǒng)也在一些大學(xué)和研究單位得到了廣泛的應(yīng)用。

2.4 多元校正分析法的應(yīng)用

多元分析法的不斷發(fā)展和完善,其研究對象也日益復(fù)雜,因此需要分析工作者要準確和迅速的提供定性定量,并提供結(jié)構(gòu)分析的結(jié)果。多元校正法主要是針對了現(xiàn)代的分析儀器的一些量測數(shù)據(jù),通過這些數(shù)據(jù)的提供從而進行解析,是一種數(shù)學(xué)統(tǒng)計方法。在目前,多元分析法的靈敏度、檢測限、緊密度、準確性等指標被不斷研究和分析,指標也經(jīng)過了不斷的優(yōu)化和完善,分析儀器的功能也因此得到了更大的擴展空間,其分析方法的有效性和實用性也得到了更多人的認可。在對正交設(shè)計、因子設(shè)計、析因設(shè)計以及均勻設(shè)計等方法的基礎(chǔ)上,能夠有效研究在多種因素條件下的影響和協(xié)同作用,進一步提高了分析選擇性,將其應(yīng)用范圍進行了擴展。

2.4.1 無機離子的測定

分析化學(xué)中主成分分析、聚類分析等數(shù)學(xué)多元分析方法的應(yīng)用,能夠?qū)⒎治鰧ο蟮臏y量數(shù)據(jù)結(jié)構(gòu)進行簡化,有效減少了測量數(shù)據(jù)的復(fù)雜程度,通過將分析對象和變量進行分類和分組,對變量之間的關(guān)系進行分析。在化學(xué)計量學(xué)中,中線性回歸分析、曲線擬合、信號轉(zhuǎn)換等多種分析方法不斷得到應(yīng)用,對無機離子的測定和分析起到了巨大的作用。例如,我國已經(jīng)通過正交回歸極譜法,對錮和錫同時進行了分析,另外通過回歸正交極譜法,還對鋅、鈷、鎳的組成成分進行了測定。

2.4.2 有機電分析化學(xué)中的應(yīng)用

生物學(xué)、藥物學(xué)、環(huán)境學(xué)以及生命學(xué)不斷發(fā)展,化學(xué)分析工作者對于復(fù)雜的有機混合物需要迅速做出定性定量的分析。多元校正法在目前已經(jīng)廣泛應(yīng)用在對農(nóng)藥殘留量、抗氧化劑等的分析中。

3、如何規(guī)范管理化學(xué)計量器具

新型的化學(xué)計量器具在購買引入后,需要經(jīng)過相關(guān)的校準和檢定階段,合格之后才可以驗收入庫。計量人員還需要對儀器進行編號、履歷卡的建立以及臺賬登記等。相關(guān)人員在領(lǐng)取儀器時,需要填寫相關(guān)的申請單,經(jīng)過計量主管批準后才可領(lǐng)取使用,最后需要在臺賬上進行簽字。另外,計量器在存放過程中,需要進行定期的檢定,確保儀器的使用狀態(tài)良好。對于一些長期不需要使用的計量儀器,則需要進行封存,辦理相關(guān)的封存手續(xù)。當儀器需要重新使用時,則需要辦理啟封手續(xù),并進行相關(guān)的檢定程序,確認合格才可進行使用。

參考文獻:

[1]倪永年,等. 化學(xué)計量學(xué)在分析化學(xué)中的應(yīng)用[M]. 北京: 科學(xué)出版社, 2004: 1-120.

篇10

【摘要】 為了實現(xiàn)人體器官的三維重建,如何準確、有效地提取二維醫(yī)學(xué)圖像的邊緣成了首要解決的問題。我們提出一種新的圖像邊緣提取方法,該方法先將原始CT圖像二值化,然后利用數(shù)學(xué)形態(tài)運算對二值化圖像進行預(yù)處理,最后利用Canny算子提取圖像邊緣。通過腎臟CT圖像邊緣提取結(jié)果表明,該方法簡單、高效、性能優(yōu)越。

【關(guān)鍵詞】 CT圖像;邊緣提?。粩?shù)學(xué)形態(tài)學(xué);Canny算子

Research on the Edge Extraction of CT ImageZHANG Xiaoping,ZHU Zhisong,WANG Junze

(Nantong Univirsity, Nantong 226019, China)

Abstract:To reconstruct the body organs in 3-D, how to extract the edges from 2-D medical images accurately and effectively has benen the primarily problem. Therefore, a new method of edge extraction was introduced in this paper. The original CT image was binarized firstly and then preprocessed by mathematical morphology operating. Finally, the image edge was extracted by the Canny algorithm. The results of kidney CT image edge extraction show that the method is simple, efficient and superior performance.

Key words:CT image;Edge extraction;Mathematical morphology;Canny algorithm

1 引 言

隨著計算機技術(shù)、CT(計算機斷層掃描)、MRI(核磁共振)等醫(yī)學(xué)影像技術(shù)的不斷發(fā)展,虛擬現(xiàn)實技術(shù)也越來越多地應(yīng)用到現(xiàn)代醫(yī)療領(lǐng)域。利用計算機圖像處理和數(shù)據(jù)可視化技術(shù),根據(jù)醫(yī)學(xué)影像設(shè)備提供的二維斷層圖像,進行人體器官的三維重建已是現(xiàn)代醫(yī)學(xué)重要發(fā)展方向之一。腎臟疾病的外科手術(shù)是泌尿外科中的一個重點和難點,因此,根據(jù)CT二維圖像重構(gòu)腎臟及其周圍結(jié)構(gòu)的三維模型,有助于醫(yī)生選擇最佳手術(shù)路線、減少手術(shù)損傷、提高手術(shù)成功率[1]。CT二維圖像的邊緣提取作為器官三維重構(gòu)的第一步,一直受到國內(nèi)外學(xué)者的關(guān)注,提出了眾多的邊緣檢測算法,如小波變換法、神經(jīng)網(wǎng)絡(luò)法、模糊技術(shù)法等[2]。近幾年,隨著數(shù)學(xué)形態(tài)學(xué)理論的不斷完善與發(fā)展,數(shù)學(xué)形態(tài)學(xué)在圖像邊緣檢測中得到了廣泛的應(yīng)用[3-5]。本研究正是在數(shù)學(xué)形態(tài)學(xué)的基礎(chǔ)上,結(jié)合Canny算子,以腎臟為例,進行了CT圖像的邊緣提取。

2 數(shù)學(xué)形態(tài)學(xué)在圖像預(yù)處理中的運用

數(shù)學(xué)形態(tài)學(xué)是一門新興的、以形態(tài)為基礎(chǔ)對圖像進行分析的學(xué)科。它利用具有一定結(jié)構(gòu)和特征的結(jié)構(gòu)元素對圖像進行匹配,以實現(xiàn)對圖像的分析和識別,在去除噪聲、邊緣檢測等圖像預(yù)處理問題中有著明顯的優(yōu)勢[6]。數(shù)學(xué)形態(tài)學(xué)定義了兩種基本變換,即膨脹(Dilation)和腐蝕(Erision)。首先介紹其定義[7]:設(shè)F是原始圖像,B是結(jié)構(gòu)元素,膨脹運算定義為:

D(F)=FB={(x,y)/Bxy∩F≠Φ}(1)

即B對F膨脹產(chǎn)生的二值圖像D(F)是由這樣的點(x,y)組成的集合,若圖B的原點位移至(x,y),那么它與F的交集非空。

腐蝕運算定義為:

E(F)=FΘB={(x,y)/BxyF}(2)

即B對F腐蝕產(chǎn)生的二值圖像E(F)是由這樣的點(x,y)組成的集合,若圖B的原點位移至(x,y),那么B將完全包含于F。

由上述兩種基本運算可以復(fù)合得到開啟、閉合變換。

開啟是對圖像先腐蝕后膨脹的過程,F(xiàn)用B來開啟,其數(shù)學(xué)表達式可記為:

F·B=(FΘB)B(3)

閉合是對圖像先膨脹后腐蝕的過程,F(xiàn)用B來閉合,其數(shù)學(xué)表達式可記為:

F·B=(FB)ΘB(4)

上述4種運算中,膨脹可以填充圖像中的小孔及圖像邊緣上小的凹陷部分;腐蝕可以消除圖像中細小的成分;開啟則具有消除細小物體、在纖細處分離物體和平滑較大物體邊界的作用;閉合則具有填充物體內(nèi)細小孔洞、連接臨近物體和平滑邊界的作用。

利用數(shù)學(xué)形態(tài)學(xué)進行圖像預(yù)處理時,選擇簡單、表現(xiàn)力強的結(jié)構(gòu)元素是關(guān)鍵,是形態(tài)變換中最重要的參數(shù);其次,還要綜合考慮目標體的清晰度和噪聲的大小來選取結(jié)構(gòu)元素的大?。?]。一般目標體輪廓不清晰時,選擇較小的結(jié)構(gòu)元素;噪聲顆粒較大時,選擇較大的結(jié)構(gòu)元素。

3 Canny算子的邊緣檢測原理

經(jīng)過數(shù)學(xué)形態(tài)變換之后,圖像的邊緣將變得清晰、突出,此時,圖像的邊界信息可以被方便地提取出來。傳統(tǒng)的算法有Sobel、 Prowitt 、Robert、Canny算子等[9]。在眾多的算子中,Canny算子因其具有高信噪比、高定位精度及單邊緣響應(yīng)等優(yōu)良性能[10],在許多圖像處理領(lǐng)域得到應(yīng)用。本研究也正是采用該算法提取腎臟CT圖像邊緣。

Canny算子的基本思想是采用二維高斯函數(shù)的任意方向上的一階方向?qū)?shù)為噪聲濾波器,通過與圖像卷積進行濾波,然后對濾波后的圖像尋找局部梯度最大值,以此來確定圖像邊緣[11]。其數(shù)學(xué)描述如下:

3.1 用高斯濾波器平滑圖像

二維高斯濾波函數(shù)為:

G(x,y)=12πσ2exp(-x2+y2〖〗2σ2)(5)

在某一方向n上G(x, y)的一階導(dǎo)數(shù)為:

Gn=Gn=nG(6)

式6中n是方向矢量,n=cosθ

sinθ,

G是梯度矢量,G=Gx

Gy。

將圖像{F|f(x,y)}與Gn 作卷積,改變n的方向,Gn×f(x,y)取得最大值時的n,就是正交于檢測邊緣的方向。

3.2 梯度的幅值和方向計算

用一階偏導(dǎo)的有限差分來計算梯度的幅值和方向。

Ex=Gx×f(x,y) Ey=Gy×f(x,y)

A(x,y)=Ex2+Ey2 Φ=Arctan(ExEy)(7)

A(x,y)反映了圖像(x,y)點處的邊緣強度,Φ是圖像(x,y)點處的法向矢量。

3.3 對梯度幅值進行非極大值抑制

為確定圖像邊緣,必須保留局部梯度最大的點,而抑制非極大值。若圖像F上(x,y)點處的梯度幅值A(chǔ)(x,y)小于沿著梯度線方向上的相鄰像素點的邊緣強度,則認為該點為非邊緣點,將A(x,y)置為0。

3.4 用雙閾值法檢測和連接邊緣

設(shè)定兩個閾值t1和t2(t2>t1)。凡邊緣強度>t2者,則一定是邊緣點;凡邊緣強度t2的點,若有,則補為邊緣點,若沒有,則不是邊緣點。用t1、t2兩個閾值對非極大值抑制圖像進行雙閾值化,可得兩個檢測結(jié)果,分別記為T1和T2。圖像T2閾值較高,所以噪聲較少,但會造成邊緣信息的損失;圖像T1閾值較低,則保留了較多信息。于是以圖像T2為基礎(chǔ),以圖像T1為補充,連接圖像的邊緣。

由此可見,Canny算子是既能去除噪聲又能保留邊緣特性的邊緣檢測一階微分算法的最佳方法。

4 應(yīng)用實例

本研究在Matlab6.5軟件平臺上,以某醫(yī)院一患者的腎臟CT斷層圖像為例,提取了其中右腎的邊緣輪廓,具體實施步驟如下:

4.1 圖像二值化

CT圖像是灰度圖像,為了更好的形態(tài)運算和邊緣檢測,首先進行二值化處理,即把灰度圖像轉(zhuǎn)變成由0、1 組成的矩陣所表示的圖像。圖1為原始CT圖像,圖2是二值化圖像。在本次實驗中,二值化閾值為0.8。實驗過程中發(fā)現(xiàn),該方法簡單、高效,且丟失的信息也很少。

4.2 數(shù)學(xué)形態(tài)學(xué)處理

由圖2可見,圖像存在著一些空腔、毛刺、邊緣凹陷等現(xiàn)象,要進行邊緣檢測,還需經(jīng)過進一步處理,通過本研究介紹的數(shù)學(xué)形態(tài)運算即可完成。

所求邊緣是腎臟外圍輪廓,首先需要填充圖像中的空腔和邊緣凹陷。對此,可采用imclose函數(shù)進行閉合運算,即進行先膨脹后腐蝕,其中結(jié)構(gòu)元素為5×5圓形結(jié)構(gòu)元素,結(jié)果見圖3。由圖3可見,經(jīng)過閉合運算后,圖像中還存在一些小短枝和孤立斑點,這些也必須剔除,否則,將影響邊緣提取效果。對此,可采用imopen函數(shù)進行開啟變換實現(xiàn),即先腐蝕后膨脹。針對小短枝和孤立斑點,無法用同一種結(jié)構(gòu)元素去剔除,所以必須分兩步:首先選用3×3矩形結(jié)構(gòu)元素執(zhí)行開啟變換,去除小短枝像素,結(jié)果見圖4;然后用3×3菱形結(jié)構(gòu)元素再次執(zhí)行開啟變換,去除孤立斑點,結(jié)果見圖5。

4.3 Canny算子提取邊緣

經(jīng)過上述處理,腎臟圖像邊緣已經(jīng)逐漸清晰、突出,此時利用Canny算子即可提取其邊界信息,如圖6所示,本次實驗中,邊緣強度閾值t1為0.0063,t2為0.0156 。圖6基本無失真地描述了邊界信息。提取圖6中各邊界點的坐標,即可獲得重構(gòu)的邊界圖形,見圖7。對腎臟各層CT圖像進行上述運算后,經(jīng)過插值處理,即可進行該器官的三維重構(gòu)。

5 結(jié)束語

本研究從實用性的角度出發(fā),闡述了利用數(shù)學(xué)形態(tài)學(xué)和Canny算子進行腎臟CT斷層圖像邊緣提取的方法和步驟。實驗證明該方法簡單、快速、精度高、適用性強,為醫(yī)學(xué)圖像的三維重建和虛擬手術(shù)技術(shù)的研究奠定了良好的基礎(chǔ)。

參考文獻

[1]王洛夫, 張紹祥,江軍,等.腎臟及其周圍結(jié)構(gòu)的三維可視化研究[J].第三軍醫(yī)大學(xué)學(xué)報,2004,26 ( 6 ): 537-539.

[2]張小琳.圖像邊緣檢測技術(shù)綜述[J].高能量密度物理,2007,(1):37-40.

[3]Bai X Z, Zhou F. Edge detection based on mathematicalmorphology and iterative thresholding[A].International conference on computational intelligence and Security[C]. NY: IEEE, 2006.1849-1852.

[4]Serra J. Image analysis and mathematical morphology[M].New York: Academic Press,1982.

[5]Huang C-P,Wang R-Z.An intergrated edge detection method using mathematical morphology[J].Pattern Recgnition and Image Analysis,2006,16(3):406-412.

[6]陳虎,王守尊,周朝輝.基于數(shù)學(xué)形態(tài)學(xué)的圖像邊緣檢測方法研究[J].工程圖學(xué)學(xué)報,2004,(2):112-115.

[7]崔屹.圖像處理與分析-數(shù)學(xué)形態(tài)學(xué)方法及應(yīng)用 [M].北京:科學(xué)出版社,2000.

[8]Li Z H,Yang Y P,Jiang W.Multi-scale morphologictracking approach for edge detection[A].The 4th International conference on image and graphics[C]. NY: IEEE,2007.358-362.

[9]馬艷, 張治輝.幾種邊緣檢測算子的比較[J].工礦自動化,2004(2): 54-56.