計算機視覺研究領(lǐng)域范文

時間:2024-01-12 17:49:30

導(dǎo)語:如何才能寫好一篇計算機視覺研究領(lǐng)域,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

篇1

Abstract: This paper puts forward the camera calibration method in computer vision, through analysis of principle of computer vision, and analyzes the application of camera calibration methods in computer vision.

關(guān)鍵詞: 計算機;視覺;攝像機;定標(biāo)

Key words: computer;visual;camera;scaling

中圖分類號:TP391.4 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2013)24-0193-02

0 引言

在計算機技術(shù)快速發(fā)展的今天,人們越來越依賴于計算機,計算機在人們的生活工作中占有重要的地位。計算機中的各種應(yīng)用層出不窮,廣泛應(yīng)用在各個領(lǐng)域,計算機視覺在攝像中的應(yīng)用為攝像機定標(biāo)方法提供了巨大的參考價值。由于人們對攝像機拍攝效果的要求,使得攝像機在不斷改革更新,攝像機的定標(biāo)方法是攝像機研究領(lǐng)域備受關(guān)注的話題。計算機視覺中攝像機的定標(biāo)方法是攝像機研究領(lǐng)域所推崇的,它受到了研究人員的高度重視。計算機視覺中攝像機的定標(biāo)方法呈現(xiàn)出了高質(zhì)量的攝像效果,極大地滿足了人們對攝像機攝像效果的要求。

1 計算機視覺投影原理

計算機視覺投影原理是利用光的折射現(xiàn)象,把視覺中呈現(xiàn)的影像投射到攝影機的屏幕上,形成了固定的圖像。在計算機視覺中攝影機的成像原理就是利用光的感應(yīng),通過對攝像機的焦距進行調(diào)整,確定拍攝目標(biāo)在攝像機鏡頭中的位置,然后利用光的折射形成固定的圖像。在進行攝像時調(diào)整焦距是非常關(guān)鍵的,焦距就是鏡頭與目標(biāo)之間的距離,這兩者距離的遠(yuǎn)近決定了攝像的效果。如果焦距太遠(yuǎn)的話,目標(biāo)成像就會非常小甚至是模糊。如果焦距太近的話,目標(biāo)成像會很大也會導(dǎo)致無法看清圖像,所以調(diào)整焦距是非常必要的,只有調(diào)好了焦距才會形成高質(zhì)量的圖像。

2 計算機視覺中的攝像機定標(biāo)方法

2.1 三維立體定標(biāo)法 攝像機的成像往往都是三維立體的,把圖形通過每個立體面詳細(xì)的表現(xiàn)出來,以達(dá)到完美的效果。要想達(dá)到三維立體的效果在對攝像目標(biāo)的位置進行確定時,就要找出目標(biāo)的三維坐標(biāo)點,以便接下來的攝像工作可以順利進行。然后在圖像投影中找到對應(yīng)的三維坐標(biāo),這一步?jīng)Q定了整個攝像過程的設(shè)計方案。最后確定目標(biāo)在攝影鏡頭中的實際三維坐標(biāo),根據(jù)鏡頭中目標(biāo)的實際三維坐標(biāo)形成具體的圖像。三維立體定標(biāo)方法的操作原理就是把目標(biāo)的三維投影進行分步成像,和實際成像效果相聯(lián)系,形成鏡頭中具體的三維圖像。在計算機視覺中把三維成像圖進行處理,對三維定標(biāo)的參數(shù)進行分析,找出最優(yōu)的三維成像方法,使攝像機呈現(xiàn)出高質(zhì)量的攝像效果。

2.2 平面定標(biāo)法 平面定標(biāo)法就是利用多個成像平面對目標(biāo)的位置進行分析,選擇合適的成像平面對目標(biāo)進行位置的確定。每個平面的成像都是不同的,由于每個平面的成像都是在運動的,所以應(yīng)該在攝像機與目標(biāo)之間的平面內(nèi)找到一個點,來分析目標(biāo)與攝像機之間的成像規(guī)律,然后根據(jù)這一規(guī)律對目標(biāo)進行定標(biāo),使攝像機中運動的目標(biāo)給人們帶來不一樣的感受。隨著目標(biāo)的不斷運動,攝像機與目標(biāo)之間平面內(nèi)的點會越來越多,對物體的定標(biāo)會受到這些點的影響,物體定標(biāo)的準(zhǔn)確度也越來越高,為攝像機定標(biāo)提供了可靠的信息支持,會減少攝像機定標(biāo)的成本,提高了攝像的經(jīng)濟效益。相比三維立體定標(biāo)法,平面定標(biāo)的精確度更高,定標(biāo)所用的時間相對較短,所以平面定標(biāo)法在攝像研究領(lǐng)域中值得推廣。

2.3 雙平面定標(biāo)法 所謂的雙平面定標(biāo)法就是利用鏡頭與目標(biāo)之間的兩個平面的成像點來進行定標(biāo),不需要成像平面上的光線通過平面中心,只要選取兩個平面之間任意兩點坐標(biāo)來對定標(biāo)參數(shù)進行計算分析,得出具體的成像圖。這種定標(biāo)方式不受平面中心的影響可以在任意點上成像,減少了定標(biāo)參數(shù)的數(shù)量,提高了定標(biāo)的工作效率。但是由于雙平面定標(biāo)法只是任意選取兩平面上的點,對定標(biāo)的精確度造成了一定的影響,使計算機對參數(shù)的運算缺少可靠的數(shù)據(jù)支持,一定程度上降低了攝像機的成像清晰度,使計算機視覺中攝像機的定標(biāo)精度存在一定的偏差,呈現(xiàn)出來的具體圖像質(zhì)量相對比較差。

2.4 直線兩點定標(biāo)法 在三維立體和平面定標(biāo)法的基礎(chǔ)上,又進一步研究了直線兩點定標(biāo)法,極大程度上滿足了人們對攝像效果的要求。直線兩點定標(biāo)法是利用定標(biāo)物與攝像機鏡頭之間的直線上的兩點進行定標(biāo)。然后通過計算機視覺對這兩點的坐標(biāo)參數(shù)進行分析,然后攝像機利用這些參數(shù)對攝像機的焦距進行調(diào)整,確定物體的具置。在三維立體和平面定標(biāo)的基礎(chǔ)上對計算機視覺程序進行改進升級,進一步提高對物體定標(biāo)的精確度。對原有定標(biāo)方法進行創(chuàng)新改進得出了直線兩點定標(biāo)法使定標(biāo)參數(shù)的數(shù)量大幅度的下降,節(jié)省了很多的人工成本,攝像機的清晰度也會大大提高。

2.5 透視變換焦距的定標(biāo)法 透視變換焦距定標(biāo)法是通過分析鏡頭與目標(biāo)之間的距離,不斷調(diào)整兩者之間的距離使鏡頭里呈現(xiàn)出來的圖形清晰為止,然后就將現(xiàn)在的目標(biāo)設(shè)置為定標(biāo)物。由于這種定標(biāo)方法不用去分析具體的定標(biāo)參數(shù)被人們廣泛的應(yīng)用。隨著科技的發(fā)展現(xiàn)在的攝像機都有自動調(diào)整焦距功能,不用人為的去調(diào)整焦距,使定標(biāo)物更快地呈現(xiàn)在鏡頭中,節(jié)省了大量的定標(biāo)時間,計算機的運算速度也加快了。但是這種定標(biāo)方法也存在一定的缺陷,在實際操作如果不考慮攝像環(huán)境以及攝像鏡頭的變化,定標(biāo)的精確度會存在一定的偏差,導(dǎo)致鏡頭中的定標(biāo)物成像不清晰。

3 計算機視覺中攝像機定標(biāo)方法的應(yīng)用

3.1 在計算機視覺中攝像機的主動定標(biāo) 計算機視覺中攝像機的定標(biāo)方法推動了計算機技術(shù)在攝像機中的廣泛應(yīng)用。計算機視覺中攝像機的主動定標(biāo)是計算機技術(shù)在攝像機中的顯著應(yīng)用。計算機技術(shù)使攝像機在定標(biāo)過程中主動尋找定標(biāo)物,使焦距和視角很好地配合,充分發(fā)揮計算機視覺在攝像機中的成像原理,把定標(biāo)方法合理地運用在攝像機主動定標(biāo)過程中,使攝像機的清晰度得到大幅度地提升。

3.2 分層次進行攝像機的定標(biāo) 隨著計算機技術(shù)在攝像機定標(biāo)中的不斷發(fā)展更新,攝影者喜歡分層次地進行定標(biāo),把自己的觀點融入到攝像機定標(biāo)過程中,用自己的思維對定標(biāo)參數(shù)進行分析,利用計算機視覺成像原理把定標(biāo)物直觀的反映在計算機上,以便更好的對定標(biāo)物進行分析,以其中一個定標(biāo)物的成像平面來確定定標(biāo)物的具體成像圖,使攝像機鏡頭中的定標(biāo)物圖像可以更清晰。這種分層次的定標(biāo)使計算機技術(shù)可以更好的應(yīng)用在攝像機定標(biāo)過程中,呈現(xiàn)出高質(zhì)量的攝像效果。

4 總結(jié)

在計算機視覺中攝像機的定標(biāo)方法都是可行的,但各種方法都存在一定的缺陷,所以在實際應(yīng)用中還應(yīng)該根據(jù)攝影環(huán)境以及攝影機的質(zhì)量選擇最優(yōu)的定標(biāo)方法,保證定標(biāo)參數(shù)的準(zhǔn)確性,在鏡頭里呈現(xiàn)出清晰的成像。針對計算機視覺中攝像機定標(biāo)方法的缺陷,攝像機的研究領(lǐng)域應(yīng)該要不斷更新攝像機定標(biāo)方法,提高攝像機定標(biāo)的精確度,不斷滿足人們對攝像機清晰度的要求,呈現(xiàn)出清晰的攝像效果。

參考文獻(xiàn):

[1]邱茂林,馬頌德,李毅.計算機視覺中攝像機定標(biāo)綜述[J].自動化學(xué)報,2000(1).

[2]伍雪冬,蔣新華,李建興,黃靖.計算機視覺中傳統(tǒng)攝像機定標(biāo)方法綜述[J].福建工程學(xué)院學(xué)報,2007(1).

篇2

關(guān)鍵詞:三目攝像機;標(biāo)定;立體視覺;外部參數(shù)

一、緒論

1.1研究的背景及意義

計算機視覺是當(dāng)今極為重要的學(xué)科之一,它在具有很強的挑戰(zhàn)性的同時又擁有廣泛的應(yīng)用前景和實用價值。計算機視覺以視覺理論為中心,以圖像處理、模式識別、計算機技術(shù)和生理學(xué)、心理學(xué)為基礎(chǔ),研究內(nèi)容主要有兩個方面:一是開發(fā)從輸入圖像數(shù)據(jù)自動構(gòu)造場景描述的圖像處理系統(tǒng);二是理解人類視覺機理,用機器代替人去做人類難以達(dá)到或根本無法達(dá)到的工作[1]。

計算機視覺應(yīng)用的廣泛性體現(xiàn)在其不僅用于文字、指紋、面部、商標(biāo)以及圖像數(shù)據(jù)庫、檢測集成電路芯片、多媒體技術(shù)這些圖像方面,還應(yīng)用到機器人導(dǎo)航、工業(yè)檢測和產(chǎn)品的自動裝配、CT圖像器官重建和遙感照片解釋等空間物體的定位、識別以及重建上?,F(xiàn)如今,計算機視覺已經(jīng)應(yīng)用到機器人、地理、醫(yī)學(xué)、物理、化學(xué)、天文等各大的研究領(lǐng)域。

作為多個學(xué)科交叉與融合中心的計算機視覺,攝像機是其研究的重要工具,而攝像機標(biāo)定又是計算機視覺研究的一個關(guān)鍵問題,故攝像機的標(biāo)定越來越受到廣泛的重視。攝像機標(biāo)定是通過物體空間上的點與圖像中的對應(yīng)點的幾何關(guān)系,來確定攝像機的內(nèi)外參數(shù)的過程。標(biāo)定結(jié)果是否準(zhǔn)確影響著三維測量的精度和三維重建的結(jié)果,而且實時的標(biāo)定更能滿足自動導(dǎo)航機器視覺的需要[2]。

伴隨著應(yīng)用的發(fā)展,攝像機廣泛地被應(yīng)用于三維立體的測量、視覺檢測、運動檢測等領(lǐng)域。由此,對攝像機標(biāo)定的精度要求也日益增加。攝像機標(biāo)定結(jié)果的優(yōu)劣影響了計算機視覺在各領(lǐng)域的應(yīng)用。攝像機標(biāo)定的準(zhǔn)確與否,對能否提高計算機視覺在各領(lǐng)域測量的準(zhǔn)確度有重要影響[3]。因此,研究攝像機標(biāo)定方法具有重要的理論研究意義和實際應(yīng)用價值。

1.2攝像機標(biāo)定技術(shù)研究的發(fā)展及現(xiàn)狀

攝像機有一個圖像平面和提供三維空間到圖像平面轉(zhuǎn)換的鏡頭。由于鏡頭會產(chǎn)生畸變,不能把這個轉(zhuǎn)化過程簡單描述為投射變換。所以它表示的是畸變的模型,這些模型近似于真實數(shù)據(jù),而其精確性則依靠于建立的模型及模型參數(shù)的準(zhǔn)確性。

首先進行攝像機標(biāo)定工作的是加拿大的Deville,他于1910年建立實驗室,使用多個瞄準(zhǔn)儀對他的“測量攝像機”(surveying camera)進行標(biāo)定[4]。上個世紀(jì)三十年代后期,美國標(biāo)準(zhǔn)局發(fā)明了一種精確鏡頭,用來檢測攝像機,同時將它用在攝像機標(biāo)定上。四十年代后期,該項工作得到進一步加深,有了更多對高精度的需求和對易操作設(shè)備的需求。1955年,Carman出版了 《棋盤平面度的干涉測量和控制》,該書引起了社會各界對攝像機標(biāo)定的關(guān)注。二戰(zhàn)時期,隨著飛機的大規(guī)模使用,航空攝影與制圖興起,為得到更加精確的測量結(jié)果,對攝像機鏡頭的校正要求也變得更高。五十到七十年代也是鏡頭校正技術(shù)發(fā)展最為迅速的時間段。在這期間,各種鏡頭像差的表達(dá)式逐步被提出并且得到普遍認(rèn)同與采用,建立了很多的鏡頭像差的模型,D.C.Brown等人作出了比較大的貢獻(xiàn),他們導(dǎo)出了近焦距情況下給定位置處徑向畸變表達(dá)式并證明了近焦距情況下測量出鏡頭兩個位置的徑向畸變就可以求出任何位置的徑向畸變[5]。這些徑向與切向像差表達(dá)式成為后來各攝像機的標(biāo)定非線性模型的基礎(chǔ)。這段時間里,研究的重點是如何校正鏡頭與用何種方法補償鏡頭像差,這些研究對促進各性能鏡頭組的研制起到了重要作用。在1999年,張正友提出了一種簡便的攝像機標(biāo)定方法,該方法介于傳統(tǒng)標(biāo)定和自標(biāo)定之間,操作方便靈活,能夠得到不錯的精度,滿足了眾多擁有桌面視覺系統(tǒng)的用戶在攝像機標(biāo)定方面的需求。

1.3本文的主要研究內(nèi)容

本文的主要研究多個攝像機的標(biāo)定問題。標(biāo)定主要是對攝像機內(nèi)外參的測量計算,利用這些參數(shù)對多個攝像機識別的物體尺寸進行衡量并建立起多攝像機系統(tǒng)的數(shù)字環(huán)境。

論文的內(nèi)容包括:

第一章為緒論,介紹攝像機標(biāo)定相關(guān)的研究背景、國內(nèi)外研究現(xiàn)狀。

第二章為攝像機標(biāo)定理論基礎(chǔ):主要介紹標(biāo)定的坐標(biāo)系與待標(biāo)定的參數(shù)。

第三章提出本文的多攝像機標(biāo)定方法與實驗過程。

第四章進行全文的總結(jié)。

二、攝像機標(biāo)定方法研究

2.1攝像機標(biāo)定原理

攝像機通過透鏡將三維物體投影到--維圖像平面上,這個成像變換的過程稱為攝像機成像模型。攝像機成像模型有多種,最常用的為小孔成像模型。由于實際的攝像機鏡頭會發(fā)生一定的畸變,使得空間點所成的像不在線性模型描述的位置而會發(fā)生一定的偏移,為了能準(zhǔn)確的標(biāo)定攝像機參數(shù),標(biāo)定的過程中要考慮非線性畸變因子。

一般來說,得到標(biāo)定結(jié)果后要對其精度進行評估,然而很難得到準(zhǔn)確的攝像機標(biāo)定參數(shù)真值作為參考,其中基于圖像坐標(biāo)和世界坐標(biāo)的絕對和相對誤差的評價方法應(yīng)用廣泛,本文將對這些方法的原理進行探討。

2.2攝像機標(biāo)定坐標(biāo)系建立

首先定義了四個坐標(biāo)系,如圖1所示,圖像坐標(biāo)系的坐標(biāo)原點為O0,列與行由坐標(biāo)軸u和v表示;成像平面坐標(biāo)系的原點是攝像機光軸與圖像坐標(biāo)系的交點0l,x、y 軸分別與u、v 軸平行;在攝像機坐標(biāo)系中,坐標(biāo)原點0c即為在攝像機的光心,Xc、Yc軸與x、y 軸平行,與圖像平面垂直是攝像機光軸作為Zc軸,0c0l為攝像機焦距f;世界坐標(biāo)系是假想的參考坐標(biāo)系,可固定于場景中某物體上,用于描述攝像機的位置,由Xw,Yw,Zw軸組成。

圖(1)

2.3攝像機外部參數(shù)構(gòu)成

主動視覺傳感器從在笛卡爾直角坐標(biāo)系中的運動表現(xiàn)為相應(yīng)的旋轉(zhuǎn)矩陣和平移矩陣,故攝像機外部參數(shù)表現(xiàn)為旋轉(zhuǎn)矩陣R和平移矩陣T,則攝像機坐標(biāo)系與世界坐標(biāo)系的轉(zhuǎn)化關(guān)系可以表示成:

上式中(Xc,Yc,Zc)表示空間點在攝像機坐標(biāo)系下的坐標(biāo),(Xw,Yw,Zw)表示空間點在世界坐標(biāo)系下的坐標(biāo)。根據(jù)靶標(biāo)點在像空間坐標(biāo)系和物方空間坐標(biāo)系中的坐標(biāo),通過分解旋轉(zhuǎn)矩陣線性計算像空間坐標(biāo)系與物方空間坐標(biāo)之間的轉(zhuǎn)換參數(shù),即外方位元素(攝站參數(shù))[6]。

2.4各攝像機相對位置確定

三目攝像機擁有三個視覺傳感器,而三個傳感器之間的相對位置可通過已獲得的外部參數(shù)進行確定。將三個攝像機坐標(biāo)系設(shè)置為,Oci xci yci zci(i=1,2,3),由2.3中所介紹的內(nèi)容可知,這三個攝像機坐標(biāo)系與世界坐標(biāo)系的關(guān)系為:

i=(1,2,3)

由此我們可以得到任意兩個攝像機i,j的坐標(biāo)系轉(zhuǎn)換關(guān)系:

其中: = = i,j=1,2,3

三、攝像機標(biāo)定實驗過程及結(jié)果

3.1實驗系統(tǒng)介紹

實驗中被用來標(biāo)定的是一個多攝像機系統(tǒng),攝像機標(biāo)定有關(guān)的基本參數(shù)、系統(tǒng)組成和開發(fā)環(huán)境如下:

(1)硬件環(huán)境

標(biāo)定板、三目攝像機和圖像采集卡等。

(2)軟件環(huán)境

OpenCV開源視覺庫,它僅由一系列C函數(shù)和少量C++類構(gòu)成,為Python、MATLAB等語言提供了接口,在圖像處理和計算機視覺方面實現(xiàn)了很多通用算法。

3.2實驗過程

本系統(tǒng)以棋盤格模板作為標(biāo)定模板。采用激光打印機打印棋盤格黑白方塊間隔紙,方塊邊長為3cm,共6行9列,將打印紙固定在一塊平板上,作為標(biāo)定模板,如圖(2)。安裝三目攝像機系統(tǒng),調(diào)節(jié)固定好個攝像機位置,如圖(3)。手持標(biāo)定板在三目攝像機前方各個位置拍攝5組共15張各姿態(tài)的照片,利用Canny算子進行像點灰度中心提取、同名像點匹配并解算出三個攝像機在標(biāo)定板坐標(biāo)系中的外部參數(shù)值。

3.3標(biāo)定結(jié)果

攝像機1:

R= T=

攝像機2:

R= T=

攝像機3:

R= T=

四、總結(jié)

隨著計算機技術(shù)的高速發(fā)展,計算機視覺成為當(dāng)今熱門的研究課題,受到了廣泛關(guān)注。本文就如何在機器視覺的理論基礎(chǔ)上對三目視覺系統(tǒng)進行標(biāo)定進行了研究,討論了計算機視覺理論知識,分析攝像機標(biāo)定原理以及標(biāo)定坐標(biāo)系的建立。同時通過計算機視覺知識的分析討論了基于三目視覺系統(tǒng)的攝像機標(biāo)定技術(shù),完成了三目視覺系統(tǒng)的外部參數(shù)標(biāo)定實驗。三目攝像機測量系統(tǒng)外部參數(shù)的標(biāo)定能夠解決測量作業(yè)現(xiàn)場、測量控制場建立難的問題,為快速地建立簡單實用的控制場提供了方案,有一定的實用價值。

參考文獻(xiàn)

[1] 荊麗秋.雙目視覺系統(tǒng)標(biāo)定與匹配的研究與實現(xiàn)[D].哈爾濱工程大學(xué),2009.DOI:10.7666/d.y1489086.

[2] 馬頌德.計算機視覺―計算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,1998.

[3] 王榮一.攝像機標(biāo)定及關(guān)鍵技術(shù)研究[D].哈爾濱理工大學(xué),2011.DOI:10.7666/d.y2012483.

[4] Clarke T A,F(xiàn)ryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66

[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.

[6] 范亞兵,黃桂平,高寶華等.三目立體工業(yè)攝影測量系統(tǒng)外部參數(shù)的快速標(biāo)定[J].測繪工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013

篇3

關(guān)鍵詞:壁紙;計算機視覺;灰度共生矩陣;紋理

中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9599 (2012) 11-0000-01

一、壁紙樣本特征參數(shù)的獲取

紋理是一種普遍存在的視覺現(xiàn)象,如木材表面、草坪、皮膚、織物、水波等都有各自的紋理特征,而紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的重要特征。壁紙大都仿制木材表面、皮膚、織物等物體,具有典型的紋理特征。因此,本文采用經(jīng)典的灰度共生矩陣法對壁紙進行紋理特征參數(shù)的獲取。

數(shù)學(xué)定義:灰度共生矩陣是從圖像灰度為i的像元位置為(x,y)出發(fā),統(tǒng)計與其距離為d,灰度為j的像元(x+Dx, y+Dy)同時出現(xiàn)的頻度P(i, j, d,θ),數(shù)學(xué)表達(dá)為[1]:

P(i, j, d,θ)={[ (x, y), (x+Dx, y+ Dy) | f(x, y)= i;f(x+ Dx, y+ Dy)= j]} (1)

其中,θ為共生矩陣的生成方向,通常取0°、45°、90°、135°四個方向。Haralick等人由灰度共生矩陣提取了14個紋理特征參數(shù),分別為角二階矩、對比度、相關(guān)、熵、方差、均值和、方差和、逆差矩、差的方差、和熵、差熵、聚類陰影、顯著聚類、最大概率,依次標(biāo)為W1~ W14,表1列出了部分樣本的紋理特征參數(shù)。

二、實驗樣本

實驗樣本選用了壁紙樣本手冊中的8類樣本進行實驗測試,每類樣本包含100張初始樣本圖像,樣本庫共包含800張圖像(100×8),如圖2所示。為了便于進行識別實驗,將樣本分成3部分,依次為:標(biāo)準(zhǔn)樣本集(70×8)、測試樣本集(30×8)。

三、實驗分析

為了能真實地反映所獲取特征的識別能力,應(yīng)選擇相對簡單的分類器,從而避免分類器差異對識別率的影響,因此,本研究選擇最近鄰分類器對壁紙樣本進行識別。

觀察表2可見,對壁紙測試樣本集的總體分類識別率為87.50%,獲得了較高的分類識別率。其中,對第5類板材樣本的識別率最低為750%,對第3類的識別率最高為100.0%,這也能夠反映出樣本自身的復(fù)雜程度和灰度共生矩陣特征參數(shù)對各類樣本的描述能力。

四、結(jié)論:

本文使用最近鄰分類器對壁紙測試樣本集合進行分類,總體識別率為87.50%,表明灰度共生矩陣特征參數(shù)能夠有效描述壁紙的紋理特征,同時也表明采用計算機對板材進行分類識別取代人工識別是基本可行的。

參考文獻(xiàn):

[1]莊軍,李弼程.一種基于灰度共生矩陣的文本圖像識別方法[J].計算機工程,2006,32(3):214-216

[2]王克奇,王輝,白雪冰.基于模擬退火算法和最近鄰分類器識別率的特征選擇方法[J].自動化技術(shù)與應(yīng)用,2007,26(1):27-29

[3]楊彩霞.基于Gabor變換與最近鄰分類器的字符識別方法[J].西安文理學(xué)院學(xué)報(自然科學(xué)版),2010,13(4):83-85

篇4

(上海大學(xué)通信與信息工程學(xué)院,上海200072)

摘要:運動目標(biāo)的檢測是數(shù)字圖像處理和模式識別的基礎(chǔ),也是計算機視覺研究的一個重要領(lǐng)域。以C#為主要研究工具,對基于相鄰幀差法及背景差分法的視頻目標(biāo)檢測算法進行了研究,主要對其原理和算法進行研究。最后利用以AForge.NET架構(gòu)類庫,利用圖像灰度的絕對值是否大于設(shè)置的閾值實現(xiàn)了對運動目標(biāo)進行檢測,實驗結(jié)果表明,采用該算法可以對運動目標(biāo)進行較為精確的檢測。

關(guān)鍵詞 :運動檢測;AForge.NET;幀差法;背景差分法

中圖分類號:TN911.73?34 文獻(xiàn)標(biāo)識碼:A 文章編號:1004?373X(2015)17?0058?03

0 引言

由于微電子技術(shù)的發(fā)展與社會生活水平的提高及各種安防需求的增多,運動目標(biāo)檢測逐步成為當(dāng)前監(jiān)控系統(tǒng)研究領(lǐng)域的熱點,更是計算機視覺領(lǐng)域中視頻跟蹤算法和識別技術(shù)的基礎(chǔ),該算法的檢測精度直接影響了后續(xù)的運動目標(biāo)跟蹤及識別效果。目前,運動目標(biāo)檢測領(lǐng)域比較常用的方法有:光流法、幀間差分法和背景差分法。

光流法是相對于觀察者的運動目標(biāo)造成的觀測目標(biāo)、表面或邊緣的運動[1]。但是該算法計算量比較大,并且存在抗干擾能力差,所以對于實時性要求較高的場合,該檢測算法在視頻運動檢測應(yīng)用中并不是特別的適用,目前在運動檢測中最常用的方法實際上是背景差分法[2]和幀間差分法[3]。

幀間差分法是一種通過對視頻圖像序列中相鄰兩幀作差分運算來獲得運動目標(biāo)輪廓的方法,非常適用于存在多個運動目標(biāo)和攝像機移動的情況[4]。由于該算法對光線及場景變化具有較強的抗干擾性,且無需獲得背景圖像,更新速度快,所以非常適用于實時性較強的應(yīng)用場合。但是該算法存在閾值難以確定的問題,這個現(xiàn)象在低對比度灰度圖像序列別明顯,導(dǎo)致對目標(biāo)對象的完整區(qū)域提取不完整而產(chǎn)生空洞的現(xiàn)象。

背景差分法是采用圖像序列中的當(dāng)前幀和背景參考模型比較,來檢測運動目標(biāo)的一種方法,其檢測性能依賴于所使用的背景建模技術(shù)[5]。該算法可以實現(xiàn)緩慢的背景變化過程中對目標(biāo)進行精確快速的分割,所以具有很強的適用性,然而對于突然的光照變化和背景擾動,對物體帶有影子的圖像分割出來的前景圖像可能帶有影子區(qū)域[6],為此可以通過建立實時更新的背景模型機制將前景區(qū)域分割出來,就可以減少動態(tài)場景變化對運動分割的影響[7]。

本文利用AForge.NET[8]架構(gòu)類庫,在Microsoft VisualStudio 2010中分別實驗了幀間差分法與背景差分法,并實現(xiàn)運動目標(biāo)的檢測。實驗結(jié)果表明,利用幀間差分法可以快速實現(xiàn)運動目標(biāo)的檢測,但是對于運動速度較慢的目標(biāo)檢測效果不是特別理想。為此,對于緩慢變化的運動目標(biāo)引入背景差分法,利用類庫中MoveTowards類建立實時有效的背景模型,有效地解決目標(biāo)低速運動識別率較低的問題,提高了目標(biāo)檢測的準(zhǔn)確率。

1 AForge.NET 簡介

AForge.NET是一個專門為開發(fā)者和研究者設(shè)計的基于C#框架,包括計算機視覺與人工智能、圖像處理、神經(jīng)網(wǎng)絡(luò)、遺傳算法、機器學(xué)習(xí)、模糊系統(tǒng)、機器人控制等領(lǐng)域[9]。AForge.NET 是一個不斷完善和發(fā)展的計算機視覺和圖像處理庫,目前的最新版本是2.2.5。

這個框架由一系列的類庫組成,主要包括有:

AForge.Imaging:日常的圖像處理和過濾器;

AForge.Vision:計算機視覺應(yīng)用類庫;

AForge.Neuro:神經(jīng)網(wǎng)絡(luò)計算庫AForge.Genetic?進化算法編程庫;

AForge.MachineLearning:機器學(xué)習(xí)類庫;

AForge.Robotics:提供一些機器學(xué)習(xí)的工具類庫;

AForge.Video:一系列的視頻處理類庫;

AForge.Fuzzy:模糊推理系統(tǒng)類庫;

AForge.Controls:圖像,三維,圖表顯示控件。

2 檢測原理

幀差法及背景差分法主要原理就是圖像的差分技術(shù)。設(shè)在一個時間軸上相鄰時刻點ti 采集到的圖像幀分別為f (x,y,ti),ti + 1 采集到的幀為f (x,y,ti + 1),則可以得出:

//對兩幀數(shù)據(jù)差值進行數(shù)據(jù)濾波

Bitmap tmp3 = erosionFilter.Apply(tmp2);

上面幾行代碼可以計算出當(dāng)前幀與上一幀這兩幀數(shù)據(jù)相差的像素數(shù)據(jù),通過設(shè)定特定的閾值,就可以實現(xiàn)對運動目標(biāo)的報警功能。在本文所做的實驗中,為了形象展示當(dāng)前幀與上一幀數(shù)據(jù)的差值數(shù)據(jù),把連續(xù)兩幀數(shù)據(jù)差值用過紅色高亮數(shù)據(jù)進行顯示。實驗結(jié)果表明,通過差幀法可以快速實現(xiàn)運動目標(biāo)的檢測,由于幀差檢測法存在閾值難以確定的問題,特別是對于低速運動的運動目標(biāo),如果設(shè)定較低的閾值則存在誤觸發(fā)虛報的問題,而對于設(shè)定的高閾值,因為具有較低的檢測靈敏度,則存在漏警的問題,實驗結(jié)果如圖2所示。

為此,本文引入了背景差分法技術(shù),相對幀差檢測算法,該算法使用AForge.NET的MoveTowards類實現(xiàn)實時背景的建模,再通過當(dāng)前圖像幀與建模形成的背景幀數(shù)據(jù)進行差分運算,實現(xiàn)運動目標(biāo)的檢測。該算法可以解決幀差檢測法閾值難以確定的問題,可以實現(xiàn)低速運動目標(biāo)精確的定位與檢測。

背景差分法與幀間差分法的區(qū)別只是有了一個背景更新的過程,本文新背景的建立是通過AForge.NET視頻庫中類實現(xiàn),該類背景提取算法原理是當(dāng)前幀與前一個背景幀求加權(quán)平均得出當(dāng)前背景幀數(shù)據(jù)。背景差分法的具體算法流程如圖3所示。

背景差分法相關(guān)實現(xiàn)代碼如下:

// 初始化背景類

MoveTowards moveTowardsFilter = new MoveTowards();

// 把當(dāng)前幀復(fù)制給該類

moveTowardsFilter.OverlayImage = currentFrame;

// 通過前一幀與當(dāng)前幀建立新的背景

Bitmap tmp = moveTowardsFilter.Apply(backgroundFrame);

// 把原先老的背景去除掉

backgroundFrame.Dispose();

//把當(dāng)前計算出來的背景幀保存下來,為下一背景幀計算做準(zhǔn)備

backgroundFrame = tmp;

背景差分法運動檢測算法的相關(guān)實驗結(jié)果如圖4所示。

從圖4 可以看出,背景差分法具有更好的目標(biāo)輪廓,通過當(dāng)前幀與背景幀比較的運動檢測算法,可以很好地解決運動目標(biāo)低速運行的問題,可以較為精確地實現(xiàn)與運動目標(biāo)的檢測。所有背景差分法與幀差法相比,具有更高的檢測精度,非常適合工程中的應(yīng)用。

4 結(jié)語

本文利用AForge.NET 類庫,分別采用幀差法及背景差分法對運動目標(biāo)進行實時檢測。實驗結(jié)果證明,利用AForge.NET可以實現(xiàn)運動目標(biāo)的檢測功能,并且具有很強的實時性。幀差法可以快速地檢測運動目標(biāo),但是由于其特性決定了其對于低速運動目標(biāo)的檢測較背景差分法檢測靈敏度要低。本文只針對運動目標(biāo)進行簡單的檢測,對于更進一步的問題將在后續(xù)工作中繼續(xù)研究。

參考文獻(xiàn)

[1] 陳銀,任侃,顧國華,等.基于改進的單高斯背景模型運動目標(biāo)檢測算法[J].中國激光,2014(11):245?253.

[2] 紀(jì)青華,禹素萍.基于Surendra背景減除法和四幀差分法的目標(biāo)檢測算法[J].計算機應(yīng)用與軟件,2014(12):242?244.

[3] 邱斌,干紅華,張亶.基于時空信息的運動目標(biāo)分割算法[J].激光雜志,2014(12):40?44.

[4] 柴池.基于背景差分和三幀差分的運動目標(biāo)檢測[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(11):75?76.

[5] 黃素茵.基于視頻監(jiān)控運動目標(biāo)檢測算法研究[D].廣州:華南理工大學(xué),2013.

[6] 余啟明.基于背景減法和幀差法的運動目標(biāo)檢測算法研究[D].贛州:江西理工大學(xué),2013.

[7] 嚴(yán)曉明.一種基于改進幀差法的運動目標(biāo)檢測[J].莆田學(xué)院學(xué)報,2011(5):69?72.

[8] KIRILLOV A. AForge.NET framework [EB/OL].(2010?03?02)[2010?12?20]. http:// aforgenet. com.

篇5

關(guān)鍵詞:圖像內(nèi)容檢索; 紋理特征;視頻水印; 高壓縮; 魯棒性

中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A

1 引 言20世紀(jì)70年代末期,基于文本的圖像檢索技術(shù)(textbased image retrieval)方興未艾。當(dāng)時流行的圖像檢索系統(tǒng)是將圖像作為數(shù)據(jù)庫中存儲的一個對象,用關(guān)鍵字或自由文本對其進行描述。查詢操作是基于該圖像的文本描述進行精確匹配或概率匹配。然而,完全基于文本的圖像檢索技術(shù)存在著嚴(yán)重的問題。90年代初期,隨著大規(guī)模數(shù)字圖像庫的出現(xiàn),基于內(nèi)容的圖像檢索技術(shù)(contentbased image retrieval)應(yīng)運而生。區(qū)別于原有系統(tǒng)中對圖像進行人工標(biāo)注的做法,基于內(nèi)容的檢索技術(shù)自動提取每幅圖像的視覺內(nèi)容特征作為其索引,如色彩、紋理、形狀等。此后幾年中,這個研究領(lǐng)域中的許多技術(shù)發(fā)展迅速,一大批研究性的或商用的圖像檢索系統(tǒng)被建立起來。這個領(lǐng)域的發(fā)展主要來歸功于計算機視覺技術(shù)的進步,在文獻(xiàn)[1]中有對這一領(lǐng)域的詳細(xì)介紹。

圖像特征的提取與表達(dá)是基于內(nèi)容的圖像檢索技術(shù)的基礎(chǔ)。從廣義上講,圖像的特征包括基于文本的特征(如關(guān)鍵字、注釋等)和視覺特征(如色彩、紋理、形狀、對象表面等)

兩類。由于基于文本的圖像特征提取在數(shù)據(jù)庫系統(tǒng)和信息檢索等領(lǐng)域中已有深入的研究,本文我們主要介紹視頻圖像視覺特征的提取和表達(dá)。并利用特征提取選定相應(yīng)幀,并在選定的特定幀中嵌入水印。

2 Tamura紋理特征

紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺特征[2]。它是所有物體表面共有的內(nèi)在特性,例如云彩、樹木、磚、織物等都有各自的紋理特征。

基于人類對紋理的視覺感知的心理學(xué)的研究,Tamura等人提出了紋理特征的表達(dá)[3]。Tamura紋理特征的六個分量對應(yīng)于心理學(xué)角度上紋理特征的六種屬性,分別是粗糙度(coarseness)、對比度(contrast)、方向度(directionality)、 線像度(linelikeness)、規(guī)整度(regularity)和粗略度(roughness)。其中,前三個分量對于圖像檢索尤其重要[4]。接下來我們就著重討論粗糙度、對比度和方向度這三種特征的定義和數(shù)學(xué)表達(dá)。

計算技術(shù)與自動化2011年9月

篇6

關(guān)鍵詞 SIFT 尺度空間 圖像匹配 特征描述符

中圖分類號:TP39 文獻(xiàn)標(biāo)識碼:A

Research on the Simplified SIFT Feature Matching Algorithm

YIN Lihua[1], CHEN Yong[1], YANG Yuping[2]

([1] Chongqing Normal University, Chongqing 401331;

[2] Chongqing College of Electronic Engineering, Chongqing 401331)

Abstract For SIFT algorithm, for the matching problem of the classic descriptors for feature dimension is too high and lead to reduced efficiency, this paper presents a simplified SIFT feature matching algorithm, the first of the operator dimensionality reduction to improve the speed, then use two-way matching to eliminate errors together with the algorithm to ensure the accuracy of experiments and achieved good results, verify the feasibility of the method.

Key words SIFT; scale space; image matching; feature descriptors

0 引言

圖像匹配是同一場景在兩個不同視點下的圖像之間的對應(yīng)關(guān)系,是虛擬現(xiàn)實、計算機視覺等研究領(lǐng)域的一個熱點,也是計算機視覺應(yīng)用,如深度恢復(fù)、攝像機標(biāo)定、運動分析以及三維重構(gòu)等研究的基本問題。①總結(jié)起來,圖像匹配算法大致分為:基于面積的方法、②基于比值的方法③等,但這些算法有著共同的缺點。本文提出一種簡化的SIFT算法,通過減少特征描述符的維數(shù)來降低計算的復(fù)雜度,并采用雙向匹配增強匹配的精度。

1 SIFT算法研究

SIFT( scale invariant feature transform,即尺度不變特征變換)算法是David G.Lowe于1999年提出,2004年進行了總結(jié)和完善的特征匹配算法,SIFT特征匹配算法共分為如下五個步驟:

1.1 尺度空間的形成。

Koendetink等人證明了高斯卷積核是實現(xiàn)尺度變換的惟一線性核,因此,一幅二維圖像的尺度空間可定義為:

() = ()* () (1)

式中:L為尺度空間,()為空間坐標(biāo), 則為尺度因子。 的值越小表示圖像越清晰,越大則表示圖像越模糊。為了提高尺度空間中被檢測關(guān)鍵點的穩(wěn)定性,采用了高斯差分尺度空間()。定義為兩相鄰尺度的高斯核差分,公式如下:

() = [ () ()]* () = () - () (2)

1.2 空間極值點的檢測

在中,為確保在尺度空間及二維圖像空間都能檢測到極值點,每一個像素點(最頂層和最底層像素點除外)要和其上下兩層各9個及同層8個相鄰點進行比較。并通過擬和三維二次函數(shù)來精確確定特征點的尺度和位置,同時去除對比度低的特征點和不穩(wěn)定的邊緣特征點,以增強圖像匹配的穩(wěn)定性、提高抗噪聲能力。

1.3 特征點方向分配

為使算子具備旋轉(zhuǎn)不變性,統(tǒng)計特征點鄰域像素的梯度方向直方圖,以確定每個特征點的方向參數(shù)。

1.4 特征點描述器的生成

為了增強算子的抗噪能力,每個特征點選用16個種子點來描述,而每個種子點又有8個方向的向量信息,因此,每個特征點就能形成16共128維的SIFT特征向量。

1.5 特征匹配

SIFT算法選用歐式距離作為特征點的相似性度量函數(shù),設(shè)定一個閾值,當(dāng)距離小于這個閾值時就接受這一對匹配點。

2 簡化的SIFT算法研究

2.1 簡化算法的匹配步驟

經(jīng)典算法中,第三步的計算時間在整個算法中占了70%多,大大地降低了算法的速度,影響了實時性。為了改善這一狀況,將第二、三步合并,并在對特征點進行描述時,把原來的128維向量降為現(xiàn)在的12維向量。匹配步驟如下:

2.1.1 初步特征點的檢測(方法同原算法)

2.1.2 形成特征向量

(1)以初步檢測到的特征點為中心采用圓形窗體來確定需要統(tǒng)計的領(lǐng)域范圍,選取圓形窗口半徑為4.5s,在該窗體內(nèi)統(tǒng)計12個梯度方向。

(2)歸一化這12個梯度方向,以保證算子的光照不變性。用表示特征向量,即 = ,歸一化后得到:

(3)

(3)為保證算子的旋轉(zhuǎn)不變性,查找最大的梯度方向統(tǒng)計量。向左循環(huán)移動整個向量序列,直至梯度方向統(tǒng)計量最大的元素移動到序列的第一個元素。

2.1.3 特征匹配

為保證算法的精度,采用雙向匹配。即第一次匹配完后,記錄下成功匹配的坐標(biāo)對,然后交換匹配對的坐標(biāo)位置,再匹配一次,如果這兩次匹配得到的坐標(biāo)對是一樣的,就接受這一對匹配點。

2.2 維數(shù)設(shè)定

簡化算法中最重要的一步就是圓形窗口中維數(shù)n的設(shè)定,實驗結(jié)果表明,當(dāng)<12時,匹配效率隨著維數(shù)的增加呈指數(shù)級增加;反之,當(dāng)>12時,匹配效率卻隨著維數(shù)的增加反而下降。由此可得,當(dāng) =12時,匹配效率最高, =12即為所需確定的維數(shù)。對于匹配效率,定義為:

匹配效率 = (4)

3 仿真實驗及結(jié)果

為了驗證算法,在CPU為Intel Corei3 2.20GHz,內(nèi)存為2G的PC機上采用Matlab7.8軟件平臺進行實驗。為了證明算法對物體旋轉(zhuǎn)、遮擋和光照的魯棒性,在設(shè)計場景的時候?qū)⑽矬w任意擺放,在不同的光照條件下進行實驗,部分效果及結(jié)果如圖表所示,其中圖1(a)為SIFT算法匹配圖像,圖1(b)為簡化SIFT算法匹配圖像,表1為兩種算法匹配對比結(jié)果。

4 結(jié)論

總之,本文研究了經(jīng)典SIFT算法,并分析了算法的優(yōu)勢及其局限性,從匹配速度上加以了改進。首先利用圓形窗口本身的旋轉(zhuǎn)不變特性對算法進行降維,從原來的128維降為12維;其次采用雙向匹配提高匹配的精度,去除可能存在的不明顯誤匹配。將匹配結(jié)果同原SIFT算法進行了比較,試驗結(jié)果表明本文改進算法比原SIFT算法在速度上有了很大的提高,同時在一定程度上也保證了精度。

注釋

① 孔曉東,屈磊,桂國富等.基于極約束和邊緣點檢測的圖像密集匹配[J].計算機工程,2004(20):178-179.

篇7

關(guān)鍵詞:視頻檢測;蜂群算法;互信息

中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A

Abstract:Here,a video object detection method based on an improved bee colony algorithm is presented.First,the maximum mutual information values of two images are obtained through optimization.Then,the best spatial matching parameters are acquired,and finally the target is detected through the three frame difference pared to the traditional algorithm,the proposed algorithm can restrain the residual background noise,and does not require the image pre-processing,feature selection and background updating,which reduce the complexity of the pared with the results based on the traditional bee colony algorithm,the effectiveness and reliability of the improved algorithm are demonstrated.

Keywords:video detection;bee colony algorithm;mutual information

1 引言(Introduction)

近年來,科學(xué)技術(shù)的不斷發(fā)展以及人民生活水平的不斷提高使人類對生活質(zhì)量和本身的安全性保證需求愈來愈高。視頻監(jiān)控由于能形象、直觀地表示信息而被應(yīng)用于大部分公共場所。相比較傳統(tǒng)的視頻監(jiān)控,高端化的視頻監(jiān)控系統(tǒng)可通過計算機視覺、圖像處理等技術(shù)提取出人們感興趣的目標(biāo)信息圖像,然后對其進行檢測、跟蹤、分類以及行為理解和描述等過程來判別監(jiān)控畫面中的情況,代表了未來視頻監(jiān)控產(chǎn)業(yè)的發(fā)展趨勢。視頻監(jiān)控系統(tǒng)的關(guān)鍵技術(shù)主要有四個方面:目標(biāo)的檢測,目標(biāo)的跟蹤,目標(biāo)的分類,行為的理解與描述。

視頻目標(biāo)檢測在人機交互、視頻監(jiān)控、交通視頻、視頻會議、客流量統(tǒng)計等許多方面都有非常重要的應(yīng)用,是當(dāng)今計算機視覺領(lǐng)域的研究熱點與難點之一。傳統(tǒng)的檢測算法[1]如背景差分法、相鄰幀差法、光流場法等已相對成熟,但存在不足:背景差分法對光線等外在因素的變化過于敏感,幀差法檢測目標(biāo)的完整性較差,光流場法的計算比較復(fù)雜且容易被外界噪聲干擾。因此,學(xué)者們提出了許多改進算法,如背景移動補償算法[2]、幀間差法與背景差分相結(jié)合的算法[3]等。

2 互相關(guān)信息(Mutual information)

互相關(guān)信息是一種具有測量圖像間的統(tǒng)計相關(guān)性作用的信息理論概念。它代表圖像間的重合區(qū)域,重合區(qū)域越多,互相關(guān)信息越大。當(dāng)兩幅圖像在幾何上完全重合時的互相關(guān)信息是最大的,稱為最大互信息。

假設(shè)有兩個隨機變量A和B,灰度值范圍為0―255,和分別是它們各自的概率密度函數(shù),表示它們之間的相關(guān)密度函數(shù)。那么隨機變量A和B的互相關(guān)信息表示如下:

由于聯(lián)合熵的值取決于邊緣熵與變換函數(shù),因此需要找出最優(yōu)變換函數(shù)對圖像進行配準(zhǔn),以讓聯(lián)合熵最小,則此時的互相關(guān)信息為最大互信息。因為互相關(guān)信息是關(guān)于圖像全部像素的,所以帶來的計算量較大。小波變換為一種擁有多分辨率的時間――尺度分析方法,本文結(jié)合小波分解的方法,對配準(zhǔn)圖像進行小波變換,主要包括平移和旋轉(zhuǎn),因此,通過對小波變換函數(shù)中平移和旋轉(zhuǎn)參數(shù)的最優(yōu)化以獲得最大互信息。

3 改進蜂群算法(Improved bee colony algorithm)

所謂人工蜂群算法就是對蜜蜂行為加以模擬而提出的一種優(yōu)化算法。蜂群中出現(xiàn)群體智慧的最小搜索模型主要包括四個基本的組成要素:食物源、引領(lǐng)蜂、偵查蜂與跟隨蜂。

在蜂群算法中,優(yōu)化問題的一個可能解就是一個食物源的位置,解的質(zhì)量(適應(yīng)度)就是食物源的花蜜數(shù)目。詳細(xì)過程如下:起先,生成具有個解(食物源)的初始種,其中的各個解――是一個維數(shù)為D(待優(yōu)化參數(shù)的數(shù)目)的向量;其次,所有的食物源都要被蜜蜂進行反復(fù)(次數(shù)為MCN)搜尋:對應(yīng)的食物源(解)先被引領(lǐng)蜂在鄰域作一次搜尋,通過對比搜尋前后兩個食物源的花蜜數(shù)目后,選取適應(yīng)度相對高即花蜜數(shù)目大的食物源(解)來采蜜;結(jié)束搜尋以后,所有的引領(lǐng)蜂將食物源上花蜜數(shù)目的信息傳遞給跟隨蜂,跟隨蜂通過獲得的信息按照一定的概率選取食物源,即花蜜越多的食物源被選擇的可能性越大。而后,跟隨蜂為了選取更好的解也作一次與引領(lǐng)蜂相同的鄰域搜尋。

其中,,,以上和都是隨機選擇的,并且。在-1和1之間。

在蜂群算法中,通過次循環(huán)之后得不到改善的解要被丟棄,這里的“”便是算法中的一個關(guān)鍵的控制參數(shù)。假設(shè)是被丟棄的解,偵查蜂可以隨機生成一個新解對進行代替。

以上表述可以看出,蜂群算法中的三個控制參數(shù)――食物源的數(shù)目、引領(lǐng)蜂的數(shù)目、跟隨蜂的數(shù)目(SN)是相等的。以上整個算法的核心包括三個部分:(1)引領(lǐng)蜂:鄰域搜索;(2)跟隨蜂:將搜尋范圍縮小后對鄰域作搜尋;(3)偵查蜂:隨機搜索。

因為蜜蜂隨機選擇鄰域個體,并且未考慮食物源之間的內(nèi)部聯(lián)系,致使收斂速度較為緩慢。為了提高收斂性能,提出改進蜂群算法,將式(4)變化為

式中,―遺忘因子,代表搜尋其它食物源時對當(dāng)前食物源的記憶強度,并且為了使蜜蜂充分的利用鄰域個體的搜索信息從而更好地尋找到全局的最優(yōu)點,在下一食物源的搜索過程中遺忘因子會動態(tài)調(diào)整;―鄰域因子,確定信息共享的強度是根據(jù)鄰域個體食物源的優(yōu)劣來進行的,在搜索后期為了使蜜蜂具有較強的全局尋優(yōu)能力,鄰域因子進行動態(tài)變化。為常量,以1為分界線,當(dāng)食物源質(zhì)量比蜜蜂當(dāng)前食物源質(zhì)量劣時取1,從而讓蜜蜂可以向高質(zhì)量的食物源移動。

鄰域因子、遺忘因子中的參數(shù)、隨搜索進程動態(tài)變化如下:

式中,iter代表搜索步數(shù);、、與都是常量,取值在[0.1,1.5],且、。為了使蜜蜂迅速向最優(yōu)食物源區(qū)域移動,遺忘因子中的參數(shù)隨搜索進程從逐漸下降至,取值范圍在[0.8,1];隨著搜索的進行,鄰域因子中的參數(shù)從逐漸上升到,代表逐漸增大鄰域個體與當(dāng)前蜜蜂的信息共享強度,β取值范圍在[1,1.2]。

4 三幀差分法(Three frame difference method)

三幀差分法把相鄰三幀圖像當(dāng)作一組進行差分,可以將實際運動目標(biāo)的輪廓完整的檢測出來,具體算法如下:

(1)讀取圖像序列中的三幀圖像、、,依次計算出相連兩幀圖像的絕對差值灰度圖、,設(shè)置閾值T對差值圖像進行二值化,提取運動目標(biāo)區(qū)域如下:

(2)通過邏輯“與”運算提取和的交集,獲取運動目標(biāo):

5 計算分析(Calculation and analysis)

5.1 基于改進蜂群算法的視頻目標(biāo)檢測算法流程

(1)首先通過小波變換將圖像映射到小波域。

(2)利用式(1)作為衡量標(biāo)準(zhǔn)進行基于互相關(guān)信息的圖像配準(zhǔn)計算。

(3)采用改進的蜂群算法優(yōu)化兩幅圖像間的互信息值,此算法通過迭代后將獲得最優(yōu)的小波變換平移參數(shù)與旋轉(zhuǎn)參數(shù)。

(4)最終依靠三幀差分法實現(xiàn)對圖像中運動目標(biāo)的增測,使用矩形框?qū)⒛繕?biāo)進行標(biāo)記,完成目標(biāo)檢測。

5.2 結(jié)果與分析

圖1和圖2分別為基于蜂群算法和改進蜂群算法的視頻目標(biāo)檢測結(jié)果。從中可看出,基于蜂群算法檢測到的目標(biāo)范圍過大,而基于改進蜂群算法檢測出的目標(biāo)范圍更加精確,也更能夠反映出真實情況。

6 結(jié)論(Conclusion)

本文在基于互相關(guān)信息進行目標(biāo)檢測的基礎(chǔ)上,利用改進的蜂群算法對兩幅圖像間的互相關(guān)信息進行優(yōu)化,得到最大互信息值,進而獲得最佳空間匹配參數(shù)并完成對圖像的空間配準(zhǔn),最后通過三幀差分法檢測出目標(biāo)。通過與傳統(tǒng)蜂群算法的結(jié)果對比,證明了改進算法的有效性和可靠性。

參考文獻(xiàn)(References)

[1] 萬纓,韓毅,盧漢清.運動目標(biāo)檢測算法的探討[J].計算機仿真,2006,23(10):221-226.

[2] 於時才,吳鍵.運動背景下的運動目標(biāo)檢測方法[J].計算機仿真,2011,28(2):292-294.

[3] 朱明旱,羅大庸,曹倩霞.幀間差分與背景差分相融合的運動目標(biāo)檢測算法[J].計算機測量與控制,2005,13(3):215-217.

[4] Teodorovi'c,Dell Orco.Bee colony optimization-a cooperative learning approach to complex transportation problems[M].In Proceedings of the 10th Ewgt Meeting,Poznan,13-16 September 2005.

作者簡介:

仲 躍(1960-),男,碩士,高級工程師.研究領(lǐng)域:水利信息系統(tǒng)應(yīng)用開發(fā).

楊 勁(1986-),男,碩士,工程師.研究領(lǐng)域:計算機圖形學(xué)和圖像處理.

顧 京(1985-),男,碩士,工程師.研究領(lǐng)域:信息系統(tǒng)建模與仿真.

篇8

關(guān)鍵詞:人臉修飾;頻域濾波;幾何表示;演化模型

中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)22-0119-03

Abstract: With the popularity of digital cameras, mobile phones and other camera equipment, automatic face modification technology has become a research hotspot in the field of computer vision, digital image processing. In this paper, the framework and the new progress of automatic face modification technology are summarized. The algorithm based on frequency domain filtering, the algorithm based on geometric representation, and the algorithm based on age evolution model are summarized. The main algorithms are introduced and the advantages and disadvantages of various algorithms are also analyzed. Through the research on the practical problems in the domestic and international application, the challenge and the shortage of the automatic face modification technology are presented.

Key words: face modification; frequency domain filtering; geometric representation; evolution model

隨著圖像信息處理技術(shù)的不斷進步,以及拍照設(shè)備的普及,人們對照片的處理需求不斷提高,尤其是針對面部圖像的修飾技術(shù)已成為電腦軟件和手機軟件的一個開發(fā)熱點,比如:美圖秀秀、人人-美顏美圖、光影魔術(shù)手等。這些軟件不要求用戶具有專業(yè)的圖像處理技術(shù),可以方便地實現(xiàn)美化照片的效果。

人臉自動修飾與渲染是計算攝影領(lǐng)域中新的研究熱點。其主要關(guān)注人臉照片品質(zhì)的提高,更關(guān)注對人臉的某些屬性的處理,如:對人臉皺紋的去除、膚色的改善、光潔度的提高等。人們希望經(jīng)自動修飾與渲染的照片,能夠符合視覺感知習(xí)慣、更具吸引力,改變傳統(tǒng)的攝影、圖像處理工作需繁復(fù)的人工操作的現(xiàn)狀。因此,在攝影、廣告設(shè)計、電影制作、數(shù)字娛樂、專業(yè)研究領(lǐng)域都有著廣泛的應(yīng)用前景。

本文對自動人臉修飾技術(shù)的研究背景、研究現(xiàn)狀進行了綜述,列舉了近幾年自動人臉修飾技術(shù)的主要算法,以及算法的改進、對比,最后對自動人臉修飾技術(shù)發(fā)展趨勢、存在的問題、下一步的研究方向進行了闡述。

1 人臉修飾技術(shù)研究進展

1.1 基于頻域濾波的方法

該算法可以實現(xiàn)圖像中高頻率瑕疵(如:皺紋、斑點)的去除,進而完成人臉的修飾,使處理后圖片看上去更白、更美觀,但該算法當(dāng)遇到大范圍皺紋、斑點等瑕疵時的處理效果不理想。

1.2 基于幾何表示的方法

此外還有一些修改人臉外形的算法,通過對面部輪廓和器官作適當(dāng)變形,使其更加貼近最優(yōu)臉型,達(dá)到優(yōu)化人臉的目的。但該類算法容易造成修改后的人臉對標(biāo)準(zhǔn)人臉的依賴,調(diào)整過大時,容易造成人臉原來特征的丟失。

1.3 基于年齡演化模型的方法

基于年齡演化模型的算法通?;贔G-NET數(shù)據(jù)庫、MORPH數(shù)據(jù)庫開展實驗。FG-NET數(shù)據(jù)庫包含了82個人,年齡從0~69歲,共有1002張照片,為包含大的年齡跨度里面收集的照片直接采自被拍攝者的老照片,因此拍攝角度、環(huán)境、光照條件都不能一致,有的照片還有帽子、眼鏡等遮擋,年代很早的照片都是黑白照片,而且早期的照片,受拍照攝備所限,畫面不夠清晰。但FG-NET仍然是現(xiàn)有的人臉年齡數(shù)據(jù)庫中,唯一包含了0~18歲照片的數(shù)據(jù)庫,而且照片反映的年齡跨度大、且密集。

MORPH數(shù)據(jù)庫是最大的、已公開的縱向人臉數(shù)據(jù)庫。該數(shù)據(jù)庫包含超過13000人的55000幅圖像,年齡跨度在16歲到77歲之間,并且該數(shù)據(jù)庫還在不斷擴種中。MORPH數(shù)據(jù)庫除了包含人臉照片,還包含被拍照者的年齡、性別、種族、體重、身高等信息,可供面部分析、年齡分析、面部識別的研究使用。

現(xiàn)階段年齡相關(guān)的人臉數(shù)據(jù)庫還很不完善,人臉圖像的采集需要經(jīng)歷相當(dāng)長時間的跟蹤拍攝,這需要相當(dāng)長時間的積累,并且考慮包含不同種族、性別、地域的人臉照片。

在計算機視覺領(lǐng)域,年齡演化問題是一個研究熱點?;谀挲g演化模型的自動人臉修飾技術(shù)的關(guān)鍵是通過各年齡段的人臉照片構(gòu)建合適的年齡演化模型。

早期的基于年齡演化模型的自動人臉?biāo)惴ㄖ校Y(jié)合了小波變換的內(nèi)容,如:參考文獻(xiàn)[3]中,Tidderman提出了通過小波變換建立特征向量,并針對不同年齡構(gòu)建合成人臉。實驗結(jié)果表明,當(dāng)使用小區(qū)域邊緣強度加權(quán)來保留邊緣特征后,根據(jù)年齡進行人臉修飾的效果更明顯。對這一算法進一步改進,通過MRF模型在小波變換后進行年齡演化過程中的人臉特征學(xué)習(xí),可以實現(xiàn)人臉的年輕化修飾、以及性別修改。實驗結(jié)果表明,MRF模型比單純使用小波變換對人臉的修飾效果要好。

此外,還有根據(jù)生物學(xué)、遺傳學(xué)等領(lǐng)域的研究來建立年齡演化模型的方法。如:參考文獻(xiàn)[4]中,Ramanathan根據(jù)生物學(xué)中顱面骨的生長規(guī)律,對0-18歲期間的人臉建立基于年齡影響的模型,融入人體測量學(xué)的方法,即:人臉不同部位在不同年齡段會有不同的生長進度,來提取不同年齡段人臉的特征。圖3顯示了側(cè)面人臉隨年齡增長的模型,及對應(yīng)不同年齡跨度,產(chǎn)生的特征參數(shù)k。通過最優(yōu)化計算人臉成長參數(shù)k,來實現(xiàn)不同年齡人臉比例的轉(zhuǎn)換,圖4顯示了參考文獻(xiàn)[4] 的實驗結(jié)果。

針對成年人的年齡演化模型,如:參考文獻(xiàn)[5]中,Ramanathan考慮到人的衰老,主要體現(xiàn)在面部肌肉的彈性變差、皺紋的增加,提出了與年齡相關(guān)的形狀、紋理變化的模型,可以用來修飾人臉產(chǎn)生老化特征,如:額頭皺紋、眼角紋、嘴角紋等。實驗通過將數(shù)據(jù)庫人臉按年齡分組,年齡跨度在10歲,如:21-30歲一組,31-40歲一組等,搜集的實驗數(shù)據(jù)可以很好的反映隨年齡、性別、種族等變化而產(chǎn)生的形狀、紋理特征。

綜上,基于年齡演化模型的自動人臉修飾技術(shù)先要對人臉數(shù)據(jù)庫按年齡分組,對不同分組提取特征,得到經(jīng)年齡演化修飾后的圖像。實驗效果很大程度上依賴于人臉數(shù)據(jù)庫,為了得到好的演化效果,需要使用年齡跨度大的人臉照片。

2 總結(jié)

本文總結(jié)了國內(nèi)外關(guān)于自動人臉修飾技術(shù)的算法框架,主要針對基于頻域濾波的算法、基于幾何表示的算法、基于年齡演化模型地算法進行了歸納,這些算法仍存在很大的改善空間,下一步研究可以考慮如下問題:

1)自動人臉修飾技術(shù)最重要的是保留人臉的個性化特征,不能在修飾后面目全非,因此如何在特征提取過程中盡量保留原照片的個性化特征,仍然需要繼續(xù)探討。

2)現(xiàn)階段的自動修飾技術(shù),會使修飾的結(jié)果和方向趨于一致,如何使美化修飾過程具有一定的個性化是一個有待進一步研究的問題。

最后,為了使自動人臉修飾技術(shù)的應(yīng)用更具有利用價值,在算法的改進中不能只局限于現(xiàn)有的數(shù)據(jù)模型、年齡演化模型,可以跨學(xué)科地嘗試、引入新的模型方法,以期在更具有實用價值的指導(dǎo)下設(shè)計新的算法或改進。

參考文獻(xiàn):

[1] 韓靜亮,趙曦,趙群飛,等.基于迭代多級中值濾波的人臉美化算法[J].計算機應(yīng)用與軟件,2010,27(5): 227-229.

[2] Leyvand T, Cohen-Or D, Dror G, et al., Data-driven enhancement of facial attractiveness, in ACM Transactions on Graphics(TOG), 2008: 38.

[3] Tidderman B, Stirrat B, Perrett D I, Towards realism in facial image transformations: Results from a wavelet mrf method, Computer Graphics Forum,2005, vol. 24: 449-456.

篇9

關(guān)鍵詞:智能;監(jiān)控技術(shù);安防;應(yīng)用

中圖分類號:TB381 文獻(xiàn)標(biāo)識碼:A 文章編號:

引言

目前,傳統(tǒng)的視頻監(jiān)控系統(tǒng)已經(jīng)不能夠滿足快速發(fā)展的人類社會的需要,這就需要更加有效、更加智能的視頻監(jiān)控技術(shù)來滿足人們的需求。在視頻監(jiān)控里所說的智能視頻技術(shù)一般是指:“自動的分析和抽取視頻源中的關(guān)鍵信息。”我們可以把攝像機比作是人的眼睛,而智能視頻的系統(tǒng)和設(shè)備就好比是人用來思考的大腦。智能的視頻技術(shù)就是運用強大的計算機數(shù)據(jù)的處理功能,高速的分析視頻畫面里的大量的數(shù)據(jù),將那些對用戶沒用的信息過濾掉,只留下一些關(guān)鍵的信息。

一、智能視頻監(jiān)控技術(shù)及的工作原理

智能視頻監(jiān)控是將計算機視覺技術(shù)引入到視頻監(jiān)控中而產(chǎn)生的,目前,智能視頻監(jiān)控已經(jīng)成為計算機視覺中一個重要的研究領(lǐng)域,從監(jiān)控攝像頭開始,包括運動對象提取、對象描述、對象跟蹤、對象識別和對象的行為分析,最后進行預(yù)警或報警。

智能視頻監(jiān)控技術(shù)主要包括對視頻圖像序列自動地進行運動對象的提取、描述、跟蹤、識別和行為分析等方面的內(nèi)容。如果把攝像機看作人的眼睛,而智能視頻系統(tǒng)或設(shè)備則可以看作人的大腦。智能視頻監(jiān)控技術(shù)就是借助計算機強大的數(shù)據(jù)處理功能,對視頻畫面中的海量數(shù)據(jù)進行高速分析,過濾掉監(jiān)控者不關(guān)心的信息,僅僅為監(jiān)控者提供有用的關(guān)鍵信息。智能視頻監(jiān)控以數(shù)字化、網(wǎng)絡(luò)化視頻監(jiān)控為基礎(chǔ),但又有別于一般的網(wǎng)絡(luò)化視頻監(jiān)控,它是一種更高端的視頻監(jiān)控應(yīng)用。智能視頻監(jiān)控系統(tǒng)能夠識別不同的物體,發(fā)現(xiàn)監(jiān)控畫面中的異常情況,并能夠以最快和最佳的方式發(fā)出警報和提供有用信息,從而能夠更加有效的協(xié)助安全人員處理危機,并最大限度的降低誤報和漏報現(xiàn)象。其最終目的就是要使計算機能夠分析、描述和理解視頻畫面中的內(nèi)容。智能視頻監(jiān)控涉及到計算機視覺、圖像視頻處理和人工智能領(lǐng)域中的眾多核心技術(shù),是一個非常具有挑戰(zhàn)性的困難問題。

二、智能視頻監(jiān)控技術(shù)的主要優(yōu)勢

視頻監(jiān)控技術(shù)的升級換代除了追求高壓縮比、高清,還在從普通的視頻移動偵測向視頻分析邁進,具備更多面向特定應(yīng)用的智能(如防丟失、風(fēng)險管理、商業(yè)管理等等)。智能視頻的本質(zhì)就是對于視頻圖片進行一個數(shù)學(xué)上的分析處理,然后這個處理的結(jié)果為視頻的使用者提供一個決策和行動的建議。以下是智能視頻監(jiān)控的主要優(yōu)勢:

1、快速的反應(yīng)時間。毫秒級的報警觸發(fā)反應(yīng)時間。智能視頻監(jiān)控系統(tǒng)大大提高了報警的及時性,在事故發(fā)生的第一時間就會發(fā)出報警信號,使得事件能夠在最短的事件內(nèi)得以解決。

2、更有效的監(jiān)視。針對廣場、旅游景點等重要領(lǐng)域的監(jiān)控范圍廣、人流量大,且極易發(fā)生應(yīng)急事件的問題,要求高速球需具備速度快、精度高的特點,在出現(xiàn)警情的情況下,能夠更快速、便捷的跟蹤目標(biāo)移動物體,從而改變普通高速球的“被動監(jiān)控”的現(xiàn)狀,實現(xiàn)“主動監(jiān)控”。安保操作員只需要注意相關(guān)信息。

3、強大的數(shù)據(jù)檢索和分析功能。能提供快速的反應(yīng)時間和調(diào)查時間。智能視頻監(jiān)控系統(tǒng)能夠有效提高報警精確度,大大降低誤報和漏報現(xiàn)象的發(fā)生。智能視頻監(jiān)控系統(tǒng)的前端設(shè)備(網(wǎng)絡(luò)攝像機和視頻服務(wù)器)集成了強大的圖像。

4、有效擴展視頻資源的用途。無論是傳統(tǒng)的視頻監(jiān)控系統(tǒng)還是網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng),其所監(jiān)控到的視頻畫面都只能應(yīng)用在安全監(jiān)視領(lǐng)域,而在智能視頻系統(tǒng)中,這些視頻資源還可以有更多的用途。

智能視頻監(jiān)控設(shè)備比普通的網(wǎng)絡(luò)視頻監(jiān)控設(shè)備具備更加強大的圖像處理能力和智能因素,因此可以為用戶提供更多高級的視頻分析功能,它可以極大的提高視頻監(jiān)控系統(tǒng)的能力,并使視頻資源能夠發(fā)揮更大的作用。

三、智能視頻監(jiān)控技術(shù)在安防領(lǐng)域的應(yīng)用

1、主要安防應(yīng)用類型

智能視頻監(jiān)控除具有一般的數(shù)字監(jiān)控系統(tǒng)的優(yōu)勢外,還具有實現(xiàn)24×7 h全天候可靠監(jiān)控、報警精確度高、響應(yīng)速度快、有效擴展視頻資源的用途等特點。因此,隨著視頻監(jiān)控的普及以及監(jiān)控要求的提高,智能視頻監(jiān)控應(yīng)用范圍會不斷擴大。智能視頻監(jiān)控的應(yīng)用主要分為安防類應(yīng)用和非安防類應(yīng)用。安防類應(yīng)用是目前市場上存在的主要智能視頻應(yīng)用,主要包括:

(1)高級視頻移動偵測:在復(fù)雜的天氣環(huán)境中(例如雨雪、大霧、大風(fēng)等)精確的偵測和識別單個物體或多個物體的運動情況,包括運動方向、運動特征等。

(2)人物面部識別:自動識別人物的臉部特征,并經(jīng)與數(shù)據(jù)庫檔案的比較來識別或驗證人物身份。

(3)遺留、遺棄物品檢測:當(dāng)一個物體(如箱子、包裹、車輛、人物等)在敏感區(qū)域停留的時間過長,或超過了預(yù)定義的時間長度就產(chǎn)生報警。典型應(yīng)用場景包括機場、火車站、地鐵站等。

(4)車輛識別:識別車輛的形狀、顏色、車牌號碼等特征,并反饋給監(jiān)控者。可用在被盜車輛追蹤等場景中。

(5)人體行為分析:在目標(biāo)檢測分類的基礎(chǔ)上,利用人體的各種行為特征對其進行各種行為的描述和分析,提取哪些危險和有潛在危險的行為,如打斗、搶奪和突然倒地等行為。

(6)物體追蹤:偵測到移動物體之后,根據(jù)物體的運動情況,自動發(fā)送PTZ控制指令,使攝像機能自動跟蹤物體,在物體超出該攝像機監(jiān)控范圍之后,自動通知物體所在區(qū)域的攝像機繼續(xù)進行追蹤。

(7)入侵探測:可感知設(shè)定區(qū)域內(nèi)突然出現(xiàn)和入侵的物體并及時報警。比如在戒備森嚴(yán)的軍事重地或銀行博物館等重要場所出現(xiàn)可疑人物等。

(8)擁擠檢測:識別人群的整體運動特征,包括速度、方向等等,用以避免形成擁塞,或及時發(fā)現(xiàn)異常情況。典型的應(yīng)用場景包括超級市場、火車站等人員聚集的地方。

(9)物品被盜或移動檢測;當(dāng)監(jiān)控場景中的物體被盜和移動,算法將自動檢測這種動作,常用于貴重物品和關(guān)鍵設(shè)備的監(jiān)控。

(10)焰火檢測:根據(jù)發(fā)生火情過程中煙火表現(xiàn)出的時一空特征進行煙火的實時檢測。

2、應(yīng)用模式

智能視頻監(jiān)控技術(shù)具有2種應(yīng)用模式:

(1)與傳統(tǒng)的模擬視頻監(jiān)控系統(tǒng)結(jié)合使用,以突破傳統(tǒng)視頻監(jiān)控發(fā)展中遇到的瓶頸問題。主要用于對已存在的模擬視頻監(jiān)控系統(tǒng)進行智能化改造。選擇重點、高危監(jiān)控目標(biāo)和場所,針對該部分圖像進行分析,選擇智能視頻服務(wù)器(IVS BOX)實現(xiàn)主動監(jiān)控,同時將預(yù)警、警情實時發(fā)給模擬矩陣和DVR,完成快速切換和錄像。

(2)基于網(wǎng)絡(luò)的全數(shù)字化智能視頻監(jiān)控系統(tǒng)。該模式主要用于新建的數(shù)字化監(jiān)控系統(tǒng)中。同樣,選擇重點、高危監(jiān)控目標(biāo)和場所,直接在前端選擇智能視頻服務(wù)器(IVS BOX),實現(xiàn)主動監(jiān)控,將預(yù)警、警情實時發(fā)給后端智能管理平臺,完成快速切換和錄像。

3、實現(xiàn)方式

智能視頻監(jiān)控系統(tǒng)一般采用模塊化的設(shè)計方式,智能視頻分析模塊實現(xiàn)對運動目標(biāo)的自動檢測、識別、跟蹤和報警,是實現(xiàn)智能視頻監(jiān)控的核心。該模塊可以部署在監(jiān)控系統(tǒng)的前端采集部分,也可以置于監(jiān)控中心。其產(chǎn)品形態(tài)可以是嵌入式DSP板卡的方式(板卡可以集成在視頻服務(wù)器、數(shù)字錄像機、攝像機等設(shè)備中),也可以是純軟件的方式。

智能視頻分析模塊接收上位機發(fā)送的告警規(guī)則設(shè)置;對固定攝像頭攝取的圖像內(nèi)容進行高速分析與數(shù)據(jù)處理,實現(xiàn)目標(biāo)檢測和識別,對比預(yù)先設(shè)置的報警規(guī)則或用戶設(shè)定的條件給出預(yù)警、報警或處理結(jié)果。在發(fā)現(xiàn)威脅目標(biāo)并進行報警的同時,對目標(biāo)進行自動跟蹤。

結(jié)束語

智能化、數(shù)字化、網(wǎng)絡(luò)化是視頻監(jiān)控發(fā)展的必然趨勢,智能視頻監(jiān)控的出現(xiàn)正是這一趨勢的直接體現(xiàn)。智能視頻監(jiān)控設(shè)備比普通的網(wǎng)絡(luò)視頻監(jiān)控設(shè)備具備更加強大的圖像處理能力和智能因素,因此可以為用戶提供更多高級的視頻分析功能,它可以極大地提高視頻監(jiān)控系統(tǒng)的能力,并使視頻資源能夠發(fā)揮更大的作用,其在安防領(lǐng)域的應(yīng)用也必將越來越來越廣泛。

參考文獻(xiàn):

[1]周永紅.智能視頻監(jiān)控技術(shù)及應(yīng)用[J].智能建筑與城市信息,2009,6.

[2]呂立波.淺析智能視頻監(jiān)控技術(shù)及其主要應(yīng)用[J].中國公共安全雜志,2009,5.

篇10

關(guān)鍵詞:字符提取;HALCON;機器視覺;圖像處理

中圖分類號:TP319

文獻(xiàn)標(biāo)識碼:A

文章編號:16727800(2017)004008003

0引言

我國專利申請量居世界前列,每年都有數(shù)以百萬項專利申請。專利號是每個專利的唯一標(biāo)識,數(shù)目繁多,統(tǒng)計工作量巨大,人工管理專利作業(yè)不僅效率低,還容易出錯。因此,設(shè)計一種自動識別專利發(fā)票上的專利申請?zhí)栂到y(tǒng)十分必要。本文以專利發(fā)票為實驗對象,介紹一種票據(jù)字符提取系統(tǒng)。 隨著計算機技術(shù)和數(shù)字圖像處理技術(shù)的飛速發(fā)展,機器視覺廣泛應(yīng)用于生產(chǎn)生活中。視覺檢測技術(shù)作為機器視覺的重要研究領(lǐng)域,不僅能提高自動化程度,還能顯著提升檢測的安全性與可靠性[1]。當(dāng)今幾乎所有需要人類視覺的場合都可以用機器視覺技術(shù)來代替,尤其對于需要快速、重復(fù)地從圖像中獲取精確信息的場合,機器視覺技術(shù)是實現(xiàn)計算機集成制造的基礎(chǔ)技術(shù)[23]。 HALCON是德國MVtec公司開發(fā)的具有強大圖像處理功能的軟件,包含所有標(biāo)準(zhǔn)和高級的圖像處理方法,擁有非常完善的函數(shù)庫,包括定位、匹配、識別等高級算法,能夠進行圖像獲取、模板匹配、Blob分析、邊緣提取、測量、識別等[4],具有全面的視覺處理庫和應(yīng)用廣泛的機器視覺集成開發(fā)環(huán)境。HALCON通過交互編程開發(fā)應(yīng)用程序,或加入新的算子來實現(xiàn)視覺功能,是應(yīng)用效果最好的機器視覺處理軟件[2,5]。本文利用HALCON機器視覺技術(shù)設(shè)計并實現(xiàn)票據(jù)特定字符――專利申請?zhí)柕奶崛 ?/p>

1系統(tǒng)設(shè)計

基于機器視覺的專利收費票據(jù)檢測系統(tǒng)需要對置物臺上的專利收費票據(jù)進行采集和識別,最終提取出申請?zhí)栕址?。申請?zhí)栕址崛∠到y(tǒng)主要由電源光源部分、z像機傳感器單元、圖像采集單元和圖像處理操作平臺等構(gòu)成。通過調(diào)節(jié)器控制光源,攝像機傳感器和圖像采集單元由檢測元件控制。系統(tǒng)架構(gòu)如圖1所示。

系統(tǒng)流程如圖2所示。 申請?zhí)栕址崛∠到y(tǒng)中,用CMOS數(shù)字像機進行圖像采集,圖像采集單元主要完成置物臺上整個票據(jù)圖像的獲取。圖像采集和處理是機器視覺系統(tǒng)的核心,攝像機獲取的圖像包含了需要的所有信息,圖像質(zhì)量的好壞將直接影〖HJ*3〗響系統(tǒng)檢測效率和精度,是整個機器視覺系統(tǒng)的關(guān)鍵。光源則影響整個圖像質(zhì)量,合適的光源能很好地區(qū)分目標(biāo)信息和背景信息,影響輸入圖像的質(zhì)量和至少30%的應(yīng)用效果[6]。根據(jù)應(yīng)用需求,系統(tǒng)光源采用LED光源。系統(tǒng)工作時,采用檢測觸發(fā)抓拍方式獲取圖像,攝像機由檢測元件觸發(fā)控制。檢測元件由光電觸發(fā)器與反射板組成,它是一個反射型的觸發(fā)器。當(dāng)票據(jù)通過置物臺時,信號強度會變化,檢測元件據(jù)此輸出控制信號來觸發(fā)攝像機拍攝圖像[7]。拍攝的圖像傳送到采集單元,再經(jīng)過像機數(shù)據(jù)接口傳輸?shù)綑C器視覺圖像庫中,利用軟件中的算子功能對圖像進行相應(yīng)處理、識別和輸出。機器視覺軟件為HALCON 10.0。

2圖像處理技術(shù)

采用 OCR圖像處理方法檢測專利收費票據(jù)申請?zhí)栕址CR指通過圖像處理和模式識別技術(shù)對光學(xué)字符進行識別,用于閱讀和識別特定區(qū)域字符?;谀0鍣C制,針對不同票據(jù),定制不同的識別要素,專利票據(jù)為印刷票據(jù),因此采用OCR圖像處理方法對票據(jù)申請?zhí)栕址M行提取,基本步驟為:獲取圖像預(yù)處理圖像分割圖像OCR匹配識別字符輸出結(jié)果。

2.1獲取圖像

圖像獲取由攝像機傳感器、檢測元件等硬件設(shè)備和HALCON軟件算子共同完成,HALCON軟件首先調(diào)用open_framegrabber算子訪問圖像采集設(shè)備,再調(diào)用grab_image算子完成采集圖像,將采集得到的圖像加以保存,然后再調(diào)用read_image和dev_display把圖像顯示出來。票據(jù)圖像如圖3所示。

2.2預(yù)處理圖像

為使采集的圖像區(qū)域特征更加明顯,目標(biāo)信息更加突出,要經(jīng)過一系列預(yù)處理,主要有圖像增強、灰度值調(diào)節(jié)、濾波、填充縫隙、圖像分割等[7]。

2.2.1圖像增強與灰度值調(diào)整

調(diào)用emphasize算子,使發(fā)票上的信息顯示更為明顯。為了得到更清晰的申請?zhí)栕址枰獙⑸暾執(zhí)栃畔恼麄€票據(jù)復(fù)雜的背景中提取出來,消除噪聲,以降低后續(xù)步驟難度。采用閾值分割,調(diào)節(jié)灰度值調(diào)用threshold算子,調(diào)節(jié)灰度值過后的圖像突出了申請?zhí)栕址畔?,見圖4。

2.2.2填充縫隙與濾波 灰度值調(diào)整后的數(shù)字圖像仍存在許多噪聲,去除這些噪聲干擾,常采用數(shù)學(xué)形態(tài)學(xué)方法進行去噪[8]。數(shù)學(xué)形態(tài)學(xué)有4個基本運算:膨脹、腐蝕、開運算和閉運算。數(shù)學(xué)形態(tài)學(xué)利用結(jié)構(gòu)元素作為探針不斷移動圖像信息來了解圖像的結(jié)構(gòu)特征。為使圖像數(shù)字特征更為明顯,調(diào)用fill_up_shape和dilation_circle算子填充字符內(nèi)部的黑色部分;對深色部分進行處理時,調(diào)用形態(tài)學(xué)opening_circle算子以抑制雜波。為滿足申請?zhí)栕址珳?zhǔn)檢測提取要求,在圖像預(yù)處理階段需將灰度值調(diào)整、填充縫隙、濾波等3種處理方式相互協(xié)調(diào)使用。

2.3申請?zhí)柖ㄎ慌c分割圖像

申請?zhí)栕址ㄎ凰惴ㄊ钦麄€字符識別的核心,從專利票據(jù)可以看到許多數(shù)字組合,但是申請?zhí)柕奈粩?shù)是固定的,而且距離整個方框中心最近。基于此,可以根據(jù)申請?zhí)柕拈L度定位申請?zhí)?,但最下排漢字會存在干擾,如圖5所示綠色部分。 通過申請?zhí)柕姆娇騼蓷l豎線定位中心,尋找距離中心較近目標(biāo),即為申請?zhí)栁恢茫妶D5。HALCON主要程序如下:MiddleColumnSum:=0 for i := 1 to NumIntermediate2 by 1 MiddleColumnSum:=(Row22[i-1]+Row21[i-1])/2+MiddleColumnSum endfor MiddleColumn:= MiddleColumnSum/NumIntermediate2 **尋找與豎線中心坐標(biāo)最接近的目標(biāo),即為申請?zhí)杁evbig:=0 dev:=0 for i := 1 to NumIntermediate3 by 1 dev :=(Row22[i-1]+Row21[i-1])/2 if(dev>devbig) devbig:=dev n:=i endif endfor

確定申請?zhí)栁恢煤?,單獨分割提出申請?zhí)柌糠謭D像,見圖6,再應(yīng)用圖像處理技術(shù),對申請?zhí)栕址M行分割。首先進行圖像分割,通過對原始圖像進行某種方式的分割處理,提取圖像的某些特征,最常用的方法是閾值分割[910]。經(jīng)過處理后,申請?zhí)栕址赡艽嬖谝恍┪⑿〉臄嗔?,此時調(diào)用closing_circle算子以連接這些微小斷裂,減少誤識別。因為申請?zhí)栕址脚帕谐梢慌?,可以調(diào)用closing_rectanglel算子將申請?zhí)栕址谒椒较蚝喜⒊梢粋€整目標(biāo),調(diào)用connection算子把合并后的目標(biāo)區(qū)域轉(zhuǎn)換為一個個分離的對象,采用聯(lián)合與分割方法分開字符,調(diào)用intersection算子和connection算子得到分割好的底滯枷?。具^以上步驟,整個申請?zhí)栕址旧夏軌蚯逦仫@示出來,再使用sort_region算子將數(shù)字排列,調(diào)用region_to_bin算子把區(qū)域轉(zhuǎn)化成二值圖像,最后將圖像顯示出來,結(jié)果如圖7所示。

2.4OCR匹配

在HALCON軟件中進行OCR圖像處理和識別:根據(jù)申請?zhí)栕址卣?,將?jīng)過處理后的圖像與已知 “模板”進行比對,把置信度最高的值返回到class中,進行自動識別然后輸出結(jié)果。字符檢測提取 “模板”非常重要,它將決定最后匹配結(jié)果的精準(zhǔn)度。申請?zhí)栆话闶欠浅:唵蔚臄?shù)字和字母組合,所以本系統(tǒng)采用HALCON自帶的OCR模板庫即可。但是如果想識別其它文字等符號,則需要使用函數(shù)庫,或者創(chuàng)建及訓(xùn)練ORC分類器,即建立相應(yīng)的“模板”。

2.5識別字符

采用模板匹配法識別字符。將待識別的字符逐個與建立好的模板字符匹配。識別過程就是利用模板,對要識別的對象進行圖形處理,最后通過OCR模板匹配度算子得到結(jié)果。 首先調(diào)用read_ocr_class_mlp算子讀取分類文件,讀取 HALCON 自帶的 'Industrial_0-9A-Z.omc' 模板文件。do_ocr_multi_class_mlp算子將最終處理后得到的圖像與模板逐一匹配,得到匹配結(jié)果和匹配置信度,再調(diào)用smallest_rectangle1算子提取特征,得到該圖像上的字符方位,為后面定位操作提供參考。最后選擇一個起始位置顯示識別結(jié)果,這里要用到set_tposition 和write_string 兩個算子。程序運行結(jié)果見圖8。

3結(jié)語

票據(jù)特殊字符人工提取不僅工作量大、速度慢,而且枯燥乏味,容易因疏忽導(dǎo)致錯誤。本文將機器視覺技術(shù)應(yīng)用到專利票據(jù)申請?zhí)柼崛≈?,能?zhǔn)確識別出專利發(fā)票收據(jù)上的申請?zhí)?,實現(xiàn)了自動快速檢測提取,大幅降低了成本,提高了效率和準(zhǔn)確度。此技術(shù)還可識別增值稅發(fā)票等不同種類票據(jù),在財務(wù)管理等領(lǐng)域用途廣泛。

參考文獻(xiàn):[1]趙杰文,陳振濤,鄒小波.機器視覺實現(xiàn)方便面破損在線檢測的研究[J].微計算機信息,2007,23(10):238240.

[2]孫懷遠(yuǎn),廖躍華,周夫之,等.基于HALCON的藥品包裝瓶批號檢測技術(shù)研究[J].包裝工程,2008,29(8):7173.[3]彭曉輝.基于HALCON的IC卡噴碼符號識別技術(shù)研究與實現(xiàn)[D].廣州:廣東工業(yè)大學(xué),2006.

[4]肖???,葛廣英,姚坤,等.基于HALCON的噴碼字符識別技術(shù)的研究與實現(xiàn)[J].現(xiàn)代電子技術(shù),2015,38(15):9598.

[5]郭佳寅,岳秀江,吳雙,等.基于HALCON的乳制品箱體噴碼字符識別方法研究[J].制造業(yè)自動化,2013(3):2122.

[6]楊莉,潘豐.基于機器視覺的硬盤磁體檢測系統(tǒng)設(shè)計[J].江南大學(xué)學(xué)報:自然科學(xué)版,2012,11(5):505-508.[7]孫懷遠(yuǎn),楊麗英,周夫之.基于機器視覺技術(shù)的藥品瓶包裝在線檢測系統(tǒng)[J].自動化與控制,2011(2):4650.[8]春霞,魏敏,唐正寧.基于數(shù)學(xué)形態(tài)學(xué)的印刷網(wǎng)點圖像分割方法[J].包裝工程,2007,28(6):14-15,36.