計(jì)算機(jī)視覺(jué)基本原理范文
時(shí)間:2023-12-22 18:04:30
導(dǎo)語(yǔ):如何才能寫(xiě)好一篇計(jì)算機(jī)視覺(jué)基本原理,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
1、引言
隨著經(jīng)濟(jì)的迅猛發(fā)展,汽車(chē)的迅速普及,根據(jù)社會(huì)對(duì)汽車(chē)產(chǎn)業(yè)的要求,車(chē)輛的各方面指標(biāo)都受到人們?cè)絹?lái)越多地關(guān)注,汽車(chē)涂裝過(guò)程中的瑕疵直接影響汽車(chē)的外觀質(zhì)量,因此如何在生產(chǎn)過(guò)程中利用計(jì)算機(jī)視覺(jué)檢測(cè)技術(shù)檢測(cè)出并及時(shí)修補(bǔ)汽車(chē)涂裝過(guò)程中產(chǎn)生的瑕疵就成了首要的任務(wù)[1]。本文的研究?jī)?nèi)容是首先了解計(jì)算機(jī)視覺(jué)檢測(cè)系統(tǒng)的工作原理,汽車(chē)涂裝瑕疵的種類(lèi),然后結(jié)合兩者的特點(diǎn),應(yīng)用計(jì)算機(jī)視覺(jué)檢測(cè)系統(tǒng)檢測(cè)汽車(chē)涂裝瑕疵。該研究的價(jià)值在于兩方面:①對(duì)于汽車(chē)生產(chǎn)的自動(dòng)化和過(guò)程自動(dòng)化,計(jì)算機(jī)視覺(jué)是現(xiàn)實(shí)真正意義的自動(dòng)的基礎(chǔ)和一種重要的質(zhì)量控制的手段;②對(duì)于汽車(chē)涂裝瑕疵的修補(bǔ)可以提高其修補(bǔ)的精度。
2、汽車(chē)涂裝瑕疵的計(jì)算機(jī)視覺(jué)檢測(cè)系統(tǒng)
汽車(chē)涂裝瑕疵檢測(cè)系統(tǒng)主要包括照明系統(tǒng)、圖像采集卡、CCD攝像機(jī)、計(jì)算機(jī)以及軟件處理等幾個(gè)主要部分[2]。綜合計(jì)算機(jī)視覺(jué)檢測(cè)系統(tǒng)的構(gòu)成和線結(jié)構(gòu)光測(cè)量的原理,基于計(jì)算機(jī)視覺(jué)的汽車(chē)涂裝瑕疵的檢測(cè)系統(tǒng)大致是這樣構(gòu)成的:將線結(jié)構(gòu)光投射到被測(cè)物上,所形成的光斑作為傳感信號(hào),用CCD攝像機(jī)采集光斑圖像,采集到的圖像信號(hào)被傳輸?shù)接?jì)算機(jī),根據(jù)圖像處理和計(jì)算機(jī)視覺(jué)檢測(cè)系統(tǒng)的處理產(chǎn)生處理結(jié)果,返回到涂裝生產(chǎn)線,對(duì)車(chē)身的涂裝進(jìn)行修正,從而提高產(chǎn)品質(zhì)量。汽車(chē)涂裝瑕疵的視覺(jué)檢測(cè)系統(tǒng)如圖1所示[3]。
3、計(jì)算機(jī)視覺(jué)檢測(cè)
計(jì)算機(jī)視覺(jué)是計(jì)算機(jī)對(duì)圖像進(jìn)行自動(dòng)處理并報(bào)告“圖像中有什么”的過(guò)程,也就是說(shuō)它識(shí)別圖像中的內(nèi)容。圖像中的內(nèi)容往往是某些機(jī)器零件,而處理的目標(biāo)不僅要能對(duì)機(jī)器零件定位,還要能對(duì)其進(jìn)行檢驗(yàn)。計(jì)算機(jī)視覺(jué)系統(tǒng)基本原理:機(jī)器視覺(jué)系統(tǒng)通常采用CCD相機(jī)攝取圖像,將其轉(zhuǎn)化為數(shù)字信號(hào),再采用先進(jìn)的計(jì)算機(jī)硬件與軟件技術(shù)對(duì)圖像數(shù)字信號(hào)進(jìn)行處理,從而得到所需要的各種目標(biāo)圖像特征值,并在此基礎(chǔ)上實(shí)現(xiàn)模式識(shí)別、坐標(biāo)計(jì)算、灰度分布圖等多種功能。計(jì)算機(jī)視覺(jué)系統(tǒng)能夠根據(jù)其檢測(cè)結(jié)果快速地顯示圖像、輸出數(shù)據(jù)、指令,執(zhí)行機(jī)構(gòu)可以配合其完成指令的實(shí)施。計(jì)算機(jī)視覺(jué)系統(tǒng)主要由圖像獲取、圖像分析和處理、輸出顯示或控制三個(gè)功能模塊組成[4]。視覺(jué)檢測(cè)按其所處理的數(shù)據(jù)類(lèi)型可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺(jué)檢測(cè)。另外,還有X射線檢測(cè)、超聲波檢測(cè)和紅外線檢測(cè)。一個(gè)完整視覺(jué)檢測(cè)系統(tǒng)包括:圖像采集、圖像分割、零件識(shí)別、模型匹配和決策判斷。Newman[5]等描述了利用深度圖像進(jìn)行零件檢測(cè)的AVI系統(tǒng),具有一定的代表性。一個(gè)典型的AVI系統(tǒng)如圖2所示。
4、汽車(chē)涂裝瑕疵的檢測(cè)算法
由于汽車(chē)涂膜中一些缺陷的邊界比較模糊,例如:氣泡、爆裂氣泡孔、氣泡針孔、抽縮等等。邊緣處灰度變化很小,直接用傳統(tǒng)的微分邊緣檢測(cè)算法無(wú)法有效的檢測(cè)出來(lái)。所以對(duì)缺陷模糊邊緣的檢測(cè)成為了算法的關(guān)鍵[6]。本文介紹了基于線結(jié)構(gòu)光的邊緣檢測(cè)方法。汽車(chē)涂裝表面被光源投射器發(fā)出的線結(jié)構(gòu)光照射,反射出的圖像被CCD攝像機(jī)所接收傳輸?shù)接?jì)算機(jī)視覺(jué)檢測(cè)系統(tǒng)中。若涂裝表面沒(méi)有瑕疵,則產(chǎn)生圖3的圖像。若涂裝表面有瑕疵,則產(chǎn)生圖4的圖像[7]。
篇2
關(guān)鍵詞:三維點(diǎn)云;配準(zhǔn);迭代最近點(diǎn)
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2012)31-7568-03
在計(jì)算機(jī)應(yīng)用領(lǐng)域,三維點(diǎn)云數(shù)據(jù)的配準(zhǔn)對(duì)解決曲線曲面匹配、圖像拼接、三維重建、計(jì)算機(jī)輔助文物復(fù)原等問(wèn)題至關(guān)重要。以計(jì)算機(jī)輔助文物碎片拼接為例,在過(guò)去十年間有很多研究項(xiàng)目需要獲取文物詳細(xì)的三維表示,但是通過(guò)三維掃描設(shè)備獲取的多個(gè)掃描需要采取一定的技術(shù)恢復(fù)每個(gè)掃描的相對(duì)視點(diǎn),然后將多個(gè)掃描融合到一個(gè)最終的模型。這一過(guò)程就是三維點(diǎn)云數(shù)據(jù)的配準(zhǔn),它是獲取文物準(zhǔn)確的三維表示的關(guān)鍵步驟。1992年,Besl和Mckay提出了一種基于幾何模型的三維物體配準(zhǔn)算法——迭代最近點(diǎn)算法[1]。近年來(lái),伴隨著三維掃描技術(shù)的不斷進(jìn)步,該算法得到了廣泛應(yīng)用,也吸引了眾多研究者的目光。許多研究者對(duì)該算法進(jìn)行了系統(tǒng)的研究,分析了該算法的特點(diǎn)與不足,提出了各種改進(jìn)算法。國(guó)外學(xué)者M(jìn)ichael Wild[2]回顧了2002年到2007年ICP算法的發(fā)展;介紹了ICP算法的流程并對(duì)幾種改進(jìn)算法做了詳細(xì)的分析和比較;最后介紹了該算法在放射療法中的應(yīng)用。近幾年,ICP算法的研究改進(jìn)以及應(yīng)用仍然是國(guó)內(nèi)外眾多學(xué)者熱衷的一個(gè)研究方向,這從發(fā)表在IEEE上的論文數(shù)量即可看出。本文詳細(xì)總結(jié)了ICP算法的基本原理,然后從數(shù)據(jù)采樣、特征點(diǎn)選取與點(diǎn)對(duì)權(quán)重、非重疊區(qū)域檢測(cè)、兼容性約束四個(gè)方面對(duì)幾種改進(jìn)算法進(jìn)行了系統(tǒng)而詳細(xì)的分析與研究。總結(jié)了這些算法的基本思想和特點(diǎn),這些工作對(duì)后期的研究將會(huì)起到重要的作用。
1 ICP算法的基本原理
篇3
關(guān)鍵詞:嵌入式;GUI;QT;OpenCV
中圖分類(lèi)號(hào):TP368.1
1 目前主流的嵌入式GUI
GUI技術(shù)是嵌入式的關(guān)鍵技術(shù)之一,其直接關(guān)系到產(chǎn)品的界面友好性程度,最終影響到產(chǎn)品的競(jìng)爭(zhēng)力。
目前主流的嵌入式GUI主要有以下幾種:
Microwindows的體系結(jié)構(gòu)由上至下,分別為API層、圖形引擎層、驅(qū)動(dòng)層、硬件層,用戶可以根據(jù)具體的應(yīng)用需求來(lái)實(shí)現(xiàn)每一個(gè)層。
MiniGUI的實(shí)現(xiàn)主要依賴(lài)于標(biāo)準(zhǔn)C的庫(kù)函數(shù),它可以任意在支持標(biāo)準(zhǔn)C的環(huán)境上運(yùn)行,MiniGUI很小巧但也很高效。MiniGUI主要應(yīng)用在一些中低端設(shè)備中。
2 QT的搭建
由于QT具有跨平臺(tái)的特性,所以一般開(kāi)發(fā)可以在windows下開(kāi)發(fā),再移植到Linux中,本文重點(diǎn)介紹QT在Windows下的使用。
QT的開(kāi)發(fā)環(huán)境包括以下幾部分:QT的GUI庫(kù),QT creator,windows版本還包含編譯器,可以是Microsoft visual stdio c++,還可以是MinGW,本文中使用的是MinGW。
搭建QT開(kāi)發(fā)環(huán)境包括以下幾部分:(1)下載安裝MinGW編譯器,該編譯器支持Gcc和G++。(2)下載安裝qt-creator-win-opensource。(3)為QT、MinGW、qmake添加環(huán)境變量。
3 OpenCV的安裝配置
3.1 OpenCV簡(jiǎn)介。QT中本身也支持視頻處理,但功能十分有限,如果需要更強(qiáng)大的視頻處理功能,需要引入OpenCV(open source computer vision library),即開(kāi)源計(jì)算機(jī)視覺(jué)庫(kù)。
3.2 OpenCV的優(yōu)點(diǎn):(1)開(kāi)源。OpenCV完全遵循BSD協(xié)議(五大開(kāi)源許可協(xié)議之一),具有極高的開(kāi)放性。(2)跨平臺(tái)。OpenCV支持Windows、Linux,Mac,可以輕松實(shí)現(xiàn)平臺(tái)之間的移植。(3)效率高,速度快。由于OpenCV采用C++實(shí)現(xiàn),并且算法經(jīng)過(guò)優(yōu)化,效率有較大程度的提高,執(zhí)行的速度也比較快。(4)涵蓋面廣、功能強(qiáng)大。OpenCV主要有13個(gè)模塊構(gòu)成,涵蓋了計(jì)算機(jī)視覺(jué)的各個(gè)方面,在相關(guān)方面基本都應(yīng)用。
3.3 OpenCV的安裝配置:(1)前提是QT已經(jīng)安裝配置成功。(2)下載OpenCV。下載OpenCV后,解壓即可,實(shí)際上并不需要安裝,注意解壓路徑不能有空格,否則會(huì)出錯(cuò)。(3)下載安裝CMake。OpenCV只是一個(gè)庫(kù),并不能直接拿來(lái)使用,需要借助CMake將其編譯后才可以使用。(4)配置CMake參數(shù),進(jìn)行編譯。使用CMake,主要是設(shè)定OpenCV的輸入路徑、輸出路徑、MinGW的位置等相關(guān)信息。運(yùn)行CMake之后,需要在命令提示符下進(jìn)入輸出路徑,然后執(zhí)行mingw32-make命令,由MinGW對(duì)OpenCV進(jìn)行編譯,其間會(huì)耗費(fèi)一定的時(shí)間。此步驟成功后,再執(zhí)行mingw32-make install命令,會(huì)把編譯好的所有文放到這個(gè)文件夾下,這個(gè)就是將來(lái)開(kāi)發(fā)要用到的OpenCV全部文件。(5)將上一步驟得到的install目錄bin文件夾,添加到系統(tǒng)的環(huán)境變量中,重新啟動(dòng)電腦。(6)在QT工程中,打開(kāi).pro工程屬性文件,將OpenCV添加到INCLUDEPATH和LIBS中后,就可以在QT開(kāi)發(fā)中使用OpenCV計(jì)算機(jī)視覺(jué)庫(kù)了。
4 在QT中通過(guò)OpenCV實(shí)現(xiàn)視頻處理
4.1 實(shí)現(xiàn)的基本原理。在視頻處理中主要用到OpenCV的highgui模塊,該模塊,前面已說(shuō)過(guò),主要完成視頻捕捉、編碼,圖片處理等相關(guān)功能。
highgui模塊中已經(jīng)封裝了視頻、圖像、窗口的所有操作。
首先,利用OpenCV建立窗口,然后打開(kāi)攝像頭,獲取攝像頭中的幀,然后申請(qǐng)IplImage類(lèi)型的指針,將幀放入指針指向的內(nèi)存空間,此時(shí)的只是靜止的圖像而已,為了符合我們?nèi)搜鄣挠^看習(xí)慣,再通過(guò)循環(huán),達(dá)到每秒鐘顯示30次左右的效果,與放電影的原理基本一樣,最終顯示到窗口,看到就是動(dòng)態(tài)的視頻效果,使用完之后釋放內(nèi)存,釋放窗口即可。
5 總結(jié)
嵌入式技術(shù)在當(dāng)前的大環(huán)境下得到了快速發(fā)展,隨著硬件設(shè)備性能的不斷提高,高性能的嵌入式程序會(huì)越來(lái)越廣泛地被使用,而QT恰好與這個(gè)大環(huán)境相吻合,同時(shí)OpenCV的出現(xiàn)對(duì)QT也是一個(gè)促進(jìn),QT+OpenCV模式在未來(lái)嵌入式視頻處理中會(huì)廣泛地被使用。
參考文獻(xiàn):
[1]彭均鍵,史步海,劉洋.基于Qt的嵌入式GUI開(kāi)發(fā)平臺(tái)的搭建[J].微型電腦應(yīng)用,2010,2.
[2]郭暉,陳光.基于OpenCV的視頻圖像處理應(yīng)用研究[J].微型機(jī)與應(yīng)用,2010,21.
[3]秦小文,溫志芳,喬維維.基于OpenCV的圖像處理[J].電子測(cè)試,2011-7.
[4]許生模,余敏.嵌入式QT的內(nèi)核分析與優(yōu)化[J].微計(jì)算機(jī)信息,2007-10.
[5]陳峰,郭爽,趙欣.基于QT和嵌入式的視頻監(jiān)控系統(tǒng)[J].通信技術(shù),2011,10.
篇4
【關(guān)鍵詞】量子計(jì)算;量子計(jì)算機(jī);量子算法;量子信息處理
1、引言
在人類(lèi)剛剛跨入21山_紀(jì)的時(shí)刻,!日_界科技的重大突破之一就是量子計(jì)算機(jī)的誕生。德國(guó)科學(xué)家已在實(shí)驗(yàn)室研制成功5個(gè)量子位的量子計(jì)算機(jī),而美國(guó)LosAlamos國(guó)家實(shí)驗(yàn)室正在進(jìn)行7個(gè)量子位的量子計(jì)算機(jī)的試驗(yàn)。它預(yù)示著人類(lèi)的信息處理技術(shù)將會(huì)再一次發(fā)生巨大的飛躍,而研究面向量子計(jì)算機(jī)以量子計(jì)算為基礎(chǔ)的量子信息處理技術(shù)已成為一項(xiàng)十分緊迫的任務(wù)。
2、子計(jì)算的物理背景
任何計(jì)算裝置都是一個(gè)物理系統(tǒng)。量子計(jì)算機(jī)足根據(jù)物理系統(tǒng)的量子力學(xué)性質(zhì)和規(guī)律執(zhí)行計(jì)算任務(wù)的裝置。量子計(jì)算足以量子計(jì)算目L為背景的計(jì)算。是在量了力。4個(gè)公設(shè)(postulate)下做出的代數(shù)抽象。Feylllilitn認(rèn)為,量子足一種既不具有經(jīng)典耗子性,亦不具有經(jīng)典渡動(dòng)性的物理客體(例如光子)。亦有人將量子解釋為一種量,它反映了一些物理量(如軌道能級(jí))的取值的離散性。其離散值之問(wèn)的差值(未必為定值)定義為量子。按照量子力學(xué)原理,某些粒子存在若干離散的能量分布。稱(chēng)為能級(jí)。而某個(gè)物理客體(如電子)在另一個(gè)客體(姻原子棱)的離散能級(jí)之間躍遷(transition。粒子在不同能量級(jí)分布中的能級(jí)轉(zhuǎn)移過(guò)程)時(shí)將會(huì)吸收或發(fā)出另一種物理客體(如光子),該物理客體所攜帶的能量的值恰好是發(fā)生躍遷的兩個(gè)能級(jí)的差值。這使得物理“客體”和物理“量”之問(wèn)產(chǎn)生了一個(gè)相互溝通和轉(zhuǎn)化的橋梁;愛(ài)因斯坦的質(zhì)能轉(zhuǎn)換關(guān)系也提示了物質(zhì)和能量在一定條件下是可以相互轉(zhuǎn)化的因此。量子的這兩種定義方式是對(duì)市統(tǒng)并可以相互轉(zhuǎn)化的。量子的某些獨(dú)特的性質(zhì)為量了計(jì)算的優(yōu)越性提供了基礎(chǔ)。
3、量子計(jì)算機(jī)的特征
量子計(jì)算機(jī),首先是能實(shí)現(xiàn)量子計(jì)算的機(jī)器,是以原子量子態(tài)為記憶單元、開(kāi)關(guān)電路和信息儲(chǔ)存形式,以量子動(dòng)力學(xué)演化為信息傳遞與加工基礎(chǔ)的量子通訊與量子計(jì)算,是指組成計(jì)算機(jī)硬件的各種元件達(dá)到原子級(jí)尺寸,其體積不到現(xiàn)在同類(lèi)元件的1%。量子計(jì)算機(jī)是一物理系統(tǒng),它能存儲(chǔ)和處理關(guān)于量子力學(xué)變量的信息。量子計(jì)算機(jī)遵從的基本原理是量子力學(xué)原理:量子力學(xué)變量的分立特性、態(tài)迭加原理和量子相干性。信息的量子就是量子位,一位信息不是0就是1,量子力學(xué)變量的分立特性使它們可以記錄信息:即能存儲(chǔ)、寫(xiě)入、讀出信息,信息的一個(gè)量子位是一個(gè)二能級(jí)(或二態(tài))系統(tǒng),所以一個(gè)量子位可用一自旋為1/2的粒子來(lái)表示,即粒子的自旋向上表示1,自旋向下表示0;或者用一光子的兩個(gè)極化方向來(lái)表示0和1;或用一原子的基態(tài)代表0第一激發(fā)態(tài)代表1。就是說(shuō)在量子計(jì)算機(jī)中,量子信息是存儲(chǔ)在單個(gè)的自旋’、光子或原子上的。對(duì)光子來(lái)說(shuō),可以利用Kerr非線性作用來(lái)轉(zhuǎn)動(dòng)一光束使之線性極化,以獲取寫(xiě)入、讀出;對(duì)自旋來(lái)說(shuō),則是把電子(或核)置于磁場(chǎng)中,通過(guò)磁共振技術(shù)來(lái)獲取量子信息的讀出、寫(xiě)入;而寫(xiě)入和讀出一個(gè)原子存儲(chǔ)的信息位則是用一激光脈沖照射此原子來(lái)完成的。量子計(jì)算機(jī)使用兩個(gè)量子寄存器,第一個(gè)為輸入寄存器,第二個(gè)為輸出寄存器。函數(shù)的演化由幺正演化算符通過(guò)量子邏輯門(mén)的操作來(lái)實(shí)現(xiàn)。單量子位算符實(shí)現(xiàn)一個(gè)量子位的翻轉(zhuǎn)。兩量子位算符,其中一個(gè)是控制位,它確定在什么情況下目標(biāo)位才發(fā)生改變;另一個(gè)是目標(biāo)位,它確定目標(biāo)位如何改變;翻轉(zhuǎn)或相位移動(dòng)。還有多位量子邏輯門(mén),種類(lèi)很多。要說(shuō)清楚量子計(jì)算,首先看經(jīng)典計(jì)算。經(jīng)典計(jì)算機(jī)從物理上可以被描述為對(duì)輸入信號(hào)序列按一定算法進(jìn)行交換的機(jī)器,其算法由計(jì)算機(jī)的內(nèi)部邏輯電路來(lái)實(shí)現(xiàn)。經(jīng)典計(jì)算機(jī)具有如下特點(diǎn):
a)其輸入態(tài)和輸出態(tài)都是經(jīng)典信號(hào),用量子力學(xué)的語(yǔ)言來(lái)描述,也即是:其輸入態(tài)和輸出態(tài)都是某一力學(xué)量的本征態(tài)。如輸入二進(jìn)制序列0110110,用量子記號(hào),即10110110>。所有的輸入態(tài)均相互正交。對(duì)經(jīng)典計(jì)算機(jī)不可能輸入如下疊加Cl10110110>+C2I1001001>。
b)經(jīng)典計(jì)算機(jī)內(nèi)部的每一步變換都將正交態(tài)演化為正交態(tài),而一般的量子變換沒(méi)有這個(gè)性質(zhì),因此,經(jīng)典計(jì)算機(jī)中的變換(或計(jì)算)只對(duì)應(yīng)一類(lèi)特殊集。
相應(yīng)于經(jīng)典計(jì)算機(jī)的以上兩個(gè)限制,量子計(jì)算機(jī)分別作了推廣。量子計(jì)算機(jī)的輸入用一個(gè)具有有限能級(jí)的量子系統(tǒng)來(lái)描述,如二能級(jí)系統(tǒng)(稱(chēng)為量子比特),量子計(jì)算機(jī)的變換(即量子計(jì)算)包括所有可能的幺正變換。因此量子計(jì)算機(jī)的特點(diǎn)為:
a)量子計(jì)算機(jī)的輸入態(tài)和輸出態(tài)為一般的疊加態(tài),其相互之間通常不正交;
b)量子計(jì)算機(jī)中的變換為所有可能的幺正變換。得出輸出態(tài)之后,量子計(jì)算機(jī)對(duì)輸出態(tài)進(jìn)行一定的測(cè)量,給出計(jì)算結(jié)果。由此可見(jiàn),量子計(jì)算對(duì)經(jīng)典計(jì)算作了極大的擴(kuò)充,經(jīng)典計(jì)算是一類(lèi)特殊的量子計(jì)算。量子計(jì)算最本質(zhì)的特征為量子疊加性和相干性。量子計(jì)算機(jī)對(duì)每一個(gè)疊加分量實(shí)現(xiàn)的變換相當(dāng)于一種經(jīng)典計(jì)算,所有這些經(jīng)典計(jì)算同時(shí)完成,并按一定的概率振幅疊加起來(lái),給出量子計(jì)算的輸出結(jié)果。這種計(jì)算稱(chēng)為量子并行計(jì)算,量子并行處理大大提高了量子計(jì)算機(jī)的效率,使得其可以完成經(jīng)典計(jì)算機(jī)無(wú)法完成的工作,這是量子計(jì)算機(jī)的優(yōu)越性之一。
4、量子計(jì)算機(jī)的應(yīng)用
量子計(jì)算機(jī)驚人的運(yùn)算能使其能夠應(yīng)用于電子、航空、航人、人文、地質(zhì)、生物、材料等幾乎各個(gè)學(xué)科領(lǐng)域,尤其是信息領(lǐng)域更是迫切需要量子計(jì)算機(jī)來(lái)完成大量數(shù)據(jù)處理的工作。信息技術(shù)與量子計(jì)算必然走向結(jié)合,形成新興的量子信息處理技術(shù)。目前,在信息技術(shù)領(lǐng)域有許多理論上非常有效的信息處理方法和技術(shù),由于運(yùn)算量龐大,導(dǎo)致實(shí)時(shí)性差,不能滿足實(shí)際需要,因此制約了信息技術(shù)的發(fā)展。量子計(jì)算機(jī)自然成為繼續(xù)推動(dòng)計(jì)算速度提高,進(jìn)而引導(dǎo)各個(gè)學(xué)科全面進(jìn)步的有效途徑之一。在目前量子計(jì)算機(jī)還未進(jìn)入實(shí)際應(yīng)用的情況下,深入地研究量子算法是量子信息處理領(lǐng)域中的主要發(fā)展方向,其研究重點(diǎn)有以下三個(gè)方面;
(1)深刻領(lǐng)悟現(xiàn)有量子算法的木質(zhì),從中提取能夠完成特定功能的量子算法模塊,用其代替經(jīng)典算法中的相應(yīng)部分,以便盡可能地減少現(xiàn)有算法的運(yùn)算量;
(2)以現(xiàn)有的量子算法為基礎(chǔ),著手研究新型的應(yīng)用面更廣的信息處理量子算法;
(3)利用現(xiàn)有的計(jì)算條件,盡量模擬量子計(jì)算機(jī)的真實(shí)運(yùn)算環(huán)境,用來(lái)驗(yàn)證和開(kāi)發(fā)新的算法。
5、量子計(jì)算機(jī)的應(yīng)用前景
目前經(jīng)典的計(jì)算機(jī)可以進(jìn)行復(fù)雜計(jì)算,解決很多難題。但依然存在一些難解問(wèn)題,它們的計(jì)算需要耗費(fèi)大量的時(shí)間和資源,以致在宇宙時(shí)間內(nèi)無(wú)法完成。量子計(jì)算研究的一個(gè)重要方向就是致力于這類(lèi)問(wèn)題的量子算法研究。量子計(jì)算機(jī)首先可用于因子分解。因子分解對(duì)于經(jīng)典計(jì)算機(jī)而言是難解問(wèn)題,以至于它成為共鑰加密算法的理論基礎(chǔ)。按照Shor的量子算法,量子計(jì)算機(jī)能夠以多項(xiàng)式時(shí)間完成大數(shù)質(zhì)因子的分解。量子計(jì)算機(jī)還可用于數(shù)據(jù)庫(kù)的搜索。1996年,Grover發(fā)現(xiàn)了未加整理數(shù)據(jù)庫(kù)搜索的Grover迭代量子算法。使用這種算法,在量子計(jì)算機(jī)上可以實(shí)現(xiàn)對(duì)未加整理數(shù)據(jù)庫(kù)Ⅳ的平方根量級(jí)加速搜索,而且用這種加速搜索有可能解決經(jīng)典上所謂的NP問(wèn)題。量子計(jì)算機(jī)另一個(gè)重要的應(yīng)用是計(jì)算機(jī)視覺(jué),計(jì)算機(jī)視覺(jué)是一種通過(guò)二維圖像理解三維世界的結(jié)構(gòu)和特性的人工智能。計(jì)算機(jī)視覺(jué)的一個(gè)重要領(lǐng)域是圖像處理和模式識(shí)別。由于圖像包含的數(shù)據(jù)量很大,以致不得不對(duì)圖像數(shù)據(jù)進(jìn)行壓縮。這種壓縮必然會(huì)損失一部分原始信息。
作者簡(jiǎn)介:
篇5
[關(guān)鍵詞] 數(shù)字圖像、編碼編碼方法
中圖分類(lèi)號(hào):TN131+.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):
1 引言
數(shù)字圖像處理又稱(chēng)為計(jì)算機(jī)圖像處理,它是指將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并利用計(jì)算機(jī)對(duì)其進(jìn)行處理的過(guò)程。早期圖像處理的目的是改善圖像的質(zhì)量,它以人為對(duì)象,以改善人的視覺(jué)效果為目的。圖像處理中,輸入的是質(zhì)量低的圖像,輸出的是改善質(zhì)量后的圖像。常見(jiàn)的圖像處理有圖像數(shù)字化、圖像編碼、圖像增強(qiáng)、圖像復(fù)原、圖像分割與圖像分析等。圖像編碼是對(duì)圖像信息進(jìn)行編碼,可以壓縮圖像的信息量,以便滿足傳輸與存儲(chǔ)的要求。本文主要介紹了圖像編碼的基本原理和技術(shù)方法。
一幅二維數(shù)字圖像可以由一個(gè)二維亮度函數(shù)通過(guò)采樣和量化后而得到的一個(gè)二維數(shù)組表示。這樣一個(gè)二維數(shù)組的數(shù)據(jù)量通常很大,從而對(duì)存儲(chǔ)、處理和傳輸都帶來(lái)了許多問(wèn)題,提出了許多新的要求。為此人們?cè)噲D采用對(duì)圖像新的表達(dá)方法以減少表示一幅圖像需要的數(shù)據(jù)量,這就是圖像編碼所要解決的主要問(wèn)題。壓縮數(shù)據(jù)量的主要方法是消除冗余數(shù)據(jù),從數(shù)學(xué)角度來(lái)講是要將原始圖像轉(zhuǎn)化為從統(tǒng)計(jì)角度看盡可能不相關(guān)的數(shù)據(jù)集。這個(gè)轉(zhuǎn)換要在圖像進(jìn)行存儲(chǔ)、處理和傳輸之前進(jìn)行,然后將壓縮了的圖像解壓縮以重建原始圖像,即通常所稱(chēng)的圖像編碼和圖像解碼。
2 傳統(tǒng)編碼方法
傳統(tǒng)的編碼方法可以分成兩大類(lèi),預(yù)測(cè)編碼方法(對(duì)應(yīng)空域方法)和變換編碼方法(對(duì)應(yīng)頻域編碼方法)。預(yù)測(cè)編碼方法的優(yōu)點(diǎn)是:算法一般較簡(jiǎn)單,易于用硬件實(shí)現(xiàn);缺點(diǎn)是:壓縮比不夠大,承受誤碼的能力較差。由于它采用的最小均方誤差準(zhǔn)則不能反映人眼的視覺(jué)心理特性,近年來(lái)已較少單獨(dú)采用,而是與其他方法混合使用。另外,由于DPCM編碼系統(tǒng)會(huì)引起斜率過(guò)載、界線繁忙、顆粒噪聲和輪廓噪聲,在使用中應(yīng)加以考慮。變換編碼方法的優(yōu)點(diǎn)是:壓縮比高、承受誤碼能力強(qiáng);缺點(diǎn)是:算法較復(fù)雜。
3 現(xiàn)代編碼方法
31 第二代圖像編碼方法
第二代圖像編碼方法[2]是針對(duì)傳統(tǒng)編碼方法中沒(méi)有考慮人眼對(duì)輪廓、邊緣的特殊敏感性和方向感知特性而提出的。它認(rèn)為傳統(tǒng)的第一代編碼技術(shù)以信息論和數(shù)字信號(hào)處理技術(shù)為理論基礎(chǔ),出發(fā)點(diǎn)是消除圖像數(shù)據(jù)的統(tǒng)計(jì)冗余信息,包括信息熵冗余、空間冗余和時(shí)間冗余。其編碼壓縮圖像數(shù)據(jù)的能力已接近極限,壓縮比難以提高。第二代圖像編碼方法充分利用人眼視覺(jué)系統(tǒng)的生理和心理視覺(jué)冗余特性以及信源的各種性質(zhì)以期獲得高壓縮比,這類(lèi)方法一般要對(duì)圖像進(jìn)行預(yù)處理,將圖像數(shù)據(jù)根據(jù)視覺(jué)敏感性進(jìn)行分割。
按處理方法的不同,第二代圖像編碼方法可分為兩種典型的編碼技術(shù)[3]:一種是基于分裂合并的方法,先將圖像分為紋理和邊緣輪廓,然后各自采用不同的方法編碼;另一種是基于各向異性濾波器的方法,先對(duì)圖像進(jìn)行方向性濾波,得到不同方向的圖像信息,再根據(jù)人眼的方向敏感性對(duì)各個(gè)通道采用特定的方法單獨(dú)編碼。
32 分形圖像編碼
分形圖像編碼是在分形幾何理論的基礎(chǔ)上發(fā)展起來(lái)的一種編碼方法。分形理論是歐氏幾何相關(guān)理論的擴(kuò)展,是研究不規(guī)則圖形和混沌運(yùn)動(dòng)的一門(mén)新科學(xué)。它描述了自然界物體的自相似性,這種自相似性可以是確定的,也可以是統(tǒng)計(jì)意義上的。這一理論基礎(chǔ)決定了它只有對(duì)具備明顯自相似性或統(tǒng)計(jì)自相似性的圖像,例如海岸線、云彩、大樹(shù)等才有較高的編碼效率。而一般圖像不具有這一特性,因此編碼效率與圖像性質(zhì)學(xué)特性有關(guān),而且分形圖像編碼方法實(shí)質(zhì)上是通過(guò)消除圖像的幾何冗余來(lái)壓縮數(shù)據(jù)的,根本沒(méi)有考慮人眼視覺(jué)特性的作用。
33 基于模型的圖像編碼
基于模型的圖像編碼技術(shù)[4]是近幾年發(fā)展起來(lái)的一種很有前途的編碼方法。它利用了計(jì)算機(jī)視覺(jué)和計(jì)算機(jī)圖形學(xué)中的方法和理論,其基本出發(fā)點(diǎn)是在編、解碼兩端分別建立起相同的模型,針對(duì)輸入的圖像提取模型參數(shù),或根據(jù)模型參數(shù)重建圖像。模型編碼方法的核心是建模和提取模型參數(shù),其中模型的選取、描述和建立是決定模型編碼質(zhì)量的關(guān)鍵因素。為了對(duì)圖像數(shù)據(jù)建模,一般要求對(duì)輸入圖像要有某些先驗(yàn)知識(shí)。
基于模型的圖像編碼方法是利用先驗(yàn)?zāi)P蛠?lái)抽取圖像中的主要信息,并以模型參數(shù)的形式表示它們,因此可以獲得很高的壓縮比。然而在模型編碼方法的研究中還存在很多問(wèn)題,例如:①模型法需要先驗(yàn)知識(shí),不適合一般的應(yīng)用;②對(duì)不同的應(yīng)用所建模型是不一樣的;③在線框模型中控制點(diǎn)的個(gè)數(shù)不易確定,還未找到有效的方法能根據(jù)圖像內(nèi)容來(lái)選取;④由于利用模型法壓縮后復(fù)原圖像的大部分是用圖形學(xué)的方法產(chǎn)生的,因此看起來(lái)不夠自然;⑤傳統(tǒng)的誤差評(píng)估準(zhǔn)則不適合用于對(duì)模型編碼的評(píng)價(jià)。
34小波圖像編碼
一維連續(xù)小波變換可看成原始信號(hào)和一組不同尺度的小波帶通濾波器的濾波運(yùn)算,從而可把信號(hào)分解到一系列頻帶上進(jìn)行分析處理。將其離散化后即為離散小波變換。小波變換圖像編碼壓縮[6]的核心問(wèn)題是要對(duì)子帶圖像進(jìn)行小波分解系數(shù)的量化和編碼。低頻子帶圖像包含原圖像的大部分能量,即包含圖像的基本特性。它在圖像重構(gòu)算法中起主導(dǎo)作用,對(duì)重建圖像的質(zhì)量有很大影響,因此這部分信號(hào)應(yīng)精確保留。
高頻子圖像的系數(shù)分布符合廣義高斯分布,對(duì)其系數(shù)進(jìn)行粗量化編碼較為有效。這也完全符合人的視覺(jué)特性,根據(jù)對(duì)人眼視覺(jué)系統(tǒng)的研究可知,人眼視覺(jué)靈敏度具有明顯的低通特性,而且對(duì)不同方向上的敏感度也不一樣,尤其是對(duì)傾斜方向的刺激不太敏感,如人眼對(duì)對(duì)角線方向子圖像系數(shù)誤差敏感度較低,因此可對(duì)對(duì)角線方向子圖像進(jìn)行粗量化高壓縮。
小波變換后的能量主要集中在低頻系數(shù)分量,而其他高頻系數(shù)分量大多為零值,這為高倍率壓縮提供了可能。通過(guò)選擇合適的具有平滑特性小波基,就可消除重建圖像中出現(xiàn)的方塊效應(yīng),減小量化噪聲,獲得較好的重建圖像質(zhì)量。
小波變換圖像編碼壓縮方法可分為如下兩大類(lèi):基于傳統(tǒng)的圖像編碼方法和基于分形理論的小波變換圖像編碼方法。
基于傳統(tǒng)的圖像編碼方法[7]包括:零樹(shù)小波編碼、基于塔式網(wǎng)絡(luò)矢量量化的小波變換編碼、基于LBG算法的小波變換編碼、基于標(biāo)量量化的小波變換編碼等。
由于不同分辨率級(jí)子圖像之間存在著相似性,因此,利用此相似性,可提高壓縮比[8]。J.M.Shapiro采用零樹(shù)自嵌套編碼方法,對(duì)小波分解系數(shù)進(jìn)行壓縮,在PSNR=27.54dB的情況下,獲得壓縮比為128∶1。這是最著名的一種小波變換圖像編碼壓縮方法。該方法的優(yōu)點(diǎn)是:與傳統(tǒng)的DCT編碼相比,它既可以克服方塊效應(yīng),又可以在低比特率下獲得較好的圖像主觀質(zhì)量。缺點(diǎn)是:由于它對(duì)各子帶采用相同的門(mén)限量化,因此不能充分利用人眼的視覺(jué)特性,限制了圖像壓縮比的進(jìn)一步提高。對(duì)此,A.Said等人提出了改進(jìn)算法。
針對(duì)分形圖像編碼尚存在的缺點(diǎn),如編碼算法的耗時(shí)、自然圖像不一定具有嚴(yán)格的分形結(jié)構(gòu)而無(wú)法達(dá)到預(yù)期的高壓縮比、高壓縮倍率時(shí)的方塊效應(yīng)等,有人提出了基于小波變換的分形編碼[9]。它具有以下特點(diǎn):①采用平滑小波可去除傳統(tǒng)分形變換中存在的方塊效應(yīng);②小波表示使圖像的四叉樹(shù)分割十分自然;③可將零樹(shù)算法看成是該算法的一個(gè)特例。圖像經(jīng)過(guò)金字塔形離散小波變換后的系數(shù)在小波域內(nèi)可組成分層樹(shù)狀數(shù)據(jù)結(jié)構(gòu)小波樹(shù)。這些跨越不同分辨率的小波樹(shù)之間存在一定的相似性,可通過(guò)分形變換來(lái)描述?;谛〔ㄗ儞Q的分形壓縮過(guò)程就是一個(gè)由分層樹(shù)狀結(jié)構(gòu)的頂部開(kāi)始一層層地向下預(yù)測(cè)其余系統(tǒng)的過(guò)程,而這個(gè)由上至下、由粗至細(xì)的預(yù)測(cè)過(guò)程是通過(guò)分形編碼來(lái)實(shí)現(xiàn)的。基于小波變換的圖像編碼壓縮的特點(diǎn)是[10]:壓縮比高、壓縮速度快,壓縮后能保持信號(hào)與圖像的特征不變,且在傳遞過(guò)程中就可以抗干擾。從現(xiàn)在的研究結(jié)果可看到,該方法已獲得了較好的編碼效果,是現(xiàn)代圖像壓縮技術(shù)研究的熱點(diǎn)之一,也是十分有前途的一種方法。
4結(jié)束語(yǔ)
本研究介紹了圖像編碼的基本原理,傳統(tǒng)的圖像編碼方法和幾種比較新的編碼方法。第二代圖像編碼將視覺(jué)特性引入到圖像編碼技術(shù),分形圖像編碼是以分形幾何理論為基礎(chǔ),基于模型的圖像編碼是利用了計(jì)算機(jī)視覺(jué)和計(jì)算機(jī)圖形學(xué)中的理論,而小波變換圖像編碼則引入了小波分析理論。盡管它們理論基礎(chǔ)不同,但它們均在不同情況下不同程度地提高了編碼質(zhì)量。相比之下,小波變換圖像編碼是一種性能更佳的圖像編碼方法,僅從去除冗余信息的角度而言,它的性能就遠(yuǎn)遠(yuǎn)優(yōu)于其他幾種編碼方法。另外,將小波變換與其他的新型編碼方法結(jié)合,也是小波圖像編碼方法的重要研究方向。
參考文獻(xiàn)
1 萬(wàn)建偉,黃埔堪,周良柱,梁甸農(nóng)圖像編碼技術(shù)的發(fā)展系統(tǒng)工程與電子技術(shù),1996,5:31~38
2 張雪松,倪國(guó)強(qiáng),周立偉,金偉其圖像編碼技術(shù)發(fā)展綜述光學(xué)技術(shù),1997,3:37~41
3 曹寧,吳琰,馮曄模型基方法在圖像編碼中的應(yīng)用與改進(jìn)河海大學(xué)學(xué)報(bào),1997,25(6):97~102
4 陳紅麗幾種新型的圖像編碼技術(shù)淮北煤師院學(xué)報(bào),2001,22(2):28~30
5 吳謹(jǐn)圖像編碼與小波變換圖像編碼武漢科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2000,23(3):289~292
6 陳雷霆,吉家成,傅志中,梁福成小波圖像編碼與JPEG圖像編碼的比較研究計(jì)算機(jī)應(yīng)用,2000,20(增刊):273~277
7 唐良瑞小波圖像編碼技術(shù)的研究北方工業(yè)大學(xué)學(xué)報(bào),2001,13(3):9~13
篇6
關(guān)鍵詞:雙目立體視覺(jué);立體匹配;光流
中圖分類(lèi)號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-7712 (2013) 20-0000-02
一、引言
雙目立體視覺(jué)在機(jī)器人導(dǎo)航、微操作系統(tǒng)的參數(shù)檢測(cè)、三維測(cè)量和虛擬現(xiàn)實(shí)等領(lǐng)域都有廣泛的應(yīng)用,它是計(jì)算機(jī)視覺(jué)的一個(gè)重要分支。它主要是由不同位置的左右兩個(gè)攝像機(jī)同時(shí)獲得同一場(chǎng)景的兩幅圖,通過(guò)計(jì)算空間點(diǎn)在兩幅圖像中的視差,獲得該點(diǎn)的三維信息。立體匹配算法的目的就是找出左右圖像對(duì)中的匹配點(diǎn),進(jìn)而獲得距離信息,其基本原理就是從兩個(gè)視點(diǎn)同時(shí)觀察同一景物以獲取立體像對(duì),并匹配出相應(yīng)像點(diǎn),從而計(jì)算出視差并獲得三維信息。
考慮到光流這種運(yùn)動(dòng)速度,不僅包含了二維瞬時(shí)速度場(chǎng),還可以反映可見(jiàn)點(diǎn)的三維速度矢量在成像表面得投影,提出了一種融合光流的立體匹配算法。該方法在基于區(qū)域相關(guān)匹配的基礎(chǔ)上,求取左右運(yùn)動(dòng)目標(biāo)的光流,用光流作為一種外加限制條件進(jìn)行立體匹配。首先分別求取左右圖像序列中垂直和水平方向上的光流,然后通過(guò)對(duì)右圖像序列中候選點(diǎn)的光流的計(jì)算與左圖像序列中的種子點(diǎn)進(jìn)行匹配,進(jìn)而提高了匹配的精度和準(zhǔn)確度;而且該算法只選用邊緣點(diǎn)進(jìn)行匹配,這樣簡(jiǎn)化了運(yùn)算,提高了算法的運(yùn)行速度。
二、求取光流
三、實(shí)驗(yàn)
圖1顯示了在連續(xù)時(shí)間幀里獲得的兩對(duì)立體圖像對(duì),圖2顯示了在50幀時(shí)邊緣檢測(cè)結(jié)果。然后用這兩幅圖像中的邊緣點(diǎn)作為種子點(diǎn)在第二個(gè)立體圖像對(duì)(也就是下一幀)中尋找相關(guān)點(diǎn),這樣就可以在連續(xù)的圖像序列中進(jìn)行相關(guān)性研究。圖3中給出了光流的計(jì)算,把每個(gè)邊緣點(diǎn)的光流都分解為水平(X)和垂直(Y)方向的位移,其中(a),(b)圖顯示了左右圖像的水平位移,而(c),(d)顯示了垂直位移。
采用融入光流的匹配方法,不僅測(cè)量了互相關(guān)系數(shù),還測(cè)量了待估計(jì)的兩點(diǎn)水平及垂直位移,這樣就可以避免光照和攝像機(jī)本身移動(dòng)的問(wèn)題。視差圖反應(yīng)的是目標(biāo)離攝像機(jī)的遠(yuǎn)近,離攝像機(jī)越近,視差越大,表現(xiàn)在灰度圖中越亮,反之,離攝像機(jī)越遠(yuǎn),視差越小,表現(xiàn)在灰度圖中越暗。圖4中的(a),(b)分別為沒(méi)有融合光流和融合光流之后的視差圖,從圖中可以明顯的發(fā)現(xiàn),沒(méi)有融合的視差圖中有很多地方出現(xiàn)誤匹配,而融合光流之后的視差圖更為清晰,消除了偽匹配點(diǎn)。
四、總結(jié)
本文通過(guò)對(duì)傳統(tǒng)匹配算法的分析,提出了一種融合光流的立體匹配算法,該算法是在區(qū)域相關(guān)立體匹配的基礎(chǔ)上附加上了光流作為限制條件,使得匹配更為準(zhǔn)確迅速。實(shí)驗(yàn)結(jié)果表明了該算法的有效性,不僅縮小了匹配搜索空間,提高了匹配的速度與準(zhǔn)確度,而且可以有效的克服光照等外部環(huán)境的干擾,消除誤匹配點(diǎn)。
參考文獻(xiàn):
[1]劉金頌.雙目立體視覺(jué)中的攝像機(jī)標(biāo)定技術(shù)研究[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(6).
[2]梁元月.基于雙目立體視覺(jué)的工件識(shí)別定位方法研究[D].西安理工大學(xué),2008.
[3]白明,莊嚴(yán),王偉.雙目立體匹配算法研究與進(jìn)展[J].控制與決策,2008.
篇7
關(guān)鍵詞: 目標(biāo)檢測(cè); 全局運(yùn)動(dòng)估計(jì); 角點(diǎn); 奇異值分解
中圖分類(lèi)號(hào): TN911.73?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)07?0066?05
Abstract: To resolve the indistinct background problem caused by dynamic camera behavior, and in combination with the global motion estimation algorithm of angular point distance feature, the maximum interclass variance method is introduced into the RANSAC estimation algorithm to improve the common RANSAC algorithm. The moving object detection algorithm based on difference multiply principle is used to detect and locate the moving object in object detection process. Aiming at the object detection of follow?up frame sequence of the obtained object location, the moving target detection algorithm based on angular point marching of improved singular value decomposition is proposed. The experimental results demonstrate that the proposed algorithm has good background motion compensation effect in dynamic background, and can accurately detect the moving target of the follow?up frame sequence in the subsequent measured dynamic background measurement. The algorithm has good robustness.
Keywords: target detection; global motion estimation; angular point; singular value decomposition
0 引 言
運(yùn)動(dòng)目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)最主要的研究方向和難點(diǎn)之一[1?2],主要涉及到圖像理解、模式識(shí)別、人工智能、自動(dòng)控制和機(jī)器視覺(jué)等有關(guān)專(zhuān)業(yè)學(xué)科和領(lǐng)域的知識(shí),并且已經(jīng)被廣泛地應(yīng)用到很多場(chǎng)合 [3]。運(yùn)動(dòng)目標(biāo)檢測(cè)為后續(xù)的目標(biāo)跟蹤和目標(biāo)識(shí)別奠定了良好的基礎(chǔ)。在現(xiàn)實(shí)生活中,大量有意義的視覺(jué)信息包含在運(yùn)動(dòng)之中,人類(lèi)可以憑借自身強(qiáng)大的視覺(jué)系統(tǒng)獲取80%的信息[4],通過(guò)大腦的分析判斷出運(yùn)動(dòng)目標(biāo),而對(duì)于計(jì)算機(jī)視覺(jué)而言,從獲取視頻到分析出運(yùn)動(dòng)的物體成為關(guān)鍵問(wèn)題。
基于視頻的目標(biāo)檢測(cè)系統(tǒng)具有結(jié)構(gòu)簡(jiǎn)單、隱蔽性好、抗干擾能力強(qiáng)的優(yōu)點(diǎn),而且視頻檢測(cè)系統(tǒng)采用價(jià)格低廉的攝像機(jī)和光學(xué)成像結(jié)構(gòu),具有更高的性價(jià)比。通過(guò)攝像機(jī)采集回來(lái)的圖像信息,可以獲得關(guān)于運(yùn)動(dòng)目標(biāo)的豐富信息,具有很高的直觀性和可靠性。因此,研究運(yùn)動(dòng)目標(biāo)檢測(cè)的有關(guān)問(wèn)題,在理論上和應(yīng)用價(jià)值上都具有重要的意義。
1 基于角點(diǎn)矩特征的背景運(yùn)動(dòng)補(bǔ)償算法
1.1 基于Harris算子的角點(diǎn)矩特征的提取及匹配設(shè)計(jì)
Harris[5]算子是在 Moravec算子的基礎(chǔ)上進(jìn)行改進(jìn)的。因此,它也是一種基于信號(hào)的特征點(diǎn)提取算子。通過(guò)在圖像位置建立局部窗口,監(jiān)測(cè)窗口各個(gè)方向的能量數(shù)值和變化。對(duì)圖像亮度改變具有無(wú)關(guān)性,算法只關(guān)注梯度。因此系統(tǒng)運(yùn)動(dòng)后只發(fā)生了方向的改變,系統(tǒng)具有旋轉(zhuǎn)穩(wěn)定性。同時(shí),Harris特征點(diǎn)提取算子適用于角點(diǎn)數(shù)目較多并且光源復(fù)雜的情況。但是,Harris角點(diǎn)不具有尺度不變性。因此本文引入不變矩特征對(duì)其進(jìn)行改良。Hu最早提出了幾何矩特征,1962年,他在幾何不變量理論的基礎(chǔ)上提出了幾何矩的概念[6]。Hu構(gòu)造了7個(gè)不變矩并證明了相應(yīng)的矩組對(duì)于平移、旋轉(zhuǎn)和縮放變換的不變性。
本文將角點(diǎn)和矩特征進(jìn)行結(jié)合,以彌補(bǔ)Harris角點(diǎn)不具備縮放不變性的缺點(diǎn),提高角點(diǎn)的穩(wěn)定性,從而可以實(shí)現(xiàn)在視頻序列中存在平移、旋轉(zhuǎn)和縮放時(shí),具有一種穩(wěn)定的特征進(jìn)行全局運(yùn)動(dòng)估計(jì)和補(bǔ)償,最終實(shí)現(xiàn)準(zhǔn)確的運(yùn)動(dòng)目標(biāo)檢測(cè)。在視頻序列中角點(diǎn)矩特征的提取步驟主要分為:
(1) 在每一幀圖像中提取Harris角點(diǎn);
(2) 在獲得角點(diǎn)的[W×W]的鄰域內(nèi)進(jìn)行矩特征的計(jì)算,即得到一個(gè)7維的圖像特征向量。
在實(shí)現(xiàn)角點(diǎn)矩特征向量的提取后,需要對(duì)已提取的特征向量進(jìn)行幀間的匹配。角點(diǎn)矩特征向量的匹配原理是:視頻序列中存在仿射變換時(shí),矩特征對(duì)仿射變換具有不變性,因此對(duì)應(yīng)角點(diǎn)特征向量的矩值是相等的或者是相近的,對(duì)于誤匹配的角點(diǎn)向量的矩值存在較大變化。
本文中采用計(jì)算特征向量之間的歐式距離進(jìn)行角點(diǎn)矩特征的匹配。即尋找特征向量在待匹配向量集中與其歐式距離最小的向量且該距離小于設(shè)定閾值[T,]如果滿足條件則該特征向量對(duì)相互匹配,否則從初匹配特征向量集中刪除該特征向量。將匹配的特征點(diǎn)集作為運(yùn)動(dòng)信息的表達(dá),便于進(jìn)行參數(shù)估計(jì)的計(jì)算。在角點(diǎn)矩特征點(diǎn)集中既包含有背景點(diǎn),又有前景點(diǎn),也就是進(jìn)行魯棒的參數(shù)估計(jì)所指的內(nèi)點(diǎn)和外點(diǎn)。把提取出的角點(diǎn)矩特征點(diǎn)集作為待估計(jì)點(diǎn)集,如何將該點(diǎn)集中的外點(diǎn)去除,是進(jìn)行全局運(yùn)動(dòng)估計(jì)的關(guān)鍵。
1.2 基于改進(jìn)的RANSAC全局運(yùn)動(dòng)估計(jì)算法
傳統(tǒng)的RANSAC算法是將所有的點(diǎn)都代入?yún)?shù)估計(jì)模型,將估計(jì)殘差大于所選閾值的點(diǎn)作為外點(diǎn),迭代[N]次,最終求得所有的內(nèi)點(diǎn)。但是外點(diǎn)數(shù)據(jù)在迭代過(guò)程中對(duì)估計(jì)精度會(huì)造成影響,而且在攝像機(jī)存在旋轉(zhuǎn)運(yùn)動(dòng)時(shí),仿射模型對(duì)外點(diǎn)的敏感加強(qiáng)[7]。因此,為了提高全局運(yùn)動(dòng)估計(jì)的精度,本文將最大類(lèi)間方差引入RANSAC。
首先,利用RANSAC算法進(jìn)行全局運(yùn)動(dòng)參數(shù)的初始值估計(jì)。然后,計(jì)算每個(gè)點(diǎn)的估計(jì)殘差[r:]
在本文中,把從圖像中提取出的[n]個(gè)角點(diǎn)矩的特征點(diǎn)作為全局運(yùn)動(dòng)估計(jì)的點(diǎn),設(shè)其殘差點(diǎn)集為[R={r1,r2,…,rn}]。令閾值[Tr∈R,]根據(jù)殘差值的大小將點(diǎn)集殘差分為兩類(lèi):
本節(jié)詳細(xì)闡述了角點(diǎn)矩特征的提取及匹配、基于角點(diǎn)矩特征改進(jìn)的RANSAC全局運(yùn)動(dòng)估計(jì)及補(bǔ)償?shù)倪^(guò)程,其流程圖如圖1所示。
2 運(yùn)動(dòng)背景下基于特征的運(yùn)動(dòng)目標(biāo)檢測(cè)
2.1 角點(diǎn)匹配的基本原理
角點(diǎn)匹配的基本原理通過(guò)確定圖像[J]和圖像[I]的單獨(dú)相應(yīng)的組點(diǎn),在無(wú)誤確定相應(yīng)的點(diǎn)特征的情況下,算法可以進(jìn)一步進(jìn)行最優(yōu)匹配,完成圖像最終的匹配。
相匹配的特征點(diǎn)對(duì)由于矩陣[P]和[G]具有一致的結(jié)構(gòu)被進(jìn)一步突出,這種結(jié)構(gòu)具有抑制非對(duì)應(yīng)的特征。
當(dāng)矩陣[P]中的元素[Pi,j]既是所在列所有元素中的最大值,同時(shí)也是所在行所有元素中的最大值,相互對(duì)應(yīng)的特征點(diǎn)則為特征點(diǎn)[Ii]和[Jj,]當(dāng)元素[Pi,j]不具備上述特征時(shí),則說(shuō)明[Ii]和[Jj]不匹配[8]。
2.2 改進(jìn)的角點(diǎn)匹配的運(yùn)動(dòng)目標(biāo)檢測(cè)算法
本文提出的改進(jìn)的基于奇異值分解的角點(diǎn)匹配算法,核心思想是通過(guò)改變?cè)撍惴ㄖ猩婕暗降南嗨凭仃嚇?gòu)造相關(guān)系數(shù),達(dá)到適用于運(yùn)動(dòng)目標(biāo)角點(diǎn)匹配的目標(biāo),解決了由于運(yùn)動(dòng)目標(biāo)位置變化導(dǎo)致待匹配的兩組角點(diǎn)中正確配對(duì)的角點(diǎn)之間距離相關(guān)性降低,造成誤匹配角點(diǎn)對(duì)的問(wèn)題。其核心流程如圖1所示。
由式(9)可以看出,在相似矩陣構(gòu)造過(guò)程中,上述的核心匹配方法考慮了距離的影響。然而,誤匹配角點(diǎn)的數(shù)量增加,多數(shù)由于運(yùn)動(dòng)目標(biāo)位置的變化導(dǎo)致待匹配的兩組角點(diǎn)中正確配對(duì)的角點(diǎn)之間距離相關(guān)性降低。正確描述這些對(duì)應(yīng)的特征點(diǎn)是研究的關(guān)鍵所在。在式(9)中,基于奇異值分解的角點(diǎn)匹配算法使用公式[r2i,j=Ii-Jj]描述兩點(diǎn)之間距離的相關(guān)性,即兩個(gè)特征點(diǎn)[Ii]和[Jj]之間的歐氏距離。然后,針對(duì)運(yùn)動(dòng)目標(biāo),兩個(gè)特征點(diǎn)之間的歐式距離不能準(zhǔn)確描述兩點(diǎn)之間的距離相關(guān)性。
式中:目標(biāo)運(yùn)動(dòng)的距離估計(jì)通過(guò)目標(biāo)運(yùn)動(dòng)區(qū)域預(yù)測(cè)中心與模板中心在[y]軸和[x]軸的差值分別用[Δcenter x]和[Δcenter y]表征。系統(tǒng)針對(duì)目標(biāo)運(yùn)動(dòng)中心位移及區(qū)域的預(yù)測(cè)使用Kalman濾波算法進(jìn)行。
通過(guò)四個(gè)主要步驟,基于奇異值分解的角點(diǎn)匹配算法可以改善運(yùn)動(dòng)目標(biāo)的檢測(cè):
(1) 確定目標(biāo)模板。通過(guò)上一節(jié)全局運(yùn)動(dòng)補(bǔ)償后,且經(jīng)過(guò)基于差分相乘原理的運(yùn)動(dòng)目標(biāo)檢測(cè)獲取形心位置來(lái)捕獲得到目標(biāo)區(qū)域。將視頻序列中測(cè)量的運(yùn)動(dòng)目標(biāo)的矩形區(qū)域作為目標(biāo)模板,然后檢測(cè)目標(biāo)角點(diǎn)。
(2) 確定目標(biāo)預(yù)測(cè)區(qū)域。使用Kalman濾波預(yù)測(cè)下一幀目標(biāo)位置的特征點(diǎn)作為目標(biāo)模板的中心,從而得到目標(biāo)預(yù)測(cè)區(qū)域,最終獲取檢測(cè)角點(diǎn)。
(3) 確定偏移距離。通過(guò)步驟(1)和步驟(2)計(jì)算得到的角點(diǎn)進(jìn)行匹配,再去除其誤匹配角點(diǎn),目標(biāo)位置預(yù)測(cè)的特征點(diǎn)是由正確角點(diǎn)的聚類(lèi)中心構(gòu)成,由此計(jì)算目標(biāo)預(yù)測(cè)中心與目標(biāo)模板中心的偏移距離。
(4) 檢測(cè)運(yùn)動(dòng)目標(biāo)。利用改進(jìn)的角點(diǎn)匹配算法進(jìn)行角點(diǎn)匹配,同時(shí)檢測(cè)當(dāng)前幀中目標(biāo)預(yù)測(cè)區(qū)域的角點(diǎn),最后檢測(cè)到運(yùn)動(dòng)目標(biāo)并用矩形框標(biāo)將其標(biāo)注出來(lái)。具體的算法流程框圖如圖2所示。
運(yùn)動(dòng)目標(biāo)檢測(cè)流程圖
3 算法仿真試驗(yàn)
3.1 基于改進(jìn)的RANSAC全局運(yùn)動(dòng)估計(jì)算法驗(yàn)證分析
實(shí)驗(yàn)1:實(shí)驗(yàn)中對(duì)河流中船只運(yùn)動(dòng)的視頻序列中連續(xù)的兩幀進(jìn)行全局運(yùn)動(dòng)估計(jì)和補(bǔ)償。圖3給出了視頻序列上相鄰兩幀在完成全局運(yùn)動(dòng)估計(jì)和補(bǔ)償前后的幀差。從圖3中可以看出本文提出的全局運(yùn)動(dòng)估計(jì)和補(bǔ)償算法能夠?qū)g的運(yùn)動(dòng)背景準(zhǔn)確對(duì)齊。
實(shí)驗(yàn)2:為了證明基于RANSAC改進(jìn)算法的效果,通過(guò)對(duì)比實(shí)驗(yàn),詳細(xì)分析了RANSAC算法和改進(jìn)RANSAC算法的全局運(yùn)動(dòng)精度。通常采用相鄰兩幀完成全局運(yùn)動(dòng)估計(jì)和補(bǔ)償后的峰值信噪比來(lái)衡量全局運(yùn)動(dòng)估計(jì)的精度,圖中所示,在背景區(qū)域內(nèi)隨著差分圖像[Id]非零像素點(diǎn)的不斷降低,系統(tǒng)的信噪比PSNR不斷升高的情況下,系統(tǒng)非零值不斷減小,進(jìn)一步證明了運(yùn)動(dòng)補(bǔ)償算法的效果顯著。本實(shí)驗(yàn)在視頻序列1和視頻序列2中分別提取了30幀圖像進(jìn)行信噪比的計(jì)算,圖4為兩種方法的信噪比對(duì)比圖。
3.2 基于改進(jìn)的奇異值分解的角點(diǎn)匹配的運(yùn)動(dòng)目標(biāo)檢測(cè)算法驗(yàn)證分析
實(shí)驗(yàn)是在3.1節(jié)中對(duì)相鄰兩幀進(jìn)行了全局運(yùn)動(dòng)估計(jì)與補(bǔ)償?shù)幕A(chǔ)上實(shí)現(xiàn)的。在對(duì)相鄰幀進(jìn)行了全局運(yùn)動(dòng)的估計(jì)和補(bǔ)償后,可以按照靜態(tài)背景下的運(yùn)動(dòng)目標(biāo)檢測(cè)算法檢測(cè)并定位出運(yùn)動(dòng)目標(biāo),試驗(yàn)采用基于差分相乘原理的運(yùn)動(dòng)目標(biāo)檢測(cè)算法進(jìn)行運(yùn)動(dòng)目標(biāo)的檢測(cè)和定位。然后,根據(jù)獲得的運(yùn)動(dòng)目標(biāo)形心,采用基于改進(jìn)奇異值分解的角點(diǎn)匹配的運(yùn)動(dòng)目標(biāo)算法進(jìn)行后續(xù)幀的目標(biāo)檢測(cè)。
實(shí)驗(yàn)中對(duì)船只的視頻序列進(jìn)行后續(xù)的檢測(cè)。首先對(duì)視頻序列中連續(xù)的四幀進(jìn)行全局運(yùn)動(dòng)估計(jì)和補(bǔ)償,即在連續(xù)的四幀第10幀、第11幀、第12幀、第13幀中,估計(jì)第10幀和第11幀的全局運(yùn)動(dòng),并進(jìn)行全局補(bǔ)償;同理,對(duì)第12幀和第13幀進(jìn)行處理。圖5(a)~(c)分別表示第10幀原始圖像、第11幀原始圖像、全局運(yùn)動(dòng)補(bǔ)償結(jié)果。
圖5(d)~(f)分別表示第12幀原始圖像、第13幀原始圖像、全局運(yùn)動(dòng)補(bǔ)償結(jié)果。圖5(g)~(i)分別表示第11幀與補(bǔ)償幀的幀差二值圖、第13幀與補(bǔ)償幀的幀差二值圖、差分相乘結(jié)果。圖5(j),圖5(k)分別表示對(duì)圖5(i)進(jìn)行形態(tài)學(xué)濾波處理、連通域分析,最終確定目標(biāo)范圍獲取形心圖。
圖6中顯示了獲取形心后,利用改進(jìn)的基于奇異值分解的角點(diǎn)匹配的運(yùn)動(dòng)目標(biāo)檢測(cè)算法對(duì)運(yùn)動(dòng)目標(biāo)檢測(cè)的6幀圖像??梢钥闯鲈撍惴梢苑€(wěn)定的檢測(cè)出運(yùn)動(dòng)目標(biāo),當(dāng)背景中出現(xiàn)其他運(yùn)動(dòng)目標(biāo)時(shí),該算法依然能夠保持良好的檢測(cè)效果。
4 結(jié) 論
本文提出了基于角點(diǎn)矩特征的全局運(yùn)動(dòng)估計(jì)算法。此外,本文將最大類(lèi)間方差的方法引入了隨機(jī)抽樣一致性估計(jì)算法中,改善了參數(shù)估計(jì)的精度,且在計(jì)算速度上有所提高。針對(duì)全局運(yùn)動(dòng)估計(jì)和補(bǔ)償?shù)膹?fù)雜性,實(shí)際運(yùn)動(dòng)目標(biāo)檢測(cè)的實(shí)時(shí)性檢測(cè)難以滿足。本文提出了一種基于改進(jìn)的奇異值分解的角點(diǎn)匹配的運(yùn)動(dòng)目標(biāo)檢測(cè)算法,該算法具有計(jì)算簡(jiǎn)單的特點(diǎn),為運(yùn)動(dòng)目標(biāo)檢測(cè)系統(tǒng)的實(shí)時(shí)性實(shí)現(xiàn)奠定了基礎(chǔ)。
參考文獻(xiàn)
[1] FUJIMOTO L, YAMADA Y, MORIZONO T, et al. Development of artificial finger skin to detect incipient slip for realization of static friction sensation [C]// Proceedings of 2003 IEEE Conference on Multisensor Fusion and Integration for Intelligent System. [S.l.]: IEEE, 2003: 15?21.
[2] AZARBAYEJANI A, WREN C, PENTLAND A. Real?time 3?d tracking of the human body [J]. IEEE transactions on pattern analysis and machine intelligence, 1996, 19(7): 780?785.
[3] 謝文輝.動(dòng)態(tài)場(chǎng)景下運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤算法研究[D].武漢:華中科技大學(xué),2011.
[4] 章毓晉.圖像工程(上冊(cè))[M].2版.北京:清華大學(xué)出版社,2005:1?10.
[5] HARRIS C, STEPHENS M.A combined corner and edge detector [C]// Proceedings of the 4th Alvey Vision Conference. Manchester: ACM, 1988: 147?151.
[6] HU M K. Visual pattern recognition by moment invariants [J].IRE transactions on information theory, 1962: 8(2): 179?187.
篇8
(上海市計(jì)算技術(shù)研究所上海 200040)
摘 要 針對(duì)公共交通資源浪費(fèi)和分配的不勻,導(dǎo)致公共交通承載體出現(xiàn)過(guò)度擁擠,甚至嚴(yán)重超載現(xiàn)象,提出利用智能視頻檢索分析技術(shù),通過(guò)將場(chǎng)景中背景和目標(biāo)分離進(jìn)而分析并追蹤在攝像機(jī)場(chǎng)景內(nèi)出現(xiàn)的目標(biāo),可以實(shí)時(shí)分析車(chē)內(nèi)上下車(chē)人數(shù),提供有力客流數(shù)據(jù)分析,有效的控制超載超員,實(shí)驗(yàn)證明這些方法可以為策略的制定者提供客觀公正的數(shù)據(jù)。
關(guān)鍵詞 人像,智能,檢索,分析
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.3969/j.issn.1674-7933.2015.05.008
作者簡(jiǎn)介:胡竹平,男,1964 年生,碩士,工程師,主要從事及研究領(lǐng)域:計(jì)算機(jī)應(yīng)用,Email:huzpcast@sina.com。
0 引言
近十年來(lái),平安城市的數(shù)字化進(jìn)程中,數(shù)字視頻錄像機(jī)(DVR)、數(shù)字視頻服務(wù)器(DVS)得到了長(zhǎng)足發(fā)展。特別是近兩年,隨著平安城市項(xiàng)目的推進(jìn),各個(gè)城市的大街小巷已經(jīng)布滿了攝像頭。存儲(chǔ)技術(shù)的不斷更新,也為大量案件積存了海量視頻信息,這給公安破案帶來(lái)極大的便利。這時(shí),如何在海量視頻中快速提取有價(jià)值的線索便顯得尤為重要。隨著安防智能化需求越來(lái)越強(qiáng)烈,視頻檢索技術(shù)也得以快速發(fā)展。下面主要討論智能視頻檢索技術(shù)在公交客流數(shù)據(jù)分析中的發(fā)展與應(yīng)用。
在社會(huì)公共安全領(lǐng)域,視頻監(jiān)控系統(tǒng)成為維護(hù)社會(huì)治安,加強(qiáng)社會(huì)管理的一個(gè)重要組成部分。傳統(tǒng)視頻檢索的模式下,需要從頭到尾順序播放,需要大量人員進(jìn)行視頻審看,實(shí)際應(yīng)用過(guò)程中,視頻錄像存在存儲(chǔ)數(shù)據(jù)量大,存儲(chǔ)時(shí)間長(zhǎng)等特點(diǎn),通過(guò)錄像尋找線索,獲取證據(jù)傳統(tǒng)的做法是要耗費(fèi)大量人力、物力以及時(shí)間,效率極其低下,以至于錯(cuò)過(guò)最佳時(shí)機(jī)。因此必須在視頻監(jiān)控系統(tǒng)中,對(duì)原始視頻進(jìn)行處理和分析,使其可以快速瀏覽,鎖定檢索對(duì)象,能夠滿足用戶的各種需求及應(yīng)用。
視頻監(jiān)控檢索關(guān)注的人數(shù)據(jù)以視頻為主,目的是查找某一事件的起因和關(guān)聯(lián)的發(fā)展過(guò)程,相關(guān)信息數(shù)據(jù)包含:發(fā)生事件的時(shí)間、發(fā)生事件的地點(diǎn)、相關(guān)的人和物體、相關(guān)的圖像和聲音等信息的一系列數(shù)據(jù)。當(dāng)檢索條件包含的信息越多,定位就越精準(zhǔn),檢索的算法也就容易;反之,檢索條件傳遞包含的信息越少,定位就越模糊,這時(shí)如要精確定位相應(yīng)的檢索算法的難度也就越高。不過(guò)對(duì)用戶來(lái)說(shuō)總是期望檢索條件最簡(jiǎn)單時(shí),定位也要能精準(zhǔn)。
智能視頻檢索技術(shù)就是要滿足人們的這種需求把用戶從單一、繁瑣的任務(wù)中解放出來(lái)。通過(guò)的智能分析預(yù)處理分析,將無(wú)序無(wú)章無(wú)邏輯的視頻監(jiān)控內(nèi)容進(jìn)行梳理,獲取目標(biāo)的關(guān)鍵信息,從而生成目標(biāo)視頻及索引。智能視頻檢索,以圖像處理、圖像識(shí)別、圖像理解等知識(shí)為基礎(chǔ),利用了內(nèi)容自動(dòng)關(guān)聯(lián),視頻結(jié)構(gòu)化,視頻分割、鏡頭檢測(cè)、關(guān)鍵幀抽取、自動(dòng)數(shù)字化、語(yǔ)音識(shí)別等相關(guān)技術(shù),采用了集群方式,實(shí)現(xiàn)了快速分析處理,并可根據(jù)實(shí)際使用中的需要進(jìn)行擴(kuò)展,大大提高了計(jì)算能力,節(jié)省了鎖定目標(biāo)的時(shí)間。
在智能視頻檢索過(guò)程中,用戶可以根據(jù)自己所需要的檢索條件,通過(guò)智能視頻分析技術(shù),從海量視頻中獲取想要的關(guān)鍵信息。
1 智能視頻檢索現(xiàn)狀
智能視頻分析技術(shù)源自計(jì)算機(jī)視覺(jué)技術(shù),是人工智能研究的分支之一,它能夠在圖像及圖像內(nèi)容描述之間建立映射關(guān)系,從而使計(jì)算機(jī)能夠通過(guò)數(shù)字圖像處理和分析來(lái)有限理解視頻畫(huà)面中的內(nèi)容[1]。
基于內(nèi)容的圖像檢索是近年來(lái)的熱門(mén)研究?jī)?nèi)容,涉及圖像處理、計(jì)算機(jī)視覺(jué)和數(shù)據(jù)庫(kù)系統(tǒng)等方面的學(xué)科。其中,高效實(shí)時(shí)的大規(guī)模圖像庫(kù)的檢索是關(guān)鍵技術(shù)。目前的技術(shù)主要是將監(jiān)控視頻中的人臉進(jìn)行整理聚集,通過(guò)智能分析處理以及人臉檢測(cè)算法,對(duì)目標(biāo)的人臉信息生成索引。有關(guān)人員通過(guò)查看人臉圖示,就能快速查看視頻中的所有目標(biāo),并迅速確定嫌疑目標(biāo),察看該目標(biāo)在整個(gè)視頻圖像中的片段和軌跡,如圖1。
運(yùn)動(dòng)目標(biāo)屬性包括目標(biāo)的速度、幅度、軌跡及規(guī)律等因素。目標(biāo)軌跡的檢索是指通過(guò)在視頻中選定一個(gè)特定的區(qū)域,目標(biāo)進(jìn)入或離開(kāi)該區(qū)域、以及滯留該區(qū)域,視頻檢索算法可以快速關(guān)注所有時(shí)間內(nèi)在該區(qū)域出現(xiàn)過(guò)的目標(biāo),還可以過(guò)濾目標(biāo)圖例或排查結(jié)果,如圖2。在目標(biāo)結(jié)果較多的情形下,系統(tǒng)還可以將目標(biāo)的類(lèi)型進(jìn)一步分離,縮小關(guān)注范圍,比如車(chē)輛、人、樹(shù)木等。
在系統(tǒng)中輸入待查詢的人臉照片,選擇需要檢索的人臉后進(jìn)行相似度等參數(shù)設(shè)置后開(kāi)始檢索,最后檢索出的相似人臉的結(jié)果會(huì)在界面上顯示出來(lái)。
2 公交視頻應(yīng)用需求
長(zhǎng)期以來(lái)公交線路覆蓋率低、重疊系數(shù)大、車(chē)輛運(yùn)行效率不高、調(diào)度指揮全憑人力和手工、不能及時(shí)了解公共汽車(chē)在線路上的運(yùn)行情況從而造成又“聾”又“瞎”(公交調(diào)度部門(mén)即不知道公交車(chē)輛行駛位置又得不到公交車(chē)輛的信息)[2],更無(wú)法實(shí)時(shí)了解客流信息。
近幾年,隨著車(chē)載視頻設(shè)備在城市巴士、長(zhǎng)途大巴、長(zhǎng)途貨運(yùn)車(chē)輛上的應(yīng)用越來(lái)越廣泛,并且逐漸擴(kuò)展到了火車(chē)、船舶、救護(hù)車(chē)、消防車(chē)、執(zhí)法車(chē)等特種車(chē)輛領(lǐng)域。車(chē)載視頻的普及為人民出行安全起到十分重要的保護(hù)作用,為國(guó)家平安城市建設(shè)、社會(huì)穩(wěn)定和諧發(fā)展做出了重要貢獻(xiàn)。
與此同時(shí),隨著“智慧城市”“物聯(lián)網(wǎng)”“公交優(yōu)先”“快速公交”等政策的實(shí)施,為公交車(chē)輛智能調(diào)度系統(tǒng)的實(shí)施也帶來(lái)了契機(jī)。
根據(jù)《安全生產(chǎn)法》的有關(guān)要求,2011年交通運(yùn)輸部會(huì)同公安部、安監(jiān)總局、工信部下發(fā)了《關(guān)于加強(qiáng)道路運(yùn)輸車(chē)輛動(dòng)態(tài)監(jiān)管工作的通知》,要求公交客車(chē)必須安裝車(chē)載視頻監(jiān)控裝置,國(guó)內(nèi)大部分大中型城市的公交車(chē)和長(zhǎng)途運(yùn)輸車(chē)輛也迅速地完成了車(chē)載視頻設(shè)備的安裝工作。
公共交通領(lǐng)域的車(chē)載視頻監(jiān)控的發(fā)展逐步經(jīng)歷了以下幾個(gè)階段:
第一階段:主要是以車(chē)輛本地錄像為主,由于防震方面的原因?qū)е麓鎯?chǔ)設(shè)備以SD卡、CF卡等低容量介質(zhì)為代表。受存儲(chǔ)設(shè)備容量的限制,這一階段的設(shè)備往往視頻通道數(shù)少,視頻分辨率也以標(biāo)準(zhǔn)化圖像格式(CIF,320×288像素)為主,視頻文件存儲(chǔ)時(shí)間較短,由于不帶顯示終端,對(duì)錄像資料查閱基本通過(guò)拔取存儲(chǔ)卡至PC觀看為主。此階段的車(chē)載錄像機(jī)基本完成了從無(wú)到有的過(guò)程。
第二階段:由于大容量硬盤(pán)的價(jià)格迅速下跌以及硬盤(pán)減震技術(shù)的發(fā)展,以使用硬盤(pán)作為存儲(chǔ)設(shè)備的車(chē)載錄像機(jī)誕生了。由于存儲(chǔ)設(shè)備容量的顯著增加,導(dǎo)致視頻分辨率從CIF向D1(720×576像素)轉(zhuǎn)化,視頻文件存儲(chǔ)時(shí)間也顯著延長(zhǎng)。但由于此時(shí)的硬盤(pán)減震技術(shù)尚不成熟,導(dǎo)致硬盤(pán)故障率居高不下。
第三階段:隨著gps衛(wèi)星定位系統(tǒng)與3G無(wú)線通信系統(tǒng)的廣泛應(yīng)用,具有網(wǎng)絡(luò)化特征的車(chē)載錄像機(jī)誕生了,此時(shí)的設(shè)備逐漸體現(xiàn)出公交行業(yè)的應(yīng)用特點(diǎn),初步實(shí)現(xiàn)視頻遠(yuǎn)程傳輸,基本實(shí)現(xiàn)了平臺(tái)化的遠(yuǎn)程視頻監(jiān)控。此階段的車(chē)載錄像機(jī)開(kāi)始體現(xiàn)出系統(tǒng)化、網(wǎng)絡(luò)化、平臺(tái)化的特點(diǎn),但與公交行業(yè)的調(diào)度系統(tǒng)尚屬兩套相對(duì)獨(dú)立的系統(tǒng),兩者的融合度不高,導(dǎo)致部分設(shè)備出現(xiàn)重復(fù)投資的局面。
第四階段:隨著各個(gè)城市ITS智能公交調(diào)度管理系統(tǒng)的建設(shè)逐步成熟,調(diào)度管理平臺(tái)初具規(guī)模,調(diào)度平臺(tái)與視頻監(jiān)控平臺(tái)進(jìn)行整合勢(shì)在必行,這也要求車(chē)載錄像機(jī)與車(chē)載調(diào)度終端必須進(jìn)行融合。但是由于車(chē)載錄像機(jī)的生產(chǎn)廠家與車(chē)載調(diào)度終端的生產(chǎn)廠家眾多,設(shè)備型號(hào)不一,也沒(méi)有一套通用的數(shù)據(jù)交互協(xié)議,設(shè)備的整合特別是已有設(shè)備的整合顯得非常困難。
隨著“智慧城市”“物聯(lián)網(wǎng)”“大數(shù)據(jù)”“云計(jì)算”等技術(shù)的發(fā)展以及4G通信的普及,未來(lái)的公共交通領(lǐng)域的車(chē)載視頻監(jiān)控設(shè)備必然向高清晰度、人臉識(shí)別、客流統(tǒng)計(jì)、數(shù)據(jù)高收集率、WIFI覆蓋等方面發(fā)展,調(diào)度平臺(tái)也必將與移動(dòng)互聯(lián)網(wǎng)進(jìn)行深入融合。
目前,客流數(shù)據(jù)分析,就是基于這種需求被廣泛應(yīng)用到眾多人流密集場(chǎng)所,客流量的統(tǒng)計(jì)分析、活動(dòng)評(píng)估和安全管理預(yù)警等方面發(fā)揮了極為重要的作用。特別是商業(yè)零售業(yè),越來(lái)越多的企業(yè)在開(kāi)店前和營(yíng)業(yè)后,都需要先進(jìn)的客流統(tǒng)計(jì)系統(tǒng),結(jié)合POS、erp、CRM等其他相關(guān)數(shù)據(jù)為其商業(yè)經(jīng)營(yíng)活動(dòng)提供科學(xué)高效的決策依據(jù)。通過(guò)視頻智能分析實(shí)時(shí)分析車(chē)內(nèi)上下車(chē)人數(shù),提供有力數(shù)據(jù)分析,有效的控制超載超員,為策略的制定者提供客觀公正的數(shù)據(jù)。
3 公交視頻應(yīng)用解決方案
雙目立體視覺(jué)是指通過(guò)對(duì)同一物體從不同角度獲得的兩幅圖像來(lái)復(fù)原被攝物體的三維信息的過(guò)程。這是一種模擬人的雙眼獲得視覺(jué)信息的過(guò)程。攝像機(jī)標(biāo)定是雙目立體測(cè)量系統(tǒng)不可缺少的前提和基礎(chǔ),并且標(biāo)定精度直接影響最終測(cè)量精度[3]。雙目立體視覺(jué)技術(shù)主要包括圖像獲取,攝像機(jī)標(biāo)定,特征點(diǎn)匹配以及三維信息復(fù)原個(gè)方面。最主要的部分是確定同一目標(biāo)的兩個(gè)圖像中的投影點(diǎn)間的對(duì)應(yīng)關(guān)系即特征點(diǎn)匹配。這兩個(gè)投影點(diǎn)之間的距離稱(chēng)為視差。視差圖反映了物體的深度信息。物體距離攝像機(jī)越近,視差越大;物體距離攝像機(jī)越遠(yuǎn),視差越小。
特征匹配算法的基本原理就是通過(guò)提取圖像特征的灰圖信息取代圖像灰圖值的直接利用而進(jìn)行的匹配,該算法是由的D.G.LOWE于1999年提出的,2004年進(jìn)一步完善[4]。我們求取視差采用的是高效的單相匹配算法,該方法的目的是使用計(jì)算復(fù)雜度更高更有效的方法,來(lái)檢測(cè)不可靠的點(diǎn)的深度值。主要原理是通過(guò)區(qū)域灰度相關(guān)性匹配,在左右兩幅圖像中尋找對(duì)應(yīng)點(diǎn),從而計(jì)算視差圖像,獲得深度信息。對(duì)應(yīng)點(diǎn)匹配滿足唯一性約束,極線約束,以及視差搜索范圍的限定等。這些約束條件不僅可以減少計(jì)算量,也可以提高計(jì)算精度。在單相位匹配中,保存最好的那個(gè)匹配結(jié)果,同時(shí)拋棄剩下不好的匹配結(jié)果,在減少了計(jì)算量的同時(shí),也保證了算法的精度。
車(chē)載客流統(tǒng)計(jì)系統(tǒng)通過(guò)分析安裝在垂直于大巴進(jìn)門(mén)口的視頻攝像頭,分析過(guò)往人數(shù)的頭部特征和肩部輔助特征,通過(guò)計(jì)算運(yùn)動(dòng)軌跡,從而獲知不同運(yùn)動(dòng)方向的人數(shù),即進(jìn)出車(chē)內(nèi)的實(shí)時(shí)人數(shù)。通過(guò)分析統(tǒng)計(jì)進(jìn)出人數(shù)的數(shù)據(jù),達(dá)到控制車(chē)內(nèi)乘客數(shù)量和調(diào)控車(chē)輛調(diào)度的目的。
通過(guò)對(duì)進(jìn)出通道客流量的雙向統(tǒng)計(jì),得到每輛車(chē)上下站的客流量和客流變化的情況。通過(guò)客流量狀況,可以對(duì)進(jìn)出通道的設(shè)置進(jìn)行優(yōu)化調(diào)整。對(duì)不同時(shí)間段的客流進(jìn)行統(tǒng)計(jì),得到客流分布圖。統(tǒng)計(jì)各個(gè)區(qū)域客流量大小及變化,客觀決定發(fā)車(chē)密度和車(chē)輛調(diào)度安排。根據(jù)客流變化,可以有效分配管理、維護(hù)人員的配備,降低營(yíng)運(yùn)成本,提高服務(wù)質(zhì)量和服務(wù)效率。根據(jù)客顯示當(dāng)前客流狀態(tài)和變化趨勢(shì),實(shí)施判斷當(dāng)前的實(shí)際人數(shù),預(yù)防突發(fā)安全事件發(fā)生??赏▽?duì)單獨(dú)安裝統(tǒng)計(jì)攝像頭或利用原有攝像頭,采集客流信息,上傳到相關(guān)服務(wù)器進(jìn)行處理。
GPS是基于衛(wèi)星技術(shù)的全球定位系統(tǒng)。GPS的技術(shù)基礎(chǔ)是同時(shí)觀測(cè)接收機(jī)到幾顆衛(wèi)星的距離。衛(wèi)星的位置和GPS信號(hào)一起發(fā)播給用戶,利用幾個(gè)衛(wèi)星的已知位置以及接收機(jī)與衛(wèi)星間測(cè)得的距離,就可以確定接收機(jī)的位置。接收機(jī)位置的變化即速度也可確定。GPS最重要的應(yīng)用是定位和導(dǎo)航[5]。經(jīng)過(guò)幾十年的發(fā)展,GPS已經(jīng)廣泛地應(yīng)用于各領(lǐng)域,已經(jīng)成為日常生活、工業(yè)、研究和教育的必需。
通過(guò)多通道雙向統(tǒng)計(jì)功能,可以實(shí)時(shí)統(tǒng)計(jì)車(chē)內(nèi)乘客人數(shù)。實(shí)時(shí)分析前后門(mén)進(jìn)出人數(shù),并依此分析車(chē)內(nèi)滯留乘客人數(shù)。加載GPS(北斗)模塊,實(shí)現(xiàn)普通的車(chē)輛信息管理功能。通過(guò)與車(chē)上的行車(chē)記錄、GPS(北斗)設(shè)備等聯(lián)動(dòng),實(shí)現(xiàn)視頻監(jiān)控平臺(tái)與車(chē)輛調(diào)度管理平臺(tái)的整合,構(gòu)造完整的車(chē)輛視頻調(diào)度指揮綜合監(jiān)控系統(tǒng)。加載無(wú)線3G網(wǎng)絡(luò)模塊,實(shí)現(xiàn)車(chē)輛調(diào)度管理中心對(duì)車(chē)輛的視頻監(jiān)控和調(diào)度管理,并可利用WLAN模塊和場(chǎng)站布置的熱點(diǎn),實(shí)現(xiàn)對(duì)錄像和多媒體文件的網(wǎng)絡(luò)化下載管理。上下車(chē)人數(shù)視頻監(jiān)控,支持遠(yuǎn)程IE瀏覽器登錄,直接查看現(xiàn)場(chǎng)的視頻畫(huà)面(需3G網(wǎng)絡(luò)),查看客流數(shù)量。同時(shí)智能客流統(tǒng)計(jì)主機(jī)支持存儲(chǔ)功能可保存客流視頻錄像。
圖3是智能客流統(tǒng)計(jì)主機(jī)工作原理。
4 應(yīng)用與實(shí)踐
在公共交通行業(yè)應(yīng)用人臉視頻監(jiān)控流量后,首先可以實(shí)現(xiàn)公交車(chē)輛線路調(diào)度通過(guò)車(chē)載客流統(tǒng)計(jì),系統(tǒng)可以獲得實(shí)時(shí)的車(chē)載人數(shù),具體到每個(gè)時(shí)段,每個(gè)公交站臺(tái),對(duì)車(chē)內(nèi)人數(shù)了如指掌,方便公交線路調(diào)度,以便公交資源達(dá)到優(yōu)化配置。其次可以實(shí)現(xiàn)公交車(chē)輛票款評(píng)估,通過(guò)精準(zhǔn)的車(chē)載客流統(tǒng)計(jì)系統(tǒng),結(jié)合票務(wù)系統(tǒng),可以評(píng)估出每天的票款數(shù),起到票務(wù)監(jiān)督的作用。第三可以實(shí)現(xiàn)公共車(chē)輛,校車(chē)等人員超載監(jiān)管,對(duì)有明文嚴(yán)格限載人數(shù)的車(chē)輛,實(shí)時(shí)監(jiān)控客流數(shù)據(jù),如發(fā)現(xiàn)超載行為前端報(bào)警提示,后臺(tái)系統(tǒng)同時(shí)會(huì)提醒監(jiān)管單位,采取措施糾正超載行為。再有可以實(shí)現(xiàn)長(zhǎng)途大巴票務(wù)監(jiān)督,對(duì)于長(zhǎng)途大巴業(yè)務(wù),對(duì)司機(jī)和售票員中途私自載客的行為起到很好的監(jiān)督作用。同時(shí)實(shí)現(xiàn)交管等第三方監(jiān)管,車(chē)載客流統(tǒng)計(jì)系統(tǒng)對(duì)交警、交管、教育等三方監(jiān)管單位,對(duì)公交車(chē),大巴車(chē),校車(chē)實(shí)時(shí)監(jiān)控客流數(shù)據(jù),這種創(chuàng)新型的技術(shù)監(jiān)督手段,給公車(chē)載客安全帶來(lái)極大便利。
通過(guò)雙目攝像機(jī)捕捉到視頻圖像,分析經(jīng)過(guò)圖像中的所有物體的高度、形狀、方向,從而精確的判斷這個(gè)物體是否是人,和人的進(jìn)出方向,精確的累加進(jìn)出的人數(shù),并疊加日期和時(shí)間,生成一條進(jìn)出記錄。雙目攝像機(jī)內(nèi)置的紅外LED燈照明能適應(yīng)任何光線環(huán)境,即使全黑的情況也能正常工作。進(jìn)出人數(shù)的數(shù)據(jù)可以通過(guò)RS485、RS232、TCP/IP、USB盤(pán)進(jìn)行傳輸。內(nèi)置的獨(dú)立數(shù)字I/O口可以方便的和其它設(shè)備或開(kāi)關(guān)門(mén)的設(shè)備相連接。如連接DVR,則可以標(biāo)記有人經(jīng)過(guò)時(shí)的視頻段,便于事后回放檢索,可彌補(bǔ)計(jì)數(shù)儀的精度不足。如連接門(mén)的開(kāi)關(guān),則可設(shè)置當(dāng)門(mén)關(guān)閉時(shí),計(jì)數(shù)儀停止計(jì)數(shù)。
VPC是一款基于雙目立體視覺(jué)技術(shù)的小巧、自動(dòng)、非接觸式的高科技智能視覺(jué)產(chǎn)品。能在公交車(chē)、大巴車(chē)、和建筑物的各種門(mén)/通道下進(jìn)行人數(shù)統(tǒng)計(jì)和計(jì)數(shù)。VPC能區(qū)分進(jìn)/出的人數(shù)或者是停留在某個(gè)封閉的區(qū)域內(nèi)部的人數(shù)。
VPC是通過(guò)檢測(cè)和分析經(jīng)過(guò)雙目攝像機(jī)視野下物體的高度、大小和方向,來(lái)判斷出物體的移動(dòng)方向是“進(jìn)”還是“出”,從而將該物體的“進(jìn)”“出”信息實(shí)時(shí)記錄,并以時(shí)間順序保存到VPC中的可擦寫(xiě)存儲(chǔ)器,這些“進(jìn)”“出”記錄可以被下載和做進(jìn)一步的報(bào)表分析。
雙目立體視覺(jué)匹配一直是計(jì)算機(jī)視覺(jué)領(lǐng)域研究的熱點(diǎn)問(wèn)題,人們一直熱追于物體的三維恢復(fù),獲得效果不錯(cuò)的視覺(jué)感受,立體視覺(jué)中立體匹配是最重要最困難的問(wèn)題[6]。雙目視覺(jué)的基本原理就是模擬人眼利用照像設(shè)備從不同的位置獲取被測(cè)量物體的兩幅圖像,然后通過(guò)計(jì)算圖像對(duì)應(yīng)點(diǎn)之間的位置偏差,獲取物體三維幾何信息和深度信息。這兩個(gè)存在距離差別的圖像,即稱(chēng)作視差圖像。雙目立體視覺(jué)技術(shù)主要包括圖像獲取,攝像機(jī)標(biāo)定,特征點(diǎn)匹配以及三維信息恢復(fù)幾個(gè)方面。立體視覺(jué)的雙目攝像機(jī)比起平面(二維)視覺(jué)的單個(gè)攝像機(jī)而言,在分析可視范圍內(nèi)各物體之間相對(duì)距離(深度/高度信息)上具有更高的精度,如圖4。
為了能實(shí)時(shí)監(jiān)看乘客上下車(chē)的情況,VPC可以通過(guò)RS485/232接口連接在隨車(chē)的其它設(shè)備上,進(jìn)行實(shí)時(shí)人數(shù)數(shù)據(jù)傳輸,如圖5。采用雙目視頻客流統(tǒng)計(jì)產(chǎn)品,實(shí)時(shí)采集上/下車(chē)客流,并通過(guò)RS232串口與GPS報(bào)站器的通信,確定每個(gè)時(shí)間段、每個(gè)站點(diǎn)上/下客流,統(tǒng)計(jì)車(chē)內(nèi)實(shí)時(shí)總?cè)藬?shù),確定不同時(shí)段的乘客擁擠程度,向決策層提供公交行業(yè)客流分析、分布數(shù)據(jù),最終為公交線路運(yùn)力調(diào)整提供科學(xué)依據(jù)。例如嵌入式DVR或GPS/GPRS通過(guò)GPRS/3G網(wǎng)絡(luò)實(shí)時(shí)將上下乘客數(shù)據(jù)上傳到后臺(tái),便于查看。
VPC上集成的帶有隔離的數(shù)字I/O接口,可連接車(chē)門(mén)開(kāi)關(guān)時(shí)的信號(hào),以保證VPC在開(kāi)門(mén)時(shí)計(jì)數(shù)。
該產(chǎn)品目前已經(jīng)在上海、廣州等地區(qū)實(shí)際安裝使用,準(zhǔn)確率達(dá)到95%左右。
5 結(jié)語(yǔ)
智能視頻檢索技術(shù)已經(jīng)得到了快速發(fā)展,提升了智能視頻檢索產(chǎn)品的應(yīng)用準(zhǔn)確率及效率,在完善核心算法的同時(shí),現(xiàn)階段將繼續(xù)向以下幾個(gè)方面努力:首先,與智能視頻監(jiān)控技術(shù)、云計(jì)算、物聯(lián)網(wǎng)等新一代技術(shù)相結(jié)合,擴(kuò)展更大的智能視頻應(yīng)用范圍。其次,要立足行業(yè)用戶需求,推出細(xì)分化市場(chǎng)服務(wù),研發(fā)出更有針對(duì)性的產(chǎn)品,以符合現(xiàn)場(chǎng)環(huán)境的需求,提高產(chǎn)品的判別能力。第三,要加強(qiáng)研發(fā)力量,繼續(xù)完善產(chǎn)品性能指標(biāo)。
參考文獻(xiàn)
[1]王睿林. 智能分析助力大數(shù)據(jù)時(shí)代視頻檢索技術(shù)發(fā)展. 中國(guó)安防網(wǎng), 2014-10-14.
[2]張國(guó)伍. 北京市公共交通總公司, 北方交通大學(xué). 城市公共交通運(yùn)營(yíng)調(diào)度管理[M]. 北京:中國(guó)鐵道出版社, 2011.
[3]張?chǎng)? 雙目立體測(cè)量系統(tǒng)標(biāo)定及精度評(píng)價(jià). 計(jì)算機(jī)應(yīng)用與軟件 2014,(7):160.
[4]Lowe D. G.Distinctive image features from scaleinvariantkeypoints[J]. International Journal of ComputerVision, 2004,(60):91.
篇9
關(guān)鍵詞:雙目視覺(jué),特征提取,特征匹配,三維混合地圖
中圖分類(lèi)號(hào):G255.4 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1007-9599 (2010) 09-0000-01
Construction of Three-dimensional Mixed Feature Map
Liu Hongbo
(Dezhou Vocational and Technical College,Dezhou253034,China)
Abstract:This paper introduces the basic principles of binocular vision and space point reconstruction.Use of binocular vision sensor for the environmental characteristics of three-dimensional coordinates of points,established a three-dimensional geometric features of the environment map,the same time,these features corner windows local gray level information be saved as image feature information,geometric features including built environment and image characteristics of mixed map.
Keywords:Binocular vision,Feature extraction;Feature matching;Three-dimensional hybrid map
立體成像的方式主要由光源、采集器和景物三者的位置決定。如果采用兩個(gè)采集器分別在一個(gè)位置對(duì)同一場(chǎng)景取像就是雙目成像。
環(huán)境地圖構(gòu)建地越精確,對(duì)服務(wù)機(jī)器人的運(yùn)動(dòng)越有利。目前大多數(shù)研究是采用聲納等距離傳感器來(lái)構(gòu)建地圖,但是這些距離傳感器的分辨率較低,且存在高度不確定性,在復(fù)雜的環(huán)境中由于觀測(cè)數(shù)據(jù)的高度不確定性很難取得理想的效果,本文將介紹利用雙目視覺(jué)傳感器,構(gòu)建三維立體混合特征地圖。
一、雙目立體視覺(jué)實(shí)現(xiàn)原理
(一)雙目立體視覺(jué)實(shí)現(xiàn)步驟
雙目立體視覺(jué)技術(shù)的實(shí)現(xiàn)可分為以下步驟:圖像獲取、攝像機(jī)標(biāo)定、特征提取、立體匹配和三維重建。
(二)三維混合地圖的提出
環(huán)境地圖的表示方法對(duì)于SLAM的性能至關(guān)重要。在構(gòu)建混合特征地圖的過(guò)程中,利用立體視覺(jué)傳感器提取環(huán)境的Harris角點(diǎn)特征,通過(guò)立體匹配算法獲得這些角點(diǎn)精確的坐標(biāo)值,通過(guò)坐標(biāo)轉(zhuǎn)換,建立起米制坐標(biāo)的三維立體模型,同時(shí)獲取這些幾何特征對(duì)應(yīng)的圖像特征信息,并將這些混合信息進(jìn)行綁定,作為實(shí)時(shí)更新信息存入智能空間信息庫(kù)中。利用混合特征構(gòu)建地圖可以有效提高機(jī)器人定位的精度。
二、雙目視覺(jué)傳感器模型
求物體的深度,主要問(wèn)題在于從立體圖像中找到對(duì)應(yīng)點(diǎn)。兩部攝像機(jī)安裝于不同的位置,對(duì)同一物體或目標(biāo)同時(shí)拍攝兩幅圖片,構(gòu)成一組立體圖像。同一物體的某一點(diǎn)在兩幅圖像中的位置差稱(chēng)為視差,該視差與對(duì)應(yīng)點(diǎn)在空間中的位置、方位以及攝像機(jī)的物理特性有關(guān),若攝像機(jī)的參數(shù)已知,則可以得出物體的深度。
假設(shè)兩部攝像機(jī)的光學(xué)中心線平行,間距為 ,目標(biāo)物 與兩部CCD光學(xué)中心線的距離分別為 和 ,其投影到兩部CCD圖像。
平面上與光學(xué)中心線的距離分別為 和 ,視差,由幾何系得:
(1)
則: (2)
三、構(gòu)建局部三維地圖
空間點(diǎn)是構(gòu)成三維空間結(jié)構(gòu)的最基本單元,理論上可以由點(diǎn)形成線,由線形成面,再由各種面構(gòu)成三維立體結(jié)構(gòu)。假如能得到物體表面上所有點(diǎn)的空間坐標(biāo),那么三維物體的形狀與位置就是唯一確定的,因此,空間點(diǎn)的重建是計(jì)算機(jī)視覺(jué)三維重建的最基本的要素。
考慮非平行雙目系統(tǒng)的計(jì)算量比較大,因此采取特殊布置的雙目視覺(jué)系統(tǒng)。選取兩個(gè)內(nèi)部參數(shù)完全相同的攝相機(jī),平行放置,使它們的光軸相互平行,另有一對(duì)坐標(biāo)軸共線,使得兩個(gè)成像平面共面,兩相機(jī)的光心有一個(gè)固定距離。這樣求解圖像點(diǎn)的世界坐標(biāo)時(shí)僅涉及到相機(jī)的內(nèi)部參數(shù),降低了目標(biāo)點(diǎn)計(jì)算的難度。
經(jīng)過(guò)特征點(diǎn)匹配對(duì)應(yīng)以后,可以求取對(duì)應(yīng)點(diǎn)之間的視差 ,根據(jù)前面提到的立體視覺(jué)原理,可以獲得特征點(diǎn)的深度(depth),進(jìn)而求出場(chǎng)景征點(diǎn)相對(duì)于攝像機(jī)坐標(biāo)系的三維坐標(biāo)值,如下:
(3)
其中, 、 為圖像中心坐標(biāo), 和焦距 屬于攝像機(jī)的參數(shù)。
實(shí)驗(yàn)中利用左右攝像機(jī)獲取了兩幅圖像,采集的圖像像素為320×240,根據(jù)計(jì)算得出三維立體圖。運(yùn)用Harris角點(diǎn)檢測(cè)方法提取環(huán)境中物體的基元特征,通過(guò)立體匹配算法實(shí)現(xiàn)對(duì)應(yīng)特征點(diǎn)的匹配,根據(jù)成像關(guān)系計(jì)算出角點(diǎn)的三維幾何信息,獲取的數(shù)據(jù)較為準(zhǔn)確。
四、智能空間中的混合特征地圖
在智能空間的信息數(shù)據(jù)庫(kù)中,混合地圖信息作為實(shí)時(shí)更新的信息存入其中,可用以下形式表示:
(4)
(5)
其中, 為實(shí)時(shí)更新信息庫(kù), 為混合地圖信息, 為環(huán)境特征的幾何信息集合, 為環(huán)境的圖像特征信息集合, 和 為具體信息,“ ”表示相關(guān)性。
提取環(huán)境中的一特征角點(diǎn),該點(diǎn)的序號(hào)是5,它的三維幾何坐標(biāo)為(36.15,18.72,103.43),將角點(diǎn)5的這些信息進(jìn)行綁定,即可以得到該點(diǎn)的混合地圖信息 ,包含了三維幾何信息 和圖像特征灰度信息 。
五、深度圖的表示
形狀是三維物體的最基本性質(zhì),利用它能夠推導(dǎo)出許多其他特性,例如:表面結(jié)構(gòu),物體的邊界等。形狀是組成物體外輪廓或外表面的所有點(diǎn)的相對(duì)位置所決定的性質(zhì),因此表示景物中的形狀可通過(guò)灰度/深度圖和灰度/表面方向表示。
篇10
關(guān)鍵詞:目標(biāo)檢測(cè)和跟蹤; 背景差分; CamShift; OpenCV; OGRE
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)22-5156-05
1 概述
人類(lèi)和電腦的交流從打孔機(jī)到屏幕,從文字到圖形,從鼠標(biāo)到觸摸板,計(jì)算機(jī)用更符合直覺(jué)和人性的方法讓人機(jī)交互方式更加快捷方便。那么以后的人機(jī)交互會(huì)怎樣?
從另一方面,隨著圖形學(xué)和硬件計(jì)算能力的發(fā)展,計(jì)算機(jī)能夠?qū)崟r(shí)獲取和記錄人體動(dòng)作。計(jì)算機(jī)將人體動(dòng)作參數(shù)轉(zhuǎn)化為計(jì)算機(jī)中的物理模型,并且將其在虛擬環(huán)境中再現(xiàn),同時(shí)3D人體模型動(dòng)作目前成為最熱門(mén)的研究課題之一?,F(xiàn)在人體運(yùn)動(dòng)主要通過(guò)各種傳感器進(jìn)行捕獲和測(cè)量,并通過(guò)傳感器將相關(guān)的人體信息記錄為虛擬動(dòng)作。這種方法更加精確,但是由于其成本較高,計(jì)算量較大且需要特定的實(shí)驗(yàn)場(chǎng)合,因此無(wú)法廣泛應(yīng)用。
目前基于OpenCV的第六感交互技術(shù)和3D圖形處理技術(shù)正在迅速發(fā)展之中,該文討論如何通過(guò)這些技術(shù)完成基于計(jì)算機(jī)視覺(jué)的人體運(yùn)動(dòng)3D模型動(dòng)作記錄器,嘗試將人機(jī)交互推向更深的層次。
2 系統(tǒng)分析
3 獲取背景
攝像機(jī)首先獲取靜態(tài)場(chǎng)景,從而作為運(yùn)動(dòng)目標(biāo)檢測(cè)判斷的依據(jù),因此需要對(duì)背景不斷進(jìn)行更新。常用的背景更新方法有包括多幀平均法,選擇更新法,隨機(jī)更新法等。多幀平均法簡(jiǎn)單而且準(zhǔn)確,但是計(jì)算量大,并且在運(yùn)動(dòng)物體多且運(yùn)動(dòng)速度緩慢的情況下也不能達(dá)到滿意的效果;選擇更新法對(duì)于光線的變化有較強(qiáng)的適應(yīng)性,但是環(huán)境光線變化強(qiáng)烈時(shí)容易檢測(cè)錯(cuò)誤,并且受人為因素較大。
本課題采用將多幀圖像分別和背景圖像做差,并用幀間差來(lái)判斷光線的變化。該方法通過(guò)多幀的聯(lián)合判斷,能夠較準(zhǔn)確判斷監(jiān)視場(chǎng)景中是否有運(yùn)動(dòng)的物體或者是否應(yīng)該進(jìn)行背景更新。該方法融入了背景差分法對(duì)于物體的準(zhǔn)確分割,又運(yùn)用了幀差法較強(qiáng)的適應(yīng)性。
為了不受背景的影響,人物捕捉采用了人物進(jìn)入捕捉方法。首先實(shí)現(xiàn)對(duì)人物進(jìn)入的實(shí)時(shí)判斷監(jiān)測(cè),在沒(méi)人的時(shí)候進(jìn)行背景更新,而當(dāng)有人進(jìn)入領(lǐng)域時(shí)則實(shí)現(xiàn)了動(dòng)作實(shí)時(shí)監(jiān)測(cè)功能。為了緩沖圖像采集速度并配合3D模型輸出,每幀間間隔20ms保證系統(tǒng)運(yùn)行流暢。而運(yùn)動(dòng)目標(biāo)檢車(chē)跟蹤部分和3D模塊部分則通過(guò)全局的條件變量實(shí)現(xiàn)同步和互斥的操作。
4 運(yùn)動(dòng)目標(biāo)檢測(cè)
運(yùn)動(dòng)目標(biāo)檢測(cè)是指在序列圖像中檢測(cè)出變化區(qū)域并將運(yùn)動(dòng)目標(biāo)從背景圖像中提取出來(lái)。一般后處理過(guò)程僅僅考慮圖像中對(duì)應(yīng)于運(yùn)動(dòng)目標(biāo)的像素區(qū)域,因此運(yùn)動(dòng)目標(biāo)檢測(cè)與分割對(duì)于后期處理起決定性作用。運(yùn)動(dòng)目標(biāo)檢測(cè)方法有很多,包括幀差法、光流法、背景差分法等,該文選擇背景差分法對(duì)靜態(tài)背景下的目標(biāo)進(jìn)行分析。
通過(guò)上述原理可知,首先獲取背景圖像,將背景圖像和當(dāng)前圖像轉(zhuǎn)化為灰度圖像并進(jìn)行高斯濾波以平滑圖像;之后將當(dāng)前圖像和背景圖像相減,差值圖像二值化,再進(jìn)行形態(tài)學(xué)濾波,消除噪聲;最后將二值圖像掃描并查看是否有非零值像素點(diǎn),從而獲取目標(biāo)像素。在此差分圖像中,若像素的值大于一個(gè)特定的閾值,則認(rèn)為視頻圖像中在相同位置的像素屬于運(yùn)動(dòng)目標(biāo)區(qū)域,若像素的值小于特定的閾值,則認(rèn)為視頻圖像中在相同位置的像素屬于背景區(qū)域。
在本課題中,當(dāng)人物進(jìn)入靜態(tài)場(chǎng)景時(shí),程序處理捕捉到的圖像,檢測(cè)出人物部分的像素差大于設(shè)定的閾值從而檢測(cè)出目標(biāo)人體。如圖2所示,黑色部分是差分之后的背景,白色部分是通過(guò)背景檢測(cè)出的人體。從圖中可以看出,背景差分法可以正確的檢測(cè)出運(yùn)動(dòng)目標(biāo),但是由于算法只用亮度值做為檢測(cè)依據(jù),因此當(dāng)運(yùn)動(dòng)目標(biāo)的亮度與背景亮度相似時(shí),就難以檢測(cè)出目標(biāo)。
5 運(yùn)動(dòng)目標(biāo)跟蹤
運(yùn)動(dòng)目標(biāo)檢測(cè)之后,計(jì)算機(jī)則需要跟蹤提取出來(lái)的檢測(cè)目標(biāo)。運(yùn)動(dòng)目標(biāo)跟蹤方法包括meanshift、camshift、kalman濾波等。其中Camshift的全稱(chēng)是 “ContinuouslyApative Meanshift”算法,基本原理是將跟蹤目標(biāo)的色彩信息做為特征,并將這些信息計(jì)算處理后投影到下一幀圖像中,計(jì)算出這幅圖像中的目標(biāo),并用這幅圖像作為新的源圖,分析下一幀圖像,重復(fù)這個(gè)過(guò)程就可以實(shí)現(xiàn)對(duì)目標(biāo)的連續(xù)跟蹤。在每次搜尋前將搜尋窗口的初始值設(shè)置為移動(dòng)目標(biāo)當(dāng)前的位置和大小,由于搜尋窗就在移動(dòng)目標(biāo)可能出現(xiàn)的區(qū)域附近,搜索時(shí)就可以節(jié)省大量的搜尋時(shí)間,因此Camshift 算法實(shí)時(shí)性較好,另外Camshift 算法是通過(guò)顏色匹配找到移動(dòng)目標(biāo),而在目標(biāo)移動(dòng)過(guò)程中顏色信息變化不大,所以Camshift 算法具有良好的可靠性??紤]到以上因素,故采用camshift算法。
Camshift方法首先將RGB空間轉(zhuǎn)換為HSV空間并提取H顏色分量hue;然后提取跟蹤窗口并得到需要跟蹤的區(qū)域selection,之后根據(jù)獲得的色彩直方圖將原始圖像轉(zhuǎn)化成色彩概率分布圖像。處理前目標(biāo)圖像中的每一個(gè)像素值描述該點(diǎn)的顏色信息,而處理后每一個(gè)像素值則成為該顏色信息出現(xiàn)在此處的可能性離散化度量;之后對(duì)目標(biāo)直方圖的反向投影backproject進(jìn)行搜索,并返回下一幀的跟蹤窗口;最后畫(huà)出跟蹤結(jié)果的位置并循環(huán)執(zhí)行。
6 3D建模
7 測(cè)試
由表2可知,背景固定、光照滿足一定強(qiáng)度以及背景不能有運(yùn)動(dòng)雜質(zhì)即可滿足系統(tǒng)要求。最后系統(tǒng)在不同的平臺(tái)上進(jìn)行測(cè)試。基于X86的計(jì)算機(jī)系統(tǒng)(CPU主頻2G,內(nèi)存2G)反應(yīng)時(shí)間不超過(guò)1秒,而基于ARM9的嵌入式平臺(tái)(CPU主頻203.3MHZ,內(nèi)存64M)系統(tǒng)反應(yīng)時(shí)間不超過(guò)2秒,滿足了實(shí)時(shí)性的需求。
綜上,本系統(tǒng)并通過(guò)了開(kāi)發(fā)階段的測(cè)試。系統(tǒng)設(shè)計(jì)較好地實(shí)現(xiàn)了通過(guò)攝像頭捕捉跟蹤人物動(dòng)作來(lái)操作女孩做基本動(dòng)作的功能,在功能上還可以再添加更多動(dòng)作已期更好實(shí)現(xiàn)動(dòng)作記錄功能。由于采用高實(shí)時(shí)性和低消耗的算法設(shè)計(jì),因此系統(tǒng)擁有較好的同步操作,動(dòng)作記錄延遲較小。另外系統(tǒng)在經(jīng)過(guò)捕捉圖像預(yù)處理下能夠適應(yīng)更多的環(huán)境,在多次的測(cè)試與修改之后,本課題最終獲得了良好的測(cè)試結(jié)果。
8 總結(jié)
本系統(tǒng)通過(guò)攝像頭獲取人體運(yùn)動(dòng)視頻并檢測(cè)跟蹤,之后通過(guò)處理數(shù)據(jù)控制3D模型,從而將人體動(dòng)作進(jìn)行記錄保存。系統(tǒng)要求首先提取靜態(tài)背景建立背景模型,之后采用背景差分和Camshift方法對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行檢測(cè)跟蹤,因此要求光線穩(wěn)定、運(yùn)動(dòng)物體較少的環(huán)境條件。除此之外,Camshift方法對(duì)跟蹤目標(biāo)的選擇也是有一定的限制:鮮艷的目標(biāo)物體跟蹤起來(lái)很容易,但是由于白色物體H分量太低很容易跟丟。
在實(shí)時(shí)性方面,視頻流數(shù)據(jù)送入系統(tǒng)處理之后將處理結(jié)果顯示在屏幕上。通過(guò)觀察視頻處理結(jié)果,發(fā)生視頻流能夠流暢的顯示,并沒(méi)有出現(xiàn)停滯和跳幀的情況,這就說(shuō)明本文的跟蹤系統(tǒng)已經(jīng)達(dá)到了實(shí)時(shí)性的要求。
參考文獻(xiàn):
[1] 毛劍飛,鄒細(xì)勇,諸靜.改進(jìn)的平面模板兩步法標(biāo)定攝像機(jī)[J].中國(guó)圖像圖形學(xué)報(bào),2004,9(7):846-852.
[2] 張春田,蘇育挺.數(shù)字圖像壓縮編碼[M].北京:清華大學(xué)出版社,2006:20-23.
[3] Park J S.Interactive 3D reconstruction from multiple images:a primitive-based approach[J].Pattern Recognition Letters,2005,26(16):2558-2571.
[4] Intel Corporation. Open Source Computer Vision Library Reference Manual[S].2001-12.
[5] Fernando de la Torre Frade, Elisa Martínez Marroquín,MaEugenia Santamaría Pérez,Jose Antonio Morán Moreno. Moving object detection and tracking system:a real-time implementation.1997.
熱門(mén)標(biāo)簽
計(jì)算機(jī)論文 計(jì)算機(jī)畢業(yè)論文 計(jì)算機(jī)技術(shù)論文 計(jì)算機(jī)教育論文 計(jì)算機(jī)專(zhuān)業(yè)論文 計(jì)算機(jī)基礎(chǔ)論文 計(jì)算機(jī)教學(xué)論文 計(jì)算機(jī)應(yīng)用論文 計(jì)算化學(xué)論文 計(jì)算機(jī)專(zhuān)業(yè)畢業(yè)論文 心理培訓(xùn) 人文科學(xué)概論
相關(guān)文章
1計(jì)算機(jī)類(lèi)專(zhuān)業(yè)開(kāi)展工程的思考
2高職院校計(jì)算機(jī)專(zhuān)業(yè)人才培養(yǎng)探析
4中職計(jì)算機(jī)教學(xué)應(yīng)用策略