計(jì)算機(jī)視覺識別技術(shù)范文

時間:2023-12-19 18:02:45

導(dǎo)語:如何才能寫好一篇計(jì)算機(jī)視覺識別技術(shù),這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

計(jì)算機(jī)視覺識別技術(shù)

篇1

關(guān)鍵詞:煙葉數(shù)字圖像;邊緣處理;形態(tài)學(xué)變換;特征抽??;智能識別

1引言

煙葉是煙草工業(yè)的基礎(chǔ)原料, 對煙草工業(yè)生產(chǎn)質(zhì)量和煙草行業(yè)經(jīng)營效益具有舉足輕重的作用。對煙葉生產(chǎn)過程的各個環(huán)節(jié)包括煙葉品質(zhì)的智能識別進(jìn)行技術(shù)創(chuàng)新,提高品質(zhì)和效率,是一個前沿研究方向[1][5]。

當(dāng)前這一方面的研究,主要集中在數(shù)字圖像處理方面,把煙葉品質(zhì)的數(shù)字圖像處理與神經(jīng)網(wǎng)絡(luò)技術(shù)相結(jié)合,實(shí)現(xiàn)煙葉品質(zhì)的智能識別,是一個極有價(jià)值的工作。以下在此方面作出一個系統(tǒng)的、較為完備的、易于實(shí)際操作的研究。

2主要技術(shù)手段

2.1 MAⅡAB圖像處理工具箱

在MATLAB平臺上,借助圖像處理工具箱,可以簡易明快地實(shí)現(xiàn)對煙葉數(shù)字圖像的圖像處理。在煙葉生產(chǎn)一線,用數(shù)碼照相機(jī)對各種煙葉樣本進(jìn)行拍照,輸入計(jì)算機(jī),用MAT_LAB將它轉(zhuǎn)換為各(.bmp;.jpeg;.gif;.png;.t 圖片以便進(jìn)行圖像處理。成本低,精確度高,宜于普及推廣。獲取各種類型的煙葉數(shù)字圖像以后,經(jīng)閾值使用權(quán)圖像二值化,可以當(dāng)即辨識出這一圖像是否具有何種類型的病蟲害或品質(zhì)異變。利用煙葉數(shù)字圖像的邊緣檢測、輪廓提取等分析命令,獲得待測煙葉的圖像參數(shù)和特征,再由神經(jīng)網(wǎng)絡(luò)技術(shù),完成對煙葉品質(zhì)的智能識別。

2.2神經(jīng)網(wǎng)絡(luò)技術(shù)

神經(jīng)網(wǎng)絡(luò)是一個新的智能識別工具。畢業(yè)論文 經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)能夠存儲與過程有關(guān)的信息,能直接從歷史數(shù)據(jù)中學(xué)習(xí),經(jīng)過用各種煙葉樣本訓(xùn)練和學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),能自動地識別出待測煙葉樣本的品質(zhì)類型。而且,神經(jīng)網(wǎng)絡(luò)具有濾除噪聲及在有噪聲情況下得出正確結(jié)論的能力。這一點(diǎn)對于煙葉生產(chǎn)實(shí)際中大量存在各種噪聲信息的情況而言,特別重要。它特別適合在線識別。

3應(yīng)用MATLAB圖像處理工具箱和神經(jīng)網(wǎng)絡(luò)技術(shù)對煙葉品質(zhì)智能識別的操作過程

3.1煙葉圖片樣本庫的建立

用數(shù)碼相機(jī)或其它數(shù)字圖像采集工具,采集各種類型的煙葉的標(biāo)準(zhǔn)圖片,分類歸檔,借助MATLAB圖像變換功能,將各種類型的煙葉的標(biāo)準(zhǔn)圖片,轉(zhuǎn)換成各種圖片形式:.bmp;.jpeg;.sir;.png;.tif等,以便隨時調(diào)用。這些煙葉圖片,有不同品質(zhì)的樣本;還有各種病蟲害標(biāo)本和變異標(biāo)本。

3.2用直方圖均衡來實(shí)現(xiàn)圖像增強(qiáng)

當(dāng)從生產(chǎn)一線采集的煙葉待測樣本的圖像對比度較低,碩士論文 即灰度直方圖分布區(qū)間較窄時,可用直方圖均衡實(shí)現(xiàn)灰度分布區(qū)間展寬而達(dá)到圖像增強(qiáng)的效果。

3.3煙葉圖像的邊緣檢測和特征提取

煙葉圖像的基本特征之一是圖像邊緣。圖像邊緣是圖像周圍像素灰度有階躍性變化或屋頂變化的像素的集合。煙葉的邊緣是由灰度的不連續(xù)性所致,因此考察圖像每個像素在某個鄰域內(nèi)灰度的變化,利用邊緣鄰近一階或二階方向?qū)?shù)變化規(guī)律可以檢測煙葉圖像邊緣。圖像特征反映煙葉的幾何結(jié)構(gòu),如面積、周長、分形分維數(shù)、孔洞數(shù)、歐拉數(shù)等等。圖像特征的選擇是圖像識別的重要環(huán)節(jié)。運(yùn)用二叉分類法在找出判別特征后,對不同的圖像特征由分類閾值按二分的方法進(jìn)行分類;運(yùn)用相似距離分類方法把待判圖像與一個標(biāo)準(zhǔn)圖像相比,標(biāo)準(zhǔn)圖像用樣本圖像特征向量的均值來表示。通過計(jì)算待判圖像與標(biāo)準(zhǔn)圖像之問的在相空間中的距離來判別圖像和進(jìn)行分類。這一過程還為用神經(jīng)網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)對煙葉品質(zhì)進(jìn)行智能識別作出必要的準(zhǔn)備。

3.4數(shù)字圖像矩陣數(shù)據(jù)的顯示及其傅立葉

變換這一變換的目的是為提取特征、進(jìn)行神經(jīng)網(wǎng)絡(luò)模式識別等作出必要的準(zhǔn)備。

轉(zhuǎn)貼于 3.5直方圖均勻化

這是使煙葉圖像性質(zhì)更為優(yōu)良而采取的一個技術(shù)操作,源代碼如下:

I=imread ("yangshuo.tif');imshow (I);

figure,imhist(I);

[J,T]=histeq (I,64);

%圖像灰度擴(kuò)展到0-255,但是只有64個灰度級

figure,imshow (J);

figure,imhist(J);

figure,Dlot((0:255)/255,T);%轉(zhuǎn)移函數(shù)的變換曲線

J=histeq (I,32);

figure,imshow 0);

%圖像灰度擴(kuò)展到0~255,但是只有32個灰度級

figure,imhist(J);

3.6采用二維中值濾波函數(shù)對受椒鹽噪聲干擾的圖像濾波

MATLA圖像處理工具箱具有強(qiáng)大的功能,能夠?qū)υ肼暩蓴_的煙葉圖片進(jìn)行消噪處理,模擬源代碼如下:

I=imread ("eight.tif');

imshow (I);

J2=imnoise (I,"salt&pepper ,0.04);

%疊加密度為0.04 的椒鹽噪聲

figure,imshow 02);

I_Filterl=medfdt2 (J2,[3 ,3]);

%窗口大小為3x3

figure.imshow (I Fiher1);

I_Filter 2=medfdt2 (J2,[5, 5]);

%窗口大小為5x5

figure,imshow (I_Filter2);

I_Filter3=medf'dt2 (J2,[7, 7]);

%窗口大小為7x7

figure,imshow (I_Filter3);

3.7用神經(jīng)網(wǎng)絡(luò)技術(shù)對煙葉圖像進(jìn)行智能識別

神經(jīng)網(wǎng)絡(luò)作為一種自適應(yīng)的模式識別技術(shù),并不需要預(yù)選給定有關(guān)模式的經(jīng)驗(yàn)知識和判別函數(shù),它能通過自身的學(xué)習(xí)機(jī)制自動形成所要求的決策區(qū)域。網(wǎng)絡(luò)的我由其拓樸結(jié)構(gòu)、神經(jīng)元特性、學(xué)習(xí)和訓(xùn)練規(guī)則所決定,它可以充分利用狀態(tài)信息,對不同狀態(tài)一一進(jìn)行訓(xùn)練而獲得某種映射關(guān)系,并且,網(wǎng)絡(luò)可以連續(xù)學(xué)習(xí),即使環(huán)境變異,這咱映射關(guān)系可以自適應(yīng)調(diào)整。在上面各節(jié)獲取煙葉圖像特征基礎(chǔ)之上,可以用神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行圖像模式識別。例如,基于概率神經(jīng)網(wǎng)絡(luò)PNN的煙葉品質(zhì)智能識別,它的主要優(yōu)點(diǎn)是:快速訓(xùn)練,訓(xùn)練時問僅略大于讀取數(shù)據(jù)時間;無論分類多么復(fù)雜,只要有足夠的訓(xùn)練數(shù)據(jù)(而這是煙葉生產(chǎn)一線可以做到的),就可以保證獲得貝斯葉準(zhǔn)則下的最優(yōu)解,允許增加或減少訓(xùn)練數(shù)據(jù)而無需重新進(jìn)行長時間訓(xùn)練。這一神經(jīng)網(wǎng)絡(luò)對于煙葉品質(zhì)的圖像識別,具有重要意義。 4結(jié)論

基于計(jì)算機(jī)視覺和神經(jīng)網(wǎng)絡(luò)技術(shù)的煙葉品質(zhì)識別的數(shù)字圖像處理方法,醫(yī)學(xué)論文 是煙葉生產(chǎn)環(huán)節(jié)的一種技術(shù)創(chuàng)新,它可以在煙葉生產(chǎn)一線普及推廣,簡便易行,能夠較大地提高煙葉品質(zhì)檢測的效率和質(zhì)量,以及自動化程度和智能化水平。

參考文獻(xiàn)

[1]于潤偉.基于圖像處理的稻米堊白自動檢測研究[J].中國糧油學(xué)報(bào),2007,1:122—124.

篇2

1計(jì)算機(jī)視覺的概述及基本體系結(jié)構(gòu)

1.1計(jì)算機(jī)視覺概述

通過使用計(jì)算機(jī)和相關(guān)設(shè)備,對生物視覺進(jìn)行模擬的方式,就是計(jì)算機(jī)視覺。對采集到的圖片或視頻進(jìn)行相應(yīng)的技術(shù)處理,從而獲得相應(yīng)的三維信息場景,是計(jì)算機(jī)視覺的主要任務(wù)。計(jì)算機(jī)視覺是一門學(xué)問,它就如何通過計(jì)算機(jī)和照相機(jī)的運(yùn)用,使人們獲得被拍攝對象的數(shù)據(jù)與信息所需等問題進(jìn)行研究。簡單的說,就是讓計(jì)算機(jī)通過人們給其安裝上的“大腦”和“眼睛”,對周圍環(huán)境進(jìn)行感知。計(jì)算機(jī)視覺是一門綜合性學(xué)科,在各個領(lǐng)域都有所作為,已經(jīng)吸引了各個領(lǐng)域的研究者對其研究。同時,計(jì)算機(jī)視覺也是科學(xué)領(lǐng)域中一個具有重要挑戰(zhàn)性的研究。

1.2計(jì)算機(jī)視覺領(lǐng)域基本體系結(jié)構(gòu)

提出第一個較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學(xué)等多領(lǐng)域的研究成果,提出被計(jì)算機(jī)視覺工作者基本接受的計(jì)算機(jī)視覺系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對視覺系統(tǒng)框架的各個角度、各個階段、各個功能進(jìn)行分析研究,得出了計(jì)算機(jī)視覺系統(tǒng)的基本體系結(jié)構(gòu),如圖1。

2計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用

2.1牌照識別

車輛的唯一身份是車輛牌照。在檢測違規(guī)車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應(yīng)用價(jià)值。然而在實(shí)際應(yīng)用工作中,雖然車牌識別技術(shù)相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術(shù)仍需改善。車牌定位技術(shù)、車牌字符識別技術(shù)和車牌字符分割技術(shù)是組成車牌識別技術(shù)的重要部分。

2.2車輛檢測

目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續(xù)變化的。此外,對于某些交通區(qū)域來說,公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計(jì)算機(jī)視覺技術(shù),對交通路口的不同時間、不同位置的交通情況進(jìn)行分析計(jì)算,并對交通流量進(jìn)行預(yù)測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據(jù)實(shí)際情況設(shè)置動態(tài)變化等技術(shù)提供支持。

2.3統(tǒng)計(jì)公交乘客人數(shù)

城市公共交通的核心內(nèi)容是城市公交調(diào)度問題,一個城市如何合理的解決公交調(diào)度問題,是緩解城市運(yùn)力和運(yùn)量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟(jì)利益和社會效益的提高做出了巨大的貢獻(xiàn)。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調(diào)度不均衡問題,使有限資源浪費(fèi)嚴(yán)重。在計(jì)算機(jī)視覺智能公交系統(tǒng)中,自動乘客計(jì)數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動乘客計(jì)數(shù)技術(shù),是對乘客上下車的時間和地點(diǎn)自動收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時間和地點(diǎn)兩方面對客流分析,為城市公交調(diào)度進(jìn)行合理的安排。

2.4對車道偏離程度和駕駛員工作狀態(tài)判斷

交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車道偏離導(dǎo)致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導(dǎo)致車道偏離的主要原因。針對此種現(xiàn)象,為減少交通事故的發(fā)生,計(jì)算機(jī)視覺中車道偏離預(yù)警系統(tǒng)被研究開發(fā)并被廣泛應(yīng)用。針對駕駛員眨眼頻率,利用計(jì)算機(jī)視覺對駕駛員面部進(jìn)行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對駕駛員的工作狀態(tài)進(jìn)行判斷。此外,根據(jù)道路識別技術(shù),對車輛行駛狀態(tài)進(jìn)行檢測,也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計(jì)算機(jī)視覺的基礎(chǔ)上,檢測駕駛員疲勞狀態(tài)的有效方法。

2.5路面破損檢測

最常見的路面損壞方式就是裂縫。利用計(jì)算機(jī)視覺,及時發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴(yán)重之前進(jìn)行修補(bǔ),有利于節(jié)省維護(hù)成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計(jì)算機(jī)視覺進(jìn)行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強(qiáng)了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3結(jié)論

本文從計(jì)算機(jī)視覺的概述,及計(jì)算機(jī)視覺基本體系結(jié)構(gòu),和計(jì)算機(jī)視覺在交通領(lǐng)域中的應(yīng)用三面進(jìn)行分析,可見計(jì)算機(jī)視覺在交通領(lǐng)域中的廣泛應(yīng)用,在交通領(lǐng)域中應(yīng)用的有效性、顯著性,以此可得計(jì)算機(jī)視覺在現(xiàn)展過程中的重要性。隨著計(jì)算機(jī)視覺技術(shù)的越來越成熟,交通領(lǐng)域的檢測管理一定會加嚴(yán)格,更加安全。

作者:夏棟 單位:同濟(jì)大學(xué)軟件學(xué)院

參考文獻(xiàn):

[1]段里仁.智能交通系境在我國道路空通管理中的應(yīng)用[J].北方工業(yè)時報(bào),2015(06).

[2]王豐元.計(jì)算機(jī)視覺在建筑區(qū)間的應(yīng)用實(shí)例分析[J].河北電力學(xué)報(bào),2015(04).

[3]李釗稱.主動測距技術(shù)在計(jì)算機(jī)數(shù)據(jù)分析中的作用探析[J].計(jì)算機(jī)應(yīng)用,2015(08).

[4]馬良紅.三維物體影像的攝取與分析[J].中國公路學(xué)報(bào),2014(05).

篇3

1、引言

隨著經(jīng)濟(jì)的迅猛發(fā)展,汽車的迅速普及,根據(jù)社會對汽車產(chǎn)業(yè)的要求,車輛的各方面指標(biāo)都受到人們越來越多地關(guān)注,汽車涂裝過程中的瑕疵直接影響汽車的外觀質(zhì)量,因此如何在生產(chǎn)過程中利用計(jì)算機(jī)視覺檢測技術(shù)檢測出并及時修補(bǔ)汽車涂裝過程中產(chǎn)生的瑕疵就成了首要的任務(wù)[1]。本文的研究內(nèi)容是首先了解計(jì)算機(jī)視覺檢測系統(tǒng)的工作原理,汽車涂裝瑕疵的種類,然后結(jié)合兩者的特點(diǎn),應(yīng)用計(jì)算機(jī)視覺檢測系統(tǒng)檢測汽車涂裝瑕疵。該研究的價(jià)值在于兩方面:①對于汽車生產(chǎn)的自動化和過程自動化,計(jì)算機(jī)視覺是現(xiàn)實(shí)真正意義的自動的基礎(chǔ)和一種重要的質(zhì)量控制的手段;②對于汽車涂裝瑕疵的修補(bǔ)可以提高其修補(bǔ)的精度。

2、汽車涂裝瑕疵的計(jì)算機(jī)視覺檢測系統(tǒng)

汽車涂裝瑕疵檢測系統(tǒng)主要包括照明系統(tǒng)、圖像采集卡、CCD攝像機(jī)、計(jì)算機(jī)以及軟件處理等幾個主要部分[2]。綜合計(jì)算機(jī)視覺檢測系統(tǒng)的構(gòu)成和線結(jié)構(gòu)光測量的原理,基于計(jì)算機(jī)視覺的汽車涂裝瑕疵的檢測系統(tǒng)大致是這樣構(gòu)成的:將線結(jié)構(gòu)光投射到被測物上,所形成的光斑作為傳感信號,用CCD攝像機(jī)采集光斑圖像,采集到的圖像信號被傳輸?shù)接?jì)算機(jī),根據(jù)圖像處理和計(jì)算機(jī)視覺檢測系統(tǒng)的處理產(chǎn)生處理結(jié)果,返回到涂裝生產(chǎn)線,對車身的涂裝進(jìn)行修正,從而提高產(chǎn)品質(zhì)量。汽車涂裝瑕疵的視覺檢測系統(tǒng)如圖1所示[3]。

3、計(jì)算機(jī)視覺檢測

計(jì)算機(jī)視覺是計(jì)算機(jī)對圖像進(jìn)行自動處理并報(bào)告“圖像中有什么”的過程,也就是說它識別圖像中的內(nèi)容。圖像中的內(nèi)容往往是某些機(jī)器零件,而處理的目標(biāo)不僅要能對機(jī)器零件定位,還要能對其進(jìn)行檢驗(yàn)。計(jì)算機(jī)視覺系統(tǒng)基本原理:機(jī)器視覺系統(tǒng)通常采用CCD相機(jī)攝取圖像,將其轉(zhuǎn)化為數(shù)字信號,再采用先進(jìn)的計(jì)算機(jī)硬件與軟件技術(shù)對圖像數(shù)字信號進(jìn)行處理,從而得到所需要的各種目標(biāo)圖像特征值,并在此基礎(chǔ)上實(shí)現(xiàn)模式識別、坐標(biāo)計(jì)算、灰度分布圖等多種功能。計(jì)算機(jī)視覺系統(tǒng)能夠根據(jù)其檢測結(jié)果快速地顯示圖像、輸出數(shù)據(jù)、指令,執(zhí)行機(jī)構(gòu)可以配合其完成指令的實(shí)施。計(jì)算機(jī)視覺系統(tǒng)主要由圖像獲取、圖像分析和處理、輸出顯示或控制三個功能模塊組成[4]。視覺檢測按其所處理的數(shù)據(jù)類型可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測。另外,還有X射線檢測、超聲波檢測和紅外線檢測。一個完整視覺檢測系統(tǒng)包括:圖像采集、圖像分割、零件識別、模型匹配和決策判斷。Newman[5]等描述了利用深度圖像進(jìn)行零件檢測的AVI系統(tǒng),具有一定的代表性。一個典型的AVI系統(tǒng)如圖2所示。

4、汽車涂裝瑕疵的檢測算法

由于汽車涂膜中一些缺陷的邊界比較模糊,例如:氣泡、爆裂氣泡孔、氣泡針孔、抽縮等等。邊緣處灰度變化很小,直接用傳統(tǒng)的微分邊緣檢測算法無法有效的檢測出來。所以對缺陷模糊邊緣的檢測成為了算法的關(guān)鍵[6]。本文介紹了基于線結(jié)構(gòu)光的邊緣檢測方法。汽車涂裝表面被光源投射器發(fā)出的線結(jié)構(gòu)光照射,反射出的圖像被CCD攝像機(jī)所接收傳輸?shù)接?jì)算機(jī)視覺檢測系統(tǒng)中。若涂裝表面沒有瑕疵,則產(chǎn)生圖3的圖像。若涂裝表面有瑕疵,則產(chǎn)生圖4的圖像[7]。

篇4

關(guān)鍵詞:計(jì)算機(jī)視覺;手勢交互;膚色模型;靜態(tài)識別

中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)35-0193-02

1 研究背景

隨著信息化的高速發(fā)展,人們的生活也進(jìn)入了網(wǎng)絡(luò)時代。大數(shù)據(jù),云計(jì)算也進(jìn)入了人們的生活,其標(biāo)志性的現(xiàn)象就是各類智能終端設(shè)備的不斷涌現(xiàn),它使人機(jī)交互的方式正發(fā)生著深層次改變。人機(jī)交互的方式正在從傳統(tǒng)的鼠標(biāo)搭配鍵盤的方式往觸控、語音交互、動作識別等技術(shù)為主導(dǎo)的更自然的方式轉(zhuǎn)變。其中語音與計(jì)算機(jī)視覺尤為突出,它使計(jì)算機(jī)變得更加的靈性化。而這兩者中計(jì)算機(jī)視覺又更能夠傳情表意,它能夠“看”明白用戶的肢體語言或者表情。國內(nèi)外的自然交互研究涉及了人臉識別、眼神識別、表情識別、手勢識別、肢體語言識別等。手勢識別作為一種人類普遍使用的交流方式,應(yīng)用在計(jì)算機(jī)交互上能給人一種直觀和自然的感覺。這種自然的輸入方式把人們從傳統(tǒng)的與輸入設(shè)備接觸交互方式中解放出來,使人們與計(jì)算機(jī)交互更加的輕松愉悅。

計(jì)算機(jī)視覺是讓計(jì)算機(jī)可以替代人眼的技術(shù)。更進(jìn)一步說,就是利用視頻采集設(shè)備和電腦代替人眼對指定的目標(biāo)進(jìn)行識別,并進(jìn)一步做出計(jì)算。其中,手勢識別技術(shù)是計(jì)算機(jī)視覺的一個的重要的研究方向,它是一種常用并且合理的人機(jī)交互方式。隨著計(jì)算機(jī)視覺,包括圖像處理技術(shù)以及人工智能等技術(shù),特別是虛擬現(xiàn)實(shí)技術(shù)的迅速發(fā)展,手勢識別的實(shí)現(xiàn)更加成為可能。由于客觀環(huán)境的多變及人手和手勢的多樣性,如何在限制較少的條件準(zhǔn)確識別手勢并能保證其精度、效率以及穩(wěn)定性是研究的關(guān)鍵。

手勢識別按照手勢輸入設(shè)備分類,可以分為基于數(shù)據(jù)手套的手勢識別和基于視X的手勢識別?;谝曈X的手勢識別中,最常見的手勢分類是將手勢分為靜態(tài)手勢和動態(tài)手勢。靜態(tài)手勢是一種較簡單的手勢,當(dāng)用戶做出一個固定和靜止的動作時計(jì)算機(jī)將其處理后識別出來。動態(tài)手勢相對要復(fù)雜一些,它可以看做是由一系列的靜態(tài)手勢組成的序列。如果將靜態(tài)手勢和動態(tài)手勢組合,將可以形成語義很豐富的手勢系統(tǒng)。

1目前人機(jī)交互的不足

人與計(jì)算機(jī)之間的交互方式是人機(jī)交互研究的核心。從現(xiàn)在的姿勢交互和語音交互往前追溯,有觸摸交互、手寫交互、鼠標(biāo)和鍵盤交互。姿勢交互又細(xì)分為手勢交互、表情交互、身體姿勢交互。

傳統(tǒng)的輸入設(shè)備有很多的不足之處。鼠標(biāo)和鍵盤,由于它們的使用需要接觸,在某些環(huán)境下使用不方便。用戶在車站、餐廳、購物商場等場景下要與計(jì)算機(jī)交互時,使用傳統(tǒng)交互方式十分的不便。而且在公共場合下,接觸性的使用會有很大的衛(wèi)生問題。不僅需要占用很大的空間,同時也會有設(shè)備損耗的問題。

手寫交互和觸摸交互改善了傳統(tǒng)的機(jī)械性輸入,它們是更符合人類的使用習(xí)慣的。但是它們?nèi)稳灰笥脩粢c設(shè)備接觸,這不免會在接觸設(shè)備的過程中損壞到設(shè)備。所以同樣有著易損耗等問題。

基于視覺的手勢交互很好克服了上述交互方式的不足之處。手勢交互是不需要接觸的,沒有損耗問題,也不會有接觸帶來的衛(wèi)生問題。手勢交互有符合人類動作習(xí)慣和直觀自然的優(yōu)點(diǎn),使其成為了下一代自然交互方式研究的焦點(diǎn)。

2目前國內(nèi)外手勢識別狀況

基于視覺的手勢識別不需要昂貴的設(shè)備,僅僅需要攝像頭和PC機(jī)器就夠了。其廉價(jià)的輸入設(shè)備會使其將來應(yīng)用范圍十分廣泛。手勢識別在計(jì)算機(jī)視覺的研究中是熱點(diǎn)。國內(nèi)外都有很多的學(xué)者在不斷研究。這些研究在手勢的分割、跟蹤、識別和應(yīng)用中有很多的進(jìn)展。

國外對基于視覺的手勢識別的研究工作起步很早。L.H.Howe等人使用膚色閾值和幀相減的技術(shù)實(shí)現(xiàn)了手的檢測和分割。J.Zaletel等人提出了靜態(tài)手勢特征的方法,這種方法是用于提取手指的位置的。它先計(jì)算出掌心的位置,然后將掌心的位置作為極坐標(biāo)的原點(diǎn),將手掌的輪廓映射到這個極坐標(biāo),然后利用極坐標(biāo)上的局部最大值來提取手指的位置。Huang使用3D神經(jīng)網(wǎng)絡(luò)創(chuàng)建的手勢識別系統(tǒng)實(shí)現(xiàn)了15個不同手勢的識別[1]。

在技術(shù)的應(yīng)用上面,從上世紀(jì)九十年代開始,國外的科學(xué)家就開始不斷研究手勢識別技術(shù),并且研制出一些實(shí)體來進(jìn)行試驗(yàn),例如:可以模仿人進(jìn)行手勢操作的機(jī)器人;電視控制的傳感系統(tǒng),無需遙控,利用手勢識別左右上下進(jìn)行對電視的遙控;體感游戲,更是完美的利用手勢識別,在信息交互中完全釋放出手勢識別的優(yōu)勢。

我國相對于國外的研究起步要晚,但是目前也取得了很大的研究成果。朱建偉[1]使用兩個攝像頭正交放置,實(shí)現(xiàn)了三維手勢的識別,并實(shí)現(xiàn)了使用手勢實(shí)現(xiàn)對照片的瀏覽。孫玉[3]使用Hu矩特征手勢識別和CamShift算法對手勢跟蹤,實(shí)現(xiàn)了手勢對Word的輸入和操作。

3意義

本文主要研究基于視覺的手勢識別技術(shù)和對這種技術(shù)的應(yīng)用。目標(biāo)跟蹤識別是計(jì)算機(jī)視覺領(lǐng)域中的關(guān)鍵技術(shù),多應(yīng)用于人機(jī)交互。手勢識別必將使人與機(jī)器之間的溝通變得智能化、信息化,與傳統(tǒng)的輸入設(shè)備相比,手勢操作則顯得直觀和自然,更符合人類習(xí)慣。

手勢識別作為新型的人機(jī)交互技術(shù),手勢識別技術(shù)越來越廣泛應(yīng)用到各個行業(yè)。體感游戲首先成熟使用的,改變了傳統(tǒng)的手持物體操作。更加互動,真實(shí)。使得人與游戲美妙結(jié)合,身臨其境。

手勢識別還可以用于手語識別。手語是聾啞人使用的語言,是聾啞人與正常人交流的平臺。在醫(yī)療領(lǐng)域中,具有語言交流障礙的患者,可以通過手勢識別,在預(yù)設(shè)好系統(tǒng)中,自助掛號,表達(dá)病情。更加體現(xiàn)人性化。綜上所述,手勢識別技術(shù)越來越被研發(fā)人員重視,在日常生活中涉及的領(lǐng)域也越來越多,研究價(jià)值也越來越突出。這項(xiàng)技術(shù)也將被廣泛的普及推廣到人們生活中的方方面面。

4結(jié)束語

基于計(jì)算機(jī)視覺的識別的功能還可以不斷拓展,可以實(shí)現(xiàn)攝像頭檢測人與電腦的距離(當(dāng)計(jì)算機(jī)識別出人坐在計(jì)算機(jī)前時顯示器顯示,當(dāng)人離開的時候關(guān)閉顯示器,達(dá)到節(jié)約電能的作用)等等。手勢識別還可以應(yīng)用于虛擬鍵盤,使用一個投影的鍵盤,然后通過攝像頭識別手在虛擬鍵盤上的相關(guān)操作??梢杂迷谥腔坩t(yī)療中,解決傳統(tǒng)的診療掛號方式。從根本上尋找解決病人就醫(yī)難的狀況的合理方案將健康的養(yǎng)生知識傳播到更遠(yuǎn)更廣。

參考文獻(xiàn):

[1] Guan Ran and Xu Xiangmin, A Computer Vision-Based Gesture Detectio And Recognition Technique[J]. Computer Applications and Software.2013,30(1):155-164.

篇5

關(guān)鍵詞:動態(tài)場景;自適應(yīng)預(yù)測;多特征融合;計(jì)算機(jī)視覺;運(yùn)動目標(biāo)

接受信息的關(guān)鍵手段之一就是視覺系統(tǒng),隨著科學(xué)技術(shù)水平的不斷發(fā)展,以及計(jì)算機(jī)和信號處理理論的誕生,讓機(jī)器擁有人類視覺功能已經(jīng)不再是夢。對所采集視頻中的運(yùn)動目標(biāo)進(jìn)行跟蹤、檢測,并對其目標(biāo)行為進(jìn)行分析,就是運(yùn)動目標(biāo)分析的內(nèi)容,運(yùn)動目標(biāo)分析是計(jì)算機(jī)視覺領(lǐng)域關(guān)鍵內(nèi)容之一,其屬于圖像理解與圖像分析的范疇。而在運(yùn)動目標(biāo)分析系統(tǒng)中,跟蹤與檢測運(yùn)動目標(biāo)則為中級和低級處理部分,是分析與理解行為的高等層分析模塊的基礎(chǔ)。檢測與跟蹤運(yùn)動目標(biāo)技術(shù)主要包括了:機(jī)器人視覺導(dǎo)航、軍事領(lǐng)域、運(yùn)動圖像編碼、交通管制、視覺監(jiān)視等。

1目標(biāo)檢測算法

連續(xù)圖像序列由視頻中提取出,由前景區(qū)域與背景區(qū)域共同組成了整個畫面。前景區(qū)域包含了如運(yùn)動的人體、車輛等動態(tài)要素,它是指人們較為感興趣的區(qū)域。而背景區(qū)域主要包含例如樹木、建筑物等靜態(tài)要素,它的像素值僅發(fā)生微弱變化或者不產(chǎn)生變化。在連續(xù)圖像序列中,采用一系列算法分隔開背景區(qū)域和前景區(qū)域,將運(yùn)動目標(biāo)信息有效提取,則為運(yùn)動目標(biāo)檢測。以靜態(tài)場景為基礎(chǔ)的運(yùn)動目標(biāo)檢測算法包括了光流法、背景差分法、幀間查分法等,文章主要針對背景差分法進(jìn)行介紹。

背景差分法通常適用于靜態(tài)場景,其是將背景圖像與當(dāng)前幀圖像進(jìn)行差分,運(yùn)動目標(biāo)依靠閥值化進(jìn)行檢測,因?yàn)樵撍惴▋H能夠在背景變化緩慢或者不發(fā)生變化的情況下應(yīng)用,因此就有著一定的局限性。假設(shè)當(dāng)前幀圖像為fk(x,y),背景圖像B(x,y)可通過一定的方法得出,而這時背景差分圖像則為:

(1)

而假設(shè)二值化閥值為Th,二值化圖像B(x,y)則為:

(2)

運(yùn)動目標(biāo)檢測結(jié)果可通過數(shù)學(xué)形態(tài)學(xué)處理獲得。

2 背景模型的實(shí)時更新

要更新背景圖像可采用一階KALMAN濾波來實(shí)現(xiàn),為了克服氣候變化、光照變化等外部環(huán)境變化對運(yùn)動檢測產(chǎn)生的影響,采用一階KALMAN濾波更新背景圖像公式如下:

Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)

而增益因子則為:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)

公式中?琢1和?琢2是權(quán)值系數(shù);M是第k時刻二值化后目標(biāo)圖像中p像素的值;B為背景圖像;I為當(dāng)前幀圖像。要想將運(yùn)動目標(biāo)從背景序列圖像中有效分割出來,就必須要達(dá)到?琢2足夠小的條件,且?琢1應(yīng)等于或者大于10?琢2,若?琢1值過大,就會將算法自身的去噪特性喪失,在序列背景圖像中也會存儲越來越多的運(yùn)動變化。

3 更新車輛目標(biāo)模型

核與活動輪廓算法具有效率高、技術(shù)復(fù)雜度低等特點(diǎn),它以非參數(shù)核概率密度估計(jì)理論為基礎(chǔ),在視頻運(yùn)動目標(biāo)跟蹤中廣泛應(yīng)用。彩色圖像序列通過攝像機(jī)獲取,人臉目標(biāo)模型可以采用RGB顏色空間來進(jìn)行描述。在跟蹤車輛的過程中,噪聲、遮擋、光照等干擾或多或少存在,因干擾因素的存在,車輛像素特征也會發(fā)生相應(yīng)的微弱變化。若不對目標(biāo)模型進(jìn)行更新,會對跟蹤精度產(chǎn)生影響,所以,采用的矩形模板會包括一定背景。而在實(shí)施跟蹤的過程中,要對車輛目標(biāo)模型進(jìn)行更換。如果其過程物遮擋,當(dāng)BHATTACHARYYA系數(shù)滿足?籽>Tudm條件時,更新車輛目標(biāo)模型,更新模型為:

(5)

公式中Tudm是模板更新閥值;qk-1是更新之前的車輛目標(biāo)模型。通過視頻跟蹤,在近場景和遠(yuǎn)場景拍攝到的視頻中,多尺度圖像空間由各個幀圖像構(gòu)成。例如:將將書本作為跟蹤對象,由遠(yuǎn)及近從書本的正上方拍攝六十幀圖像,為了能使矩形框正好能夠包含書本,對每幀圖像張書本手工劃定矩形框,并對框內(nèi)圖像的信息量進(jìn)行統(tǒng)計(jì)。最后,隨書本尺度的變化,給出圖像信息量變化曲線。

4 計(jì)算機(jī)視覺原理

計(jì)算機(jī)視覺是一門研究怎樣使機(jī)器進(jìn)行觀察的科學(xué),更切確地說,就是指利用電腦和攝影機(jī)代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖形處理,用電腦處理成為傳送給儀器檢測或更適合人眼觀察的圖像。計(jì)算機(jī)視覺研究相關(guān)的理論和技術(shù)作為一個科學(xué)學(xué)科,嘗試創(chuàng)建能夠從圖像或者多維數(shù)據(jù)中獲取信息的人工智能系統(tǒng)。這里所指的信息指Shannon定義的,可以用來幫助做一個決定的信息。因?yàn)楦兄梢钥醋魇菑母泄傩盘栔刑崛⌒畔?,所以?jì)算機(jī)視覺也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中感知的科學(xué)。

計(jì)算機(jī)視覺就是由計(jì)算機(jī)來代替大腦完成處理和解釋,用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段。使計(jì)算機(jī)能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力就是計(jì)算機(jī)視覺的最終研究目標(biāo),而需要經(jīng)過長期的努力才能達(dá)到這個目標(biāo)。所以,在實(shí)現(xiàn)最終目標(biāo)以前,通過努力的中期目標(biāo)是建立一種視覺系統(tǒng),這個系統(tǒng)能依靠反饋的某種程度的智能和視覺敏感完成一定的任務(wù)。例如:計(jì)算機(jī)視覺的一個重要應(yīng)用領(lǐng)域就是自主車輛的視覺導(dǎo)航,但要實(shí)現(xiàn)自主導(dǎo)航的系統(tǒng),卻還沒有條件實(shí)現(xiàn)象人那樣能識別和理解任何環(huán)境。所以,人們通過不懈的努力,研究在高速公路上具有道路跟蹤能力,有效避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。人類視覺系統(tǒng)是有史以來,人們所知道的功能最強(qiáng)大和完善的視覺系統(tǒng)。這里要指出的一點(diǎn)是在計(jì)算機(jī)視覺系統(tǒng)中計(jì)算機(jī)起代替人腦的作用。計(jì)算機(jī)視覺可以而且應(yīng)該根據(jù)計(jì)算機(jī)系統(tǒng)的特點(diǎn)來進(jìn)行視覺信息的處理,但并不等于計(jì)算機(jī)必須按人類視覺的方法完成視覺信息的處理??梢哉f,對人類視覺處理機(jī)制的研究將給計(jì)算機(jī)視覺的研究提供指導(dǎo)和啟發(fā),所以,用計(jì)算機(jī)信息處理的方法研究人類視覺的機(jī)理,建立人類視覺的計(jì)算理論,與此同時也是一個十分重要和讓人感興趣的研究領(lǐng)域。這方面的研究被稱為計(jì)算視覺。計(jì)算視覺可被認(rèn)為是計(jì)算機(jī)視覺中的一個研究領(lǐng)域。計(jì)算機(jī)視覺領(lǐng)域的不完善性與多樣性為其突出特點(diǎn)。

5 結(jié)束語

對視頻中的運(yùn)動目標(biāo)進(jìn)行跟蹤、識別、檢測,并對目標(biāo)行為進(jìn)行研究、分析,這就是基于視覺運(yùn)動目標(biāo)分析。以計(jì)算機(jī)視覺為基礎(chǔ),分析運(yùn)動目標(biāo),包括了目標(biāo)行為的理解與分析、目標(biāo)跟蹤、運(yùn)動目標(biāo)檢測、預(yù)處理圖像等,它是計(jì)算機(jī)視覺領(lǐng)域重要內(nèi)容之一。理解與分析運(yùn)動目標(biāo)的行為,既是計(jì)算機(jī)視覺的根本目的之一,也是檢測與跟蹤運(yùn)動目標(biāo)的最終目標(biāo)。從理論層考慮,理解與分析運(yùn)動目標(biāo)的行為可以分為人工智能理論研究與模式識別。簡要闡述基于計(jì)算機(jī)視覺的運(yùn)動目標(biāo)分析,而所面臨的是對運(yùn)動目標(biāo)行為的理解。

參考文獻(xiàn)

[1]楊可,劉明軍,毛欣,夏維建,劉偉,周旋,吳煒,周凱.基于計(jì)算機(jī)視覺的電纜終端表面溫升分析系統(tǒng)[J].電視技術(shù),2013(7).

[2]葉闖,沈益青,李豪,曹思汗,王柏祥.基于人類視覺特性(HVS)的離散小波變換(DWT)數(shù)字水印算法[J].浙江大學(xué)學(xué)報(bào):理學(xué)版,2013(2).

[3]何青海,馬本學(xué),瞿端陽,李宏偉,王寶.基于機(jī)器視覺棉葉螨自動監(jiān)測與分級方法研究[J].農(nóng)機(jī)化研究,2013(4).

[4]賈挺猛,茍一,鮑官軍,董茂,楊慶華.基于機(jī)器視覺的葡萄樹枝骨架提取算法研究[J].機(jī)電工程,2013(4).

篇6

國內(nèi)人工智能產(chǎn)業(yè)鏈解構(gòu)

基礎(chǔ)技術(shù)、人工智能技術(shù)和人工智能應(yīng)用構(gòu)成了人工智能產(chǎn)業(yè)鏈的三個核心環(huán)節(jié),我們將主要從這三個方面對國內(nèi)人工智能產(chǎn)業(yè)進(jìn)行梳理,并對其中的人工智能應(yīng)用進(jìn)行重點(diǎn)解構(gòu)。

人工智能的基礎(chǔ)技術(shù)主要依賴于大數(shù)據(jù)管理和云計(jì)算技術(shù),經(jīng)過近幾年的發(fā)展,國內(nèi)大數(shù)據(jù)管理和云計(jì)算技術(shù)已從一個嶄新的領(lǐng)域逐步轉(zhuǎn)變?yōu)榇蟊娀?wù)的基礎(chǔ)平臺。而依據(jù)服務(wù)性質(zhì)的不同,這些平臺主要集中于三個服務(wù)層面,即基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺即服務(wù)(PaaS)和軟件即服務(wù)(SaaS)。基礎(chǔ)技術(shù)提供平臺為人工智能技術(shù)的實(shí)現(xiàn)和人工智能應(yīng)用的落地提供基礎(chǔ)的后臺保障,也是一切人工智能技術(shù)和應(yīng)用實(shí)現(xiàn)的前提。

對于許多中小型企業(yè)來說,SaaS 是采用先進(jìn)技術(shù)的最好途徑,它消除了企業(yè)購買、構(gòu)建和維護(hù)基礎(chǔ)設(shè)施和應(yīng)用程序的需要;而 IaaS通過三種不同形態(tài)服務(wù)的提供(公有云、私有云和混合云)可以更快地開發(fā)應(yīng)用程序和服務(wù),縮短開發(fā)和測試周期;作為 SaaS 和 IaaS 中間服務(wù)的 PaaS 則為二者的實(shí)現(xiàn)提供了云環(huán)境中的應(yīng)用基礎(chǔ)設(shè)施服務(wù)。

人工智能技術(shù)平臺

與基礎(chǔ)技術(shù)提供平臺不同,人工智能技術(shù)平臺主要專注于機(jī)器學(xué)習(xí)、模式識別和人機(jī)交互三項(xiàng)與人工智能應(yīng)用密切相關(guān)的技術(shù),所涉及的領(lǐng)域包括機(jī)器視覺、指紋識別、人臉識別、視網(wǎng)膜識別、虹膜識別、掌紋識別、專家系統(tǒng)、自動規(guī)劃、智能搜索、定理證明、博弈、自動程序設(shè)計(jì)、智能控制、機(jī)器人學(xué)習(xí)、語言和圖像理解和遺傳編程等。

機(jī)器學(xué)習(xí):通俗的說就是讓機(jī)器自己去學(xué)習(xí),然后通過學(xué)習(xí)到的知識來指導(dǎo)進(jìn)一步的判斷。我們用大量的標(biāo)簽樣本數(shù)據(jù)來讓計(jì)算機(jī)進(jìn)行運(yùn)算并設(shè)計(jì)懲罰函數(shù),通過不斷的迭代,機(jī)器就學(xué)會了怎樣進(jìn)行分類,使得懲罰最小。這些學(xué)到的分類規(guī)則可以進(jìn)行預(yù)測等活動,具體應(yīng)用覆蓋了從通用人工智能應(yīng)用到專用人工智能應(yīng)用的大多數(shù)領(lǐng)域,如:計(jì)算機(jī)視覺、自然語言處理、生物特征識別、證券市場分析和DNA 測序等。

模式識別:模式識別就是通過計(jì)算機(jī)用數(shù)學(xué)技術(shù)方法來研究模式的自動處理和判讀,它偏重于對信號、圖像、語音、文字、指紋等非直觀數(shù)據(jù)方面的處理,如語音識別,人臉識別等,通過提取出相關(guān)的特征來實(shí)現(xiàn)一定的目標(biāo)。文字識別、語音識別、指紋識別和圖像識別等都屬于模式識別的場景應(yīng)用。

人機(jī)交互:人機(jī)交互是一門研究系統(tǒng)與用戶之間交互關(guān)系的學(xué)問。系統(tǒng)可以是各種各樣的機(jī)器,也可以是計(jì)算機(jī)化的系統(tǒng)和軟件。在應(yīng)用層面,它既包括人與系統(tǒng)的語音交互,也包含了人與機(jī)器人實(shí)體的物理交互。

而在國內(nèi),人工智能技術(shù)平臺在應(yīng)用層面主要聚焦于計(jì)算機(jī)視覺、語音識別和語言技術(shù)處理領(lǐng)域,其中的代表企業(yè)包括科大訊飛、格靈深瞳、捷通華聲(靈云)、地平線、SenseTime、永洪科技、曠視科技、云知聲等。

人工智能應(yīng)用

人工智能應(yīng)用涉及到專用應(yīng)用和通用應(yīng)用兩個方面,這也是機(jī)器學(xué)習(xí)、模式識別和人機(jī)交互這三項(xiàng)人工智能技術(shù)的落地實(shí)現(xiàn)形式。其中,專用領(lǐng)域的應(yīng)用涵蓋了目前國內(nèi)人工智能應(yīng)用的大多數(shù)應(yīng)用,包括各領(lǐng)域的人臉和語音識別以及服務(wù)型機(jī)器人等方面;而通用型則側(cè)重于金融、醫(yī)療、智能家居等領(lǐng)域的通用解決方案,目前國內(nèi)人工智能應(yīng)用正處于由專業(yè)應(yīng)用向通用應(yīng)用過度的發(fā)展階段。

(1)計(jì)算機(jī)視覺在國內(nèi)計(jì)算機(jī)視覺領(lǐng)域,動靜態(tài)圖像識別和人臉識別是主要研究方向

圖像識別:是計(jì)算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。識別過程包括圖像預(yù)處理、圖像分割、特征提取和判斷匹配。

人臉識別:是基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進(jìn)而對檢測到的人臉進(jìn)行臉部的一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。

目前,由于動態(tài)檢測與識別的技術(shù)門檻限制,靜態(tài)圖像識別與人臉識別的研究暫時處于領(lǐng)先位置,其中既有騰訊、螞蟻金服、百度和搜狗這樣基于社交、搜索大數(shù)據(jù)整合的互聯(lián)網(wǎng)公司,也有三星中國技術(shù)研究院、微軟亞洲研究院、Intel中國研究院這類的傳統(tǒng)硬件與技術(shù)服務(wù)商;同時,類似于 Face++ 和FaceID 這類的新興技術(shù)公司也在各自專業(yè)技術(shù)和識別準(zhǔn)確率上取得了不錯的突破。

而在難度最大的動態(tài)視覺檢測領(lǐng)域,格靈深瞳、東方網(wǎng)力和 Video++ 等企業(yè)的著力點(diǎn)主要在企業(yè)和家庭安防,在一些常見的應(yīng)用場景也與人臉識別技術(shù)聯(lián)動使用。

(2)語音/語義識別

語音識別的關(guān)鍵基于大量樣本數(shù)據(jù)的識別處理,因此,國內(nèi)大多數(shù)語音識別技術(shù)商都在平臺化的方向上發(fā)力,希望通過不同平臺以及軟硬件方面的數(shù)據(jù)和技術(shù)積累不斷提高識別準(zhǔn)確率。

在通用識別率上,各企業(yè)的成績基本維持在 95% 左右,真正的差異化在于對垂直領(lǐng)域的定制化開發(fā)。類似百度、科大訊飛這樣的上市公司憑借著深厚的技術(shù)、數(shù)據(jù)積累占據(jù)在市場前列的位置,并且通過軟硬件服務(wù)的開發(fā)不斷進(jìn)化著自身的服務(wù)能力;此外,在科大訊飛之后國內(nèi)第二家語音識別公有云的云知聲在各項(xiàng)通用語音服務(wù)技術(shù)的提供上也占據(jù)著不小的市場空間。值得注意的是,不少機(jī)器人和通用硬件制造商在語音、語義的識別上也取得了不錯的進(jìn)展,例如智臻智能推出的小 i 機(jī)器人的語義識別、圖靈機(jī)器人的個性化語音助手機(jī)器人和服務(wù)、被 Google 投資的出門問問的軟硬件服務(wù)。

(3)智能機(jī)器人

由于工業(yè)發(fā)展和智能化生活的需要,目前國內(nèi)智能機(jī)器人行業(yè)的研發(fā)主要集中于家庭機(jī)器人、工業(yè)企業(yè)服務(wù)和智能助手三個方面其中,工業(yè)及企業(yè)服務(wù)類的機(jī)器人研發(fā)企業(yè)依托政策背景和市場需要處于較為發(fā)達(dá)的發(fā)展階段,代表性企業(yè)包括依托中科院沈陽自動化研究所的新松機(jī)器人、聚焦智能醫(yī)療領(lǐng)域的博實(shí)股份,以及大疆、優(yōu)愛寶機(jī)器人、Slamtec 這類專注工業(yè)生產(chǎn)和企業(yè)服務(wù)的智能機(jī)器人公司。在以上三個分類中,從事家庭機(jī)器人和智能助手的企業(yè)占據(jù)著絕大多數(shù)比例,涉及到的國內(nèi)企業(yè)近 300 家。

(4)智能家居

與家庭機(jī)器人不同,智能家居和物聯(lián)企業(yè)的主要著力點(diǎn)在于智能設(shè)備和智能中控兩個方面。在這其中,以海爾和美的為代表的傳統(tǒng)家電企業(yè)依托自身渠道、技術(shù)和配套產(chǎn)品優(yōu)勢建立起了實(shí)體化智能家居產(chǎn)品生態(tài). 而以阿里、騰訊、京東、小米和樂視等互聯(lián)網(wǎng)企業(yè)為代表的公司則通過各自平臺內(nèi)的數(shù)據(jù)和終端資源提供不同的軟硬件服務(wù)。

值得關(guān)注的是,科沃斯、broadlink、感居物聯(lián)、風(fēng)向標(biāo)科技、歐瑞博、物聯(lián)傳感和華為等技術(shù)解決方案商在通用硬件和技術(shù)、系統(tǒng)級解決方案上已成為諸多智能家居和物聯(lián)企業(yè)的合作伙伴。綜合來看,智能家居和物聯(lián)企業(yè)由于市場分類、技術(shù)種類和數(shù)據(jù)積累的不同各自提供著差異化的解決方案。在既定市場中,沒有絕對意義上的排斥競爭,各企業(yè)之間的合作融合度較強(qiáng)。

(5)智能醫(yī)療

目前國內(nèi)智能醫(yī)療領(lǐng)域的研究主要集中于醫(yī)療機(jī)器人、醫(yī)療解決方案和生命科學(xué)領(lǐng)域。由于起步較晚和技術(shù)門檻的限制,目前國內(nèi)醫(yī)用機(jī)器人的研發(fā)水平和普及率相較于國際一線水平仍存在一定的差距,從事企業(yè)主要集中與手術(shù)機(jī)器人和康復(fù)機(jī)器人兩大領(lǐng)域,以新松機(jī)器人、博實(shí)股份、妙手機(jī)器人、和技創(chuàng)等企業(yè)為代表。

在醫(yī)療解決方案方面,以騰訊、阿里巴巴、百度和科大訊飛為代表的公司通過和政府、醫(yī)療機(jī)構(gòu)的合作,為腦科學(xué)、疾病防治與醫(yī)療信息數(shù)據(jù)等領(lǐng)域提供智能解決方案。而在生命科學(xué)領(lǐng)域,研究的著眼點(diǎn)在以基因和細(xì)胞檢測為代表的前沿研究領(lǐng)域。

綜合來看,國內(nèi)人工智能產(chǎn)業(yè)鏈的基礎(chǔ)技術(shù)鏈條已經(jīng)構(gòu)建成熟,人工智能技術(shù)和應(yīng)用則集中在人臉和圖像識別、語音助手、智能生活等專用領(lǐng)域的場景化解決方案上。就趨勢來看,未來國內(nèi)人工智能領(lǐng)域的差異化競爭和突破將主要集中在人工智能相關(guān)技術(shù)的突破和應(yīng)用場景升級兩個層面。

未來國內(nèi)人工智能行業(yè)發(fā)展的五大趨勢

(1)機(jī)器學(xué)習(xí)與場景應(yīng)用將迎來下一輪爆發(fā)

根據(jù) Venture Scanner 的統(tǒng)計(jì),截至 2015 年 9 月,全球人工智能領(lǐng)域獲得投資的公司中,按照平均融資額度排名的五大業(yè)務(wù)依次是:機(jī)器學(xué)習(xí)(應(yīng)用類)、智能機(jī)器人、計(jì)算機(jī)視覺(研發(fā)類)、機(jī)器學(xué)習(xí)(研發(fā)類)和視頻內(nèi)容識別等。

自 2009 年以來,人工智能已經(jīng)吸引了超過 170 億美元的投資。過去四年間,人工智能領(lǐng)域的民間投資以平均每年 62% 的增長速率增加,這一速率預(yù)計(jì)還會持續(xù)下去。而在 2015 年,全球人工智能領(lǐng)域的投資占到了年度總投資的 5%,盡管高于 2013 年的2% ,但相比其他競爭領(lǐng)域仍處于落后位置。

目前中國地區(qū)人工智能領(lǐng)域獲得投資最多的五大細(xì)分領(lǐng)域是計(jì)算機(jī)視覺(研發(fā)類)、自然語言處理、私人虛擬助理、智能機(jī)器人和語音識別。從投資領(lǐng)域和趨勢來看,未來國內(nèi)人工智能行業(yè)的資本將主要涌向機(jī)器學(xué)習(xí)與場景應(yīng)用兩大方向。

(2)專用領(lǐng)域的智能化仍是發(fā)展核心

基于 GPU(圖形處理器)計(jì)算速度(每半年性能增加一倍)和基礎(chǔ)技術(shù)平臺的飛速發(fā)展,企業(yè)對于人工智能神經(jīng)網(wǎng)絡(luò)的構(gòu)建取得了前所未有的突破。但是,由于人工智能各領(lǐng)域技術(shù)和算法的復(fù)雜性,未來 20 年內(nèi)人工智能的應(yīng)用仍將集中于人臉和圖像識別、語音助手和智能家居等專用領(lǐng)域。

通過上述產(chǎn)業(yè)鏈環(huán)節(jié)構(gòu)成和投資分類可以看出,優(yōu)勢企業(yè)的核心競爭力主要集中于特定領(lǐng)域的專用技術(shù)研發(fā);其中,計(jì)算機(jī)視覺和語音識別領(lǐng)域的研發(fā)和應(yīng)用已處于國際一流水平,專業(yè)應(yīng)用機(jī)器人的研發(fā)也有望近 10 年內(nèi)迎來突破性發(fā)展。可以預(yù)見的是,在由專業(yè)領(lǐng)域向通用領(lǐng)域過渡的過程中,自然語言處理與計(jì)算機(jī)視覺兩個方向?qū)蔀槿斯ぶ悄芡ㄓ脩?yīng)用最大的兩個突破口。

(3)產(chǎn)業(yè)分工日漸明晰,企業(yè)合作大于競爭

隨著專用領(lǐng)域應(yīng)用開發(fā)的成熟和差異化技術(shù)門檻的存在,國內(nèi)人工智能產(chǎn)業(yè)將逐漸分化為底層基礎(chǔ)構(gòu)建、通用場景應(yīng)用和專用應(yīng)用研發(fā)三個方向。

在底層基礎(chǔ)構(gòu)建方面,騰訊、阿里巴巴、百度、華為等企業(yè)依托自身數(shù)據(jù)、算法、技術(shù)和服務(wù)器優(yōu)勢為行業(yè)鏈條的各公司提供基礎(chǔ)資源支持的同時,也會將自身優(yōu)勢轉(zhuǎn)化為通用和專業(yè)應(yīng)用領(lǐng)域的研究,從而形成自身生態(tài)內(nèi)的人工智能產(chǎn)業(yè)鏈閉環(huán)。

在通用場景應(yīng)用方面,以科大訊飛、格靈深瞳和曠視科技為代表的企業(yè)將主要以計(jì)算機(jī)視覺和語音識別為方向,為安防、教育和金融等領(lǐng)域提供通用解決方案。而在專用應(yīng)用研發(fā)方面則集中了大部分硬件和創(chuàng)業(yè)企業(yè),這其中既包括以小米和 broadlink 為代表的智能家居解決方案商,也包含了出門問問、linkface 和優(yōu)必選這類的差異化應(yīng)用提供商。

總的來說,由通用領(lǐng)域向?qū)I(yè)領(lǐng)域的進(jìn)化離不開產(chǎn)業(yè)鏈條各核心環(huán)節(jié)企業(yè)的相互配合,專用領(lǐng)域的競爭盡管存在,但各分工層級間的協(xié)作互通已成為多數(shù)企業(yè)的共識。

(4)系統(tǒng)級開源將成為常態(tài)

任何一個人工智能研究分支都涉及到異常龐大的代碼計(jì)算,加上漏洞排查與跨領(lǐng)域交叉,任何一家企業(yè)都無法做到在封閉環(huán)境內(nèi)取得階段性突破的可能??梢钥吹降内厔菔?,Google、微軟、Facebook 和雅虎等視人工智能為未來核心競爭力的頂級企業(yè)都先后開放了自身的人工智能系統(tǒng)。

需要明確的一點(diǎn)是,開源并不代表核心技術(shù)和算法的完全出讓,底層系統(tǒng)的開源將會讓更多企業(yè)從不同維度參與到人工智能相關(guān)領(lǐng)域的研發(fā),這為行業(yè)層面新產(chǎn)品的快速迭代和共同試錯提供了一個良性且規(guī)范化的共生平臺。于開放企業(yè)而言,這也確保了它們與行業(yè)最新前沿技術(shù)的同步。

(5)算法突破將拉開競爭差距

作為人工智能實(shí)現(xiàn)的核心,算法將成為未來國內(nèi)人工智能行業(yè)最大的競爭門檻。以 Google 為例,Google 旗下的搜索算法實(shí)驗(yàn)室每天都要進(jìn)行超過 200 次的改進(jìn),以完成由關(guān)鍵字匹配到知識圖譜、語義搜索的算法創(chuàng)新。

在未來競爭的重點(diǎn)機(jī)器學(xué)習(xí)領(lǐng)域,監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí)三個方面算法的競爭將進(jìn)入白熱化階段。而正是算法層面的突破造就了騰訊優(yōu)圖、科大訊飛和格靈深瞳等企業(yè)在圖像識別和計(jì)算機(jī)視覺領(lǐng)域取得了突破性進(jìn)展和國際一線的技術(shù)水平。

但就目前國內(nèi)人工智能算法的總體發(fā)展而言,工程學(xué)算法雖已取得階段性突破,但基于認(rèn)知層面的算法水平還亟待提高,這也是未來競爭的核心領(lǐng)域。

總的來看,雖然基礎(chǔ)技術(shù)的成熟帶來了存儲容量和機(jī)器學(xué)習(xí)等人工智能技術(shù)的提升,但由于現(xiàn)階段運(yùn)算能力以及大規(guī)模 CPU 和GPU 并行解決方案的局限,目前國內(nèi)人工智能的發(fā)展主要集中于計(jì)算機(jī)視覺、語音識別、智能生活等方向上。

雖然專用化領(lǐng)域的場景應(yīng)用仍是目前研發(fā)和投資的核心,但隨著技術(shù)、數(shù)據(jù)的積累演化以及超算平臺的應(yīng)用,由專用化領(lǐng)域的場景應(yīng)用向語音、視覺等領(lǐng)域的通用化解決方案應(yīng)該在未來 20 年內(nèi)成為發(fā)展的主流。

篇7

關(guān)鍵詞:OpenCV;人臉檢測;實(shí)時

中圖分類號:TP391.41

人臉檢測(Face Detection)是指對于給定的圖像或視頻,采用一定的策略對其進(jìn)行搜索以確定其中是否含有人臉,如果是則返回一臉的位置、大小和姿態(tài)。人臉檢測是人臉識別的重要環(huán)節(jié),運(yùn)用攝像機(jī)或攝像頭采集含有人臉的視頻流,并進(jìn)行實(shí)時的人臉檢測是目前主流的應(yīng)用。

OpenCV(Open Source Computer Vision Library)是開源的計(jì)算機(jī)視覺代碼庫,它輕量級而且高效,由一系列C函數(shù)和少量C++類構(gòu)成,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺的接口,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺方面的很多通用算法[1]。

1 系統(tǒng)設(shè)計(jì)

本系統(tǒng)采用了OpenCV的基于boost篩選式級聯(lián)Haar分類器,該分類器是通過成千上萬的物體各個角度的訓(xùn)練圖像訓(xùn)練出來的,它先對圖像進(jìn)行直方圖均衡化處理,并將圖像歸一化到同樣大小,然后標(biāo)記是否包含要檢測的物體,在人臉檢測方面比較擅長。系統(tǒng)加載分類器后,利用OpenCV的視頻捕獲函數(shù)實(shí)時捕獲連接在電腦上的攝像頭讀入的視頻流,并將抓取的視頻幀轉(zhuǎn)換為圖像,然后對圖像進(jìn)行人臉檢測和標(biāo)定,具體流程圖如圖1所示:

圖1 系統(tǒng)流程圖

2 系統(tǒng)實(shí)現(xiàn)

本系統(tǒng)在WindowsXP操作系統(tǒng)下使用VC++6.0基于OpenCV1.0進(jìn)行開發(fā)。系統(tǒng)具體實(shí)現(xiàn)如下:

(1)初始化聲明。通過CvMemStorage*captureFaceStorage=cvCreateMemStorage(0);語句創(chuàng)建一個內(nèi)存存儲器,來統(tǒng)一管理各種動態(tài)對象的內(nèi)存,參數(shù)為0時創(chuàng)建的內(nèi)存塊默認(rèn)大小為64k。然后分別聲明分類器對象、圖像對象級聯(lián)名稱及識別函數(shù)等成員:

Static CvHaar Classifier Cascade* cascade=0;

Ipl Image *frame,*frame_copy=0;

Char* capture Face Cascade_name=haarcascade_frontalface_alt2.xml;

(2)加載分類器。通過cvLoad函數(shù),加載調(diào)用CvHaarClassifierCascade類的分類器文件“haarcascade_frontalface_alt2.xml”:

cascade=(CvHaarClassifierCascade*)cvLoad(captureFaceCascade_name,0,0,0);

(3)捕獲視頻。通過cvCreateCameraCapture函數(shù)捕獲攝像頭,捕獲視頻后循環(huán)執(zhí)行抓取幀操作cvGrabFrame(cap)和獲取圖像操作cvRetrieveFrame(cap)操作,從而將幀轉(zhuǎn)換成圖像,以便于處理。

(4)圖像格式轉(zhuǎn)換。一般從硬盤讀入的圖片或者通過cvCreateImage方法創(chuàng)建的IplImage圖片默認(rèn)的origin屬性為0,即顯示的時候都是正的。而由攝像頭或者視頻文件獲取的幀圖像origin屬性為1,此時顯示的圖像掃描順序是從下到上,它會將幀圖像的第i行賦值給圖像的第height-i行,因此采集的圖像會出現(xiàn)倒立現(xiàn)象,為此,應(yīng)將復(fù)制的圖像的origin屬性調(diào)整為與幀圖像的origin屬性一致。此時需要使用cvFlip(frame,frame_copy,0)函數(shù),實(shí)現(xiàn)對幀圖像沿X軸的翻轉(zhuǎn)。

(5)識別與檢測人臉。本部分主要實(shí)現(xiàn)人臉檢測功能,首先將從實(shí)時視頻中提取的圖像進(jìn)行灰度化處理:

然后調(diào)整新圖像gray,使它精確匹配目標(biāo)small_img的大小,并利用cvEqualizeHist函數(shù)進(jìn)行灰度圖像直方圖均衡化處理,最終通過cvHaarDetectObjects函數(shù)檢測出人臉:

(6)標(biāo)定檢出的的人臉。繪制目標(biāo)圓形區(qū)域,標(biāo)定出檢測出的人臉:

最后通過cvShowImage("result",img)顯示出檢測后的圖像,如果檢測到人臉,顯示效果圖。

3 結(jié)束語

基于的攝像頭實(shí)時人臉檢測系統(tǒng)的實(shí)現(xiàn)充分說明了OpenCV技術(shù)在實(shí)現(xiàn)人臉檢測方面的效率高、功能強(qiáng)的特點(diǎn),OpenCV必將在計(jì)算機(jī)視覺、圖形圖像處理領(lǐng)域有著廣泛地應(yīng)用前景。

參考文獻(xiàn):

[1]Gray Bradski,Adrian Kaebler.Learning OpenCV:Computer Vision with the OpenCV Library[M].USA:O Reilly media,2008.

[2]梁路宏.人臉檢測研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2002(05):449-458.

作者簡介:徐占鵬(1979.01-),男,山東棲霞人,講師,碩士,研究方向:計(jì)算機(jī)應(yīng)用、計(jì)算機(jī)圖形圖像處理和計(jì)算機(jī)視覺。

篇8

【關(guān)鍵詞】機(jī)器視覺 應(yīng)用研究 識別 預(yù)處理 labVIEW

1 引言

機(jī)器視覺主要研究用計(jì)算機(jī)來模擬人的視覺功能,通過攝像機(jī)等得到圖像,然后將它轉(zhuǎn)換成數(shù)字化圖像信號,再送入計(jì)算機(jī),利用軟件從中獲取所需信息,做出正確的計(jì)算和判斷,通過數(shù)字圖像處理算法和識別算法,對客觀世界的三維景物和物體進(jìn)行形態(tài)和運(yùn)動識別,根據(jù)識別結(jié)果來控制現(xiàn)場的設(shè)備動作。從功能上來看,典型的機(jī)器視覺系統(tǒng)可以分為:圖像采集部分、圖像處理部分和運(yùn)動控制部分,計(jì)算機(jī)視覺是研究試圖建立從圖像或者多維數(shù)據(jù)中獲取“所需信息”的人工智能識別系統(tǒng)。正廣泛地應(yīng)用于醫(yī)學(xué)、軍事、工業(yè)、農(nóng)業(yè)等諸多領(lǐng)域中。

2 視覺技術(shù)研究與應(yīng)用的必要性

視覺技術(shù)在國內(nèi)外發(fā)展極其必要。2008年經(jīng)濟(jì)危機(jī)極大沖擊了美國至全球的各個領(lǐng)域。美國汽車制造業(yè) “Big Three”頻臨破產(chǎn),進(jìn)一步自動化是唯一出路。美國政府推行“Made in US” 計(jì)劃。出臺多個政策刺激鼓勵企業(yè)技術(shù)發(fā)明創(chuàng)新,視覺技術(shù)的應(yīng)用就顯得非常必要。近年在國內(nèi),勞動力工資成本大幅提高,很多生產(chǎn)企業(yè)遷移到人力資源更低廉的國家和區(qū)域,食品、醫(yī)藥質(zhì)量事件不斷?!癕ade in China”在世界聲譽(yù)亟需提高,為提高質(zhì)量保持競爭力,各領(lǐng)域的視覺檢測及高度自動化勢在必行。視覺檢測對工業(yè)自動化的重要性與日俱增,工業(yè)自動化需求對視覺技術(shù)的推動高度集成化。

3 國外典型研究與應(yīng)用

對于機(jī)器視覺技術(shù),世界各國都在研究與應(yīng)用。1994年S.T rika等研究了一種基于機(jī)器視覺的多面體零件特征提取技術(shù),獲得零件特征。1998年,J.Merlet等將機(jī)器視覺技術(shù)應(yīng)用于部件裝配。同年, Du-Ming Tsai等將機(jī)器視覺和神經(jīng)網(wǎng)絡(luò)技術(shù)相結(jié)合, 實(shí)現(xiàn)對機(jī)械零件表面粗糙度的非接觸測量。2003年,Eladaw .iA.E將機(jī)器視覺技術(shù)用于數(shù)控銑加工中, 以獲得實(shí)時加工數(shù)據(jù)。日本的視覺識別機(jī)器人研究,從數(shù)量或研究成果看都占據(jù)著明顯的領(lǐng)先地位.美英德韓也都在開展相關(guān)研究。國外的卡耐基-梅隆M.A.Smith等提出了一種在視頻幀中檢測文字的方法。韓國Soongsil大學(xué)的Kim基于支持向量機(jī)和Camshift算法檢測視頻幀中的文字。

4 國內(nèi)典型研究與應(yīng)用

相對國外,國內(nèi)計(jì)算機(jī)視覺技術(shù)應(yīng)用研究起步較晚,與國外有差距,還需進(jìn)一步在深度、廣度及實(shí)踐方面作出努力。國內(nèi)的李留格等采用BP神經(jīng)網(wǎng)絡(luò)來進(jìn)行輪胎胎號字符識別;李朝輝等利用形態(tài)算子提取視頻幀的高頻分量,把文本字符從復(fù)雜的視頻中分離出來;周詳?shù)壤酶倪M(jìn)的BP神經(jīng)網(wǎng)絡(luò)對字符進(jìn)行識別,提高了識別率和識別速度。字符識別技術(shù)是機(jī)器視覺領(lǐng)域的一個重要分支,在文字信息處理,辦公自動化、實(shí)時監(jiān)控系統(tǒng)等高技術(shù)領(lǐng)域,都有重要的使用價(jià)值和理論意義。本文以輸血袋的字符識別為例介紹機(jī)器視覺在工業(yè)智能檢測中的應(yīng)用。

5 機(jī)器視覺識別技術(shù)應(yīng)用實(shí)例

當(dāng)前,機(jī)器視覺已成功地應(yīng)用于工業(yè)檢測領(lǐng)域,大幅度地提高了產(chǎn)品的質(zhì)量和生產(chǎn)效率。企業(yè)中用于檢測輸血袋編號。在血袋生產(chǎn)過程中,血袋上的字符編號的正確和唯一是必不可少的檢測信息。依靠工人的肉眼逐條檢測帶狀轉(zhuǎn)印薄膜上的字符串,來追蹤血袋編號是否錯印,勞動強(qiáng)度大,效率低,不能從根本上保證檢測質(zhì)量。一旦血袋編號出現(xiàn)重印、錯印將會發(fā)生嚴(yán)重醫(yī)療事故,因此一種基于機(jī)器視覺技術(shù)的血袋編號字符的提取、識別與錯誤反饋于一體的檢測系統(tǒng)就適時、必要的誕生了,用以提高一次性血袋出廠編號的檢測精度和自動化水平,保證產(chǎn)品質(zhì)量,解決生產(chǎn)實(shí)際問題。

5.1 字符在線識別系統(tǒng)組成

為達(dá)到識別目的,識別系統(tǒng)由硬件和軟件構(gòu)成。硬件系統(tǒng)主要有血袋編號檢測臺機(jī)械結(jié)構(gòu)、LED陣列照明系統(tǒng)、血袋編號圖像采集系統(tǒng)、攝像機(jī)和計(jì)算機(jī)等。軟件部分是系統(tǒng)的核心,主要由圖像預(yù)處理、字符定位、字符傾斜校正、字符分割、字符識別等部分組成。

5.2 識別系統(tǒng)的實(shí)現(xiàn)

本系統(tǒng)基于labVIEW編程、圖像處理、微型計(jì)算機(jī)接口技術(shù)等實(shí)現(xiàn)輸血袋的文字在線識別。使用圖像灰度化技術(shù)、平滑、校正、直方圖均衡化等技術(shù)進(jìn)行圖像預(yù)處理。使用投影定位法等對字符進(jìn)行定位。使用投影法、模版匹配等進(jìn)行傾斜角度調(diào)整。使用垂直投影法對字符進(jìn)行分割。使用了BP神經(jīng)網(wǎng)絡(luò)來識別分割后的字符。為提高識別率,設(shè)計(jì)訓(xùn)練了三個神經(jīng)網(wǎng)絡(luò):字母網(wǎng)絡(luò)、數(shù)字網(wǎng)絡(luò)、字母與數(shù)字網(wǎng)絡(luò)。

5.3 實(shí)驗(yàn)結(jié)果

利用該系統(tǒng)做過多次實(shí)驗(yàn),測試了大量數(shù)據(jù),整體看,系統(tǒng)穩(wěn)定可靠,系統(tǒng)對輸血袋文字識別程度非常高。本系統(tǒng)提高生產(chǎn)效率和生產(chǎn)過程的自動化程度,并為機(jī)器視覺系統(tǒng)應(yīng)用于此種生產(chǎn)線,提供了成功的先例和經(jīng)驗(yàn)。但由于各種原因,也會對識別的結(jié)果有一定的影響,因此,在識別率方面,尚有一定的差距。

6 機(jī)器視覺技術(shù)在應(yīng)用中存在問題

雖然機(jī)器視覺技術(shù)目前已廣泛應(yīng)用到各領(lǐng)域,但由于其自身或配套技術(shù)上仍有不完善的地方,要廣泛的應(yīng)用還有一定限制。而圖像處理算法的效率高低是計(jì)算機(jī)視覺成功應(yīng)用的關(guān)鍵,盡管國內(nèi)外都提出一些新的算法, 但是大部分仍處于實(shí)驗(yàn)階段。特別是有復(fù)雜背景的工業(yè)現(xiàn)場,對視覺識別技術(shù)的識別率和精度降低。

7 結(jié)束語

機(jī)器視覺技術(shù)應(yīng)用前景極為廣闊,目前應(yīng)用于生產(chǎn)生活各領(lǐng)域,但我國發(fā)展滯后,在工業(yè)檢測中離實(shí)用化、商業(yè)化還有差距,因此亟待提高我國機(jī)器視覺技術(shù)的發(fā)展速度和水平,達(dá)到工業(yè)生產(chǎn)的智能化、現(xiàn)代化,為我國的現(xiàn)代化建設(shè)做出應(yīng)有貢獻(xiàn)。

參考文獻(xiàn)

[1]周平,王思華.基于機(jī)器視覺技術(shù)的壓縮機(jī)編碼識別系統(tǒng)設(shè)計(jì)[J].PLC技術(shù)應(yīng)用200例,2009.

[2]范祥,盧道華,王佳.機(jī)器視覺在工業(yè)領(lǐng)域中的研究應(yīng)用[J].現(xiàn)代制工程,2007.

作者單位

篇9

關(guān)鍵詞:計(jì)算機(jī)智能視頻監(jiān)控;運(yùn)動目標(biāo)檢測方法;目標(biāo)跟蹤方法

中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-7712 (2012) 10-0104-01

隨著人工智能技術(shù)日新月異的發(fā)展,基于人工智能的計(jì)算機(jī)視覺技術(shù)也得到了廣泛的推廣和應(yīng)用,成為計(jì)算機(jī)智能領(lǐng)域一個重要的發(fā)展方向。到目前為止,計(jì)算機(jī)視覺技術(shù)已經(jīng)過20余年的發(fā)展,其在社會人文,軍事技術(shù)及工業(yè)生產(chǎn)領(lǐng)域得到了廣泛的應(yīng)用,并以其獨(dú)具特色的技術(shù)優(yōu)勢逐漸形成了一門具有一定先進(jìn)理論支撐的獨(dú)立學(xué)科。其中,著名學(xué)者M(jìn)arr提出的視覺計(jì)算理論已成為計(jì)算機(jī)智能視頻監(jiān)控領(lǐng)域的主導(dǎo)思想,為大多數(shù)該領(lǐng)域內(nèi)的研究人員所接受。從廣義上講,計(jì)算機(jī)視覺技術(shù)的實(shí)質(zhì)就是實(shí)現(xiàn)對在復(fù)雜環(huán)境中運(yùn)動物體的幾何尺寸、形狀及相關(guān)運(yùn)動狀態(tài)的識別和認(rèn)知,即把實(shí)際空間中的三維對象轉(zhuǎn)換為計(jì)算機(jī)視覺系統(tǒng)識別的二維圖像。近年來,計(jì)算機(jī)視覺技術(shù)以其迅猛的發(fā)展態(tài)勢及成熟的應(yīng)用技術(shù)成為了業(yè)界的新寵,并得到了廣泛的應(yīng)用,取得了矚目的成績。

一、運(yùn)動目標(biāo)檢測方法分析

(一)運(yùn)動目標(biāo)在靜止背景條件下的檢測分析

1.差分檢測法

將同一背景不同時刻兩幅圖像進(jìn)行比較,可以反映出一個運(yùn)動物體在此背景下運(yùn)動的結(jié)果,比較簡單的一種方法是將兩圖像做“差分”或“相減”運(yùn)算,從相減后的圖像中,很容易發(fā)現(xiàn)運(yùn)動物體的信息。在相減后的圖像中,灰度不發(fā)生變化的部分被減掉,則前區(qū)為正,后區(qū)為負(fù),其他部分為零。由于減出的部分可以大致確定運(yùn)動目標(biāo)在圖像上的位置,使用相關(guān)法時就可以縮小搜索范圍。

2.自適應(yīng)運(yùn)動檢測方法

當(dāng)兩幀圖像的背景圖像起伏較大時,簡單的差分法難以得到滿意的解。此時可以考慮用自適應(yīng)背景對消的方法,該方法可以在低信雜比的情況下壓制背景雜波和噪聲,檢測出非穩(wěn)態(tài)圖像信息。在背景雜波較大時,常用的門限分割不能分出這種運(yùn)動目標(biāo)。在圖像序列中,每一個像素點(diǎn)的灰度值都是這一點(diǎn)所對應(yīng)傳感器的輸出信號值與噪聲值的疊加,因此,如何克服噪聲的影響確定一個最佳門限將目標(biāo)與背景分離,就成為弱小目標(biāo)檢測的一個重要環(huán)節(jié)。

(二)目標(biāo)在運(yùn)動背景條件下的檢測方法分析

塊匹配法是目標(biāo)在運(yùn)動背景條件下的主要檢測方法?;趬K的運(yùn)動分析在圖像運(yùn)動估計(jì)和其他圖像處理和分析中得到了廣泛的應(yīng)用,比如說在數(shù)字視頻壓縮技術(shù)中,國際標(biāo)準(zhǔn)MPEG1-2采用了基于塊的運(yùn)動分析和補(bǔ)償算法。塊運(yùn)動估計(jì)與光流計(jì)算不同,它無需計(jì)算每一個像素的運(yùn)動,而只是計(jì)算由若干像素組成的像素塊的運(yùn)動,對于許多圖像分析和估計(jì)應(yīng)用來說,塊運(yùn)動分析是一種很好的近似。這里主要介紹塊匹配方法。塊匹配方法實(shí)質(zhì)上是在圖像序列中做一種相鄰幀間的位置對應(yīng)人物。它首先選取一個圖像塊,然后假設(shè)塊內(nèi)的所有像素做相同的運(yùn)動,以此來跟蹤相鄰幀間的對應(yīng)位置。各種塊匹配算法的差異主要體現(xiàn)在:匹配準(zhǔn)則、搜索策略及塊尺寸選擇方法上。

1.匹配準(zhǔn)則

典型的匹配準(zhǔn)則有:最大互相關(guān)準(zhǔn)則、最小均方差準(zhǔn)則、最小平均絕對值差準(zhǔn)則、最大匹配像素?cái)?shù)量準(zhǔn)則等。

2.搜索策略

為了求得最佳位移估計(jì),可以計(jì)算所有可能的位移矢量對應(yīng)的匹配誤差,然后選擇最小匹配誤差對應(yīng)的矢量就是最佳位移估計(jì)值。因此,人們提出了各種快速搜索策略。這種策略的最大優(yōu)點(diǎn)是可以找到全局最優(yōu)值,但十分浪費(fèi)時間。因此,人們提出了各種快速搜索策略。盡管快速搜索策略得到的可能是局部最優(yōu)值,但由于其快速計(jì)算的實(shí)用性,在實(shí)際中得到了廣泛的應(yīng)用。下面討論兩種快速搜索方法:二維對數(shù)及三步搜索法。

二維對數(shù)搜索法開創(chuàng)了快速搜索算法的先例,分多個階段搜索,逐漸縮小搜索范圍,直到不能再小而結(jié)束。其基本思想是從當(dāng)前像素點(diǎn)開始,以十字形分布的5個點(diǎn)構(gòu)成每次搜索的點(diǎn)群,通過快速搜索跟蹤最小誤差MBD點(diǎn)。

三步搜索法與二位對數(shù)法類似,由于簡單、健壯、性能良好等特點(diǎn),為人們所重視。例如其最大搜索長度為7,搜索精度取一個像素,則步長為4、2、1,只需三步即可滿足要求,因此而得名三步法。其基本思想是采用一種由粗到細(xì)的搜索模式,從原點(diǎn)開始,按一定步長取周圍8個點(diǎn)構(gòu)成每次搜索的點(diǎn)群,然后進(jìn)行匹配計(jì)算,跟蹤最小塊誤差MBD點(diǎn)。

三、運(yùn)動目標(biāo)跟蹤方法

成像跟蹤系統(tǒng)經(jīng)過圖像的預(yù)處理、圖像的分割識別等一系列信息處理,最終實(shí)現(xiàn)對目標(biāo)位置的實(shí)時精確測量。跟蹤策略基本上可分為兩大類:波門跟蹤和相關(guān)跟蹤。

(一)波門跟蹤法分析

參考被跟蹤目標(biāo)外觀的實(shí)際尺寸形態(tài),事先確定好跟蹤窗口就是我們通常所定義的“波門”的概念。與傳統(tǒng)的圖像處理方法不同,采用波門跟蹤法進(jìn)行圖像的分析和處理,其原始狀態(tài)的圖像數(shù)據(jù)僅僅限于波門內(nèi)的數(shù)據(jù),這樣系統(tǒng)一旦捕捉到目標(biāo),不僅可以避免傳統(tǒng)技術(shù)對整幅圖像處理過程的耗時缺點(diǎn),而且這種跟蹤技術(shù)應(yīng)用和操作更為簡單,跟蹤及成像效果也能夠得到切實(shí)的保障。

(二)相關(guān)跟蹤法分析

當(dāng)被跟蹤的目標(biāo)物體出現(xiàn)運(yùn)動、姿態(tài)的調(diào)整或由于自然條件等因素造成了背景的雜波干擾時,目標(biāo)圖像的分割及提取工作由于目標(biāo)矩心及形心的不確定將難于進(jìn)行。這種情況下,就可以采用相關(guān)跟蹤的方式進(jìn)行處理。這種基于圖像匹配為基礎(chǔ)的相關(guān)跟蹤技術(shù)是以圖像相識性度量為基礎(chǔ),獲取現(xiàn)場圖像中實(shí)時的最接近目標(biāo)圖像值的一種跟蹤方式。由于分析及處理過程中,不需對用于分割及提取的特征值進(jìn)行處理,因而可以應(yīng)用于對圖像數(shù)據(jù)的原始資料的處理方面,這種方法不僅可以使圖像的信息得以全部的保留,而且適合眾多復(fù)雜的環(huán)境及場景,是一種操作簡單,結(jié)果精確的測量方法。

四、結(jié)語

近年來,各行各業(yè)對視頻監(jiān)控的需求不斷升溫,但已有的視頻監(jiān)控產(chǎn)品不能滿足日益增長的需要。因此,計(jì)算機(jī)視覺和應(yīng)用研究學(xué)者適時提出新一代監(jiān)控—視頻智能監(jiān)控。它是目前國內(nèi)外計(jì)算機(jī)視覺研究領(lǐng)域熱點(diǎn)問題之一。因而,在生產(chǎn)實(shí)踐中,不斷加強(qiáng)對其的分析和研究具有非常重要的現(xiàn)實(shí)意義。

參考文獻(xiàn):

篇10

【關(guān)鍵詞】圖像識別 邊緣檢測 小波算法

小波算法在圖形識別、壓縮等方面有著較為廣泛的應(yīng)用,且具有較高的應(yīng)用效率。在圖形識別與壓縮中實(shí)現(xiàn)小波算法的應(yīng)用,能夠更加有效地實(shí)現(xiàn)應(yīng)用數(shù)據(jù)的識別與壓縮。當(dāng)前,在圖像識別與邊緣檢測領(lǐng)域中依舊存在著計(jì)算方法相對單一的情況,這種局限性對圖像識別與邊緣檢測的進(jìn)一步發(fā)展造成了嚴(yán)重的阻礙作用。因此,要實(shí)現(xiàn)小波算法在圖像識別與邊緣檢測中的廣泛應(yīng)用,促進(jìn)其進(jìn)一步發(fā)展。

1 小波算法概述

法國地球物理學(xué)家J?Morlet在1984年首次提出了小波的概念,隨后Hardy空間分子解說研究為小波算法的誕生奠定了理論基礎(chǔ)。當(dāng)前,小波算法在圖像處理中有著非常廣泛的應(yīng)用,并且其應(yīng)用效果非常良好。小波算法主要是對非平穩(wěn)的信號進(jìn)行分析,在小波算法壓縮、平移等處理功能的支持之下,能夠從多個尺度對函數(shù)或者信號進(jìn)行分析,實(shí)現(xiàn)空間域與頻率域的具備變換,從而能夠更加有效地對信息進(jìn)行檢索。因此,小波算法屬于新興的信號處理技術(shù)。

在傳統(tǒng)的信號表示中,正交基有著非常廣泛的應(yīng)用?;瘮?shù)具有正交性,這使得基函數(shù)相應(yīng)的表示函數(shù)能夠通過內(nèi)積進(jìn)行計(jì)算。小波算法實(shí)現(xiàn)了局部化思想的發(fā)展,屬于信號的“時間――頻率”分析方法,其主要的特點(diǎn)為多分辨率分析,同時在時間域與頻率域中都能夠?qū)π盘柕木邆涮卣鬟M(jìn)行表示。

2 圖像識別中小波算法的應(yīng)用分析

圖像識別指的是通過計(jì)算機(jī)實(shí)現(xiàn)對圖像的處理、分析與理解。通過圖像識別工作能夠?qū)崿F(xiàn)不同模式目標(biāo)、對象的計(jì)算機(jī)識別工作。一般情況下,圖像識別的有效支持包括兩個方面,一方面是進(jìn)入到系統(tǒng)中的信息,另一方面是系統(tǒng)中原本保存的信息,通過對這兩種信息的對比之后實(shí)現(xiàn)對圖像的有效識別。不同的圖像具有不同的特征,計(jì)算機(jī)在進(jìn)行圖像識別的過程中通常會將視線集中在圖像較為突出的特征方面,從一個突出的特征向下一個突出的特征進(jìn)行依次掃描。因此,在圖像識別的過程中,知覺機(jī)制的工作原理為排除多余信息、識別關(guān)鍵信息,因此小波算法有著非常關(guān)鍵的作用。一般情況下,在圖像識別中實(shí)現(xiàn)小波算法的應(yīng)用,能夠有效地整理按照階段獲得的信息,以此為基礎(chǔ)形成完成的知覺映像。此外,在圖像識別中實(shí)現(xiàn)小波算法的應(yīng)用還能夠有效地處理與計(jì)算信息的細(xì)節(jié),促進(jìn)圖像識別效率的提高。

利用冗余小波對圖像進(jìn)行J個尺度的二維小波變換,得到3?J+1幅子圖像,其公式為

[Cj?{dj1,dj2,dj3},j=1,2,3,……,J] (1)

其中,Cj代表原圖像尺度aj上的二維小波變換得到的低頻子帶圖像;djk代表原圖像在尺度2j與方向k上的二維小波變換得到的高頻細(xì)節(jié)自帶圖像,其中k=1,2,3,分別對應(yīng)高頻子帶圖像的水平部分,垂直部分與對角線部分。

3 邊緣檢測中小波算法的應(yīng)用分析

在計(jì)算機(jī)視覺中,邊緣檢測是非常重要的核心問題之一。一般情況下,邊緣檢測的主要目的就是對數(shù)字圖像中具有明顯亮度變化的點(diǎn)進(jìn)行標(biāo)識。在邊緣檢測的過程中,圖像屬性中一些較為顯著的變化能夠?qū)χ匾录⒆兓冗M(jìn)行反映。例如,如果在圖像的屬性方面出現(xiàn)了表面方向不連續(xù)的情況,這就說明在這一地方存在著比較重要的事件、變化等。此外,邊緣檢測在圖像處理與計(jì)算機(jī)視覺中還發(fā)揮著特征提取的關(guān)鍵作用。實(shí)現(xiàn)了小波算法在邊緣檢測中的應(yīng)用,能夠在很大程度上實(shí)現(xiàn)相應(yīng)數(shù)據(jù)計(jì)算量的降低,同時還能夠?qū)⒂?jì)算機(jī)視覺中一些不相干的冗雜信息進(jìn)行有效的剔除,同時能夠合理地對結(jié)構(gòu)屬性進(jìn)行辨識與保留。小波算法在邊緣檢測中的應(yīng)用包括兩種類型,第一種類型為查找計(jì)算,第二種類型為穿越計(jì)算。在邊緣檢測的查找計(jì)算中,工作人員通過以查找方法為基礎(chǔ)的小波算法對計(jì)算機(jī)圖像中的一階導(dǎo)數(shù)最大值與最小值進(jìn)行尋找,從而實(shí)現(xiàn)邊緣檢測工作。在邊緣小波基選取的過程中,遵循的原則包括:第一,邊緣檢測小波應(yīng)該選擇高通濾波器,濾波器的脈沖回應(yīng)函數(shù)包括奇對稱與偶對策兩個部分,

f(x)=f1(x)+f2(x),其中f1(-x)=-f1(x),f2(-x)=f2(x)

除此之外,小波算法在邊緣檢測的應(yīng)用過程中,其主要的應(yīng)用效果還包括在數(shù)據(jù)壓縮方面取得了較好的效果。小波算法首先對邊緣檢測中的線性頻率進(jìn)行分析,之后實(shí)現(xiàn)相關(guān)信息與數(shù)據(jù)的壓縮與處理,通過小波算法實(shí)現(xiàn)壓縮與處理之后,其圖像的分辨率普遍較高,出現(xiàn)這種情況的主要原因是在邊緣檢測中實(shí)現(xiàn)小波算法的應(yīng)用能夠使邊緣檢測中存在的高頻信號進(jìn)行消除,在高頻信號消除的基礎(chǔ)上對信息與數(shù)據(jù)進(jìn)行壓縮工作,從而取得較好的效果。然而,在利用小波算法實(shí)現(xiàn)邊緣檢測中的數(shù)據(jù)與信息壓縮時,工作人員還應(yīng)該關(guān)注到邊緣檢測中存在的非線性不穩(wěn)定信號,在對這些信號進(jìn)行處理的過程中,小波算法的應(yīng)用效果并不明顯。因此,在邊緣檢測中實(shí)現(xiàn)小波算法的應(yīng)用,應(yīng)該注重小波算法形態(tài)的有效選擇,從而實(shí)現(xiàn)邊緣檢測水平整體上的提升。

4 總結(jié)

隨著計(jì)算機(jī)視覺處理技術(shù)的快速發(fā)展,圖像處理與邊緣檢測中已經(jīng)實(shí)現(xiàn)了小波算法的廣泛應(yīng)用,且已經(jīng)取得了非常良好的應(yīng)用效果。因此,工作人員在圖像識別與邊緣檢測的過程中,對小波算法的應(yīng)用已經(jīng)有了非常明確的了解,通過小波算法的有效應(yīng)用能夠促進(jìn)圖像識別與邊緣檢測水平的不斷提高。

參考文獻(xiàn)

[1]喬鬧生,鄒北驥,鄧?yán)?,曾友兵,鄒劍臣.一種基于圖像融合的含噪圖像邊緣檢測方法[J].光電子.激光,2012,11(65):2215-2220.

[2]馬麗亞木?阿布來孜,艾力米努.阿卜杜如蘇力.一種基于邊緣圖像融合的圖像邊緣檢測方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012,12(41):182-185.

[3]王婭囡,谷方,楊厚俊,范延濱,賈冬雪.基于PET醫(yī)學(xué)圖像邊緣檢測算法的研究[J].現(xiàn)代生物醫(yī)學(xué)進(jìn)展,2014,05(42):965-968.

[4]王曉丹,吳崇明.基于MATLAB的系統(tǒng)分析與設(shè)計(jì)--圖像處理[M].陜西:西安電子科技大學(xué)出版社,2014,02(44):96-98.