計算機視覺的優(yōu)點范文
時間:2023-12-22 18:02:58
導(dǎo)語:如何才能寫好一篇計算機視覺的優(yōu)點,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞:檢修;預(yù)決算;定額;ERP;Ajax;AOP/IOC
中圖分類號:TP311.52
隨著中國國內(nèi)經(jīng)濟的持續(xù)發(fā)展,國有大型石化化工企業(yè)為了加快企業(yè)發(fā)展和增強市場競爭力,需對原有煉油及化工生產(chǎn)裝置進行改造、擴建及設(shè)備檢維修,這些項目的結(jié)算過程通常采用手工結(jié)算方式,即使ERP上線后,設(shè)備檢維修項目的結(jié)算仍然按線下手工結(jié)算方式,這種結(jié)算方式過程中往往涉及的部門、人員較多,甚至涉及外部造價咨詢機構(gòu),處理的環(huán)節(jié)和工單數(shù)量也非常多,目前采用紙質(zhì)傳遞、手工核算,審核痕跡不便查詢,各級審核人員的工作量將相當(dāng)龐大,容易造成出錯,同時審核效率低,對施工單位也造成諸多不便。
為了解決石油化工行業(yè)工程項目預(yù)決算管理手工核算的問題,目前國內(nèi)許多企業(yè)都做了一些有意義的探索,希望通過信息系統(tǒng)將工程結(jié)算流程實現(xiàn)電子化在線執(zhí)行,提高工作效率,避免因手工操作引起的人為錯誤等,同時在流轉(zhuǎn)過程中會保留每一步的操作痕跡,并且人員的查看、修改、審核權(quán)限控制到單據(jù)的字段級別,不同人員根據(jù)分配的不同權(quán)限,處理各自的業(yè)務(wù)。此外,能與ERP系統(tǒng)的通過接口集成,以獲取項目的相關(guān)信息,驗證結(jié)算工程項目的合法性。
1 開發(fā)內(nèi)容
(1)檢修預(yù)決算電子化管理系統(tǒng)將提高檢修項目結(jié)(預(yù))算審核效率。檢修項目結(jié)算整個流程涉及的部門及人員多,審核環(huán)節(jié)多,工單數(shù)量多,目前采用紙質(zhì)傳遞、手工核算,審核效率低,審核痕跡不便查詢。采用此系統(tǒng)后,實現(xiàn)全流程網(wǎng)上流傳、審核,提高ERP勞務(wù)工單結(jié)算及時性,及時掌握檢修項目結(jié)(預(yù))算動態(tài)。
(2)本系統(tǒng)與ERP系統(tǒng)后臺實時關(guān)聯(lián)。此系統(tǒng)作為ERP工單結(jié)算的輔助系統(tǒng),實時提取ERP模塊每張勞務(wù)工單數(shù)據(jù)信息,在此系統(tǒng)實現(xiàn)勞務(wù)工單結(jié)算網(wǎng)上審核,結(jié)算終審價再按ERP操作規(guī)則,進行SES(收貨過賬)并對工單進行技術(shù)完結(jié)。
(3)本系統(tǒng)進一步提高計價定額執(zhí)行的統(tǒng)一性。在此系統(tǒng)實現(xiàn)本公司檢修計價定額庫管理,進一步提升檢修結(jié)算的工程量簽證、結(jié)(預(yù))算計價等表單模版的規(guī)范化管理水平,嵌入檢修項目計價定額庫以及常規(guī)檢修項目統(tǒng)一計價表,對人工取費、材料費、機械臺班費定期統(tǒng)一維護,便捷追溯檢修項目計價的歷史記錄,對同類或類似項目計價進行查詢、對比,提高審核效率。
(4)本系統(tǒng)強化檢修項目結(jié)算的報表統(tǒng)計、過程跟蹤、考核。按ERP工單類型、作業(yè)類型、專業(yè)類型、時間等參數(shù),在此系統(tǒng)實現(xiàn)實時查詢統(tǒng)計,對審核流程各環(huán)節(jié)進行跟蹤、提醒等動態(tài)管理,強化管理工作績效考核。
2 工藝技術(shù)
本開發(fā)和設(shè)計堅持繼承與創(chuàng)新,堅持現(xiàn)有技術(shù)與先進性、前瞻性統(tǒng)一,堅持系統(tǒng)安全性與操作靈活性統(tǒng)一,堅持研究與實踐緊密結(jié)合的模式。
本開發(fā)和設(shè)計的實現(xiàn)基于B/S結(jié)構(gòu)的多層應(yīng)用,客戶端不需要安裝應(yīng)用,只需要IE或FireFox等瀏覽器就可以操作。由于采用HTTP協(xié)議,服務(wù)器只需對外開通“80”WEB服務(wù)端口,有效阻止網(wǎng)絡(luò)攻擊。
在實現(xiàn)方式采用以J2EE為技術(shù)框架,J2EE有著穩(wěn)定、靈活、安全、可伸縮性強、易維護、支持異構(gòu)環(huán)境、支持多種操作系統(tǒng)等先天的優(yōu)勢,有大量成功的商業(yè)系統(tǒng)案例,保證的系統(tǒng)健壯性。
使用網(wǎng)絡(luò)WEB技術(shù),結(jié)合ERP模塊和定額庫,實現(xiàn)預(yù)決算網(wǎng)上在線審批和管理。根據(jù)ERP工單確定檢維修預(yù)決算書工程量簽證的來源依據(jù),進行工程量核實程序,然后根據(jù)石油化工行業(yè)定額或地方定額編制預(yù)決算書,并通過可定制的流程實現(xiàn)預(yù)決算書的流轉(zhuǎn)過程;審批流轉(zhuǎn)過程中系統(tǒng)記錄了工程量簽證和定額修改的歷史痕跡和變化的過程,并且系統(tǒng)可以通過Ajax技術(shù)清楚的回顯預(yù)結(jié)算的審核修改過程,而且施工單位可以實時跟蹤預(yù)決算書審核過程;結(jié)合系統(tǒng)數(shù)據(jù)庫可以對預(yù)決算書和各階段審核數(shù)據(jù)即時查詢和統(tǒng)計分析,可以達到很好地控制設(shè)備檢維修費用的作用,確保設(shè)備和裝置的安穩(wěn)長運行。
通過AOP/IOC技術(shù),基于系統(tǒng)核心工作流程,實現(xiàn)預(yù)決算的高效審核。通過制定控制審核限制和對接期限、ERP采購訂單等業(yè)務(wù)策略,以及基于定額庫關(guān)聯(lián)關(guān)系,制定預(yù)決算審核過程中定額、取費等數(shù)值計算規(guī)則和策略,達到審核高效的目的。
3 結(jié)構(gòu)設(shè)計
整個開發(fā)和設(shè)計分為二個層次,基礎(chǔ)模塊和業(yè)務(wù)模塊,如圖1所示?;A(chǔ)模塊包括基礎(chǔ)信息配置模塊和權(quán)限管理;業(yè)務(wù)模塊包括工作流模塊和統(tǒng)計分析,工作流模塊是系統(tǒng)的核心模塊,通過配置,實現(xiàn)簽證單和結(jié)算書的多種審核流程。
4 功能特點
4.1 網(wǎng)上審核,及時反饋。通過全流程網(wǎng)上流傳、審核,及時掌握檢修項目結(jié)算動態(tài),可以有效地提高各級審核員的辦事效率;同時給各個施工單位以明確的審核結(jié)果出示時間,可以有效地促進施工單位、項目所在單位和各級審核單位之間的工作協(xié)調(diào)。同時施工單位可以在本單位進行數(shù)據(jù)上傳和審核結(jié)果查看、修正等工作,不用再頻繁的來往于本單位和審核單位之間。
4.2 結(jié)算單數(shù)據(jù)自動核對、計算。通過網(wǎng)上審核,系統(tǒng)可以充分利用信息技術(shù)來實現(xiàn)結(jié)算的數(shù)據(jù)自動核對、計算;系統(tǒng)可以實現(xiàn)實時計算功能,即在用戶修改單據(jù)某個數(shù)據(jù)后,馬上根據(jù)修改內(nèi)容自動計算相關(guān)聯(lián)的數(shù)據(jù)。通過這些功能,可以大大減少審核員的工作量,避免誤算,提供審核效率。
4.3 進一步提高計價定額執(zhí)行的統(tǒng)一性。通過內(nèi)置定額庫管理,進一步提升結(jié)算的工程量簽證、結(jié)算計價等表單模版的規(guī)范化管理水平,嵌入項目計價定額庫以及常規(guī)檢修項目統(tǒng)一計價表,對人工取費、材料費、機械臺班費定期統(tǒng)一維護,便捷追溯檢修項目計價的歷史記錄,對同類或類似項目計價進行查詢、對比,提高審核效率和計價管理水平。
4.4 保留審核操作痕跡。在本系統(tǒng)中,每一步的審核過程中都會將數(shù)據(jù)修改痕跡保留下來,審核員在審核過程中可以查看前面審核人員的數(shù)據(jù)修正紀(jì)錄。在結(jié)算書審核完之后,這些修改的歷史紀(jì)錄會保存下來,供以后核查。
4.5 歷史數(shù)據(jù)查詢統(tǒng)計。以數(shù)字信息方式存在的結(jié)算單審核數(shù)據(jù)可以有效地進行歷史數(shù)據(jù)的管理,不用擔(dān)心數(shù)據(jù)丟失、查詢困難的問題。用戶可以方便的查詢歷史數(shù)據(jù),同時根據(jù)選定條件來做數(shù)據(jù)的統(tǒng)計和分析,把歷年“死”數(shù)據(jù)盤活起來。
4.6 強化過程跟蹤、考核。通過系統(tǒng)進行審核流程各環(huán)節(jié)進行跟蹤、提醒等動態(tài)管理,分析某一段時間內(nèi)的特定審核員的審核速度、準(zhǔn)確程度,可以為對各級審核員的績效考核提供有用的數(shù)據(jù)基礎(chǔ),強化管理工作績效考核。
5 結(jié)論
實現(xiàn)結(jié)算書全流程網(wǎng)上流傳、審核,減少結(jié)算過程中的計算差錯、結(jié)算書丟失、查找結(jié)算書困難等問題,提高勞務(wù)工單結(jié)算及時性,及時掌握檢修項目預(yù)決算動態(tài),推進規(guī)范管理工作,強化管理工作績效考核。大力推進工程結(jié)算管理工作進步,通過信息技術(shù)帶來管理效益,同時通過和其他信息系統(tǒng)的整合,有效的提高企業(yè)的整體信息化水平。
參考文獻:
篇2
關(guān)鍵詞:計算機視覺;課堂考勤;深度學(xué)習(xí);MCV架構(gòu)
前言
隨著國家標(biāo)準(zhǔn)《智慧校園總體框架》(Smartcampusoverallframework)的,智慧校園的規(guī)劃與設(shè)計成為了校園建設(shè)的重點項目[1]。而課堂考勤作為學(xué)校教學(xué)管理、學(xué)生評價的重要組成部分,隨著物聯(lián)網(wǎng)技術(shù)、人工智能和移動通信技術(shù)的水平的提高與發(fā)展,更應(yīng)該向著智能化、準(zhǔn)確化的方向發(fā)展[2]。本文研究了的當(dāng)前應(yīng)用的課堂考勤方式,并做了進一步的分析,最終根據(jù)社會技術(shù)的革新與發(fā)展[3],提出了一種基于計算機視覺的實時課堂考勤系統(tǒng)的設(shè)計。我們的主要工作是搭建了整個系統(tǒng)框架,包括數(shù)據(jù)庫系統(tǒng)、服務(wù)器、計算機視覺模型、網(wǎng)絡(luò)通信、圖像采集系統(tǒng)、客戶端和網(wǎng)絡(luò)通信系統(tǒng)。
1課堂考勤方式現(xiàn)狀
目前校園中主要的課堂考勤方式存在為兩種,分別是傳統(tǒng)的考勤方式和生物識別的考勤方式。如圖1所示,其中傳統(tǒng)的考勤方式包括點名考勤和通過校園卡進行考勤,點名考勤的方式仍然是高校中最常用的考勤手段,因它不受場地的限制,可以根據(jù)點名冊直接核對現(xiàn)場的學(xué)生信息,但這種方式存在的缺點就是花費時間,影響上課效率,為此有些教師不進行點名,因此影響了考勤的效果。校園卡考勤解決了點名占用課堂時間的問題,但這種方式具有學(xué)生代考勤的漏洞,因為學(xué)生可以拿著別人的校園卡進行考勤。生物識別的考勤方式包括指紋考勤和人臉識別考勤,這些方式有效解決了傳統(tǒng)考勤方式代考勤的弊端,但這種方式受設(shè)備硬件的影響,識別能力太慢,尤其是在下課后學(xué)生較多,考勤簽退時容易發(fā)生擁擠等現(xiàn)象,具有安全隱患[4]。因此,為解決當(dāng)前考勤方式存在的一些弊端,本文設(shè)計了一種基于計算機視覺的實時課堂考勤系統(tǒng)。
2系統(tǒng)設(shè)計基礎(chǔ)
2.1系統(tǒng)開發(fā)環(huán)境
本文設(shè)計的實時課堂考勤系統(tǒng)主要是使用Python開發(fā)語言,Python是目前最流行開發(fā)語言之一,主要應(yīng)用于Web服務(wù)設(shè)計、大數(shù)據(jù)、人工智能等領(lǐng)域,它的主要優(yōu)點是開發(fā)效率高、可擴展性強、跨平臺和具有可移植性等,滿足了本文系統(tǒng)的設(shè)計要求。另外,在開發(fā)過程還用到了基于Python的第三方軟件開發(fā)包,包括Flask用于搭建系統(tǒng)的Web服務(wù)器;PyQt5用于搭建系統(tǒng)的客戶端;OpenCV用于系統(tǒng)中對圖像視頻的處理;Tensoflow用于開發(fā)計算機視覺模型,搭建深度學(xué)習(xí)模型,完成人臉檢測和識別任務(wù);Mysqlclient用于管理、訪問、查詢和更新Mysql數(shù)據(jù)庫。
2.2系統(tǒng)開發(fā)框架
本文設(shè)計的實時課堂考勤系統(tǒng)通信基于Web應(yīng)用,因此選擇一個合適的服務(wù)架構(gòu)有利于提高系統(tǒng)的開發(fā)和部署效率。目前較流行的Web應(yīng)用主要有MVC(ModelViewController)和CMS(ContentManagementSystem)兩種架構(gòu)。本文使用了基于Python和Flask搭建的MVC架構(gòu)[5],該架構(gòu)如圖2所示,主要包括模型層、視圖層和控制器。使用該框架的優(yōu)點是可將視圖層和業(yè)務(wù)邏輯層進行分離開發(fā),提高開發(fā)效率,方便系統(tǒng)的部署、維護和管理。
3系統(tǒng)設(shè)計方式
3.1系統(tǒng)總結(jié)構(gòu)設(shè)計
本文設(shè)計的實時課堂考勤系統(tǒng)的總體結(jié)構(gòu)如圖3所示。根據(jù)MVC構(gòu)架的設(shè)計,我們將該系統(tǒng)分為了模型層、控制器層和視圖層,另外還包括網(wǎng)絡(luò)通信設(shè)備。
3.2模型層設(shè)計
模型層主要是關(guān)系型數(shù)據(jù)庫模,MySQL是目前使用最多的關(guān)系型數(shù)據(jù)庫系統(tǒng),也是學(xué)校管理系統(tǒng)使用最多的數(shù)據(jù)系統(tǒng),為了更好地與學(xué)校管理系統(tǒng)兼容,我們選擇了MySQL數(shù)據(jù)庫,數(shù)據(jù)表之間的關(guān)系如圖4所示。
3.3控制器層設(shè)計
控制器層主要包括服務(wù)器應(yīng)用軟件和計算機視覺模型,服務(wù)器應(yīng)用軟件的功能包括系統(tǒng)通信配置、數(shù)據(jù)業(yè)務(wù)處理和系統(tǒng)各模塊間的調(diào)度。計算機視覺模型是實時課堂考勤系統(tǒng)的核心模塊,基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)[6],主要作用是進行人臉檢測和識別兩個部分,計算機視覺模型的工作流程如圖5所示。在人臉檢測階段使用VGG16檢測器作為主干網(wǎng)絡(luò),為提高模型的檢測準(zhǔn)確率,通過引入注意力模型和多尺度特征融合對網(wǎng)絡(luò)進行了優(yōu)化,有效地從輸入圖片中提取人臉位置信息,得到人臉圖像。在人臉識別階段首先使用FaceNe人臉識別網(wǎng)絡(luò)提取人臉圖像的特征圖,然后通過決策樹算法與待檢測的人臉特征進行匹配,從而識別圖片中的學(xué)生信息。
3.4視圖層設(shè)計
本文設(shè)計的實時考勤系統(tǒng)的模型層主要包括圖像采集系統(tǒng)和客戶端。目前各學(xué)校教室內(nèi)都安裝有監(jiān)控設(shè)備,因此為節(jié)約成本和安裝消耗,圖像采集系統(tǒng)使用教室內(nèi)的監(jiān)控設(shè)備作為圖像采集系統(tǒng),負責(zé)采集教室現(xiàn)場圖片??蛻舳嗽O(shè)計首先在本系統(tǒng)中采用應(yīng)用程序接口,然后在教學(xué)管理系統(tǒng)中設(shè)計圖形化用戶界面,通過應(yīng)用程序接口調(diào)用本系統(tǒng)的功能,從而減少資源浪費,方便維護和管理。
4實時考勤功能的實現(xiàn)
實時考勤功能的實現(xiàn)方式如圖6所示,首先系統(tǒng)啟動后,用戶可以隨時更新考勤信息,比如在數(shù)據(jù)庫中創(chuàng)建新的考勤表等。接著系統(tǒng)會自動讀取考勤表的信息,比如課程所在教室、上課時間。然后啟動考勤程序,進行簽到、簽退操作,并將考勤數(shù)據(jù)保存到考勤數(shù)據(jù)表中。整個系統(tǒng)啟動完成后可以自動運行,直到關(guān)閉系統(tǒng),而且可以實時進行課堂考勤。
篇3
關(guān)鍵詞 計算機視覺;攝像機定標(biāo)方法;應(yīng)用特點;線性關(guān)系;參照物
中圖分類號:TP391 文獻標(biāo)識碼:A 文章編號:1671—7597(2013)022-067-3
計算機視覺中的攝像機定標(biāo)方法總得來說可以分為兩類——傳統(tǒng)的攝像機定標(biāo)法和攝像機自定標(biāo)法。為了能夠使所獲取的場景更加自然,計算機視覺系統(tǒng)可以通過運用攝像機定標(biāo)方法,加之合理安排攝像機和計算機這兩種成像裝置,來對二維的圖像信息進行虛擬空間的三維建模,進而控制整個攝像效果。這其中攝像及內(nèi)部的一些參數(shù)起到了很大的作用,最初在計算機視覺中都是采用的傳統(tǒng)攝像機定標(biāo)方法,但是這種方法存在著一定的局限性。這種定標(biāo)方法在攝像機隨意運動和未知場景的安排下很難進行有效的標(biāo)定。隨著計算機視覺中的攝像機定標(biāo)方法的不斷進步和發(fā)展,以及攝像機自定標(biāo)方法的誕生,使得這項技術(shù)逐漸獲得了相對廣泛的應(yīng)用。
1 計算機視覺中與攝像機定標(biāo)解析
計算機視覺的基本任務(wù)是采集一定數(shù)量的圖片或視頻資料并進行處理,以此來獲得相應(yīng)場景環(huán)境下的的三維信息。而這些三維信息與圖像、視頻對應(yīng)點的相互關(guān)系需要通過攝像機的幾何模型來決定,經(jīng)過計算分析得出這些幾何模型參數(shù)的過程即為攝像機定標(biāo)。如此看來,計算機視覺與攝像機定標(biāo)的關(guān)系密不可分,目前可知,計算機視覺與攝像機定標(biāo)的結(jié)合已經(jīng)運用到相關(guān)領(lǐng)域,如高速公路上的車輛自主導(dǎo)航,部分醫(yī)學(xué)圖像的處理,電腦中臉孔或指紋識別等。但是由于所使用的目標(biāo)人群相對較窄,以及攝像機定標(biāo)方法的相對局限,使得計算機視覺的攝像機定標(biāo)無法廣泛的運用到各個行業(yè)領(lǐng)域。正因如此,才加大了對計算機中攝像機定標(biāo)方法的研究的必要性。下面就來對攝像機定標(biāo)的兩種方法進行簡要的探討。
2 傳統(tǒng)的攝影機定標(biāo)方法及應(yīng)用特點
傳統(tǒng)的攝像機定標(biāo)方法主要是在相應(yīng)的攝像機模型下面,通過對一系列的數(shù)學(xué)公式進行變換計算和改進優(yōu)化,然后對標(biāo)定的具體參照物進行科學(xué)的圖像處理,最終來獲取攝像機模型的主要外部參數(shù)和內(nèi)部參數(shù)。但是,由于不同的標(biāo)的參照物與不同的算法思路的限制,傳統(tǒng)的攝像機定標(biāo)方法也各不相同,其大致可分為以下三種:三維型——3D立體靶標(biāo)定標(biāo)法、平面型——2D平面靶標(biāo)定標(biāo)法以及以徑向約束為基準(zhǔn)的定標(biāo)法。
2.1 基于3D立體靶標(biāo)的攝像機定標(biāo)
這種基于3D立體靶標(biāo)的攝像機定標(biāo)方法就是在攝像機的前面安置一個具有3D效果的立體靶標(biāo)裝置,然后將靶標(biāo)上面的任何一個點都拿出來作為i這個參照物的特征點。在計算機視覺系統(tǒng)的作用下,將每一個靶標(biāo)上面的特征點在整個三維坐標(biāo)系中進行精確的制作測定。與此同時,攝像機首先在拍攝過程中獲取靶標(biāo)上面的特征點影像信息,然后對平面圖像坐標(biāo)系和立體空間坐標(biāo)系二者的內(nèi)外部數(shù)據(jù)參數(shù)排列出非線性方程,找出方程中系數(shù)矩陣的非線性關(guān)系,最后通過數(shù)學(xué)算法中的線性變換法來對整個透視系數(shù)矩陣中的每一個元素進行求解。通常在這種定標(biāo)方法的應(yīng)用過程中,計算機視覺系統(tǒng)都會忽略攝相機鏡頭在拍攝時的非線性畸變,將透視變幻矩陣中的相關(guān)元素定義為未知數(shù),繼而在整個定標(biāo)過程確定有效的三維控制點和相應(yīng)的圖像點。在裝置3D立體靶標(biāo)后,整個攝像機定標(biāo)就能夠根據(jù)靶標(biāo)上特征點的圖像坐標(biāo)和世界坐標(biāo),在數(shù)學(xué)變幻算法的應(yīng)用下,計算出攝像機的內(nèi)部參數(shù)和外部參數(shù)。
這種3D立體靶標(biāo)的攝像機定標(biāo)方法不僅能夠優(yōu)化定標(biāo)物的獲取方法,而且能夠適應(yīng)程序功能的改進,并且較高的精度,因而得到了廣泛的應(yīng)用,但是這種定標(biāo)方法通常比較繁瑣。
2.2 基于2D平面靶標(biāo)的攝像機定標(biāo)
基于2D平面靶標(biāo)的攝像機定標(biāo)方法在傳統(tǒng)攝像機定標(biāo)方法分類中屬于一種新型的定標(biāo)方法,又名張正友定標(biāo)法。這種定標(biāo)法具有靈活適用的特點,也是對傳統(tǒng)攝像機定標(biāo)方法的一種簡化。在定標(biāo)過程中首先是要在兩個以上的不同方位對一個平面靶標(biāo)進行攝相機拍攝,整個拍攝過程中2D平面靶標(biāo)和攝相機鏡頭都能夠自由地進行移動,而且要保持整個攝像機的內(nèi)部參數(shù)一直固定。通常在基于2D平面靶標(biāo)的攝像機定標(biāo)法的應(yīng)用中,我們都需要先假定這個靶標(biāo)在三維空間坐標(biāo)系中的豎軸為0,然后為了求出攝像機內(nèi)外參數(shù)的優(yōu)化解,要建立相應(yīng)的線性模型,通過對線性模型的線性分析來計算出優(yōu)化解,最后,運用最大似然法排列參數(shù)之間的非線性關(guān)系來求出其非線性解。在整個定標(biāo)流程中,必須對攝像機的鏡頭畸變的目標(biāo)函數(shù)進行綜合考慮,才能夠計算出攝像機的外部和內(nèi)部參數(shù)。
這種方法既具有較高的精確性,又不需要很昂貴的定標(biāo)成本,因此在計算機視覺系統(tǒng)中很為實用。但是,這種方法在進行整個攝像機內(nèi)外參數(shù)的線性分析時,因為特征圖像上面的直線在透視之后依然是直線,在進行圖像處理的過程中,會引入一定的誤差。因此,在很多具有廣角鏡頭的攝像機定標(biāo)上會出現(xiàn)因為鏡頭畸變而引起的較大誤差。
2.3 基于徑向約束的攝像機定標(biāo)
基于徑向約束的攝像機定標(biāo)就是通常所說的兩步法標(biāo)定方法。這種方法通常是先利用徑向一致約束對超定性的線性方程進行最小二乘法求解,這樣就能夠?qū)⒊藬z像機光軸方向平移外的其他的攝像機參數(shù),然后對攝相機鏡頭存在和不存在透鏡畸變的情況下分別進行其他攝像機參數(shù)的求解。這種方法的計算量較為適中,而且精度也比較高,適用于攝像機的精密測量。然而,兩步法對于整個定標(biāo)設(shè)備的要求也高,對于簡單的攝像機標(biāo)定而言不易采用。
總的來說,基于徑向約束的攝像機定標(biāo)的精準(zhǔn)是通過設(shè)備的復(fù)雜和精確來獲得的,因此具有針對性的應(yīng)用特點。
3 攝像機自定標(biāo)方法及其應(yīng)用特點
攝像機自定標(biāo)方法是指在攝像機在移動時,周圍環(huán)境中的圖像會形成一定的對應(yīng)關(guān)系,通過這種對應(yīng)關(guān)系來對攝像機進行定標(biāo)的方法,這種方法無需依賴參照物。攝像機自定標(biāo)方法主要有以下四種:基于主動視覺的自定標(biāo)法、基于Kruppa方程的自定標(biāo)方法、分層逐步定標(biāo)法以及基于二次曲面的自定標(biāo)方法等。這些方法相較于傳統(tǒng)的攝像機定標(biāo)方法來說有了很大的改進和提高,下面就進行簡要的探討。
3.1 基于主動視覺的自定標(biāo)法
目前,在攝像機自定標(biāo)方法中的應(yīng)用最為普遍的方法便是基于主動視覺的自定標(biāo)法。這種方法主要是能夠通過對攝像機在移動過程中的對環(huán)境中的多幅圖像進行標(biāo)定,進而建立對應(yīng)關(guān)系來求出標(biāo)定參數(shù),由此可見,整個標(biāo)定過程不需要精密的標(biāo)定物,如此一來就能夠使得標(biāo)定問題簡單化。主動視覺系統(tǒng)是這種標(biāo)定方法的核心技術(shù),就是攝像機在拍攝過程中被固定在了一個能夠得到精確控制的移動平臺上,并且這個平臺的相關(guān)參數(shù)能夠通過計算機進行精確的讀出,在整個拍攝過程中攝像機只需要通過一定的特殊運動來獲取多幅圖像信息,然后在結(jié)合攝像機運動的具體參數(shù)和圖像的參數(shù)來確定整個攝像機的內(nèi)部和外部參數(shù),達到攝像機定標(biāo)的效果。其中基于主動視覺的自定標(biāo)法的代表方法就是馬頌德提出的控制攝像機的兩組三正交平移運動的標(biāo)定方法。后來,李華、楊長江等人對這種方法進行了改進和優(yōu)化,提出了基于四組平面正交和五組平面正交運動的標(biāo)定方法,并能夠利用獲取圖像中的機電信息來對攝像機的參數(shù)進行線性表定。
這種方法算法簡便,能夠獲得整個參數(shù)的線性解,但是這種方法對整個攝像機的運動平臺要求很高,因此要求必須具有精確控制的能力。
3.2 基于Kruppa方程的自定標(biāo)方法
基于Kruppa方程的自定標(biāo)方法主要是在整個攝像機自定標(biāo)過程中導(dǎo)入了Kruppa方程,并對該方程進行直接求解,從而得到整個攝像機的具體參數(shù)的方法。基于Kruppa方程的自定標(biāo)方法在應(yīng)用時利用了極線變幻和二次曲線像的概念對Kruppa進行推導(dǎo),直接進行求解。
這種標(biāo)定方法不需要對整個圖像的序列進行射影重建,通常是對兩個圖像之間的信息建立一個方程,相較于逐步分層標(biāo)定方法而言,基于Kruppa方程的自定標(biāo)方法能夠?qū)⒛承┖茈y做到所有圖像整合到一個統(tǒng)一的射影框架中的情況更加具有優(yōu)勢,但是這種方法還是存在著一定的局限性,它無法保證在無窮遠處的平面能夠保持所有圖像在確定的攝影平面中還具有一致性的效果。當(dāng)整個攝像機拍攝的圖像的序列較長的時候,基于Kruppa方程的自定標(biāo)方法就顯得很不穩(wěn)定,繼而不能夠很好地算出整個攝像機的內(nèi)外參數(shù),對定標(biāo)造成了一定的影響。
3.3 分層逐步定標(biāo)法
分層逐步定標(biāo)法是攝像機自定標(biāo)方法中的一個研究熱點,在攝像機自定標(biāo)的實際應(yīng)用中以及逐步取代了可以直接求解的基于Kruppa方程的自定標(biāo)方法。分層逐步定標(biāo)法在應(yīng)用過程中首先需要對整個拍攝的圖像序列進行攝影重建,這點和基于Kruppa方程的自定標(biāo)方法一樣,然后利用絕對二次曲面加以約束,最后在確定出無窮遠處平面方程中的仿射參數(shù)以及攝像機內(nèi)部的參數(shù)。分層逐步定標(biāo)法的應(yīng)用特點是必須建立在射影定標(biāo)的基礎(chǔ)之上,利用某一幅圖形作為特征基準(zhǔn)點進行射影對其,將整個攝像機自定標(biāo)的未知數(shù)的數(shù)量減少,再運用數(shù)學(xué)算法中的非線性優(yōu)化算法來進行未知數(shù)的求解。
這種方法的不知自出就是在進行非線性優(yōu)化算法時,初值是通過事前的預(yù)估得到的,不能夠保證這個方程的收斂性。由于在射影重建時,選擇的基準(zhǔn)圖像不同,整個攝像機自定標(biāo)的結(jié)果也會存在差異。
3.4 基于二次曲面的自定標(biāo)方法
基于二次曲面的自定標(biāo)方法和基于Kruppa方程的自定標(biāo)方法在本質(zhì)上答題一致,這兩種方法都是利用了絕對二次曲面在歐式變幻算法的計算下維持的不變性進行的。最早將二次曲面的概念引入到計算機視覺系統(tǒng)中攝像機自定標(biāo)方法的是Triggs,他在這種定標(biāo)方法上作出了可行性的研究,最后形成了基于二次曲面的自定標(biāo)方法。
在輸入了多幅的圖像并且在進行統(tǒng)一的射影重建的狀態(tài)下,基于二次曲面的自定標(biāo)方法會比基于Kruppa方程的自定標(biāo)方法更加適用一些,原因就是基于二次曲面的自定標(biāo)方法包含了絕對二次曲面和無窮遠處平面的所有信息,進而能夠辦證整個圖像在無窮遠處平面的一致性。
4 傳統(tǒng)攝像機定標(biāo)方法與自定標(biāo)方法優(yōu)缺點分析
從上文可知,對于傳統(tǒng)攝像機定標(biāo)方法應(yīng)該取其精華,去其糟粕;對于攝像機自定標(biāo)方法,在吸取傳統(tǒng)攝像機定標(biāo)方法的優(yōu)點的同時,應(yīng)該加強自身的精度要求??偠灾?,兩種攝像機定標(biāo)方法各自存在利弊,如何改進才是正確的研究方向。
4.1 傳統(tǒng)的攝像機定標(biāo)方法弊端
傳統(tǒng)的攝像機定標(biāo)方法通過實踐證明,在理論上和實際運用上十分有用的,但仍有不少地方需要進一步改進,以下為它目前存在的問題所在:1)攝像機所拍攝的圖像或視頻存在一定噪聲。在實際數(shù)據(jù)計算分析中,這種噪音無論大小,都會對內(nèi)部參數(shù)的實際解造成大的干擾,并且使實際解與由約束關(guān)系所求得的解之間有著相當(dāng)大的差異。因此,怎樣才能夠提高解的魯棒性、減少解之間的差異性成為了傳統(tǒng)攝像機定標(biāo)亟待解決的1問題;2)線性模型所得的優(yōu)化解并非全局的。由上可知,攝像機定標(biāo)的實際過程便是獲得實際參數(shù)的過程,即使用各種不同的優(yōu)化計算方法,來獲得相應(yīng)的非線性方程的一組解,但實際上,以此所獲得的優(yōu)化解并非全局的。因此,如何變化或者提高線性方程的解答方法也很重要;3)攝像機定標(biāo)參數(shù)的不確定性。一般來講,攝像機定標(biāo)參數(shù)的不確定性決定著計算參數(shù)的可信程度,同時,其對三維重建有著影響,進一步來講,攝像機定標(biāo)的不確定性也決定著約束關(guān)系的不確定性傳播。因此,這個問題也需要深入進一步研究。
總之,傳統(tǒng)攝像機的定標(biāo)方法依然存在著許多無法忽視的弊端和需要解決的問題,深入研究并盡快解決這些問題,應(yīng)該是傳統(tǒng)攝像機的定標(biāo)方法今后的大的研究方向。
4.2 攝像機自定標(biāo)方法相關(guān)問題
目前普遍認為,攝像機自定標(biāo)方法實現(xiàn)隨時隨地的校準(zhǔn)攝像機模型參數(shù),與傳統(tǒng)的攝像機定標(biāo)方法相比顯得更為靈活先進。攝像機自定標(biāo)方法無需參照物,僅僅從圖像或視頻的相關(guān)點中得到它們之間的約束關(guān)系,從而通過相應(yīng)的分析,計算出攝像機模型的參數(shù).這種定標(biāo)方法看似毫無缺點,但自定標(biāo)的精度與傳統(tǒng)的攝像機定標(biāo)方法相比,還是存在者一定的缺點,以下便是對其缺點的歸納總結(jié):部分攝像機自定標(biāo)方法所求得的解不夠穩(wěn)定。例如:在圖像或視頻存在一定噪聲的情況下,實際的解與理論的解有著相當(dāng)差異,或者所求得的解并不唯一。因此,解的不穩(wěn)定性和精度不夠的情況,不僅是傳統(tǒng)攝像機定標(biāo)方法的缺點,也是自定標(biāo)方法的一個問題,提高解的精度及穩(wěn)定性,是自定標(biāo)研究的一個重要方向。實際上,在現(xiàn)在的解決方案中,各種優(yōu)化算法是最常用最普遍的方法,但是,在多解的情況下,優(yōu)化算法也無法能夠保證得出全局的最優(yōu)解。由此看來,這個問題是計算機是絕種攝像機定標(biāo)方法普遍存在的關(guān)鍵性問題。
5 結(jié)束語
隨著計算機視覺系統(tǒng)的不斷發(fā)展,攝像機定標(biāo)技術(shù)也呈現(xiàn)了進步的狀態(tài)。綜上所述,計算機視覺中的攝像機定標(biāo)方法主要有傳統(tǒng)的攝像機定標(biāo)法和攝像機自定標(biāo)法,對這兩類的定標(biāo)方法進行深入的研究能夠為全面認識和了解攝像機定標(biāo)方法起到很好的幫助作用。計算機視覺中的攝像機定標(biāo)方法在今后的發(fā)展過程中應(yīng)該得到更多的研究,但其所存在的不足和弊端也理應(yīng)得到研究人員的重視。在這個多元化信息化的世界里,計算機視覺中的攝像機定標(biāo)技術(shù)若能夠根據(jù)現(xiàn)有的條件,適應(yīng)如今的環(huán)境,選擇合適的方法,對一些還存在局限性的環(huán)節(jié)取得更好地突破,則能夠?qū)⒄麄€定標(biāo)技術(shù)提升一個高度。相信隨著未來計算機視覺系統(tǒng)的不斷擴展和不斷完善,攝像機定標(biāo)技術(shù)的應(yīng)用范圍也會越來越廣闊。
參考文獻
[1]宋雪峰,楊明,王宏.用于攝像機標(biāo)定的網(wǎng)格狀紋理的檢測方法[A].2001年中國智能自動化會議論文集(下冊)[C].2001.
[2]譚躍鋼,吳正平.一種新的基于雙目視模型的三維重建方法[A].中國儀器儀表學(xué)會第三屆青年學(xué)術(shù)會議論文集(上)[C].2001.
[3]劉健勤,鮑光淑.面向數(shù)據(jù)采掘的自適應(yīng)圖象分割技術(shù)[A].中國圖象圖形科學(xué)技術(shù)新進展——第九屆全國圖象圖形科技大會論文集[C].1998.
[4]洪俊田,陶劍鋒,李剛,桂預(yù)風(fēng),徐曉英.基于灰色關(guān)聯(lián)的數(shù)字圖像去噪研究[J].武漢理工大學(xué)學(xué)報(交通科學(xué)與工程版),2006,04.
[5]趙江濤,周仁斌,劉寶源.基于線結(jié)構(gòu)激光三維掃描系統(tǒng)的攝像機標(biāo)定方法研究[A].2010振動與噪聲測試峰會論文集[C].2010.
[6]王鵬,王紅平.基于網(wǎng)格圖像的雙線性插值畸變校正的方法研究[A].科技創(chuàng)新與節(jié)能減排——吉林省第五屆科學(xué)技術(shù)學(xué)術(shù)年會論文集(上冊)[C].2008.
[7]程建璞,項輝宇,于修洪.基于OpenCV的視覺測量技術(shù)中攝像機標(biāo)定方法[J].北京工商大學(xué)學(xué)報(自然科學(xué)版),2010,01.
[8]趙越,江南.一種基于3D矩形靶標(biāo)的攝像機標(biāo)定算法及其實現(xiàn)[A].第九屆全國信息獲取與處理學(xué)術(shù)會議論文集Ⅰ[C].2011.
篇4
論文關(guān)鍵詞:表面粗糙度,非接觸,光學(xué)測量
隨著科學(xué)技術(shù)的進步和社會的發(fā)展,人們對于機械產(chǎn)品表面質(zhì)量的要求越來越高。表面粗糙度是評價工件表面質(zhì)量的一個重要指標(biāo),國內(nèi)外很多學(xué)者在表面粗糙度檢測方面做了大量研究工作。目前測量表面粗糙度的主要方法有:接觸式測量和非接觸式測量。
1 接觸式測量
接觸式測量就是測量裝置的探測部分直接接觸被測表面,能夠直觀地反映被測表面的信息,接觸式測量方法主要是觸針法,該方法經(jīng)過幾十年的充分發(fā)展,以其穩(wěn)定、可靠的特點被廣泛應(yīng)用。但接觸式測量存在很大的缺陷,具體表現(xiàn)在:(1)對高精度表面及軟質(zhì)金屬表面有劃傷破壞作用;(2)受觸針尖端圓弧半徑的限制,其測量精度有限;(3)因觸針磨損及測量速度的限制,無法實現(xiàn)在線實時測量[1]。
2 非接觸式測量
為了克服接觸式測量方法的不足非接觸,人們對非接觸式測量方法進行了廣泛研究。研究表明,非接觸式測量方法具有非接觸、無損傷、快速、測量精度高、易于實現(xiàn)在線測量、響應(yīng)速度快等優(yōu)點。目前已有的非接觸式測量方法包括各種光學(xué)測量方法、超聲法、掃描隧道顯微鏡法、基于計算機視覺技術(shù)的表面粗糙度檢測方法等。這里我們只對基于光學(xué)散射原理的測量方法、基于光學(xué)干涉原理的測量方法和基于計算機視覺技術(shù)的測量方法做簡單介紹論文格式模板。
2.1基于光學(xué)散射原理的測量方法
當(dāng)一束光以一定的角度照射到物體表面后,加工表面的粗糙不平將引起發(fā)生散射現(xiàn)象。研究表明:表面粗糙度和散射光強度分布有一定的關(guān)系。對于表面粗糙度數(shù)值較小的表面,散射光能較弱,反射光能較強;反之,表面粗糙度數(shù)值較大的表面,散射光能較強,反射光能較弱。
基于光學(xué)散射原理測量表面粗糙度的研究方法和理論較多。四川聯(lián)合大學(xué)和哈爾濱理工大學(xué)相繼提出了一種稱之為散射特征值的參數(shù),表征被測物體表面上反射光和散射光的分散度,散射特征值與被測物體表面的粗糙度有很好的對應(yīng)關(guān)系[2]。哈爾濱理工大學(xué)利用已知表面粗糙度參數(shù)值的標(biāo)準(zhǔn)樣塊測得其散射特征值,建立—關(guān)系曲線,從而實現(xiàn)利用散射特征值測量火炮內(nèi)膛表面粗糙度[3]。
基于光學(xué)散射原理的表面粗糙度檢測方法,具有結(jié)構(gòu)簡單、體積小、易于集成產(chǎn)品、動態(tài)響應(yīng)好、適于在線測量等優(yōu)點。該方法的缺點是測量精度不高,用于超光滑表面粗糙度的測量還有待進一步改進。
2.2基于光學(xué)干涉原理的測量方法
當(dāng)相干光照射到工件表面同一位置時,由于光波的相互位相關(guān)系,將產(chǎn)生光波干涉現(xiàn)象。一般的干涉法測量是利用被測面和標(biāo)準(zhǔn)參考面反射的光束進行比較,對干涉條紋做適當(dāng)變換,通過測量干涉條紋的相對變形來定量檢測表面粗糙度。該方法的測量精度取決于光的波長。但是由于干涉條紋的分辨率是以光波波長的一半為極限的,僅從條紋的狀態(tài)無法判斷表面是凸起還是凹陷,因此非接觸,作為一種具有較好分辨率、寬測量范圍的表面粗糙度在線檢測技術(shù),這種干涉法測量技術(shù)還有待于進一步發(fā)展[4]。
基于光學(xué)干涉原理,1984年美國洛克西德導(dǎo)彈公司huang采用共模抑制技術(shù)研制成功了光學(xué)外差輪廓儀,光外差干涉檢測技術(shù)是一種具有納米級測量準(zhǔn)確度的高精度光學(xué)測量方法,適用于精加工、超精加工表面的測量,而且可以進行動態(tài)時間的研究;華中理工大學(xué)采用光外差干涉方法研制出2D-SROP-1型表面粗糙度輪廓儀[5]。美國的維易科(VEECO)精密儀器有限公司,采用共光路干涉法研制了WYKO激光干涉儀和光學(xué)輪廓儀,可用來測量干涉條紋位相[6]。
基于光學(xué)干涉原理測量表面粗糙度分辨率高,適于測量超光滑表面粗糙度,但由于該方法的測量精度受光波波長的影響很大,所以其測量范圍受到一定影響。
2.3基于計算機視覺技術(shù)的測量方法
基于計算機視覺的粗糙度測量方法是指使用攝像機抓取圖像,然后將該圖像傳送至處理單元,通過數(shù)字化處理,根據(jù)像素分布和灰度、紋理、形狀、顏色等信息,選用合理的算法計算工件的粗糙度參數(shù)值。近年來,隨著計算機技術(shù)和工業(yè)生產(chǎn)的不斷發(fā)展,該方法受到越來越多的關(guān)注。
北京理工大學(xué)的王仲春等人采用顯微鏡對檢測表面進行放大,并通過對CCD采集加工表面微觀圖像進行處理實現(xiàn)了表面粗糙度的檢測[7]論文格式模板。哈爾濱理工大學(xué)吳春亞、劉獻禮等為解決機械加工表面粗糙度的快速、在線檢測,設(shè)計了一種表面粗糙度圖像檢測方法,建立了圖像灰度變化信息與表面粗糙度之間的關(guān)系模型[8]。英國學(xué)者Hossein Ragheb和Edwin R. Hancock通過數(shù)碼相機拍攝的表面反射圖來估計表面粗糙度參數(shù)非接觸,運用Vernold–Harvey修正的B–K散射理論模型獲得了比Oren–Nayar模型更好的粗糙度估計結(jié)果[9]。澳大利亞學(xué)者Ghassan A. Al-Kindi和Bijan Shirinzadeh對基于顯微視覺的不同機械加工表面粗糙度參數(shù)獲取的可行性進行了評估,討論了照射光源與表面輻照度模型對檢測的影響,結(jié)果顯示盡管從視覺數(shù)據(jù)和觸針數(shù)據(jù)所獲得的粗糙度參數(shù)存在一定差異,但是基于視覺的方法仍是一種可靠的粗糙度參數(shù)估計方法[10-11]。
可以看出,基于計算機視覺技術(shù)的測量方法主要有統(tǒng)計分析、特征映射和神經(jīng)網(wǎng)絡(luò)等黑箱估計法。通過這些方法獲得的表面粗糙度參數(shù)的估計值受諸多因素的影響,難以給出其準(zhǔn)確的物理解釋。真正要定量地計算出粗糙度參數(shù),需要科學(xué)的計算。
但是隨著機械加工自動化水平的提高,基于計算機視覺技術(shù)的檢測方法處理內(nèi)容豐富、處理精度高、處理速度快、易于集成等優(yōu)點將受到越來越多的重視。
3 結(jié)束語
接觸式測量測量速度較慢,容易劃傷工件表面,并且不適用于連續(xù)生產(chǎn)材料表面的檢測。非接觸式測量具有無損傷、快速、測量精度高、易于實現(xiàn)在線測量等優(yōu)點,已成為表面粗糙度檢測的重點研究方向。非接觸測量以光學(xué)法為主,隨著計算機技術(shù)和工業(yè)生產(chǎn)的迅猛發(fā)展,基于計算機視覺技術(shù)的表面粗糙度非接觸式檢測方法受到越來越多的重視。
參考文獻:
[1]劉斌,馮其波,匡萃方.表面粗糙度測量方法綜述[J]. 光學(xué)儀器, 2004, 26(5): 54-55.
[2]苑惠娟等.非接觸式表面粗糙度測量儀[J].哈爾濱科學(xué)技術(shù)大學(xué)學(xué)報,1995,19(6):30-34.
[3]強熙富,張詠,許文海.?dāng)U展激光散射法測量粗糙度的測量范圍的研究[J].計量學(xué)報,1990,11(2):81-85.
[4]王文卓,李大勇,陳捷.表面粗糙度非接觸式測量技術(shù)研究概況[J].機械工程師,2004,11:6-9.
[5]王菊香.2D-SROP-1型表面粗糙度輪廓儀[J].工業(yè)計量,1994,(4):27-29.
[6]徐德衍等.光學(xué)表面粗糙度研究的進展與方向[J].光學(xué)儀器,1996,18(1):32-41.
[7]王仲春,高岳,黃粵熙等.顯微成像檢測表面粗糙度[J]. 光學(xué)技術(shù), 1998, 5: 46-48.
[8]吳春亞,劉獻禮,王玉景等.機械加工表面粗糙度的圖像檢測方法[J]. 哈爾濱理工大學(xué)學(xué)報, 2007, 12(3): 148-151.
[9]Hossein Ragheb, Edwin R.Hancock. The modified Beckmann–Kirchhoff scattering theory for rough surfaceanalysis[J]. Pattern Recognition, 2007, 40: 2004-2020.
[10]Ghassan A. Al-Kindi, BijanShirinzadeh. An evaluation of surface roughness parameters measurement usingvision-based data[J]. International Journal of Machine Tools & Manufacture,2007, 47: 697-708.
[11]Ghassan A. Al-Kindi, BijanShirinzadeh. Feasibility assessment of vision-based surface roughnessparameters acquisition for different types of machined specimens[J]. Image andVision Computing, 2008, 6: 1-15.
篇5
關(guān)鍵詞:數(shù)據(jù)融合傳感器無損檢測精確林業(yè)應(yīng)用
多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數(shù)據(jù)可信度和分辨能力,已廣泛應(yīng)用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機器人、海洋監(jiān)視和管理、目標(biāo)跟蹤和慣性導(dǎo)航等領(lǐng)域[1,2]。筆者在分析數(shù)據(jù)融合技術(shù)概念和內(nèi)容的基礎(chǔ)上,對該技術(shù)在林業(yè)工程中的應(yīng)用及前景進行了綜述。
1數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。70年代末,在公開的技術(shù)文獻中開始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進行定位與估計,并完全能對態(tài)勢及帶來的威脅進行實時評估”。
1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實際需要的信息”。
Wald定義的數(shù)據(jù)融合的概念原理中,強調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標(biāo),這正是很多關(guān)于數(shù)據(jù)融合的文獻中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項目的資金、人力資源等[3]。
1.2基本內(nèi)容
信息融合是生物系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環(huán)境和發(fā)生的事件做出估計和判斷。當(dāng)運用各種現(xiàn)代信息處理方法,通過計算機實現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術(shù)。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據(jù)某些準(zhǔn)則進行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:
(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標(biāo)。
(2)多傳感器ID/軌跡估計。假設(shè)多傳感器的報告反映的是同源目標(biāo),對這些數(shù)據(jù)進行綜合,改進對該目標(biāo)的估計,或?qū)φ麄€當(dāng)前或未來情況的估計。
(3)采集管理。給定傳感器環(huán)境的一種認識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標(biāo)探測、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識別、情況評估和預(yù)測[4]。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進行關(guān)聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數(shù)據(jù)之間配準(zhǔn)精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進一步改善。
(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務(wù),然后進行關(guān)聯(lián),再送入融合中心處理。這種方法的實質(zhì)是根據(jù)一定的準(zhǔn)則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點是數(shù)據(jù)通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術(shù)也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等[5,6]。
1.3處理模型
美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型[7],當(dāng)時僅應(yīng)用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗知識等)。
源數(shù)據(jù)預(yù)處理。進行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計算負擔(dān),有時需要為融合中心提供最重要的數(shù)據(jù)。目標(biāo)評估。融合目標(biāo)的位置、速度、身份等參數(shù),以達到對這些參數(shù)的精確表達。主要包括數(shù)據(jù)配準(zhǔn)、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識。
態(tài)勢評估。根據(jù)當(dāng)前的環(huán)境推斷出檢測目標(biāo)與事件之間的關(guān)系,以判斷檢測目標(biāo)的意圖。威脅評估。結(jié)合當(dāng)前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時考慮當(dāng)前的政治環(huán)境和對敵策略等因素,所以較為困難。
處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導(dǎo)和評價、多媒體功能等。
2多傳感器在林業(yè)中的應(yīng)用
2.1在森林防火中的應(yīng)用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數(shù)據(jù)測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態(tài),用一般圖像增強處理方法探測燃燒區(qū)火點的結(jié)果不理想。余啟剛運用數(shù)據(jù)融合技術(shù),在空間分辨率為1000m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250m的可見光通道的數(shù)據(jù),較好地進行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點位置的判斷準(zhǔn)確度[8]。為進一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準(zhǔn)確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計算機獲得GPS接收機輸出的有關(guān)信息通過與RS實現(xiàn)高效互補性融合,從而彌補衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點信息準(zhǔn)確度和敏感性。
2.2森林蓄積特征的估計
HampusHolmstrom等在瑞典南部的試驗區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-IIVHFSAR傳感器的雷達數(shù)據(jù)進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計[9]。
KNN方法就是采用目標(biāo)樣地鄰近k個(k=10)最近樣地的加權(quán)來估計目標(biāo)樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達數(shù)據(jù)融合技術(shù)對試驗區(qū)的不同林分的蓄積特征進行估計,并對三種不同的數(shù)據(jù)方法進行誤差分析。試驗表明,融合后的數(shù)據(jù)作出的估計比單一的衛(wèi)星數(shù)據(jù)或雷達數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調(diào)查數(shù)據(jù)
森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森林資源調(diào)查的工作量巨大,且要花費大量的人力、物力和資金。國內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對應(yīng)的GIS數(shù)據(jù)信息實現(xiàn)森林調(diào)查數(shù)據(jù)的快速更新,認為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機側(cè)面裝上可視的數(shù)字攝像裝置,利用GPS對測點進行定位,對特殊地區(qū)的攝像進行拍攝,同時與對應(yīng)的GIS數(shù)據(jù)進行融合,做出資源變化的估計或影像的修正[10]。
試驗表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠、地形復(fù)雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。
3數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望
3.1在木材檢測中的應(yīng)用
3.1.1木材缺陷及其影響
木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標(biāo)準(zhǔn)掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進行在線識別和自動剔除技術(shù),以解決集成材加工中節(jié)子人工識別誤差大、難以實現(xiàn)雙面識別、剔除機械調(diào)整時間長等問題。
3.1.2單一傳感器在木材檢測中的應(yīng)用
對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應(yīng)力、震動、沖擊應(yīng)力波、快速傅立葉變換分析等檢測方法[11,12]。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等[13]。
隨著計算機視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測中。新西蘭科學(xué)家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準(zhǔn)確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結(jié)合力,并動態(tài)地觀察木材纖維在材料中的結(jié)合機理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現(xiàn)的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。
美國林產(chǎn)品實驗室利用計算機視覺技術(shù)對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進行了定向刨花板內(nèi)刨花定向程度的檢測,從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強度。
在制材加工過程中,利用計算機視覺技術(shù)在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質(zhì)量進行分級,實現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計算機視覺技術(shù)在線實時檢測單板上的各種缺陷,實現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現(xiàn)自動化生產(chǎn)過程。Wengert等在綜合了大量的板材分類經(jīng)驗的基礎(chǔ)上,建立了板材分級分類的計算機視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計算機視覺技術(shù)對刨花板施膠效果進行了定量分析[14]。
X射線對木材及木質(zhì)復(fù)合材料的性能檢測已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對木材密度、含水率、纖維素相對結(jié)晶度和結(jié)晶區(qū)大小、纖維的化學(xué)結(jié)構(gòu)和性質(zhì)等進行檢測,并對木材內(nèi)部的各種缺陷進行檢測。
3.1.3數(shù)據(jù)融合在木材檢測中的應(yīng)用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當(dāng)成節(jié)子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測部分表面缺陷,而無法檢測到內(nèi)部缺陷;超聲、微波、核磁共振和X射線技術(shù)均能測量密度及內(nèi)部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準(zhǔn)確、可靠地檢測到木材的缺陷[15,16]。
基于多傳感器(機器視覺及X射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項技術(shù),更可靠、準(zhǔn)確地實時檢測出木材表面的各種缺陷,為實現(xiàn)木材分級自動化、智能化奠定基礎(chǔ),同時為集裁除鋸、自動調(diào)整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設(shè)備提供技術(shù)支持。
3.2在精確林業(yè)中的應(yīng)用
美國華盛頓大學(xué)研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學(xué)的生物系統(tǒng)工程系和USDA南方林業(yè)實驗站與有關(guān)公司合作開展用GPS和其他傳感器研究林業(yè)機器系統(tǒng)的性能和生產(chǎn)效率。
目前單項的GPS、RS、GIS正從“自動化孤島”形式應(yīng)用于林業(yè)生產(chǎn)向集成技術(shù)轉(zhuǎn)變。林業(yè)生產(chǎn)系統(tǒng)作為一個多組分的復(fù)雜系統(tǒng),是由能量流動、物質(zhì)循環(huán)、信息流動所推動的具有一定的結(jié)構(gòu)和功能的復(fù)合體,各組分間的關(guān)系和結(jié)合方式影響系統(tǒng)整體的結(jié)構(gòu)和功能。因此應(yīng)該在計算機集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時間上的質(zhì)的差異及空間數(shù)據(jù)類型的多樣性,如地理統(tǒng)計數(shù)據(jù)、柵格數(shù)據(jù)、點數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術(shù))等,使林業(yè)生產(chǎn)成為一個高效、柔性和開放的體系,從而實現(xiàn)林業(yè)生產(chǎn)的標(biāo)準(zhǔn)化、規(guī)范化、開放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。
南京林業(yè)大學(xué)提出了“精確林業(yè)工程系統(tǒng)”[17]。研究包括精確林業(yè)工程系統(tǒng)的領(lǐng)域體系結(jié)構(gòu)、隨時空變化的數(shù)據(jù)采集處理與融合技術(shù)、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術(shù)等,實現(xiàn)基于自然界生物及其所賴以生存的環(huán)境資源的時空變異性的客觀現(xiàn)實,以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標(biāo),建立關(guān)于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。
[參考文獻]
[1]高翔,王勇.數(shù)據(jù)融合技術(shù)綜述[J].計算機控制與測量,2002,10(11):706-709.
[2]龔元明,蕭德云,王俊杰.多傳感器數(shù)據(jù)融合技術(shù)(上)[J].冶金自動化,2002(4):4-7.
[3]錢永蘭,楊邦杰,雷廷武.數(shù)據(jù)融合及其在農(nóng)情遙感監(jiān)測中的應(yīng)用與展望[J].農(nóng)業(yè)工程學(xué)報,2004,20(4):286-290.
[4]高德平,黃雪梅.多傳感器和數(shù)據(jù)融合(一)[J].紅外與激光工程,1999,28(1):1-4.
[5]王耀南,李樹濤.多傳感器信息融合及其應(yīng)用綜述[J].控制與決策,2001,16(5):518-52.
[6]許軍,羅飛路,張耀輝.多傳感器信息融合技術(shù)在無損檢測中的應(yīng)用研究[J].無損檢測,2000,22(8):342-344.
[7]WhiteFE.Datafusionlexicon:DatafusionsubpanelofthejointdirectorsoflaboratoriestechnicalpanelforC3[R].SanDiego,1991.
[8]余啟剛.數(shù)據(jù)融合技術(shù)在“3S”森林防火中的應(yīng)用[J].森林工程,2003,19(4):5-6.
[9]HampusHolmstrom,biningremotelysensedopticalandradardatainKNN-estimationofforest[J].ForestScience,2003,49(3):409-418.
[10]TrevorJDavis,BrianKlinkenberg,PeterKellerC.Updatinginventory:Usingobliquevideogrammetry&datafusion[J].JournalofForestry,2002,100(2):45-50.
[11]楊春梅,胡萬義,白帆,等.木材缺陷檢測理論及方法的發(fā)展[J].林業(yè)機械與木工設(shè)備,2004,32(3):8-10.
[12]胡英成,顧繼友,王逢瑚.木材及人造板物理力學(xué)性能無損檢測技術(shù)研究的發(fā)展與展望[J].世界林業(yè)研究,2002,15(4):39-46.
[13]肖忠平,盧曉寧,陸繼圣.木質(zhì)材料X射線與超聲檢測技術(shù)研究的發(fā)展與展望[J].木材加工機械,2004,15(1):25-27.
[14]王金滿,周秀榮.刨花板施膠效果計算機視覺分析方法[J].東北林業(yè)大學(xué)學(xué)報,1994,22(3):25-26.
[15]KlinkhachornP.Prototypinganautomatedlumberprocessingsystem[J].ForestProductsJournal,1993(2):11-18.
篇6
關(guān)鍵詞:
俯仰角; 圓形目標(biāo); 透視投影; 測量方法
中圖分類號: TP 242.6 文獻標(biāo)識碼: A
引 言
在計算機視覺領(lǐng)域內(nèi),空間目標(biāo)的位置和姿態(tài)是非常關(guān)鍵的參數(shù),尤其是在視覺導(dǎo)航、目標(biāo)識別以及人機交互等方面[1,2]。圓是物體的基本幾何形狀,在許多自然景物和人造物體中大量存在,并且圓形是一種幾何特征明顯且容易識別的形狀,在圖像處理中有著其它幾何形狀無法比擬的優(yōu)點。圓形特征已經(jīng)被應(yīng)用在各種機器視覺相關(guān)的領(lǐng)域[3]。例如,使用圓形標(biāo)志來進行移動機器人位置的精確估計,使用圓形標(biāo)志物來進行三維物體的識別,以及使用圓形表面輪廓來進行目標(biāo)的三維姿態(tài)估計等[4]。
作為姿態(tài)角的一種,俯仰角在許多領(lǐng)域起著重要作用。在火箭發(fā)射過程中,火箭的俯仰角等姿態(tài)參數(shù)是反映火箭飛行狀態(tài)的重要參數(shù),對于分析火箭的運動狀態(tài)等有著重要的價值[5]。無人機及其它飛行器在飛行及著陸的過程中,也需要實時估計其姿態(tài)角等參數(shù)[6,7]。在頭盔瞄準(zhǔn)具中,射擊目標(biāo)的位置是依靠頭部的運動來確定的,頭部的俯仰角等姿態(tài)角測量,關(guān)系到射擊的命中率[8]。而在計算機視覺領(lǐng)域,通過攝像測量獲得距離等參數(shù)已經(jīng)應(yīng)用于汽車自動測距等,而攝像機的俯仰角參數(shù)直接影響著所測距離的精確度[9]。對于空間圓形目標(biāo)的姿態(tài)角,國內(nèi)外已經(jīng)開始了相關(guān)研究。SafaeeRad等人[4]使用幾何分析的方法,提出了一種圓形目標(biāo)的三維定位問題的閉合分析解。魏振中[3,10]等人研究了中心畸變誤差及空間圓姿態(tài)識別二義性的消除問題?,F(xiàn)有的俯仰角測量方法,計算較為復(fù)雜。
現(xiàn)作為探索性研究,基于攝像機透視投影原理,對空間圓形目標(biāo)的俯仰運動及俯仰角的測量進行研究,提出一種測量空間圓形目標(biāo)俯仰角的方法。
1 圓形目標(biāo)的俯仰運動及俯仰角測量
俯仰角最早出現(xiàn)在航空航天領(lǐng)域,定義為機體坐標(biāo)系X軸與水平面的夾角。當(dāng)X軸的正半軸位于過坐標(biāo)原點的水平面之上時,俯仰角為正,俯仰角θ的范圍為[-π/2,π/2]。
由于設(shè)定攝像機光心與圓形目標(biāo)之間的距離相對圓形目標(biāo)的直徑來說非常大,并且圓形目標(biāo)可在攝像機成像平面上完全成像,成像部位為感光器件中央或靠近中央位置,因此不考慮因攝像機鏡頭畸變等因素而帶來的影響。結(jié)合運動分析的方法,現(xiàn)對圓形目標(biāo)的俯仰運動進行研究。不妨設(shè)定圓形目標(biāo)的初始位置,并根據(jù)俯仰運動的旋轉(zhuǎn)軸是否通過其圓心,將俯仰運動分為以下兩種情況來分別進行分析。
3 結(jié) 論
文中研究了空間圓形目標(biāo)的俯仰運動,提出了一種基于攝像機透視投影原理的空間圓形目標(biāo)俯仰角的測量方法。根據(jù)圓形目標(biāo)的俯仰運動旋轉(zhuǎn)軸是否通過其圓心,將俯仰運動分為兩類。通過分析空間圓形目標(biāo)在不同姿態(tài)時的透視投影成像,使用幾何推理的方法,分別推導(dǎo)出了空間圓形目標(biāo)兩種俯仰運動俯仰角的計算公式,并通過實驗進行了驗證。結(jié)果表明,所提出的方法,能夠很好地實現(xiàn)空間圓形目標(biāo)俯仰角的測量。如何提高現(xiàn)場的測量和計算結(jié)果的精度,都將是進一步的研究工作。
參考文獻:
[1] LU Y,LEINONEN T.Solution and simulation of positionorientation for multispatial 3RPS parallel mechanisms in series connection[J].Multibody System Dynamics,2005,14(1):47-60.
[2] FANTONI C.3D surface orientation based on a novel representation of the orientation disparity field[J].Vision Research,2008,48(25):2509-2522.
[3] 魏振忠,張廣軍.視覺檢測中橢圓中心成像畸變誤差模型研究[J].北京航空航天大學(xué)學(xué)報,2003,29(2):140-143.
[4] SAFAEERAD R,TCHOUKANOV I,SMITH K C,et al.Threedimensional location estimation of circular features for machine vision[J].IEEE Trans Robot Automat,1992,8(2):624-640.
[5] 于起峰,孫祥一,陳國軍.用光測圖像確定空間目標(biāo)俯仰角和偏航角的中軸線法[J].國防科技大學(xué)學(xué)報,2000,22(2):15-19.
[6] 潘 翔,馬德強,吳貽軍,等.基于視覺著陸的無人機俯仰角與高度估計[J].浙江大學(xué)學(xué)報(工學(xué)版),2009,43(4):692-696.
[7] 趙世峰,張 海,范耀祖.一種基于計算機視覺的飛行器姿態(tài)估計算法[J].北京航空航天大學(xué)學(xué)報,2006,32(8):885-898.
[8] 王 超,魏生民,周繼紅,等.視頻圖像技術(shù)在頭部位置跟蹤上的應(yīng)用研究[J].現(xiàn)代制造工程,2008(2):111-115.
篇7
關(guān)鍵詞:計算機視覺;跟蹤算法;綜述;人數(shù)統(tǒng)計
中圖分類號:TP391 文獻標(biāo)識碼:A DOI:10.3969/j.issn.1003-6970.2013.03.003
0 引言
計算機視覺作為一門多學(xué)科的交叉領(lǐng)域,涉及圖像處理、計算機圖形學(xué)、模式識別、人工智能、人工神經(jīng)網(wǎng)絡(luò)、計算機、數(shù)學(xué)、心理學(xué)、生理學(xué)和物理學(xué)等。本文是對視頻人數(shù)統(tǒng)計技術(shù)的綜述,屬于智能視頻監(jiān)控范疇。
由于智能視屏監(jiān)控的挑戰(zhàn)性以及其巨大的應(yīng)用價值,越來越多的學(xué)校、研究所以及公司的研究人員投入到該領(lǐng)域中來。麻省理工學(xué)院、卡內(nèi)基梅隆大學(xué)以及其他國外著名大學(xué)成立了專門的計算機視覺及多媒體方向的實驗室;Nice和Object video等公司已經(jīng)針對飛機場、國界線等應(yīng)用場合開發(fā)了一些相應(yīng)的智能監(jiān)控系統(tǒng)。國際上的高級視頻和錄像(Advanced Videoand Signal-Based Surveillance)論壇每年都會舉辦PETS(Performance Evaluation of Tracking Systems)會議專門針對于人群行為分析,包括群體人數(shù)統(tǒng)計,人流密度估計;對單個人員以及群體中個體進行跟蹤;特殊群體和特殊事件檢測等。本文主要針對視頻人數(shù)識別這個研究方向,從基于特征點、顏色與形狀信息、模板匹配三種不同類型識別跟蹤方式分析了近些年來國內(nèi)外的研究工作及最新進展,通過對各種不同識別方法比較,對當(dāng)前亟需解決的問題做了詳細的分析。
1 人數(shù)識別研究現(xiàn)狀
人數(shù)統(tǒng)計算法融合了運動物體檢測、行人檢測與分割、形狀分析、特征提取和目標(biāo)跟蹤等多個領(lǐng)域的技術(shù)。從采用的手段來講可以分為直接法和間接法:直接法(或稱基于檢測的),即首先在場景中檢測出每個行人,再計數(shù)。第二種稱為間接法(也稱為基于映射或基于度量的),一般是建立場景特征與行人數(shù)量的函數(shù)關(guān)系來測算人數(shù)。在行人高度密集的場景中,間接法比直接法更加可靠,主要因為直接法無法有效分割每個行人,特別是在行人高度密集的場景中,從20世紀(jì)90年代起到目前為止這近20年里,出現(xiàn)了眾多的視覺跟蹤算法,1988年,Aggarwal和Nanadhakumar對運動圖像分析算法進行了總結(jié),將算法分為兩類,一類是基于光流法的分析,另一類是基于特征點的分析,此后在視覺跟蹤領(lǐng)域中,又出現(xiàn)了許多新的方法,目前,視頻中人數(shù)的跟蹤方法大致分為三類,分別是基于區(qū)域的跟蹤、基于特征點的跟蹤、基于模板和模型的跟蹤,這種分類方法概括了目前大多數(shù)視覺跟蹤算法,因此下面用這種分類方法對視覺跟蹤算法進行介紹。
1.1 基于特征的人數(shù)識別
基于特征的人數(shù)跟蹤算法選取目標(biāo)的某個或某些局部特征作為相關(guān)時的對象,這種算法的優(yōu)點在于即使目標(biāo)的某一部分被遮擋,只要還有一部分特征可以被看到,就可以完成跟蹤任務(wù),另外,這種方法與卡爾曼濾波器聯(lián)合使用,也具有很好的跟蹤效果。這種算法的難點是:對某個運動目標(biāo),如何確定它的唯一特征集?這也是一個模式識別問題,若采用特征過多,系統(tǒng)效率將降低,且容易產(chǎn)生錯誤,文獻對這一問題進行了討論,在特征提取時,一般采用Canny算子獲得目標(biāo)的邊緣特征,而采用SUSAN算子獲得目標(biāo)的角點信息。有關(guān)基于特征的跟蹤算法還可參見文獻。在2009年,Albiol使用角點個數(shù)作為場景特征來估測人數(shù),首先通過Harris角檢測器檢測出圖像角點,然后進行角點匹配以區(qū)分人身上的角點和背景角點,Albiol認為每幀總?cè)藬?shù)與人身上角點的個數(shù)成正比例關(guān)系,以此估測人數(shù),算法雖然簡單,但在PETS 2010“人數(shù)統(tǒng)計與密度估計”競賽中取得優(yōu)勝。2010年,Conte等“”基于Albiol的方法提出改進。采用的SURF(Speed up Ro.bust Feature)特征點以代替角點,同時,Conte等不僅考慮到特征點個數(shù)對人數(shù)估測的影響,還考慮到透視投影(拍攝距離d)密度人群遮掩(特征點密度p)對于估測的影響,同時對所有SURF點進行分組回歸以提高精度,在這個基礎(chǔ)上張茂軍等相比Conte等的研究成果在處理遠距離人群上精度提高,主要因為使用“非最大抑制聚類”——對不同拍攝距離的人群采取不同的聚類標(biāo)準(zhǔn),有效解決遠距離人群的類過大問題,提取人身上特征點的方法是在掩模上直接檢測特征點,使得特征點個數(shù)更加穩(wěn)定,有利于SVM預(yù)測。
1.2 基于區(qū)域的人數(shù)識別
基于區(qū)域的跟蹤算法基本思想是:首先得包含目標(biāo)的模板(Template),該模板通過圖像分割獲得或是預(yù)先人為確定,模板通常為略大于目標(biāo)的矩形,也可為不規(guī)則形狀;然后在序列圖像中,運用相關(guān)算法跟蹤目標(biāo),對灰度圖像可以采用基于紋理和特征的相關(guān),對彩色圖像還可利用基于顏色的相關(guān)。
McKenna等首先利用色彩和梯度信息建立自適應(yīng)的背景模型,并且利用背景減除方法提取運動區(qū)域,有效地消除了影子的影響;然后,跟蹤過程在區(qū)域、人、人群三個抽象級別上執(zhí)行,區(qū)域可以合并和分離,而人是由許多身體部分區(qū)域在滿足幾何約束的條件下組成的,同時人群又是由單個的人組成的,因此利用區(qū)域跟蹤器并結(jié)合人的表面顏色模型,在遮擋情況下也能夠較好地完成多人的跟蹤。Marana等認為低密度人群在圖像上體現(xiàn)出粗糙紋理特征,而高密度人群則體現(xiàn)出精細紋理特征。文獻分別采用自組織理論和Minkowsld不規(guī)則維度理論從圖像紋理特征預(yù)測人群密度。Lin等則結(jié)合Harr小波變換(HWT)和支持向量機(SVM)進行行人頭部輪廓檢測,從而達到人數(shù)統(tǒng)計的目的。文獻利用顏色和形狀信息實現(xiàn)人頭的檢測,包含兩個步驟:黑色區(qū)域提取和形狀分析。通過對HSV空間V通道的像素設(shè)置閾值這種方法有效地檢測出黑色區(qū)域,同時可以少受光照變化和陰影的影響。使用一種基于形狀描述的快速弧形結(jié)構(gòu)提取方法實現(xiàn)人頭檢測。姬紅兵等提出了一種基于局部特征的目標(biāo)跟蹤算法,通過多尺度分析方法,根據(jù)顏色和空間上的相似性將目標(biāo)分割為多個區(qū)域,每個區(qū)域由一個團塊表示,團塊包含了該區(qū)域所有像素的顏色均值、形狀和位置,根據(jù)團塊特征構(gòu)造目標(biāo)的外觀模型,定義團塊的匹配準(zhǔn)則,通過團塊匹配進行目標(biāo)跟蹤。
1.3 基于模板匹配的人數(shù)識別
采用模板匹配識別跟蹤方法首先將圖像序列轉(zhuǎn)換為一組靜態(tài)形狀模式然后在識別過程中和預(yù)先存儲的行為標(biāo)本相比較,
部分學(xué)者在運動前景提取的基礎(chǔ)上使用了輪廓匹配方法對目標(biāo)進行定位,文獻使用了半圓模型搜索前景中人頭肩所在位置,然后使用Snake模型與卡爾曼濾波相結(jié)合對目標(biāo)進行跟蹤目標(biāo),但Snake模型比較適合單目標(biāo)的跟蹤,當(dāng)行人發(fā)生重疊時,定位精度會有一定的下降;在此基礎(chǔ)上文獻提出使用含有人harr特征分類器(使用頭肩部上半身樣本),對行人重疊情況下的檢測精度有一定的提升。文獻提出使用垂直攝像頭降低行人之間的遮擋程度,通過對基于AdaBoost的人頭檢測本方法,建立一個良好的人頭檢測分類器。然后根據(jù)運動人頭的特征去除誤檢區(qū)域。最后配合過線跟蹤實現(xiàn)出入口人數(shù)統(tǒng)計。
2 視頻跟蹤問題中的難點
從上面的闡述可以看出,各種方法都有自己的優(yōu)點和不足,是在文獻基礎(chǔ)上分析得到的幾種具體識別方法的比較結(jié)果,由于各種方法在設(shè)定理想情況下都有較好的準(zhǔn)確率,所以不對各種方法的準(zhǔn)確率做出比較,而是從各種算法的復(fù)雜度、魯棒性、先驗知識需求、高密度復(fù)雜人群適應(yīng)性(有遮擋出現(xiàn))等方面進行相對的比較分析,分析結(jié)果如表1。
2.1 視覺跟蹤問題中的難點
從控制的觀點來看,視覺跟蹤問題所面臨的主要難點可以歸結(jié)為對視覺跟蹤算法在三個方面的要求,即對算法的魯棒性、準(zhǔn)確性和快速性。
魯棒性是指視覺跟蹤算法能夠在各種環(huán)境條件下實現(xiàn)對運動目標(biāo)持續(xù)穩(wěn)定的跟蹤。影響人數(shù)跟蹤系統(tǒng)魯棒性的最主要原因在于目標(biāo)處環(huán)境的光照變化以及部分遮擋引起的運動目標(biāo)不規(guī)則變形和全部遮擋引起的目標(biāo)的暫時消失。當(dāng)運動目標(biāo)所處環(huán)境的光照發(fā)生改變時,采用圖像灰度信息或色彩信息作為跟蹤基礎(chǔ)的視覺跟蹤算法一般都會失效,而基于圖像特征的方法往往不受光照改變的影響,如利用運動目標(biāo)的邊緣信息能有效避免光照變化對運動目標(biāo)的影響,但在復(fù)雜環(huán)境中要將運動目標(biāo)的邊緣和周圍其它目標(biāo)邊緣區(qū)分開來是非常困難的,遮擋問題是視覺跟蹤算法中又一難點問題,利用單攝像機解決遮擋問題也一直是視覺跟蹤領(lǐng)域中的熱點。而利用多攝像機可以在很大程度上解決這一問題,但正如前所述,多攝像機的應(yīng)用又會引入新的難題。
在視覺跟蹤研究中,準(zhǔn)確性包括兩個方面,一是指對運動目標(biāo)檢測的準(zhǔn)確性,另一個是指對運動目標(biāo)分割的準(zhǔn)確性,對運動目標(biāo)檢測準(zhǔn)確性的目的是盡量避免運動目標(biāo)虛檢和漏檢,從而提高對真實運動目標(biāo)的檢測概率。由于實際復(fù)雜環(huán)境中存在大量噪聲。至今已經(jīng)出現(xiàn)了上千種各種類型的分割算法,但由于尚無通用的分割理論,目前并沒有一種適合于所有圖像的通用分割算法。
一個實用的視覺跟蹤系統(tǒng)必須能夠?qū)崿F(xiàn)對運動目標(biāo)的實時跟蹤,這就要求視覺跟蹤算法必須具有快速性但是,視覺跟蹤算法處理的對象是包含巨大數(shù)據(jù)量的圖像,這些算法往往需要大量的運算時間,很難達到實時處理的要求,通常,簡單算法能夠?qū)崿F(xiàn)實時跟蹤,但跟蹤精度卻很差;復(fù)雜算法具有很高的跟蹤精度,實時性卻很差,一種通用的減小視覺跟蹤算法運算量的方法是利用金字塔分解或小波變換將圖像分層處理。
3 展望與結(jié)束語
3.1 展望
實現(xiàn)一個具有魯棒性、準(zhǔn)確性和快速性的視覺跟蹤系統(tǒng)是當(dāng)前視覺跟蹤技術(shù)努力的方向。但視覺跟蹤技術(shù)在這幾個方面中每前進一步都是非常困難的,因為該技術(shù)的發(fā)展與人的感知特性的研究緊密聯(lián)系在一起,由于目前對人的感知特性沒有一個主流的理論,其數(shù)學(xué)模型更是難以建立。同時,在計算機視覺中大多數(shù)問題是不確定的,這就更增加了視覺跟蹤技術(shù)發(fā)展的難度。但是,近幾十年來,數(shù)學(xué)理論方面取得了巨大的進步,因此合理的使用在數(shù)學(xué)理論方面的知識提高系統(tǒng)的性能能夠很好的解決視覺跟蹤問題。例如現(xiàn)在已經(jīng)應(yīng)用在諸多領(lǐng)域的模糊算法,神經(jīng)網(wǎng)絡(luò)等提高系統(tǒng)性能,簡化計算復(fù)雜度。
3.2 結(jié)束語
篇8
關(guān)鍵詞:圖像分割;閾值分割;Otsu算法
中圖分類號:TP312
在圖像處理、模式識別和計算機視覺領(lǐng)域,圖像分割對于許多圖像分析和處理的任務(wù)來說是一個基石。因為人們往往僅對圖像中的某些部分感興趣,所以希望將這些相關(guān)區(qū)域分離并提取出來以進行進一步的應(yīng)用,如進行特征提取和測量。圖像分割是解決此類問題的方法。圖像分割是把圖像分成各具特征的區(qū)域并提取出感興趣目標(biāo)的技術(shù)和過程。圖像分割技術(shù)是一項計算機領(lǐng)域里的經(jīng)典的研究課題,計算機視覺中的圖像理解包括目標(biāo)檢測、特征提取和目標(biāo)識別等,都依賴圖像分割的質(zhì)量。
因為分割質(zhì)量的好壞將直接影響圖像處理的后續(xù)工作的進行,所以對圖像分割的研究一直是圖像技術(shù)研究中的熱點和難點之一。到目前為止已經(jīng)出現(xiàn)了許多圖像分割技術(shù),如:基于閾值的分割方法、基于區(qū)域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。其中閾值分割算法是應(yīng)用在圖像分割領(lǐng)域的最流行的技術(shù)。閾值分割是最早提出的圖像分割方法之一,具有簡單、快速的優(yōu)點。閾值分割算法的基本思想是通過處于圖像灰度取值范圍之中的灰度閾值將圖像劃分成不同的區(qū)域,從而達到分割的目的,其中最常見的一種方法,是將圖像劃分為兩部分,即前景和背景。閾值分割的關(guān)鍵是閾值的選取。閾值分割算法具有悠久的歷史,并廣泛應(yīng)用于圖像分析與目標(biāo)識別等方面。常用的閾值分割算法有最小誤差法、最大類間方差法、P-tile法、雙峰法、灰度直方圖凹度分析法、最大熵法與Otsu方法等。
在這些閾值分割算法中,Otsu法是最流行的方法之一。由于Otsu法擁有計算簡單、實時性高、魯棒性強等優(yōu)點,所以被廣泛使用。Otsu法是由日本人大津首先提出的,也稱“大津閾值法”或“最大類間方差法”。該方法是基于圖像中前景和背景兩類別的可分離性提出的。在一些免費的或是商業(yè)的軟件上,如GIMP或是MATLAB,都采用Otsu法來進行圖像的自動閾值分割。在圖像閾值分割中,確定最佳的閾值t*往往是基于估計的位置和散度。像其他的方法一樣,Otsu方法采用取樣的方式和樣本分布的偏差來估計位置和散度。然而,如果這些圖像的分布是非常傾斜的或是有異常數(shù)據(jù)等情況出現(xiàn)時,Otsu分割算法提供的結(jié)果通常不令人滿意。為了解決這一問題,我們提出了一種基于中值的Otsu分割方法,并且它與原來的Otsu方法相比可以得到非常令人滿意的結(jié)果。
假設(shè)在灰度值為L的灰度圖像中,灰度值為i的像素個數(shù)用ni表示,總的像素個數(shù)用n表示;pi表示灰度圖像中灰度值i出現(xiàn)的頻率,則pi=ni/n。將圖像中的像素按灰度值用閾值t分成兩類,設(shè)為C0和C1,其中C0={0,1,…,t},C1={t+1,t+2,…,L-1}。
則這兩類像素出現(xiàn)的概率分別是:
ω0= pi= ω(t),ω1= pi=1- ω(t)
這兩類像素出現(xiàn)的均值分別是:
μ0= i = ,μ1= i =
圖像總均值表示為:
而且我們可以發(fā)現(xiàn):
設(shè)ω0和ω1代表前景和背景的概率。μ0,μ1,μT表示前景,背景和整個圖像的灰度值的平均值。設(shè)表示兩類的類間方差,則
最終,最佳閾值t*為
傳統(tǒng)的二維Otsu法是通過均值來確定最佳閾值,對于那些直方圖呈雙峰分布的圖像,該算法具有十分優(yōu)秀的分割效果。然而,因為均值的魯棒性較差,若直方圖是單峰的或是接近單峰的時候,亦或是有異常數(shù)據(jù)時會失敗。
我們知道,當(dāng)直方圖的分布是傾斜的,或當(dāng)有異常數(shù)據(jù)等情況出現(xiàn)時,中值比均值具有更強的魯棒性。所以我們用中值來代替原式中的均值,以嘗試獲得更好的閾值和分割結(jié)果。
原式中的μ0,μ1,μT可以被中值m0,m1,mT所替代,于是在C0和C1的類間方差可以重寫為
最優(yōu)的閾值t*為
在驗證本文的實驗中,傳統(tǒng)的Otsu方法和我們改進的Otsu方法都在Visual C++ 2008軟件上進行測試,應(yīng)用的計算機的CPU型號是AMD Athlon 7750 Dual-Core 2.7GHz,內(nèi)存是2G RAM,系統(tǒng)是Windows XP platform。通過實驗我們可以發(fā)現(xiàn)改進的Otsu方法得到的閾值分割的結(jié)果是令人滿意的,而傳統(tǒng)的Otsu方法得到的閾值分割的結(jié)果并不理想。
結(jié)論:在本文中,我們提出了一種基于中值的Otsu圖像閾值分割算法。傳統(tǒng)的二維Otsu方法對于雙峰分布的直方圖提供了令人滿意的結(jié)果,但是,如果直方圖是單峰的或是接近單峰時所得到的結(jié)果并不理想。我們知道,當(dāng)直方圖的分布是傾斜的,或當(dāng)有異常數(shù)據(jù)等情況出現(xiàn)時,中值比均值具有更強的魯棒性。在這樣的情況下,我們用中值取代均值來進行背景和前景以及整個圖像的Otsu法分割。與原來的Otsu方法相比,這種方法提供了更優(yōu)的閾值和令人滿意的閾值分割的結(jié)果。
參考文獻:
[1]W Niblack.An Introduction to Digital Image Processing[M].Prentice Hall,Englewood Cliffs,NJ,1986:115-116.
[2]J Sauvola and M Pietikainen.Adaptive Document Image Binarization[J].Pattern Recognition,2000,33(2):225-236.
[3]B Gatos,I Pratikakis and S J Perantonis.Adaptive Degraded Document Image Binarization[J].Pattern Recognition,2006,39(3):317-327.
[4]F Moghaddam and M Cheriet.A Multi-scale Framework for Adaptive Binarization of Degraded Document Images[J].Pattern Recognition,2010,43(6):2186-2198.
[5]C H Chou,W H Lin and F Chang.A Binarization Method with Learning-build Rules for Document Images Produced by Cameras[J].Pattern Recognition,2010,43(4):1518-1530.
[6]Y T Pai,Y F Chang and S J Ruan.Adaptive Thresholding Algorithm:Efficient Computation Technique Based on Intelligent Block Detection for Degraded Document Images[J].Pattern Recognition,2010,43(9):3177-3187.
[7]Chierr Hsing.Chou,Werr Hsiung Lin,F(xiàn)u Chang.A binarization method with learning build rules for document images produced by cameras[J].Pattern Recognition,2010,43(4):1508-1530.
篇9
關(guān)鍵詞:SIFT;相似性度量;圖像匹配
引言
在計算機視覺領(lǐng)域,圖像匹配仍然是當(dāng)前研究的熱點問題?;谔卣鞯钠ヅ浞椒╗1],因為根據(jù)圖像中趨于穩(wěn)定的少量特征進行匹配,使得運算速度快、匹配效果好,所以成為目前研究最多、應(yīng)用最廣泛的一種方法。但是,這種方法需要在圖像間進行遍歷性的匹配運算,存在計算量大,且精度不高的問題。
1999年,Lowe提出了SIFT(Scale Invariant Feature Transform)算法[2],該算法利用高斯差分在圖像的多尺度空間中快速求解高斯拉普拉斯空間中的極值點,加快了特征提取的速度,提取的SIFT特征對于圖像平移、縮放、旋轉(zhuǎn)具有不變性,并且對于仿射變換、視覺變化、光照變化有較強的穩(wěn)定性和很好的匹配魯棒性,所以被廣泛應(yīng)用于計算機視覺的圖像匹配、圖像檢索和模式識別等方面[3,5]。雖然SIFT 算法具有上述的優(yōu)點,但該算法首先要將彩色圖像灰度化,僅利用圖像的灰度信息和特征點的局部鄰域信息,忽略了圖像的顏色信息,導(dǎo)致不能識別圖像內(nèi)具有相似結(jié)構(gòu)的特征點。
文章提出基于SIFT的多特征相似性度量算法,首先對彩色壁畫圖像提取SIFT特征點與特征向量,然后對每個特征點提取HSI彩色特征,最后按定義的相似性度量公式計算兩個特征點之間的距離,確定二者是否匹配。
1 特征提取
1.1 SIFT特征提取
尺度空間極值點的檢測采用DOG方法,將一個像素點與它相鄰的26個點相比較,如果是最大值或最小值,就作為圖像中的一個特征點。以特征點為中心,在16×16的鄰域內(nèi),將采樣點與特征點的相對方向通過高斯加權(quán)后,分別歸入8個方向的梯度方向直方圖,最后獲得4×4×8的128維特征向量來描述一個SIFT特征點。
SIFT算法的兩個關(guān)鍵步驟是關(guān)鍵點檢測和關(guān)鍵點描述。在關(guān)鍵點檢測階段,大多是利用兩種不同的方法,即尺度不變檢測和致密采樣。文章采用致密采樣進行特征檢測,理由如下。一方面,尺度不變檢測器在描繪均勻信息時是低效的,而壁畫圖像中包含著這樣的信息。另一方面,在特征匹配時,通過致密采樣得到的關(guān)鍵點優(yōu)于隨機抽樣和尺度不變的探測器[6]。
SIFT算法首先將彩色圖像灰度化,提取的特征關(guān)注圖像的梯度信息,忽視了圖像的彩色信息。文章對彩色圖像提取特征,實驗發(fā)現(xiàn)圖像的誤匹配點中,存在著彩色信息不一致的問題。因此,文章對圖像既提取SIFT特征,又提取顏色特征,對多特征融合設(shè)計相似性度量方案,可以減少誤匹配率,提高匹配效果。
1.2 顏色特征提取
為了解決誤匹配中存在的SIFT梯度信息一致,彩色信息不一致的問題,我們在對特征點提取SIFT特征后,再次提取其顏色特征。由于RGB顏色模型只考慮圖像的亮度信息,而HSI顏色模型全面考慮圖像的亮度和顏色信息,因而在開發(fā)基于彩色描述的圖像處理算法中,HSI模型更為有用[7],文章提取HSI彩色特征。
HSI顏色模型中,H表示色調(diào),指的是人的感官對不同顏色的感受,描述純色的屬性;S表示飽和度,描述的是顏色的純度;I表示強度,描述的是顏色的明亮程度。
常用的最近鄰方法原理是,對于基準(zhǔn)圖像中的每個特征點,在待匹配圖像中尋找距離最近的特征點,然后形成一組匹配對。因為最近鄰獲得的匹配對中存在大量的誤匹配,所以Lowe在論文[8]中對于基準(zhǔn)圖像中的每個特征點,在待匹配圖像中尋找距離最近和次近的兩個特征點,當(dāng)這兩個距離的比值小于預(yù)設(shè)的閾值時,才認為找到了一組正確的匹配對,這樣消除了大量的誤匹配,取得了不錯的匹配效果。文章設(shè)閾值為thr,且0
3 實驗結(jié)果及分析
為了觀察算法性能,我們從互聯(lián)網(wǎng)上尋找了兩張有重疊部分的壁畫圖片進行了實驗。圖像如圖1所示。采用Matlab7.7.0編程,運行在AMD A6-3400M CPU 1.4GHZ和4G內(nèi)存的PC機上,Windows 7.0操作系統(tǒng)。
實驗首先尋找圖像的SIFT特征點,然后提取特征點的SIFT特征和HSI特征,再對圖1a和圖1b按公式(9)進行相似性度量,再分別用歐式距離和卡方距離作為相似性度量,并且thr分別選用0.5,0.6,0.7,0.8進行特征對提純。結(jié)果表明,匹配過程在使用同樣的閾值時,三種相似性度量方法中,所得到的匹配正確率相同,而匹配時間不同,按公式(9)計算的距離稍快一些。隨著thr值的增大,所得匹配對數(shù)減少,當(dāng)thr取值為0.6時,具有較好的匹配結(jié)果。圖2為thr取值為0.6時的匹配結(jié)果。
另外,實驗同時表明,對于圖像分別提取SIFT特征和HSI特征,如果僅按SIFT特征或HSI特征計算相似性,所得到的匹配正確率都低于兩個特征按公式(9)計算相似性的情況。
因此,對圖像提取SIFT特征和HSI特征,按我們定義的相似性度量計算方法,確實提高了圖像匹配的效率。
4 結(jié)束語
文章采用的算法對彩色壁畫圖像同時提取SIFT特征和HIS彩色特征,有效地去除了梯度信息一致而彩色信息不一致產(chǎn)生的誤匹配。通過定義的相似性度量公式,在計算兩個特征點之間是否匹配時,速度更快一些。由于SIFT 算法計算量大,算法復(fù)雜,提高圖像匹配的實時性,將是下一步的研究工作。
參考文獻
[1]ZHU Q,WU B,XU Z.Seed point selection method for triangle constrained image matching propagation[J].IEEE Geoscience and Remote Sensing Letters,2006,3(2):207-211.
[2]LOWE D G.Object recognition from local scale-invariant feature[C]// Proc.the Seventh IEEE International Conference on Computer Vision.Corfu,Greece: IEEE Press,1999:1150-1157.
[3]張書真,宋海龍,向曉燕,等.采用快速SIFT算法實現(xiàn)目標(biāo)識別[J].計算機系統(tǒng)應(yīng)用,2010,19(6):82-85.
[4]王瑞瑞,馬建文,陳雪.多傳感器影像配準(zhǔn)中基于虛擬匹配窗口的SIFT算法[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2011,36(2):163-166.
[5]鐘金琴,檀結(jié)慶,李瑩瑩,等.基于二階矩的SIFT特征匹配算法[J].計算機應(yīng)用,2011,31(1):29-32.
[6]K.Mikolajczyk,C.Schmid. A performance evaluation of local descriptors [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(10):1615-1630.
[7]何川.高壓輸電線路視頻監(jiān)控技術(shù)研究[D].北京:北京交通大學(xué),2012.
篇10
關(guān)鍵詞:機器人視覺;攝像機自標(biāo)定;三維重建;零空間投影;RQ分解
中圖分類號:TP242.6+2文獻標(biāo)識碼:A文章編號:1009-3044(2008)17-21529-04
三維形狀重建是計算機視覺中的最重要任務(wù)之一[1-2]。從已標(biāo)定的單視圖或多視圖重建目標(biāo)三維形狀已相對成熟[1-5],但是,從未標(biāo)定的單視圖或多視圖重建三維形狀仍是一個值得研究的課題。此時,必須在線完成攝像機自標(biāo)定。攝像機自標(biāo)定首先由Hartley[6]和Faurgeras[7]在1992年提出。從此它成為計算機視覺界的一個熱門課題。線性自標(biāo)定[8-12]因簡單有效而成為流行技術(shù)。但它對視圖個數(shù)和歷經(jīng)的三維運動往往有較多的限制,影響了其應(yīng)用范圍。另外,當(dāng)模型形狀先驗已知時,如何有效地充分利用該先驗信息提高自標(biāo)定和三維重建的速度和精度,仍是一個有待回答的問題。本文基于零空間投影和RQ分解,開發(fā)從目標(biāo)單視圖或多視圖同時完成攝像機自標(biāo)定和目標(biāo)三維重建的線性算法,該算法原則上對歷經(jīng)的三維運動沒有限制,算法也較簡捷。實驗演示了噪聲強度、點數(shù)和幀數(shù)對算法性能的影響。理論分析和實驗數(shù)據(jù)表明,該算法具有快速高效、簡單實用、抗噪能力較強的優(yōu)點。
1 理論分析
1.1 成像模型
假設(shè)攝像機成像服從針孔成像的透視投影模型,則第i幀(i=1,2,...,q, q為幀數(shù))的第j個(j=1,2,...,N,N為點數(shù))三維點Xi,j在攝像機坐標(biāo)系中的坐標(biāo)Pi,j及相應(yīng)的數(shù)字坐標(biāo)Pi,j(d)與其二維像點的模擬齊次坐標(biāo)mi,j=[xi,j yi,j l]T(上標(biāo)T標(biāo)記轉(zhuǎn)置運算)及相應(yīng)的數(shù)字齊次坐標(biāo)mi,j(d)=[xi,j(d) yi,j(d) l]T服從透視投影公式
(1)
其中,深度Zi,j是Pi,j的第3分量,攝像機內(nèi)參數(shù)矩陣
這兒,(xc,yc) 是圖像主點,(fx,fy)是圖像水平軸和垂直軸的尺度因子, s是畸變因子。實際上,該內(nèi)參數(shù)矩陣完成以象素計的數(shù)字坐標(biāo)系與以攝像機焦長f計的圖像坐標(biāo)系之間的轉(zhuǎn)換,即
mi,j(d)=Kmi,j (3)
1.2 三維幾何變換和單應(yīng)性變換
假設(shè)從目標(biāo)從模型到第i幀圖像歷經(jīng)了三維運動(Ri,Ti) ,其中,Ri為三維旋轉(zhuǎn)矩陣,Ti為三維平移矢量,則三維點Xi,j的模型位置Pj(0)與其第i幀位置Pi,j滿足三維幾何變換
1.7 討論
顯然,該算法有解且有唯一解的條件是:3(N-3)×N維矩陣Ai的秩等于N-1,考慮到中心化算子P1N是個正交投影算子,它具有降秩1的功能,因此條件變成3(N-4)≥N-1即點數(shù)N≥6。這意味著該線性算法至少要6個特征點。節(jié)2的實驗表明,N<6時無唯一解和N≥6時有解且有唯一解。另外,點數(shù)的增多確實可改進算法性能。
經(jīng)過比較,不難發(fā)現(xiàn),新算法有五個鮮明的特點。
(1)現(xiàn)有算法往往有8點以上的要求,而新算法的需要點數(shù)已達到最小值6。因為5個內(nèi)參數(shù)加上6個三維運動參數(shù)有11個自由度,而每個點僅能提供2個自由度。
(2)現(xiàn)有算法往往不能有效地利用先驗?zāi)P托畔?,而新算法能有效地充分利用先驗已知的模型形狀陣信息。這對提高算法性能具有顯著作用。
(3)現(xiàn)有算法往往在自標(biāo)定之后才完成深度矢量估計,新算法卻是在在自標(biāo)定之前完成深度矢量估計。這有利于提高深度復(fù)原的精度,對重視深度復(fù)原的應(yīng)用場合尤其重要。
(4)現(xiàn)有算法往往對歷經(jīng)的三維運動有限制,新算法無任何限制。
(5)現(xiàn)有算法往往只能用于多視圖情況,不能用于單視圖情況;而新算法既能用于多視圖情況,也能用于單視圖情況,只需令上述算法中的幀數(shù)q=1 即可并未單視圖情況的線性算法。
2 實驗
2.1 實驗步驟
為了定量分析算法的統(tǒng)計性能,用計算機仿真數(shù)據(jù)進行了蒙特卡洛實驗、每次實驗對仿真生成的多視圖特征點集組成的數(shù)據(jù)運行所開發(fā)的算法,并計算各種誤差性能;然后,用100次實驗的誤差性能的平均值作為相應(yīng)的誤差性能的數(shù)學(xué)期望值。
算法輸入數(shù)據(jù)的生成過程是:首先,用N個均勻分布于立方體{ (-2, 2), (-2, 2), (1, 2) }內(nèi)三維數(shù)據(jù)集合組成三維點集,該點集經(jīng)q個由三維旋轉(zhuǎn)和三維平移構(gòu)成的幾何變換生成q幀三維點集,再經(jīng)透視投影后得到多視圖特征點集的模擬齊次坐標(biāo)集合,它們用攝像機內(nèi)參數(shù)陣變換后,舍入取整生成相應(yīng)的多視圖特征點集的數(shù)字齊次坐標(biāo)集合。該集合就是算法的輸入數(shù)據(jù)。
為考察算法抗噪能力,輸入數(shù)據(jù)必須加入強度可控的噪聲,考慮到數(shù)字坐標(biāo)已整數(shù)化,不宜加噪,我們用每維均勻分布于[-Am, Am]且互相獨立的二維噪聲疊加到多視圖特征點集的二維模擬坐標(biāo)上,其中,強度Am可程控然后用攝像機內(nèi)參數(shù)陣變換后,舍入取整生成相應(yīng)的多視圖特征點集的數(shù)字齊次坐標(biāo)集合,其中,強度Am由運行程序控制,它從0.001逐步增加到0.032。多視圖的圖像尺寸是1024×1024。
算法精度用所有估計項目的以百分比計的相對誤差衡量。例如,用||ΔK||/||K||的統(tǒng)計平均值總體度量自標(biāo)定誤差,其中, ΔK=K-K,K是設(shè)定的內(nèi)參數(shù)陣,K是內(nèi)參數(shù)陣K的估計,矩陣范數(shù)采用Frobenius范數(shù),矢量范數(shù)采用歐幾里得范數(shù)。其它各項誤差類似地定義,但是,三維運動要在取幀平均后再取統(tǒng)計平均,建模要在取點平均后再取統(tǒng)計平均,形狀重建要在取點平均和幀平均后再取統(tǒng)計平均。
2.2 單視圖實驗結(jié)果
表1示出了單視圖情況下、當(dāng)點數(shù)N=6時,噪聲強度Am對算法性能的影響??梢?,即使算法僅使用6點,仍能在所有加噪情況中,三維運動重建和三維形狀重建的相對誤差都小于5.93%, 而在中小強度(不超過0.0012)噪聲情況時,相對誤差都不大于1.50%以下。
表3示出了多視圖情況下,當(dāng)幀數(shù)q=6和點數(shù)N=24時,噪聲強度Am對算法性能的影響??梢钥闯?,在所有加噪情況中,攝像機內(nèi)參數(shù)自標(biāo)定的相對誤差都不大于0.17%,三維重建相對誤差都小于0.17%,而在中小強度(不超過0.0012)噪聲情況時,自標(biāo)定相對誤差不大于0.06%,三維重建相對誤差都不大于0.29%。
3 結(jié)束語和展望
通過對中心化模型形狀陣的RQ分解得到其零空間的標(biāo)準(zhǔn)正交基,然后把中心化后的從模型形狀陣到多視圖數(shù)據(jù)陣的單應(yīng)性變換方程投影到該零空間,建立了一個精確求解多幀深度矢量集合的方法,然后用中心化單應(yīng)性變換方程求取多幀單應(yīng)性矩陣的最小二乘最小范數(shù)估計,最后用RQ分解計算攝像機內(nèi)參數(shù)陣和多幀三維旋轉(zhuǎn)矩陣,并進而完成目標(biāo)三維重建。這樣,通過充分利用包含于先驗已知的模型形狀陣和后驗提供的多幀數(shù)據(jù)陣中的所有信息,開發(fā)了一個能同時完成攝像機自標(biāo)定和目標(biāo)三維重建的線性算法。
該算法不同于已有線性算法的五個鮮明特點是:1)所需點數(shù)達到了可能的最小值6;2)能很有效地利用寶貴的先驗?zāi)P托畔ⅲ?)在自標(biāo)定之前完成深度矢量估計;4)對歷經(jīng)的三維運動沒有限制;5)既能用于多視圖情況也能用于單視圖情況。
可以預(yù)期,使用零空間投影技術(shù)也能推廣應(yīng)用于模型形狀陣未知時的多視圖自標(biāo)定和三維重建。該算法正在研究開發(fā)中,將另行著文討論。
參考文獻:
[1] 馬頌德,張正友.計算機視覺計算理論與算法基礎(chǔ)[M].科學(xué)出版社,1998.
[2] 章毓晉.圖像理解與計算機視覺[M].清華大學(xué)出版社,2000.
[3] Oliensis, J., A Multi-frame structure from motion algorithm under perspective projection[C].IEEE Workshop on Perception for Mobile Agents, 1998, pp. 49-577.
[4] Thomas, J. I. and Oliensis J., Dealing with noise in multiframe structure from motion[J], CVIU 76, 1999, pp. 109-124.
[5] Chiuso, A., Brockett, R. and Soatto S., Optimal structure from motion: local ambiguities and global estimates[J], IJCV 39(3), 2000, 195-228.
[6] Hartley, R., Estimation of relative camera positions for uncalibrated camera[C], In: Proc. European Conference on Computer Vision, NLCS 588, Springer-Verlag, 1992, 579~587
[7] Faurgeras, O. D., What can be seen in three dimensions with an uncalibrated stereo rig[C], In: Proc. European Conference on Computer Vision, NLCS 588, Springer-Verlag, 1992, 563~578
[8] 吳朝福,胡占義.攝象機自標(biāo)定的理論與算法[J].計算機學(xué)報,2001, 24(11):1121~1135.
[9] 吳朝福,胡占義.線性確定無窮遠平面的單應(yīng)性矩陣和攝象機自標(biāo)定[J].自動化學(xué)報,2003,28(4):488~496.
[10] Yang, Z. -G., Ren, L., SVD-based camera self-calibration and 3-D reconstruction from single-view[C],’ Proceedings of 2004 International Conference on Machine Learning and Cybernetics, Vol. 7 of 7, 4090-4095, Aug. 2004.
[11] Yang, Z. -G., Ren, L., A new algorithm for linearly reconstructing the infinite homography matrix and intrincic parameter matrix of a camera[C], 7th International Conference on Signal Processing Proceedings, Vol. II of III, 1247-1251, Aug. 2004.
熱門標(biāo)簽
計算機論文 計算機畢業(yè)論文 計算機技術(shù)論文 計算機教育論文 計算機專業(yè)論文 計算機基礎(chǔ)論文 計算機教學(xué)論文 計算機應(yīng)用論文 計算化學(xué)論文 計算機專業(yè)畢業(yè)論文 心理培訓(xùn) 人文科學(xué)概論