計算機視覺概念范文
時間:2023-12-18 17:57:23
導語:如何才能寫好一篇計算機視覺概念,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵字:大數(shù)據(jù);數(shù)據(jù)挖掘;分類算法;概念漂移
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)09-0011-03
Design and Implementation of Flow Mining Algorithm and Resistance Concept Drift System Based on Storm Platform
LU Yuan-fu, PENG Tian-ci, Ji Kai-yang, TAN Hai-yu
(College of Computer Science, Nanjing University of Posts and Telecommunications, Nanjing 210046, China)
Abstract:With the rise of cloud computing and Internet of things(LOT) technology,stream data widely exist in all fields as a new mega data form.This article propose a stream-classifying algorithm and system oriented to big data,which is based on DCP (Distributed Computing Platform).Parallelize windows and CVFDT algorithm are both adopted.We use a DCP to test whether the mutation concept drift happened in data stream,so as to change the inflow of modeling sample data adaptively.The accuracy and efficiency of stream data model will be improved at last.
Key words: big data; data mining; classifying algorithm; concept drift
1 背景
隨著云計算、互聯(lián)網(wǎng)+等技術(shù)的快速發(fā)展,生產(chǎn)制造控制、無線通信網(wǎng)絡、電子商務交易、金融信息監(jiān)控等領(lǐng)域形成了高速、海量、動態(tài)的數(shù)據(jù)流,而有效的對數(shù)據(jù)流進行處理并從中挖掘有價值的信息就顯得尤為重要。
在流數(shù)據(jù)分類挖掘中,概念漂移是指流數(shù)據(jù)特性的改變使得目標分類模型隨著時間的變化而變化。針對流數(shù)據(jù)挖掘過程中的概念漂移問題,Hulten等人提出了概念自適應快速決策(Concept-adaptingVeryFastDecisionTree,CVFDT)算法[1]。CVFDT 算法是一種擴展了VFDT算法用以解決概念漂移問題的高效算法,通過在原有的算法基礎上改進添加滑動窗口使得建立決策樹模型的數(shù)據(jù)流能夠不斷實現(xiàn)更新,從而保證在概念漂移的數(shù)據(jù)流中模型建立的準確率。
本文主要討論研究了基于分布式實時計算系統(tǒng)STORM平臺的去概念漂移算法及系統(tǒng)的設計與實現(xiàn),在流挖掘過程中,利用分布式平臺的特點采用并行化窗口方案來檢測數(shù)據(jù)流中是否發(fā)生概念漂移,并行化窗口bin-win根據(jù)數(shù)據(jù)流中的概念漂移自適應調(diào)整窗口大小,從而自適應的改變建模樣本數(shù)據(jù)的流入,提高了流數(shù)據(jù)的準確性和高效性。
2 算法分析與實現(xiàn)
2.1 CVFDT算法
2.1.1 CVFDT算法的原理
概念自適應快速決策樹(CVFDT)[2]是一種擴展了VFDT算法用以解決概念漂移問題的高效算法,具有類似VFDT的HT樹生成過程,在保持了VFD的速度和精度的前提下,能夠處理樣本產(chǎn)生過程中所出現(xiàn)的概念漂移問題[3]。CVFDT對樣本維持一個滑動窗口,并能夠動態(tài)改變窗口的大小。CVFDT算法過程包括CVFDTGrow過程、ForgetExample過程、RemoveExample過程和CheckSplitValidity過程。算法主要思想是先根據(jù)當前的數(shù)據(jù)構(gòu)建臨時決策樹,然后并不斷地獲取新的數(shù)據(jù)去優(yōu)化已建立的決策樹。若在某個時候出現(xiàn)了概念漂移,則算法會在出現(xiàn)漂移的節(jié)點上建立一個新的替代子樹。當替代子樹的分類效果優(yōu)于當前的決策子樹時,就直接取而代之。
2.1.2 CVFDT算法抵抗概念漂移問題
概念漂移表示目標變量的統(tǒng)計特性隨著時間的推移以不可預見的方式變化的現(xiàn)象[4]。在流數(shù)據(jù)分類挖掘中,也指流數(shù)據(jù)特性的改變使得目標分類模型隨著時間的變化而變化。CVFDT周期性的掃描HT生成樹的內(nèi)部節(jié)點來檢驗原先的分裂節(jié)點是否依然是最優(yōu)的分裂屬性節(jié)點。當該節(jié)點發(fā)生了概念漂移,最優(yōu)分裂屬性節(jié)點已不再是原先的Xa。CVFDT算法會重新尋找最佳測試屬性,新的屬性不直接取代原有的測試屬性,而是成為一個替代子樹的根節(jié)點,并且依據(jù)該根節(jié)點建立替代子樹。如果后繼滑動窗口的樣本在替代子樹上有較高的分類精度,則替代子樹便取代原先的決策樹,以維持滑動窗口的樣本和更新后的決策樹的一致性。
2.2 基于STORM平臺的CVFDT算法實現(xiàn)
2.2.1 CVFDT并行化窗口抵抗概念漂移算法設計
本小節(jié)討論以STORM作為分布式實時計算平臺,結(jié)合CVFDT流挖掘算法,解決數(shù)據(jù)流的概念漂移問題,從而提高模型建立的準確性?;趕torm分布式平臺的并行化窗口抵抗概念漂移方案,通過并行化窗口bin-win對數(shù)據(jù)流實時檢測實現(xiàn)概念漂移抵抗[5-6],窗口調(diào)整流程圖如圖1所示。
從流程圖中,可以看到并行化窗口根據(jù)數(shù)據(jù)流中的概念漂移自適應調(diào)整窗口大小,當窗口檢測數(shù)據(jù)流未發(fā)生概念漂移時,則增大窗口中的樣本量,反之,則減小并行化窗口的大小,有利于較快的適應概念漂移。
其中,檢測是否發(fā)生概念漂移模塊,通過對HT樹中的非葉子節(jié)點的替代子樹調(diào)用CheckSplitValidity函數(shù),計算屬性增益,從而判斷是否發(fā)生概念漂移,流程圖如圖2 所示。
2.2.2 CVFDT算法實現(xiàn)與分析
在現(xiàn)實生活中,大部分數(shù)據(jù)都是非平穩(wěn)分布的,數(shù)據(jù)流根據(jù)時間的推移不斷發(fā)生變化,即發(fā)生了概念漂移[7]。CVFDT算法通過并行化窗口檢測數(shù)據(jù)流是否發(fā)生概念漂移,窗口太大不能快速有效的抵抗數(shù)據(jù)流中的概念漂移,窗口太小影響模型建立的時間和模型一段時間內(nèi)的穩(wěn)定性,如圖3所示在建立決策樹模型時檢測到概念漂移,則減小窗口的大小。當數(shù)據(jù)流穩(wěn)定時,則增大窗口的大小,從而有效建立準確的決策樹模型。
3 系統(tǒng)實現(xiàn)
3.1 系統(tǒng)總體架構(gòu)
CVFDT算法在STORM平臺上的實現(xiàn)方式有兩種,一種是垂直并行化實現(xiàn),一種是結(jié)合隨機森林的實現(xiàn),該抵抗概念漂移系統(tǒng)的設計主要基于垂直并行化的實現(xiàn)方式。系統(tǒng)包括三大模塊:并行化窗口模塊、抵抗概念漂移模塊、決策樹建立更新模塊。系統(tǒng)整體框架如圖4所示。
3.2 系統(tǒng)界面
抵抗概念漂移流分類挖掘系統(tǒng)參數(shù)設置界面如圖5所示,用戶輸入訓練樣本、更新樣本、測試樣本以及樣本所在文件的具體地址。點擊確定之后傳輸相應參數(shù),CVFDT算法執(zhí)行結(jié)束之后,彈出該算法挖掘結(jié)果顯示窗口,姐main如圖6所示,結(jié)果展示界面輸出當前決策樹以及其評價結(jié)果,以及未分類樣本的標記結(jié)果[8]。
4結(jié)束語
本文以分布式實時計算STORM平臺,設計并實現(xiàn)CVFDT算法,解決在流數(shù)據(jù)挖掘過程中出現(xiàn)的概念漂移現(xiàn)象,保證了流數(shù)據(jù)分類挖掘模型的準確性和高效性。CVFDT算法對樣本數(shù)據(jù)維持一個滑動窗口,在新樣本到達的時候更新節(jié)點上的統(tǒng)計信息,并在樣本滑出窗口的時候肩上其對應的統(tǒng)計信息。STORM平臺保證算法能夠提前預測數(shù)據(jù)流中的概念漂移,并實時更改窗口的大小,提高決策模型的準確性。
本文設計實現(xiàn)的算法與系統(tǒng)僅僅只是數(shù)據(jù)挖掘的一個方面,隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)流會越來越大,并且會不斷變化,這就影響到了決策模型的建立與改善,因此,如何設計準確的算法和平臺來徹底解決流數(shù)據(jù)的概念漂移仍然需要進一步的研究。
參考文獻:
[1] Hulten G, Spencer L, and Domingos P. Mining time-changing data streams[C]//Proceedings of the Seventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, California, USA, 2001: 97-106.
[2] Ganti V, Johannes Gehrke, Raghu Ramakrishnan. Mining Data Streams under Block Evolution. [J].SIGKDD Explorations, 2002, 3(2).
[3]Street W N, Kim Y S. A streaming ensemble algorithm (SEA) for large-scale classification[C]//Proceedings of the seventh International Conference on Knowledge Discovery and Data Mining. San Francisco, USA, 2001: 377-382.
[4] Mitchell T M. Machine learning[M]. New York City: McGraw-Hill, 1997.
[5] 楊雅雙. 關(guān)聯(lián)規(guī)則的并行挖掘算法研究[D]. 西安:西安科技大學,2010.
[6] 唐耀紅. 數(shù)據(jù)流環(huán)境中關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究[D]. 北京:北京交通大學,2012.
篇2
【關(guān)鍵詞】Opencv;計算機視覺技術(shù);系統(tǒng);研究
隨著計算機技術(shù)的快速發(fā)展,計算機設備逐漸被應用到社會生活的各個方面,尤其是在當前計算機視覺技術(shù)和圖像處理技術(shù)快速發(fā)展的時期,各個科技領(lǐng)域中的計算機視覺技術(shù)已經(jīng)逐漸成熟。計算機視覺技術(shù)主要是利用計算機智能化來替代人眼,即對于客觀存在的三維立體化世界的理解和識別,整個實現(xiàn)過程均是以計算機技術(shù)作為基礎。隨著計算機視覺技術(shù)的不斷發(fā)展,現(xiàn)今其已逐漸成為了一門神經(jīng)生理學、計算機工程、信號學、物理學、應用數(shù)學等綜合性學科。計算機視覺技術(shù)系統(tǒng)其在高性能計算機基礎之上來實現(xiàn)對大量數(shù)據(jù)的獲取,并且通過智能算法來對獲取數(shù)據(jù)進行處理,從而完成對數(shù)據(jù)集成。
一、視頻中運動物體檢測原理
對于視頻中的運動物體檢測主要分為兩中方法,其一為宏觀檢測法;其二為微觀檢測法。宏觀檢測法是對獲得的整幅圖像進行檢測,而微觀檢測法則是對所需要的區(qū)域進行圖像檢測。視覺技術(shù)在檢測運動物體的時候,首先對圖像進行采集,并對采集的信息數(shù)據(jù)進行預處理,將圖像進行分割,然后分別提取運動物體的影象,從而實現(xiàn)參數(shù)的更新。圖像采集過程中采用背景差分法,實現(xiàn)對背景圖像的提取,其通過一定算法采用人為手段獲取沒有背景的圖像。另外在進行運動物體檢測的時候還可以采用幀間差分法,其主要是實時獲取幀圖,然后實現(xiàn)一幀一幀圖像比值的比較,從而獲取具有差值的圖像。運動物體進行檢測的時候需連續(xù)獲取幀圖,將這些幀圖組合起來,其實就是物體的運動軌跡,然后同分割技術(shù)就能勾勒出物體的輪廓。隨著計算機視覺技術(shù)的不斷深入研究,發(fā)現(xiàn)此兩種方法單獨使用仍然存在的一些缺點,于是研究人員將二種檢測方法進行融合,形成一種綜合檢測方法。綜合檢測法將兩者檢測方法的優(yōu)勢進行了融合,并將其靈活的應用到了生產(chǎn)和生活之中,取得了十分不錯的效用。
二、基于Opencv的計算機視覺技術(shù)探究
(一)基于Opencv的運動物體檢測
運動物體在進行檢測的時候,基于Opencv的檢測原理主要為:根據(jù)物體某項特定信息,例如,顏色、輪廓、性狀等,在復雜背景中利用這些特定的信息將物體分離出來。整個圖像的分離過程首先是進行視頻流捕捉,然后是進行視頻的格式轉(zhuǎn)換,再將圖像進行預處理,從而提取前景物體,減少環(huán)境因素對圖像處理的誤差,最后根據(jù)物體特征提取,并完成對運動物體的跟蹤。從圖像中提取所需的目標物體,其實質(zhì)就是對整個屋里輪廓進行檢測和分割,根據(jù)每個圖像的幀差異來進行提取。
(二)基于Opencv圖像預處理
視覺技術(shù)應用于復雜的環(huán)境之中,由于存在著光照的變化,其場景中所出現(xiàn)的環(huán)境因素對視頻采集設備性能影響很大。環(huán)境因素會使得獲取的圖像信息的質(zhì)量降低,并且在圖像中無法避免的存在著噪點,這對于運動物體的檢測和圖像采集會造成很大的影響。當獲取視頻幀圖像之后需對其數(shù)據(jù)進行預處理,通常有平滑度濾波處理、圖像填充、圖像背景更新等。
1.平滑度濾波處理
由于在進行視頻圖像采集的時候存在著噪點,那么我們就需要對其進行噪點處理,以求減小噪聲。濾波平滑度濾波處理,其具有線性和非線性兩種方式,其中線性方式進行處理器運算簡單、運算速度快,但是在進行處理之后的圖像都會呈現(xiàn)不清晰的情況。而非線性方式盡心給處理之后,雖然能夠很好的減小噪點,確保信號的局部特點,但是其運算的速度會較慢。
2.圖像填充
對于幀圖像進行處理,通常采用檢測邊緣填充法或者是腐蝕膨脹法來完成,其中填充法是指當檢測出目標物體之后,利用邊緣檢測方法來對物體進行辨識,然后利用形態(tài)學的漫水填充法進行填充。圖像的腐蝕膨脹則主要是由于攝像機的性能等問題造成的。
3.實時背景更新
在進行圖像差分之前,需要對背景圖樣進行確定,并且需要對其進行初始化處理。以方便以后在進行檢測時候能夠?qū)崟r背景圖進行差分計算,只有這樣,才能夠獲得極佳的前景效果。在進行圖像差分時,首先需要根據(jù)指定法來確定第一幀背景的圖像,并將其指定為第一張背景圖片,然后在檢測過程中根據(jù)算法對背景實施更新。整個圖像在進行更新時,其主要的流程為:判斷并讀取圖像是否為第一幀;將Opencv處理的圖像轉(zhuǎn)化為單通道灰度值;將實時采集的圖像進行高斯平滑度處理,去除噪點;最后使用形態(tài)學濾波處理噪點。
(三)提取前景運動物體圖像
檢測運動物體的時候,只有在檢測流程中確保精確度,才能夠獲取滿意的前景跟蹤效果。此過程中主要分為兩個步驟,第一步為二值化圖像之后進行分割;第二步,圖像分析前處理,進行充分填充,確保前景圖的完整性。其中,前景圖的提取主要分為下面幾個步驟:首先對前景圖像和背景圖像進行差分,然后對差分的圖像進行二值化,再對背景中的前景圖像邊緣進行檢測,根據(jù)輪廓進行填充圖像。由于攝像頭存在于不同的場景和環(huán)境之中,不論是室外或者是室內(nèi)隨著場景的變化都會對圖像的采集產(chǎn)生影響。那么在前景圖中提取目標就需要在檢測系統(tǒng)中采用有效手段來完成背景實時更新。
閥值二值化分割法可以對檢測的物體進行前景和背景差圖分割,從而使目標物體能夠分離出圖像,且閥值分割先要確定每個像素的點是否處于灰度范圍值之內(nèi)。將圖像中的像素灰度與確定的閥值進行比較,其結(jié)果解釋所有像素點分為2類,一類像素的灰度小于閥值,另外一類就是大于閥值。閥值二值化分割時,確定分割的閥值T,然后分割圖像。選取合適的閥值進行分割,可以有效的減少光照因素影響,常用的動態(tài)閥值主要有直方圖來法與最大類方差法這另種分割方法。
三、計算機視覺三維技術(shù)
計算機視覺技術(shù)的核心為分割問題、運動分析、3D立體場景重構(gòu)等,立體視覺主要是從多幅圖像的參照中獲取目標物體的三維幾何信息。計算機視覺所模擬出的3D立體畫面只需要攝像機從不同的角度同一時間針進行圖像捕獲,將2D信息進行3D重構(gòu),進而將計算機程序重建于真實的三維場景之中,以恢復物體的真實空間信息。
(一)視覺系統(tǒng)
視覺系統(tǒng)捕獲圖像的過程,實則可以看成為對大量信息進行處理過程,整個系統(tǒng)處理可以分為三個層次,其一,理論層次;其二,描述層次;其三,實現(xiàn)層次。在攝像機視覺系統(tǒng)之中,輸入的是2D圖像,但是輸出為3D信息,而這就可以實現(xiàn)對圖像的位置、距離等信息的如實描述。視覺系統(tǒng)分為三個進階層次,第一階段為基礎框架;第二階段為2.5D表達;第三階段為三維階段。在第二階段中實現(xiàn)的2.5D表達,其原理是將不完整的3D圖像信息進行表達,即以一個點為坐標,從此點看去某一些物體的部分被遮擋。第三階段的三維階段,則是人眼觀察之后可以從不同的角度來觀察物體的整體框架,從而實現(xiàn)了將2.5D圖像信息的疊加重合運算,進一步處理之后得到了3D圖像。
(二)雙目視覺
人們從不同角度觀看同一時間內(nèi)的同一物體的時候,可以利用算法測量物體間的距離。此法被稱為雙目立體感覺,其依據(jù)的原理是視覺差原理,利用兩臺攝像機或者一臺攝像機,對兩幅不同的圖像進行不同角度觀察,并且對其觀察的數(shù)據(jù)進行對比分析。實現(xiàn)雙目立體視覺與平面視覺圖像獲取,其主要的步驟為:
(1)圖像獲取
從兩臺不同的攝像機,捕獲幀圖像,由于環(huán)境因素會造成圖像差異困難。為了更好的跟蹤目標、檢測,當捕獲圖像之后,需要對圖像進行預處理。
(2)攝像標定方式
獲得真實坐標系中的場景點中的與平面成像點占比見的對應關(guān)系,借用三維立體空間中的三維坐標,標定之后確定攝像機的位置以及屬性參數(shù),并建立起成像的模型。
(3)特征提取方式
所謂的特征提取方式主要是為了提升檢測、跟蹤目標的準確性,需要對目標物體進行特征提取,從而實現(xiàn)對圖像分割提取。
(4)深度計算
深度信息主要是根據(jù)幾何光學原理,從三維世界進行客觀分析,因為距離會產(chǎn)生不同的位置,會使得成像位置與兩眼視網(wǎng)膜上有所不同。簡單來說,客觀景物的深度可以反映出雙目的視覺差,而利用視覺差的信息結(jié)合三角原理進行計算,可呈現(xiàn)出深度的圖像信息。
(三)攝像機模型
攝像機在標定過程中確定了其建立的基礎為攝像機的模型,攝像機模型在標定過程中關(guān)系到三個不同坐標系的轉(zhuǎn)換,分別為2D圖像平面坐標系、攝像機自身坐標系以及真實的世界坐標系。攝像機在攝像的時候起本質(zhì)是2D圖像坐標轉(zhuǎn)換,首先要定義攝像機的自身坐標系,將坐標系的原點設置為光心,X、Y、Z成立三維坐標系。其次則是建立平面的圖像坐標系,用以透視模型表示,其原點也在廣心的位置,稱之為主點。實際應用中,物理的距離光心的位置d≠f焦距,而且會遠遠大于焦距,為了解決如此問題就提出了平面概念。在光軸z上設置一個虛擬的圖像平面,然后在此位置于平面關(guān)于光心對稱。接著,在設置的虛擬2D坐標系中,光軸和原點重合,并且攝像機與垂直平面的垂直方向相同,真實圖像上的點影射到攝像機坐標系。
(四)3D重構(gòu)算法
視頻流的采集,主要是采用Kinect設備、彩色攝像頭、紅外發(fā)射攝像頭、紅外接收攝像頭。使用微軟提供API控制Kinect設備,在操作之前需調(diào)用NUI初始化函數(shù),將函數(shù)的參數(shù)設置為用戶信息深度圖數(shù)據(jù)、彩色圖數(shù)據(jù)、骨骼追蹤圖數(shù)據(jù)、深度圖數(shù)據(jù)。上述的視頻流的打開方式不同,既可以是一種打開方式,也可以是多種打開方式,尤其在進行Kinect傳輸數(shù)據(jù)處理的時候,需遵循三條步驟的運行管線。此三條管線分別為:第一條為處理彩色和深度數(shù)據(jù),第二條為根據(jù)用索引添加顏色信息,并將其放入到深度圖之中,第三條為骨骼追蹤數(shù)據(jù)。
四、總結(jié)
隨著計算技術(shù)的快速發(fā)展,視覺技術(shù)逐漸被廣泛的應用于我們?nèi)粘5难芯恐小1疚耐ㄟ^對視覺技術(shù)的相關(guān)問題進行分析,探究了圖像處理、分割、前景提取、運動物體觀測以及重構(gòu)3D圖等問題,為實現(xiàn)視覺技術(shù)更加深入研究做出了相應的貢獻;為廣大參與計算機視覺技術(shù)研究同仁提供一個研究的思路,為實現(xiàn)視覺技術(shù)的騰飛貢獻薄力。
參考文獻
[1]張???基于Opencv的人手識別與跟蹤定位技術(shù)研究與實現(xiàn)[D].云南大學,2013.
篇3
關(guān)鍵詞OpenCV;科學教育;推廣價值
1、OpenCV庫簡介
OpenCV是由Intel微處理器研究實驗室的視覺交互組開發(fā)的一個跨平臺計算機視覺庫,它的代碼都是開源的而且都經(jīng)過非常好的優(yōu)化,并且具有很好的移植性,可以根據(jù)需求導入到合適的環(huán)境中使用。它可以實現(xiàn)有關(guān)圖像識別與處理和計算機視覺技術(shù)方面的很多通用算法。它的優(yōu)勢是可以運行在當代社會使用熱門的各大操作系統(tǒng)上,適用性強,還可以脫離外部庫而獨立運行。OpenCV的C和C++都是經(jīng)過優(yōu)化的開源代碼,采用靈活的接口,提升計算機的運行速度。其中包含的函數(shù)就有500多個,包括的種類有C和C++等。OpenCV因為免費面向市場,已經(jīng)被社會各界廣泛使用?,F(xiàn)已應用于人機互動、圖像識別、圖像分割、目標追蹤、3D重建、機器視覺、結(jié)構(gòu)分析等數(shù)個領(lǐng)域。OpenCV主要包括以下幾個部分:①cxcore:核心功能模塊,包含一些基本函數(shù),運用于各種數(shù)據(jù)類型的計算。②cv:圖像處理和計算機視覺功能。③ml:機器學習模塊,主要內(nèi)容是分類器。④cvaux:包括大部分實驗性的函數(shù),例如ViewMorph-ing、三維跟蹤、PCA、HMM等。⑤Highgui:圖像界面接口,支持攝像頭的讀取和轉(zhuǎn)換。
2、OpenCV處理圖像的功能
OpenCV中有很多的函數(shù),可以實現(xiàn)很多不同的功能,其中最具有學習價值的部分就是圖像處理。處理圖像主要分為三部分:加載圖像,顯示圖像,處理圖像。
2.1加載圖像
不同類型的圖像有著不同的內(nèi)部結(jié)構(gòu)。我們需要根據(jù)圖像的結(jié)構(gòu)采用合適的方法將圖像文件中的數(shù)據(jù)讀入內(nèi)存。OpenCV中的cvLoadImage()函數(shù),可以加載圖像數(shù)據(jù)。而且圖像的格式不影響加載的效果,加載后它以一個指向IplImage結(jié)構(gòu)體的指針形式返回,大大方便了后續(xù)處理的過程。2.2顯示圖像加載圖像后需要通過函數(shù)使其顯示。cvNamedWindow()函數(shù)由HighGUI庫提供,它可以在屏幕上創(chuàng)建一個窗口,將圖像顯示出來。cvShowImage()函數(shù)的作用是在這個創(chuàng)建的窗口中顯示出加載過后的圖像。觀察圖像時經(jīng)常用到的重要函數(shù)還有可以使程序暫停的函數(shù)cvWaitKey(),以及用于釋放內(nèi)存的函數(shù)cvReleaseImage()和cvDestoryWindow(),掌握并運用這些函數(shù),就可以輕松的實現(xiàn)觀察圖像的功能。
2.3處理圖像
OpenCV中包含的多種函數(shù),可以達到圖像處理技術(shù)方面的很多效果,包括圖像灰度化函數(shù)cvtColor(),邊緣檢測函數(shù)Sobel()、Laplacian()、Canny(),其中Canny算子只能處理8位灰度圖,其余兩種8位32位都可以,合并梯度函數(shù)addWeighted(),放大縮小函數(shù)resize(),閾值化操作函數(shù)imshow()等等。適當選用合適的函數(shù)并加以運用即可達到目標所需。
3、OpenCV的推廣價值體現(xiàn)
OpenCV可以應用在社會的各個領(lǐng)域,價值就體現(xiàn)在每個科學的產(chǎn)物當中。舉個近在身邊的例子,隨著社會的發(fā)展,生活質(zhì)量的提高,人們的居住環(huán)境也在逐漸改善,樓層越蓋越高,無數(shù)摩天大樓,商業(yè)大廈群起而立,電梯已經(jīng)成為了我們?nèi)粘I钪斜夭豢缮俚墓ぞ?。盡管現(xiàn)在電梯的功能、質(zhì)量不斷地提升,但是仍然存在些許不足,當我們在學校的教學樓內(nèi)等電梯時發(fā)現(xiàn)了一個問題,那就是在電梯使用的高峰期時,比如在上下課時段,有很多人都在同一樓層等電梯。但是此時只有一臺離該樓層最近的電梯會過來,而其余的電梯都會自動向其它叫梯樓層運行或是閑置??墒谴藭r這一臺電梯只能容納有限數(shù)量的人,時常不能使所有人坐上電梯,這樣就無法滿足全部人的需求,由此就導致了有部分人無法及時地坐上電梯,需要繼續(xù)等候,而閑置的電梯又不能及時地被利用。這樣不僅不能合理地利用資源,反而浪費了許多不必要的時間。因此,我們想到可以通過利用圖像識別與處理的方法來彌補這個不足,首先通過硬件設備連接拍照捕獲候梯人像,后臺運行判斷出候梯人數(shù),然后運用語言編程來確定調(diào)動電梯的個數(shù),從而來達到實現(xiàn)自動控制每個電梯的運行的目的,使所有人都能在第一時間乘坐電梯。而上文中提到的OpenCV就可以完成這項艱巨的任務。我們將OpenCV導入編程環(huán)境,其次修改電梯工作系統(tǒng)的運行程序,將軟件與硬件設備相連通,這樣通過調(diào)度程序,就可以輕松高效地解決這個問題。使用這種方法,不僅可以節(jié)約人們的候梯時間,方便學生、老師上課,而且可以合理有效地調(diào)度電梯,使電梯的價值得到最大化。見微知著,OpenCV可以應用在每個領(lǐng)域,對各界的發(fā)展起到推動作用,造福社會的科技發(fā)展,方便人們的生活。
4、科學教育存在的問題
在歷年的教學模式中,老師們往往會強調(diào)理論知識的重要性,但卻忽略了對學生使用動手能力的培養(yǎng),學生不能獨立完成實踐性的技術(shù)操作,也就是說教學模式缺乏實踐性。只有將理論與實踐相結(jié)合,才能實現(xiàn)知識價值的最大化,因此,應當在教學中配合著實踐課程,舉一反三,讓學生們更加深刻地學習和了解所學到的知識。而如今雖然一部分學校也開設了實踐課程,但也只是淺嘗輒止,并沒有過多地講授計算機技術(shù)實踐方面的知識,學生們也沒有真正擁有動手實踐能力,這使學生們的技術(shù)知識十分受限。雖然現(xiàn)在多數(shù)學生對計算機略懂一二,但是實際上僅僅會使用類似Word等簡單的軟件,而技術(shù)要求較高的一些軟件及工具卻全然不知,甚至對自己所學過的課程軟件的使用也是馬馬虎虎,這對于未來工作所需的能力來講,實在是九牛一毛。目前中學生使用電腦的重心更多放在了社交軟件和游戲上,很少有人利用計算機學習更多的技能,這對青少年的發(fā)展實在是利大于弊的,而且這樣也失去了計算機的正向價值。因此,我們應該改變現(xiàn)有的教學模式,一邊教授理論知識,一邊配合指導學生動手操作,將理論與實踐相結(jié)合,也能讓學生更好地消化和吸收所學到的知識,并且引導學生正確使用計算機,發(fā)揮計算機的價值,讓學生們都能夠在計算機中獲得更多的知識。
5OpenCV開源算法庫在各個領(lǐng)域的實例化體現(xiàn)
OpenCV在醫(yī)學領(lǐng)域、軍事領(lǐng)域、安全防護領(lǐng)域等都有很大的重要意義。在醫(yī)學領(lǐng)域中,由于有了這個開源算法庫,我們可以盡可能地調(diào)用它,從而來進行圖像處理、對象檢測,讓醫(yī)生更好更快速觀測人體結(jié)構(gòu),及時發(fā)現(xiàn)病癥。在軍事領(lǐng)域中,大多數(shù)無人操作的機器運作,比如無人機飛行、水下無人駕駛儀、無人駕駛汽車等等,都需要用到OpenCV來對圖像進行處理,并進行分析,并且可以檢測出人眼看不到的事物,這是OpenCV能夠帶來人類的巨大的進步。在安全防護領(lǐng)域中,我們現(xiàn)實生活中常見的汽車的安全駕駛,房屋入侵的檢測、自動監(jiān)視報警系統(tǒng)等等,正是由于這些技術(shù),讓我們的環(huán)境更加安全,這都是我們生活中息息相關(guān)不可缺少的?,F(xiàn)如今,國家的科學技術(shù)飛速發(fā)展,日益強盛,OpenCV的成績有目共睹,未來的發(fā)展需要科學技術(shù)的不斷推進,才能為祖國未來的其他事業(yè)提供強有力的后盾。
6OpenCV在科學教育中的作用
在文化改革的大背景下,文盲的概念早已從沒有文化轉(zhuǎn)變成了不會使用計算機。因為隨著科技的進步,計算機的使用已經(jīng)越來越廣泛,計算機已經(jīng)逐步取代了以往人工可以完成的許多工作,比如在超市生成的結(jié)賬單、用計算機控制動力系統(tǒng)的運行、人造衛(wèi)星軌跡的計算等等,這些都依賴于計算機強大的功能。計算機的推廣證明著我國科技的發(fā)展和人類文明的進步,由此可見,計算機技術(shù)知識的掌握對現(xiàn)代人來說是十分重要的。如果想要成為一個真正有技術(shù)、有能力的人才,就務必要熟練掌握計算機技術(shù)的使用。但是目前當代社會的教育在計算機技術(shù)方面的內(nèi)容還不夠豐富。減壓政策開放以來,教育課時被壓縮,技術(shù)知識的傳輸也相應減少,學生們的能力也因此日益下降。而科學教育,顧名思義,是使科學技術(shù)在教育過程中得以傳承。想要科學地教育學生,就必須要多多講授科學技術(shù)方面有關(guān)的知識。說到科學技術(shù),它的重點自然是計算機技術(shù),而OpenCV作為計算機視覺技術(shù)的核心,可以說也是計算機技術(shù)甚至科學教育中的一個重要部分。在教育中普及并傳承這個技術(shù)無疑可以提高學生們的技術(shù)水平。但是,相信有大多數(shù)的人在此之前從未聽說過計算機視覺技術(shù),也并不了解OpenCV庫,更加不會學習到與之有關(guān)的技術(shù)知識。在這樣嚴峻的形勢下,我們更應該將類似OpenCV方面技術(shù)有關(guān)的知識通過教育傳遞下去。各大高校應積極開展有關(guān)計算機的活動,開設與計算機技術(shù)有關(guān)的課程。這樣才能根據(jù)社會的需求來培養(yǎng)更多的綜合性人才。如果可以將其投入到現(xiàn)代教育當中,定會使現(xiàn)在的教育事業(yè)更加輝煌,也能使祖國的未來更加璀璨。
參考文獻
[1]于仕琪,劉瑞禎.學習OpenCV(中文版)[M].北京:清華大學出版社,2009.
[2]陰法名.基于OpenCV圖像處理[J].科技信息,2009(32):220.
[3]賈小軍,喻擎蒼.基于開源計算機視覺庫OpenCV的圖像處理[J].計算機應用與軟件,2008,25(4):276-278.
[4]陳勝勇.基于OpenCV的計算機視覺技術(shù)實現(xiàn)[M].北京:科學出版社,2008.
[5]劉潔,馮貴玉,張汗靈.一種圖像處理和計算機視覺的開發(fā)工具[J].計算機仿真,2006(11).
篇4
關(guān)鍵詞:機器視覺技術(shù);大米;品質(zhì)檢測
中圖分類號:TP391.4 文獻標識碼:A 文章編號:0439-8114(2012)05-0873-04
Application Progress of Machine Vision Technology in the Quality Inspection of Rice
WAN Peng,LONG Chang-jiang,REN Yi-lin
(College of Engineering, Huazhong Agricultural University, Wuhan 430070, China)
Abstract: The research dynamic of machine vision technology was reviewed from the aspects of rice varieties, germ, crack, yellow grain rice, and so on; and the shortcomings of the machine vision technology in rice quality inspection were proposed for its further application.
Key words: machine vision technology; rice; quality inspection
我國是世界上最大的稻米生產(chǎn)國,稻米年產(chǎn)量常年保持在1.8億t左右,占世界稻米總產(chǎn)量的1/3,居世界第一位[1]。我國也是大米消費大國,有近2/3的人口以大米為主食,全國大米年消費總量保持在1.35億t左右[2]。我國的水稻研究在世界上處于領(lǐng)先地位,但是在國內(nèi)外貿(mào)易、加工和消費等領(lǐng)域中仍然存在諸多問題[3,4]。
我國曾經(jīng)是世界三大稻米輸出國之一,但是由于我國大米的品質(zhì)不高,再加上大米的生產(chǎn)標準、質(zhì)量技術(shù)標準、檢驗檢疫技術(shù)等與發(fā)達國家存在較大差距,在相當程度上影響了我國大米在國際市場上的競爭優(yōu)勢,大米的年出口量已退居六七位。2008年以來,隨著世界稻米產(chǎn)量的下降,各國對大米出口配額進行調(diào)整,導致國際大米的價格出現(xiàn)了瘋漲,而我國出口的大米因品種不穩(wěn)定、品質(zhì)較差,在國際市場上競爭力較低,市場份額逐漸減小。
為了提高大米的品質(zhì),不但需要選育優(yōu)質(zhì)的稻米品種,還需要加強大米品質(zhì)的檢測。但是,由于我國對大米品質(zhì)的檢測研究起步較晚,同時也缺乏方便簡單的檢測方法和快捷準確的檢測儀器,在對大米品質(zhì)進行檢測的過程中,主要依靠人工識別、感官評定等方法進行檢測,這些方法主觀性較強,準確度較低,可重復性較差,工作效率也較低,因此在實施過程中的有效性受到了質(zhì)疑[5]。
機器視覺(Machine vision)又稱計算機視覺,是指利用計算機實現(xiàn)人的視覺功能,是研究采用計算機模擬生物外顯或宏觀視覺功能的科學和技術(shù),是一門涉及數(shù)學、光學、人工智能、神經(jīng)生物學、心理物理學、計算機科學、圖像處理、圖像理解、模式識別等多個領(lǐng)域的交叉學科[6]。機器視覺技術(shù)在農(nóng)業(yè)上的應用研究始于20世紀70年代末期,主要進行的是植物種類的鑒別、農(nóng)產(chǎn)品品質(zhì)檢測和分級等。隨著計算機軟硬件技術(shù)、圖像處理技術(shù)的迅速發(fā)展,它在農(nóng)業(yè)上的應用研究有了較大的進展[7,8]。
目前,大部分的大米品質(zhì)檢測指標根據(jù)國家標準采用人工進行檢測,容易產(chǎn)生許多問題。隨著機器視覺技術(shù)的發(fā)展和在農(nóng)產(chǎn)品無損檢測領(lǐng)域的廣泛應用,采用機器視覺技術(shù)對大米的品質(zhì)進行檢測,不僅能夠提高大米品質(zhì)的檢測效率,而且能夠克服主觀因素的影響,降低檢測誤差,使得大米品質(zhì)的檢測變得更加快速和準確[9]。
1 基于機器視覺技術(shù)的大米品質(zhì)檢測裝置
基于機器視覺技術(shù)的大米品質(zhì)檢測系統(tǒng)由檢測箱、檢測臺、光源、CCD圖像傳感器、鏡頭、圖像采集卡和計算機系統(tǒng)等幾個部分組成[10,11](圖1)。
大米品質(zhì)檢測系統(tǒng)是一個內(nèi)空的箱體,箱子的底部是檢測臺,頂部為光源和攝像頭;檢測箱內(nèi)表面粘貼有背景紙,使光在箱體內(nèi)形成均勻的漫反射,避免樣品在檢測時形成鏡面反射。光源提供樣品檢測照相時所需的亮度,為了提供充足的光線,同時盡量消除光源照射樣品時在背景上產(chǎn)生的陰影,通常選用環(huán)形熒光燈管作為光源[12]。CCD圖像傳感器是獲取數(shù)字米粒樣品圖像的關(guān)鍵部件之一,它將大米圖像由光信號轉(zhuǎn)換為表示R、G、B顏色值的模擬電信號,并輸入圖像處理設備進行后續(xù)處理[13]。計算機軟件系統(tǒng)用于對采集到的數(shù)字圖像進行分析、處理和識別,實現(xiàn)對特定目標的檢測、評價等[14]。
2 基于機器視覺技術(shù)的大米粒形檢測
大米的粒形是實現(xiàn)大米分級和質(zhì)量檢測的最基本參數(shù)。根據(jù)《GB1345-1986大米》中的規(guī)定,評價大米質(zhì)量的檢測指標主要有加工精度、不完善粒、雜質(zhì)、碎米等,這些檢測指標與大米的粒形直接或間接相關(guān)。由于人工評價是通過肉眼觀察對大米粒形進行評價,因此受檢測環(huán)境、視覺生理、視覺心理等諸多因素以及評價人員對大米標準理解程度不同的影響,即便是同一份大米樣品,很難保證大米粒形檢測結(jié)果的穩(wěn)定,而采用計算機視覺技術(shù)進行檢測則可以有效避免主觀因素的影響,保證大米粒形檢測結(jié)果的準確性[9,15]。
中國農(nóng)業(yè)大學孫明等[16]借助于MATLAB圖像處理工具箱對大米粒形進行測定。首先定義單粒大米子粒的粒長(A)與粒寬(B)的比值為粒形,檢測時先求出大米粒的橢圓離心率R,通過公式:
■=sqrt■
將大米子粒的橢圓離心率轉(zhuǎn)變?yōu)殚L寬比A/B,即求出大米子粒的粒形。試驗結(jié)果表明,該方法具有操作簡單、檢測速度快、重復性好的優(yōu)點。
武漢工業(yè)學院張聰?shù)龋?7]提出了一種基于計算機圖像分析識別大米破碎粒的方法,即先采用數(shù)碼相機獲取大米圖片,再對大米圖片進行分析處理。識別時先將大米圖像的邊緣曲線變換為極坐標形式,再結(jié)合大米粒形的一般形狀,用橢圓模板定位米粒,獲得一組與米粒平移、旋轉(zhuǎn)和尺度無關(guān)的形狀描述數(shù)據(jù),再運用小波變換提取奇異點及特征參數(shù)。試驗結(jié)果表明,該方法簡單有效,用于米粒定位與識別時的可信度高。同時,劉光蓉等[18]也研究了通過掃描儀獲取大米的圖像,再采用計算機圖像處理技術(shù)將彩色圖像轉(zhuǎn)化成灰度圖像并進行進一步的處理,最后獲得大米子粒的二值圖像,然后利用八鄰域分析法提取大米圖像的輪廓。試驗結(jié)果表明,這種方法的檢測效果良好。
此外,袁佐云等[19]還提出了采用最小外接矩形計算大米粒形的方法。包曉敏等[20]分析了采用Roberts算子、Sobel算子、Prewitt算子、模板匹配法和快速模糊邊緣檢測法對大米粒形進行邊緣檢測,并通過對大米圖像的分割試驗驗證了快速模糊邊緣檢測法最為有效。
3 基于機器視覺技術(shù)的大米加工精度檢測
大米加工精度是指大米背溝和粒面留皮程度,即糙米皮層被碾去的程度。大米的加工精度是決定大米外觀質(zhì)量的主要因素,加工精度越高,米粒表面殘留糠皮量就越少,胚乳表面光潔度、口感、外觀品質(zhì)也就越好。我國國家標準規(guī)定各類大米按加工精度分等級[9]。因此,大米加工精度的檢測具有十分重要的意義。傳統(tǒng)大米加工精度的測定有多種方法,國標中規(guī)定大米加工精度的判定采用試劑染色法[21],通過染色劑使米粒胚乳和胚乳表面殘留糠皮呈現(xiàn)不同的顏色差異便于肉眼觀測,該方法受到光照條件、視力、情緒等諸多因素以及各種染色參數(shù)的影響,操作繁瑣、效率低、誤差大,不能滿足快速、客觀檢測的需要。
河南工業(yè)大學張浩等[22]研究了機器視覺技術(shù)結(jié)合數(shù)字圖像處理技術(shù)檢測大米加工精度的方法,首先獲取大米的圖像,利用米粒區(qū)域和背景區(qū)域的亮度差異將大米圖像轉(zhuǎn)化為灰度圖像,再利用邊緣檢測函數(shù)求出分割閾值,將米粒從背景中分割出來,并計算米粒區(qū)域的面積;然后利用米粒區(qū)域中糠皮部分和胚乳部分R-B特征值差異,將大米圖像分解為R、G、B分量圖,以R-B矩陣代替大米圖像,再將R-B矩陣轉(zhuǎn)化為灰度圖,用邊緣檢測函數(shù)求出分割閾值把糠皮部分分割出來,計算糠皮部分面積。最后測得大米留皮率為米??菲げ糠置娣e與米粒區(qū)域面積之比。
江蘇理工大學許俐等[23]將計算機圖像處理技術(shù)與色度學理論相結(jié)合研究了大米加工精度的自動檢測方法。檢測時先將大米染色,然后采用機器視覺系統(tǒng)獲取大米圖像,再根據(jù)染色后大米的胚乳、皮層以及胚芽所呈現(xiàn)的不同顏色特征,采用不同的區(qū)分方法獲取米粒不同部位的面積即像素的個數(shù),然后根據(jù)胚乳面積與大米圖像總面積的百分比計算大米的加工精度。
此外,無錫輕工大學田慶國[24]根據(jù)色度學原理,采用圖像處理技術(shù)對染色后的大米進行檢測,識別大米的加工精度,并建立了大米染色后的顏色值與加工精度之間的數(shù)據(jù)庫。西華大學的劉建偉與日本岐阜大學的三輪精博[25]合作研究大米加工精度與碾白程度之間的關(guān)系時,采用改良后的大米精度鑒定NMG溶液,按照品紅石碳酸溶液染色法(GB 5502-85)對大米進行染色獲得米粒表皮呈綠色、糊粉層呈藍色、胚乳呈藍紅色的大米樣品,米粒干燥后采用測差計檢測樣品的顏色計算大米的加工精度。
4 基于機器視覺技術(shù)的大米堊白檢測
堊白是指稻米粒胚乳中不透明的部分。堊白之所以不透明是因為稻米子粒中淀粉粒排列疏松,顆粒間充氣引起光線折射所致。按其發(fā)生部位可將堊白區(qū)分為腹白、心白和背白等類型。通常用堊白粒率、堊白大小和堊白度等概念描述稻米的堊白狀況。堊白是衡量稻米品質(zhì)的重要性狀之一,不僅直接影響稻米的外觀品質(zhì)和商品品質(zhì),而且還影響稻米的加工品質(zhì)和蒸煮食味品質(zhì)[9,26]。
黑龍江農(nóng)業(yè)工程職業(yè)學院于潤偉等[27]研究了采用機器視覺技術(shù)和圖像處理技術(shù)檢測稻米堊白的方法。先用機器視覺裝置獲取大米的原始圖像,再采用圖像處理方法對大米圖像進行預處理,然后應用大津算法自動選取分割閾值對稻米圖像進行兩次分割,分別得到大米子粒的二值圖像和堊白區(qū)域的二值圖像,再根據(jù)區(qū)域內(nèi)部像素點的聯(lián)通性,將不同區(qū)域分別進行標記,計算出子粒數(shù)和堊白粒數(shù),同時計算出二者對應的面積(像素點個數(shù))。研究結(jié)果表明,該算法的自動檢測結(jié)果與人工檢測相關(guān)性大于90%。
中國農(nóng)業(yè)大學侯彩云、日本東京大學Seiichi等[28]采用微切片三維圖像處理系統(tǒng)對大米的品質(zhì)特性進行探索性研究,結(jié)果表明借助于三維可視化技術(shù)分析大米的微切片,不僅可以觀察大米堊白部分內(nèi)部的組織結(jié)構(gòu)以及在蒸煮過程中的變化,還可以利用灰度直方圖定量計算出堊白米粒中各部分堊白的面積和體積。同時,侯彩云等[29]還利用自行研制開發(fā)的機器視覺圖像處理系統(tǒng)對大米的堊白度及堊白粒率進行檢測,試驗結(jié)果表明所研制的裝置具有客觀、準確、快速和重現(xiàn)性好等特點,在大米的快速分等定級中具有良好的應用前景。
江蘇大學黃星奕等[30]研究了采用遺傳神經(jīng)網(wǎng)絡計算大米堊白度的方法。先采用機器視覺系統(tǒng)提取堊白米的圖片,然后采用數(shù)字圖像處理技術(shù)提取米粒的堊白區(qū)域與胚乳非堊白區(qū)域的交界區(qū)域內(nèi)的像素,再采用遺傳算法建立一個人工神經(jīng)網(wǎng)絡識別系統(tǒng)對這部分交界區(qū)域內(nèi)的像素進行識別。試驗結(jié)果表明,采用機器視覺系統(tǒng)的檢測結(jié)果與人工檢測結(jié)果的誤差小于0.05。
此外,凌云等[31]提出了一種基于分形維數(shù)的堊白米檢測算法。孫明等[32]采用了MATLAB軟件開發(fā)平臺構(gòu)造了基于計算機視覺的大米堊白檢測算法,完成了對大米堊白參數(shù)、堊白度以及堊白粒率的測定。吳建國等[33]從實際應用出發(fā),采用計算機和掃描儀結(jié)合開發(fā)了機器視覺系統(tǒng)的堊白測定軟件。而曾大力等[34]利用視頻顯微鏡對大米粒進行掃描,結(jié)合計算機圖形分析,直接計算大米的堊白大小和透明度,初步探討了視頻顯微掃描技術(shù)在大米堊白分析中的應用。湖南農(nóng)業(yè)大學蕭浪濤等[35]開發(fā)了基于微軟Windows 98平臺的大米堊白度測定軟件Chalkiness 1.0,該軟件與計算機和圖像掃描儀相結(jié)合能夠組成一套高效的大米堊白度測定系統(tǒng)。
5 基于機器視覺技術(shù)的整精米率檢測
整精米是指糙米碾磨成國家標準一級大米時米粒產(chǎn)生破碎,其中的完整米粒以及長度達到完整精米粒平均長度4/5以上(含4/5)的米粒。整精米率是指整精米占凈稻谷試樣質(zhì)量的百分率,它是稻米加工品質(zhì)優(yōu)劣的指標,是稻米貿(mào)易中商家最關(guān)注的內(nèi)容,與碾米廠的經(jīng)濟效益密切相關(guān)。正確識別整精米是檢測整精米率的關(guān)鍵。目前整精米率主要采用人工方法進行檢測,該方法難以滿足對稻米品質(zhì)快速、準確的檢測要求[9,36]。
中國農(nóng)業(yè)大學尚艷芬等[37]開發(fā)了一套基于機器視覺技術(shù)的整精米檢測系統(tǒng)用于識別整精米和碎米。該方法通過提取并分析稻米的粒長、粒形等特征參數(shù),提出了同一品種并在同一生長條件下生長的大米粒形具有相似性的前提假設,據(jù)此求得標準米,再通過偏差計算、粒長、粒形分析等對整精米和碎米進行識別。采用該方法開發(fā)的整精米識別系統(tǒng)對整精米和碎米識別的準確率與人工檢測結(jié)果的相關(guān)系數(shù)可到達0.99。
于潤偉等[38]首先通過圖像識別系統(tǒng)采集大米的原始圖像,再采取動態(tài)閾值分割等圖像處理方法把米粒圖像變成二值圖像,然后根據(jù)區(qū)域內(nèi)部像素的連通性計算出單個米粒的像素個數(shù);再根據(jù)先期計算的整精米長度/面積比換算出米粒長度,最后根據(jù)米粒長度判斷整精米和碎米。研究結(jié)果表明,該算法的自動檢測與人工檢測的相關(guān)性大于99%,可用于整精米的自動檢測。
6 問題和展望
機器視覺技術(shù)在農(nóng)產(chǎn)品的品質(zhì)檢測方面具有廣泛的應用,國內(nèi)外的學者在此領(lǐng)域進行過廣泛研究。但機器視覺技術(shù)在大米品質(zhì)檢測領(lǐng)域的應用尚處于起步階段,仍有許多等待解決的技術(shù)問題,需要進一步深入研究。
1)目前的大米品質(zhì)檢測裝置多為靜態(tài)檢測裝置,即將大米放于檢測箱中通過機器視覺系統(tǒng)獲取圖片或通過掃描儀獲取圖片,大米相對于攝像頭靜止不動;獲取圖像之后再采用計算機軟件系統(tǒng)對圖像進行分析處理。這種檢測方法效率低下,因此,動態(tài)地獲取大米圖像并進行分析檢測是下一個要解決的難題。
2)采用機器視覺系統(tǒng)檢測大米品質(zhì)時,多采用的是串行化算法,即先獲取大米圖像,然后采用某種算法對大米圖像進行處理,再檢測大米的某項品質(zhì)指標;之后再采用某種算法對大米圖像處理大米的另一項品質(zhì)指標,這種檢測方法在處理群體米粒圖像時極大地影響了檢測速度,因此開發(fā)并行處理算法對大米圖像進行分析檢測可以有效提高機器視覺系統(tǒng)的工作效率。
3)目前對大米品質(zhì)指標進行檢測分析時缺少統(tǒng)一的檢測裝置,有的研究者采用CCD攝像頭獲取大米的圖像進行分析檢測,而有的研究者采用掃描儀獲取圖像進行分析檢測,檢測裝置不同、檢測條件不一致難以達到相同的檢測結(jié)果,因此有必要研制具有實用價值的大米品質(zhì)檢測裝置,使基于機器視覺技術(shù)的大米品質(zhì)檢測能夠具有統(tǒng)一的標準。
總之,伴隨著計算機科學技術(shù)的迅速發(fā)展,機器視覺技術(shù)在大米品質(zhì)檢測中的應用將越來越廣泛。
參考文獻:
[1] 龐乾林.稻米知識縱覽[J].中國稻米,2004(3):44-47.
[2] 劉月好.陳米產(chǎn)生的原因與處理方法[J].糧食加工,2004(1):30-31.
[3] 莊麗娟,刁慕容.中國谷物外貿(mào)格局與發(fā)展趨向分析[J].中國農(nóng)墾經(jīng)濟,2004(8):25-26.
[4] 山世英,彭玉珊.我國農(nóng)產(chǎn)品出口遭遇技術(shù)性貿(mào)易壁壘的原因及對策[J].山東農(nóng)業(yè)大學學報,2004,6(2):41-43.
[5] 李里特.糧油產(chǎn)品規(guī)格化、標準化是農(nóng)業(yè)現(xiàn)代化的迫切任務[J].中國糧油學報,2001,16(5):1-5.
[6] 劉傳才.圖像處理與計算機視覺[M].廈門:廈門大學出版社,2002.
[7] 趙曉霞.計算機視覺技術(shù)在農(nóng)業(yè)中的應用[J].科技情報開發(fā)與經(jīng)濟,2004,14(4):124-126.
[8] 熊利榮,陳 紅,丁幼春.機器視覺技術(shù)在農(nóng)產(chǎn)品破損檢測上的應用[J].農(nóng)機化研究,2005(5):204-205.
[9] 李天真,周柏清.基于計算機視覺技術(shù)的稻米檢測研究[J].糧食與食品工業(yè),2005,12(4):50-53,55.
[10] 凌 云,王一鳴,孫 明,等.基于機器視覺的大米外觀品質(zhì)檢測裝置[J].農(nóng)業(yè)機械學報,2005,36(9):89-92.
[11] 張巧杰,王一鳴,凌 云,等.稻谷品質(zhì)檢測技術(shù)與裝置研制[J].現(xiàn)代科學儀器,2006(1):128-130.
[12] 趙志強,熊元姣.計算機視覺檢測系統(tǒng)的設計方案[J].工業(yè)控制計算機,2005,18(10):1-2.
[13] 唐向陽,張 勇,李江有,等.機器視覺關(guān)鍵技術(shù)的現(xiàn)狀及應用展望[J].昆明理工大學學報(理工版),2004,29(2):36-39.
[14] 張紀明.基于PC的機器視覺系統(tǒng)研究[J].可編程控制器與工廠自動化,2006(11):107-110.
[15] 任憲忠,馬小愚.農(nóng)產(chǎn)品粒形識別研究進展及其在工程中應用現(xiàn)狀[J].農(nóng)業(yè)工程學報,2004,20(3):276-280.
[16] 孫 明,石慶蘭,孫 紅,等.基于計算機視覺的大米外觀品質(zhì)檢測[J].沈陽農(nóng)業(yè)大學學報,2005,36(6):659-662.
[17] 張 聰,管庶安.基于圖像分析的大米形狀識別[J].糧食與飼料工業(yè),2006(6):5-7.
[18] 劉光蓉,周 紅,管庶安.基于圖像處理技術(shù)的大米輪廓檢測[J].糧食與飼料工業(yè),2004(6):14-15.
[19] 袁佐云,牛興和,劉傳云.基于最小外接矩形的稻米粒型檢測方法[J].糧食與飼料工業(yè),2006(9):7-8.
[20] 包曉敏,汪亞明,黃振.計算機視覺技術(shù)在大米輪廓檢測上的應用[J].浙江工程學院學報,2003,20(2):104-107.
[21] 呂季璋,陳效貴,范慕蕙,等.GB/T 18105-2000米類加工精度異色相差分染色檢驗法[S].北京:國家質(zhì)量技術(shù)監(jiān)督局,2000.
[22] 張 浩,孟永成,周展明,等.基于圖像處理技術(shù)大米加工精度的檢測研究[J].中國糧油學報,2006,21(4):135-137.
[23] 許 俐,錢敏娟,方如明,等.大米加工精度的圖象識別方法[J].農(nóng)業(yè)工程學報,1996,12(3):172-175.
[24] 田慶國.圖像處理技術(shù)在大米碾白精度測定中的應用[J].糧食與飼料工業(yè),1997(10):10-11.
[25] 劉建偉,徐潤琪,三輪精博,等.大米加工精度與碾白程度檢測的研究[J].中國糧油學報,2004,19(3):5-8,61.
[26] 周新橋,鄒冬生.稻米堊白研究綜述[J].作物研究,2001(3):52-58.
[27] 于潤偉,朱曉慧.基于圖像處理的稻米堊白自動檢測研究[J].中國糧油學報,2007,22(1):122-125.
[28] 侯彩云,SEIICHI O,YASUHISA S,等.三維圖像處理系統(tǒng)在稻米品質(zhì)檢測中的應用研究[J].農(nóng)業(yè)工程學報,2001,17(3):92-95.
[29] 侯彩云,王一鳴,凌 云,等.堊白米粒的計算機圖像識別[J].農(nóng)業(yè)工程學報,2002,18(5):165-168.
[30] 黃星奕,吳守一,方如明,等.遺傳神經(jīng)網(wǎng)絡在稻米堊白度檢測中的應用研究[J].農(nóng)業(yè)工程學報,2003,19(3):137-139.
[31] 凌 云,王一鳴,孫 明,等.基于分形維數(shù)的堊白米圖像檢測方法[J].農(nóng)業(yè)機械學報,2005,36(7):92-95,91.
[32] 孫 明,凌 云,王一鳴.在MATLAB環(huán)境中基于計算機視覺技術(shù)的大米堊白檢測[J].農(nóng)業(yè)工程學報,2002,18(4):146-149.
[33] 吳建國,劉長東,楊國花,等.基于計算機視覺的稻米堊白指標快速測定方法研究[J].作物學報,2005,31(5):670-672.
[34] 曾大力,藤 勝,錢 前,等.視頻顯微掃描技術(shù)在稻米堊白研究中的應用[J].中國農(nóng)業(yè)科學,2001,34(4):451-453.
[35] 蕭浪濤,李東暉,藺萬煌,等.一種測定稻米堊白性狀的客觀方法[J].中國水稻科學,2001,15(3):206-208.
[36] 郭英群.對國家標準中整精米率定義及檢測方法的探討[J].糧油倉儲科技通訊,2005(6):52-53.
篇5
誕生于20世紀40年代的電子計算機是人類最偉大的發(fā)明之一。并且一直以飛快的速度發(fā)展著。進入21世紀的現(xiàn)代社會,計算機已經(jīng)進入各個行業(yè),并成為各行業(yè)必不可少的工具。如今的計算機發(fā)展的更加智能化,就如今來說,人們最什么事情都非常重視信息,人類和社會的發(fā)展,時刻都離不開信息。計算機如今重視的方面就是對信息的閱讀和控制,人臉檢測與識別技術(shù)也是應運而生。
人臉識別的論述
人臉識別是人類視覺中的一大特色,因為能對身邊的人進行識別,才不會對身邊的信息進行混淆,簡單來說,根據(jù)人臉可以對人的年齡,性別進行初步判斷。隨著計算機技術(shù)的智能化,計算機業(yè)已經(jīng)通過視覺能進行人臉的識別。其中在對人臉識別的同時進行有關(guān)信息的收集、識別、提取、變換、存儲、傳遞、處理、檢索、檢測、分析和利用等技術(shù)。如今人臉識別已經(jīng)應用于很多的領(lǐng)域,但是要人臉檢測與識別是需要基于本來已經(jīng)收集和整理的信息本庫才能進行。再加上現(xiàn)在計算機技術(shù)雖然已經(jīng)接近成熟,然而在人臉識別方面的表情傳達出什么信息還是無從下手進行編程和設計。所以,基于計算機視覺的人臉檢測與識別技術(shù)還是會有很廣的發(fā)展空間,再加上人臉識別還可以維護人們的財產(chǎn)安全和隱私保護,必然會引起社會各界人士的廣泛關(guān)注。
從19世紀末開始就已經(jīng)有人對人臉識別進行了研究,因為當時沒有先進的科學技術(shù)做后盾,所以經(jīng)過了數(shù)百年的研究仍然沒有什么顯著的進展和成果。直到20世紀90年代人臉識別才成立了自己的學科,在加上當時的科技發(fā)展水平已經(jīng)達到了不錯的水平,人臉識別這個學科得到了快速的發(fā)展。如今,我國的計算機技術(shù)也已經(jīng)居于世界的前列,我國也已經(jīng)擁有比較完善的一套東方面孔的人臉數(shù)據(jù)庫。
人臉識別在發(fā)展過程中大概經(jīng)歷了三個階段:第一階段就是對人臉特征進行整理,整理出所需要的數(shù)據(jù)庫,并且應用當時的計算機技術(shù)做出一套質(zhì)量不錯的人臉灰度模型,這個階段的識別工作全部由操作人員來完成;第二階段比第一階段要先進,有了基礎人機互交,將人臉的特征經(jīng)過多維度的矢量在模型上表示出來,并也可以設計出一套人臉識別的系統(tǒng),這個階段的識別不再是僅僅依靠操作人員,而是操作者和計算機一起完成;第三個階段是計算機智能識別的最高峰,一切操作和識別都依靠機器全自動化進行,在人臉識別過程中也不再是每臺計算機都需要完成一整套的工作,也實現(xiàn)了計算機與計算機之間的互聯(lián),多臺計算機一起完成人臉識別的過程,都人力也是一種解放。
積極踐行人臉檢測識別技術(shù)
人臉檢測識別技術(shù)是計算機實現(xiàn)智能化特征后的又一重要發(fā)展方向之一,它已經(jīng)在世界范圍內(nèi)得到了廣泛的普及與應用。人們可以通過人臉識別來進行定位,來起到保護人們財產(chǎn)安全的作用,通過人臉識別來抵制社會中的造假率,之前曾經(jīng)有一些不法分子利用假身份來做損害公共利益和侵犯人們隱私權(quán)的事情,有了人臉識別讓不法分子沒有可乘之機,也應用人臉識別來對財務密碼進行聯(lián)系,起到對人們的財產(chǎn)有絕對的保護作用,對社會的安定何嘗不是一項有意義的發(fā)明。
人臉識別一直是計算機智能化發(fā)展過程中的一個重要領(lǐng)域,因為人臉的識別與檢測是一個很難做到完善的項目,由于人類的面部表情豐富,要對人類的面部表情做出判斷和分析會存在一定的困難。再加上人臉識別的過程中,每個獨立存在的個體都有一張專屬于自己的臉。它的輪廓沒有明顯的特征界限,同時對眼、鼻子、嘴等器官在臉上的分布情況也沒有明確的界限,這就使得對人臉識別來進行算法設計有一定的困難,所以只有通過輪廓特征來進行初步的判斷,分辯出各種器官,再根據(jù)器官來完成人臉的分布情況設計灰度模型的完成工作。
篇6
關(guān)鍵詞:多模態(tài);檢索;圖像特征
0 引言
現(xiàn)階段基于圖像檢索普遍采用方式是人工對上傳到網(wǎng)絡中的數(shù)字圖像進行文字標注,根據(jù)每幅圖像的視覺特征人為的設置他們的文字描述。在檢索時,使用標注的文字作為關(guān)鍵字來檢索我們想要的數(shù)字圖像。這種依據(jù)圖像標注的文字匹配檢索的方法簡稱為“字找圖”,它的缺點為:(1)由于需要大量的人工對每幅圖像進行文字標注,數(shù)字圖像的數(shù)量是海量的,標注工作是非常耗費人力和時間;(2)由于每個人對圖像的認識不同,所以,在標注的過程中會按照自己對圖像的認識來選擇標注文字,這樣會使不同的人對圖像的標注不同,而在檢索中會產(chǎn)生很大誤差;(3)不同國家使用的標注文字不同,所以在匹配文字時也會產(chǎn)生很大的偏差;(4)有的圖像里面含有大量的內(nèi)容,不可能用幾個關(guān)鍵字就能表達清楚。為解決標注圖像檢索的缺陷問題。學者著手開展對內(nèi)容的圖像檢索技術(shù)的研究。基于多模態(tài)的圖像檢索的改善了此類瓶頸問題,主要從被檢圖像庫根據(jù)海量圖像特征進行檢測和匹配,獲取圖像之間的相關(guān)性特征信息。
1 基于多模態(tài)的圖像特征匹配方法
(1)直接從圖像中尋找匹配線索,而不是通過人為的文字標注,正因為這個特點,突破了傳統(tǒng)的關(guān)鍵字標注的耗費人力時間的缺點,而是直接對圖像本身進行處理和分析,使檢索更貼近圖像本身。
(2)檢索可以是人機交互的,當使用一種特征選取方式檢索的結(jié)果不能滿足人們的需求時,人們可以人工的改變特征選取方式使檢索結(jié)果向于人們需求的方向接近。這樣避免了計算機檢索圖像時的不靈活性,加入了人為的因素。因此,人和計算機結(jié)合檢索能使效率和準確率更高。
(3)基于內(nèi)容的圖像檢索是一種相似性檢索,可以將檢索結(jié)果進行相似性排序,我們可以采取逐步求精的算法,不斷減小檢索的范圍,直到定位到準確目標,這與傳統(tǒng)數(shù)據(jù)庫精確匹配有很大的不同。
由于這些方法,基于多模態(tài)內(nèi)容的圖像檢索漸漸成為人們研究的重點,此類技術(shù)可以應用在社會安全、遙感、醫(yī)學、數(shù)字圖書館、建筑、計算機輔助設計、地理信息系統(tǒng)、商標版權(quán)管理、等諸多領(lǐng)域。
2 基于紋理識別的多模態(tài)的圖像檢索系統(tǒng)的框架和技術(shù)
基于紋理識別的多模態(tài)圖像檢索系統(tǒng)組成部分如圖1所示。
(1)輸入模塊:分析和獲取圖像的紋理特征值,并將特征向量輸入圖像特征數(shù)據(jù)庫。
(2)描述模塊:利用查詢抽象檢索技術(shù),實現(xiàn)將用戶需求抽象提取相關(guān)圖像特征語義,并完整描述成計算機能進行識別的特征向量。
(3)檢索模塊:與圖像數(shù)據(jù)庫的圖像紋理特征值進行相關(guān)性匹配,根據(jù)機器學習和神經(jīng)網(wǎng)絡技術(shù),對跨語義的特征向量進行學習和篩選,獲取最符合查詢要求的圖像信息,并返回給用戶。
3 基于圖像紋理特征的檢測方法
圖像有三大底層特征,分別是顏色特征、紋理特征和形狀特征。紋理特征是顯著的視覺特征,其弱化了顏色和亮度的作用,但它吸收了表面結(jié)構(gòu)的排列與組織次序,而且表現(xiàn)出了上下文的關(guān)系,反映出了同質(zhì)再現(xiàn)的視覺特征。
紋理源于人們對物體表面觸感的概念,這種固有的內(nèi)在特征反映了物體表面的組織結(jié)構(gòu)或者上下文內(nèi)容的關(guān)系等諸多有用的信息,或者反映了圖像像素間的灰度變化情況或者顏色變化情況。組成紋理的基本元素叫作紋元或者紋理基元,是一個觸發(fā)視覺感知并且特性相對穩(wěn)定的基本單元,這些單元在一定的區(qū)域內(nèi)的不同位置會以不同的形態(tài)再現(xiàn),主要是灰度或色彩模式呈現(xiàn)不同特點,其包含多個像素,在物體表面呈現(xiàn)三種:周期性、準周期性或隨機性。
如今,神經(jīng)網(wǎng)絡、最近鄰分類器、決策樹和支持向量機等模式方法已經(jīng)廣泛的應用到了許多領(lǐng)域,譬如圖像分類、視頻處理、檢索等。模式類就是由一些共同屬性所決定的,模式分類就是根據(jù)對象的特征或?qū)傩赃M行分類。
按照學習方法的監(jiān)督程度,也就是根據(jù)否存在先驗知識并且是否使用到這些先驗知識,模式分類方法可以分為監(jiān)督分類和非監(jiān)督分類。
監(jiān)督分類對各對象分類的依據(jù)是通過訓練樣本,選擇合適的特征參數(shù),以此建立判別函數(shù)。監(jiān)督分類必須要有分類區(qū)域的先驗類別知識用以建立判別函數(shù),從而獲得訓練分類器,它把圖像分解為多個組成部分,求解各部分之間的空間關(guān)系。一般監(jiān)督分類在訓練階段需要手工選擇分類區(qū)域從而可以確定模型。
在沒有先驗知識情況下,非監(jiān)督分類能夠有效地分類,是因為其根據(jù)圖像像元間的相似度和從分析數(shù)據(jù)上得到的統(tǒng)計特性,它不需要獲取判別函數(shù)集而去進行場地訓練。熟知并且常用的K-means和ISODATA法就是非監(jiān)督分類方法,也是一種聚類分析方法。這種方法是將圖像視作一些特征的集合,先對這些特征進行聚類分析,得到特征單詞和特征碼,再用統(tǒng)計方法對特征單詞和特征碼進行統(tǒng)計分析,最后根據(jù)統(tǒng)計特征進行有效分類。
前面一種分類是根據(jù)監(jiān)督程度來劃分,模式分類方法還可以分為經(jīng)驗型分類方法和理論型分類方法,此時是根據(jù)有無前人分類算法的思想。經(jīng)驗型方法中比較常用的有最近鄰分類器、RBF網(wǎng)絡和神經(jīng)網(wǎng)絡等。理論型模式分類算法比較常用的有貝葉斯分類器,支持向量機,這種分類算法數(shù)量較少,遠沒有經(jīng)驗型分類方法多。貝葉斯分類器通過計算樣本概率的差異,將樣本進行分類,但是分布函數(shù)的求取較為困難;支持向量機方法SVM基于統(tǒng)計學習理論,在實際應用中取得了一定的成效。
篇7
關(guān)鍵詞:計算機專業(yè)教育;圖形學;圖像處理;多媒體;教學改革
中圖分類號:TP391,G642 文獻標識碼:A
文章編號:1672-5913 (2007) 24-0080-05
1對圖形圖像與多媒體知識的要求
1.1CC2004知識領(lǐng)域要求
在CC2004中,和圖形圖像與多媒體相關(guān)的知識領(lǐng)域是人―機交互(Human-Computer Interaction -HC)、圖形學與可視計算(Graphics & Visual Computing-GV)、信息系統(tǒng)(Information Management -IM)、網(wǎng)絡計算(NetCentric Computing-NC)等幾個部分。表1是CC2004列出的五種課程計劃中所含人―機交互和圖形學與可視計算兩個計算機主題的比重。表中的數(shù)字表示對應的專業(yè)與相應的知識域的相關(guān)性,范圍從0~5。其中,min值表示該學科報告中列舉的學生對相應知識域掌握的典型的最低要求,也是相對于其它專業(yè)最低要求的值,max值表示該專業(yè)學生對相應知識域掌握的典型的最高要求。
表1 計算機主題的比重
分析CC2004中各課程計劃和表1可得出,CC-CS2001對圖形圖像與多媒體的知識要求最高,所涉及的具體知識單元見表2。
表2 和圖形圖像與多媒體相關(guān)的知識單元
CC-CS2001在附錄B的課程描述中,推薦了一些覆蓋知識領(lǐng)域和單元的課程,每門課程里對預備課程、課程提綱、覆蓋的知識單元、各單元學時做了較為詳細的描述。相應地,和圖形圖像與多媒體有關(guān)的中介課程有CS250W人機交互和CS255W計算機圖形學等課程,高級課程有CS352圖形用戶接口、CS355高級計算機圖形學、CS356圖像處理等課程,但高級課程只給出課程名稱,還沒有詳細描述。
CS250W人機交互課程要求全面介紹人機交互原理和技術(shù),CS255W計算機圖形學課程則要介紹計算機圖形學的原理和技術(shù),兩門課程覆蓋的知識單元見表3。
表3 CS250W和CS255W的知識單元
1.2CCC2002和教指委計算機科學規(guī)范的要求
CCC2002同CC2001一樣,把計算機科學與技術(shù)學科的知識體系劃分為知識領(lǐng)域、知識單元和知識點等三個相互關(guān)聯(lián)的層次結(jié)構(gòu)。完整的本科課程體系結(jié)構(gòu)由三部分組成,即奠定基礎的基礎課程,涵蓋知識體系大部分核心單元的主干課程,用來完備課程體系的特色課程。根據(jù)我國計算機科學與技術(shù)學科教育的現(xiàn)狀及對典型課程設置的分析,給出了16門課程,分別為計算機導論,程序設計基礎,離散結(jié)構(gòu),算法與數(shù)據(jù)結(jié)構(gòu),計算機組織與體系結(jié)構(gòu),微型機系統(tǒng)與接口,操作系統(tǒng),數(shù)據(jù)庫系統(tǒng)原理,編譯原理,軟件工程,計算機圖形學,計算機網(wǎng)絡,人工智能,數(shù)字邏輯,計算機組成基礎,計算機體系結(jié)構(gòu)。在教指委的《計算機科學規(guī)范》中,也選取部分知識單元組成了15門核心課程,分別是計算機導論,程序設計基礎,離散結(jié)構(gòu),算法與數(shù)據(jù)結(jié)構(gòu),計算機組成基礎,計算機體系結(jié)構(gòu),操作系統(tǒng),數(shù)據(jù)庫系統(tǒng)原理,編譯原理,軟件工程,計算機圖形學,計算機網(wǎng)絡,人工智能,數(shù)字邏輯,社會與職業(yè)道德。可見,計算機圖形學都為核心課程之一。
在《計算機科學規(guī)范》中,計算機圖形學和可視化計算可以劃分成以下四個相互關(guān)聯(lián)的領(lǐng)域:
(1) 計算機圖形學:計算機圖形學是一門以計算機產(chǎn)生并在其上展示的圖像作為通信信息的藝術(shù)和科學。它有以下幾方面的要求:①表示信息的模型的設計和構(gòu)建應有助于圖像的產(chǎn)生和觀察;②方便用戶使之能夠通過精心設計的設備和技術(shù)與模型(或者說觀察到的圖像)進行交互;③能提供繪制模型的技術(shù);④設計出有助于圖像保存的技術(shù)。計算機圖形學的目標是對人類的視覺中心及其他的認知中心有進一步深入的了解;
(2) 可視化技術(shù):主要目標是確定并展示存在于科學的(如計算和醫(yī)學科學)和比較抽象的數(shù)據(jù)集中的基本的相互關(guān)聯(lián)結(jié)構(gòu)與關(guān)系。展示的主要目標則應當是發(fā)掘在數(shù)據(jù)集中潛在的信息,從而有助于用戶增強對它們的理解。雖然,當前的可視化技術(shù)主要是探索人類的視覺能力,但是其他的一些感知通道,包括觸覺和聽覺,也均在考慮之中,以便通過它們進一步發(fā)現(xiàn)信息的處理過程;
(3) 虛擬現(xiàn)實:虛擬現(xiàn)實(VR)是要讓用戶經(jīng)歷由計算機圖形學以及可能的其他感知通道所產(chǎn)生的三維環(huán)境,提供一種能增進用戶與計算機創(chuàng)建的“世界”交互作用的環(huán)境;
(4) 計算機視覺:計算機視覺的目標是推導出一幅或多幅二維圖像所表示的三維圖像世界的結(jié)構(gòu)及性質(zhì)。對計算機視覺的理解和實踐依賴于計算學科中的核心概念,但也和其他一些學科(如物理、數(shù)學、心理學等)密切相關(guān)。
CC2004和CCC2002的規(guī)范中給出的課程建議規(guī)定了每門課程的最小核心內(nèi)容,包括的這些單元是要獲得學位必須具備的相應知識。核心單元不是課程的全部,核心單元是課程最小的部分,但不能構(gòu)成完整的本科課程,每門課程應當包括來自知識體系中的附加選修單元。核心單元不能僅安排在本科階段的入門性課程中。許多核心單元屬于入門的導論性知識,但這不意味著它們必須安排在低年級的入門性課程中,因為有些導論性的知識,只有當學生具有必需的基礎知識后才能接受。另外,引論性課程也可以包括選修單元。所以核心這一說法只是意味著必須具備的含義,而并沒有限制它必須安排在那些課程里。
從以上國內(nèi)外計算機專業(yè)推薦的教學計劃和設置的課程可以得到,涉及到圖形圖像與多媒體的內(nèi)容,一般宜設置計算機圖形學、數(shù)字圖像處理、多媒體技術(shù)等課程及相關(guān)課程,可涵蓋的知識有人―機交互、圖形學、圖像處理、多媒體技術(shù)等基礎內(nèi)容,這樣才可基本達到規(guī)范的要求。
2部分高校課程開設情況
從網(wǎng)上可查到的清華大學、上海交通大學、中國科技大學等幾所高校的計算機科學與技術(shù)專業(yè)本科生培養(yǎng)教學計劃中計算機圖形學、數(shù)字圖像處理、多媒體技術(shù)等課程設置情況如表4。
表4 涉及圖形圖像與多媒體類課程開設情況
從表4可看到,近幾年在計算機專業(yè)里,國內(nèi)的大學普遍增加了圖形圖像與多媒體類課程的課程數(shù)量和教學時間。
3 存在問題及教改研究
3.1問題
篇8
微軟的游戲操控設備 Kinect 有一句廣告語:You are the controller(你就是遙控器)。通過 Kinect,普通人不需要使用任何手柄、搖桿、鼠標或者其他遙控器就能操控游戲,這讓 Kinect 遠遠超越了普通家用游戲機的段位。事實是,人們也沒有把它僅僅當成游戲機,無數(shù)黑客對其進行破解,開發(fā)出一系列創(chuàng)新發(fā)明,有模擬光劍道具,也有自動跟著垃圾跑的垃圾桶,甚至英國一所大學正在基于它研發(fā)一種技術(shù)幫助中風患者恢復健康。
新的人機交互方式讓計算機能讀懂人所傳遞的命令?,F(xiàn)在,眼睛是人們開發(fā)的下一個目標。去年底丹麥公司 Senseye 了一個視頻,視頻里,一個人捧著平板電腦在玩“切水果”的游戲——不過,他沒有動一根手指,而是完全用眼神控制。后來,這家由四個丹麥博士生創(chuàng)立的公司改名為“The Eye Tribe”,他們開發(fā)的眼控技術(shù)能通過智能手機或者平板電腦的前置攝像頭獲取圖像,利用計算機視覺算法進行分析。軟件能定位眼睛的位置,估計你正在看屏幕的什么地方,甚至精確到非常小的圖標。這項眼控技術(shù)能夠取代手指,控制平板電腦或手機。據(jù)國外媒體報道,他們已經(jīng)開始與手機制造商和運營商進行合作,希望明年能將正式產(chǎn)品推向市場。
除了用眼神控制手機,用眼睛操控的概念筆記本、眼控相機等產(chǎn)品也已面世。以眼神的移動軌跡為基礎進行的人機交互方式,是繼 Kinect 之后人機交互界面的又一次革命。
眼睛上的實驗
17 世紀初,人們就開始研究眼睛的運動。1879 年,法國人路易斯·艾米·賈維爾觀察到,人們的眼睛在閱讀文字時,并非像之前猜想的是平滑地一行行掃射,而是每隔幾個字就會有短暫的視覺停留。
于是人們很好奇:閱讀時,眼睛會停留在哪些字上?停留多長時間?
為了研究這個問題,埃德蒙·休伊做出世界上第一個眼睛追蹤器:一個有洞的隱形眼鏡,和一個會根據(jù)眼睛活動擺動指針的鋁制指示器相連。但這個追蹤器因為要和眼球接觸,對眼睛的干擾比較大。另一個芝加哥的家伙托馬斯·巴斯維爾轉(zhuǎn)換了思路,做出了一個非接觸式的追蹤器,他利用光束照射眼睛,通過在電影膠片上記錄眼睛反射的光記錄眼睛的活動軌跡。他用這個裝置研究人們閱讀和觀看圖片的行為習慣。
到了 1980 年,眼睛追蹤器被用來研究和人機交互有關(guān)的問題;比如,研究人員很好奇用戶如何在電腦菜單中搜索命令。最近幾年,人們越來越多運用眼部追蹤器研究用戶如何和不同的計算機界面互動,結(jié)果往往能改變界面的設計。其他的研究包括用戶如何對待下拉菜單,他們通常將注意力集中在網(wǎng)站的什么位置,開發(fā)人員就會知道該在哪里設計廣告位。
隨著眼控技術(shù)的發(fā)展,和人類對視覺生理及心理的了解,基于人類視覺系統(tǒng)(Human Vision System, 簡稱“HVS”)的凝視繪制技術(shù)也逐漸成為圖形學的研究熱點。這種技術(shù)通過略去不為用戶感知的畫面區(qū)域的圖像細節(jié)來提高圖像的繪制和顯示效率。
在研究中,人們普遍達成的共識是,“注意力”和眼睛看在哪并不統(tǒng)一,前者總是比眼睛要領(lǐng)先大約 100-250 微秒;也就是說,人的注意力轉(zhuǎn)移到新的位置 100-250 微秒后,眼睛才會跟隨其后。
在技術(shù)上,眼控技術(shù)已經(jīng)相當成熟,在工業(yè)控制、機器人學和臨床醫(yī)學領(lǐng)域都有應用,只是還沒有應用到消費領(lǐng)域。它是基于角膜反射原理,通過光在用戶眼睛角膜上形成高亮度反射點作為參考點,當眼球轉(zhuǎn)動注視屏幕上不同位置時,由于眼球近似為球體,光斑不動,瞳孔相對光斑發(fā)生偏移,利用瞳孔中心和光斑的位置關(guān)系就能確定視線方向。目前運用最廣泛的設計是以視頻為基礎的眼睛追蹤器。一個設想鏡頭聚焦在一只或一雙眼睛上,在觀眾受到某種刺激時記錄它們的變動。眼控技術(shù)的核心是算法,如何讓系統(tǒng)迅速準確地“學習”人眼睛的各種行為,這是個挑戰(zhàn)。
EyePhone 應該翻譯成“眼機”或者“目機”?似乎都不太好聽。在大觸屏手機廣泛流行之前,有人就開始研究如何用眼睛控制手機了。
美國達特茅斯學院(Dartmouth College)就有一支眼控手機的研發(fā)團隊,他們試圖創(chuàng)造一套眼睛追蹤系統(tǒng),開發(fā)以眼睛來控制手機的操作方法。
讓眼睛追蹤系統(tǒng)運用到操作系統(tǒng)里,重要的是設計一套能夠?qū)崿F(xiàn)的軟件。首先,你需要校準這個系統(tǒng),在室內(nèi)室外不同光線下盯著同一張圖片看,讓軟件學習、識別你的眼睛在不同光照條件下的運動。他們在諾基亞 N810 上做了試驗,設計出一個初始“眼菜單”,屏幕被分為9格,分別對應郵件、接電話、拍照片、日歷、短信等不同功能。當一個人盯著某一塊區(qū)域看時,某一個功能區(qū)域就被激活高亮顯示,一眨眼,這個功能就被激活。
根據(jù)《麻省理工科技評論》雜志 2010 年的報道,眼控式手機的技術(shù)研發(fā)已經(jīng)數(shù)年。進行這項技術(shù)開發(fā)的主要目的,是希望能讓手部殘疾的人克服無法使用電話的障礙。
在這項研究中,整個系統(tǒng)技術(shù)含量最高的部分就是自動校正系統(tǒng),它需要算法優(yōu)化,提高光學采集精度,實現(xiàn)視線跟蹤,適應外部環(huán)境光強度變化,判別眼睛睜、閉狀態(tài)等。帶領(lǐng)“EyePhone”研發(fā)團隊的安德魯·坎貝爾(Andrew Campbel)教授認為,眼控式手機解放了雙手,不僅僅是殘疾人,每個人都能享受到它帶來的極大便利。但靠眼神操作手機,比在桌上的電腦執(zhí)行眼控指令更困難,因為使用者和手機都是行動中的物體,而周圍環(huán)境也是變幻莫測,如何演算和辨識使用者在不同的狀態(tài)下所傳達的眼神收發(fā)訊號,是最難解決的問題。
在 2011 年的 Cebit 展上,聯(lián)想和瑞典眼控技術(shù)公司 Tobbi 聯(lián)合了一款概念筆記本,特制的長方形感應器能夠追逐眼球的移動軌跡,記錄數(shù)據(jù),電腦處理器把這些數(shù)據(jù)轉(zhuǎn)化為鼠標控制,整個系統(tǒng)并不會讓眼控的過程感覺十分刻意,也不會像傳統(tǒng)的眼控系統(tǒng)一樣過于敏感或是過于駑鈍。
Tobii 公司成立于 2001 年,是一家專門研發(fā)眼動追蹤和眼動控制技術(shù)的公司。除了桌面眼動電腦,他們也在研發(fā)一款具備眼控界面的 windows 平板電腦 C12,用戶可以轉(zhuǎn)動眼珠來移動 C12 上的鼠標指針,而眨眼則代表點擊。機器里設置了一個校準界面,允許多個用戶定義眼控指令。
篇9
【關(guān)鍵詞】灰度化 RGB HSI HSV
一、引言
彩色攝像機采集的圖像一般是RGB三個顏色通道的模型,即擁有紅(700nm)、綠(546.1nm)、藍(435.8nm)三個分量,這三個分量不同比例的混合,可以得到人類視覺上幾乎全部的色彩信息[1]。但由于該信息占據(jù)存儲空間大小灰度化后的三倍,并且三個通道沒辦法按照數(shù)學方法進行一些必要的處理(比如邊緣檢測或者二值化),故需將RGB模型處理成為一種新的色彩通道,該模型只有一個色彩通道,可以令R=G=B,這樣原本用三個通道的信息,便轉(zhuǎn)化為一個叫做灰度的值,而這個值的范圍同樣是0~255,并且可以直觀地認為,該數(shù)字表示圖像上色彩的亮度。由于彩色光(RGB混合)同一波長有可能對應不同的混合顏色,所以我們又定義了色調(diào)、飽和度、明度的概念。色調(diào)用于標識顏色,如果顏色可以用單一色光和白光按照一定比例配合,則這個顏色的色調(diào)用此單一色光的波長表示,若非單色光和白光按照比例合成,則這個顏色的色調(diào)用此非單色光的補光表示[2]。飽和度用以表示顏色的純潔程度,明度用于表示顏色的明亮程度。要提取亮度分量,需要用到HSV和HSL模式。HSV由色調(diào)、飽和度、純度表示顏色。HSL則由色調(diào)、飽和度、亮度三個通道構(gòu)成,是目前應用最多的色彩模式之一[3~4]。灰度化一般可以采取RGB分量、HSL分量、HSV分量、HSI分量等方式。
二、 灰度化原理
(一)RGB分量法:將RGB空間中的R分量、G分量或B分量提取出來稱為強度信號,變?yōu)樗膱D形。
(二)HSL分量法:將RGB空間按公式轉(zhuǎn)換為HSL空間,然后分別提取H、S、L分量[5]。
(三)HSV分量法:將RGB空間按公式轉(zhuǎn)換為HSV空間,然后分別提取H、S、L分量。
(四)HSI分量法:人的視覺系統(tǒng)經(jīng)常采用HSI色彩空間,它比RGB色彩空間更符合人的視覺特性。在圖像處理和計算機視覺中大量算法都可在HSI色彩空間中方便地使用,它們可以分開處理而且是相互獨立的。因此,在HSI色彩空間可以大大簡化圖像分析和處理的工作量。
三、灰度化的實現(xiàn)
四、總結(jié)
本文介紹了幾種圖像灰度化的方法,并用LABVIEW編程實現(xiàn)了,仿真結(jié)果表明對于不同的圖像應該針對圖像本身采用相應的灰度化方法。
參考文獻:
[1]郝建青,張仲義,陳濱.基于車輛實時跟蹤的編組站綜合自動化系統(tǒng)集成方案的研究[J].鐵道學報,2000,(2):1-6.
[2]徐杰民,肖云.二維條碼技術(shù)現(xiàn)狀及發(fā)展前景[J].計算機與現(xiàn)代化,2004,(12):141-142.
[3]張聰,張慧.復雜背景下維條碼圖像的提取[J].微計算機信息,2007,23(10):302-304.
[4]霍宏濤,林小竹,何薇.數(shù)字圖像處理[M].北京:北京理工大學出版社,2003.
[5]劉紅霞.圖像分割算法的研究與實現(xiàn)[D].上海:華東師范大學,2004.
作者簡介:
篇10
Linear Algebra Tools for Data Mining
2012,880 p
Hardcover
ISBN9789814383493
Dan A Simovici著
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)挖掘技術(shù)逐漸走向了應用的前臺。從文本檢索到社交關(guān)系挖掘,從計算機視覺到語音識別,從推薦系統(tǒng)到網(wǎng)絡安全,眾多應用領(lǐng)域都需要數(shù)據(jù)挖掘技術(shù)的支撐。而隨著數(shù)據(jù)規(guī)模的膨脹,數(shù)據(jù)挖掘技術(shù)也面臨著如何提高效率、提高可擴展性的挑戰(zhàn)。為此科學家們提出很多解決思路,其中基于矩陣計算或線性代數(shù)的數(shù)據(jù)挖掘技術(shù)因其易于并行化且計算效率相對較高等優(yōu)勢而受到研究人員的青睞。而對于計算機科學或者工科計算技術(shù)的教材來說,一般只對線性代數(shù)的理論和技術(shù)進行講解,很少能與實際應用進行結(jié)合。本書的目的就是希望彌補這一空白,把傳統(tǒng)的線性代數(shù)內(nèi)容與最新的數(shù)據(jù)挖掘技術(shù)結(jié)合在一起展示給人們。
本書分為線性代數(shù)理論部分和數(shù)據(jù)挖掘應用部分,共包含16章。線性代數(shù)部分,含第1-10章:1.通過基本代數(shù)結(jié)構(gòu)的建立引入線性空間;2.矩陣的概念;3.MATLAB的基本編程;4.行列式;5.線性空間中的范式;6.內(nèi)積空間;7.凸性;8.特征值;9.相似和譜;10.矩陣的SVD(奇異值分解)。第2部分講解了線性代數(shù)在數(shù)據(jù)挖掘中的應用,含第11-16章:11.矩陣在圖中的應用;12.數(shù)據(jù)采樣矩陣;13.最小二乘近似和數(shù)據(jù)挖掘;14.維度約減技術(shù);15.kMeans聚類;16.圖的譜和譜聚類。
本書非常好地把線性代數(shù)和數(shù)據(jù)挖掘結(jié)合起來進行介紹,使得科研人員不僅能深化對于矩陣和線性代數(shù)理論的認識,又可以從應用中理解各種方法的作用。本書的作者Dan A Simovici教授是馬薩諸塞波士頓大學計算機科學系的教授,多年來致力于將基本數(shù)學理論與數(shù)據(jù)挖掘技術(shù)相結(jié)合的教學研究工作。他目前還在撰寫另一本圖書《數(shù)據(jù)挖掘的數(shù)學工具(Mathematical Tools for Data Mining)》,預計2014年會由Springer出版。本書非常適合在讀研究生和相關(guān)科研人員閱讀。
張志斌,副研究員
(中國科學院計算技術(shù)研究所)
熱門標簽
計算機畢業(yè)論文 計算機論文 計算機技術(shù)論文 計算機教育論文 計算機專業(yè)論文 計算機專業(yè)畢業(yè)論文 計算機教學論文 計算機基礎論文 計算機應用論文 計算化學論文 心理培訓 人文科學概論