人臉檢測(cè)中眼睛定位算法研究論文
時(shí)間:2022-10-11 10:59:00
導(dǎo)語:人臉檢測(cè)中眼睛定位算法研究論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要眼睛是一個(gè)在人臉檢測(cè)中極為重要的人臉特征,因此一種快速可靠的精確定位眼睛的算法對(duì)許多實(shí)際的應(yīng)用是十分重要的。本文分析了幾種常用的眼睛定位算法,并提出了一種基于膚色信息、人臉面部幾何特征和人眼灰度信息的算法。算法采用由粗到細(xì)的檢測(cè)策略,先對(duì)AnilK.Jain的Cb、Cr橢圓聚類方法進(jìn)行了改進(jìn),用改進(jìn)的算法進(jìn)行膚色提取,經(jīng)過膚色區(qū)域的分析,對(duì)人臉區(qū)域進(jìn)行預(yù)檢測(cè),然后結(jié)合人眼幾何特征進(jìn)行初步定位,再利用人眼的灰度信息進(jìn)行精確定位。該算法定位效率高,并對(duì)背景、尺寸等細(xì)節(jié)具有很好的適應(yīng)性,在人臉實(shí)時(shí)檢測(cè)系統(tǒng)中具有很好的應(yīng)用價(jià)值。
關(guān)鍵詞眼睛定位;膚色提?。粠缀翁卣?;復(fù)雜度
1引言
雙眼是人臉的突出特征,它們?cè)谌四樦姓紦?jù)比較固定的位置,雙眼間的距離刻畫了人臉的大小,是人臉識(shí)別中尺度歸一化的依據(jù)。因此雙眼的精確定位成為人臉識(shí)別前處理階段非常關(guān)鍵的一步,絕大部分的人臉識(shí)別算法都強(qiáng)烈地依賴于雙眼的準(zhǔn)確定位。只要人眼被精確定位,則臉部其他特征,如眉、鼻、嘴等,可由潛在的分布關(guān)系比較準(zhǔn)確地定位。人臉可以較好地歸一化,預(yù)處理的效果也更明顯,同時(shí)也可提高識(shí)別速度和降低識(shí)別算法的復(fù)雜度。
正因?yàn)檠劬Χㄎ辉谌四樧R(shí)別中具有如此重要的地位,于是人們研究各種算法來實(shí)現(xiàn)眼睛定位,主要可以分為以下幾類:霍夫變換法、變形模板法、邊緣特征分析法和對(duì)稱變換法等,本文結(jié)合人臉的膚色和幾何特征以及人眼的灰度信息提出了一種快速、穩(wěn)定的人眼定位算法。
2常用的幾種眼睛定位算法
(1)霍夫變換法
假設(shè)經(jīng)預(yù)處理已經(jīng)得到包含眼球的圖像Ep,為了節(jié)省檢測(cè)眼球的時(shí)間并避免鏡片反光點(diǎn)邊緣產(chǎn)生的干擾,先用小灰度聚類法粗定眼球中心點(diǎn),以此縮小檢測(cè)范圍,聚類的過程是將圖像Ep中灰度值最小的n個(gè)像素,按列遞增的順序排序,若相鄰的列數(shù)差值都未超過預(yù)先設(shè)定的門限T1,說明只有一個(gè)聚類中心,求出這些像素行列的平均值就是要找的眼球中心點(diǎn);若超過了門限T1,說明這n個(gè)像素可以聚成兩類,對(duì)左眼,因?yàn)殛幱?、鏡腳集中在左邊,所以取右邊那類的平均值;對(duì)右眼,則取左邊那類的平均值;n的選擇可根據(jù)圖像Ep的總像素?cái)?shù)目及眼球占圖像的大致百分比決定。
在用霍夫變換檢測(cè)眼球前,先用Canny算法提取邊緣。對(duì)于比較細(xì)長的眼睛,由于眼球的上半部分較多地被眼皮覆蓋,所以改用檢測(cè)下半圓,這樣更可靠且省時(shí)。設(shè)圖像空間為(i,j),i和j分別表示行和列,三維變換空間為(ie,je,R),其中ie、je分別代表眼球圓心的行和列,R為半徑。下半圓表達(dá)式為:
(1)
對(duì)于變換空間的每一個(gè)坐標(biāo)點(diǎn)(ie,je,R),在圖像空間都對(duì)應(yīng)一個(gè)半圓,在這個(gè)半圓上存在的邊緣點(diǎn)數(shù)就是變換空間上坐標(biāo)點(diǎn)(ie,je,R)對(duì)應(yīng)的值。變換空間上的峰值點(diǎn)坐標(biāo)即為所求的眼球半圓參數(shù)。實(shí)驗(yàn)證明,霍夫變換確實(shí)具有抗干擾能力強(qiáng)的優(yōu)點(diǎn)。當(dāng)眼球與眼白的對(duì)比度較低時(shí),提取出來的邊緣是斷裂或不很規(guī)則的,即使如此,仍能根據(jù)變換空間中的峰值點(diǎn)準(zhǔn)確地定位眼球圓心[2]。
(2)變形模板法
模板匹配法主要是模板的選擇,根據(jù)所選模板的維數(shù)可分為二維可變形模板和三維可變形模板。圖1為二維簡單眼睛模板,由于人臉的旋轉(zhuǎn)角度是任意的,當(dāng)旋轉(zhuǎn)角度比較大時(shí),其中一部分眼白就會(huì)看不見,所以為了適應(yīng)人臉向兩側(cè)作較大角度的旋轉(zhuǎn),就增加了兩個(gè)單眼白的簡單眼睛模板,當(dāng)垂直旋轉(zhuǎn)角度大于30°時(shí),就使用僅有左眼白的簡單眼睛模板,如圖1a所示,當(dāng)旋轉(zhuǎn)角度大于-30°時(shí),就使用僅有右眼白的簡單眼睛模板,如圖1b所示,若旋轉(zhuǎn)角度介于-30°和30°之間,就使用正常的雙眼白簡單眼睛模板,如圖1c所示。
圖1眼睛的變形模板
簡單二維眼睛模板可以用如下數(shù)學(xué)形式表示:
(2)
在進(jìn)行眼睛定位時(shí),不斷改變簡單眼睛模板的尺寸參數(shù)S和眼球中心位置參數(shù)(x,y),當(dāng)模板與人臉圖像取得最佳匹配時(shí)的對(duì)應(yīng)的尺度S就是眼睛的大小,中心位置(x,y)就是眼睛在人臉圖像中的位置。匹配時(shí)采用的能量函數(shù)與三維可變形模板中的能量函數(shù)類似。
三維可變形眼睛模板的生成源于人臉合成時(shí)用到的一般三維人臉模型。在一般三維人臉模型中,把眼睛特征點(diǎn)分截取出來,作為可變形眼睛模板的基本點(diǎn)。三維可變形眼睛模板是由10個(gè)基本三維點(diǎn)構(gòu)成的,如圖2所示,其中外部8個(gè)點(diǎn)組成了上、下眼瞼,內(nèi)部2個(gè)點(diǎn),決定眼球的所有邊界,其余的眼瞼三維點(diǎn)是由外部8個(gè)基本點(diǎn)線性插值得來的,而眼球上的三維點(diǎn)是通過內(nèi)部2點(diǎn)構(gòu)成的空間來定的。
圖2三維眼睛模板
三維可變形眼睛模板可以用以下的數(shù)學(xué)形式來表示:
(3)
其中,參數(shù)X=(x1,x2,x3…,y1,y2,y3,…,z1,z2,z3,…)是由10個(gè)三維基本點(diǎn)的坐標(biāo)組成,S表示三維可變形眼睛模板的尺度大小,θ表示眼睛模板的垂直旋轉(zhuǎn)角度,表示眼球的中心,也是整個(gè)三維眼睛模板的中心坐標(biāo)。眼睛模板的可變形性就體現(xiàn)在不僅模型的尺度S、角度θ和眼球的中心是可變化的,而且眼睛模板的形狀參數(shù)X也是可變化的。當(dāng)所有參數(shù)都進(jìn)行變化時(shí),將產(chǎn)生各種各樣的三維眼睛模板。在模板匹配時(shí),需要把這些三維模板影射成如圖3所示的二維眼睛映射模板,然后針對(duì)這些二維眼睛模板定義相應(yīng)的能量函數(shù),用最小值搜索算法求得最佳匹配。此時(shí)所對(duì)應(yīng)的眼睛模板坐標(biāo)就是需要求的眼球中心。
圖.3三維眼睛模型在不同旋轉(zhuǎn)角度下的二維映射
(3)邊緣特征分析法
此算法所處理的圖像為單人灰度圖像,是利用圖像的垂直灰度投影曲線,根據(jù)凸峰寬度確定人臉的左右邊界,然后利用人臉區(qū)域的水平灰度投影曲線確定頭頂及鼻子中部形成的上下邊界。利用預(yù)測(cè)法先確定人眼在眉眼區(qū)域的大概位置,通過檢測(cè)眉眼部位的邊緣及邊緣分組,確定雙眼的坐標(biāo)位置。
觀察不同單人臉圖像的垂直灰度投影曲線,可以發(fā)現(xiàn)人臉?biāo)趨^(qū)域?qū)⑹勾怪被叶韧队扒€形成一個(gè)具有一定寬度的凸峰。這個(gè)凸峰的左右邊界大致代表了人臉的左右邊界。當(dāng)人臉的左右邊界確定之后,取左右邊界之間的人臉區(qū)域作為研究對(duì)象,作該圖像的水平灰度投影曲線,觀察人臉區(qū)域圖像的水平投影曲線可以發(fā)現(xiàn),此曲線的第一個(gè)極小值點(diǎn)對(duì)應(yīng)人的頭頂,因?yàn)轭^發(fā)的低灰度產(chǎn)生了水平投影曲線的低谷,而曲線的最大值點(diǎn)和次最大值點(diǎn)分別對(duì)應(yīng)人的額頭部位和人的鼻中部,這樣就可以輕易地求得人眼所處的大致水平位置(如圖4所示)。
在邊緣檢測(cè)前先對(duì)眉眼區(qū)域進(jìn)行去噪、增強(qiáng)處理,使圖像平滑,這是保證下面邊緣檢測(cè)獲得較好效果的關(guān)鍵步驟。然后用Canny算子求出眉眼區(qū)域的邊緣圖像[4],求解時(shí)閾值取得較高,使得邊緣點(diǎn)僅由眉毛和眼睛的強(qiáng)邊緣以及瞳孔產(chǎn)生的強(qiáng)邊緣組成,而不會(huì)包含由鼻子的輪廓產(chǎn)生的弱邊緣。隨后將邊緣點(diǎn)進(jìn)行分組,可以得到幾組分離的邊緣,其中位于下面的兩組分別為左右兩眼產(chǎn)生的邊緣,取這兩個(gè)邊緣組的中心作為人眼的中心。邊緣分組算法中,將分別包含每個(gè)邊緣分組的最小矩形作為人眼檢出,最先檢出的兩個(gè)分組分別對(duì)應(yīng)左眼和右眼。當(dāng)出現(xiàn)兩個(gè)分組后算法立即結(jié)束,提高了執(zhí)行效率。
(a)原圖像
(b)在水平方向上的投影
(c)在垂直方向上的投影
圖4水平方向和垂直方向的投影結(jié)果示意圖
該算法的優(yōu)勢(shì)在于首先通過灰度投影曲線確定眉眼區(qū)域,使數(shù)據(jù)量大大減少,然后在有效的邊緣檢測(cè)之后,使用了高效的邊緣分組策略,在保證正確率的基礎(chǔ)上,提高了算法速度。此算法的定位錯(cuò)誤出現(xiàn)在頭部傾斜度過大,以及側(cè)光太強(qiáng),還有頭部在圖像中所占區(qū)域過小的情況。
(4)對(duì)稱變換法
在計(jì)算機(jī)視覺研究中,對(duì)稱性被認(rèn)為是物體的基本性質(zhì)之一,通常在將物體從背景中分割出來后,用來簡化物體形狀的描述,或物體的近似。目前研究最多的是點(diǎn)對(duì)稱(也叫中心對(duì)稱)和軸對(duì)稱,對(duì)人臉而言,眼睛、鼻子、嘴巴等都有很弱的點(diǎn)對(duì)稱性,廣義對(duì)稱變換正是用來描述物體的點(diǎn)對(duì)稱。文獻(xiàn)[3]利用廣義對(duì)稱變換定位人眼進(jìn)而提取臉部特征,文獻(xiàn)[4]在廣義對(duì)稱變換的基礎(chǔ)上,定義了一種方向?qū)ΨQ變換DST(DirectionalSymmetryTransform),用于人眼的精確定位。以上的對(duì)稱變換利用了人眼的中心強(qiáng)對(duì)稱和臉部特征的生理幾何分布,對(duì)人臉偏轉(zhuǎn)、臉部表情變化、光照變化等因素的左右不敏感,因而具有很好的魯棒性。但是,以上對(duì)稱變換的計(jì)算需要在大范圍的尺度上進(jìn)行,計(jì)算量很大,而且,由于只是描述了各點(diǎn)的局部對(duì)稱性,當(dāng)它用于人眼的定位時(shí)產(chǎn)生的候選點(diǎn)較多,不太利于眼睛的精確定位。
結(jié)合廣義對(duì)稱變化和方向?qū)ΨQ變換的優(yōu)點(diǎn),于是有了一種新的對(duì)稱變換——離散對(duì)稱變換,它不僅具有廣義對(duì)稱變換描述物體對(duì)稱性大小的特點(diǎn),而且通過對(duì)各點(diǎn)領(lǐng)域的考察,去除那些處于規(guī)則區(qū)域外的點(diǎn),可大大降低計(jì)算量,實(shí)現(xiàn)眼睛定位的快速算法。廣義對(duì)稱變換把圖像中的所有像素點(diǎn)同等對(duì)待,每個(gè)像素點(diǎn)都計(jì)算其對(duì)稱值。事實(shí)上,在圖像中物體的單一背景區(qū)域中,大面積的灰度均勻區(qū)域上的像素點(diǎn)在一定的尺度范圍內(nèi)不具有明顯意義的對(duì)稱性,所以就不必計(jì)算它的對(duì)稱值,而這樣的像素點(diǎn)在人臉圖像中占了很大一部分,如頭發(fā)、臉部除眼、嘴等特征區(qū)域之外的區(qū)域及部分身體區(qū)域。眼、嘴、鼻子等特征區(qū)域在大于其輪廓的范圍內(nèi)灰度有變化,這樣的區(qū)域我們把它稱為灰度不均勻區(qū)。離散對(duì)稱變換以減少計(jì)算量為出發(fā)點(diǎn),在計(jì)算對(duì)稱之前加入一個(gè)對(duì)圖像灰度不均勻區(qū)域的檢測(cè)步驟以減少計(jì)算量,然后定義了一個(gè)與廣義對(duì)稱變化相似的對(duì)稱算子來計(jì)算點(diǎn)對(duì)稱。
離散對(duì)稱變換實(shí)際上可看成一種非線形濾波,由于對(duì)每個(gè)像素點(diǎn)都進(jìn)行相同的領(lǐng)域處理,適合于并行處理,在定位圓形物體圓心時(shí),算子領(lǐng)域采用圓環(huán)。通過圖像的離散對(duì)稱變換后,眼睛中心點(diǎn)附近像素的對(duì)稱值一般都處在對(duì)稱值最大的前四、五位,對(duì)具有強(qiáng)對(duì)稱值的候選點(diǎn),采用兩條簡單的規(guī)則進(jìn)行篩選。規(guī)則(1):鄰近像素合并,一般選取對(duì)稱值內(nèi)最大的前10位候選點(diǎn),將其中位置相鄰的候選點(diǎn)合并到它們中對(duì)稱值最大的像素處;規(guī)則(2):幾何約束判別,對(duì)經(jīng)過規(guī)則(1)篩選后的候選點(diǎn),利用眼在臉部的幾何分布性質(zhì)進(jìn)一步篩選,取基本符合眼睛分布規(guī)律的兩點(diǎn)作為最終的定位雙眼結(jié)果。
3基于膚色、幾何特征和灰度信息的人眼定位
根據(jù)人眼灰度變化非常明顯這一顯著特點(diǎn),本文提出的基于膚色、幾何特征和灰度信息的人眼定位算法主要由以下幾步組成。
(1)膚色提取
膚色是人臉的重要信息,不依賴于面部的細(xì)節(jié)特征,對(duì)于旋轉(zhuǎn)、表情等變化情況都能適用,具有相對(duì)的穩(wěn)定性并且和大多數(shù)背景物體的顏色相區(qū)別。AnilK.Jain曾專門統(tǒng)計(jì)研究了皮膚的色彩模型,他提出的方法屬于色彩空間中的聚類模型,這一類膚色模型的建立要選取一種合適的色彩空間。文獻(xiàn)
[1]采用非線形分段膚色分割得到膚色區(qū)域在CbCr空間中近似于橢圓,可用如下公式表示:
(5)
a=25.39,b=14.03,ecx=1.60,ecy=2.41,
θ=2.53,cx=109.38,cy=152.02,
若大于1則不是膚色,否則為膚色。
AnilK.Jain的Cb、Cr橢圓聚類方法膚色分割效果較好,但是對(duì)于亮度較低的區(qū)域容易誤判為膚色,對(duì)于亮度較高的膚色區(qū)域會(huì)誤判為非膚色區(qū)域。本文針對(duì)AnilK.Jain的Cb、Cr橢圓聚類方法膚色分割的缺點(diǎn),首先對(duì)亮度信息進(jìn)行分段判斷,這樣克服了在高亮度區(qū)域和亮度較低的區(qū)域中存在的不足。通過多次實(shí)驗(yàn)統(tǒng)計(jì)表明,對(duì)于亮度小于80的非膚色像素點(diǎn)會(huì)誤判為膚色點(diǎn),比如眼睛區(qū)域等。對(duì)與大于230的膚色像素點(diǎn)會(huì)誤判為非膚色點(diǎn)(如圖1所示)。因此采用如下分段方法:
①對(duì)于亮度低于80像素點(diǎn)直接判決為非膚色像素點(diǎn)。
②對(duì)于亮度在80—230之間的像素點(diǎn)采用膚色的橢圓聚類方法
③對(duì)于亮度大于230的像素點(diǎn)進(jìn)行判決時(shí),將膚色的聚類時(shí)的橢圓的長短軸同時(shí)擴(kuò)大為原來的1.1倍
(a)原圖像(b)AnilK·Jain的方法(c)本文的方法
圖5膚色提取示意圖
圖5.c與圖5.b比較,在人眼區(qū)域此圖有更好更細(xì)致的檢測(cè)效果。實(shí)驗(yàn)結(jié)果表明本文的方法較之其它的膚色提取方法在人的五官部分有更好更細(xì)致的檢測(cè)效果。
(2)膚色區(qū)域分析
因?yàn)槿四樐w色建模是根據(jù)皮膚顏色來確定的,有可能把脖子、肩膀、手臂等膚色區(qū)域或是與膚色相近的其他物體也包括了進(jìn)去,所以得到的只能是人臉的大致區(qū)域,需要進(jìn)一步通過各種算法將那些非人臉區(qū)域盡可能都去除掉。為了排除非人臉區(qū)域,依據(jù)人臉區(qū)域的空間特征,本文選取了連通區(qū)域像素?cái)?shù)、區(qū)域填充率和長寬比判斷因素。
●連通區(qū)域像素?cái)?shù)
因?yàn)槿四樣幸欢ǖ拇笮?,通常人臉小?9*19則無法識(shí)別,因此對(duì)于n值小于300的塊我們認(rèn)為是非人臉將其值置為背景是合理的。
●區(qū)域填充率
對(duì)于二值化之后的一個(gè)連通區(qū)域,系統(tǒng)中使用該區(qū)域的像素?cái)?shù)與外接矩形的像素?cái)?shù)的比值來表征這個(gè)區(qū)域的空間屬性。假設(shè)S’是外接矩形的像素?cái)?shù),S為目標(biāo)區(qū)域的像素?cái)?shù),若0.5<S/S’<0.9,就暫時(shí)保留該區(qū)域,否則就將其刪除。
●長寬比
通過對(duì)人臉特征的統(tǒng)計(jì),人臉的長寬比應(yīng)該大致在這樣的一個(gè)范圍內(nèi):0.6<人臉長寬比<1.5。考慮到人臉區(qū)域和脖子區(qū)域大都是連通的,所以實(shí)際處理中將比例修正到如下的范圍內(nèi):0.6<人臉長寬比<2。
通過以上判斷規(guī)則,得到的人臉候選區(qū)域結(jié)果(如圖6(a)所示)。
(3)形態(tài)學(xué)圖像處理
膚色提取后,圖像中仍然含有一些噪聲(主要在背景中)。噪聲的存在顯然會(huì)使后續(xù)的操作更為復(fù)雜。為了既能把圖像中的噪聲點(diǎn)去掉又能保持圖像有用信息不發(fā)生變化,本文使用形態(tài)學(xué)濾波器對(duì)人臉候選區(qū)域進(jìn)行除噪。通過形態(tài)學(xué)處理不但可以過濾由于噪音或者其他原因引起的一些較小的不可能為人臉的類膚色區(qū)域,減少候選區(qū)域和提高檢測(cè)速度,而且可以填補(bǔ)膚色區(qū)域內(nèi)的較小空洞,防止這些空洞被誤認(rèn)為是人臉器官所造成,為后續(xù)檢測(cè)區(qū)域降低了誤判的可能性。
(a)標(biāo)記人臉侯選區(qū)域(b)形態(tài)學(xué)濾波后的圖像(c)人眼粗定位結(jié)果
圖6眼睛粗定位示意圖
(4)基于幾何規(guī)則的人眼粗檢測(cè)
經(jīng)過以上步驟處理,系統(tǒng)基本上可以得到人臉器官的色塊圖,而各個(gè)色塊的中心點(diǎn)是眼睛的候選點(diǎn)。通過人臉面部的幾何特征規(guī)則,可以迅速粗略檢測(cè)出人眼,其結(jié)果如圖6(c)所示。規(guī)則如下:
①在候選人臉區(qū)域上面的1/2區(qū)域內(nèi),搜索孤立黑塊,并求出各個(gè)黑塊的中心點(diǎn)坐標(biāo)。在求中心點(diǎn)坐標(biāo)時(shí),本文使用公式(6)計(jì)算黑塊像素點(diǎn)的平均坐標(biāo)點(diǎn)作為中心點(diǎn)坐標(biāo),并將中心點(diǎn)的坐標(biāo)按x坐標(biāo)值由小到大進(jìn)行排序。Bm×2是黑塊像素點(diǎn)的坐標(biāo)矩陣,一共m行,B(i,1)是黑塊像素點(diǎn)的橫坐標(biāo),B(i,2)是黑塊像素點(diǎn)的縱坐標(biāo)。
(6)
②雙眼中心距應(yīng)在某個(gè)范圍之內(nèi)(如30~100個(gè)像素距離)。
③雙眼中心點(diǎn)的連線與x軸正向夾角應(yīng)在一定范圍之內(nèi)(如-π/18~π/18)。
在上述過程中,已經(jīng)初步確定了候選眼睛對(duì)。但由于眉毛在眼睛的上方,若只依據(jù)上述規(guī)則定位眼睛,我們常常會(huì)碰到以下兩種情況:①檢測(cè)到眼睛對(duì)和眉毛對(duì);②檢測(cè)到眼睛對(duì)以及眼睛-眉毛對(duì)。然而,人眼既具有灰度值較低的區(qū)域,同時(shí)也具有灰度值較高的區(qū)域,且灰度值具有突變性。因此,本文就根據(jù)人眼灰度變化非常明顯這一特征,通過計(jì)算候選眼睛對(duì)的灰度復(fù)雜度來進(jìn)行精確定位。
假設(shè)檢測(cè)出的圖像塊,每塊總共m行n列,則圖像塊的復(fù)雜度Com(k)的計(jì)算公式由(7)定義。
(7)
其中,Bi,j為圖像塊第i列第j行像素點(diǎn)的灰度值。
此圖像塊的復(fù)雜度公式Com(k)計(jì)算了圖像塊灰度值的縱向一階加權(quán)導(dǎo)數(shù),min(j,m-j)即為權(quán),離圖像中心越近導(dǎo)數(shù)的權(quán)越大,橫向坐標(biāo)沒有加權(quán)。實(shí)驗(yàn)證明,這種定義符合人臉特征器官復(fù)雜度的計(jì)算。類似的也可以有橫向一階加權(quán)導(dǎo)數(shù)。但是通過實(shí)驗(yàn)發(fā)現(xiàn)人眼的縱向一階加權(quán)導(dǎo)數(shù)大,所以我們采用圖像塊灰度值的一階縱向加權(quán)導(dǎo)數(shù)。
(a)相應(yīng)的灰度圖像(b)人眼精確定位結(jié)果
圖7眼睛精確定位示意圖
計(jì)算候選眼睛塊的圖像復(fù)雜度,根據(jù)人眼灰度變化非常明顯這一特征,找出復(fù)雜度最大的兩小塊,即為要找的眼睛塊(如圖7(b)所示)。
4實(shí)驗(yàn)結(jié)果分析
根據(jù)上面介紹的5個(gè)步驟,對(duì)眼睛的定位實(shí)驗(yàn)結(jié)果如圖8所示。
(a)原圖像(b)膚色提取后的圖像(c)標(biāo)記人臉候選區(qū)域
(d)形態(tài)學(xué)濾波結(jié)果(e)人眼粗定位結(jié)果(f)人眼精確定位結(jié)果
圖8基于膚色、幾何特征和灰度信息的人眼定位結(jié)果示意圖
通過實(shí)驗(yàn)結(jié)果可得到如下結(jié)論:
①采用由粗到精的檢測(cè)策略,先通過膚色特征對(duì)人臉區(qū)域進(jìn)行預(yù)選,再用幾何特征進(jìn)行人眼粗定位,具有很高的檢測(cè)速度;本文針對(duì)AnilK·Jain的Cb、Cr橢圓聚類法的缺點(diǎn),增加了亮度信息的判斷,實(shí)驗(yàn)證明,該方法能很好的提取人臉面部的眼睛、嘴巴等;
②經(jīng)過幾何特征進(jìn)行粗定位后,再充分利用人眼灰度變化明顯這一特征,計(jì)算候選眼睛對(duì)的灰度復(fù)雜度,對(duì)眼睛進(jìn)行精確定位;
③本檢測(cè)算法具有很強(qiáng)的魯棒性,受背景環(huán)境、尺寸大小影響小。
5小結(jié)
一般的眼睛定位算法分為兩個(gè)步驟:(1)粗定位。在精確定位眼球中心前一般要找到眼睛的大致位置,常見的方法有:對(duì)稱性法、邊緣點(diǎn)積分投影曲線極值位置判斷法、神經(jīng)網(wǎng)絡(luò)法、多分辨率的馬賽克圖法等。(2)眼球的精確定位。常用的方法有:基于霍夫變換、幾何及對(duì)稱性檢測(cè)、彈性模板等等。每個(gè)算法都有自己的優(yōu)點(diǎn)和缺點(diǎn)也即局限性,如計(jì)算量太大、計(jì)算速度慢、算法不容易實(shí)現(xiàn)或正確定位率不高等。主要原因是由于人臉作為一個(gè)非鋼體,在信息輸入時(shí)存在尺度、位置、姿態(tài)變化問題,很難做到面面俱到,十全十美的算法。
本文提出的基于膚色、幾何特征和灰度信息的人眼定位算法有效的平衡了檢測(cè)速度和穩(wěn)定性之間的矛盾,實(shí)驗(yàn)證明,該算法定位效率高,并對(duì)背景、尺寸等細(xì)節(jié)具有很好的適應(yīng)性,在人臉實(shí)時(shí)檢測(cè)系統(tǒng)中具有很好的應(yīng)用價(jià)值。
參考文獻(xiàn)
[1]Rein-LienHsuandAnilK.Jain,FaceDetectioninColorImages[J]IEEETrans.PatternAnalysisandMachineIntelligence,may2002
[2]王磊,莫玉龍.基于霍夫變換和眼睛彈性模板的眼睛特征提取[J].紅外與毫米波學(xué)報(bào),1999,2(18):53-60
[3]CaiJ.GoshtasbyA..Detectingfaceincolorimages.ImageandVisionComputing[J],1999,18(1):63-75
[4]CannyJ.AComputationalApproachtoEdgeDetection[J].IEEETransPatternAnal&MachIntell,1986,8(6):619-698
[5]于威威,滕曉龍等.復(fù)雜背景下人眼定位及人臉檢測(cè).計(jì)算機(jī)仿真[J],2004第21卷,第7期
[6]陳楊,陳榮娟等編著.MATLAB6.X圖形編程與圖像處理[M].西安:西安電子科技大學(xué)出版社
[7]朱夏君.人臉識(shí)別的研究及眼睛定位算法[C].碩士學(xué)位論文,浙江工業(yè)大學(xué),2004