人臉識(shí)別技術(shù)論文
人臉識(shí)別,特指利用人臉視覺特征信息的分析比較結(jié)果進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù)。下面是學(xué)習(xí)啦小編為大家整理的人臉識(shí)別技術(shù)論文,希望你們喜歡。
人臉識(shí)別技術(shù)論文篇一
人臉識(shí)別技術(shù)綜述
摘要:文章首先對(duì)人臉識(shí)別技術(shù)進(jìn)行了介紹,其次回顧了人臉識(shí)別研究的發(fā)展歷程及識(shí)別方法的基本分類,然后對(duì)當(dāng)前主流的人臉識(shí)別方法展開了詳細(xì)的論述,最后提出了人臉識(shí)別技術(shù)面臨的問題及研究方向。
關(guān)鍵詞:人臉識(shí)別;特征臉;線形判別分析;局部二值模式
中圖分類號(hào):TP391
Survey of face recognition technology
He Chun
(Education and Information Technology Center, China West Normal University, Nanchong Sichuan 637002, China)
Abstract: This paper introduces technology of face recognition firstly, and reviews the development process and the basic classification method of face recognition. After that, the paper discusses the current methods of face recognition in detail, therefore proposes the existing problems in the research of recognition faces and future’s research direction.
Key words: face recognition; Eigenface; linear discrimination analysis; LBP
1 人臉識(shí)別技術(shù)簡介
人臉識(shí)別,特指利用人臉視覺特征信息的分析比較結(jié)果進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù)[1]。一般人臉識(shí)別有廣義和狹義之分,廣義是指包含人臉圖像采集、定位、預(yù)處理、身份確認(rèn)與查找等在內(nèi)的技術(shù);而狹義僅指身份確認(rèn)或查找系統(tǒng)。
通俗來講,人臉識(shí)別指運(yùn)用計(jì)算機(jī)分析人臉視頻或圖像之后,提煉可用、有益的識(shí)別信息,再對(duì)人臉對(duì)象的身份構(gòu)建判斷與識(shí)別。人臉識(shí)別是身份識(shí)別研究中最主要的一種方法,重點(diǎn)建立在生物識(shí)別技術(shù)基礎(chǔ)之上,而且其中應(yīng)用了諸多計(jì)算機(jī)相關(guān)的圖形學(xué)、人工智能等最新技術(shù)手段。
人臉與人體的其他生物特征(指紋、虹膜等)一樣與生俱來,其生物特征內(nèi)在的穩(wěn)定性和唯一性使其自然成為了身份識(shí)別的理想依據(jù)。學(xué)術(shù)界對(duì)人臉識(shí)別相關(guān)問題的研究已然趨近成熟,并形成了為數(shù)可觀的研究成果,到目前為止,仍然在不斷的探索與發(fā)展中,尤其在人臉身份識(shí)別方面的建樹頗多??焖?、直接、簡捷是人臉識(shí)別系統(tǒng)的獨(dú)有優(yōu)勢(shì),并已廣泛運(yùn)用于刑事偵破、信息安全等方面。在此,本次研究將對(duì)人臉識(shí)別技術(shù)給出全面的解析論述。
1 人臉識(shí)別發(fā)展歷程
早在20世紀(jì)50年代,心理學(xué)家即已著手對(duì)人臉識(shí)別展開研究,但是直至60年代,對(duì)人臉識(shí)別真正意義上的研究才正式開啟,具體是從工程應(yīng)用層面出發(fā),研究得到一種半自動(dòng)的人臉識(shí)別系統(tǒng),這種系統(tǒng)具備的特點(diǎn)可描述如下:
一是該系統(tǒng)是對(duì)局部的識(shí)別,對(duì)人臉的幾何特點(diǎn)識(shí)別,進(jìn)而分析人臉器官特征信息及其之間的關(guān)系,優(yōu)勢(shì)在于識(shí)別手段簡易、清晰,劣勢(shì)在于一旦人臉的視角、表情等發(fā)生變動(dòng)和變化,那么很難準(zhǔn)確地得到識(shí)別效果;二是這種半自動(dòng)的人臉圖像識(shí)別需要較為嚴(yán)苛的約束環(huán)境和條件,如果圖像存在單一或無背景的情況下,那么就將削弱最終的處理效果。
研究遞進(jìn)到20世紀(jì)90年代以后,即已朝著整體和局部相結(jié)合的態(tài)勢(shì)演變。學(xué)者們認(rèn)為需要將人臉的形狀拓?fù)浣Y(jié)構(gòu)、局部灰度和全局灰度分布等多項(xiàng)人臉特征信息相結(jié)合,才能全面、準(zhǔn)確地實(shí)現(xiàn)人臉圖像識(shí)別。1991年,Turk和Pentland [2]、首次提出著名的“特征臉”(Eigenface)方法,利用主成分分析(Principal Component Analysis,PCA)取得了不錯(cuò)的識(shí)別效果;Belhumer在其論文中,則將Fisher判別準(zhǔn)則成功應(yīng)用到了人臉分類當(dāng)中,由此而提出Fisherface方法[3]。
此后,這種應(yīng)用線性子空間和統(tǒng)計(jì)特征的技術(shù)就已成為當(dāng)時(shí)大眾化流行的識(shí)別技術(shù),可概括為利用成分分析、線性判別分析的特征識(shí)別手段。后期出現(xiàn)了基于機(jī)器學(xué)習(xí)理論的實(shí)用技術(shù),學(xué)者們相繼探索出遺傳算法、支持向量機(jī)等方法對(duì)人臉進(jìn)行識(shí)別。
2 人臉識(shí)別方法分類
研究可知從不同的角度,人臉識(shí)別可有不同的分類方法,本次研究根據(jù)人臉識(shí)別發(fā)展階段的特征,把人臉識(shí)別技術(shù)分為初始以幾何特征為基礎(chǔ)、中期以代數(shù)特點(diǎn)為依據(jù)、后期以機(jī)器學(xué)習(xí)理論為原理三種。下面即對(duì)這3類研究給出功能實(shí)現(xiàn)概述。
2.1 以幾何特征為基礎(chǔ)的研究
這種方式是將人臉用一個(gè)幾何特征矢量予以有效表示,并根據(jù)模式識(shí)別中層次聚類的思想設(shè)計(jì)分類器,達(dá)到識(shí)別目的。識(shí)別所采用的幾何特征是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,本質(zhì)上是特征矢量之間的匹配,相應(yīng)分量通常包括人臉指定2點(diǎn)間的歐式距離、曲率、角度等[4]。
該類研究方式優(yōu)點(diǎn)是簡單易懂,但是由于能量函數(shù)中加權(quán)系數(shù)的選擇表現(xiàn)出一定的經(jīng)驗(yàn)性,并未能形成規(guī)范統(tǒng)一的特征提取標(biāo)準(zhǔn);而且圖像穩(wěn)定的特征提取仍有難度,尤其是特征受阻時(shí);另外,對(duì)于明顯的表達(dá)變化或不良的姿勢(shì)變化,其魯棒性均呈低弱。
2.2 以代數(shù)特點(diǎn)為依據(jù)的研究
這種方式往往基于代數(shù)特征圖像的像素變換投影空間,具有某種數(shù)量的基本圖像對(duì)人臉圖像線性編碼,典型的理論工作可首推主成分分析方法。
主成分分析方法早期是由Sirovitch和Kirby[5]引入人臉識(shí)別領(lǐng)域,并將其用于分析數(shù)據(jù),過程中是使用數(shù)量少的特點(diǎn)來描述為了降低特征空間維數(shù)的樣本,而且是基于K-L來展開和實(shí)現(xiàn)的。 2.3 以機(jī)器學(xué)習(xí)理論為原理的研究
由2.1節(jié)中的研究方式可知,人臉特征是預(yù)先定義形成的。本節(jié)討論的方式,則是通過使用統(tǒng)計(jì)分析和機(jī)器學(xué)習(xí)技術(shù),從中獲取信息。獲得的信息存在于確定的分布之中,并通過算法、模型和判別函數(shù),用作人臉圖像識(shí)別。這種分類器是時(shí)下至關(guān)重要的一門技術(shù),而且涵蓋了SVM、Hidden Markov模型與AdaBoost算法等在內(nèi)的綜合開發(fā)系統(tǒng)技術(shù)。
3 人臉識(shí)別主流方法介紹
3.1 特征臉方法
人臉方法來自主成分分析的人臉識(shí)別和描述技術(shù)。這種方法主要是把圖像區(qū)域當(dāng)作隨機(jī)變量,運(yùn)用K-L轉(zhuǎn)變成為正交K-L基,與較大特征值相關(guān)的對(duì)應(yīng)基具有與人臉相似的形狀,所以也可稱做特征臉。使用這種線性組合能夠描述、展現(xiàn)近似的人臉圖像、人臉識(shí)別以及合成。具體表現(xiàn)為把人臉圖像映射到人臉子空間之上,同時(shí)對(duì)人臉圖像在特征臉子空間上的方位進(jìn)行對(duì)比。
3.1.1 人臉空間的建立
研究假設(shè)人臉圖像包含了眾多像素點(diǎn),并且可用N維向量Γ來表示,那么樣本庫就可用Γi(i=1,...,M)提供應(yīng)用表達(dá)[6] 。人臉空間的基向量由協(xié)方差矩陣C的正交特征向量構(gòu)成,因此稱為特征臉。
把特征值由大到小排列:λ1≥λ2≥...≥λr ,其對(duì)應(yīng)的特征向量為μk。在此條件下,不同的人臉圖像都能投影到由u1, u2, ..., ur組成的子空間中。結(jié)果就是不同的人臉圖像將映射為子空間中不同的點(diǎn),反之亦然。
3.1.2 特征向量的選取
協(xié)方差矩陣Ω所生成的非零特征值的k(k遠(yuǎn)小于M)個(gè)特征向量,一般來說k值比較大,但在常規(guī)情況下并非需要保留所有有的特征向量。因?yàn)橥队暗挠?jì)算速度是同子空間向量數(shù)有著密切關(guān)聯(lián),如果能夠考慮到時(shí)間限度,就能夠提取有效信息的特征向量。
3.1.3 預(yù)測(cè)識(shí)別
人臉圖像置其投影可得到一組坐標(biāo)系數(shù),該系數(shù)能夠表明圖像在子空間中的位置,因而可以作為人臉識(shí)別的基礎(chǔ)。換言之,每一幅人臉圖像皆能顯示出線性組合的“人臉”,加權(quán)系數(shù)為K-L變換的擴(kuò)展系數(shù),也能作為圖像的代數(shù)特征。所以,提取特征臉信息后,可向?qū)Ψ降湫蜆颖具M(jìn)行投影,并將得到的投影特征映射到各研究人臉的特征向量,作為后續(xù)識(shí)別匹配搜索空間的一個(gè)步驟。 圖1~圖3給出了不同情況下的特征臉圖像。
3.2 線性判別分析法
線性判別分析,可簡稱為LDA,本質(zhì)是多維模式空間到一維特征空間的映射,使用類的成員信息形成一組特征向量,構(gòu)建得到的特征空間稱為Fisherface。在理論上,這種方式主要是利用類之間的散射矩陣類中的訓(xùn)練樣本和基于散射矩陣的最優(yōu)投影空間。和人臉識(shí)別方式比較,該種模式能夠抑制不確定圖像間的差異信息,并可以進(jìn)一步提取利于識(shí)別的特征,因而具有較好的識(shí)別性能。
Lades等人認(rèn)為人臉圖像皆有相似的拓?fù)浣Y(jié)構(gòu),提出了關(guān)于建立在動(dòng)態(tài)連接結(jié)構(gòu)的彈性圖匹配方式基礎(chǔ)上的物體識(shí)別問題。每節(jié)點(diǎn)涵蓋40個(gè)小波系數(shù),集合稱為射流,對(duì)小波系數(shù)進(jìn)行原始圖像和一組5個(gè)頻率,8個(gè)方向的Gabor小波卷積。所以每一張圖像,就像標(biāo)簽被逐一校準(zhǔn),而邊緣之間的距離則是通過點(diǎn)來設(shè)計(jì)校準(zhǔn)。因此,針對(duì)圖中邊緣編碼后得到的是人臉的幾何形狀,而圖中節(jié)點(diǎn)編碼后的結(jié)果是灰度值的分布。實(shí)現(xiàn)過程示意如圖4所示。
由圖4可知,彈性圖匹配的意義在于尋找新的人臉,同時(shí)提取一張圖像,圖像類似于束圖,用其可以開展識(shí)別工作。當(dāng)開始識(shí)別的時(shí)候,計(jì)算、測(cè)量人臉和目前束圖之間的相似性,具有最大相似性的面部實(shí)體就指明了測(cè)試人臉的身份。
3.3 局部二值模式
局部二值模式(Local Binary Pattern, LBP)是執(zhí)行紋理描述的最佳方法之一, 并已在于各類應(yīng)用軟件中獲得全面功能發(fā)揮,同時(shí)經(jīng)由實(shí)踐證得該模式具備著強(qiáng)大的判別能力、計(jì)算效率及不變形單調(diào)灰度水平變化等顯著優(yōu)勢(shì)[7],因而可將其應(yīng)用到不同復(fù)雜程度的圖像分析任務(wù)之中。
3.3.1 基本LBP算子
LBP算子最初是界定于3×3鄰域,將中心像素設(shè)置成閾值,并將灰度值與其建立對(duì)比,大于中心像素時(shí)就記1,反之記0。這時(shí)的8個(gè)點(diǎn)就能變換為一種8位沒有符號(hào)的二進(jìn)制數(shù),此二進(jìn)制數(shù)再轉(zhuǎn)換為十進(jìn)制數(shù),也就是窗口的LBP值。LBP可整體反饋出區(qū)域的紋理信息?;镜腖BP算子如圖5所示。
LBP能夠用鄰域的大小不同,采用圓形面積與雙線性插值,鄰域半徑R和P的像素?cái)?shù)能任意選擇,用符號(hào)(p,r)表示像素區(qū)域。常見的LBP算子參見圖6。
3.3.2 LBP人臉描述
使用LBP手段描述人臉,具體表現(xiàn)為運(yùn)用紋理描述符對(duì)人臉局部展開詳細(xì)的繪制處理,然后將其組合成一體。人臉圖像就被分割成幾個(gè)局部區(qū)域,從這些不同的區(qū)域提取紋理描述符,并共同構(gòu)成人臉的整體視圖。
把臉部區(qū)域分成確定的m份R0、R1、R2、…、Rm-1,直方圖將依序計(jì)算每個(gè)區(qū)域,M的直方圖計(jì)算結(jié)果整合在一起形成空間,空間增加M×N大小的直方圖,其中的n表示一個(gè)直方圖的大小??臻g增強(qiáng)的直方圖可以有效地描述3個(gè)不同層次的臉部,具體的3個(gè)層次分別為:直方圖LBP標(biāo)識(shí)包含一個(gè)像素級(jí)別的信息;地域級(jí)是由小的區(qū)域上的標(biāo)志結(jié)合構(gòu)成的;這些區(qū)域的直方圖連接起來,最終形成完整的人臉。
4 人臉識(shí)別技術(shù)面臨的問題
人臉識(shí)別技術(shù)存在獨(dú)有優(yōu)勢(shì)和廣闊前景,但同時(shí)卻也面臨一定問題,而這些問題是卻均是源起于人臉具備的生物特征的某些顯性表象。人臉在視覺上的特點(diǎn)可實(shí)際剖析如下:
一方面由于個(gè)體間差別較小,人臉、人體器官構(gòu)成也比較類似,雖然對(duì)人臉定位是占優(yōu)勢(shì)的,而對(duì)區(qū)別個(gè)體卻產(chǎn)生干擾;另一方面,人臉的表情變化產(chǎn)生的視覺圖像也會(huì)導(dǎo)致差異。此外,人臉圖像識(shí)別時(shí)還會(huì)受到其他約束條件影響,比如光照、年齡、遮蓋物等。因此,解決上面提及的各類問題則既是創(chuàng)新,也是挑戰(zhàn),更是人臉識(shí)別技術(shù)開展未來研究的后續(xù)發(fā)展方向。
參考文獻(xiàn):
[1] 吳巾一,周德龍. 人臉識(shí)別方法綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2009, 26(9): 3205-3209.
[2] TURK M, PENTLAND A. Eigenfaces for recognition [J]. Journal of cognitive neuroscience, 1991, 3(1): 71-86.
[3] BELHUMEUR P N, HESPANHA J P, KRIEGMAN D. et al. fisherfaces: Recognition using class specific linear projection [J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1997, 19(7): 711-720.
[4] BARTLETT M, LADES H, SEJNOWSKI T. Independent component representations for face recognition[C]//Proceeding of the SPIE Symposium on Electronic Imaging: Human Vision and Electronic Imaging . San Jose, CA:IEEE, 1998, 3299:528-539.
[5] KIRBY M, SIROVICH L. Application of the Karhunen-Loeve procedure for the characterization of human faces [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1990, 12(1):103-108.
[6] SAMARIA F, YOUNG S. HMM based architecture for face identification [J]. Image and Computer Vision, 1994, 12(8): 537-543.
[7] AHONEN T, HADID A, PIETIKAINEN M. Face description with local binary patterns: Application to face recognition [J]. IEEE Trans. Pattern Anal. 2006, 28(5): 2037-2041.
點(diǎn)擊下頁還有更多>>>人臉識(shí)別技術(shù)論文