實(shí)現(xiàn)人臉識(shí)別無(wú)感通行的密鑰:圖像質(zhì)量檢測(cè)算法
作為生物識(shí)別技術(shù)的一種,搭載人臉識(shí)別功能的各類智能化產(chǎn)品已應(yīng)用得非常普遍。但從產(chǎn)品體驗(yàn)而言,用戶的感受卻不盡相同。比如有能夠在自行車騎行狀態(tài)下,無(wú)需下車實(shí)現(xiàn)快速無(wú)感通行的小區(qū)人臉識(shí)別閘機(jī)。同時(shí)也會(huì)在使用部分產(chǎn)品時(shí),遇到多次識(shí)別不通過(guò)、站在原處不停變換人臉角度等待識(shí)別通過(guò)的尷尬。
造成這一差距,除了算法自身魯棒性和性能之外,由于模糊、遮擋、大角度、逆光暗光等復(fù)雜環(huán)境引起的人臉圖像質(zhì)量問(wèn)題也會(huì)導(dǎo)致人臉識(shí)別準(zhǔn)確率過(guò)低,需要多次重復(fù)識(shí)別才能成功,從而整體耗時(shí)被大大拉長(zhǎng)。
我們知道當(dāng)圖像質(zhì)量越差,那么人臉識(shí)別的準(zhǔn)確率就越低。如果可以將人臉圖像進(jìn)行標(biāo)準(zhǔn)化評(píng)估,去除低質(zhì)量圖片,將篩選后質(zhì)量符合標(biāo)準(zhǔn)的圖像才送往下一個(gè)流程中,那么識(shí)別效率將大大提升。這就是實(shí)現(xiàn)人臉識(shí)別無(wú)感通行的一項(xiàng)重要技術(shù)——圖像質(zhì)量檢測(cè)算法(FQ),《從零學(xué)習(xí)人臉識(shí)別》系列公開課第六期就對(duì)該算法進(jìn)行了詳細(xì)介紹。
人臉圖像質(zhì)量檢測(cè)算法的原理
與人臉識(shí)別一樣,圖像質(zhì)量檢測(cè)算法(FQ)也是基于特征提取原理,通過(guò)神經(jīng)網(wǎng)絡(luò)從海量數(shù)據(jù)中學(xué)習(xí)獲取人臉質(zhì)量檢測(cè)關(guān)注的特征(主要包括光線、模糊、角度、遮擋、表情、噪聲等)并進(jìn)行質(zhì)量判斷。每個(gè)特征以特定的數(shù)值來(lái)表示,比如下圖的人臉特征向量為(0,1,0,1,1),即強(qiáng)光、中度模糊、中等遮擋、大角度、大表情。
當(dāng)然,這個(gè)特征向量可以無(wú)限擴(kuò)充,將特征的描述越細(xì)致,特征向量就越精確,光線可以增加暗光、低光,模糊可以增加輕微模糊、中等模糊。以虹軟視覺(jué)開放平臺(tái)的圖像質(zhì)量檢測(cè)算法為例,在噪聲特征中甚至可以擴(kuò)充到六十四位以上的特征。
在提取特征向量后,各張人臉圖片的特征雜亂無(wú)序地分布在向量空間里。此時(shí),通過(guò)對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí),質(zhì)量好的樣本盡可能聚集在中間,而不好的被推離。最后根據(jù)計(jì)算樣本到圈中心的距離,得到一個(gè)質(zhì)量分?jǐn)?shù)。
每個(gè)特征對(duì)質(zhì)量分?jǐn)?shù)的影響各不相同,我們需要根據(jù)各自業(yè)務(wù)需求設(shè)定相應(yīng)的閾值,F(xiàn)Q會(huì)將低于設(shè)定閾值的低質(zhì)量圖像過(guò)濾,從而確保輸送到后面人臉識(shí)別環(huán)節(jié)的圖像質(zhì)量都是比較好的。
人臉圖像質(zhì)量檢測(cè)算法的經(jīng)典應(yīng)用
將人臉質(zhì)量檢測(cè)放到真實(shí)的使用場(chǎng)景中,情況會(huì)怎么樣?以下是基于,包含人臉檢測(cè)、活體檢測(cè)、人臉比對(duì)、人證比對(duì)等一系列功能在內(nèi)的虹軟視覺(jué)開放平臺(tái)免費(fèi)、離線SDK ArcFace,所開發(fā)的智能辦公刷臉門禁。
一名用戶從遠(yuǎn)處走來(lái),由于距離原因,系統(tǒng)首先捕捉到的是比較模糊的人臉圖像。而后,F(xiàn)Q算法會(huì)自動(dòng)進(jìn)行判斷,由于質(zhì)量過(guò)低該圖像會(huì)被拒絕送往下一個(gè)識(shí)別環(huán)節(jié)中。隨后系統(tǒng)會(huì)繼續(xù)捕捉,直到一張質(zhì)量較好的人臉圖像被送往識(shí)別并成功。整個(gè)過(guò)程用戶無(wú)需刻意停留等待,即可一次完成人臉識(shí)別。
而如果在沒(méi)有加入FQ算法的情況下,首次捕捉到的模糊照片被送入下一個(gè)人臉識(shí)別環(huán)節(jié)中。當(dāng)這張人臉圖片在識(shí)別失敗后,系統(tǒng)就需要再捕捉一張圖片,進(jìn)行第二次識(shí)別、甚至第三次識(shí)別。如此,用戶基本將難以實(shí)現(xiàn)無(wú)感快速通行。
從對(duì)比實(shí)驗(yàn)中,所感受到的差異就已經(jīng)非常明顯,如下圖所示:相比沒(méi)有FQ的情況,增加了FQ的人臉識(shí)別系統(tǒng)每個(gè)環(huán)節(jié)耗時(shí)平均減少約30%。
同樣,在批量進(jìn)行人臉識(shí)別底庫(kù)注冊(cè)時(shí),往往會(huì)有上萬(wàn)張圖片。普通的人工篩選,很難完成圖像質(zhì)量檢測(cè)。而FQ算法可以快速完成篩選,讓人臉識(shí)別從底庫(kù)的特征值開始就更加準(zhǔn)確。
作為一款輔助算法,我們?cè)谶x型時(shí)要更多地考慮整體,F(xiàn)Q不能占用太大空間和耗時(shí)。比如上面“智能辦公刷臉門禁”實(shí)驗(yàn)中選擇的虹軟視覺(jué)開放平臺(tái)所開發(fā)的FQ算法,其模型小,能在確保精度的前提下盡可能提升檢測(cè)速度。
此外需要注意的是,不同項(xiàng)目、不同環(huán)境對(duì)質(zhì)量好的定義各有不同。比如公司刷臉門禁和絕密實(shí)驗(yàn)室的刷臉門禁,兩者對(duì)攝像頭成像效果的定義當(dāng)然就有所區(qū)別。這時(shí)候,開發(fā)者就得根據(jù)不同項(xiàng)目需求進(jìn)行攝像頭的單獨(dú)調(diào)參,從而分支出不同場(chǎng)景的版本。
其他關(guān)于人臉質(zhì)量檢測(cè)的相關(guān)問(wèn)題, 第六期“虹軟視覺(jué)開放平臺(tái)人臉公開課”都有具體解答,感興趣的開發(fā)者朋友可以點(diǎn)擊下方鏈接觀看完整視頻;蛘咦孕兴阉鳌昂畿浺曈X(jué)開放平臺(tái)人臉公開課”,隨時(shí)可以學(xué)習(xí)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市
- 7 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 8 “AI六小虎”到了下一個(gè)賽點(diǎn)
- 9 張勇等人退出阿里合伙人
- 10 AI視頻,攪動(dòng)1.5萬(wàn)億市場(chǎng)