借助于深度神經網絡,俄羅斯國立高等經濟大學的人研究人員已經提出了一種新方法,能夠從視頻中識別出人的身份。該方法不需要大量的照片,并且與現有方法相比具有明顯更高的識別準確度——即使只有某個人的一張照片可用。
面部識別技術在過去幾年中發展迅速。作為驗證和識別個人身份的工具,這些技術被用于各種領域,從打擊恐怖主義的執法機構到社交網絡和移動應用。許多國際公司和世界領先大學的研究小組正在不斷對數據和儀器本身進行試驗,以提高識別的準確率。
識別可以通過多種方式進行,但最近在高精度神經網絡的幫助下獲得了最好結果。神經網絡獲得的訓練圖像越多,該過程就越有效。網絡可以提取出關鍵面部特征,然后在識別未知圖像時使用該知識。
現在,可以更容易地訪問越來越多的照片數據集,并將這些數據集用于訓練神經網絡。對于受限的觀察環境(具有相同的面部方向、照明等因素的照片),算法的準確性早已達到人類面部識別的能力水平。然而,在識別不受約束的條件下,收集到的視頻數據具有可變的照明、角度和大小,實現高精度識別對研究人員來說是一個更大挑戰。
國立高等經濟大學信息系統與技術部教授Savchenko解釋說:“網絡能夠以100%的準確度識別知名演員,因為演員的可用圖像數量可能有數百萬張。然而,隨著神經網絡中積累的知識的變化,這并不意味著它可以適應只有一張照片用作訓練樣本的情況并識別出人的身份。”
為了解決這個問題,國立高等經濟大學的研究人員利用模糊集和概率理論來開發視頻識別算法。在利用少量圖像進行視頻實時面部識別的實驗中,該算法顯著提高了若干眾所周知的神經網絡架構的準確度(比早期實驗高2-6%),如VGGFace、VGGFace2、ResFace和LightCNN。
作為測試數據庫,國立高等經濟大學的研究人員使用以下傳統數據集來對視頻面部識別方法進行評估:IJB-A(IARPA Janus Benchmark A)和YTF(YouTube Faces)。這些數據集包含了著名人物(演員、政治家、公眾人物)的免費圖像,而這些圖像是在不受約束的環境中和不同時間點從開放源頭收集的。在最復雜的實驗中,研究人員使用上述算法和來自于另一個具有更好分辨率的LFW(Labeled Faces in the Wild)數據集的相同人物的幾張照片來識別來自YouTube視頻中的人。而這些照片本身是在不同的時間(從20世紀70年代到21世紀10年代)和不同的地點拍攝的。
這種新方法的實質是利用參考照片的相關性信息,即它們之間的距離或差距。相似個體之間的聯系(即數學模型中的距離)較小,而不相似個體之間的聯系則較大。了解人與人之間的差異程度可以幫助系統在識別視頻幀的過程中糾正錯誤。
Savchenko教授解釋說:“算法估計一幀與一個人的接近程度,以及另一幀與另一個人的接近程度。然后,它比較這兩個人的訓練靜態照片之間的相似程度。接下來,它將第三人添加進來并評估他與哪個人的相似度更高——第一個人或第二個人。然后它會糾正識別錯誤。”
該算法已經用針對固定計算機的Python語言實現,能夠幫助用戶在照片/視頻專輯中查找和分組不同人的面部,并估計一個人的出生年份、性別和其他參數。研究人員還開發了一個Android應用程序原型,用于確定照片和視頻中人物的年齡和性別。對照片庫的分析能夠實現對用戶社交活動程度的自動評估,并識別用戶的親密朋友和親戚。對于現代智能手機,該應用程序原型每秒能夠處理15幀。據研究人員稱,有了他們的方法,面部識別可以獲得更高的準確率。
-
神經網絡
+關注
關注
42文章
4781瀏覽量
101177 -
面部識別
+關注
關注
1文章
375瀏覽量
26710
原文標題:新型神經網絡可從單張照片識別人臉
文章出處:【微信號:AI_News,微信公眾號:人工智能快報】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論