人臉識別之后的下一個風口是什么?

對于這個問題,業界似乎早已有了共識。從 AI 的人臉識別能力超越人類以來,學術界和產業界的目光逐漸轉向另一個更具科研意義和應用價值的課題——行人重識別(Person Re-identification,ReID)。
 
近日,依圖科技在 ReID 領域取得新突破,其提出的技術刷新了全球工業界三大權威數據集業內最優成績(SOTA),算法性能達到業界迄今最高標準,極大拓展了算法和應用的邊界。


(注:YITU 算法結果是在不利用時空信息,不進行重排再優化,即: Re-ranking 等條件下取得的。)
 
還記得 2018 年底依圖進軍智能語音,隨即在中文語音識別領域創下識別精度的新紀錄。2019 年 5 月推出全球首顆云端視覺 AI 芯片,而且「發布即商用」。在一些技術領域中,依圖將行業水平推上了新的高點,并加速了技術的產業化落地。

這背后的關鍵是什么?

行人重識別(ReID),人臉識別后的「殺手級應用」
 
在交通運輸、工業制造和城市規劃等實際場景下,99% 的圖像都是不含人臉的——即使出現了人臉部分也極其模糊,僅有幾個像素大小,這時候人臉識別的作用較為有限。

行人重識別(ReID,也稱「行人再識別」),是指在多攝像設備網絡下對行人進行檢索,利用步態動作、身體特征等更為全面的信息來識別人物,無論單獨使用還是與人臉識別相結合,都能發揮更大的應用價值。

除了智能零售、智慧交通、智能城市等經常提及的應用場景,ReID 技術的應用也將使日常生活更加便捷:游樂園更易尋找走失兒童、寵物/家庭機器人可以憑背影準確識別主人或顧客并提供相應服務。

然而,由于 ReID 需要從不同攝像機拍攝的圖像或視頻中找出同一個人物,而這些攝像機所覆蓋的范圍彼此并不重疊,導致缺乏連貫的信息,而且不同畫面中人物的姿態、行為甚至外觀(比如: 正身、側身、背身)會發生較大變化,不同時間、場景的光照、背景和遮擋物各不相同(背景中常還有體型、衣著相似的其他人物干擾),攝像機的分辨率也有高有低,人物在畫面中出現的位置有遠有進, 這些都對 ReID 技術提出了極大的挑戰。

深度優化 ReID 算法框架,AutoML 取代人工算法調優

面對這種情況,依圖深度優化了 ReID 算法框架,顯著提升了算法效率,通過結合 AutoML 等前沿技術,進一步創新性地實現了模型參數的自動搜索與迭代,突破了依賴算法研究員手工設計與調優的傳統算法開發流程,在降低人力成本的同時,使得算法的泛化性能更強。

此次依圖自研算法在業界最具影響力的三大 ReID 數據集 Market1501、DukeMTMC-ReID、CUHK03 上,將衡量算法性能的兩大關鍵指標「首位命中率」(Rank-1 Accuracy)及「平均精度均值」(Mean Average Precision,mAP)6 項數據全部提升,充分顯示了依圖的技術實力,進一步穩固了中國 AI 在該任務下領跑地位。

需要指出,首位命中率高,只意味著算法能夠在眾多圖像中準確找出最容易識別或者說匹配的那張,并不能反應模型的真實能力,尤其是應對復雜場景的表現。

因此,評價 ReID 算法性能時需要結合 mAP 值,它反映的是系統的綜合檢索性能。mAP 值越高,說明系統的實用性越好,既能查得全也能查得準,能夠較好地應對多遮擋、光線暗、畫面模糊等情況。

自研 AI 芯片 QuestCore 助力,加速世界領先 ReID 算法商業化落地

除了算法性能,限制 ReID 應用大規模商業化落地的另一大原因,是現有的攝像機等終端設備沒有足夠強的算力??梢哉f,算力的缺乏一直是 AI 商業化落地的痛點。

依圖在 2017 年自研云端 AI 芯片 QuestCore(求索),并于 2019 年 5 月「發布即商用」。QuestCore 是全球首顆云端視覺 AI 芯片,提供強大算力,單路攝像頭功耗不到 1W。

依圖研發人員針對本次提出的算法做了進一步優化, 依托依圖自研 AI 芯片, 在僅憑穿著、步態特征的條件下,已能將 ReID 做到 2017-2018 年人臉識別的精度。如此高的精度,不僅加速了行人重識別的大規模商業化落地,更解鎖了新的應用場景,為用戶提供更為全面與極致的體驗。

2017 年,以蘋果 FaceID 為代表的人臉識別商業化應用開始在全球范圍內普及。如今,刷臉支付、刷臉乘車已經滲透到我們的日常生活。有理由期待,世界級的 ReID 算法,加上依圖自研 AI 芯片, 業界期待的下一個計算機視覺領域「殺手級應用」即將到來。

您可以復制這個鏈接分享給其他人:http://www.zaolin.site/node/818