本白皮書將從人臉門禁產(chǎn)品應用場景分類、產(chǎn)品類型分級、主要功能劃分、產(chǎn)品形態(tài)、硬件、軟件、測試檢驗方法、行業(yè)解決方案、未來發(fā)展趨勢多個章節(jié)進行論述。本書可供門禁系統(tǒng)從業(yè)者、人工智能從業(yè)者、專家、安防從業(yè)者、設(shè)計院、政府相關(guān)部門、學生、工程商、集成商等相關(guān)人士閱讀、參考。
前言
無感通行一定是未來出入口控制系統(tǒng)的發(fā)展趨勢,無閘機、無需人員配合即可便利通行,但又能保障系統(tǒng)的安全性。人工智能(AI)技術(shù)給無感通行帶來無限的可能性。
近30年來對整個安防系統(tǒng),乃至整個弱電系統(tǒng)來說,發(fā)生革命性技術(shù)突破的當屬視頻監(jiān)控技術(shù),其核心就來源于AI技術(shù)中的計算機視覺技術(shù)。如今的監(jiān)控技術(shù)可以廣泛應用于監(jiān)控、門禁、車輛出入、訪客、消費、考勤、電梯控制、入侵報警,人臉識別技術(shù)應用就是典型場景代表,人臉識別+門禁、人臉識別+電梯、人臉識別+停車場,而人臉門禁就是其中最典型的革新應用之一,正是本白皮書要深入予以探討的。
無感通行整體解決方案就是系統(tǒng)全面支持多種出入控制方式:刷門禁卡、刷身份證、刷銀行卡、刷二維碼、指紋識別、指靜脈識別、支付寶、微信、Apple Pay、虹膜、人臉識別、聲紋識別等,全部支持,或者最少支持2種以上的設(shè)備才是未來技術(shù)的主流。
AI智道聯(lián)合人人智能、賽翼智能發(fā)布本人臉門禁產(chǎn)品技術(shù)白皮書,用于促進行業(yè)的技術(shù)發(fā)展和技術(shù)進步,共同開拓全新的門禁市場,集合行業(yè)力量,整合多種資源,逐步建立起優(yōu)高效的產(chǎn)業(yè)生態(tài)。
本白皮書將從人臉門禁產(chǎn)品應用場景分類、產(chǎn)品類型分級、主要功能劃分、產(chǎn)品形態(tài)、硬件、軟件、測試檢驗方法、行業(yè)解決方案、未來發(fā)展趨勢多個章節(jié)進行論述。本書可供門禁系統(tǒng)從業(yè)者、人工智能從業(yè)者、專家、安防從業(yè)者、設(shè)計院、政府相關(guān)部門、學生、工程商、集成商等相關(guān)人士閱讀、參考。
概述
系統(tǒng)概述
人臉門禁系統(tǒng)是人工智能技術(shù)在出入口通行領(lǐng)域的典型場景應用,目前正處于用人臉識別技術(shù)代替?zhèn)鹘y(tǒng)IC卡的升級換代時期。門禁系統(tǒng)和建筑智能化系統(tǒng)的出入口通行系統(tǒng)經(jīng)過多年的發(fā)展已經(jīng)有了穩(wěn)定成熟的以IC卡為主的技術(shù)體系,系統(tǒng)封閉、行業(yè)缺乏統(tǒng)一標準、用戶體驗和用戶交互流程差異很大的一些局限。尤其是門禁卡和人員弱關(guān)聯(lián),代打卡、冒名頂替時有發(fā)生,存在很大的安全隱患,只認卡不認人。而人臉識別技術(shù)是人工智能在視覺識別領(lǐng)域發(fā)展最快的技術(shù)之一,非常好的解決了人員身份鑒別和權(quán)限統(tǒng)一的問題。當然新生事物也有一定的局限性,比如存在技術(shù)和產(chǎn)品的結(jié)合尚未形成統(tǒng)一標準、各個廠商自成系統(tǒng)難于兼容等問題。為了更好的讓用戶理解人臉門禁產(chǎn)品的應用優(yōu)勢和局限、指導廠商逐步建立逐步一致的人臉門禁的產(chǎn)品定義和功能描述,減少重復開發(fā)和技術(shù)概念混亂,AI智道(公眾號:AIoWord)聯(lián)合人人智能、賽翼智能等廠家制定本人臉門禁產(chǎn)品技術(shù)白皮書,用于建立行業(yè)統(tǒng)一的技術(shù)共識。本白皮書采用在線發(fā)布、圖書出版、共同更新維護的形式,集合行業(yè)力量,逐步建立統(tǒng)一高效的人臉門禁產(chǎn)品體系,促進行業(yè)的發(fā)展。
門禁系統(tǒng)
門禁系統(tǒng)(Access Control System)又被稱為出入管理控制系統(tǒng),是安全防范管理系統(tǒng)的重要組成部分。門禁系統(tǒng)集自動識別技術(shù)和安全管理措施為一體,涉及人工智能、電子、機械、生物識別、光學、計算機、控制、通訊等技術(shù),主要解決出入口安全防范管理的問題,實現(xiàn)對人、物的出入控制和管理功能。常見的門禁系統(tǒng)有獨立式密碼門禁系統(tǒng)、非接觸卡式門禁系統(tǒng)、生物識別門禁系統(tǒng)、手機APP門禁系統(tǒng)等,曾經(jīng)應用最廣泛的非接觸卡式門禁系統(tǒng)逐漸被生物識別門禁系統(tǒng)所替代,尤其是人臉識別。
典型的聯(lián)網(wǎng)門禁系統(tǒng)由門禁服務器、門禁管理軟件、控制器、接口模塊、讀卡器、人證合一一體機、卡片、電鎖、出門按鈕、緊急玻璃破碎器和蜂鳴器等設(shè)備組成。讀卡器包括指紋、聲紋、人臉、虹膜、卡式多種類型。
門禁系統(tǒng)在國內(nèi)外的應用是有一定區(qū)別的,門禁系統(tǒng)最早出現(xiàn)在國外,技術(shù)發(fā)展比較成熟,通常都是聯(lián)網(wǎng)的總線式門禁系統(tǒng),門禁系統(tǒng)包含考勤、在線巡更功能,可以集成報警系統(tǒng),能夠和視頻監(jiān)控系統(tǒng)進行聯(lián)動;而國內(nèi)的門禁系統(tǒng)一般被歸入一卡通系統(tǒng)建設(shè),而一卡通系統(tǒng)通常包括門禁系統(tǒng)、訪客系統(tǒng)、考勤系統(tǒng)、巡更系統(tǒng)、消費系統(tǒng)、電梯管理系統(tǒng)和車輛出入管理系統(tǒng),這個范圍要較國外的門禁系統(tǒng)要大,功能就相對簡單一些。隨著AI技術(shù)的成熟,人臉門禁正在大行其道,正在改變整個市場格局。
門禁系統(tǒng)適用各種場所,如銀行、酒店、機房、機要室、辦公室、智能化小區(qū)、工廠等。在數(shù)字技術(shù)網(wǎng)絡技術(shù)飛速發(fā)展的今天門禁技術(shù)得到了迅猛的發(fā)展。早已超越了單純的門道及鑰匙管理,它已經(jīng)逐漸發(fā)展成為一套完整的出入管理系統(tǒng)。它在工作環(huán)境安全、人事考勤管理等行政管理工作中發(fā)揮著巨大的作用。如今的無感通行系統(tǒng)中不一定會存在實體“門”,也許“門”是通道閘機、“門”是電梯、或者根本就沒有“門”(虛擬的)。
門禁系統(tǒng)從技術(shù)維度可分為:電子密碼門禁系統(tǒng)、卡式門禁系統(tǒng)、指紋門禁系統(tǒng)、指靜脈門禁系統(tǒng)、掌紋門禁系統(tǒng)、虹膜門禁系統(tǒng)、聲紋識別門禁系統(tǒng)和人臉識別門禁系統(tǒng)等。
本白皮書聚焦在人臉識別門禁系統(tǒng),故以此為主。
人臉識別技術(shù)
人臉識別(Face Recognition,F(xiàn)R)是一種基于人的臉部特征信息進行身份識別的一種生物識別技術(shù)。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別的一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。
人臉與人體的其它生物特征(指紋、虹膜等)一樣與生俱來,它的唯一性和不易被復制的良好特性為身份鑒別提供了必要的前提,與其它類型的生物識別比較人臉識別具有如下特點:
非強制性。 用戶不需要專門配合人臉采集設(shè)備,幾乎可以在無意識的狀態(tài)下就可獲取人臉圖像,這樣的取樣方式?jīng)]有“強制性”;
非接觸性。 用戶不需要和設(shè)備直接接觸就能獲取人臉圖像;
并發(fā)性。 在實際應用場景下可以進行多個人臉的分揀、判斷及識別。
除此之外,還符合視覺特性:“以貌識人”的特性,以及操作簡單、結(jié)果直觀、隱蔽性好等特點。
人臉識別系統(tǒng)的研究始于20世紀60年代,80年代后隨著計算機技術(shù)和光學成像技術(shù)的發(fā)展得到提高,而真正進入初級的應用階段則在90年后期;最近幾年隨著以深度學習為主的人工智能技術(shù)進步,人臉識別技術(shù)得到了迅猛的發(fā)展。“人臉識別系統(tǒng)”集成了人工智能、機器識別、機器學習、模型理論、專家系統(tǒng)、視頻圖像處理等多種專業(yè)技術(shù),是綜合性比較強的系統(tǒng)工程技術(shù)。
人臉識別系統(tǒng)通常包括幾個過程:人臉圖像采集及檢測、關(guān)鍵點提取、人臉規(guī)整(圖像處理)、人臉特征提取和人臉識別比對。
人臉圖像采集。 不同的人臉圖像都能通過攝像鏡頭采集下來,比如靜態(tài)圖像、動態(tài)圖像、不同的位置、不同表情等方面都可以得到很好的采集。當用戶在采集設(shè)備的拍攝范圍內(nèi)時,采集設(shè)備會自動搜索并拍攝用戶的人臉圖像。
人臉檢測。 人臉檢測在實際中主要用于人臉識別的預處理,即在圖像中準確標定出人臉的位置和大小。
關(guān)鍵點提?。ㄌ卣魈崛。?。 人臉識別系統(tǒng)可使用的特征通常分為視覺特征、像素統(tǒng)計特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù)特征等。人臉特征提取就是針對人臉的某些特征進行的。人臉特征提取,也稱人臉表征,它是對人臉進行特征建模的過程。人臉特征提取的方法歸納起來分為兩大類:一種是基于知識的表征方法;另外一種是基于代數(shù)特征或統(tǒng)計學習的表征方法。
人臉規(guī)整(預處理)。 對于人臉的圖像預處理是基于人臉檢測結(jié)果,對圖像進行處理并最終服務于特征提取的過程。系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機干擾,往往不能直接使用,必須在圖像處理的早期階段對它進行灰度校正、噪聲過濾等圖像預處理。對于人臉圖像而言,其預處理過程主要包括人臉圖像的光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。
人臉識別比對(匹配與識別)。 提取的人臉圖像的特征數(shù)據(jù)與數(shù)據(jù)庫中存儲的特征模板進行搜索匹配,通過設(shè)定一個閾值,當相似度超過這一閾值,則把匹配得到的結(jié)果輸出。人臉識別就是將待識別的人臉特征與已得到的人臉特征模板進行比較,根據(jù)相似程度對人臉的身份信息進行判斷??煞譃?:1、1:N、屬性識別。其中1:1是將2張人臉對應的特征值向量進行比對,1:N是將1張人臉照片的特征值向量和另外N張人臉對應的特征值向量進行比對,輸出相似度最高或者相似度排名前X的人臉。
人臉識別的優(yōu)勢在于其自然性和不被被測個體察覺的特點。
所謂自然性,是指該識別方式同人類(甚至其他生物)進行個體識別時所利用的生物特征相同。例如人臉識別,人類也是通過觀察比較人臉區(qū)分和確認身份的,另外具有自然性的識別還有虹膜識別、語音識別、體形識別等,而指紋識別、虹膜識別等都不具有自然性,因為人類或者其他生物并不通過此類生物特征區(qū)別個體。
不被察覺的特點對于一種識別方法也很重要,這會使該識別方法不令人反感,并且因為不容易引起人的注意而不容易被欺騙。人臉識別具有這方面的特點,它完全利用可見光獲取人臉圖像信息,不同于指紋識別或者虹膜識別需要利用手指接觸的傳感器采集指紋,或者利用紅外線采集虹膜圖像,這些特殊的采集方式很容易被人察覺,從而造成諸多不便。
人臉識別被認為是生物特征識別領(lǐng)域甚至人工智能領(lǐng)域最困難的研究課題之一。人臉識別的困難主要是人臉作為生物特征的特點所帶來的。
相似性。 不同個體之間的區(qū)別不大,所有的人臉的結(jié)構(gòu)都相似,甚至人臉器官的結(jié)構(gòu)外形都很相似。這樣的特點對于利用人臉進行定位是有利的,但是對于利用人臉區(qū)分人類個體是不利的。例如雙胞胎現(xiàn)象,指胎生動物一次懷胎生下兩個個體的情況。雙胞胎一般可分為同卵雙胞胎和異卵雙胞胎兩類。在人類社會,全世界雙胞胎平均出生率為1∶89。對于人類的雙胞胎現(xiàn)象,有些雙胞胎面部存在差異,有些雙胞胎甚至從面部特征來看相似度極高,對于人臉識別系統(tǒng)形成非常大的挑戰(zhàn),幾乎從生物特征上很難區(qū)別出每個個體。
易變性。 人臉的外形很不穩(wěn)定,人可以通過臉部的變化產(chǎn)生很多表情,而在不同觀察角度,人臉的視覺圖像也相差很大,另外,人臉識別還受光照條件(例如白天和夜晚,室內(nèi)和室外等)、人臉的很多遮蓋物(例如口罩、墨鏡、頭發(fā)、胡須等)、年齡等多方面因素的影響。
易攻擊性。 隨著數(shù)字拍照、視頻合成技術(shù)等發(fā)展,越來越容易獲得某個指定人的人臉信息或者合成人臉信息。更甚至隨著對抗訓練(Adversarial Training)的深度學習技術(shù)的發(fā)展,計算機可以合成高精度的任何人的人臉等生物特征信息。某些生成對抗網(wǎng)絡訓練的反人臉識別,身份欺騙成功率達99.5%,甚至成為許多人臉識別系統(tǒng)的克星。
產(chǎn)品的場景化分類分級模型
人臉識別門禁控制系統(tǒng)基于先進的人臉識別技術(shù)在門禁出入口領(lǐng)域的應用創(chuàng)新。相比鑰匙門禁、IC卡門禁、指紋門禁、虹膜門禁等其它技術(shù)手段,人臉門禁如果有以下優(yōu)勢:
人臉識別無卡進入,免去攜帶卡證的額外工作;
高速準確方便快捷,人臉識別通常在1秒以內(nèi)完成甚至可實現(xiàn)無感自然通行;
照片記錄可追溯驗證;
同時人臉門禁也存在一些風險:
對于高相似人臉或者雙胞胎等存在一定的誤識風險;
人臉識別容易受到一些技術(shù)手段的攻擊;
人臉識別涉及到隱私權(quán)等風險。
總體來說人臉識別門禁是門禁系統(tǒng)的一次重大技術(shù)變革,將門禁智能通行帶入了全新的AI時代。
本白皮書的關(guān)鍵內(nèi)容,是對人臉門禁的產(chǎn)品應用場景、產(chǎn)品技術(shù)形態(tài)分為三類六等,樹立了對人臉門禁產(chǎn)品應用和開發(fā)的技術(shù)指導,這也是本次白皮書重大的創(chuàng)新。這個分類辦法結(jié)合了對門禁應用場景和人臉識別技術(shù)的深入調(diào)研需求提煉和技術(shù)分析,歡迎廣大讀者提出寶貴意見以便于編者修改完善。
門禁通行的應用場景分為三類:
強配合類。 人臉與設(shè)備距離0.5米以內(nèi),人臉角度在15度以內(nèi),人臉比對模式為1:1人證比對或者<1000人的小型人臉庫比對。如家庭人臉門鎖、辦公室小型人臉門禁、人臉考勤等。
半配合類。 人臉與設(shè)備的距離在0.5米-1.5米之間,人臉角度在30度以內(nèi),人臉比對庫容量在10000人以內(nèi)的中等規(guī)模人臉庫。如智能建筑樓層人臉門禁、社區(qū)單元人臉門禁等。
自然通行類。 人臉與設(shè)備的距離在1米到3米之間,人臉角度在45度以內(nèi),人臉比對庫容量在1萬到10萬人以內(nèi)。如園區(qū)出入口人臉通行、公共交通人臉閘機等。
人臉門禁產(chǎn)品的技術(shù)等級劃分為六級:
第一級:學術(shù)級。 人臉庫容量在百人左右,準確度在60%以下,用于新技術(shù)的學術(shù)分析;
第二級:娛樂級。 人臉庫容量在500人左右,準確度在60-85%之間,用于娛樂游戲出錯無直接風險;
第三級:消費級。 人臉庫容量在1000人以內(nèi),準確度在85-95%之間,用于個人領(lǐng)域或中小企業(yè);
第四級:商業(yè)級。 人臉庫容量在1千-1萬之間,準確度在95-99%之間,用于中等規(guī)模企業(yè)應用;
第五級:行業(yè)級。 人臉庫容量在1萬到10萬人左右,準確度在99-99.999%之間,用于超大規(guī)模企業(yè)或者公安、交通等海量人群應用;
第六級:金融級。 人臉庫容量在10萬人以上,準確度在99.999%以上,出錯率低于十萬分之一,可用于金融支付等應用領(lǐng)域。
總結(jié):通過按三種類別、六個級別的細分應用,可以將人臉門禁產(chǎn)品的應用場景和產(chǎn)品技術(shù)特點較好區(qū)分出來,為后續(xù)產(chǎn)品應用和產(chǎn)品開發(fā)提供指導。
第一篇 應用場景分類
人臉門禁系統(tǒng)如果按照應用場景分類,可分為三類:強配合類、半配合類和自然通行類。
強配合類應用
強配合類應用主要應用于傳統(tǒng)近紅外人臉門禁、智能鎖、柜和設(shè)備等。個人、家庭、中小企業(yè)的人臉識別門禁或者設(shè)備的應用,往往用戶人臉庫規(guī)模小、設(shè)備成本低、有時候需要設(shè)備提供電池供電的低功耗場景等應用需求,這種應用場景往往是強配合類應用。
強配合應用情況下,典型人臉庫容量在50-1000人之間,在識別時需要將人臉距離設(shè)備在0.5米以內(nèi),人臉與設(shè)備之間的夾角在15度以內(nèi)幾乎完全正臉狀態(tài)。強配合類應用的人臉識別技術(shù)精度要求有限、設(shè)備成本低、功耗低,往往適用于小規(guī)模場所。
關(guān)鍵參數(shù):
人臉庫容量:1000人以下
人臉識別距離:1米以內(nèi)
人臉檢測比對搜索時間:<3秒
人臉識別角度:15度以內(nèi),需要特意配合
半配合類應用
半配合類主要應用在建筑樓層通道門禁等場景。在企業(yè)樓層、辦公室門禁、電梯、社區(qū)單元門口等應用場景下,通常是企業(yè)或者小區(qū)將人臉門禁代替?zhèn)鹘y(tǒng)的IC卡或鑰匙門禁,適用采用半配合類人臉門禁。
半配合類的人臉門禁人臉庫在10000人以內(nèi),門禁使用時人與設(shè)備的距離 在0.5米到1.5米之間,可以實現(xiàn)人臉與設(shè)備有一定的夾角如30度以內(nèi),甚至在理想情況下實現(xiàn)人到門開的不停留通行狀態(tài)。
關(guān)鍵參數(shù):
人臉庫容量:1萬人以下
人臉比對距離:0.5-1.5米
人臉檢測比對搜索時間:<1秒
人臉識別角度:30度以內(nèi),半配合狀態(tài)
自然通行類
自然同行類就是人不用可以配合系統(tǒng)的應用,比如園區(qū)建筑出入口室內(nèi)外應用及人臉自然簽到。在住宅社區(qū)門口、大型建筑的出入口、大型演出或展會活動時,通常需要自然通行的人臉門禁產(chǎn)品。自然通行人臉門禁往往人臉庫規(guī)??蛇_1萬到10萬人左右,人臉與設(shè)備的距離可在1到3米左右,而且能夠適合室內(nèi)和室外等各種的光線環(huán)境,人員通行能夠做到完全的不停留通行和人臉比對分析。
關(guān)鍵參數(shù):
人臉庫容量:1-10萬人
人臉識別距離:1-3米
人臉檢測比對搜索時間:<0.5秒
人臉識別角度:45度以內(nèi),與通行路線一致,不影響自然通行狀態(tài)
總結(jié):人臉門禁應用的發(fā)展趨勢是從強配合向半配合過渡、進而向自然通行發(fā)展的趨勢,科技讓生活服務變得越來越便利化。同時在強配合型應用領(lǐng)域從近紅外的企業(yè)人臉識別,向家庭的人臉門鎖擴展,但由于人臉門鎖對人臉識別技術(shù)的抗攻擊能力帶來全新的挑戰(zhàn),人臉門禁的發(fā)展狀態(tài)尚存在較多不確定因素。
第二篇 產(chǎn)品類型分級
人臉門禁產(chǎn)品的技術(shù)等級劃分為六級:學術(shù)級、娛樂級、消費級、企業(yè)級、行業(yè)級、金融級。
第一級:學術(shù)級
學術(shù)級技術(shù)精度通常是指可重復的準確度在60%以下,用于原理檢驗和理論創(chuàng)新,往往不一定對應具體的產(chǎn)品。有些學術(shù)級技術(shù)可在實驗室的理想條件下取得很高的人臉識別精度,但是在現(xiàn)實環(huán)境應用時由于光線、鏡頭、計算資源等多種原因往往無法復現(xiàn)實驗室成果,甚至有些學術(shù)論文的理論成果也難以持續(xù)復現(xiàn),學術(shù)級的往往不對應具體的量產(chǎn)產(chǎn)品。
第二級:娛樂級
人臉識別的某些細分功能在有些應用領(lǐng)域的成熟度不高,比如通過人臉識別來分析人的年齡、性別,甚至通過人臉識別來區(qū)分雙胞胎或者臉部高相似人群等,人臉識別通常的成功概率低于85%以下,這樣成熟度的技術(shù)通常用于做娛樂型產(chǎn)品。
例如用于人臉識別的屬性分析或者娛樂游戲產(chǎn)品等。
第三級:消費級
人臉識別應用通常在中小規(guī)模人臉庫如千人以內(nèi)、中近距離如半米以內(nèi)有較高的人臉識別精度時,人臉識別可用于家庭、商鋪或中小企業(yè)等,作為消費級應用的產(chǎn)品。目前大量基于近紅外技術(shù)的人臉考勤機、人臉門禁級通常是消費級產(chǎn)品 。
第四級:企業(yè)級
企業(yè)級人臉門禁產(chǎn)品通常用于中大規(guī)模的企業(yè)或者居民社區(qū)、行政單位的智能通行應用。人臉庫容量通常在萬人以內(nèi),人臉比對的反應時間通常在秒級,應用場景既涉及室內(nèi)均勻光線又涉及到室外或建筑出入口的日光或強反差的光線情況。企業(yè)級人臉門禁是當前市場增長最迅猛的人臉門禁產(chǎn)品領(lǐng)域。
第五級:行業(yè)級
在公共安全、公共交通、大型園區(qū)、大型演唱會或展覽活動等進行人臉識別比對或者公共安全的應用時,往往需要具有行業(yè)級人臉識別技術(shù)的產(chǎn)品。應用環(huán)境通常在室外牙大型建筑的多個出入口,設(shè)備需要聯(lián)網(wǎng)分布式運行,用于解決數(shù)萬甚至數(shù)十萬人的智能通行需求。
第六級:金融級
人臉識別的生物精度的理論水平在萬分之一的誤差之內(nèi),但是金融支付通常要求系統(tǒng)的精度誤差在百萬分之一甚至更低水平,用于保障金融安全的人臉識別產(chǎn)品技術(shù)稱為金融級安全的技術(shù)。目前來看人臉識別在金融支付領(lǐng)域還面臨不少挑戰(zhàn)有待克服。
總結(jié):人臉識別的產(chǎn)品分為不同的技術(shù)成熟度等級,分別適應于不同的應用領(lǐng)域。從目前來看,人臉門禁正從消費級人臉門禁向企業(yè)級、行業(yè)級甚至金融級安全的人臉門禁的發(fā)展歷程中。當前比較成熟的是用于萬人庫的企業(yè)級人臉門禁產(chǎn)品,也有少數(shù)數(shù)萬人臉庫的行業(yè)級產(chǎn)品已經(jīng)開始出現(xiàn)。
第三篇 產(chǎn)品的主要功能
人臉門禁產(chǎn)品的主要功能包括人臉成像采集、人臉圖像特征提取及人臉庫比對管理、報警聯(lián)動數(shù)據(jù)分析幾個功能模塊。每種功能模塊涉及不同的業(yè)務特點。
人臉成像采集
不同的人臉圖像通過攝像鏡頭采集得到,比如靜態(tài)圖像、動態(tài)圖像、不同的位置、不同表情等,當采集對象在設(shè)備的拍攝范圍內(nèi)時,采集設(shè)備會自動搜索并拍攝人臉圖像。影響人臉成像采集的主要因素是攝像頭的性能指標和攝像頭安裝部署位置等因素。通常情況下人像采集涉及如下因素:
圖像大小。 人臉圖像過小會影響識別效果,人臉圖像過大會影響識別速度。圖像大小一定程度上在實際應用場景是人臉離攝像頭的距離。
圖像分辨率。 越低的圖像分辨率越難識別。圖像大小綜合圖像分辨率,直接影響攝像頭識別距離。
光照環(huán)境。 攝像頭成像需要一定的光照范圍,過曝或過暗的光照環(huán)境都會影響人臉識別效果。這是影響人臉識別最重要的因素之一。通常可以采用自然補光和外部人工補光的方式來解決光照問題。
模糊程度。 人臉相對于攝像頭的移動經(jīng)常會產(chǎn)生運動模糊,導致影響檢測和識別效果。
遮擋程度。 五官無遮擋、臉部邊緣清晰的圖像為最佳。而在實際場景中,很多人臉都會被帽子、眼鏡、口罩等遮擋物遮擋。
采集角度。 人臉相對于攝像頭角度為正臉最佳。但實際場景中往往很難抓拍正臉,會涉及到人臉與攝像頭之間多少角度適宜于人臉采集的進行。
攝像機成像的幾種參數(shù)
1.攝像頭成像分辨率
人像采集的攝像頭通常分為USB攝像頭、MIPI攝像頭和網(wǎng)絡攝像頭。其中USB和MIPI通常傳輸未經(jīng)壓縮的視頻數(shù)據(jù)一般用于設(shè)備內(nèi)近距離傳輸,網(wǎng)絡攝像頭通常傳輸壓縮后的視頻數(shù)據(jù)可以用于設(shè)備間的遠距離傳輸。以下以網(wǎng)絡攝像頭為例描述攝像頭的成像分辨率。
720p。 720P實際是指分辨率1280×720像素。計算一下就是1280×720=921600像素,720p或720i為百萬像素分辨率,通常指百萬網(wǎng)絡攝像機。720P每路默認圖像碼流為3M,具體的速率和視頻壓縮的比率也高度相關(guān)。
960p。 960P實際是指分辨率1280×960像素。計算一下就是1280×960=1228800像素,一般都會叫960p或960i為130萬像素分辨率,通常指130萬像素的攝像機。960P每路默認圖像碼流為4M,具體的速率和視頻壓縮的比率也高度相關(guān)。
1080p。 1080P實際是指分辨率1920×1080像素。計算一下就是1920×1080=2073600像素,一般都會叫 1080p或1080i為200萬像素分辨率,通常指200萬像素的攝像機。1080P每路默認圖像碼流為5M,具體的速率和視頻壓縮的比率也高度相關(guān)。
4K。 4K指的是3840水平×2160垂直(16:9)像素的分辨率,支持120p、60p、59.94p、50p、30p、29.97p、25p、24p和23.976p,共9種幀率。4K每路默認圖像碼流為8M以上,具體的速率和視頻壓縮的比率也高度相關(guān)。
2.光照強度
人臉若要被攝像機成像,首要條件是人臉接受到一定程度的光線即受到足夠的光照強度。光照強度的標準屬于是照度,照度是反映光照強度的一種單位,其物理意義是照射到單位面積上的光通量,照度的單位是每平方米的流明(Lm)數(shù),也叫做勒克斯(Lux):1Lux=1Lm/平方米。上式中,Lm是光通量的單位,其定義是純鉑在熔化溫度(約1770℃)時,其1/60平方米的表面面積于1球面度的立體角內(nèi)所輻射的光量。
人臉檢測要求人臉接受的光既不能太強也不能太弱,通常需要10-3000lux之間的亮度比較適宜,過亮或者過暗都能導致攝像楊對人臉成像效果的差異。
以下是各種環(huán)境照度值:(單位 lux)
3.寬動態(tài)
當在強光源(日光、燈具或反光等)照射下的高亮度區(qū)域及陰影、逆光等相對亮度較低的區(qū)域在圖像中同時存在時,攝像機輸出的圖像會出現(xiàn)明亮區(qū)域因曝光過度成為白色,而黑暗區(qū)域因曝光不足成為黑色,嚴重影響圖像質(zhì)量。攝像機在同一場景中對最亮區(qū)域及較暗區(qū)域的表現(xiàn)是存在局限的,這種局限就是通常所講的“動態(tài)范圍”。
寬動態(tài)(WDR)技術(shù)是在非常強烈的對比下讓攝像機看到影像的特色而運用的一種技術(shù)。WDR是Wide Dynamic Range 的縮寫,意思是寬動態(tài)范圍。當在強光源(日光、燈具或反光等)照射下的高亮度區(qū)域及陰影、逆光等相對亮度較低的區(qū)域在圖像中同時存在時,攝像機輸出的圖像會出現(xiàn)明亮區(qū)域因曝光過度成為白色,而黑暗區(qū)域因曝光不足成為黑色,嚴重影響圖像質(zhì)量。攝像機在同一場景中對最亮區(qū)域及較暗區(qū)域的表現(xiàn)是存在局限的,這種局限就是通常所講的“動態(tài)范圍”。
寬動態(tài)范圍是圖像能分辨最亮的亮度信號值與能分辨的最暗的亮光信號值的比值。寬動態(tài)的表現(xiàn)方式以“倍數(shù)”或“dB”來表示。
寬動態(tài)最常見的形式是使用多次曝光方法,該方法包括捕獲短時間內(nèi)的兩幀圖像和一個長曝光速度。第一次曝光捕捉明亮區(qū)域場景中的細節(jié),而后者則捕獲場景中的暗部區(qū)域的細節(jié)。然后將兩個圖像組合在一起,可以在同時呈現(xiàn)明亮和黑暗區(qū)域兩個圖像細節(jié)。通常的寬動態(tài)范圍介于50~70dB之間,更高性能的寬動態(tài)范圍從100~130dB之間。最先進的寬動態(tài)范圍(又被稱為第三代寬動態(tài))被叫做"真WDR",通過捕獲四個幀圖像進行比較,以達到最佳效果。相較于之前的兩幀寬動態(tài)范圍技術(shù)來說,幀數(shù)量的增加有助于解決圖像中前景和背景之間的照明差異。
4.人臉成像角度
人臉成像的角度對應是人臉和鏡頭之間的三種角度:上下翻轉(zhuǎn)pitch,左右翻轉(zhuǎn)yaw,平面內(nèi)旋轉(zhuǎn)roll的角度。最理想情況下,攝像頭與人臉之間的三種角度是:
上下翻轉(zhuǎn)pitch:攝像頭成像位置與人臉位置同高,這樣上下翻轉(zhuǎn)角度幾乎為0。
左右翻轉(zhuǎn)yaw:人臉正對攝像頭,左右翻轉(zhuǎn)角度在0-15度之間。
平面內(nèi)旋轉(zhuǎn)roll:人臉與攝像頭的重力線相同,不涉及到臉的平面旋轉(zhuǎn)。
但真實的攝像機成像時往往涉及到攝像頭安裝位置與人像的真實角度等問題,導致攝像機無法接近理想情況成像。
5.白平衡
在任意色溫條件下,攝像機鏡頭所拍攝的標準白色經(jīng)過電路的調(diào)整,使之成像后仍然為白色,使被拍攝到的圖像的色彩能夠精確的被反映出來,這樣的過程稱為白平衡。
白平衡(White Balance)只用于彩色攝像機,其用途是實現(xiàn)攝像機圖像能精確反映景物狀況,有手動白平衡和自動白平衡兩種方式。
自動白平衡
連續(xù)方式:此時白平衡設(shè)置將隨著景物色彩溫度的改變而連續(xù)地調(diào)整,范圍為2800~6000K。這種方式對于景物的色彩溫度在拍攝期間不斷改變的場合是最適宜的,使色彩表現(xiàn)自然,但對于景物中很少甚至沒有白色時,連續(xù)的白平衡不能產(chǎn)生最佳的彩色效果。
按鈕方式:先將攝像機對準諸如白墻、白紙等白色目標,然后將自動方式開關(guān)從手動撥到設(shè)置位置,保留在該位置幾秒鐘或者至圖像呈現(xiàn)白色為止,在白平衡被執(zhí)行后,將自動方式開關(guān)撥回手動位置以鎖定該白平衡的設(shè)置,此時白平衡設(shè)置將保持在攝像機的存儲器中,直至再次執(zhí)行被改變?yōu)橹?,其范圍?300~10000K,在此期間,即使攝像機斷電也不會丟失該設(shè)置。以按鈕方式設(shè)置白平衡最為精確和可靠,適用于大部分應用場合。
手動白平衡
開手動白平衡將關(guān)閉自動白平衡,此時改變圖像的紅色或藍色狀況有多達107個等級供調(diào)節(jié),如增加或減少紅色各一個等級、增加或減少藍色各一個等級。除次之外,有的攝像機還有將白平衡固定在3200K(白熾燈水平)和5500K(日光水平)等檔次命令。
攝像機人臉成像的關(guān)鍵關(guān)系在于:視頻或圖片畫面中“人臉”區(qū)域要有足夠的成像光線、成像大小和成像的真實還原性例如無變形和白平衡等。
無論采用任何種類的攝像頭,如果要進行有效的人臉成像,在整個畫面中理想的人臉部分畫面對應的典型參數(shù)是:
人臉檢測性能
在靜態(tài)畫面和動態(tài)視頻檢測人臉的主要指標是處理一張照片人臉檢測所需要花費的時間。衡量人臉檢測結(jié)果通常需要幾個指標:
1.輸入畫面大小
視頻圖像通常涉及CIF、D1、720P、1080P、2K、4K及以上等不同視頻分辨率。
通常用于人臉識別的視頻分辨率為720P和1080P。
2.檢測速度
對指定分辨率圖片完成一次人臉檢測所需要的時間,直接的指標是人臉識別圖像的處理幀率。
通常在1080P視頻下要求每秒能完成10幀以上的視頻檢測,即相當于每100ms要完成一幀畫面的人像檢測。
3.檢測數(shù)量
指在同一張視頻圖片中出現(xiàn)人人臉數(shù)量,和人臉抓拍的應用環(huán)境高度相關(guān)。人臉和比對環(huán)境下通常每個畫面中只有1個人出現(xiàn)。人臉門禁、人臉通行環(huán)境要求每個畫面能處理5個人臉。公共交通如車站、廣場等通常要求每個畫面處理多達30-50個人臉。
4.檢測精度
指在畫面出現(xiàn)多個人臉時算法能夠檢測出人臉的數(shù)量與真實人臉數(shù)量的差距。
總結(jié):人臉檢測通常和設(shè)備的應用場景相關(guān)度較大,如嵌入式設(shè)備比如人臉鎖或門禁、智能硬件往往只要求同一畫面只做一個人臉的識別;智能建筑門禁通行或會場簽到在同一畫面往往要求3-10人的人臉檢測;商場、車站或室外布控有時候需要同一畫面實現(xiàn)10-50人的人臉檢測處理。
活體判定
1.配合型活體檢測
通常要求被檢測的對象面對攝像機通過眨眼、張嘴、搖頭、點頭等組合動作,或者通過閱讀指定數(shù)字或者詞語,確保操作的為真實活體人臉。
2.無配合自然型活體檢測
非配合式活體檢測,不需要用戶做任何動作,依靠攝像頭在一定時間內(nèi)抓取到人臉進行相關(guān)的算法判斷是否是活體,避免利用照片、視頻等非活體投機行為。
活體識別技術(shù)一直是人臉識別的一個技術(shù)重點,人臉活體識別技術(shù)和與之對抗的人臉活體欺詐技術(shù)都在迅猛發(fā)展,相當于矛和盾的關(guān)系。
人員注冊管理
人臉門禁往往要求銜建立比對人員名單的人員庫,這個過程稱為人員注冊。人員注冊一般要求提供人員的基本信息如ID信息、姓名、所關(guān)聯(lián)的權(quán)限區(qū)域、以及最關(guān)鍵的要提供人臉比對質(zhì)量要求的清晰照片。人臉注冊可以采用自助注冊或者管理員批量處理的方式完成。
人臉特征提取和人臉庫管理比對
1.人臉特征提取
人臉識別的一個關(guān)鍵環(huán)節(jié)就是把從視頻圖片里檢測到的人臉照片通過深度學習或者其它的方法轉(zhuǎn)型成一定的數(shù)據(jù)結(jié)構(gòu),這個過程稱為人臉特征化。對一張人臉照片經(jīng)過特征化以后往往形成128維的矩陣或者不同的特征向量,然后對代表人臉的特征向量進行存儲管理、比對管理、檢索管理等。
人臉識別的特征提取分為幾種技術(shù)過程:
幾何特征。 從面部點之間的距離和比率作為特征,識別速度快,內(nèi)存要求比較小,對于光照敏感度降低。
基于模型特征。 根據(jù)不同特征狀態(tài)所具有概率不同而提取人臉圖像特征。
基于統(tǒng)計特征。 將人臉圖像視為隨機向量,并用統(tǒng)計方法辨別不同人臉特征模式,比較典型的有特征臉、獨立成分分析、奇異值分解等。
基于神經(jīng)網(wǎng)絡特征。 利用大量神經(jīng)單元對人臉圖像特征進行聯(lián)想存儲和記憶,根據(jù)不同神經(jīng)單元狀態(tài)的概率實現(xiàn)對人臉圖像準確識別。
當前比較主流的是基于神經(jīng)網(wǎng)絡的特征提取方法 。
2.人臉庫比對和管理
根據(jù)實際應用的場景不同,人臉庫可以分為以下幾種容量:
100人以內(nèi)超小規(guī)模人臉庫。 主要用于個人、家庭或者中小企業(yè)環(huán)境,用于人臉門鎖、人臉智能柜、中小企業(yè)人臉考勤等。
2000人以內(nèi)小規(guī)模人臉庫。 主要用于小型企業(yè)或社區(qū)單元樓的人臉門禁等應用。
20000人以內(nèi)中等規(guī)模人臉庫。 主要應用于中型企業(yè)、社區(qū)或者會場的人臉門禁、人臉簽到等應用。
50000人以內(nèi)大規(guī)模人臉庫。 用于大型企業(yè)、園區(qū)、社區(qū)的人臉門禁或大型活動應用。
50000人以上大規(guī)模人臉庫。 主要用于公安布控或者更大規(guī)模的人臉比對場景。
報警聯(lián)動及數(shù)據(jù)分析
人臉門禁應用中,當完成人臉檢測、人臉比對分析以后,通常涉及到人臉聯(lián)動處理。按照對聯(lián)動處理的響應速度,一般分為如下幾種類型:
1.實時聯(lián)動
人臉檢測、人臉比對和結(jié)果的聯(lián)動能夠滿足每秒完成5-10幀以上,普通人通常感覺不到人臉識別的延時過程,這種應用稱為實時聯(lián)動。
實時聯(lián)動通常要求整體的處理時間在0.2秒內(nèi)完成。
實時聯(lián)動通常用于人臉自然通行或者會場簽到等場景。
2.秒級聯(lián)動
人臉門禁從接觸到處理完成整個時間在1秒左右完成,普通人感受到延時但是可接受的狀態(tài)。
秒級聯(lián)動是人臉門禁主要的應用需求,應用于各類園區(qū)、建筑或者辦公室門禁場所。
3.延時聯(lián)動
如果從人臉出現(xiàn)到整體聯(lián)動完成需要1秒以上的處理時間,通常稱為延時聯(lián)動。延時的大小和應用場景相關(guān)。比如商場零售的會員分析統(tǒng)計或者課堂的人臉簽到經(jīng)常要求在分鐘級響應。
總結(jié):人臉門禁的主要功能涉及:人臉檢測采集、人員注冊、人臉庫管理和聯(lián)動報警及數(shù)據(jù)分析。功能的實現(xiàn)往往涉及到不同的應用場景和產(chǎn)品形態(tài)的實現(xiàn)。通常來講實現(xiàn)這些功能越有效、越便捷、越高的性價比,意味著更大的用戶滿意度。
第四篇 人臉門禁產(chǎn)品形態(tài)
組合型設(shè)備
實現(xiàn)人臉門禁的完整功能如果需要多個設(shè)備組合進行,就稱為組合型人臉門禁設(shè)備。典型的人臉門禁組合型設(shè)備涉及以下幾個部分:
人臉門禁的組成
攝像機用于采集視頻信息,主機用于運行人臉識別、人臉庫管理和注冊服務的軟件,客戶端用于用戶交互。幾個設(shè)備之間通過網(wǎng)絡進行連接。
組合型人臉門禁的典型設(shè)備是常見的監(jiān)控攝像頭和計算機主機組成,這些設(shè)備通常用于大型人臉庫管理。組合型人臉門禁的優(yōu)勢是設(shè)備性能比較高,缺點是組網(wǎng)實施比較復雜導致系統(tǒng)可靠度低或者維護工作量大。
一體化設(shè)備
一體化人臉門禁設(shè)備是指人臉識別和比對通常在同一個設(shè)備內(nèi)完成,不需要額外設(shè)備的配合。常見的一體化人臉門禁設(shè)備分為帶屏幕的一體化門禁設(shè)備和不帶屏幕的一體化人臉門禁設(shè)備。目前人臉門禁設(shè)備以一體化設(shè)備的占有率和增長速度最快。
1.帶屏幕一體化人臉門禁設(shè)備
設(shè)備直接集成攝像頭、屏幕、計算主板、聯(lián)動報警等,在單個設(shè)備完成人臉采集、人臉注冊、建庫比對、聯(lián)動門禁等功能。
2.不帶屏幕人臉門禁設(shè)備
設(shè)備直接集成攝像頭、計算主板、聯(lián)動報警等,在單個設(shè)備完成人臉采集、人臉注冊、建庫比對、聯(lián)動門禁等功能,但是不帶屏幕輸出,可以通過聲光信號進行門禁聯(lián)動。
聯(lián)網(wǎng)型設(shè)備
1.局域聯(lián)網(wǎng)
門禁設(shè)備之內(nèi)通過局域網(wǎng)進行多臺設(shè)備的聯(lián)網(wǎng)管理,可以實現(xiàn)統(tǒng)一的用戶注冊、人臉庫管理和權(quán)限管理等,稱為局域網(wǎng)聯(lián)網(wǎng)設(shè)備或稱企業(yè)內(nèi)網(wǎng)型聯(lián)網(wǎng)。
2.互聯(lián)網(wǎng)云聯(lián)網(wǎng)
門禁設(shè)備之間如果通過互聯(lián)網(wǎng)進行分布式的管理,客戶端通過手機或電腦進行遠程的管理,稱為互聯(lián)網(wǎng)云聯(lián)網(wǎng)的門禁系統(tǒng)。
總結(jié):人臉門禁的產(chǎn)品形態(tài)分為組合型產(chǎn)品、一體化產(chǎn)品,目前人臉門禁的主要產(chǎn)品為一體化門禁產(chǎn)品。一體化人臉門禁產(chǎn)品又通常以帶屏幕的一體化人臉門禁產(chǎn)品為主,未來人臉門禁攝像機類型的產(chǎn)品也將有很大的成長空間。人臉門禁的組網(wǎng)分為企業(yè)內(nèi)部的局域網(wǎng)產(chǎn)品和基于互聯(lián)網(wǎng)的云聯(lián)網(wǎng)產(chǎn)品為主。局域網(wǎng)人臉門禁組網(wǎng)通常為企業(yè)自己組建管理服務器和統(tǒng)一的集中管理端進行設(shè)備的管理。基于互聯(lián)網(wǎng)的云聯(lián)網(wǎng)人臉門禁是基于在互聯(lián)網(wǎng)上的服務器進行互聯(lián)網(wǎng)聯(lián)網(wǎng)的設(shè)備管理,客戶端既有電腦這樣的傳統(tǒng)設(shè)備,又可以采用手機移動客戶端進行管理。