本白皮書將從人臉門禁產品應用場景分類、產品類型分級、主要功能劃分、產品形態、硬件、軟件、測試檢驗方法、行業解決方案、未來發展趨勢多個章節進行論述。本書可供門禁系統從業者、人工智能從業者、專家、安防從業者、設計院、政府相關部門、學生、工程商、集成商等相關人士閱讀、參考。
前言
無感通行一定是未來出入口控制系統的發展趨勢,無閘機、無需人員配合即可便利通行,但又能保障系統的安全性。人工智能(AI)技術給無感通行帶來無限的可能性。
近30年來對整個安防系統,乃至整個弱電系統來說,發生革命性技術突破的當屬視頻監控技術,其核心就來源于AI技術中的計算機視覺技術。如今的監控技術可以廣泛應用于監控、門禁、車輛出入、訪客、消費、考勤、電梯控制、入侵報警,人臉識別技術應用就是典型場景代表,人臉識別+門禁、人臉識別+電梯、人臉識別+停車場,而人臉門禁就是其中最典型的革新應用之一,正是本白皮書要深入予以探討的。
無感通行整體解決方案就是系統全面支持多種出入控制方式:刷門禁卡、刷身份證、刷銀行卡、刷二維碼、指紋識別、指靜脈識別、支付寶、微信、Apple Pay、虹膜、人臉識別、聲紋識別等,全部支持,或者最少支持2種以上的設備才是未來技術的主流。
AI智道聯合人人智能、賽翼智能發布本人臉門禁產品技術白皮書,用于促進行業的技術發展和技術進步,共同開拓全新的門禁市場,集合行業力量,整合多種資源,逐步建立起優高效的產業生態。
本白皮書將從人臉門禁產品應用場景分類、產品類型分級、主要功能劃分、產品形態、硬件、軟件、測試檢驗方法、行業解決方案、未來發展趨勢多個章節進行論述。本書可供門禁系統從業者、人工智能從業者、專家、安防從業者、設計院、政府相關部門、學生、工程商、集成商等相關人士閱讀、參考。
概述
系統概述
人臉門禁系統是人工智能技術在出入口通行領域的典型場景應用,目前正處于用人臉識別技術代替傳統IC卡的升級換代時期。門禁系統和建筑智能化系統的出入口通行系統經過多年的發展已經有了穩定成熟的以IC卡為主的技術體系,系統封閉、行業缺乏統一標準、用戶體驗和用戶交互流程差異很大的一些局限。尤其是門禁卡和人員弱關聯,代打卡、冒名頂替時有發生,存在很大的安全隱患,只認卡不認人。而人臉識別技術是人工智能在視覺識別領域發展最快的技術之一,非常好的解決了人員身份鑒別和權限統一的問題。當然新生事物也有一定的局限性,比如存在技術和產品的結合尚未形成統一標準、各個廠商自成系統難于兼容等問題。為了更好的讓用戶理解人臉門禁產品的應用優勢和局限、指導廠商逐步建立逐步一致的人臉門禁的產品定義和功能描述,減少重復開發和技術概念混亂,AI智道(公眾號:AIoWord)聯合人人智能、賽翼智能等廠家制定本人臉門禁產品技術白皮書,用于建立行業統一的技術共識。本白皮書采用在線發布、圖書出版、共同更新維護的形式,集合行業力量,逐步建立統一高效的人臉門禁產品體系,促進行業的發展。
門禁系統
門禁系統(Access Control System)又被稱為出入管理控制系統,是安全防范管理系統的重要組成部分。門禁系統集自動識別技術和安全管理措施為一體,涉及人工智能、電子、機械、生物識別、光學、計算機、控制、通訊等技術,主要解決出入口安全防范管理的問題,實現對人、物的出入控制和管理功能。常見的門禁系統有獨立式密碼門禁系統、非接觸卡式門禁系統、生物識別門禁系統、手機APP門禁系統等,曾經應用最廣泛的非接觸卡式門禁系統逐漸被生物識別門禁系統所替代,尤其是人臉識別。
典型的聯網門禁系統由門禁服務器、門禁管理軟件、控制器、接口模塊、讀卡器、人證合一一體機、卡片、電鎖、出門按鈕、緊急玻璃破碎器和蜂鳴器等設備組成。讀卡器包括指紋、聲紋、人臉、虹膜、卡式多種類型。
門禁系統在國內外的應用是有一定區別的,門禁系統最早出現在國外,技術發展比較成熟,通常都是聯網的總線式門禁系統,門禁系統包含考勤、在線巡更功能,可以集成報警系統,能夠和視頻監控系統進行聯動;而國內的門禁系統一般被歸入一卡通系統建設,而一卡通系統通常包括門禁系統、訪客系統、考勤系統、巡更系統、消費系統、電梯管理系統和車輛出入管理系統,這個范圍要較國外的門禁系統要大,功能就相對簡單一些。隨著AI技術的成熟,人臉門禁正在大行其道,正在改變整個市場格局。
門禁系統適用各種場所,如銀行、酒店、機房、機要室、辦公室、智能化小區、工廠等。在數字技術網絡技術飛速發展的今天門禁技術得到了迅猛的發展。早已超越了單純的門道及鑰匙管理,它已經逐漸發展成為一套完整的出入管理系統。它在工作環境安全、人事考勤管理等行政管理工作中發揮著巨大的作用。如今的無感通行系統中不一定會存在實體“門”,也許“門”是通道閘機、“門”是電梯、或者根本就沒有“門”(虛擬的)。
門禁系統從技術維度可分為:電子密碼門禁系統、卡式門禁系統、指紋門禁系統、指靜脈門禁系統、掌紋門禁系統、虹膜門禁系統、聲紋識別門禁系統和人臉識別門禁系統等。
本白皮書聚焦在人臉識別門禁系統,故以此為主。
人臉識別技術
人臉識別(Face Recognition,FR)是一種基于人的臉部特征信息進行身份識別的一種生物識別技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別的一系列相關技術,通常也叫做人像識別、面部識別。
人臉與人體的其它生物特征(指紋、虹膜等)一樣與生俱來,它的唯一性和不易被復制的良好特性為身份鑒別提供了必要的前提,與其它類型的生物識別比較人臉識別具有如下特點:
非強制性。 用戶不需要專門配合人臉采集設備,幾乎可以在無意識的狀態下就可獲取人臉圖像,這樣的取樣方式沒有“強制性”;
非接觸性。 用戶不需要和設備直接接觸就能獲取人臉圖像;
并發性。 在實際應用場景下可以進行多個人臉的分揀、判斷及識別。
除此之外,還符合視覺特性:“以貌識人”的特性,以及操作簡單、結果直觀、隱蔽性好等特點。
人臉識別系統的研究始于20世紀60年代,80年代后隨著計算機技術和光學成像技術的發展得到提高,而真正進入初級的應用階段則在90年后期;最近幾年隨著以深度學習為主的人工智能技術進步,人臉識別技術得到了迅猛的發展。“人臉識別系統”集成了人工智能、機器識別、機器學習、模型理論、專家系統、視頻圖像處理等多種專業技術,是綜合性比較強的系統工程技術。
人臉識別系統通常包括幾個過程:人臉圖像采集及檢測、關鍵點提取、人臉規整(圖像處理)、人臉特征提取和人臉識別比對。
人臉圖像采集。 不同的人臉圖像都能通過攝像鏡頭采集下來,比如靜態圖像、動態圖像、不同的位置、不同表情等方面都可以得到很好的采集。當用戶在采集設備的拍攝范圍內時,采集設備會自動搜索并拍攝用戶的人臉圖像。
人臉檢測。 人臉檢測在實際中主要用于人臉識別的預處理,即在圖像中準確標定出人臉的位置和大小。
關鍵點提取(特征提?。?/span> 人臉識別系統可使用的特征通常分為視覺特征、像素統計特征、人臉圖像變換系數特征、人臉圖像代數特征等。人臉特征提取就是針對人臉的某些特征進行的。人臉特征提取,也稱人臉表征,它是對人臉進行特征建模的過程。人臉特征提取的方法歸納起來分為兩大類:一種是基于知識的表征方法;另外一種是基于代數特征或統計學習的表征方法。
人臉規整(預處理)。 對于人臉的圖像預處理是基于人臉檢測結果,對圖像進行處理并最終服務于特征提取的過程。系統獲取的原始圖像由于受到各種條件的限制和隨機干擾,往往不能直接使用,必須在圖像處理的早期階段對它進行灰度校正、噪聲過濾等圖像預處理。對于人臉圖像而言,其預處理過程主要包括人臉圖像的光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。
人臉識別比對(匹配與識別)。 提取的人臉圖像的特征數據與數據庫中存儲的特征模板進行搜索匹配,通過設定一個閾值,當相似度超過這一閾值,則把匹配得到的結果輸出。人臉識別就是將待識別的人臉特征與已得到的人臉特征模板進行比較,根據相似程度對人臉的身份信息進行判斷??煞譃?:1、1:N、屬性識別。其中1:1是將2張人臉對應的特征值向量進行比對,1:N是將1張人臉照片的特征值向量和另外N張人臉對應的特征值向量進行比對,輸出相似度最高或者相似度排名前X的人臉。
人臉識別的優勢在于其自然性和不被被測個體察覺的特點。
所謂自然性,是指該識別方式同人類(甚至其他生物)進行個體識別時所利用的生物特征相同。例如人臉識別,人類也是通過觀察比較人臉區分和確認身份的,另外具有自然性的識別還有虹膜識別、語音識別、體形識別等,而指紋識別、虹膜識別等都不具有自然性,因為人類或者其他生物并不通過此類生物特征區別個體。
不被察覺的特點對于一種識別方法也很重要,這會使該識別方法不令人反感,并且因為不容易引起人的注意而不容易被欺騙。人臉識別具有這方面的特點,它完全利用可見光獲取人臉圖像信息,不同于指紋識別或者虹膜識別需要利用手指接觸的傳感器采集指紋,或者利用紅外線采集虹膜圖像,這些特殊的采集方式很容易被人察覺,從而造成諸多不便。
人臉識別被認為是生物特征識別領域甚至人工智能領域最困難的研究課題之一。人臉識別的困難主要是人臉作為生物特征的特點所帶來的。
相似性。 不同個體之間的區別不大,所有的人臉的結構都相似,甚至人臉器官的結構外形都很相似。這樣的特點對于利用人臉進行定位是有利的,但是對于利用人臉區分人類個體是不利的。例如雙胞胎現象,指胎生動物一次懷胎生下兩個個體的情況。雙胞胎一般可分為同卵雙胞胎和異卵雙胞胎兩類。在人類社會,全世界雙胞胎平均出生率為1∶89。對于人類的雙胞胎現象,有些雙胞胎面部存在差異,有些雙胞胎甚至從面部特征來看相似度極高,對于人臉識別系統形成非常大的挑戰,幾乎從生物特征上很難區別出每個個體。
易變性。 人臉的外形很不穩定,人可以通過臉部的變化產生很多表情,而在不同觀察角度,人臉的視覺圖像也相差很大,另外,人臉識別還受光照條件(例如白天和夜晚,室內和室外等)、人臉的很多遮蓋物(例如口罩、墨鏡、頭發、胡須等)、年齡等多方面因素的影響。
易攻擊性。 隨著數字拍照、視頻合成技術等發展,越來越容易獲得某個指定人的人臉信息或者合成人臉信息。更甚至隨著對抗訓練(Adversarial Training)的深度學習技術的發展,計算機可以合成高精度的任何人的人臉等生物特征信息。某些生成對抗網絡訓練的反人臉識別,身份欺騙成功率達99.5%,甚至成為許多人臉識別系統的克星。
產品的場景化分類分級模型
人臉識別門禁控制系統基于先進的人臉識別技術在門禁出入口領域的應用創新。相比鑰匙門禁、IC卡門禁、指紋門禁、虹膜門禁等其它技術手段,人臉門禁如果有以下優勢:
人臉識別無卡進入,免去攜帶卡證的額外工作;
高速準確方便快捷,人臉識別通常在1秒以內完成甚至可實現無感自然通行;
照片記錄可追溯驗證;
同時人臉門禁也存在一些風險:
對于高相似人臉或者雙胞胎等存在一定的誤識風險;
人臉識別容易受到一些技術手段的攻擊;
人臉識別涉及到隱私權等風險。
總體來說人臉識別門禁是門禁系統的一次重大技術變革,將門禁智能通行帶入了全新的AI時代。
本白皮書的關鍵內容,是對人臉門禁的產品應用場景、產品技術形態分為三類六等,樹立了對人臉門禁產品應用和開發的技術指導,這也是本次白皮書重大的創新。這個分類辦法結合了對門禁應用場景和人臉識別技術的深入調研需求提煉和技術分析,歡迎廣大讀者提出寶貴意見以便于編者修改完善。
門禁通行的應用場景分為三類:
強配合類。 人臉與設備距離0.5米以內,人臉角度在15度以內,人臉比對模式為1:1人證比對或者<1000人的小型人臉庫比對。如家庭人臉門鎖、辦公室小型人臉門禁、人臉考勤等。
半配合類。 人臉與設備的距離在0.5米-1.5米之間,人臉角度在30度以內,人臉比對庫容量在10000人以內的中等規模人臉庫。如智能建筑樓層人臉門禁、社區單元人臉門禁等。
自然通行類。 人臉與設備的距離在1米到3米之間,人臉角度在45度以內,人臉比對庫容量在1萬到10萬人以內。如園區出入口人臉通行、公共交通人臉閘機等。
人臉門禁產品的技術等級劃分為六級:
第一級:學術級。 人臉庫容量在百人左右,準確度在60%以下,用于新技術的學術分析;
第二級:娛樂級。 人臉庫容量在500人左右,準確度在60-85%之間,用于娛樂游戲出錯無直接風險;
第三級:消費級。 人臉庫容量在1000人以內,準確度在85-95%之間,用于個人領域或中小企業;
第四級:商業級。 人臉庫容量在1千-1萬之間,準確度在95-99%之間,用于中等規模企業應用;
第五級:行業級。 人臉庫容量在1萬到10萬人左右,準確度在99-99.999%之間,用于超大規模企業或者公安、交通等海量人群應用;
第六級:金融級。 人臉庫容量在10萬人以上,準確度在99.999%以上,出錯率低于十萬分之一,可用于金融支付等應用領域。
總結:通過按三種類別、六個級別的細分應用,可以將人臉門禁產品的應用場景和產品技術特點較好區分出來,為后續產品應用和產品開發提供指導。
第一篇 應用場景分類
人臉門禁系統如果按照應用場景分類,可分為三類:強配合類、半配合類和自然通行類。
強配合類應用
強配合類應用主要應用于傳統近紅外人臉門禁、智能鎖、柜和設備等。個人、家庭、中小企業的人臉識別門禁或者設備的應用,往往用戶人臉庫規模小、設備成本低、有時候需要設備提供電池供電的低功耗場景等應用需求,這種應用場景往往是強配合類應用。
強配合應用情況下,典型人臉庫容量在50-1000人之間,在識別時需要將人臉距離設備在0.5米以內,人臉與設備之間的夾角在15度以內幾乎完全正臉狀態。強配合類應用的人臉識別技術精度要求有限、設備成本低、功耗低,往往適用于小規模場所。
關鍵參數:
人臉庫容量:1000人以下
人臉識別距離:1米以內
人臉檢測比對搜索時間:<3秒
人臉識別角度:15度以內,需要特意配合
半配合類應用
半配合類主要應用在建筑樓層通道門禁等場景。在企業樓層、辦公室門禁、電梯、社區單元門口等應用場景下,通常是企業或者小區將人臉門禁代替傳統的IC卡或鑰匙門禁,適用采用半配合類人臉門禁。
半配合類的人臉門禁人臉庫在10000人以內,門禁使用時人與設備的距離 在0.5米到1.5米之間,可以實現人臉與設備有一定的夾角如30度以內,甚至在理想情況下實現人到門開的不停留通行狀態。
關鍵參數:
人臉庫容量:1萬人以下
人臉比對距離:0.5-1.5米
人臉檢測比對搜索時間:<1秒
人臉識別角度:30度以內,半配合狀態
自然通行類
自然同行類就是人不用可以配合系統的應用,比如園區建筑出入口室內外應用及人臉自然簽到。在住宅社區門口、大型建筑的出入口、大型演出或展會活動時,通常需要自然通行的人臉門禁產品。自然通行人臉門禁往往人臉庫規??蛇_1萬到10萬人左右,人臉與設備的距離可在1到3米左右,而且能夠適合室內和室外等各種的光線環境,人員通行能夠做到完全的不停留通行和人臉比對分析。
關鍵參數:
人臉庫容量:1-10萬人
人臉識別距離:1-3米
人臉檢測比對搜索時間:<0.5秒
人臉識別角度:45度以內,與通行路線一致,不影響自然通行狀態
總結:人臉門禁應用的發展趨勢是從強配合向半配合過渡、進而向自然通行發展的趨勢,科技讓生活服務變得越來越便利化。同時在強配合型應用領域從近紅外的企業人臉識別,向家庭的人臉門鎖擴展,但由于人臉門鎖對人臉識別技術的抗攻擊能力帶來全新的挑戰,人臉門禁的發展狀態尚存在較多不確定因素。
第二篇 產品類型分級
人臉門禁產品的技術等級劃分為六級:學術級、娛樂級、消費級、企業級、行業級、金融級。
第一級:學術級
學術級技術精度通常是指可重復的準確度在60%以下,用于原理檢驗和理論創新,往往不一定對應具體的產品。有些學術級技術可在實驗室的理想條件下取得很高的人臉識別精度,但是在現實環境應用時由于光線、鏡頭、計算資源等多種原因往往無法復現實驗室成果,甚至有些學術論文的理論成果也難以持續復現,學術級的往往不對應具體的量產產品。
第二級:娛樂級
人臉識別的某些細分功能在有些應用領域的成熟度不高,比如通過人臉識別來分析人的年齡、性別,甚至通過人臉識別來區分雙胞胎或者臉部高相似人群等,人臉識別通常的成功概率低于85%以下,這樣成熟度的技術通常用于做娛樂型產品。
例如用于人臉識別的屬性分析或者娛樂游戲產品等。
第三級:消費級
人臉識別應用通常在中小規模人臉庫如千人以內、中近距離如半米以內有較高的人臉識別精度時,人臉識別可用于家庭、商鋪或中小企業等,作為消費級應用的產品。目前大量基于近紅外技術的人臉考勤機、人臉門禁級通常是消費級產品 。
第四級:企業級
企業級人臉門禁產品通常用于中大規模的企業或者居民社區、行政單位的智能通行應用。人臉庫容量通常在萬人以內,人臉比對的反應時間通常在秒級,應用場景既涉及室內均勻光線又涉及到室外或建筑出入口的日光或強反差的光線情況。企業級人臉門禁是當前市場增長最迅猛的人臉門禁產品領域。
第五級:行業級
在公共安全、公共交通、大型園區、大型演唱會或展覽活動等進行人臉識別比對或者公共安全的應用時,往往需要具有行業級人臉識別技術的產品。應用環境通常在室外牙大型建筑的多個出入口,設備需要聯網分布式運行,用于解決數萬甚至數十萬人的智能通行需求。
第六級:金融級
人臉識別的生物精度的理論水平在萬分之一的誤差之內,但是金融支付通常要求系統的精度誤差在百萬分之一甚至更低水平,用于保障金融安全的人臉識別產品技術稱為金融級安全的技術。目前來看人臉識別在金融支付領域還面臨不少挑戰有待克服。
總結:人臉識別的產品分為不同的技術成熟度等級,分別適應于不同的應用領域。從目前來看,人臉門禁正從消費級人臉門禁向企業級、行業級甚至金融級安全的人臉門禁的發展歷程中。當前比較成熟的是用于萬人庫的企業級人臉門禁產品,也有少數數萬人臉庫的行業級產品已經開始出現。
第三篇 產品的主要功能
人臉門禁產品的主要功能包括人臉成像采集、人臉圖像特征提取及人臉庫比對管理、報警聯動數據分析幾個功能模塊。每種功能模塊涉及不同的業務特點。
人臉成像采集
不同的人臉圖像通過攝像鏡頭采集得到,比如靜態圖像、動態圖像、不同的位置、不同表情等,當采集對象在設備的拍攝范圍內時,采集設備會自動搜索并拍攝人臉圖像。影響人臉成像采集的主要因素是攝像頭的性能指標和攝像頭安裝部署位置等因素。通常情況下人像采集涉及如下因素:
圖像大小。 人臉圖像過小會影響識別效果,人臉圖像過大會影響識別速度。圖像大小一定程度上在實際應用場景是人臉離攝像頭的距離。
圖像分辨率。 越低的圖像分辨率越難識別。圖像大小綜合圖像分辨率,直接影響攝像頭識別距離。
光照環境。 攝像頭成像需要一定的光照范圍,過曝或過暗的光照環境都會影響人臉識別效果。這是影響人臉識別最重要的因素之一。通??梢圆捎米匀谎a光和外部人工補光的方式來解決光照問題。
模糊程度。 人臉相對于攝像頭的移動經常會產生運動模糊,導致影響檢測和識別效果。
遮擋程度。 五官無遮擋、臉部邊緣清晰的圖像為最佳。而在實際場景中,很多人臉都會被帽子、眼鏡、口罩等遮擋物遮擋。
采集角度。 人臉相對于攝像頭角度為正臉最佳。但實際場景中往往很難抓拍正臉,會涉及到人臉與攝像頭之間多少角度適宜于人臉采集的進行。
攝像機成像的幾種參數
1.攝像頭成像分辨率
人像采集的攝像頭通常分為USB攝像頭、MIPI攝像頭和網絡攝像頭。其中USB和MIPI通常傳輸未經壓縮的視頻數據一般用于設備內近距離傳輸,網絡攝像頭通常傳輸壓縮后的視頻數據可以用于設備間的遠距離傳輸。以下以網絡攝像頭為例描述攝像頭的成像分辨率。
720p。 720P實際是指分辨率1280×720像素。計算一下就是1280×720=921600像素,720p或720i為百萬像素分辨率,通常指百萬網絡攝像機。720P每路默認圖像碼流為3M,具體的速率和視頻壓縮的比率也高度相關。
960p。 960P實際是指分辨率1280×960像素。計算一下就是1280×960=1228800像素,一般都會叫960p或960i為130萬像素分辨率,通常指130萬像素的攝像機。960P每路默認圖像碼流為4M,具體的速率和視頻壓縮的比率也高度相關。
1080p。 1080P實際是指分辨率1920×1080像素。計算一下就是1920×1080=2073600像素,一般都會叫 1080p或1080i為200萬像素分辨率,通常指200萬像素的攝像機。1080P每路默認圖像碼流為5M,具體的速率和視頻壓縮的比率也高度相關。
4K。 4K指的是3840水平×2160垂直(16:9)像素的分辨率,支持120p、60p、59.94p、50p、30p、29.97p、25p、24p和23.976p,共9種幀率。4K每路默認圖像碼流為8M以上,具體的速率和視頻壓縮的比率也高度相關。
2.光照強度
人臉若要被攝像機成像,首要條件是人臉接受到一定程度的光線即受到足夠的光照強度。光照強度的標準屬于是照度,照度是反映光照強度的一種單位,其物理意義是照射到單位面積上的光通量,照度的單位是每平方米的流明(Lm)數,也叫做勒克斯(Lux):1Lux=1Lm/平方米。上式中,Lm是光通量的單位,其定義是純鉑在熔化溫度(約1770℃)時,其1/60平方米的表面面積于1球面度的立體角內所輻射的光量。
人臉檢測要求人臉接受的光既不能太強也不能太弱,通常需要10-3000lux之間的亮度比較適宜,過亮或者過暗都能導致攝像楊對人臉成像效果的差異。
以下是各種環境照度值:(單位 lux)
3.寬動態
當在強光源(日光、燈具或反光等)照射下的高亮度區域及陰影、逆光等相對亮度較低的區域在圖像中同時存在時,攝像機輸出的圖像會出現明亮區域因曝光過度成為白色,而黑暗區域因曝光不足成為黑色,嚴重影響圖像質量。攝像機在同一場景中對最亮區域及較暗區域的表現是存在局限的,這種局限就是通常所講的“動態范圍”。
寬動態(WDR)技術是在非常強烈的對比下讓攝像機看到影像的特色而運用的一種技術。WDR是Wide Dynamic Range 的縮寫,意思是寬動態范圍。當在強光源(日光、燈具或反光等)照射下的高亮度區域及陰影、逆光等相對亮度較低的區域在圖像中同時存在時,攝像機輸出的圖像會出現明亮區域因曝光過度成為白色,而黑暗區域因曝光不足成為黑色,嚴重影響圖像質量。攝像機在同一場景中對最亮區域及較暗區域的表現是存在局限的,這種局限就是通常所講的“動態范圍”。
寬動態范圍是圖像能分辨最亮的亮度信號值與能分辨的最暗的亮光信號值的比值。寬動態的表現方式以“倍數”或“dB”來表示。
寬動態最常見的形式是使用多次曝光方法,該方法包括捕獲短時間內的兩幀圖像和一個長曝光速度。第一次曝光捕捉明亮區域場景中的細節,而后者則捕獲場景中的暗部區域的細節。然后將兩個圖像組合在一起,可以在同時呈現明亮和黑暗區域兩個圖像細節。通常的寬動態范圍介于50~70dB之間,更高性能的寬動態范圍從100~130dB之間。最先進的寬動態范圍(又被稱為第三代寬動態)被叫做"真WDR",通過捕獲四個幀圖像進行比較,以達到最佳效果。相較于之前的兩幀寬動態范圍技術來說,幀數量的增加有助于解決圖像中前景和背景之間的照明差異。
4.人臉成像角度
人臉成像的角度對應是人臉和鏡頭之間的三種角度:上下翻轉pitch,左右翻轉yaw,平面內旋轉roll的角度。最理想情況下,攝像頭與人臉之間的三種角度是:
上下翻轉pitch:攝像頭成像位置與人臉位置同高,這樣上下翻轉角度幾乎為0。
左右翻轉yaw:人臉正對攝像頭,左右翻轉角度在0-15度之間。
平面內旋轉roll:人臉與攝像頭的重力線相同,不涉及到臉的平面旋轉。
但真實的攝像機成像時往往涉及到攝像頭安裝位置與人像的真實角度等問題,導致攝像機無法接近理想情況成像。
5.白平衡
在任意色溫條件下,攝像機鏡頭所拍攝的標準白色經過電路的調整,使之成像后仍然為白色,使被拍攝到的圖像的色彩能夠精確的被反映出來,這樣的過程稱為白平衡。
白平衡(White Balance)只用于彩色攝像機,其用途是實現攝像機圖像能精確反映景物狀況,有手動白平衡和自動白平衡兩種方式。
自動白平衡
連續方式:此時白平衡設置將隨著景物色彩溫度的改變而連續地調整,范圍為2800~6000K。這種方式對于景物的色彩溫度在拍攝期間不斷改變的場合是最適宜的,使色彩表現自然,但對于景物中很少甚至沒有白色時,連續的白平衡不能產生最佳的彩色效果。
按鈕方式:先將攝像機對準諸如白墻、白紙等白色目標,然后將自動方式開關從手動撥到設置位置,保留在該位置幾秒鐘或者至圖像呈現白色為止,在白平衡被執行后,將自動方式開關撥回手動位置以鎖定該白平衡的設置,此時白平衡設置將保持在攝像機的存儲器中,直至再次執行被改變為止,其范圍為2300~10000K,在此期間,即使攝像機斷電也不會丟失該設置。以按鈕方式設置白平衡最為精確和可靠,適用于大部分應用場合。
手動白平衡
開手動白平衡將關閉自動白平衡,此時改變圖像的紅色或藍色狀況有多達107個等級供調節,如增加或減少紅色各一個等級、增加或減少藍色各一個等級。除次之外,有的攝像機還有將白平衡固定在3200K(白熾燈水平)和5500K(日光水平)等檔次命令。
攝像機人臉成像的關鍵關系在于:視頻或圖片畫面中“人臉”區域要有足夠的成像光線、成像大小和成像的真實還原性例如無變形和白平衡等。
無論采用任何種類的攝像頭,如果要進行有效的人臉成像,在整個畫面中理想的人臉部分畫面對應的典型參數是:
人臉檢測性能
在靜態畫面和動態視頻檢測人臉的主要指標是處理一張照片人臉檢測所需要花費的時間。衡量人臉檢測結果通常需要幾個指標:
1.輸入畫面大小
視頻圖像通常涉及CIF、D1、720P、1080P、2K、4K及以上等不同視頻分辨率。
通常用于人臉識別的視頻分辨率為720P和1080P。
2.檢測速度
對指定分辨率圖片完成一次人臉檢測所需要的時間,直接的指標是人臉識別圖像的處理幀率。
通常在1080P視頻下要求每秒能完成10幀以上的視頻檢測,即相當于每100ms要完成一幀畫面的人像檢測。
3.檢測數量
指在同一張視頻圖片中出現人人臉數量,和人臉抓拍的應用環境高度相關。人臉和比對環境下通常每個畫面中只有1個人出現。人臉門禁、人臉通行環境要求每個畫面能處理5個人臉。公共交通如車站、廣場等通常要求每個畫面處理多達30-50個人臉。
4.檢測精度
指在畫面出現多個人臉時算法能夠檢測出人臉的數量與真實人臉數量的差距。
總結:人臉檢測通常和設備的應用場景相關度較大,如嵌入式設備比如人臉鎖或門禁、智能硬件往往只要求同一畫面只做一個人臉的識別;智能建筑門禁通行或會場簽到在同一畫面往往要求3-10人的人臉檢測;商場、車站或室外布控有時候需要同一畫面實現10-50人的人臉檢測處理。
活體判定
1.配合型活體檢測
通常要求被檢測的對象面對攝像機通過眨眼、張嘴、搖頭、點頭等組合動作,或者通過閱讀指定數字或者詞語,確保操作的為真實活體人臉。
2.無配合自然型活體檢測
非配合式活體檢測,不需要用戶做任何動作,依靠攝像頭在一定時間內抓取到人臉進行相關的算法判斷是否是活體,避免利用照片、視頻等非活體投機行為。
活體識別技術一直是人臉識別的一個技術重點,人臉活體識別技術和與之對抗的人臉活體欺詐技術都在迅猛發展,相當于矛和盾的關系。
人員注冊管理
人臉門禁往往要求銜建立比對人員名單的人員庫,這個過程稱為人員注冊。人員注冊一般要求提供人員的基本信息如ID信息、姓名、所關聯的權限區域、以及最關鍵的要提供人臉比對質量要求的清晰照片。人臉注冊可以采用自助注冊或者管理員批量處理的方式完成。
人臉特征提取和人臉庫管理比對
1.人臉特征提取
人臉識別的一個關鍵環節就是把從視頻圖片里檢測到的人臉照片通過深度學習或者其它的方法轉型成一定的數據結構,這個過程稱為人臉特征化。對一張人臉照片經過特征化以后往往形成128維的矩陣或者不同的特征向量,然后對代表人臉的特征向量進行存儲管理、比對管理、檢索管理等。
人臉識別的特征提取分為幾種技術過程:
幾何特征。 從面部點之間的距離和比率作為特征,識別速度快,內存要求比較小,對于光照敏感度降低。
基于模型特征。 根據不同特征狀態所具有概率不同而提取人臉圖像特征。
基于統計特征。 將人臉圖像視為隨機向量,并用統計方法辨別不同人臉特征模式,比較典型的有特征臉、獨立成分分析、奇異值分解等。
基于神經網絡特征。 利用大量神經單元對人臉圖像特征進行聯想存儲和記憶,根據不同神經單元狀態的概率實現對人臉圖像準確識別。
當前比較主流的是基于神經網絡的特征提取方法 。
2.人臉庫比對和管理
根據實際應用的場景不同,人臉庫可以分為以下幾種容量:
100人以內超小規模人臉庫。 主要用于個人、家庭或者中小企業環境,用于人臉門鎖、人臉智能柜、中小企業人臉考勤等。
2000人以內小規模人臉庫。 主要用于小型企業或社區單元樓的人臉門禁等應用。
20000人以內中等規模人臉庫。 主要應用于中型企業、社區或者會場的人臉門禁、人臉簽到等應用。
50000人以內大規模人臉庫。 用于大型企業、園區、社區的人臉門禁或大型活動應用。
50000人以上大規模人臉庫。 主要用于公安布控或者更大規模的人臉比對場景。
報警聯動及數據分析
人臉門禁應用中,當完成人臉檢測、人臉比對分析以后,通常涉及到人臉聯動處理。按照對聯動處理的響應速度,一般分為如下幾種類型:
1.實時聯動
人臉檢測、人臉比對和結果的聯動能夠滿足每秒完成5-10幀以上,普通人通常感覺不到人臉識別的延時過程,這種應用稱為實時聯動。
實時聯動通常要求整體的處理時間在0.2秒內完成。
實時聯動通常用于人臉自然通行或者會場簽到等場景。
2.秒級聯動
人臉門禁從接觸到處理完成整個時間在1秒左右完成,普通人感受到延時但是可接受的狀態。
秒級聯動是人臉門禁主要的應用需求,應用于各類園區、建筑或者辦公室門禁場所。
3.延時聯動
如果從人臉出現到整體聯動完成需要1秒以上的處理時間,通常稱為延時聯動。延時的大小和應用場景相關。比如商場零售的會員分析統計或者課堂的人臉簽到經常要求在分鐘級響應。
總結:人臉門禁的主要功能涉及:人臉檢測采集、人員注冊、人臉庫管理和聯動報警及數據分析。功能的實現往往涉及到不同的應用場景和產品形態的實現。通常來講實現這些功能越有效、越便捷、越高的性價比,意味著更大的用戶滿意度。
第四篇 人臉門禁產品形態
組合型設備
實現人臉門禁的完整功能如果需要多個設備組合進行,就稱為組合型人臉門禁設備。典型的人臉門禁組合型設備涉及以下幾個部分:
人臉門禁的組成
攝像機用于采集視頻信息,主機用于運行人臉識別、人臉庫管理和注冊服務的軟件,客戶端用于用戶交互。幾個設備之間通過網絡進行連接。
組合型人臉門禁的典型設備是常見的監控攝像頭和計算機主機組成,這些設備通常用于大型人臉庫管理。組合型人臉門禁的優勢是設備性能比較高,缺點是組網實施比較復雜導致系統可靠度低或者維護工作量大。
一體化設備
一體化人臉門禁設備是指人臉識別和比對通常在同一個設備內完成,不需要額外設備的配合。常見的一體化人臉門禁設備分為帶屏幕的一體化門禁設備和不帶屏幕的一體化人臉門禁設備。目前人臉門禁設備以一體化設備的占有率和增長速度最快。
1.帶屏幕一體化人臉門禁設備
設備直接集成攝像頭、屏幕、計算主板、聯動報警等,在單個設備完成人臉采集、人臉注冊、建庫比對、聯動門禁等功能。
2.不帶屏幕人臉門禁設備
設備直接集成攝像頭、計算主板、聯動報警等,在單個設備完成人臉采集、人臉注冊、建庫比對、聯動門禁等功能,但是不帶屏幕輸出,可以通過聲光信號進行門禁聯動。
聯網型設備
1.局域聯網
門禁設備之內通過局域網進行多臺設備的聯網管理,可以實現統一的用戶注冊、人臉庫管理和權限管理等,稱為局域網聯網設備或稱企業內網型聯網。
2.互聯網云聯網
門禁設備之間如果通過互聯網進行分布式的管理,客戶端通過手機或電腦進行遠程的管理,稱為互聯網云聯網的門禁系統。
總結:人臉門禁的產品形態分為組合型產品、一體化產品,目前人臉門禁的主要產品為一體化門禁產品。一體化人臉門禁產品又通常以帶屏幕的一體化人臉門禁產品為主,未來人臉門禁攝像機類型的產品也將有很大的成長空間。人臉門禁的組網分為企業內部的局域網產品和基于互聯網的云聯網產品為主。局域網人臉門禁組網通常為企業自己組建管理服務器和統一的集中管理端進行設備的管理。基于互聯網的云聯網人臉門禁是基于在互聯網上的服務器進行互聯網聯網的設備管理,客戶端既有電腦這樣的傳統設備,又可以采用手機移動客戶端進行管理。