在人工智慧(AI)關鍵技術加持下,影像辨識技術逐漸成熟,創新應用也不斷被發掘。未來,影像辨識除了持續拓展工業、醫療領域的應用,更有望在人臉辨識的引領下,打進民生應用市場。
近幾年,人工智慧(AI)成為科技產業熱門的話題,而深度學習與機器視覺演算法等關鍵技術,也促使影像辨識技術越趨成熟。Amazon、Google及Apple等大廠皆嗅到影像辨識的龐大商機,紛紛展開布局。目前,影像辨識已可實現人臉辨識、入侵者偵測、車牌辨識及排隊管理等功能,而隨著相關資源的投入與技術的演進,未來也將發展出更多創新的應用。
影像辨識技術環節
影像辨識技術環節可分為感測(Sensing)、影像處理(Image Processing)、影像分析(Image Analysis)以及應用(Application)四個部分;在零組件方面則包括攝影機(Camera)、感測器(Sensor)以及處理器(Processor)等。而隨著影像辨識技術逐漸成熟,加上創新應用的發展,預估2018年影像感測器(CIS)的需求將達到45億至50億顆。
工研院產經中心(IEK)分析師羅宗惠說明,感測器是否具備足夠的功能與效能,如動態範圍(Dynamic Range)、自動對焦速度(Autofocus Speed)等,都將直接影響原始影像數據的品質。而擁有足夠品質的影像數據,才能透過人工智慧、演算法與軟體更進一步地進行影像處理與分析。
談到影像分析,羅宗惠表示,影像分析的價值在於其解決問題的能力,以及垂直應用的發展。工研院將2015~2017年之CPC專利家族(Patent Family)中42,047筆關於影像分析的資料進行統計,結果顯示影像分析技術主要用以解決圖像檢查、圖像分割、動態分析等問題(圖1);其應用領域則以生物醫學、車載應用、行動裝置以及工業領域為主。
羅宗惠說,談到圖像檢查許多人可能會想到人臉辨識,但事實上除了人臉辨識外,圖像檢查也包括醫學上的缺陷檢查,以及工廠中的不良品判斷。例如,恩益禧(NEC)2017年推出的工業解決方案「AI Visual Inspection」,即結合圖像檢查與機器學習技術,建立一套辨識良品與不良品的判斷模式,改善傳統以人眼判斷不良品的做法(圖2)。
三大3D影像感測技術齊頭並進
Apple iPhone X搭載3D影像感測,使該技術備受矚目,也帶動影像感測技術快速拓展出眾多創新應用。工研院產經中心分析師謝孟玹指出,3D影像感測技術可分為三種,包括雙鏡頭(Stereo Camera)、結構光(Structured Light)以及飛時測距(Time of Flight, ToF)。這三者各有優勢,如iPhone X所選用的結構光技術,能達到最精確的偵測,除了可發展人臉辨識、行動支付這類近距離且講求高準確性的應用,亦可用於工業4.0,支援逆向工程的工件模擬。
不過,結構光的缺點為無法在亮度高的環境中進行偵測,而雙鏡頭正好能補足此缺點。雙鏡頭設計原理為模擬人類雙眼,透過物件反射周圍自然光及兩眼的視差判定與物體間的距離。其在明亮環境中表現佳,且相當省電,適合在戶外長期運作,目前已有許多無人機搭載雙鏡頭。但其缺點是需要高運算量、延遲性高且無法支援長距離的偵測。
在遠距離感測可使用ToF技術,ToF主要原理為投射雷射或LED光源於待測物件,感測器會透過計算光反射的時間進行測距。其技術優勢是掃描速度快、低照度效果佳,缺點是精細度與分辨率較低。而ToF技術可運用在工廠中,以實現快速移動的協作機器人;或運用在物流業中,協助業者進行包裹盤點、尺寸測量等工作。
綜合上述,謝孟玹認為,這三種技術將齊頭並進,並發展出人臉辨識以外的應用,例如,3D掃描齒模建模、AR/3D內視鏡手術、醫療眼控輔助以及電子後視鏡立體視覺監測。
影像辨識進攻民生領域
iPhone X使3D感測技術與人臉辨識功能成為熱門的話題,而謝孟玹認為,iPhone X支付解鎖只是一個起點,未來還可能結合表情捕捉、眼球追蹤、情緒辨識以及圖像/機器學習演算法,打造出進化版的貼身情感助理。隨著技術的演進,未來人臉辨識將全面進入食衣住行育樂等民生領域。
日前Facebook、Amazon、Google、Microsoft及百度等大廠,相繼購併/結盟人臉辨識、AI公司,並開始布局相關專利技術。人臉辨識的應用範圍相當廣泛,除了可以用來進行失蹤兒童協尋、共享車服務的身分確認,也可以藉之進一步蒐集用戶習慣、行為以及情緒數據,應用於自閉症兒童治療、個人化廣告投放及精準行銷。
謝孟玹表示,過去影像辨識應用多偏重工業領域,但隨著感測與AI技術的發展、創新,未來影像感測可望快速轉進民生應用領域,形成另一股市場驅動力。