2017年Alexa掀起了語音溝通人機介面的市場熱潮,而2018 CES接續這個趨勢,展會上各式語音助理產品爭奇鬥艷,不僅是家電與機器人,甚至汽車也都搭載語音助理,反映出語音商機熱度破表的榮景。
事實上,智慧語音助理早已於2017年的CES展會上大放光彩,使提供語音助理的亞馬遜(Amazon)成為該年展會的隱形冠軍,其背後所隱藏的人工智慧(AI)與語音辨識的技術,為相關供應鏈廠商極力發展布局的戰場。而2018年網路平台業者與半導體供應商延續此風潮,智慧助理滲透到大量裝置,從資訊裝置、視聽家電、白色家電到車用電子,幾乎隨處都可以看到相關的應用,並且以追尋更加自然的直覺介面為目標,發展語音助理、生物辨識與體感辨識等能力。
語音助理戰火擴大延燒 Alexa蟬聯冠軍寶座
工研院IEK專案經理侯鈞元(圖1)表示,先發優勢與開放架構,使Amazon Alexa繼續蟬聯冠軍寶座,2018 CES約莫九成智慧裝置的語音助理採用Amazon Alexa,其餘市場比重由多至少來自於Google Assistant及Cortana,而封閉架構的Siri則完全沒有曝光,甚至也少有廠商支援Apple HomeKit的智慧裝置。
|
圖1 工研院IEK專案經理侯鈞元表示,語音助理正處持續上升之發展態勢,終端裝置數量與時俱進,成長潛力一片樂觀。 |
不過,當所有終端產品都導入語音助理,會出現甚麼狀況呢?侯鈞元談到,當所有終端載具都導入語音助理,極有可能出現多入口的亂象,也就是說,不僅是智慧音箱作為發送命令的窗口,家中的電視、冰箱等各式各樣的家電,搭配上語音助理的功能,都有可能成為人機介面的窗口,使機器之間產生衝突與矛盾。
以目前廠商搶攻Family Hub霸主地位的分類,可看出音響廠商與高通(Qualcomm)及聯發科晶片支援智慧音箱的應用;三星(Samsung)以智慧冰箱作為Family Hub,而LG和Sony等傳統家電商,則是以智慧電視作為Family Hub的應用,現階段尚難預測哪一個陣營會奪得主流寶座,成功與否還是得取決於消費者買單意願。
但顯而易見的,語音將成為主流的人機介面。侯鈞元指出,Amazon Alexa在語音助理市場取得絕對領先,關鍵在其開放性,Google與蘋果(Apple)在語音助理的布局起步雖早,但似乎錯失占地為王的先機,後續勢必加速競爭力道,可預期未來語音市場將可能面臨多元與破碎期。
平台方案陸續登場 智慧語音角力戰升溫
看好智慧語音的發展潛力,半導體大廠皆卯足全力祭出相對應的方案,準備在語音助理市場上一展長才,包括高通、三星與聯發科等三大半導體廠商,皆推出自身的參考設計平台,期能在新興領域闖出一片新天地。
高通推出智慧音訊平台促進智慧音箱與聯網音訊解決方案,提供快速商用化所需的硬體和軟體構件,其關鍵特性包括支援高回應性與高精準語音啟動的六麥克風遠場音訊和始終就緒的喚醒詞偵測,支援音質的整合式Hi-Fi音訊播放和後期處理演算法,以及高通AllPlay多房間網路音訊串流解決方案。
該平台可滿足Android Things、Google Assistant、Google Cast for Audio和其他Google服務,其協助OEM廠商更加容易打造具差異化的智慧音箱,在不同產品層級與類別中,支援Google Assistant語音互動,並縮短開發時程。
三星發展物聯網的三大核心策略,包含裝置之間的無縫接軌、單一雲端系統控管所有裝置,以及透過語音聲控所有裝置。其具體布局方針,主要是透過SmartThings應用程式將所有裝置串聯到SmartThings Cloud的物聯網平台。原有的Samsung Connect、SmartHome和SmartView都會整合進SmartThings平台,達成單一雲端的目標。此外,三星還和Open Connectivity Foundation合作,聯合其他物聯網公司,解決當前物聯網在每家公司各自為政的問題。除此之外,三星將全面升級自家的語音助理Bixby,進一步導入在不同的三星產品中。該公司甚至喊出所有聯網裝置都會是智慧型加上物聯網裝置的口號,且目標於2020年達成計畫。
值得一提的是,三星在2018年推出新款Family Hub,將提供一系列的智慧功能,包含將食物儲藏與餐點準備同步化。此外整合Bixby語音控制與三星SmartThings物聯網生態系統,讓Family Hub更為直覺與智慧。再者,使用者可以從Family Hub螢幕監控其物聯網裝置,無縫串聯數以百計的三星裝置與其他品牌所推出的相容裝置。而這也意味著上述所提及,智慧語音的窗口已不再只有音箱,包含冰箱也可成為語音控制的管道。
聯發科推出NeuroPilot平台,推動終端裝置的AI運算與應用。聯發科整合AI處理器(Artificial Intelligence Processing Unit, APU)與軟體技術,包括NeuroPilot SDK,要將AI帶入廣泛的消費性科技產品之內,從智慧型手機、智慧家庭到自動駕駛汽車等。
NeuroPilot目標為提升AI運算效率,並在多樣產品平台透過AI提升功能與品質,當然也支援主流的AI框架如Google的TensorFlow、Caffe、Amazon的MXNet,以及Sony的NNabla。
除此了平台布局之外,聯發科更攜手阿里巴巴策略合作,透過阿里巴巴人工智慧與雲端計算的能力,和聯發科晶片設計技術相輔相成,針對智慧家居控制協定、物聯網晶片定製、AI智慧裝置等領域展開合作,加速發展智慧物聯網。
平台布局可說是發展語音助理的重要策略,隨著具語音對話功能的智慧音響逐漸受到市場重視,因麥克風為聲控指令中樞的關鍵零件,使智慧音箱可望成為MEMS麥克風重要的新興應用,且為提升收音品質,含MEMS麥克風、微型揚聲器在內的音頻零組件亦扮演重要角色。
整體而言,不僅是家庭中的各式家電內建語音助理的應用,以對話導向的基礎型服務機器人亦是兵家必爭之地,為語音助理備受矚目的應用之一。以機器人外型定位來看,可分為基礎固定式音箱、增加頭部動作與簡單表情、具備自主移動功能、增加機器手臂,到完全人形機器人等類型。
效能同質性過高 機器人泡沫潮恐形成
目前來說大多數的廠商以家庭陪伴型、商廠導覽型機器人或是移動攝影機的作用最為普遍,而多數機器人的功能與語音助理差異不大,使得機器人界線模糊。再者,每家服務型機器人均以自身為平台,發布SDK給開發者使用,然而同質性過高,且欠缺國際大廠主導,使機器人產生泡沫化的狀況恐將發生。
侯鈞元分析,機器人的差異並非僅只於外表改變,如多出雙手腳,功能與體驗不僅不會成正比,反而大多數情況造成反效果。基於此,當每家公司機器人產品都同質性太高,加上機器人反應還不夠靈敏,導致使用體驗不佳的狀況,使未來恐將面臨重整期。
抵抗泡沫化寒流 開闢利基型機器人市場
侯鈞元認為,要在機器人泡沫化的險境下存活,最好的方式是投入利基型服務機器人市場,透過真實端茶、取物、送餐,甚至是打掃的特定應用,彌補目前技術上的缺口,同時為機器人市場做出差異性。
舉例來說,LG率先投入發表機器人品牌CLOi,新加入三款機器人,分別為Serving Robot送餐機器人、Porter Robot行李運送機器人與Shopping Cart Robot購物車機器人,鎖定特殊應用市場來做出差異區隔。再者,Sony推出新一代aibo寵物狗,新版aibo具備深度學習能力,將隨著與使用者長期互動產生不同「性格」,所有學習成果均放在雲端。
服務型機器人仰賴雲端人工智慧運算的缺點暴露無遺,雖然雲端基礎能降低成本,但長遠而言,邊緣運算導向的服務機器人模式,較能夠抵抗網路不穩之缺點。
離線版語音助理需求漸升
另一方面,語音助理不僅在家中應用逐漸開花結果,更是開始走入戶外,隨著自駕車行駛於道路上大顯身手。舉例來說,松下(Panasonic)就在CES的Keynote上發表與Amazon合作開發的離線版車載Alexa Onboard,讓Alexa在離線狀態下也能操作,而連線後還能接續先前的指令不中斷。
侯鈞元談到,國際上除了離線版的Alexa外,也有一些新創公司開發離線版語音助理,其除了模型需要縮減之外,最好搭配專用語音晶片方能發揮效能。整體而言,不僅是車上環境需要離線版Alexa,就連服務機器人亦有離線版語音助理的需求,才能減少因網路延遲造成的不良體驗。
相較去年2017年CES的語音助理概念才要起飛,2018年網路平台業者積極布局語音助理系統,晶片業者猛組平台、大推方案的程度方興日盛,可預見今年語音助理的重點在於「接受指令」的應用,2019年將開始轉向「指令執行」的性能前進,這場語音助理大戰,再掀高峰的發展風潮勢不可擋。