AI 語音辨識 智慧音箱 Amazon Siri Google Assistant

迎接人機介面新商機 掌握全球AI語音助理下一步

2019-01-15
2015年迄今智慧音箱市場持續成長,並未見消褪。2015~2018這三年來全球產業與消費大眾對於智慧音箱與人工智慧(AI)語音助理的看法也十分兩極化:一邊是非常不看好,另一邊視為新藍海市場。2018年是智慧音箱與AI助理發展關鍵年,撐過三年考驗之外,大廠們前仆後繼地投入,也點燃全球產業與消費大眾對具有智慧音箱與AI語音助理的興趣。AI語音助理發展正在全球如火如荼蔓延開來,全面襲擊所有的軟體服務與硬體產品。本文歸納全球AI語音未來發展方向,分析並預測市場現況趨勢、應用布局、產業鏈(歐美、中國、台灣)、生態系、人機介面等五大面向,以提供給台灣業者參考。

2015年迄今智慧音箱市場持續成長,並未見消褪。2015~2018這三年來全球產業與消費大眾對於智慧音箱與人工智慧(AI)語音助理的看法也十分兩極化:一邊是非常不看好,另一邊視為新藍海市場。2018年是智慧音箱與AI助理發展關鍵年,撐過三年考驗之外,大廠們前仆後繼地投入,也點燃全球產業與消費大眾對具有智慧音箱與AI語音助理的興趣。AI語音助理發展正在全球如火如荼蔓延開來,全面襲擊所有的軟體服務與硬體產品。本文歸納全球AI語音未來發展方向,分析並預測市場現況趨勢、應用布局、產業鏈(歐美、中國、台灣)、生態系、人機介面等五大面向,以提供給台灣業者參考。

AI語音滲透各種智慧裝置

看待AI語音的市場,應從硬體產品、軟體服務、系統平台三個方面切入。在硬體方面,根據Canalys統計,2016年全球智慧音箱出貨量約700萬台,2017年約3,000萬台,估計2018年全球AI智慧音箱出貨量,可望達到5,500萬台。但更值得觀察的是硬體背後的軟體服務市場。大多數的智慧音箱產品一上市,也促使AI語音APP服務翻倍成長,舉如Amazon Echo Voice App這三年來的跳躍式成長,如2018年將較於2017年同期比較成長266%,如圖1所示。可以想見的是,智慧音箱上市也推動APP軟體應用服務的擴張,同步讓更多APP應用服務開發商投入,同時因為使用者的回饋,也加速了APP軟體服務的多元化產出。

圖1 Amazon Alexa應用服務市場成長趨勢圖(2015~2018)
資料來源:工研院IEK Consulting(12/2018)

另外,AI語音系統與平台才是智慧音箱的靈魂,目前Google Assistant被安裝的裝置占比最高,此乃因大多數新創開發智慧音箱產品會採用Google Assistant平台,加上Google擁有多國語言轉譯技術,預估未來Google Assistant應用市場將後來居上。

根據CTA、Gartner等研究機構皆預測2019年智慧音箱市場銷售量將達到最高峰,AI語音將轉而滲透到筆電、電視、家電、汽車、機器人、智慧看板、穿戴、行動終端等其他智慧裝置之中。

走出個人/家庭服務 AI語音朝B2B2C應用發展

各家人工智慧語音助理擅長不同功能與服務,Google Assistant擅長語音搜尋、Apple Siri精於影音串流、Amazon Alexa與阿里巴巴天貓精靈則是購物通路整合及到府專送服務,Microsoft Cortana能在作業系統與工作商務給予協助、小米小愛同學則在互動問答與智慧家庭自動化上吸引消費大眾的注目。各大廠所推出的AI語音助理也展開合作互補,透過API串接以使用對方的人工智慧語音技術特點,提供更完整的AI語音服務,此將成為趨勢,如Microsoft和Amazon讓彼此可以互相呼喚,將支援Win 10、Android及iOS裝置。小米的小愛同學也和騰訊叮噹、微軟小冰整合,可以在小愛同學傳喚騰訊叮噹與微軟小冰兩個AI機器人(圖2)。

圖2 人工智慧語音應用服務布局範疇
資料來源:工研院IEK Consulting(12/2018)

雖然各家AI語音助理的專長不同,但歸納目前人工智慧語音助理的主要四大功能如下:

・互動

主要是聊天問答,這是最難的部分。主要涉及到的相關技術包括自然語言處理、語意分析引擎、多輪對話、情境感知、情感辨識、聲紋辨識、個性化等,要達到自然流暢栩栩如生的境界,仍有技術挑戰。

・服務

目前多由各種語音服務APP來提供食、衣、住、行、育、樂等各種生活資訊或連結各種服務,如天氣播報、新聞訊息、知識百科、食物外送、叫車、購物、居家打掃、人力支援等等,是目前AI語音成長最為快速的部分。

・控制

透過人工智慧語音助理來控制智慧電視、掃地機器人、空調系統、照明設備、智慧穿戴、智慧開鎖、智慧監控攝影機等,而目前透過語音控制各種裝置,多半都是語音命令句,但如要透過與使用者對話進而掌握使用者的需求與情境,達到整個自動化控制,首先必須讓所有裝置之間能互通互聯。

・內容

人工智慧助理可隨著使用者心情或需求,來播放數位串流影音,並且將有聲書內容運用各種不同的語音語言來表達,增加數位語音內容的豐富度。

觀察人工智慧語音應用服務一開始是2012年Apple Siri、Google Assistant運用在智慧手機,使用者透過智慧手機可以進行線上查詢、行事曆安排、呼叫通訊錄、打電話、打開各種APP服務等,接著運用在智慧車載的語音導航、語音電話、語音搜尋附近美食或景點等,2013年智慧穿戴的出現如Google智慧眼鏡、VR裝置等,因為觸控面板在頭戴或眼戴上運用極為不便,促使語音互動介面成了智慧穿戴的最佳選擇,2015年迄今智慧音箱及居家機器人陸續上市,多半都是互動問答、聊天陪伴、家電自動化等功能。

預估2019年AI語音助理將走出個人與家庭應用,大幅邁進B2B2C三大應用服務:

・健康照護服務

提供從家庭生活到醫院診所的健康照護管理與諮詢的AI語音服務,一方面是為了讓使用者得到更完善的健康照護,另外一方面則是為了解決目前醫院診所人力短缺問題,並減輕醫生與看謢人員的壓力。

・商用與公共場域

AI語音將導入智慧零售相關之無人商店、智慧販賣機/貨架、自動結帳機等,並取代金融服務、交通運輸之客服,以及這些場域中會運用到的3D感測、自走車、服務型機器人等。

・智慧車載系統

語音控制早已進入車載系統當中,但此波人工智慧技術也將提升AI語音功能,加上全球自動駕駛發展推進,更顯得AI語音在智慧車載的重要性,此將加速AI語音與智慧車載系統的整合。

可以預見未來AI語音助理技術因為應用範圍擴大,人工智慧在與人類多元且大量的互動之下,將促使AI語音助理技術更為成熟。

中文與英文體系已成形 台灣機會在Edge AI

歐美:平台大廠主導智慧語音生態系,AI軟體新創活躍

目前來看智慧音箱的語音互動仍以英文為主流。歐美國家雖然以AI語音助理平台大廠如Apple、Google、Microsoft、Amazon為主,但是許多新創也投入AI語音領域,如自然語言處理、機器學習、語意搜尋、多輪對話分析、機器人、虛擬分身、聲紋辨識、行動與個人助理、虛擬代理人、個人諮詢顧問、員工助理等(圖3)。

圖3 歐美-AI語音平台型生態系
資料來源:IDC;工研院IEK Consulting(7/2018)

中國:以AI中文技術為核心,大數據訓練AI語音進化

最值得注意的是中國大陸AI語音產業鏈主要分為基礎層、核心技術層與應用層,相較於2017年前有些許變化,一是重視本土AI晶片研發,扶植相關新創崛起,二是電信廠商也加入促使語音通訊的發展。整體來說,中國大陸產業發展以AI中文技術為核心的技術型生態系,雖然面對AI英文的神速進展,但因為中國大陸長期累積AI語音技術,以百度、科大訊飛為龍頭,百度Deep Speech技術曾被麻省理工學院MIT列為全球十大突破性技術之一。而受到中國大陸市場歡迎的小愛同學,因為大量的使用者語音回饋的大數據,也正持續訓練AI語音快速進化。可以借鏡的是,微軟進軍中國布局已久,融入在地語言與社會文化,創造AI助理在地化形象,已進入當地消費者的日常生活,如微軟小冰、微軟小娜等機器人(圖4)。

圖4 中國大陸-人工智慧語音技術與產業鏈
資料來源:易觀;工研院IEK Consulting(7/2018)

台灣:AI硬體有優勢,已切入國際大廠平台生態系

台灣已成為AI智慧音箱硬體組裝代工重鎮,獨缺AI相關平台與軟體,導致產業鏈斷鏈,也無法創造有感服務(圖5)。台灣廠商若想要切入AI語音市場,建議有兩個方向:

圖5 台灣-人工智慧語音技術與產業鏈
資料來源:工研院IEK Consulting(7/2018)

1. 對外的國際市場

以彈性化製造組裝AI語音助理新裝置,打入國際大廠AI平台生態系,除了智慧音箱之外,其他如AR/VR、智慧眼鏡等頭戴式、智慧販賣機、服務型機器人等都是AI語音技術可以導入的應用裝置。

2. 對內的台灣市場

台灣廠商若想要發展本土中文語音應用市場,建議整合台灣硬體優勢,創造在地化AI中文語音服務,以提供台灣消費大眾與企業客戶也能使用到AI語音的新使用者體驗,並提升產業創新應用的面向。

無論在對內對外市場中,建議有意切入AI語音產業或市場的半導體晶片、關鍵零組件、終端製造等台灣高科技業者,可以Edge AI角度挖掘共通性AI語音關鍵功能或技術,以發展有市場利基的AI語音產品或技術。

技術與應用同步擴充 共創AI語音新藍海應用市場

Amazon Echo模式帶動全球仿效,其背後AI語音平台才是驅動整個生態系的主力。目前投入AI語音的領導大廠不論是Amazon Alexa、Google Assistant、Line Clova、阿里巴巴天貓精靈、小米小愛同學等,都試圖追求AI技術平台與應用服務能達到同步擴充,歸納有三大面向:

1. 以人工智慧技術為核心

AI語音技術須具備深度學習演算法、提供各種機器學習框架與深度學習機制,以便於第三方開發者依據應用情境來進行客製化,並推出軟體服務或硬體產品。此發展重點在於必須先架構並累積大數據分析應用基礎,也要考量雲端即時性存取的時效性、速度與成本。

2. 以開放人工智慧API為策略

開放式人工智慧API已成為共通性策略,便於第三方開發,讓合作夥伴快速加入同一陣營,一起擴展AI語音應用服務。這部分的關鍵在於要能從中設計出AI語音服務的定價或分潤機制,達到與第三方或合作夥伴能共享獲利的目的。

3. 以擴展人工智慧語音生態系為目標

人工智慧技術的導入及語音技術的日漸成熟,將促使各種語音互動的IoT裝置製造商與服務提供商被納入各大廠的AI智慧語音生態體系,共同開拓目前仍處於藍海的AI語音應用市場。以Amazon Alexa為例,已能運用語音執行5萬個以上的功能,將3,500個以上的品牌納入合作夥伴,能與2萬種設備相通相容。

兩大方向持續發展 AI語音施展空間依舊大

然而,即使開放人工智慧API來降低語音技術應用的障礙,但是回到人工智慧和語音技術層次上,人工智慧語音技術仍在發展當中,還有很大的空間可以施展,分為兩大部分來說明,如圖6所示。

1. AI語音互動技術:NLP發展空間仍大

語音辨識技術已經發展幾十年,目前語音平均辨識準確率已達98%,但技術挑戰在於遠場、抗噪、多人、聲紋等層面,也許可以運用人工智慧晶片、零組件或雲端運算來跨越這些障礙;而在自然語言處理(NLP)技術部分,由於涉及到在地語言、生活文化、各種新世代用語、社會流行趨勢等,發展空間仍大,主要技術挑戰則集中在語意理解、文句整合、多輪對話等。

2. AI語音技術解決方案層次:工具→解決方案→平台

AI語音助理技術仍進化中,技術解決方案層次分為四類:(1)具有輔助功能的AI語音軟體工具;(2)將AI語音助理導入資料管理分析的解決方案;(3)以AI語音應用導向進行大數據分析並能整合軟硬體,進行各種自動化流程;(4)AI對話平台,其整合語言、視覺、生物辨識、行為模式分析等,採監督式或非監督式機器學習技術,皆能由人工智慧自行定義軟硬體整合之AIoT架構(圖6)。

圖6 人工智慧語音助理技術現況與方向
資料來源:工研院IEK Consulting(12/2018)

整合智慧感知 語音帶動消費性電子人機革命

2017年智慧音箱大爆發,在全球消費性電子歷程上寫下了一個創新里程碑,很少看到一個新興的消費性電子產品,可以在短短兩年內,從2015年快速起飛期進入2017年的爆發成長期,並帶動全球大廠小廠起而仿效。智慧音箱的異軍突起,最大的革新在於語音互動介面,除了意味物聯網與人工智慧,兩者加乘下所帶動科技產品革命之外,更代表AI語音所帶來的全球消費性電子的人機介面革命(圖7)。

圖7 AI語音人機介面技術之發展方向
資料來源:工研院IEK Consulting(7/2018)

然而,聲控UI早於2011年底Apple發表iPhone 4S Siri語音助理問世,2012年隨著Apple Siri全球陸續上市,也讓全球產業從AI語音互動服務推出相關應用產品,除運用在智慧手機上,也將AI語音技術運用在各種消費性電子產品上,如透過Apple Siri手機控制小家電,如掃地機器人、居家照明、智慧冰箱等,此掀起當年Samsung、LG、Panasonic、SONY、Hair等家電大廠,紛紛將語音互動介面導入智慧電視等家電產品中,期望以語音互動方式進入消費者日常生活,更促使語音互動技術受到全球產業的注目,各種業者已開始思索如何將語音互動導入不同的終端設備上。根據觀察2012~2013年各大廠的共通目標是朝向自然語言互動,但由於當時大廠們對於消費大眾使用語音互動的情境與行為尚未能所有掌握,語音技術也尚未成熟,因此AI語音的導入,並未讓某個智慧新興終端成功拿下市場,但卻進一步啟發2014年Amazon Echo智慧音箱的誕生。

現在全球產業也在觀望衡量AI語音是否如2011~2013年的曇花一現,其實重點在於要能發展出令廣大消費者接受的AI語音互動介面,分析其發展關鍵有二,一是在於語音介面互動設計架構與邏輯,此有別於目前消費大眾所習慣的視覺人機介面,但並非所有消費者能完全接受單純只以語音互動的方式;二是為了進一步取得使用者的黏著度,必須掌握消費者在進行AI語音互動的需求與障礙。因此,基於這兩個關鍵點,語音介面設計需要整合其他感知功能,以獲得更多使用者數據。可以預估未來2~3年內AI語音將整合各種非接觸式互動方式(如體感、手勢、腦波、觸覺、姿勢、臉部表情等),並整合各種智慧新興終端如AR/VR/MR、360度環景、健身穿戴與智慧衣等。

(本文作者為工研院產科國際所產業分析師)

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!