Google Amazon Alexa CEVA AR

語音操控/多維空間再進化 智慧音箱催生新音訊技術

2018-01-01
新世紀的聲音饗宴將再次起飛。2017年年初亞馬遜推出的Echo智慧音箱,在CES展上大顯身手,帶動各式各樣的智慧音箱、耳機發展,此時大多以語音啟動功能為主,接下來第二波的聲音革命鎖定空間音訊效能,打造身歷其境的體驗。
藉助新一代智慧音箱和其他語音啟動裝置的發展,使用者可以更加舒適地與裝置交談。在國外旅行時,使用語言翻譯耳機的效果如何呢?雖然這還不是很常見,但是Google剛剛發布的智慧耳機Pixel Buds已經支援這項功能。 

未來智慧音箱發展的第二波浪潮,將會以高效生產大量上市為主,本文推測這一階段將給對市場領導者帶來壓力,促使製造商進行技術創新和製造新的產品類型,同時進一步提高其他競爭者的進入門檻。正如市面上所看到的,包含Google、Amazon和蘋果(Apple)等公司發布了很多新的音訊和語音產品。 

去年推出的Google Home,也對於之前大獲成功的Amazon Echo做出了回應。現在,Google正在擴大產品線,對抗Echo Dot、Apple HomePod和AirPods。Google語音啟動助理可以用於更多的使用場景,獲得更大的價格空間。 

新的Google Home Mini形狀像一個插針包,更小並且更便宜,是Google Home的替代品。對於那些尋找更好的聲音體驗而且願意花更多錢的使用者,Google Home Max提供了更加高端的聲音體驗,同時具備Google Home的全部功能。新的Pixel Buds提供活動式(On-the-go)體驗,透過與智慧手機配對來創建一個入耳式的私人助理,並且使用藍牙音訊流,這與Apple AirPods類似。這些耳機最有趣的特點之一是整合了Google翻譯,可支援入耳式同聲傳譯功能。Google表示它可支持40種不同的語言,這個數字無疑會隨著產品演進而不斷增加(圖1)。 

圖1 從上到下依次是:AirPods和Pixel Buds,Echo Dot和Home Mini,以及HomePod和Home Max。
語音啟動技術另一個激動人心的發展是新的GoPro Hero6運動相機可以透過語音命令開機。這是GoPro第二代支持語音介面的裝置,最早推出的是GoPro Hero5。 

大多數的語音命令和之前一樣,比如「GoPro啟動/停止錄音」等等。 

新機型的創新點體現在使用者可以使用語音命令——「GoPro開機」打開相機。這個功能可以透過設定進行選擇,在相機關機後的8個小時內維持有效。儘管這還不是一台完全隨時傾聽(Always-listening)的裝置,但它朝這個方向邁出了重要的一步。可以語音啟動的GoPro還證實了本文的另一個設想,語音將會成為主要的使用者介面。在人機交互過程中,聲音總是最自然和最直觀的途徑,不久之後所有裝置都將會支援隨時傾聽,等待著我們發出命令。 

汽車/穿戴成顯學  接班Alexa應用 

Amazon正在使這一願景成為現實,目前仍在智慧音箱市場上領先「新人」(Google)一步。在Google發布會之前,Amazon搶先發布了一系列新的Echo產品,包括採用了新外觀設計的一系列Echo產品和智慧鬧鐘Echo Spot,延續了Echo Show開始的整合螢幕的風格。Amazon還透露,Alexa很快就會整合到BMW 2018車型中。 

這可能是Alexa在成為最受歡迎的家庭智慧音箱之後,再一次率先成為最受喜愛的公路旅行伴侶。 

比任何官方消息都更有趣的是關於即將推出的Amazon眼鏡產品的推測。肆意蔓延的傳聞指出該產品是基於Alexa的非手持、電池供電的眼鏡。根據猜測,Amazon眼鏡不會提供視覺體驗,而是作為一種可穿戴裝置,將允許使用者隨時隨地和Alexa交談。這將是Amazon進軍可穿戴裝置領域和支援Always-on功能向前邁出的重要一步。 

很明顯,為了釋放語音助手的全部潛能,必須去除電源插孔,這方面有相關技術可以實現。 

增添VR/AR臨場感  空間音訊入駐智慧裝置 

Amazon和Google進軍這個市場將直接導致耳戴式裝置全面改善。針對這種產品已經提出了很多有趣的概念,比如Kickstarter專案中名叫Vi的人工智慧私人教練,可以掌握使用者的生物識別特徵並由此客製化訓練,從而實現運動目標。現在想像一下,透過添加多維空間音訊製造出Vi就在你身前或身後的感覺,可以提供額外的動力幫助你打破個人記錄。 

Apple全新款iPhone中提出了最新的音訊創新理念。iPhone 8第一次包含了雙揚聲器。這是一個重大進步,因為雙揚聲器可以提供多維空間音訊,這意味著Apple正在押寶到擴增實境和虛擬實境(AR/VR)應用上。要創建沉浸式的AR/VR體驗,空間音訊是必須的。否則即使有令人驚歎的畫面,也不會產生足夠有說服力的真實空間。 

神經網路催化聲音感知技術成形 

音訊發展的下一步是什麼?iPhone 8和iPhone X已經包含一個專門的神經網路引擎。針對耳戴式裝置和語音啟動裝置,神經網路可用於聲音感知和音訊分析。這一技術已經用來在家中識別某些特定的聲音,比如門鈴或者玻璃破碎,從而觸發適當的回應。對於耳戴式裝置,這可以改善使用時的安全性,比如Vi私人教練和其他沉浸式AR/VR應用程式。神經網路可以感知到某些重要的聲音,並且通知使用者,如警報器或者狗叫。透過這種方式,無論安全性還是享受感都可以兼顧,從而獲得終極使用者體驗。 

(本文作者為CEVA戰略行銷總監) 

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!