Amazon智慧語音助理Alexa帶動人機介面的革命。語音輸入對人們來說比鍵盤或觸控更為直覺、簡便,與其他熱門的技術一樣,語音控制也是經過多年的發展與改進,其中,微機電(MEMS)麥克風與語音處理器(Audio Processor)就是其中的關鍵零組件,大幅改善聲音訊號的品質。
|
富迪音訊科技全球行銷總監許俊民表示,麥克風與語音處理器主要的功能就是將聲音純化,不僅盡可能收錄所有的聲音,也要濾掉不需要的環境雜音。 |
MEMS麥克風可以指向性收音,同時過濾環境雜訊,在許多應用上,MEMS麥克風會搭配數位訊號處理器(Digital Signal Processor, DSP),該晶片負責類比數位訊號轉換,同時完成訊號的取樣與抑制雜訊。富迪音訊科技從降噪演算法起家,並將該技術發展成DSP,該公司全球行銷總監許俊民表示,麥克風與語音處理器主要的功能就是將聲音純化,不僅盡可能收錄所有的聲音,也要濾掉不需要的環境雜音。
智慧語音助理將語音控制變成最主要的人機介面,因此聲音純化的能力相當重要,許俊民說明,理論上,麥克風越多,收音效果越好,同時也可以透過聲源方向計算得知主要訊息來源,而將其他方向的聲音濾除。過去富迪發展降噪演算法,多應用在手機裡,並以軟體的形式實現,而在手機裡語音輸入只是輔助性的功能。
智慧喇叭特別重視語音處理,富迪也將降噪演算法發展成具備語音處理器功能的DSP。今年因應語音處理話題越加熱門,更發表結合Tensilica Hi-Fi Mini DSP核心,為低功耗恆亮待機(Always-on)應用而設計的解決方案。許俊民解釋,該公司的語音處理器能提供低功耗持續監聽語音解決方案,並與市面主流的語音觸發引擎相容。另外,針對基本詞彙語音識別,OEM廠商可自行指定觸發短語或詞彙;利用閾值選擇,在省電模式與觸發精確度中取得平衡。
而在音訊技術愈趨成熟下,富迪科技以聲學處理技術,將其語音處理器與麥克風處理器結合,打造創新的語音處理裝置(Voice Interface Device, VID)。VID最大的特性是可持續待機偵測環境噪音類別並即時響應命令,功耗小於1mA,且提高語音識別的精確度,滿足手機、汽車、筆記型電腦等應用設備標準。
因應語音控制的需求日益提升,富迪科技除了以DSP為基礎的語音處理器,近期也積極布局MEMS麥克風,希望能提供整合度與效能都更好的解決方案。許俊民指出,富迪過去的營收來源以手機、PC/NB、車用等為主,未來隨著智慧喇叭越來越熱門,預計也將成為該公司主力產品應用領域之一。