Yole Développement預測,在這個偏好以語音作為使用者介面的年代,微機電系統(MEMS)麥克風(Microphone)從2013至2019年的出貨量將成長為三倍(從24億組成長到66億組)。
但是,隨著MEMS麥克風的需求不斷增加,遠場語音偵測應用的需求條件也持續攀升,包括日益普遍的波束成形(Beamforming)應用等。
MEMS麥克風設計 規格首重訊噪比
在MEMS麥克風的設計中,最重要的規格就是訊噪比(SNR)。訊噪比對於麥克風的遠場和語音偵測應用,其重要性經常受到誤解,以為這項規格能反映麥克風在吵雜環境下運作的能力。
然而,麥克風的訊噪比僅能測量訊號與內部雜訊(Noise)來源的比值,因此其實更適合作為評定麥克風在安靜空間內(如客廳或臥室)表現的指標。
訊噪比是一項好用的指標,標示麥克風在安靜環境下可偵測出的最低音量,單位為dB,與之比較的參考訊號為94dBSPL(選擇此值是因為其等同於1帕(Pa)的壓力變化,與音訊使用狀況沒有關聯)。就目前常見的高效能麥克風來說,訊噪比範圍多半介於64dB至68dB。
64dB訊噪比的麥克風無法從內部雜訊中分離出低於30dBSPL(94dBSPL-64dB)的聲音。實務上,即使最好的語音偵測演算法,也須要取得訊號的資訊元件,才能從雜訊基準提高幾個dB,而實際需求則取決於套用在訊號上的演算法及處理方式。
假設語音偵測演算法要求麥克風的雜訊基準與輸入訊號位準,必須保持10dB的差距,那麼一個64dB訊噪比的麥克風將能夠偵測到最低40dBPSL的聲音。這等同於相距5∼6公尺(m)的一般對話音量(咖啡廳內對話的音量),或相距2∼3公尺的輕聲對話(辦公室內對話的音量)。
就使用者而言,這意味著能夠在房間內任何位置與裝置流暢互動,而不用面對裝置或提高音量。一個理想的麥克風訊噪比若提高6dB,其語音偵測距離可拉長一倍,或只需要一半的音量(表1)。
|
表1 不同聲音的聲壓與密度概觀 |
在吵雜環境下,麥克風最重要的參數就是聲學過載點(AOP),簡單來說,此參數決定麥克風能夠偵測出的最高訊號位準,且不會「太過」失真,所謂「太過」是指10%的總諧波失真(THD)。
考量總諧波失真 決定聲學過載點
MEMS技術最近的發展,將麥克風的聲學過載點從120dBSPL不斷提升至130dBSPL,甚至更高,放到情境中的話,一支2012年的智慧型手機在錄下現場演唱會時,不太可能不破音,但現在的高階麥克風在搖滾演唱會的第一排,則能夠錄下高音質的聲音。
高位準的訊號可能伴隨著預期外的雜訊來源,尤其在戶外使用時,風聲是麥克風最常碰到的大問題。不同的風速與風向搭配麥克風的方向,風聲可能會超過120dBSPL。風聲包含明顯的低頻基音以及低位準的高頻音,在套用語音處理演算法或撥打高清晰度(HD)語音電話之前,這些音通常會先過濾掉,但過濾的條件是,其輸入訊號必須未達聲學過載點位準,一旦訊號的諧波失真過高,便無法進行過濾。
提高聲學過載點位準,表示在戶外有強風或吵雜的環境下,使用者的麥克風仍能偵測並錄下訊號,雖然也可能錄下許多背景噪音,但不會破音。換句話說,麥克風仍能夠套用語音偵測演算法,或者在高清晰度語音電話時進行過濾以改善能聽度,抑或是讓演唱會中錄下的歌曲依舊悅耳。重點是,雖然仍有一些背景噪音,但訊號的後製及復原變得容易許多,只要聲音沒有過多的諧波失真和破音即可。
提高動態範圍 擴大收音成效
訊噪比是一項麥克風在安靜環境下的效能指標,而聲學過載點則用來表示吵雜環境下的效能指標,綜合這兩項參數的則是麥克風的動態範圍(Dynamic Range, DR),表示麥克風可感應的聲壓位準範圍。麥克風可設計成對低音量敏感,或設計成可耐受高聲壓位準,但若要設計出兼顧這兩種情況的產品,就變得非常困難。
現代的MEMS麥克風測到的動態範圍接近100dB,不只可在交響樂團演奏會中錄下如雷震耳的鼓聲和管樂器,也能同時收錄進聽眾的細語聲。
麥克風的動態範圍不一定會詳列在產品資料表內,但可輕易地從其他規格來判斷。如為數位麥克風,只要在訊噪比加入靈敏度參數就能得到此規格。如為類比麥克風,則必須先找出聲學過載點與94dBSPL參考位準之間的差距,再將此數值加入訊噪比。
雙背板設計加持 MEMS麥克風看俏
MEMS麥克風通常包含軟性帶電薄膜和硬式電壓感測背板,薄膜和背板組成電容器,其數值會隨薄膜在空氣中的震動而變化。電容的變化會轉換成電壓變化,然後由類比麥克風特定應用積體電路(ASIC)加以放大並直接輸出,或透過數位麥克風ASIC內的類比數位轉換器(ADC),轉換成數位輸出訊號。此運作方式類似立體聲電容式麥克風,只是規模小了許多。
|
圖1 雙背板MEMS設計可保持高聲學過載點 |
英飛凌(Infineon)的雙背板(Dual Back-Plate)技術是MEMS結構的專屬作法,使用兩塊背板,薄膜兩面各一塊(圖1)。此方法可測量全差動訊號(圖2),加強訊號的回應與品質,提高訊噪比與聲學過載點位準,同時改善低於麥克風聲學過載點的總諧波失真,可保持在1%以下,盡可能地貼近最高甚至超過130dBSPL的聲學過載點位準,帶來出色的聽覺體驗(圖3)。
|
圖2 雙背板MEMS差動訊號輸出 |
由於語音互動不斷增加,成為人們偏好的裝置使用者介面,因此MEMS麥克風的後勢相當看好,未來將出現完美兼顧效能與使用性的創新產品。
|
圖3 雙背板MEMS與其他產品在總諧波失真及SPL(Sound Pressure Level)的效能比較 |
(本文作者任職於英飛凌)