耳機 聲音處理 ANC ENC CEVA 降噪

AI音訊技術系列(1)

ENC環境降噪強化音訊品質

2023-11-16
無線耳塞式耳機和頭戴式耳機等免持裝置逐漸普及,使用者對於高品質音訊的需求也日益增加,聲音處理方法已成為日常生活中的重要面向。語音辨識技術的進步,則讓我們對於聲音處理技術的要求更高。
Pixabay

在現今步調快速的世界中,清楚且有效的溝通比以往更加重要。隨著手機、視訊會議和其他通訊系統的廣泛使用,無線耳塞式耳機和頭戴式耳機等免持裝置的普及,以及對高品質音訊的需求日益增加,聲音處理方法已成為日常生活中的重要面向。語音辨識技術的進步,則讓我們對於聲音處理技術的要求更高。

本文分為三部分刊登,第一部分將重點探討環境降噪(ENC)日益成長的重要性,將討論:主動與被動降低噪音、單聲道或多聲道系統、近端/遠端使用者,最後則說明ANC與ENC之間的差異。

日常生活離不開ENC

隨著現代生活的興起,以及音訊裝置的普及,在吵雜環境中要聽清楚通話內容變得越來越困難。這就是環境降噪(Environmental Noise Cancellation, ENC)能夠發揮作用的地方。ENC是音訊系統中使用的聲音處理技術,可減少或消除周圍環境不必要的聲音,讓聽者更能聽到預期的音訊訊號。

近年來,音訊系統對ENC的需求因多種原因而提高。首先,環境變得越來越吵雜。交通、建築、風和擁擠的公共空間都會影響整體噪音量,讓我們更難清楚地聽到聲音。此外,智慧型手機、筆記型電腦和耳機等音訊裝置的普及,代表人們將在更多樣化的環境中收聽音訊。在許多情況下,背景噪音可能會比音訊訊號本身大聲,因此很難聽到音訊裝置傳出的內容。

高品質音訊的需求增加是另一個需要ENC的因素。隨著高品質串流服務的興起,以及高階音訊設備的普及,人們對於音訊品質的期望也更高。然而,這也代表背景噪音將會更為明顯,並可能干擾整體聆聽體驗。

最後,COVID-19疫情迫使許多人必須在家工作並仰賴線上會議,這樣的工作型態可能會因家中設備、家人、寵物或甚至戶外聲音的背景噪音而大受干擾。這讓ENC成為遠端工作和線上會議的重要工具,即使在吵雜的環境中,也能夠清楚溝通。

ENC基礎概念介紹

主動還是被動?

傳統上,主動和被動環境降噪的差別是兩者所使用的方法。主動環境降噪(ANC)會產生「反向的噪音訊號」,用破壞性的干擾來抵銷原始噪音;被動方法指的則是實體設計和配置,目的是為了避免噪音觸及感測器。近期,環境降噪方面研發出了更先進的技術,運用主動方法來處理接收到的訊號,在降低噪音的同時不會主動產生「抗噪」訊號,這些技術被歸類為ENC。稍後將詳細說明ANC和ENC之間的差異。

單/多聲道

感測器數量是聲音處理的重要因素。單聲道系統僅使用一個感測器來接收聲音,像是麥克風;多聲道系統則通常會使用兩個以上的感測器。

在單聲道語音增強中,會假設所有必要資訊都包含在單聲道輸入中,其目標是移除背景噪音和/或提高語音訊號的音量。透過使用傳統的聲音處理演算法和先進的神經網路架構,在分離語音和雜訊,以及在降低噪音的同時增強語音的方面,已取得顯著進展。

多聲道系統使用多個音訊頻道來處理聲音,假設每個聲道都包含不同的資訊,組合這些資訊可以增強語音訊號。舉例來說,可以放置兩個麥克風,其中一個麥克風記錄使用者的語音,另一個麥克風則記錄其他所有被視為背景噪音的聲音。有了多個感測器,就能判斷訊號源的方向,並更精確地聚焦於訊號源上。

多聲道系統通常比單聲道系統更有效,因為這種系統可以使用空間資訊來將語音訊號與背景噪音隔開。這可以使語音訊號的呈現更加精確,進而提升語音辨識能力並改善整體的語音品質。然而,雖然多聲道的語音增強一般而言較為有效,但也需要更強大的處理能力,且通常比單聲道系統更為複雜。這可能會導致延遲性和耗電量增加,進而更快耗盡裝置的電池電量(圖1)。

圖1 單聲道/多聲道示意圖

為此,廠商借助先進技術尋求解方,例如CEVA便致力於運用深度學習技術提升單聲道的語音處理效能,目標是在低功耗裝置實現最高的降噪效能。透過CEVA-ClearVox ENC,可將高階ENC功能帶進小巧、節能且具成本效益的裝置上。

近端/遠端

近端處理是指用戶端在環境降噪的過程中,身處具有噪音的環境中。另一方面,遠端處理則用於希望降低環境噪音,但本身並未處於吵雜環境中的用戶端,例如通話另一端的使用者。

進行近端處理時,可以利用噪音的存在,使用不同的感測器從空間感測噪音,接著使用主動降噪方法在傳入的訊號中減少噪音。然而,這種方法對於聲音延遲較為敏感,可能無法有效對抗各種噪音;在遠端處理中,降低傳輸訊號中的當地雜訊時(例如,在咖啡店接聽工作電話時),ENC可以使用較能承受延遲的不同處理方法(圖2)。

圖2 近端/遠端示意圖

ANC/ENC比較

我們已經釐清一些基本概念,現在可以來進一步瞭解ANC和ENC之間的差異。

ANC是一種主動方法,常用於近端使用者上。ANC使用感測器來擷取使用者周圍的噪音,接著將其反轉,再利用產生器來進行廣播。這種方式能夠對外部聲音產生破壞性干擾,進而消除從耳機注入的訊號中所產生的噪音。ANC通常用於使用者想要聽音樂並阻隔外部噪音的情況。

ENC則會對近端麥克風所擷取的訊號執行聲音處理,如此一來,遠端使用者不會從近端方接收到任何背景噪音。在這種情況下,會對訊號本身執行降噪,再將處理過的訊號傳輸到另一端。

簡而言之,環境降噪(ENC)已經成為日常生活中不可或缺的一環,在越來越依賴音訊通訊系統的世界裡,協助實現清晰且有效的溝通。環境所引起的音訊訊號,根據使用案例和使用的系統,有多種方法可以減少其中不必要的背景噪音。

本文的第二部分將深入探討其中的挑戰、近期的發展,以及ENC中使用的各種技術與技巧,並著重於深度學習,將探索如何運用深度學習方法來改善語音增強系統的準確性和有效性,以及這將如何為使用者提供更好的通訊體驗。

(本文作者任職於CEVA)

AI音訊技術系列(1) ENC環境降噪強化音訊品質

AI音訊技術系列(2) 靜態/非靜態降噪處理有方

AI音訊技術系列(3) 深度學習降噪處理開啟音訊新紀元

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!