DSP結合3D音效軟體展現效能 3D音效逼近高傳真原音

2007-03-16
3D強化音效技術能夠提升音質效果,營造出身歷其境般的模擬環繞立體聲享受。為營造出逼真且有空間感的音場環境,3D音效軟體的研發人員融合心理聲學以及數位訊號處理器技術,發明出許多效果。其與立體聲不同的是,全3D定位音效強化技術是採用相當精密的HTRF與其他聆聽模式,且須要運用即時數位訊號處理器演算法。
3D強化音效技術能夠提升音質效果,營造出身歷其境般的模擬環繞立體聲享受。為營造出逼真且有空間感的音場環境,3D音效軟體的研發人員融合心理聲學以及數位訊號處理器技術,發明出許多效果。其與立體聲不同的是,全3D定位音效強化技術是採用相當精密的HTRF與其他聆聽模式,且須要運用即時數位訊號處理器演算法。  

人體與腦部之間複雜的互動,讓人類能研判聲源的方向與距離,傳統的環繞立體聲錄製與產生技術,缺乏大多數必要的聽覺訊息,以致無法判斷聲音的位置,導致音效的傳真度大幅降低。有些系統透過多重聲道的環繞立體聲效果,試圖重現音場的空間感,但必須增加額外音源趨動硬體的成本。3D數位訊號處理器(DSP)提供的各種音效處理技術,也能回復與增加空間訊號,僅須使用一對立體聲耳機或一對喇叭,就能呈現高傳真的音響效果。3D強化音效技術提升音質效果,營造出身歷其境般的模擬環繞立體聲享受,不僅讓買方興奮,也刺激像是家庭劇院、個人電腦音效系統、平面電視、掌上型與電視遊樂器、可攜式音樂與影片播放裝置以及行動電話耳機等產品的買氣。  

判斷音源方位  

想要徹底了解3D音效的奧妙,必須先了解人類如何判斷音源的方位。英國數學暨科學家雷利在19世紀末~20世紀初長期研究聲音之後,於1907年發表雙耳聽覺的雙工以及聽音辨位的理論。雷利的理論為聽音辨位引進兩條重要線索:  

.耳間時間差(ITD):聲音傳抵兩耳的時間差  

.耳間音壓差(ILD):聲音在每個人頭部與上身部位經過反射後所產生的獨特衍射模式  

外耳的特徵形狀、頭部的大小與形狀,甚至人的肩膀都會形成「音影」,產生耳間音壓差的效果,在聲音中加入空間的訊息,讓音波式產生反射以及和頻率有關的衰減。許多心理聲學的理論讓我們更進一步了解這些聲音調變的複雜過程。造成兩耳聽音辨位效果的空間與幅度性聲道音效調變,稱為頭部相關轉移函數 (HRTF)。兩面的耳膜、中耳的耳骨以及耳蝸會把經過HRTF編碼的音波轉換成神經訊號,聽覺神經將這些訊號傳送到大腦的聽覺皮層,聽覺皮層再對訊號進行解碼,並將音源的空間位置傳送到人的感知中樞(圖1)。  

單純的雙聲道與3D音效之間的差異,從圖2中,可清楚看出端倪。雙聲道的立體聲使用兩個麥克風來錄製左右兩個聲道,兩個麥克風的距離約等於人耳的距離,並以適當的ITD參數來錄製聲音,但由於麥克風缺少人體的音影,無法反射聲音與製造空間編碼的效果,因此缺少聲音辨位所需的ILD特性。  

雙耳聲音重現技術能產生比立體聲技術更逼真的音效,因為它加入少掉的ILD編碼機制,將收音的麥克風嵌入在頭部模型或模仿一般人外耳、頭以及肩膀的模型中。但很少錄音資料是使用裝在頭部模型的雙耳麥克風,全世界大多數的錄音資料都是單聲道或雙聲道。此外,合成音樂如MIDI音樂、音效與鈴聲等,在透過硬體重製之前根本不存在,因此也不可能經過雙耳錄音程序。所有電子聲音重製方法或至少HRTF空間編碼技術,能提升錄製與合成音樂的空間感,這些電子音效型塑方法稱為3D音效。  

DSP執行立體聲加寬處理  

透過立體聲加寬、立體聲映像強化技術,將音場放大並純化立體聲效果,便能提高空間感。這種技術對於改進窄頻立體聲手機耳機的立體聲映像特別有效,能消除聆聽者在使用耳機時,腦中感受到立體聲映像。立體聲加寬機制運用簡單的訊號衰減、相位轉換以及加總等類比電路功能,但現今數位訊號處理器技術已被廣泛運用,許多產品已採用數位訊號處理器來執行數位音樂編解碼作業,因此運用數位訊號處理器執行立體聲加寬處理,幾乎不會增加任何硬體成本。  

與立體聲加寬技術不同的是,全3D定位音效強化技術採用相當精密的HTRF與其他聆聽模式,這些都是類比電路無法建置的效果,且須要運用即時數位訊號處理器演算法。每個3D音效數位訊號處理器演算法的研發業者,都是從建立自己的聆聽模式開始著手。有些廠商會模擬一個「一般」HTRF,運用一個或多個上半身與頭部模型,或是僅使用耳部模型。之後再把麥克風裝入這些模型中,經過無數的音效測試,產生許多資料,再用這些資料來產生HTRF模型。  

例如,音效軟體研發廠商AM3D使用一個由丹麥Aalborg大學設計的Valdemar頭部模型,所建立的HTRF模型送到Zirene立體聲加寬軟體套件以及Diesel Power Mobile 3D音效遊戲引擎。SRS Labs也特定為其XSPACE 3D行動遊戲音效套件開發一個HTRF模型,該注意的是,HTRF模型可能會受限於應用程式。QSound Labs也正著手改良其3D音場聆聽模型,應用在其Q3D演算法,目前已進行超過55萬次測試,由真人的受測聆聽者進行長達8年的實驗,而每家公司的聆聽模型都是專利資產。  

3D音效軟體透過API計算音源位置  

在發展出3D聆聽模型後,可用它來控制軟體,這些軟體負責錄音以及合成聲音資料流的作業,讓不同的音源聽起來像是放置在不同位置,在簡單的兩聲道立體聲音效方面,3D音效塑造軟體會嘗試重建一個逼真的音場環境,在聆聽樂廳中製造迴音效果,或是加強低音部分。在多重聲道或合成音源方面,3D音效軟體可透過內建在軟體中的應用程式介面(API)控制功能,直接從音源資料中解算出位置資訊。至於都普勒效應,這種3D音效能強化物體在音場中移動時的逼真度,有些 3D音效軟體亦能透過API機動調整音量以及根據參數進行等化處理。  

為營造出逼真且有空間感的音場環境,3D音效軟體的研發人員融合心理聲學以及數位訊號處理器技術,發明出許多效果。這些3D音效處理功能運用各種即時數位訊號處理器演算法,包括混音、過濾、衰減以及頻率調變等。這類軟體能在各廠商的數位訊號處理器,或是內建音效數位訊號處理器延伸集的通用型處理器上運作,例如像Tensilica的Diamond 330HiFi音效處理器核心。  

降低所用頻寬及記憶體  

尤其是對於可攜式與使用電池的產品而言,選擇處理器或數位訊號處理器最重要的考量因素就是3D演算法應僅使用極少量的處理器頻寬,讓處理器能在最低的時脈速度下運作,藉以降低處理器的功率與耗電量。對於手機與可攜式音樂與影片播放裝置而言,這項特性尤其重要,因為買方會特別注意這類產品的通話時間以及電池續航力。  

處理器的指令集架構(ISA)以及其易用性會影響處理器在執行3D音效演算法時的性能,例如像Tensilica的Diamond 330HiFi處理器擁有約300個音效方面的指令,加入其基礎的RISC ISA,簡化音效軟體的程式開發作業,並降低執行音效數位訊號處理器軟體所需的時脈頻率。對於系統單晶片(SoC)處理器核心而言,處理器占用最少的矽元件空間以及耗用的記憶體,也是重要的考量因素。  

聲音重製技術精益求精  

聲音重製的技術演進,一直朝向高傳真原音重現的目標邁向,原因很簡單,提供更好音效的產品能吸引買家的青睞。從一百多年前的機械式、低傳真的單音重製系統,電子業界持續研發更進步的音效系統,帶來持續提升的傳真度,包括立體聲、4聲道、3聲道立體聲、4.1~10.1聲道的環繞立體聲系統,模擬3D立體音場效果,使用數量持續增加的錄音音軌以及電機式音效驅動器。運用數位訊號處理器的3D音效強化軟體,讓僅有兩個音效驅動器的音效系統如耳機或兩個喇叭的揚聲器,不必增加硬體成本以及笨重的音效趨動器,毋需特別的錄音程序或使用多音軌技術。運用這類科技的音效系統能吸引消費者的青睞,且能提供這種聆聽經驗的系統,經常能影響消費者的決定,為3D音效強化系統提供顯而易見的價值。  

(本文作者為Tensilica策略行銷經理)  

(詳細圖表請見新通訊元件雜誌73期3月號)  

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!