現今市面上販售的手機、藍牙(Bluetooth)耳機有百餘種,分別由多家廠商製造,然而在通話方面,每家廠商所設定抑制雜訊或是過濾背景噪音的數位訊號處理(DSP)參數都不太一樣,本文將以固定的環境與背景噪音,來測試不同的通訊產品,如手機、藍牙耳機等之語音品質(Speech Quality),以及為了改善平均意見分數(Mean Opinion Score, MOS)時,提出DSP可能修改的方向。
|
圖1 上為無背景噪音之測試架構圖,下為有背景噪音之測試架構圖。 |
測試所用的背景噪音是利用歐洲電信標準ETSI EG 202 396-1所制定的聲場重建規範,藉由重建各種背景聲場,來模擬使用通訊產品時所在的不同環境,以觀察其在通話品質上造成的影響。MOS分數則是依據國際電信聯盟電信標準部門ITU-T P.862所建立的演算法,比對分數定在1~4.5分(分數越高越好),計算方式是將原始的聲音與透過通訊產品後所收到的聲音,著重在比較失真量,而不是聲音的大小(圖1)。
由於北美的手機市場越來越重視通話品質,各大電信業者要求所有提供給AT&T、T-Mobile USA、Cellular South、MetroPCS的手機皆須經過通訊品質的測試驗證,且將會有其他的電信業者後續跟進執行。雖然目前在其他地區是非必要認證,但卻代表一種品質的保證。所以利用計算MOS分數的設備來分析在有背景噪音的情況下,各家手機或是藍牙耳機在DSP參數設定上的差異,以了解某些特別強調可以抑制雜訊的通訊產品是否真的比較好,以及尋求改進DSP時,可以修改的參考方向。
聲場重建不可輕忽
測試將依照ETSI EG 202 396-1的法規建立起聲場重建的環境與設備,它關係到中央位置的聲場強度與經過人偶時各種繞射、反射等物理因素。通訊產品接著架設於電聲人偶上,並使其連線進行通話測試。分別測試無背景噪音時及加入背景噪音的MOS分數,之後利用知覺語音評價(Perceptual Evaluation of Speech Quality, PESQ)分析其中差異。
|
圖2 測試流程圖 |
測試前會先在全無響室與無背景噪音的半無響室做比對,以確認手機原本的性能,再加入聲場模擬的情況,進行通訊品質的比較。
聲場模擬的背景噪音採用許多手機大廠經常選擇的咖啡廳以及馬路路口兩種背景來設定DSP參數,因為咖啡廳屬於非穩態的背景噪音,馬路口則較趨於穩態。 背景噪音的聲壓強度大小將分別以70分貝和80分貝作測試,另外,也將探討訊號滿格與訊號半格MOS分數的變化。接著分析背景噪音與經過手機DSP後之語音,比較其與原始檔的差異,最後以收集到的數據找尋其原因與可能解決的方法(圖2)。
‧ |
|
|
本次測試使用的G.R.A.S. TYPE 45EA人偶,符合ITU-T P.57、P.58、P.64的規範,其中包含手機的支架與定位器、人工嘴及人工耳等,必須確保每次手機放置時,都在同一個位置。由於要透過人偶來發聲,所以採用易祿達(IEA)的MP1功率放大器來推動人工嘴,人工耳內的電容式麥克風放大器為B&K 5935。為測試手機在連線狀態下的通話品質,使用羅德史瓦茲(R&S)的CMU 200來模擬手機基地台發出的射頻(RF)訊號以撥通手機。Metrico Wireless的MUSE目前為北美各大電信業者所指定測試通訊品質的設備,可用來計算MOS分數,並包含由Psytechnics開發的PESQ分析軟體。 |
‧ |
|
|
通訊產品測試的架構圖如圖3,連接電腦與MUSE,然後以此架構來測試各種通訊產品在不同環境下的通訊品質。背景聲場模擬的架構,則是依照ETSI EG 202 396-1標準規範(圖4)。其中包含四台等化器、四聲道的功率放大器、四顆揚聲器、一個超重低音揚聲器,以及與校正此環境時須要用的B&K TYPE 4100聲學人偶(圖5)。
|
圖3 通訊設備測試架構圖 |
|
圖4 聲場重建架設圖 |
|
|
圖5 校正聲場模擬所用的B&K TYPE 4100 |
過濾高頻背景噪音可改善通話品質
此次測試首先會比較在沒有背景噪音的狀況下,透過手機在半無響室與全無響室所測試通訊品質的差異,以了解手機本身的語音品質。接著再探討以下幾個變數所造成的影響,例如訊號強弱不同可能會出現的影響、背景噪音與訊號強弱間所產生的語音品質差異,以及不同背景噪音之間可能會有的不同影響等。
環境干擾影響手機通訊品質
為要了解本測試所使用的手機,若在較理想的環境,MOS分數會分布在何處,故選擇在半無響室與全無響室測試,其規格如表1。
由圖6可以發現,在全無響室所量測到手機上行鏈路(Uplink)與下行鏈路(Downlink)的MOS分數皆在4.1分左右,而在半無響室所量測到的分數分別在3.2分和3.8分,可以發現在半無響室由於地面為反射面且無隔震設施,造成手機麥克風收到較多的干擾,導致上行鏈路的分數下降較多;而下行鏈路因為與人工耳之間距離近,受到干擾的影響較少。這代表手機本身在無干擾的情況下,通話品質平均可以到達4.1分,但在實際環境下像是房間內等,通話品質將會下降到平均3.5分。
背景噪音/訊號強弱攸關語音品質
為了解訊號滿格與訊號半格是否真的會對通訊上造成影響,以及加入背景噪音所造成的影響,在此加入了背景噪音。由圖7發現一旦加入背景噪音後,上行鏈路與下行鏈路皆大約下降了0.7分。另外,訊號半格與訊號滿格,實際測試上發現上行鏈路約下降0.3分,下行鏈路約下降1分,由此可發現訊號好壞也會影響語音品質。
|
圖6(左圖) 在全無響室(上圖)與半無響室(下圖)的無背景噪音MOS分數。 圖7(右圖) 在半無響室模擬馬路路口背景噪音量70分貝的MOS分數,上為訊號滿格時,下則為訊號半格時。 |
為了探討背景噪音的強弱會造成多大的影響,該測試使用馬路路口的背景噪音,將背景噪音聲壓調整到70分貝和80分貝來觀察其差異的程度。由圖8可以發現在背景噪音多出10分貝時,訊號強度分數會落差1分左右。
為了解主要頻率分布不同的背景噪音,對通訊品質上造成的影響,進而了解手機內DSP對不同頻率的抑制程度,在此使用了咖啡廳的背景噪音。由圖9可以發現,如果使用不同的背景噪音,即使背景噪音強度都在70分貝,MOS分數也與無背景噪音情況下落差很大。且由上行鏈路與下行鏈路的曲線可以發現,由於DSP只會過濾麥克風收到的聲音,所以上行鏈路的曲線較為平坦,而下行鏈路,也就是人工耳收到的部分,會因同時接收到背景噪音起伏的影響,因此產生高低起伏的曲線。
|
圖8(左圖) 在半無響室模擬馬路路口背景噪音量80分貝的MOS分數,上為訊號滿格時,下則為訊號半格時。 圖9(右圖) 在半無響室模擬70分貝下不同場合背景噪音的滿格的MOS分數,上為馬路路口,下為咖啡廳。
|
使用PESQ分析軟體來觀察背景噪音的頻譜圖,即可了解背景噪音本身頻率的主要分布。由圖10可以發現背景噪音為馬路路口的主要頻率分布在1kHz以下,而咖啡廳的頻率大部分分布在1k~5kHz。所以很明顯手機的DSP可能只有抑制了1kHz以下的噪音,而對1kHz以上的抑制極少,所以造成在咖啡廳的背景噪音下,即使背景噪音量只有70分貝,所測得的MOS分數也較背景噪音為馬路路口且總聲壓到達80分貝來得低。
最後為觀察一段語音和背景噪音經過手機的DSP後,其頻譜的變化。圖11分別為為原始的語音檔,及人偶發聲後經過手機麥克風與DSP回傳到電腦所錄到的上行鏈路。此時所使用的背景噪音為馬路路口,強度為70分貝。
|
圖10(左圖) 分別模擬馬路路口(上)與咖啡廳(下)的頻譜圖。 圖11(右圖) 上為人工嘴發出的原始語音頻譜圖,下為發聲後經手機回傳收到的頻譜圖。 |
至此可證實前面的推論是正確的,此手機的DSP的確著重在抑制1kHz以下的雜訊。而在這兩張圖中也可以發現DSP將3.5kHz以上的頻率做了更大的抑制。另外,由於手機通話時皆使用窄頻系統,故在測試時所使用的取樣頻率設定皆定為8kHz,所以頻譜只顯示到4kHz。
由於大部分外界環境充斥著較多低頻的背景噪音,所以大部分的手機業者也較注重抑制低頻部分的雜訊。由測試結果可得知,若是可以過濾較為高頻的背景噪音,便可大大的改善通話品質,以增加產品的競爭力和優勢。或嘗試使用更為指向型的麥克風或宣告手機較適合的使用角度,如此手機在測試時則會以該角度來進行,也會得到更好的語音品質。
(本文作者依序為國立台北科技大學車輛工程研究所教授、學生、易祿達CNLA校正與測試領域負責人)