由於三大4G無線通訊技術均採用正交分頻多重存取技術,因此就技術觀點而言,以單一硬體支援多模操作並非不切實際的幻想。經過最佳化的處理器硬體搭配對應的演算法與韌體設計,將是最具成本效益的多模整合方式。
目前被行動通訊業界稱為第四代行動通訊(4G)的技術一共有三種,分別是行動全球微波存取互通介面(WiMAX)、長程演進計畫(LTE)及日本本地所發展出來的次世代PHS(XG-PHS)。由於這些行動寬頻技術對晶片組的效能要求極高,因此要在維持低功耗的前提下支援多模操作將形成很大的技術挑戰,需要在晶片架構上進行創新才能兼顧。
4G目前仍然是一個極新且演進中的通訊技術,但由於三種4G技術均以正交分頻多工(OFDM)和正交分頻多重存取(OFDMA)技術為基礎,因此在開發支援多模操作的終端產品時,可利用可程式化的架構來進行系統實作。
在傳統觀念中,若要實現可程式化的設計,多半必須仰賴數位訊號處理器(DSP)來作為硬體平台,但4G行動通訊產品若採用傳統DSP來實作,將很難達成行動裝置對於電池壽命的要求。因此,特定應用積體電路(ASIC)遂成為最佳的選擇。
首先本文將就OFDMA的特性進行解釋,並說明演算法會遇到的挑戰,然後以宏觀角度來比較目前領先的三種4G技術之間的異同,最後再介紹如何以獨一無二的架構來實現超低功秏兼顧彈性的多模第四代行動通訊晶片。
正交分頻多工概念及接收端的挑戰
OFDM是一種在無線領域中常用的調變技術,其常見的編碼方式有QPSK、16QAM、64QAM Symbols等。由圖1可知,均化載波干擾(Inter Carrier Interference, ICI)會選擇接收端的子通道最小需求載波,而持續不斷的正交分頻多工編碼最終組合成一個完整的正交分頻多工訊框。典型的正交分頻多工訊框可分為下行(Downlink, DL)及上行(Uplink, UL)兩種模式,以在基地台(BS)和行動裝置(MS)間傳遞資料。
|
圖1 正交分頻多工概念 |
有兩種技術經常被應用在DL和UL操作中,分別是分時雙工(TDD)和分頻雙工(FDD)。分時多工使用不同的時間軸來區分UL和DL;分頻雙工則使用不同的頻帶來區分UL和DL。在分時雙工中,在UL和DL之間,BS經常會使用間帶(Gap)來傳遞指令,用來決定系統該進入UL或DL工作模式。在分時雙工中,使用DL和UL中的間帶來決定BS和MS互相適合的接收頻帶。分時雙工和分頻雙工示意圖如圖2。
|
圖2 正交分頻多工訊框結構與分時雙工/分頻雙工的定義 |
BS和MS的資訊交換方式如圖2所示。正交分頻多工訊框的架構被定義為二維陣列(Two-Dimensional Array):時間和頻率。其中基地台是在下載的頻道中進行傳送,終端裝置在上傳的頻道中進行傳送。而4G通訊技術使用正交分頻多工的其中一個好處,就是可以用一個基地台來同時服務多個用戶端。其於這樣的目的,常稱為正交分頻多重存取技術,是可以相同資源來同時處理多個使用者。舉例來說,在圖3中即可以看到不同的使用者(#1~#3)是使用同一個正交分頻多工訊框中同時上傳和下載資料。
|
圖3 正交分頻多重存取 |
有效使用無線通道中,接收道是可以同時接收多個資料。這種技術會造成時域和頻域上多重路徑(Multipath)效應,影響傳送的效果。第一種影響是符元間際干擾(Inter Symbol Interference, ISI),這種效應會造成臨近的正交分頻多工符元互相干擾。一般來說,正交分頻多工中會使用保護間帶(Guard Interval, GI),也常被稱為循環前綴(Cyclic Prefix, CP)來保護正交分頻多工符碼。在接收端可以忽略這個部分,用此一技術來消除ISI效應。圖4中描述保護間帶移除符碼間際干擾。
|
圖4 使用保護間帶(循環字串)處理符元間際干擾問題 |
第二個為頻域上的影響。此一影響會造成頻率選擇性通道衰減。每個效應會影響通道中副載波的振幅和相位,因此設計重點在於接收端如何克服影響重建傳送的資料。在副載波頻寬極為有限的情況下,此一效應將影響正交分頻多工可傳送的服務。圖5為從頻域的觀點來觀察頻率選擇性通道衰退效應對資料傳輸的影響。
|
圖5 頻率選擇性通道 |
OFDM的接收端必須得到以下幾種重要參數方能進行訊號重建的工作:
|
|
|
一般來說,接收端的石英震盪器精準度會影響頻率和造成取樣時間飄移。因為基地台和接收裝置上的石英振盪器飄移(Crystal Offset)和頻率的誤差,所以需要補償。 |
|
|
|
適當的管理訊號增益(同時在數位和類比部份),調整合理動態範圍。 |
|
|
|
對無線通道定義多種反射參數品質並定時量測,以方便系統選用用最佳的頻率。 |
在第四代行動通訊系統中,為確保通訊傳輸的效能,以上的參數應該經常被更新至接收端。在進行資料傳地時,上述訊息必須被加在傳送的資料中。其中一個專用的OFDM符元是前置碼(Preamble),也被稱作導引符元(Training Symbol),其用來送正交分頻多工訊框位置的資料。每一段時間內,接收端需要這些特定參數來調整初始增益、訊框的時序和石英振盪器飄移估測(Crystal Offset Estimations)。
另外,會有一個領航副載波(Pilot Subcarrier),也稱作參考訊源(Reference Signal),其使用固定振幅和相位的正交分頻多工訊框技術來傳遞副載波。這些副載波會分散在各自獨立的訊框的時序和頻帶,為了要先建立連線通道前的準備。在不同的第四代行動通訊技術中,對前置碼(Preamble)和領航副載波(Pilot Subcarrier)有不同的定義在。
第四代行動技術使用正交分頻多工來當成核心技術有幾個已知的好處,如穩定的載波間干擾(Inter Carrier Interference, ICI)與符元間際干擾(Inter Symbol Interference, ISI)、簡化同一時間內進行多重異變處理的過程,減輕如圖5中的通道不穩定性、提升通道傳送的速度及穩定性、容易處理在短時間內多次傳送同一筆資料,以增加抗雜訊能力等等。
此外,採用OFDM技術可以使用單一複合數值(Single-complex Scalar)搭配平緩衰減的模型,以對每一個子通道衰減進行通道響應的建立及補償。也比較容易使用快速傅立葉轉換(FFT)與反快速傅立葉轉換(IFFT)演算法及實作多重輸入多重輸出(MIMO)、順向糾錯(FEC)等,可謂好處多多。
4G技術概觀
接著筆者將介紹三大主流4G技術--WiMAX 802.16e、3GPP-LTE和XG-PHS。這些技術在細節部分有相當差異,但是在高階的流程則大同小異。
|
|
|
WiMAX 802.16e支援的通道頻寬為1.25M~20MHz,快速傅立葉轉換則是128~2,048階,副載波間隔則是10kHz,調變方法則是支援QPSK到64QAM重複編碼則可以支援到為6的因子,編碼率(Coding Rate)則是支援1/2~5/6,WiMAX同時支援5毫秒訊框的TDD跟FDD,在TDD模式裡UL跟DL的比例是可調整的,循環前綴是以1/8的方式加入訊號中,長度也是可以另外調整的,每一個訊框都是由一百一十四種可能的前置碼作為開始,AMC、PUSC及FUSC的排列方式都有支援,每個訊框都可以被分成幾個區域,每個區域分別使用不同的並列方式伴隨著MIMO的方法傳送。每個次載系統都可以依據不同的排列方式去做調整,圖6顯示一個PUSC排列的次載系統,二維時間頻率座標會被分割成以叢集(Cluster)為基本單位的系統,每個Cluster會包含十四個頻率維度上的物理次系統(~140kHz)以及兩個時間軸上連續的OFDM單位(~200μs)。
|
圖6 802.16e PUSC叢集結構 |
802.16e也同樣之原先進的MIMO技術包含DL模式的四天線技術,藉由STC可以大幅提升接收的可靠度,同時空間多路傳輸(Spatial Multiplexing)則可以大幅提高傳輸速率,波束成形(Beamforming)跟預先編碼(Precoding)也都在802.16e的支援範圍內,以CC、CTC以及混合式自動重傳請求(HARQ)為基礎的多重FEC也同樣在WiMAX 16e的支援範圍內。 |
|
|
|
3GPP-LTE支援的通道頻寬與傅立葉轉換階數與WiMAX相同,但副載波的間隔為15kHz(也可使用7.5kHz), 調頻方式則是支援BPSK到64QAM,編碼率則是依據被傳輸資料及網路資源來決定。LTE標準可支援FDD跟TDD,在FDD裡每個10毫秒的訊框都會被分割成十個次訊框,之後在新分成兩個0.5毫秒的時槽(Slot)。而在循環前綴部分,Normal CP跟Extended CP都在LTE的Cyclic Prefix規畫中。
比較值得注意的是,在LTE標準中,每一個副載波都被稱為資源元素(Resource Element, RE),再由十二個在頻率維度裡的連續RE及一個在時間軸裡的時槽構成資源區塊(Resource Block, RB)。圖7顯示Normal CP下RB及FDD(Structure 1)的結構。
|
圖7 LTE訊框與資源模組結構 |
領航副載波在LTE裡稱為參考訊號(Reference Signal, RS),存在於每個RB中。RS的位置會隨著發射天線的數量、框架及CP的形式不同而不同,圖8是單一天線、FDD(Frame Type 1)以及Normal CP下的RB結構,跟網路同步的部分則是藉由兩個特殊符號來完成,分別是首要編碼(PSC)和次要同步編碼(SSC)。相似於WiMAX、3GPP-LTE同樣支援MIMO技術,包含在DL裡的四天線發射技術以及Alamout碼與空間多路傳輸(Spatial Multiplexing)方法,LTE也同時支援MIMO裡的CDD,多重FEC也支援CC、CTC跟HARQ。
|
圖8 LTE RB第一類訊框架構,一般循環字串 |
|
|
|
|
日本的XG-PHS則支援1.25M~20MHz的頻寬以及32~512的傅立葉轉換,次載系統的間隔則是37.5kHz,調變方式採用BPSK與256QAM,編碼率則是支援1/2~7/8,支援TDD解多工,訊框長度是5毫秒,均分為UL跟DL,每個次訊框(Subframe)都再分成四個時槽,每個時槽都更進一步的分割成十九個OFDM符元,在每個時槽的開始跟結尾還有保護時間(Guard Time)以區分時槽的頭尾,循環前綴是1/8,而且時槽的第一個符元都使用長CP。
圖9是XG-PHS的訊框結構,在XG-PHS裡,一個單位的物理資源單元(Physical Resource Unit, PRU)包含頻率維度裡連續二十四個副載波以及時間軸裡的一個長度為625微秒的時槽,這是BS與MS間基本的資訊交換工具。PRU有可能在邊緣及整個DC裡包含多個保護副載波(Guard Subcarriers),如同圖10裡的F13、F1,從圖10中也可看出PRU也包含傳輸是具用的副載波,如圖中灰色部分。
|
圖9 次世代PHS訊框結構 |
|
圖10 次世代PHS實體資源單元(PRU)結構 |
表1為WiMAX、LTE與XG-PHS三種技術在一些主要的參數上的比較整理。
|
可程式化OFDMA處理晶片實現多模設計
正如表1所示,WiMAX 802.16e、3GPP-LTE以及XG-PHS等標準具備許多新的特性,且這些標準亦應用於訊號處理的演算法中,其主要目的就是能夠順利解碼與接收資料。因為這些標準各自有不同內容定義,且引用了新一代的先進通訊理論。因此有相當充分的理由證明若要達到4G多模整合的目標,必須運用可程式化的技術,硬體架構的ASCI並不適於此。
傳統DSP為基礎的方案由於功耗過高,很難開發出具有競爭力的產品。因此,採用一個針對OFDMA最佳化的處理器是較理想的方案。此外,這亦說明典型的行動OFDMA接收架構也可反過來應用在上傳操作上。一般來說OFDMA接收器能夠被分為數位前端處理、頻域運算以及順向糾錯。
|
|
|
當接收到的資料透過類比數位轉換器(ADC)將從類比訊號轉換到數位訊號時,一般來說,依據MS/BS震盪偏移後的預估值,接收到的資料須濾掉緊鄰頻道相互干擾產生的效應,並且重新取樣來修正取樣錯誤以實現與基地台的同步。ADC輸出的訊號通常包含一些稱之為線性超低雜訊正交脫鎖(IQ-mismatch),該失真訊號可以用數位方式來補償。雖然數位前端作業方式在這三種標準的屬性上是彼此是類似接近的,也因為不同的ADC取樣率使其被要求得更有彈性。
此外,濾波與重新取樣的作業也因不同的有效訊號頻寬而有所影響。因為不同訊框結構特性與不同的快速傅立葉轉換需有不同的類比增益管理控制。可透過搜尋每個訊框內被加入的特徵符號的方式來找出時域的取樣資料,以便來完成初始網路識別與同步,即WiMAX的前同步碼、PSC與LTE與SSC的訓練序列。 |
|
|
|
數位訊號處理演算法在OFDM接收器裡執行之後,訊號經由快速傅立葉轉換演算方式由時域轉變到頻域。這可能牽涉到相當多種不同的演算法,例如通訊狀態的功能,基地台發射端與終端接收器的天線數量,基地台的發射方法等,都會影響所須使用的演算法種類。
OFDMA接收器的解碼輸出值是在特有的對數似然比(Log-Likelihood Ratio , LLR)的格式來表現出每個解碼後的位元為1或0。為了編碼字元的解碼LLR就用在順向錯誤更正(FEC)的模組內。訊號處理作業描述以上使用前同步碼、領航副載波以及資料副載波。這些訊號處理作業主因是針對4G技術的寬頻屬性(即目前的標準是行動裝置接收100Mbit/s,到將來就要能接收1Gbit/s的需求),才需要一些高度的數學運算(包含極少數對每秒乘累加運算,GMAC的需求)。 |
|
|
|
在頻域運算結果裡的LLR會傳送到FEC模組。在這部分三種不同的標準均使用共通的工具,例如:HARQ、迴旋碼(Convolution Code)以及迴旋渦輪碼(Convolution Turbo Code),不過實際上完整的內部執行編碼的方式讓這些標準變得不同。雖然可編程性在此可發揮靈活的優勢,但因為三大標準對FEC的定義都很明確,所以完整的可編程性在此並非必要。
如前文分析,在所有4G的標準中,OFDMA處理器的基本任務便是處理時域與頻域的運算,且由於不同標準之間有許多共通性,因此僅須在細節部分,例如使用排列方式(Permutation)、Pilots Location、訊框結構、MIMO模式使用等進行特殊化的設計。現成的DSP並無法達成這個目標,尤其是應用在手機上,因為這類元件對於處理器的功耗沒有進行最佳化。圖11描述OFDMA接收器的架構為經過最佳化的OFDMA處理器。
|
圖11 最佳化OFDMA處理器方塊圖應用在正交分頻多工基頻接收器 |
針對OFDMA的應用將處理器做了最佳化的處理後,可以獲得兩種好處。首先,處理器可以支持多模與可編程性,第二則是省電。在此簡單整理最佳化處理器所應具備的特性:
首先,行動寬頻處理需要非常高的計算能力。為滿足接收資料時瞬間峰值與高移動通訊時極大計算負荷的需求,依目前4G的標準來看,處理器的運算效能必須達到每秒10GMAC。處理器本身的頻寬大小亦必須審慎考慮,因為當大量即時資料出現時,若頻寬不足有可能導致處理器被塞爆的結果。
在處理器的設計結構上必須強調處理器要能具備強大資料處理能力與極優功耗特性。透過最佳化演算設計的處理器可以帶來相當重要的省電效能。從現成的DSP來說,乘法器通道寬度的一些常用號碼被占用,例如16bits、32bits。針對這些情況在設計上進行最佳化可讓OFDMA處理器達到實質省電的效果。
就以大向量區塊(Large Vector Blocks) 的重覆運算來說,OFDMA處理器應該要被最佳化過。例如:採用頻域的領航副載波的向量來執行通訊估測(Channel Estimation)。相反地,單載波須每次重新取樣。
在處理器指令集部分亦須添加可以最佳化OFDMA工作的特別指令集,例如排列方式(Permutation)、同餘(Modular Arithmetic)、隨機化(Randomization)、切割(Slicing)等,可以得到額外的效能。
依循上述的指導方針是設計出最佳化的OFDMA處理器的最基本要求。對於處理OFDMA運算而言,依循這些指導原則設計的處理器只需消耗極低的電力就能具備執行極高的運算力。此外,處理器亦可與大多數高效率硬體架構(Hard-Wired)的ASIC相比較。 |
低功耗數位訊號處理為4G多模 整合關鍵
當行動寬頻趨勢來臨,4G行動寬頻裝置需要一個擁有可觀運算能力且低功率的晶片。由於4G技術的三大主流--WiMAX 802.16e、3GPP-LTE 與XG-PHS均以OFDM和OFDMA為基礎,因此對這些技術進行深入研究後,就可以據此實現以軟體支援多模操作的硬體平台。
設計一個最佳化的OFDMA處理器來支援多模4G通訊技術絕非天馬行空的科學幻想。只是開發人員只是必須設計出比傳統處理器更靈活的架構,同時兼顧手持式裝置對超低功耗的要求。適當的處理器設計只須加入少量額外設計,即可擁有超高運算能力,而且會比傳統固定功能ASIC來的靈活使用。因此未來在4G世代,大多數公司會規畫新的架構和技術來滿足可預見的龐大需求。
(本文作者任職於Altair)
參考資料 |
.802.16e Standard:Part 16:Air lnterface for Broadband Wireless Access Systems(P802.16Rev2/D5)
.LTE Standard:3GPP TS 36.22 V8.3.0(2008-05)
.PHS MoU Document:A-GN4.00-01-TS |