是德科技 1.6T 資料中心 800G 224Gbps SerDes OIF IEEE CPO

剖析224G通道挑戰 1.6T資料中心為大勢所趨(下)

2023-04-21
資料中心整合商藉由並聯更多通道,來提高網路的總資料傳輸速率。第一代800G可能包含8個100Gbps通道,總資料速率為800Gbps。然而,最好的方法是直接提高每通道的資料速率。開發人員可選擇提高鮑率(Baud Rate)或每個符碼的位元數。提高傳輸速率可加快符碼通過通道的速度,但可能會加劇訊號衰減。提高脈衝振幅調變機制(PAM)的階數雖然可以讓每個符碼傳送更多的位元,但容差度會下降,並且將縮減臨界值。
Shutterstock

在定義800G和1.6T標準時,IEEE和OIF會通盤考慮各種實作方法的利與弊。這兩個組織均已著手制訂224Gbps通道的800G和1.6T標準。

突破224Gbps重重關卡

以下是致力於實現224Gbps通道速率時,業者可能面臨的挑戰和可行的解決方案:

交換器晶片

更快的網路交換器晶片是提高通道速度的關鍵。高速的特定應用積體電路(ASIC)可在伺服器機櫃和資料中心裝置間實現低延遲交換。從2010年到2022年,互補金氧半導體(CMOS)製程技術已取得重大突破,使得交換器晶片頻寬從640Gbps一路飆升到51.2Tbps。

SerDes(串列器/解串列器)速度和SerDes(I/O針腳)的數量,決定了晶片的頻寬大小。例如,51.2Tbps頻寬的晶片可提供512個100Gbps SerDes,足以支援128個400G乙太網路埠,每個埠由4個100Gbps通道組成。一旦102.4T交換器能夠提供512個200Gbps SerDes通道,下一代交換器晶片的頻寬將再度翻倍。屆時,這些晶片交換器可透過224Gbps通道支援800G和1.6T的速率。

脈衝振幅調變

當資料以更快的速度通過通道時,提高的資料傳輸速率很可能導致訊號衰減。在此情況下,要維持高速數位通訊的訊號完整性變得更加複雜,因此標準組織開始轉而採用更高的調變機制,藉以增加每符碼的位元數。例如,400G乙太網路使用四階脈衝振幅調變(PAM4)SerDes,可在符碼速率為50GBd的情況下,將資料速率從50Gbps提高至100Gbps。如此一來,400G網路可開始使用4個100Gbps的通道,而非8個50Gbps的通道。

然而,脈衝振幅調變有優點也有缺點,因為每個週期傳送更多的位元,每個符碼的雜訊邊限會因此縮減。使用不歸零(NRZ)訊令時,區分0位元和1位元的電壓臨界值範圍變得更大。當每個符碼的位元數增加,臨界值會變小,雜訊抗擾能力也隨之降低。在50GBd NRZ下的雜訊位準不會導致眼圖閉合,這意味著接收器可以清楚區分不同的位元位準,但對於嘗試解析50GBd PAM4符碼的接收器而言,這反而是種阻礙。

為了確定更高的調變機制是否對1.6T系統有利,Broadcom模擬了224Gbps通道,用不同的等化等級來測試PAM4至PAM8的訊噪比(SNR)和誤碼率(BER)效能(圖1)。在此速度下,PAM4的效能優於所有其他調變機制。在取得這些成果後,業界可能會保留PAM4的共通性,並試圖以不同方法來維持高資料速率下的訊號完整性。

圖1 Broadcom 224 Gbps脈衝振幅調變效能模擬 (圖片來源:由Broadcom Inc. Cathy Liu提供)

前向誤差修正(FEC)

大多數的高速資料標準均使用等化技術來補償自然的訊號衰減和通道失真。發射器和接收器中經過微調的等化器,可在訊號傳送到通道另一端後將其復原。然而,隨著更快的速度不斷挑戰物理極限,業界需要使用更複雜的方法,例如前向誤差修正(FEC)。

前向誤差修正是指藉由傳輸冗餘資料,讓接收器能夠將其中可能包含損壞位元的訊號,完整拼湊在一起。發生隨機誤差時,FEC演算法可恢復資料訊框,但如果整個訊框都遺失了,便無法有效處理突發錯誤(Burst Error)。在遺失整個資料訊框的情況下,接收器很難重建訊號。例如,224Gbps收發器需要使用更強大的FEC演算法,來成功地傳輸和接收資料。每一種FEC架構,在處理編碼增益、額外負荷(Overhead)、延遲和電源效率等方面,各有所長(圖2)。

圖2 FEC架構的類型及其取捨 (圖片來源:由Broadcom Inc.的Cathy Liu提供)

FEC雖有助於減輕發射器和接收器之間隨機誤差的影響,但是對突發錯誤卻束手無策。因此,224Gbps系統必須使用更複雜的FEC演算法將突發錯誤降到最低。測試與量測開發人員正致力於開發支援FEC的接收器測試解決方案,以即時偵測訊框遺失並進行除錯。

光學模組與能源效率

功耗很可能是資料中心面臨的最大挑戰。如今,資料中心消耗的電力約占全球總發電量的1%。資料中心營運商必須極力提高處理能力,同時避免功耗跟著大幅上升。光學模組是提高能源效率的關鍵元件。

每一代光學模組問世,都導致功耗日益攀升。例如,100G四通道SFP(QSFP28)模組的功耗不到5W,但400G QSFP-DD(QFSP雙倍密度)模組的功耗高達14W。當光學模組設計變得更成熟,其效率也會變得更高。以首次亮相、功耗為17W的800G QSFP-DD模組為例,隨著技術變成熟,功耗應該會降低到10W,也就是說,每位元的功耗開始下降(圖3)。然而,每個資料中心內部平均有50,000個光學模組,而這些模組的高功耗仍是一個問題。

圖3 光學模組的功耗趨勢 (圖片來源:由Eoptolink的Supriyo Dey提供)

為了提高能源效率,開發人員正致力於開發其他可行的光學模組。共同封裝光學元件有機會實現最低的功耗。這類元件將光學模組轉移到ASIC上、去除了光學重計時器,進而在封裝內執行光電轉換。代價是功率耗散集中在ASIC封裝內部,因此可能需要新型的散熱解決方案。散熱是導致資料中心耗電量增加的另一個重要因素。共同封裝光學元件尚未經過驗證,因此業界可能會繼續在800G系統中使用可插拔式光學元件。更高版本的800G或1.6T標準,則可能使用共同封裝光學元件(圖4)。

圖4 可插拔和共同封裝光學模組 (圖片來源:Alphawave IP的Tony Chan Carusone提供)

1.6T及更高速率的時代即將到來

雖然無法得知1.6T將於何時進入資料中心,但就我們對先前標準的了解,加上一些研發成果陸續出爐,或許可以看出一些端倪。OIF的112Gbps標準和IEEE的802.3ck(400G)標準的最終版本已於2022年發布,為800G奠定基礎。第一個51.2T交換器晶片於2022年推出,可支援64個800Gbps埠。此外,業界也已開始對第一批800G收發器進行驗證。

今年,這些標準組織將發布IEEE 802.3df和OIF 224Gbps標準的第一個版本。第一版標準可讓開發人員充分了解如何使用112Gbps和224Gbps通道來建立800G和1.6T系統;同時,可提供8個112Gbps通道的800G設備也即將問市(圖5)。

圖5 800G和1.6T發展預估時間表

在接下來兩年裡,預計各個標準組織將發布最終實體層標準;更多關於共同封裝光學元件、1.6T收發器和224Gbps SerDes交換器晶片的資訊也是關注的重點。這些進展有助於落實使用224Gbps通道的800G和1.6T最終驗證。

目前,400G正在大規模部署中。營運商可將現有設施升級為超大規模資料中心,以便滿足目前的需求,但這只能暫時地緩解問題,業界終究需要應對下一次無可避免的技術進步。接下來的重大變化包括可能將在2025年之前問世、448Gbps的SerDes晶片(100T ASIC)。屆時,3.2T網路將乘勢崛起。

資料中心永遠需要更高效、可擴充的資料技術。1.6T網路能以閃電般的速度處理海量資料,讓5G、AI和IoT應用得以發揮最佳效益。如今,開發人員已將目光投向不遠的未來,並著手打造將來互連社會的無形支柱。

(本文由是德科技Keysight Technologies提供)

運算需求激增 1.6T資料中心為大勢所趨(上)

剖析224G通道挑戰 1.6T資料中心為大勢所趨(下)

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!