在快速發展的資料儲存世界中,設計師們正競相跟上不斷變化的標準介面及外觀尺寸規格(Form factor)標準。善用PCIe介面,可以讓設計人員更輕鬆地開發出滿足其多樣化規格需求的儲存設備。
為滿足不斷變化的市場及應用需求,資料儲存設備的規格正在快速改變。本文將探討這些產業變化的影響,重點關注採用PCIe介面,但外觀尺寸規格不同的儲存設備,如企業和資料中心標準外觀尺寸(EDSFF)。PCIe介面設計需要在其鏈路寬度以及多種協議之前提供多樣的靈活性,以確保在各種環境下的最佳性能。
在高速資料傳輸和系統限制(如熱管理和能源效率)之間取得平衡,是一項複雜但必要的任務。這些知識對於想在這個快速進步的產業中保持領先的設計者與工程師十分重要,特別是在PCIe 6.0和PCIe 7.0規範即將到來之際。瞭解這些趨勢並預測未來,是保持競爭力的關鍵。
儲存應用中的PCIe整合與系統吞吐量的挑戰
資料儲存產業快速發展,對更高容量和更快存取的需求不斷增加,也為系統單晶片(SoC)設計人員帶來重大挑戰。本文的目的是提出因應這些挑戰的策略,幫助SoC設計人員有效應對資料儲存技術的進步。這些挑戰包括:
外觀尺寸整合:
SoC設計者必須解決PCIe與各種儲存設備外觀尺寸整合的問題。這一挑戰涉及設計可靈活調整的PCIe鏈路寬度,並支援多種協議,以確保在不同儲存環境下的最佳性能。
符合產業標準:
要持續遵循電子工業聯盟(EIA)和儲存網路產業協會(SNIA)不斷提出的新標準,是一項重大挑戰。這些標準越來越傾向於為各種不同的外觀尺寸提出標準,而SoC設計需要能夠適應這些變化。
高效能環境:
在資料中心和高效能運算環境中,高度資料處理能力和可靠性至關重要,SoC面臨著功耗、性能及延遲等各式各樣的挑戰。
系統層面限制:
在高速資料傳輸需求與系統層面限制(例如功耗和散熱)之間取得平衡,是一項重大挑戰。而隨著儲存設備外觀尺寸變得越來越小,且功率密度持續增高之下,這一點尤其重要。
有效的熱管理:
在SoC設計中進行創新,以能在小型且高效能配置中進行有效的熱管理至關重要。在企業儲存解決方案和邊緣計算設備中,這是一個特別重要的設計考量,因為這些設備需要高密度儲存和相當大的運算能力。
外觀尺寸標準化帶來諸多優點
標準化儲存裝置外形因素的好處是多方面的,尤其是在伺服器機架、機箱、單元配置和RAID特性等方面:
伺服器機架、機箱和單元配置
從雲端運算和資料分析,到企業IT和高效能運算,許多應用都需要穩健的儲存解決方案。這些應用要求儲存設備能夠隨時互換,以適應不同的儲存需求。而確保這種互通性水平的基礎在於遵循標準化的儲存設備外觀尺寸。
電子工業聯盟(EIA)已制定伺服器機箱尺寸的通用標準,規定寬度為19英寸,高度為1.75英寸。這種統一性使得一個標準的伺服器機架能夠容納多達42個機箱。對於需要單一機箱更大儲存的應用,還提供兩倍高度的伺服器機箱配置,使得單個伺服器機架最多可容納21個機箱。這種標準化的外觀尺寸,允許伺服器機架和機箱的製造商設計出能夠在各種平台上無縫整合的產品。
值得注意的是,雖然EIA標準定義了伺服器機箱的寬度和高度,但並沒有規定深度。這一設計選項預留伺服器機架後方的空間,以容納額外的電纜管理、電源供應器和風扇。要維持有效的散熱,這個空間非常重要,特別是對雲端服務和大數據處理這類高度資料密集的應用。因為在這類應用情境中,伺服器機架通常在高容量下運行。
儲存裝置使用案例
伺服器機櫃和機箱的尺寸標準化,讓維護和磁碟更換變得更容易。儲存設備通常位於每個伺服器機箱的前側,儘管由於不同的機箱設計,其實際位置可能會有所不同。圖1顯示了儲存設備與不同高度的伺服器機箱之間的示意關係。
圖1 不同伺服器單元中儲存設備外觀尺寸標準的使用案例
RAID功能
隨著用戶資料迅速累積,資料中心必須及時擴展其儲存設備的容量。固態硬碟(SSD)的出現,標誌著儲存技術從磁碟轉向半導體的重大轉變。這一變化不僅維持相當的儲存容量,還承諾未來有顯著擴增儲存容量的潛力。此外,這一轉變還同時帶來性能的顯著提升,以及支持更大的儲存容量。
然而,由磁碟儲存轉向半導體儲存(主要是使用NAND Flash),對資料的可靠性產生了影響。在系統層面下,納入磁碟陣列(RAID)架構(圖2),以實現磁碟級的資料保護是提升資料保護的一種有效方法。RAID-0模式透過並行儲存資料,以提高存取性能,而 RAID-1 模式則透過資料的重複儲存,以提高資料保護的等級。RAID-0 / RAID-1 各自代表了資料吞吐效能與資料保護的兩種不同設計考慮。另一方面,RAID-5模式藉由在儲存空間內嵌入錯誤修正功能,當一個磁碟故障的情況下,仍然可以維持資料的正確性。並且在RAID-5系統中,可存取的用戶資料空間比例一開始是66.67%,並隨著添加更多磁碟而增加可存取的用戶資料空間。
RAID-6模式更進一步將兩種不同的錯誤修正整合進儲存空間中,並允許在兩個磁碟失效的情況下進行資料恢復。在這裡,可存取的用戶資料從50% 開始,隨著更多磁碟加入RAID-6系統而上升。
RAID-50是一種多層次的方法,它將兩個RAID-5子系統結合形成RAID-0模式。這不僅透過ECC演算法為用戶資料提供更多保護,並同時兼顧資量的系統吞吐量,使影響降到最低,達成了資料保護和系統性能之間的平衡。然而,當需要同時使用更多儲存設備時,決定採取何種方案時,必須做出妥協。
圖2 RAID模式
儲存設備外觀尺寸的新興趨勢與標準
對於儲存設備的外觀尺寸,業界越來越偏好小型化的設計。這一轉變帶來了幾個關鍵的系統設計考量:
1. 在單一伺服器單元中同時安裝更多儲存設備的需求
2. 機箱設計需要能夠提供更高的功耗供給能力以及更強的散熱能力
這些不斷變化的需求,提供了獨特的機會給各種低功耗新設計方法、先進半導體製程的創新,以及用於改善散熱的新材料開發,。
外觀尺寸的類型
儲存網路產業協會(SNIA)涵蓋了各種儲存主題。它曾與SATA-IO合作制定SATA硬碟形狀標準,包括U.2和U.3。然而,由於對傳輸介面的吞吐量需求不斷增加,目前PCIe已正式取代SATA,成為主流的儲存標準。PCIe不僅在各種介面世代中提供更高的資料傳輸速率,還通過多鏈路寬度架構實現系統吞吐量的提升。
目前市場上存在許多不同的儲存裝置外觀尺寸標準。瞭解不同的應用需求對於確定使用哪種形狀規範非常重要。PCI-SIG,作為PCIe標準的主要維護者,已定義以下儲存裝置形狀規範:
• PCIe m.2:為用戶端儲存應用而設計,其體積更小、重量更輕,可支持由電池供電的場景,以提高設備的可移動性
• EDSFF:專為資料中心儲存應用而設計,具有更大體積,以容納更多儲存材料。為支援熱插拔功能,另需要一個帶有屏蔽外殼的模組。表1為EDSFF標準的重點摘要。

PCIe讓資料傳輸更快更完整
在PCIe架構下,如果要提升性能,採用多鏈路寬度的做法,往往比開發新的PCIe標準更有效、更簡單。這種方法在確定最佳化的PCIe連接寬度配置方面,扮演著關鍵角色,特別是針對像EDSFF這類的標準化儲存外觀尺寸。
EDSFF具有三個專用的金手指插槽,各自支持不同的操作需求(圖3),對於定義SSD SoC的PCIe介面連接鏈路寬度規範至關重要。在確保設計符合最新儲存設備標準的同時,也具備技術先進性和性能最佳化。
圖3 對於PCIe介面鏈路寬度的考量。出處:對EDSFF硬體形狀標準的演變和趨勢的初步討論
支援多種介面標準
目前市場上存在各式各樣的儲存介面標準,每種標準都需要在儲存設備中使用更寬的金手指插槽。這一要求讓儲存設備外觀尺寸小型化的目標,變得更具挑戰性,然而這對於系統層面來說,小型化是非常重要的設計目標。
為解決這個問題,業界提出一個簡單的解決方案:採用支持多種介面標準的統一引腳配置。透過在連接器中整合額外的邊帶(Sideband)編碼信號,使得這一策略進一步得到實現(圖4)。這些信號使儲存設備能夠自主識別並適應當前使用的具體介面標準,從而在系統設計中最佳化相容性和效率。
圖4 U.2/U.3連接器演變。摘自《SFF-8639 Rev 1.1的通用x4鏈路定義規範》,2018年5月28日。
通過雙埠PCIe確保資料完整性
資料中心的首要任務是確保所有用戶資料的可靠性,並讓經過認證的最終用戶更容易存取資料。因此,資料完整性不能僅依賴於儲存設備本身,還需要更高層次的保護,例如對單一儲存設備的多重訪問路徑,以避免任何意外的資料路徑損壞,如圖6所示。在資料中心的應用環境中,雙埠PCIe(圖5)已成為一項必要條件。
圖5 雙埠PCIe連接的系統級區塊圖
如圖6所示,額外的側帶信號也存在於儲存設備本身的連接器上,以檢測主機的預期操作模式。當預期的操作模式為雙埠PCIe時,接口標準從單鏈路全鏈寬配置切換為雙鏈路半鏈寬。在下一次開機循環之前的整個操作期間,雙鏈路必須獨立運作,不受其他PCIe鏈路操作的影響。
圖6 U.2/U.3連接器。資料來源:於快閃記憶體高峰會發表的《新興PCIe SSD客戶端和企業配置》
為了實現雙埠PCIe連結的最佳性能,仔細考量PCIe邊帶信號十分重要。這些考量超越了PCIe IP模組本身,並涵蓋更廣泛的系統操作需求。該實施有助於確保整個系統經過調整,可以有效處理這些側邊信號(圖7、圖8)。
圖7 PCIe雙埠重置處理區塊示意圖
圖8 PCIe雙埠參考時脈處理區塊示意圖
鏈路寬度和鏈路速度的最佳配置以提升系統效能
PCIe鏈路寬度的配置可以通過儲存設備的外觀尺寸連接器輕鬆決定,但還有一個重要的因素需要考慮:速度。在瞭解如何選擇合適的PCIe鏈路速度等級之前,必須優先考慮附加快閃記憶體陣列的整體性能。
影響NAND Flash傳輸速率的標準有很多,但最重要的規則是更多的NAND Flash將具有更高的輸出,這又回到儲存設備的外型標準。較大尺寸的儲存設備將擁有更多的NAND Flash封裝數量,從而支援更高的資料處理能力並滿足PCIe鏈路的要求(圖9)。在這種特性要求下,鏈路速度等級和寬度的配置可以基於有意義的理由來確定,而不僅僅是對市場需求的反應。
圖9 多儲存裝置外觀尺寸的元件放置範例
強化熱管理
散熱對於資料中心的儲存裝置變得越來越重要,尤其當單一伺服器機箱整合更多儲存裝置,以因應激增的全球用戶資料量的情況下,每個儲存裝置的電源供應預算與散熱的平衡,變得比以往更加重要。新思科技(Synopsys)的PCIe IP為各種應用領域的多樣化需求提供解決之道,優先考慮設計者認為最具挑戰性的那些需求。此外,越來越強調發展協同設計策略,利用新思科技廣泛的IP產品組合,以完整的解決方案有效地滿足全面的系統級需求。
規格需求快速演變 善用IP為成功關鍵
在快速發展的資料儲存產業中,SoC設計工程師面臨許多挑戰,這主要是因為對於在各種儲存環境中提供更高容量和更快存取速度的需求不斷增加。這些挑戰包括將PCIe介面與各種儲存設備外觀尺寸整合、遵循不斷發展的產業標準,以及管理系統層面的限制,如散熱效率和功耗。要在提高資料處理能力與更小、功率密度更高的儲存設備的物理限制之間找到平衡,成為越來越艱鉅的挑戰。這是現代資料中心中的一種常見趨勢。
新思科技提供的PCI Express解決方案包括支援最新PCIe規範,涵蓋六代的控制器加上IDE安全模組、PHY和驗證IP,解決PCIe鏈路寬度和多協定支援的問題,確保不同儲存環境間的相容性。這種適應性對於SoC設計者來說十分重要,因為他們需要適應不斷變化的儲存技術。此IP能夠支持雙埠PCIe配置,對於確保資料中心應用中的資料完整性和可靠性尤其有利。
此外,在維持高資料處理能力的同時,滿足系統層級的設計限制(如熱管理和能源效率),對當今高效能運算環境來說也是不可或缺的。透過提供一個符合當前市場需求及未來趨勢的綜合解決方案,新思科技為晶片設計提供一條低風險的成功途徑,幫助SoC設計者有效解決現代儲存解決方案的複雜性。
(本文作者為新思科技首席工程師)