智慧物聯網時代來臨,固態硬碟(SSD)應用於消費電子、伺服器、工業電腦等,需求強勁且大幅攀升。工業電腦系統儲存裝置已擺脫機械式傳統硬碟,全面換上固態硬碟以因應各種嚴苛應用環境與使用情境,舉凡精簡型電腦、嵌入式POS端點受付機、售票機、運輸交通閘口、互動式資訊站、電子廣告看板、交易自動提款機、智慧醫療儀器、網路交換機、訊號基地台及終端感測器等大大小小的工業電腦,針對特定的應用執行同一種任務,需求容量不高,期待穩定的效能與長時間運作,因此固態硬碟對於各種工業領域應用,能提供高效能與穩定運作極為重要,工控固態硬碟模組廠需深入了解各種應用帶來的挑戰,提供適合該應用的固態硬碟儲存裝置。
3D NAND可靠度挑戰 控制器硬體韌體扮要角
固態硬碟中重要的關鍵零組件即控制器與快閃記憶體,控制晶片業者也加速布局更高效能且更可靠的設計,從SATA傳輸介面邁向新一代PCIe傳輸介面。除了介面的推進外,增加核心處理器與先進資料處理技術對於高階製程的快閃記憶體也越顯重要,快閃記憶體製程走向3D堆疊結構製程,近年來也相對成熟。過去十幾年快閃記憶體2D平面記憶單元結構不斷的進行製程微縮來到近10奈米製程,其位元成本與可靠度受到挑戰,需從平面製程轉向立體堆疊設計,因此快閃記憶體採取先進3D立體堆疊技術,堆疊技術從32層、64層到92/96層記憶單元。除了堆疊層數增加,快閃記憶體存取單元從SLC(1Bit per Cell)、MLC(2Bit per Cell)、TLC(3Bit per Cell)、QLC(4Bit per Cell),甚至未來OLC(8Bit per Cell)邏輯資料設計,以提高單晶片儲存單元的容量並降低生產製造成本。
3D快閃記憶體相對於2D快閃記憶體其可靠度需要多項技術來解決,而控制器晶片設計需要針對3D快閃記憶體投入更多技術解決方案包含資料ECC處理能力與資料管理韌體架構等。由於快閃記憶體採3D堆疊結構設計,以TLC為例,其快閃記憶體特性上在TLC Mode上位元錯誤率(Error Bit)相對容易發生,隨著抹除與寫入循環累積,會使得位元錯誤率逐步升高,約莫30至80位元錯誤率。到了抹除與寫入循環末期會明顯的急速上升,由於3D NAND設計是以堆疊結構,可能產生位元錯誤的機率除了Cell本身外,結構上Bit-line與Bit-line、Bit-line與Word-line及Word-line與Word-line交互影響下可能產生不同範圍的位元錯誤率,需要更好的先進ECC處理與韌體架構來解決。
因應3D NAND需設計更強化的ECC處理糾錯保護機制LDPC(Low-Density Parity-Check)可進行多階段硬體解碼與軟體預測解析糾錯能力,提高修正位元錯誤能力,保持資料的正確性。當讀取資料發生UNC(Uncorrectable)位元錯誤時,進入ECC錯誤處理機制,首先進入硬體解碼嘗試修正錯誤位元,同時會加入快閃記憶體的Read Retry的機制,調整快閃記憶體記憶單元解譯電壓準位以得到正確的資料。其ECC硬體解碼與快閃記憶體Read Retry過程會進行多次資料修正解析,若此階段機制仍然無法解析正確資料,隨即進入軟體錯誤修正機制,以預測模擬調整模式,試著解析正確資料,通常會需要較久時間處理。針對應用資料要求較高的情境,亦可採用DATA RAID模式做大範圍資料存取保護的韌體架構,也就是當整個LDPC ECC錯誤保護機制仍無法解析資料時,最終會進入DATA RAID模式的錯誤資料解析試著解決,以提高資料的可靠性(圖1)。
由於3D NAND製程與疊構設計不同於過往的2D NAND製程及設計,採用堆疊更多層數方式來提高容量,設計上可以解決2D NAND因製程微縮造成的電子干擾及資料發生錯誤率,在成本上可以有較佳的優勢。因為立體疊構使得每個單位區塊(Block)的寫入頁(Page)數量增加,意即每單位區塊容量變大,在相同單晶片快閃記憶體容量下,3D NAND運作的區塊數會比2D NAND運作的區塊數較少。當隨機寫入負載大時,間接影響到碎塊處理效率,其垃圾資料回收GC(Garbage Collection)效能相對較差,有可能產生較長的延遲(Latency)。工控模組廠針對搭載3D NAND固態硬碟模組導入超容量(Over Provisioning)快取技術,降低LBA可定址容量以保留約7% NAND區塊容量做為超容量快取,讓韌體在區塊管理上有較高的彈性,此技術可降低GC負載提高處理效率,進而提升尖峰資料流量時整體存取效能。GC效能提升後也順勢降低了寫入放大率,寫入放大率直接影響固態硬碟的使用壽命,其越低可延長更長的使用壽命。
工控市場的系統及儲存裝置相當重視整體的使用週期,導入超容量(Over Provisioning)快取技術可提升效能與增加耐用性,有助於延長固態硬碟壽命。當然有部分使用者會對於可見的容量縮小,而有所抱怨,但事實上固態硬碟仍然會將資料平均的寫入所有區塊容量。一般來說工控平台的作業系統與資料寫入並不會完全寫滿整個容量,因此超容量(Over Provisioning)快取技術減少的可定址容量並不會對實際應用有影響。
固態硬碟一直以來大量的使用快閃記憶體(NAND Flash)做為儲存媒介,其優異的儲存特性,衍生各種介面的儲存裝置如PATA固態硬碟、SATA固態硬碟、USB隨身碟、SD卡等移動式儲存,NAND製程逐步的微縮與3D疊構製程成熟,NAND Flash的傳輸速度也不斷提升,從Legacy傳輸到Toggle/ONFi模式傳輸,將傳輸頻率提升至800Mbps及1,200Mbps。
3D NAND製程漸穩定 效能推升PCIe SSD商機
SSD固態硬碟模組技術發展趨勢,因應傳輸效能從SATA單通道傳輸介面走向PCI Express多通道傳輸介面,逐步提升介面傳輸頻率與通道頻寬達到更高的存取效能。PCI Express介面技術已經發展多時且已應用於各種的傳輸設備,SSD固態硬碟順勢加入了PCI Express介面技術,藉由PCI Express傳輸規格來提升資料存取速度,有助於PCIe固態硬碟逐步放大儲存裝置在各應用的占有率,消費性電子裝置、工控平台應用及伺服器雲端系統等也已採用PCIe固態硬碟作為系統儲存裝置。但因傳輸效能大幅提升,進而導致各控制器與模組廠需要解決溫度效應的問題。
PCI Express固態硬碟在傳輸頻率、傳輸頻寬及NVMe優異的驅動下,不斷的突破提升傳輸速度,固態硬碟以PCIe Gen3規格為市場主流,而PCIe Gen4控制器設計已完成,也蓄勢待發等待市場成熟。
高速傳輸效能提升 散熱方案競相出籠
PCIe Gen3基本的單一通道傳輸速度1GB/sec,一舉突破目前市場上儲存裝置的主流SATA Gen3(6Gbps)介面傳輸速度600MB/sec,PCIe增加匯流排傳輸通道可以使得速度再加倍,效能倍數提升,其PCIe Gen3×2頻寬效能達2GB/sec,而PCIe Gen3×4頻寬效能可達4GB/sec。通常工業電腦應用需求會採用PCIe Gen3×2與PCIe Gen3×4規格固態硬碟做為儲存裝置,部分工業電腦嵌入式系統,因系統空間考慮會採無風扇設計,同時要求高效能下多半會以PCIe Gen3×2的固態硬碟為考量。PCIe高頻寬、高效能的運作下,會帶來無可避免的熱源產生,且以工業電腦系統可能長期處於嚴苛高溫環境,也讓整個系統及固態硬碟的溫度升高(圖2)。
隨著環境溫度的升高亦會讓PCI Express固態硬碟整體溫度升高,其中最重要的控制器產生的熱源會最高,連帶升高快閃記憶體運作的溫度,可能會影響固態硬碟的運作與儲存資料的可靠度。為了維持固態硬碟的正常運作與保護儲存於快閃記憶體資料,控制器韌體運作必須採取抑制熱源的產生,而降低運作頻率與效能可減緩熱源的產生。PCIe固態硬碟必須要在速度效能與溫度熱源之間取得平衡,內建多個溫度感測元件,即時感測各零件及裝置溫度變化,透過韌體設計智慧溫控調頻技術(Thermal Throttling Technology),收集內建多溫度感測元件,監控固態硬碟內部溫度變化,基於保護重要零件快閃記憶體內資料儲存可靠性,透過溫控演算法換算可控溫度。當可控溫度到達一定的溫度門檻(TMT1)時,控制器韌體必須採取「輕載調頻降速」技術,試著減少熱源再產生以維持固態硬碟內部運作溫度,避免影響系統正常運作及保護儲存資料。但若環境溫度或可控溫度還是持續升高,且可控溫度達到下一階段門檻(TMT2)時,此時必須進入下一階段溫度調控,進行「重載調頻降速」技術,以最低速度進行運作減少溫度帶來的資料可靠度影響。
當環境溫度及可控溫度下降時,固態硬碟控制器韌體透過即時溫度監控,當可控溫度下降達一定的溫度門檻(TMT0)時,隨即啟動智慧調頻升速技術,且採取緩升速方式避免影響持續運作,讓固態硬碟效能恢復高速運作。智慧溫控調頻技術可以針對當固態硬碟處於極高溫環境下時,採取抑制熱源技術,可提供多一層資料安全的保護機制(圖3)。
PCI Express固態硬碟除了抑制熱源透過溫度調頻技術外,快速散熱方案也可改善熱的問題,透過外加材質對流散熱設計,如不同散熱材質選用或鰭片機構設計等,將產生的熱源經由熱傳導、熱輻射及熱對流散出。不同散熱材質銅、鋁、石墨烯、陶瓷等,各具有不同的散熱能力,散熱能力也因為不同的組合達到不同的效果,但搭載在固態硬碟上也必須考量成本價格及空間干涉等問題。
一般PCIe固態硬碟為了達到散熱效果,會設計單一散熱片並覆蓋於所有零件上,以進行大面積的散熱,但因為固態硬碟上的兩個主要零組件控制器與快閃記憶體其產生熱源的速度不同,且耐受的溫度效應也不同,其中,最為敏感的元件為快閃記憶體,也是主要資料儲存的元件,單一片式的設計易導致高熱源元件傳導至低熱源元件,直接影響讓快閃記憶體增加多餘溫度熱源。為解決此一問題,工控儲存模組採用是熱源分流技術即獨立散熱方式,讓不同元件各自透過散熱材質進行熱傳導、熱輻射及熱對流等路徑快速散熱,此設計可以避免高熱源控制器元件傳導至較低熱源快閃記憶體元件,保護重要的資料儲存元件避免非必要的熱堆積效應。
工業儲存應用要求日益嚴苛,固態硬碟在工控應用的需求也急速攀升,3D NAND快閃記憶體製程成熟,帶動PCIe固態硬碟的效能與應用,控制器與工控固態硬碟模組廠持續的開發先進固態硬碟技術,發揮PCI Express固態硬碟儲存裝置高速傳輸效能與可靠的資料儲存
(本文作者為宇瞻科技研發暨技術中心技術總監)