雲端資料儲存與處理的費用是機器學習(ML)應用的門檻之一,而在邊緣端進行運算則可能導致電力消耗上升。RISC-V處理器陸續問世,帶來運算效率高且功耗低的全新方案,有望推動ML應用運行於邊緣端的發展趨勢。
許多甫接觸機器學習(ML)領域的新手很快就會發現,雲端資料儲存與處理所費不貲。許多組織試圖透過採用本地基礎設施處理ML工作負載的方式來降低成本,但即便如此,這些本地資料中心仍可能需要付出如電力消耗增加等代價,在規模較大的情況下尤其如此。電力消耗增加,意味著電費支出更高,同時還會引起設備散熱問題,並影響永續發展進程。
不論是在雲端或是本地處理ML工作負載,所需成本皆與樞紐中心接收的資料量直接相關。要解決這個問題,就必須在資料抵達之前,運用邊緣運算系統,儘可能在靠近資料採集點處進行資料篩選。
當然,邊緣運算系統本身也必須節能,才能證明有轉換的必要。新一代的RISC-V處理器恰在此時悄然面世,在每單位性能的功耗效率上,是基於其他指令集架構(ISA)裝置的三倍。
邊緣ML中的RISC-V:指令更少、功耗更低
ML結合邊緣運算,賦予智慧設備自主決策及即時適應的能力。這種資料處理層級的需求與RISC-V處理器技術的進展不謀而合,後者已廣泛應用於以下連接邊緣的應用場景:
.穿戴式設備:配備RISC-V處理器的健身追蹤器能在裝置上辨識活動並監測健康狀態,即時向用戶提供個人化解析和回饋。
.智慧建築:RISC-V處理器已應用於建築自動化裝置,這些裝置可以用於進行即時進行物體偵測、異常辨識、智慧自動化及安全相關應用。
.機器人:裝有RISC-V處理器的工業機器人能進行即時影像處理和物體辨識,進而適應變化莫測的環境,並自主完成複雜任務。
RISC-V將持續在此類及其他應用案例的轉換中發揮關鍵作用,部分原因是RISC-V具備開放、標準化的ISA及高運算效率,可簡化複雜AI演算法在邊緣裝置上的實作。優秀的運算效率源自RISC-V架構最根本的核心要素:指令集。
RISC-V建立於簡化的ISA之上。這種架構能提供一組基本的整數指令(RV32I或RV64I),並允許處理器設計人員因應各式各樣的應用需求而納入選擇性擴展功能,其中兩項關鍵擴充功能大幅提升了RISC-V處理器的ML運算效能:
- 向量擴充功能(V):這項擴充功能提供了向量運算支援,為高效矩陣乘法和許多ML演算法中基本運算的根本元素。向量擴充功能允許處理器同時對多項資料元素進行多重運算,藉以大幅提高性能。
- 壓縮擴充功能(C):這項擴充功能引進了壓縮指令,讓編碼需要的位元數更少,進而達成更小的代碼規模,占用的記憶體資源也較少,對於記憶體資源有限的邊緣裝置來說是一大優勢。
透過這些擴充功能,RISC-V處理器能在執行ML工作負載時兼顧高性能與高效率,例如RISC-V處理器IP公司SiFive便運用向量擴充功能及其他微架構創新,實現了較競爭方案高出30%至40%的功耗效率[1]。
實際上,有研究顯示,RISC-V裝置的指令平均周期數(CPI)常常展現出比多數現有指令集架構更佳的表現。此處的CPI為執行一項指令所需的平均時鐘週期數[2]。這些測試顯示,RISC-V裝置能在維持熱效率的同時,更長時間地執行複雜的ML任務。
用於邊緣ML的RISC-V工具
RISC-V的模組化ISA可為開發小巧節能的處理器帶來顯著效益。簡單的指令集有助於優化設計、減少晶片設計及驗證花費的時間,並且可降低成本,也能夠降低功耗。要將這些優勢充分發揮在終端系統,最終仍須仰賴開發人員。RISC-V技術能迅速應用在邊緣運算,則可歸功於開放標準處理器硬體相關的軟體及工具生態系統的同步成長。
目前廣受歡迎的編譯器(包括LLVM及GCC)均已支援RISC-V。這種普及度能確保所生成的程式碼能夠針對目標處理器進行優化,包括對ISA擴充功能的使用。同時,TensorFlow及PyTorch等流行架構正逐漸移植到RISC-V,嵌入式軟體公司也正在貢獻出自身的ML程式庫、架構和中介軟體。
例如,Antmicro及Google Research攜手針對RISC-V型邊緣ML應用提供了快速原型設計和前矽階段開發方案,由Antmicro的Renode模擬架構和Google Research的Kenning裸機運作環境組成(圖1)。這種合作方案能夠在模擬的RISC-V硬體之上運行ML模型,進而協助開發人員加速工程生命週期。最終,此類模擬架構將讓業者能夠在投入鉅資製造矽晶片之前,對整個技術堆疊加以進行評估和優化。
當然,無論是RISC-V或ML開發工具,都還有很大的改善空間。隨著這些生態系統並行發展,仍有需要克服的挑戰,包括:
.成熟度:與成熟架構相比,RISC-V仍是較新的生態系統,因此資深開發人員較少,可取得的工具和程式庫也較為有限。
.標準化:儘管RISC-V International為供應商之間提供了合作和創新的基礎,但在開放式生態系統中,可預期實作方式將呈現多元化發展,可能因此埋下架構碎片化及相容性挑戰兩大隱憂。持續努力完善標準是維持順暢及統一開發流程的關鍵。
.硬體取得容易度:目前市場上專為ML任務量身打造的商用RISC-V處理器選擇仍然不多。不過,若需求持續增加,硬體市場也將同步茁壯成長。
解決上述挑戰亟需產業領袖、研究機構及開放原始碼社群的合作和投資。由於我們沒有理由相信產業或開放原始碼和開放標準社群會停止投資RISC-V生態系統,自然也沒有理由認為RISC-V技術在節能邊緣應用的進展會戛然而止。
RISC-V開創邊緣ML未來
從實作角度來看,精簡指令集電腦(RISC)與複雜指令集電腦(CISC)雙方的辯論幾乎已經成為過去。現在,CPU的效能和性能主要由微架構決定,而微架構的執行則依靠ISA及生產實體晶片所採用的製程技術。
隨著RISC-V和邊緣ML市場逐漸成長,我們將繼續目睹硬體創新和益發專業化的RISC-V處理器。這些處理器可能會包含專用加速器、優化的記憶體架構和其他功能,以提高執行ML工作負載的整體性能與效率。
這些新增功能將持續擴大RISC-V邊緣裝置的應用範疇,為其在從智慧家庭和醫療裝置到工業自動化系統和自動駕駛車輛等一切領域的部署披荊斬棘。由於涉及範疇相當廣泛,RISC-V處理器技術仍將是智慧型連結邊緣ML系統的基本元素,而在許多領域的實際應用已經可以看到相關趨勢的發展。
RISC-V生態系統正逐步成熟,開發人員也越來越熟悉這項架構,可期待接下來有更多創新應用出現,拓展應用範疇的極限,推動我們朝向充滿智慧、互聯及高效率創新應用的未來邁進。
(本文作者為貿澤電子特約作家)
資料來源
[1] SiFive website, n.d., accessed February 16, 2024, https://www.sifive.com/.
[2] Wajid Ali. "Exploring Instruction Set Architectural Variations: x86, ARM, and RISC-V in Compute-Intensive Applications," Engineering: Open Access 1, no. 3, (2023):157–162.