Xeon Gaudi 3 英特爾 AI 企業AI AI加速器

英特爾發表Xeon 6/Gaudi 3 搶攻高效能企業AI

2024-10-01
隨著AI持續顛覆各個產業,企業對於兼顧成本效益和可以快速開發並布署基礎設施的需求愈趨成長。因應需求攀升,英特爾推出搭載效能核心(P-core)的Xeon 6和Gaudi 3 AI加速器,強化致力於提供具備每瓦最佳效能且降低總持有成本(TCO)的AI系統。

英特爾AI基礎架構最新進展包括為資料中心產品組合增加兩大產品:

Ÿ Intel Xeon 6搭載效能核心(P-core):專為處理運算密集型的工作負載而設計,並兼顧優異效率。相較於上一代處理器,Xeon 6提供兩倍的效能提升,不僅核心數增加、記憶體頻寬加倍,更將AI加速功能嵌入每個核心。英特爾此款處理器,專為滿足邊緣到資料中心和雲端環境的AI效能需求而打造。

Ÿ Intel Gaudi 3 AI加速器:特別為大規模生成式AI最佳化的Gaudi 3,具備64個張量處理器核心(TPC)和8個矩陣乘法引擎(MME),能加速深度神經網路運算。此外,還包括用於訓練與推論的128GB HBM2e記憶體,以及用於可擴充網路的24個200Gb乙太網路連接埠。Gaudi 3提供了與PyTorch框架、Hugging Face Transformer模型和diffuser模型無縫的相容性。英特爾近期宣布與IBM合作,將英特爾Gaudi 3 AI加速器做為服務布署至IBM Cloud上,期待透過這項合作,客戶在使用AI與擴充AI規模時,能同時強化效能與降低總持有成本(TCO)。

大規模布署AI涉及各種考量因素,包括靈活彈性布署的選項、具競爭力的價格效能比,以及可用的AI技術等。英特爾的x86架構與開放生態系,使其能夠支援企業建構具備最佳化總持有成本(TCO)及每瓦效能的高價值AI系統。值得一提的是,市場上高達73%的GPU加速伺服器是使用Intel Xeon系列處理器作為伺服器處理器(host CPU)。

在生成式AI(Gen AI)解決方案由原型設計推進至量產就緒的過程中,將面臨即時監控(Real-time Monitoring)、錯誤處理(Error Handling)、記錄日誌檔(Logging)、安全性和可擴充性等方面的挑戰。英特爾與OEM廠商和其他夥伴合作,透過共同設計處理這些挑戰,推出量產就緒的RAG解決方案。

這些解決方案建立於Open Platform For Enterprise AI(OPEA)平台之上,將基於OPEA的微服務架構整合至可擴充的RAG系統,並針對Xeon和Gaudi AI系統進行最佳化,其目的為協助客戶整合Kubernetes、Red Hat OpenShift AI和Red Hat Enterprise Linux AI的應用程式。

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!