6月27日,以“未來先行(Future First)”為主題的2024年世界移動通信大會上海站(MWC上海)持續火熱進行中,來自全球的行業領袖和創新先鋒齊聚一堂,碰撞思想火花。紫光股份旗下新華三集團云與計算存儲產品線副總裁、產品支持與解決方案部總經理武家春受邀出席“構建人工智能就緒基礎設施”主題峰會,并發表“算力 x 聯接,讓未來更智能”的主題演講,深入闡述了新華三如何構建面向智算的基礎設施建設思路和技術布局。
AIGC大模型的快速進化極大地推動了行業應用創新和生產效率的提升,隨之而來的是算力需求呈現爆發式增長,全球范圍內正在掀起智算數據中心建設熱潮。因此,如何構建更強大高效的智算基礎設施,推動算力產業高質量可持續發展,成為各行業關注的焦點議題。對此,武家春在演講中深度詮釋了新華三集團“算力 x 聯接”技術理念,圍繞算力多元高效、聯接標準靈活兩方面深刻剖析了兩者深度融合所帶來的倍增效應和技術優勢。
“依托算力 x 聯接技術理念,新華三致力于算力、存力、運力的協同演進及數據價值的升華,為大規模人工智能計算提供可持續發展的高效解決方案。”
新華三集團云與計算存儲產品線副總裁、產品支持與解決方案部總經理武家春
必一運動官網
會上,武家春分別從算力多元化、調度統一化、存儲智能化、數據標準化四個方面向與會嘉賓分享了新華三對開放多元算力的建設思路:
算力多元化:H3CUniServer系列服務器為AIGC提供澎湃算力支持
● 多元異構,開放包容:打造多CPU平臺,并支持10+種AI加速卡;滿足不同場景需求,提升供應鏈供給保障
●擁抱OAI規范,互聯標準化:采用OAM標準適應不同GPU的功耗需求,提供GPU互聯高帶寬定制化設計,滿足不同互聯帶寬需求
●CXL演進,存算分離:內置CXL異構資源池,內存池(10TB+),提供數據低時延無損共享,為業界提供機柜級內存資源多機彈性管理解決方案
●異構算力統一智能調度:實現多元CPU和GPU異構算力統一調度;通過自研統一集合通信庫UCCL,有效提升23%算力;支持萬卡規模集群的算力調度
●AI業務調優:集成多種模型框架及工具,提供對AI大模型訓練/微調/推理全流程開發服務的高效支撐
●大規模智算中心運維:以業界領先的1天內自動化算力方案開局;提供高可靠算力任務保障,3秒內故障檢測,5秒內自動隔離,10秒內啟動算力替換,分鐘內恢復業務
●極致性能提升:單節點支持百萬級IOPS和50GB/s l/O帶寬,實現了120%的性能提升
●GPU數據直通:主流GPU廠商完成GPU直通方案,單GPU性能提升50%以上
●更低TCO:超高空間利用率(94%),大容量高密節點,更低能耗,整體TCO降低超過20%
●智能分層:基于深度學習技術,通過AI算法分析應用指紋,緩存命中率提升20%以上
武家春表示,新華三集團的算力產品和解決方案通過不斷升級進化和應用優化,打出一套算力服務的組合拳,為百行百業的用戶提供算力多元化、調度統一化、存儲智能化和數據標準化精細服務。
武家春表示,在算力聯接方面,新華三目前已實現聯接標準化和組網靈活化。通過以太網統一GPU服務器節點間網絡連接,可實現集群Scale out;依托OAM+高速聯接可實現集群內部高速域Scale up;并且服務器內/外聯接標準達成歸一化,有助于構建異構GPU智算集群,降低算力部署和應用的成本。
組網靈活方面,新華三所提供的S12516、S98系列、S12516+S98系列智能交換機可分別實現單框單層組網、盒-盒兩層組網、框-盒兩層組網等模式的靈活組網,提升網絡帶寬的利用率至95%,將網絡的故障收斂時間降低至微秒級。
同時,在綠色節能方面,新華三全棧液冷解決方案,為數據中心的綠色發展提供了創新思路。新華三液冷整機柜方案將計算密度提升240%,實現運維免手動,全盲插快接。箱式浸沒和油類浸沒方式可適配傳統機柜,解決浸沒部署難題,突破油冷散熱瓶頸。全冷板系統實現 0.3W以上熱敏部件全覆蓋,集中式冷板設計實現I/O熱插拔。兩相散熱采用冷凝回流設計,液體循環使用散熱效率提高70%以上。新華三圍繞國家“雙碳”戰略的實施,踐行可持續發展理念,依托全棧液冷的技術路線,為客戶提供高效節能、綠色低碳的全套方案。
通過多元化算力和標準化聯接的深度融合,新華三集團能夠更靈活極致地調度和釋放算力,給模型的訓練、推理帶來更高效、更穩定的支持,為迎接不斷變革的未來做好充分的準備。作為AIGC時代的數字化解決方案領導者,未來,新華三將持續深化“AI in ALL”技術戰略,并加速推進“AI for ALL”行業賦能戰略,充分發揮“算力×聯接”的倍增效應,為數字經濟發展貢獻不竭力量!