近日,全球矚目的NVIDIA GTC大會如期舉行,作為AI時代的數(shù)字化解決方案領導者,紫光股份旗下新華三集團深度參與此次盛會,并發(fā)表了題為《AI 2.0時代的算力基礎設施》的演講,深入探討了AI產業(yè)高速發(fā)展下算力基礎設施的新需求、新挑戰(zhàn),以及大模型技術演進帶來的算力技術變革,并分享了新華三應對變革提出的AI算力領域的創(chuàng)新解決方案。
全新趨勢引領算力變革
關于AI技術發(fā)展對算力基礎設施的挑戰(zhàn),新華三云與計算存儲產品線資深產品專家馮良磊在演講中指出,AI發(fā)展新階段的核心特征在于其“通用性”和“創(chuàng)造性”,AI不再僅僅是解決特定問題的工具,而是能夠處理多模態(tài)信息、生成內容,甚至進行跨模態(tài)工作的“認知型AI”。這一變革對算力基礎設施的計算、存儲、網(wǎng)絡以及能耗等各方面,提出了更高、更復雜的要求。
面向新的階段,算力需求呈現(xiàn)出爆發(fā)式增長,隨之而來對電力的需求呈現(xiàn)了指數(shù)級增長,網(wǎng)絡需求增長了上百倍,存儲需求更是激增了上千倍。未來,算力需求可能還將增長上萬倍。面對如此巨大的需求,構建大規(guī)模、高性能的算力基礎設施成為了行業(yè)必然趨勢。
算力基礎設施的新需求與挑戰(zhàn)
? 算力的可擴展性與穩(wěn)定性:大模型的訓練需要處理海量數(shù)據(jù),模型參數(shù)動輒達到數(shù)百億甚至上千億,傳統(tǒng)AI模型的算力需求已無法滿足。
? 存儲性能與容量的提升:大模型的訓練和推理需要快速訪問和處理海量數(shù)據(jù),存儲系統(tǒng)的帶寬和延遲直接影響了整個計算任務的效率。
? 資源調度的智能化與高效性:大規(guī)模AI集群通常包含數(shù)百甚至數(shù)千個節(jié)點,如何智能分配資源、避免浪費,成為了開發(fā)者面臨的重要問題。
? 系統(tǒng)穩(wěn)定性與安全性:大模型的訓練周期長,任何中斷都可能導致巨大的時間和成本損失,系統(tǒng)的穩(wěn)定性和安全性至關重要。
? 能源效率的提升:大規(guī)模計算集群的能耗和散熱問題日益突出,如何在保證高性能的同時降低能耗,成為了行業(yè)關注的焦點。
算力×聯(lián)接,加速邁入AI新時代
面對新的挑戰(zhàn),新華三提出了“算力×聯(lián)接”技術理念,旨在通過多元異構的算力解決方案,構建完整的AI基礎設施生態(tài)。馮良磊在演講中介紹了新華三在算力、存儲、網(wǎng)絡等領域的創(chuàng)新產品與技術。
1.多元算力平臺:H3C UniServer R5500/R5300 G7系列
服務器,支持靈活配置,兼容超過70款AI加速卡,能夠滿足從推理、微調到訓練等多種復雜應用場景的需求。
2.高效存儲系統(tǒng):基于新華三下一代AI存儲——Polaris X20000系列全面重構存儲軟件棧,通過軟硬件協(xié)同創(chuàng)新,單節(jié)點實現(xiàn)200萬IOPS,以及百TB級帶寬,為AI大模型訓練提供所需要的超強性能和極致穩(wěn)定,并通過協(xié)議融合,實現(xiàn)跨協(xié)議無損訪問,進一步簡化AI數(shù)據(jù)存儲基礎架構。
3.智能網(wǎng)絡調度:新華三的SeerFabric無損網(wǎng)絡技術,支持大規(guī)模GPU集群的高效穩(wěn)定運行,顯著降低了運維復雜度,確保了網(wǎng)絡的高效調度和管理。
4.全棧液冷解決方案:為了應對大規(guī)模計算集群的散熱問題,新華三推出了全棧液冷解決方案,顯著降低了能耗,幫助企業(yè)構建更加綠色、高效的算力基礎設施。
新華三始終秉持開放、多元的生態(tài)合作理念,致力于與上下游合作伙伴共同推動AI技術的發(fā)展。新華三的傲飛算力平臺、綠洲數(shù)據(jù)平臺和靈犀使能平臺,為開發(fā)者提供了高效、易用的AI開發(fā)環(huán)境,幫助更多企業(yè)和開發(fā)者輕松接入AI 新時代。未來,新華三將繼續(xù)與全球合作伙伴攜手,以“精耕務實,為時代賦智慧”的理念,共同推動AI技術的進步,助力千行百業(yè)實現(xiàn)智能化轉型。
昵稱 驗證碼 請輸入正確驗證碼
所有評論僅代表網(wǎng)友意見,與本站立場無關