摘要:中國算力產(chǎn)業(yè)正在上演一場從“單點(diǎn)突破”到“系統(tǒng)致勝”的范式革命。這種將硬件堆疊、算法優(yōu)化與生態(tài)協(xié)同熔于一爐的創(chuàng)新路徑,或許正是破解全球算力困局的中國方案。
7月26日,在2025世界人工智能大會(WAIC)上,華為首次線下展出昇騰384超節(jié)點(diǎn),這也是目前業(yè)界規(guī)模最大的超節(jié)點(diǎn),堪稱“算力核彈”。
在業(yè)內(nèi)人看來,這標(biāo)志著全球AI算力已從單點(diǎn)芯片性能轉(zhuǎn)向大規(guī)模系統(tǒng)效能、生態(tài)構(gòu)建與產(chǎn)業(yè)鏈能力的整合。包括寶蘭德在內(nèi),華為昇騰生態(tài)及算力產(chǎn)業(yè)鏈相關(guān)公司或迎來重大利好。
算力產(chǎn)業(yè)迎來跨越式發(fā)展
隨著大模型在多模態(tài)、推理等領(lǐng)域的性能持續(xù)增強(qiáng),以及智能體開發(fā)工具的成熟,AI產(chǎn)業(yè)正迎來爆發(fā)式增長。數(shù)據(jù)顯示,2025年至2029年中國AI產(chǎn)業(yè)年均復(fù)合增長率預(yù)計達(dá)32.1%,2029年市場規(guī)模將突破萬億。
與此同時,算力需求呈指數(shù)級攀升,2025年中國智能算力規(guī)模預(yù)計達(dá)1,037.3 EFLOPS,到2028年將增長至2,781.9 EFLOPS。然而,算力資源的稀缺性、異構(gòu)算力管理的復(fù)雜性以及高昂的成本成為制約行業(yè)發(fā)展的主要瓶頸。
當(dāng)前業(yè)界一臺算力服務(wù)器通常是8張算力卡,這一臺服務(wù)器就稱為一個節(jié)點(diǎn)。2024年3月,英偉達(dá)率先發(fā)布NVL72超節(jié)點(diǎn),可以把72張訓(xùn)練卡組成一個超節(jié)點(diǎn)。
華為完成了超越。今年4月,華為云發(fā)布CloudMatrix 384超節(jié)點(diǎn)技術(shù),成功實(shí)現(xiàn)超節(jié)點(diǎn)技術(shù)商用。據(jù)介紹,華為昇騰384超節(jié)點(diǎn)由12個計算柜和4個總線柜構(gòu)成,通過MatrixLink高速互聯(lián)技術(shù)將384顆昇騰NPU、192顆鯤鵬CPU全對等互聯(lián),實(shí)現(xiàn)業(yè)界最大規(guī)模的384卡高速總線互聯(lián),算力總規(guī)模達(dá)300Pflops。
這不僅是中國規(guī)模最大的商用超節(jié)點(diǎn),而且是目前已商用的超節(jié)點(diǎn)中,單體規(guī)模全球最大,有效算力全球最高的技術(shù)。英偉達(dá)創(chuàng)始人兼CEO黃仁勛也在接受媒體采訪時表示,華為昇騰CloudMatrix 384超節(jié)點(diǎn),部分性能甚至超過英偉達(dá)產(chǎn)品。
眾所周知,AI訓(xùn)練和推理不能輕易中斷,否則就前功盡棄。為了讓CloudMatrix 384超節(jié)點(diǎn)能夠24小時不停工,華為團(tuán)隊(duì)提出面向整個超節(jié)點(diǎn)的故障容錯方案,分為“系統(tǒng)層容錯”、“業(yè)務(wù)層容錯”,以及后續(xù)“運(yùn)維層容錯”,核心思想就是將故障問題轉(zhuǎn)為亞健康問題,通過運(yùn)維手段優(yōu)雅消除。
據(jù)悉,在昇騰計算平臺的相關(guān)研發(fā)上,華為為此展開了一場橫跨多個部門的萬人“算力會戰(zhàn)”,覆蓋了云計算、模型、底座、芯片、硬件工程和基礎(chǔ)軟件等多個能力領(lǐng)域。
在行業(yè)觀察人士看來,中國算力產(chǎn)業(yè)正在上演一場從“單點(diǎn)突破”到“系統(tǒng)致勝”的范式革命。在摩爾定律逼近量子墻的當(dāng)下,這種將硬件堆疊、算法優(yōu)化與生態(tài)協(xié)同熔于一爐的創(chuàng)新路徑,或許正是破解全球算力困局的中國方案。
業(yè)界普遍認(rèn)為,昇騰384超節(jié)點(diǎn)將加速AI技術(shù)在各行業(yè)的應(yīng)用落地。目前,業(yè)界已基于昇騰適配和開發(fā)超過80個大模型,昇騰聯(lián)合2700+行業(yè)合作伙伴,共同孵化了超過6000+個行業(yè)解決方案。昇騰未來的路徑正變得“越來越開放”。
生態(tài)賦能釋放AI產(chǎn)業(yè)最大價值
在AI技術(shù)飛速發(fā)展的今天,算力已成為推動產(chǎn)業(yè)變革的核心動力,更是AI時代的“永動機(jī)”,唯有通過生態(tài)賦能和產(chǎn)業(yè)鏈協(xié)同,才能釋放其最大價值。
作為華為深度合作的生態(tài)伙伴之一,寶蘭德(688058)長期以來參與共建、共享鯤鵬昇騰產(chǎn)業(yè)生態(tài)。今年5月,在鯤鵬昇騰開發(fā)者大會2025(KADC2025)上,寶蘭德與華為等企業(yè)聯(lián)合發(fā)布鯤鵬RAG解決方案1.0,基于鯤鵬CPU和昇騰NPU、第三方GPU卡,打造包含RAG業(yè)務(wù)編排、AI+微服務(wù)、部署調(diào)度、安全和存儲的開源開放體系,定義企業(yè)級RAG的技術(shù)標(biāo)桿。
不僅如此,寶蘭德還多維展示與鯤鵬、昇騰以及多個華為計算生態(tài)合作的成果。其中,寶蘭德全棧中間件,結(jié)合鯤鵬/昇騰/openEuler創(chuàng)新開發(fā),構(gòu)建全系列中間件產(chǎn)品體系,支持X86/ARM架構(gòu)、傳統(tǒng)/云創(chuàng)新環(huán)境,包括應(yīng)用服務(wù)器、Web服務(wù)器、緩存服務(wù)器、消息隊(duì)列、消息流、天工JDK等產(chǎn)品,支撐客戶業(yè)務(wù)全面數(shù)智化創(chuàng)新轉(zhuǎn)型。
其中,寶蘭德AI匯智平臺更是備受矚目。據(jù)介紹,該平臺攜手昇騰算力,通過異構(gòu)算力統(tǒng)一調(diào)度管理框架,實(shí)現(xiàn)對NVIDIA、AMD等國際AI芯片及國內(nèi)信創(chuàng)GPU、NPU的高效納管。平臺支持細(xì)粒度算力切分(最低1%算力)、動態(tài)遷移、遠(yuǎn)程掛載、資源聚合等功能,顯著提升資源利用率。
除此之外,寶蘭德在模型服務(wù)層面也展現(xiàn)出了超強(qiáng)實(shí)力。據(jù)悉,寶蘭德提供大模型全生命周期管理工具鏈,涵蓋數(shù)據(jù)工程、模型訓(xùn)練、推理加速及效果評測,兼容國內(nèi)外主流模型。平臺還內(nèi)置分布式訓(xùn)練與推理框架,支持自動擴(kuò)縮容與斷點(diǎn)續(xù)訓(xùn),幫助企業(yè)構(gòu)建兼具效果與成本優(yōu)勢的AI方案。
截至目前,公司已完成與芯片、操作系統(tǒng)、數(shù)據(jù)庫等上下游廠商的近5000款產(chǎn)品,構(gòu)建了完善的國產(chǎn)化技術(shù)生態(tài)。
至此,為推動中國算力產(chǎn)業(yè)發(fā)展,寶蘭德持續(xù)發(fā)揮關(guān)鍵作用。在2025世界人工智能大會期間,由AI大模型算力產(chǎn)業(yè)方陣聯(lián)合寶蘭德等成員共同舉辦了一場“浦江·AI算力之夜”的活動,目的就是通過“方陣”力量,匯聚上下游的產(chǎn)業(yè)鏈資源為AI算力產(chǎn)業(yè)、數(shù)據(jù)產(chǎn)業(yè)、信息產(chǎn)業(yè)賦能,實(shí)現(xiàn)從堅實(shí)的算力底座,到系統(tǒng)軟件的優(yōu)化調(diào)度,從算力平臺的普惠服務(wù),到創(chuàng)新應(yīng)用的落地開花的美好愿景。