中國日報5月19日電(記者 馬思)AI技術(shù)的飛速演進(jìn)正深刻重塑著產(chǎn)業(yè)格局。在日前舉辦的華為云AI峰會上,華為北京總經(jīng)理張東亞表示,面向政府、教育、金融、零售、互聯(lián)網(wǎng)、交通、制造等行業(yè),昇騰AI云服務(wù)已經(jīng)成為超過600家創(chuàng)新先鋒企業(yè)的數(shù)字化轉(zhuǎn)型伙伴。
隨著大模型訓(xùn)練和推理對算力需求的爆炸式增長,傳統(tǒng)計算架構(gòu)已難以支撐AI技術(shù)的代際躍遷。對此,華為云推出采用全對等互聯(lián)架構(gòu)的CloudMatrix 384超節(jié)點(diǎn),華為云副總裁黃瑾介紹,這項技術(shù)創(chuàng)新跳出單點(diǎn)技術(shù)限制,走向系統(tǒng)性、工程性的創(chuàng)新算力架構(gòu),直面通信效率瓶頸、內(nèi)存墻制約、可靠性短板三大技術(shù)挑戰(zhàn)。通過新型高速互聯(lián)總線實(shí)現(xiàn)384張卡互聯(lián)成為一個超級云服務(wù)器,最高提供300Pflops的算力規(guī)模,比業(yè)界同類產(chǎn)品領(lǐng)先67%。
穩(wěn)定的AI算力供給,離不開可靠的數(shù)據(jù)中心載體。大會期間,華為云數(shù)據(jù)中心全球DC運(yùn)維首席專家謝峰分析,當(dāng)前,通算平穩(wěn)發(fā)展,AI智算快速發(fā)展,數(shù)據(jù)中心在空間、供電、散熱和運(yùn)維等方面面臨著更多挑戰(zhàn)。包括,AI集群超大規(guī)模組網(wǎng)帶來的光鏈路可靠性挑戰(zhàn);AI集群功率快速增長和毫秒級功率波動,帶來供電的可靠性挑戰(zhàn);AI集群超高密度散熱帶來的水質(zhì)安全和水力平衡挑戰(zhàn)。
硅基流動聯(lián)合創(chuàng)始人、首席產(chǎn)品官胡健介紹,硅基流動與華為云聯(lián)合攻關(guān)實(shí)現(xiàn)了技術(shù)突破。通過采用大規(guī)模專家并行方案進(jìn)行DeepSeek-R1部署,以多專家負(fù)載均衡和極致通信優(yōu)化,實(shí)現(xiàn)高吞吐、高性能。
中國科學(xué)院自動化研究所研究員李林靜認(rèn)為,AI賦能科研,成為全球科技發(fā)展的制高點(diǎn),且亟需從作坊模式轉(zhuǎn)向平臺化建設(shè),而平臺化建設(shè)的核心是構(gòu)建面向科學(xué)研究的基座大模型?;贑loudMatrix 384超節(jié)點(diǎn)的大模型后訓(xùn)練,支撐不同訓(xùn)練范式時穩(wěn)定和擴(kuò)展性強(qiáng),為AI模型的迭代升級提供了可靠的算力保障,能有效支持基座模型持續(xù)優(yōu)化。