在6月20日舉行的云基于華為開發(fā)者大會(huì)2025(HDC 2025)上,華為常務(wù)董事、服務(wù)華為云計(jì)算 CEO張平安宣布基于CloudMatrix384超節(jié)點(diǎn)的全面新一代昇騰AI云服務(wù)全面上線,為大模型應(yīng)用提供澎湃算力。上線
隨著大模型訓(xùn)練和推理對(duì)算力需求的云基于爆炸式增長(zhǎng),傳統(tǒng)計(jì)算架構(gòu)已難以支撐AI技術(shù)的服務(wù)代際躍遷。華為云新一代昇騰AI云服務(wù)基于CloudMatrix384超節(jié)點(diǎn),全面首創(chuàng)將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網(wǎng)絡(luò)MatrixLink全對(duì)等互聯(lián),上線形成一臺(tái)超級(jí)“AI服務(wù)器”,云基于單卡推理吞吐量躍升到2300 Tokens/s。服務(wù)超節(jié)點(diǎn)架構(gòu)能更好地支持混合專家MoE大模型的全面推理,可以實(shí)現(xiàn)“一卡一專家”,上線一個(gè)超節(jié)點(diǎn)可以支持384個(gè)專家并行推理,云基于極大提升效率。服務(wù)同時(shí),全面超節(jié)點(diǎn)還可以支持“一卡一算力任務(wù)”,靈活分配資源,提升任務(wù)并行處理,減少等待,將算力有效使用率(MFU)提升50%以上。
對(duì)于萬億、十萬億參數(shù)的大模型訓(xùn)練任務(wù),在云數(shù)據(jù)中心,還能將432個(gè)超節(jié)點(diǎn)級(jí)聯(lián)成最高16萬卡的超大集群;同時(shí),超節(jié)點(diǎn)還可以支持訓(xùn)推算力一體部署,如“日推夜訓(xùn)”,訓(xùn)推算力可靈活分配,幫助客戶資源使用最優(yōu)。
張平安表示,昇騰AI云服務(wù)得到了全球客戶、伙伴和開發(fā)者的支持。正是因?yàn)樗麄儗?duì)華為的堅(jiān)定信任,才有機(jī)會(huì)讓昇騰構(gòu)筑起一個(gè)比肩巔峰,開創(chuàng)未來的AI算力底座!
新浪與華為云深度合作,基于CloudMatrix384昇騰AI云服務(wù),為“智慧小浪”智能服務(wù)體系構(gòu)建了統(tǒng)一的推理平臺(tái),底層由昇騰AI算力提供支持。推理的交付效率提升了超過 50%,模型上線速度成倍加快;通過軟硬協(xié)同調(diào)優(yōu),NPU利用率提升超過40%,每一份資源都得到更高效的使用。
硅基流動(dòng)正在使用CloudMatrix384超節(jié)點(diǎn),為數(shù)百萬用戶高效提供DeepSeek V3、R1的推理服務(wù)。面壁智能使用CloudMatrix384超節(jié)點(diǎn),讓他們的小鋼炮模型的推理業(yè)務(wù)性能得到了2.7倍提升。
在科研領(lǐng)域,中科院基于CloudMatrix384超節(jié)點(diǎn)打造了自己的模型訓(xùn)練框架,快速構(gòu)建了中科院AI for Science科研大模型,擺脫了對(duì)國(guó)外高性能AI算力平臺(tái)的依賴。
在互聯(lián)網(wǎng)領(lǐng)域,360打造的納米AI搜索,為用戶提供超級(jí)AI搜索服務(wù),對(duì)AI算力有極大需求,也已開啟了CloudMatrix384超節(jié)點(diǎn)的測(cè)試。
當(dāng)前,昇騰AI云服務(wù)已經(jīng)成為AI基礎(chǔ)設(shè)施的最優(yōu)選擇,為超過1300家客戶提供澎湃的AI算力,加速千行萬業(yè)智能化升級(jí)。
蘇州國(guó)際金融大廈資料圖近日,江蘇省住房和城鄉(xiāng)建設(shè)廳公示了20...
2025-07-18616近日,中建科工承建的深圳海洋大學(xué)一期)項(xiàng)目建設(shè)正全面推進(jìn)中,...
2025-07-1893899近日,中建七局、中建海峽等單位組成聯(lián)合體,中標(biāo)煙臺(tái)市龍口綜合...
2025-07-18315