華為發(fā)布AI新技術(shù):?jiǎn)慰ㄍ瑫r(shí)承載多AI工作負(fù)載 提升硬件資源利用率

 人參與 | 時(shí)間:2025-12-05 07:59:53

11月21日消息,發(fā)布負(fù)載據(jù)媒體報(bào)道,新技華為今日正式發(fā)布Flex:ai AI容器軟件。術(shù)單時(shí)承該產(chǎn)品的卡同核心突破在于運(yùn)用算力切分技術(shù),可將單張GPU/NPU算力卡精細(xì)切分為多個(gè)虛擬算力單元,載多資源最小粒度精準(zhǔn)至10%。工作

這一創(chuàng)新使得單張算力卡能夠同時(shí)承載多個(gè)AI工作負(fù)載,提升顯著提升硬件資源利用率。硬件

同時(shí),利用率Flex:ai能夠?qū)⒓簝?nèi)各計(jì)算節(jié)點(diǎn)的發(fā)布負(fù)載空閑XPU算力進(jìn)行高效聚合,形成統(tǒng)一的新技“共享算力池”,實(shí)現(xiàn)算力資源的術(shù)單時(shí)承全局調(diào)度與靈活分配。

其核心技術(shù)原理是卡同一套深度融合軟硬件的系統(tǒng)工程,覆蓋從底層芯片到頂層調(diào)度。載多資源通過創(chuàng)新性的工作軟件技術(shù)深度挖掘硬件潛力,F(xiàn)lex:ai成功將GPU/NPU的典型利用率從30%-40%提升至70%,有效踐行了“以軟件補(bǔ)硬件”的理念。

在硬件協(xié)同方面,Flex:ai深度整合華為自研的昇騰AI處理器,通過軟硬件協(xié)同設(shè)計(jì)優(yōu)化,實(shí)現(xiàn)了最佳的性能功耗比。

特別在大模型訓(xùn)練場(chǎng)景中,F(xiàn)lex:ai通過軟件層面的創(chuàng)新,實(shí)現(xiàn)了對(duì)包括英偉達(dá)GPU、昇騰NPU在內(nèi)的多種異構(gòu)算力資源的統(tǒng)一管理與調(diào)度,有效解決了當(dāng)前大模型訓(xùn)練面臨的算力效率瓶頸問題。

 據(jù)悉,Flex:ai將在發(fā)布后同步開源在魔擎社區(qū)中,以促進(jìn)技術(shù)共享與生態(tài)發(fā)展。

頂: 75踩: 8636