&

當前位置：當前位置：首頁 > 熱點 > 國產萬卡訓練！推理性能突破！摩爾線程新架構“花港”與路線圖亮相正文

國產萬卡訓練！推理性能突破！摩爾線程新架構“花港”與路線圖亮相

[熱點] 時間：2025-12-29 02:15:25 來源：企業(yè)錄(www.falconvsmonkey.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶作者：知識點擊：104次

2025年12月20日，花港北京——摩爾線程首屆MUSA開發(fā)者大會（簡稱：MDC 2025）在北京中關村國際創(chuàng)新中心正式開幕。國產構路作為國內首個聚焦全功能GPU的訓練性能線程新架線圖開發(fā)者技術盛會，大會系統(tǒng)展示了摩爾線程以自主MUSA統(tǒng)一架構為核心的推理突破全棧技術成果，全面展現(xiàn)公司在高端全功能GPU領域的亮相關鍵突破與前瞻布局。

本次發(fā)布的花港核心成果包括：

1、新架構“花港”亮相：全功能GPU架構“花港”，國產構路支持FP4到FP64的訓練性能線程新架線圖全精度計算，算力密度提升50%，推理突破效能提升10倍。亮相未來并將基于該架構推出高性能AI訓推一體“華山”芯片與專攻高性能圖形渲染的花港“廬山”芯片。

2、國產構路“夸娥萬卡”高效訓練：發(fā)布夸娥萬卡智算集群，訓練性能線程新架線圖展示了其支撐萬億參數(shù)模型訓練的推理突破工程化能力與可靠性，在多項關鍵精度指標上達到國際主流水平。亮相

3、推理性能實現(xiàn)跨越：摩爾線程聯(lián)合硅基流動，在DeepSeek R1 671B全量模型上實現(xiàn)性能突破，MTT S5000單卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s，樹立國產推理性能新標桿。

4、超節(jié)點架構前瞻：分享面向下一代超大規(guī)模智算中心的MTT C256超節(jié)點架構，著眼高密硬件架構，實現(xiàn)極致智算性能。

5、全新個人智算平臺：正式發(fā)布搭載智能SoC芯片“長江”的AI算力本MTT AIBOOK，賦能“摩爾學院”20萬開發(fā)者與學習者。

6、圖形進化與前沿探索：揭曉硬件級光線追蹤加速與自研AI生成式渲染技術，具身智能、科學智能（AI4S）、AI for 6G等前沿領域的深度布局，進一步印證了全功能GPU技術路線的廣度與面向未來的可擴展性。

這一系列成果的發(fā)布，標志著摩爾線程已成功構建起一套以自主統(tǒng)一架構為根基、貫穿“芯-邊-端-云”的完整技術棧，實現(xiàn)了從底層硬件到上層應用的系統(tǒng)化閉環(huán)。該體系為國產智能計算生態(tài)的持續(xù)演進與產業(yè)融合，提供了堅實、開放且可持續(xù)的平臺級支撐。

戰(zhàn)略基石：MUSA統(tǒng)一架構的進化與開放

MUSA（Meta-computing Unified System Architecture）是摩爾線程自主研發(fā)的元計算統(tǒng)一計算架構，覆蓋從芯片架構、指令集、編程模型到軟件運行庫及驅動程序框架等的全棧技術體系。

MUSA不僅完整定義了從芯片設計到軟件生態(tài)的統(tǒng)一技術標準，更代表了公司堅持底層創(chuàng)新、踐行長期主義的戰(zhàn)略核心，并為全功能GPU奠定了堅實的技術根基，可高效支持AI計算、圖形渲染、物理仿真和科學計算、超高清視頻編解碼等全場景高性能計算。

歷經(jīng)五年深度研發(fā)與持續(xù)迭代，MUSA實現(xiàn)了軟件性能的指數(shù)級跨越。全新升級的MUSA 5.0標志著架構步入成熟新階段，在全棧統(tǒng)一性、極致效能與生態(tài)開放性上取得關鍵突破。

編程生態(tài)全面升級：原生MUSA C，深度兼容 TileLang、Triton 等編程語言，為開發(fā)者提供靈活高效的全棧開發(fā)體驗。計算效能極致優(yōu)化：核心計算庫muDNN實現(xiàn)GEMM/FlashAttention效率超98%，通信效率達97%，編譯器性能提升3倍，并集成高性能算子庫，顯著加速訓練與推理全流程。開源生態(tài)持續(xù)擴大：計劃逐步開源計算加速庫、通信庫及系統(tǒng)管理框架在內的核心組件，向開發(fā)者社區(qū)開放深度優(yōu)化的底層能力。前沿特性拓展邊界：即將推出兼容跨代GPU指令架構的中間語言MTX、面向渲染+AI融合計算的編程語言muLang、量子計算融合框架MUSA-Q，以及計算光刻庫muLitho，持續(xù)拓展全功能GPU的算力邊界。

硬件核心：“花港”新架構與技術路線圖

基于MUSA統(tǒng)一體系，摩爾線程揭曉新一代全功能GPU架構“花港”，該架構在計算密度、能效、精度支持、互聯(lián)能力及圖形技術等方面實現(xiàn)全面突破，其核心特性包括：

計算性能顯著提升：基于新一代指令集，算力密度提升50%，能效大幅優(yōu)化；支持從FP4到FP64的全精度端到端計算，新增MTFP6/MTFP4及混合低精度支持。異步編程與超大規(guī)模互聯(lián)：集成新一代異步編程模型，優(yōu)化任務調度與并行機制；通過自研MTLink高速互聯(lián)技術，支持十萬卡以上規(guī)模智算集群擴展。圖形與AI深度融合：內置AI生成式渲染架構，增強硬件光線追蹤加速引擎，完整支持DirectX 12 Ultimate，實現(xiàn)圖形渲染與智能計算的高度協(xié)同。全棧自研與安全可信：架構基于全棧自主研發(fā)，擁有扎實的專利壁壘（截至2025年6月30日，公司累計授權專利514項，其中發(fā)明專利468項），具備全棧自研與自主可控的核心能力。通過四層硬件安全架構，提供從芯片到系統(tǒng)的可驗證安全守護。

基于“花港”架構，摩爾線程公布了未來將發(fā)布的兩款芯片技術路線：

“華山”專注AI訓推一體與超大規(guī)模智能計算。集成新一代異步編程與全精度張量計算單元，支持從FP4至FP64的全精度計算，為萬卡級智算集群提供穩(wěn)定高效的算力支撐，是構建下一代“AI工廠”的堅實底座?！皬]山”專攻高性能圖形渲染。其圖形性能實現(xiàn)全面跨越：AI計算性能提升64倍，幾何處理性能提升16倍，光線追蹤性能提升50倍，并顯著增強紋理填充、原子訪存能力及顯存容量。集成AI生成式渲染、UniTE統(tǒng)一渲染架構及全新硬件光追引擎，為3A游戲、高端圖形創(chuàng)作提供強大算力支持。

基礎設施：夸娥萬卡集群，樹立國產智算效率標桿

本次大會正式發(fā)布了夸娥萬卡智算集群。該集群具備全精度、全功能通用計算能力，在萬卡規(guī)模下實現(xiàn)高效穩(wěn)定的AI訓練與推理。其核心突破包括：浮點運算能力達到10Exa-Flops，訓練算力利用率（MFU）在Dense大模型上達60%，MOE大模型上達40%，有效訓練時間占比超過90%，訓練線性擴展效率達95%，與國際主流生態(tài)高度兼容，并在多項指標上具備顯著能效優(yōu)勢。

在訓練側，基于原生FP8能力完整復現(xiàn)頂尖大模型訓練流程，并在多項關鍵精度指標上達到國際主流水平。技術層面實現(xiàn)關鍵優(yōu)化：Flash Attention算力利用率超95%，并突破FP8累加精度等關鍵技術瓶頸，充分釋放國產GPU在大模型訓練中的性能潛力。在推理側，摩爾線程聯(lián)合硅基流動，經(jīng)過系統(tǒng)級工程優(yōu)化與FP8精度加速，在DeepSeek R1 671B全量模型上實現(xiàn)性能突破：MTT S5000單卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s，樹立國產推理性能新標桿。面向未來，發(fā)布了MTT C256超節(jié)點的架構規(guī)劃。該產品采用計算與交換一體化的高密設計，旨在系統(tǒng)性提升萬卡集群的訓練效能與推理能力，為下一代超大規(guī)模智算中心構建兼具超高密度與極致能效的硬件基石。

邁向物理AI：圖形技術持續(xù)進化，前瞻布局未來計算

在圖形計算領域，摩爾線程持續(xù)推動國產GPU向兼容性更廣、技術更深的方向發(fā)展。其產品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流圖形與計算API，并與國產主流CPU及操作系統(tǒng)完成了全棧適配，持續(xù)擴展游戲及專業(yè)應用的兼容覆蓋。公司同時宣布，即將完整支持DirectX 12 Ultimate，進一步接軌行業(yè)頂級圖形標準。

在核心渲染技術上，摩爾線程率先擁抱“圖形+AI”范式革命，實現(xiàn)兩項關鍵突破：

邁入實時光追時代：基于“花港”架構的硬件光線追蹤加速引擎，可實現(xiàn)對DirectX Raytracing (DXR)的支持，使實時、逼真的光影效果在國產GPU上成為可能。定義AI生成式渲染（AGR）：推出全自研MTAGR 1.0技術，推動渲染技術范式從“計算”走向“生成”，為下一代數(shù)字內容創(chuàng)作及數(shù)字孿生等場景構建國產技術基座。

面向更廣闊的未來計算場景，摩爾線程已展開前瞻性布局：

具身智能全棧賦能：發(fā)布了MT Lambda具身智能仿真訓練平臺，深度融合物理、渲染與AI三大引擎，構建了開發(fā)、仿真、訓練的高效統(tǒng)一環(huán)境。推出基于智能SoC芯片“長江”、AI模組MTT E300和夸娥智算集群“端云結合”的MT Robot具身智能解決方案，并宣布將于2026年第一季度開源關鍵仿真加速組件Mujoco-warp-MUSA，以開放協(xié)作助力機器人產業(yè)研發(fā)效率提升。前沿融合計算探索：MUSA生態(tài)已與合作伙伴在科學智能（AI for Science）、量子科技、AI for 6G等前沿交叉領域展開探索工作，持續(xù)拓展全功能GPU作為通用算力底座的技術邊界與應用價值。

生態(tài)加速：全面賦能開發(fā)者，發(fā)布個人AI算力平臺

生態(tài)建設是GPU行業(yè)的核心壁壘與價值所在，摩爾線程構建了從硬件工具、算力支撐到人才培養(yǎng)的賦能體系。

深化人才培養(yǎng)，建設MUSA生態(tài)樞紐：以摩爾學院為平臺，摩爾線程已構建起產教融合的開發(fā)者成長體系，該平臺匯聚近20萬名開發(fā)者與學習者，并通過“國產計算生態(tài)與AI教育共建行動”將前沿技術與產業(yè)實踐帶入全國 200多所高校，吸引超10萬名學子參與。本次大會宣布建設MUSA生態(tài)中心，同時發(fā)布MUSA開發(fā)者計劃，旨在為從AI學習探索到科研創(chuàng)新的各階段創(chuàng)新者，提供算力支持與技術賦能。發(fā)布AI算力本，提供“開箱即用”的開發(fā)體驗：作為連接開發(fā)者與MUSA生態(tài)的核心入口，MTT AIBOOK搭載自研“長江”智能SoC，提供高達50TOPS的端側AI算力，首次實現(xiàn)從芯片、驅動到開發(fā)環(huán)境的全棧整合，不僅實現(xiàn)了專業(yè)AI開發(fā)的“開箱即用”，更創(chuàng)新地打破Linux開發(fā)、Windows辦公與Android應用之間場景壁壘，將強大的AI能力轉化為人人可及的生產力，賦能開發(fā)者在AI時代成為“超級個體”。

大會同時預告了基于“長江”SoC打造的迷你型計算設備MTT AICube，進一步豐富端側計算產品形態(tài)。

結語：構筑自主基座，共赴智能未來

MDC 2025展示了從統(tǒng)一架構到核心芯片，從超大規(guī)模基礎設施到開發(fā)者終端的技術全景，這不僅是一次全功能GPU技術路線的系統(tǒng)呈現(xiàn)，更是摩爾線程對自主計算未來的堅定承諾。

展望未來，摩爾線程將以MUSA為核心，堅持開放生態(tài)，與全球開發(fā)者及伙伴攜手，共同構建下一代的智能計算體系，賦能千行百業(yè)，邁向智能新紀元。

+++

關于摩爾線程

摩爾線程以全功能GPU為核心，致力于向全球提供加速計算的基礎設施和一站式解決方案，為各行各業(yè)的數(shù)智化轉型提供強大的AI計算支持。我們的目標是成為具備國際競爭力的GPU領軍企業(yè)，為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進的加速計算平臺。我們的愿景是為美好世界加速。

*更多關于MUSA架構、技術細節(jié)等深度解讀，請關注摩爾線程官網(wǎng)及后續(xù)發(fā)布。

(責任編輯：娛樂)

風云四號03星成功發(fā)射長三甲系列火箭年度發(fā)射次數(shù)創(chuàng)新高中國臺灣宜蘭縣海域發(fā)生6.6級地震網(wǎng)友：福建震感明顯

国产激情AⅤ无码毛片_色播亚洲视频在线观看_亚洲无码熟妇破处在线观看_亚洲寡妇无码AV在线少妇

國產萬卡訓練！推理性能突破！摩爾線程新架構“花港”與路線圖亮相

國產萬卡訓練！推理性能突破！摩爾線程新架構“花港”與路線圖亮相