從代碼生成到智能開發(fā):北大發(fā)布基于昇騰平臺軟件開發(fā)解決方案
軟件開發(fā)流程的從代成智能化,能顯著解放開發(fā)者生產(chǎn)力,碼生并驅(qū)動軟件工程領(lǐng)域的開發(fā)開范式革新。北京大學(xué)計算機學(xué)院李戈教授團隊深耕該技術(shù)方向并在鯤鵬昇騰科教創(chuàng)新卓越中心的發(fā)布方案算力支持下,成功研發(fā)出一套基于昇騰平臺的基于解決智能化軟件開發(fā)系統(tǒng),通過大模型自動代碼生成和優(yōu)化技術(shù)實現(xiàn)了軟件開發(fā)效率的昇騰顯著提升。該成果完成了開源代碼大模型 aiXcoder-7B在昇騰NPU硬件平臺上的平臺適配,通過集成 torch_npu 擴展庫與 MindIE 推理加速套件,軟件實現(xiàn)了模型的從代成高效運行。同時,碼生構(gòu)建了基于 DeepSeek-V3 Agent 的開發(fā)開智能開發(fā)系統(tǒng)。
針對大模型aiXcoder-7B的發(fā)布方案適配優(yōu)化,其核心依托于代碼生成技術(shù)所具備的基于解決意圖理解與自動編碼能力。該技術(shù)通過深度解析海量代碼與注釋語料,昇騰精準(zhǔn)識別開發(fā)者編程意圖,平臺自動生成符合工程規(guī)范的高質(zhì)量代碼。昇騰提供的高性能算力為技術(shù)實現(xiàn)奠定了堅實基礎(chǔ),通過將模型從通用平臺向昇騰NPU高效遷移,使代碼生成的訓(xùn)練與推理過程全面獲得硬件加速;同時MindIE集成并優(yōu)化了Flash Attention等關(guān)鍵算法,使其能在昇騰上高效運行,進一步增強了數(shù)據(jù)處理與模型計算效能。最終,該模型推理速度相比原版實現(xiàn)大幅提升,首Token延遲時間降低至原版的四分之一。
而在DeepSeek-V3 Agent智能開發(fā)系統(tǒng)中,代碼生成技術(shù)實現(xiàn)了從 “單一編碼” 到 “復(fù)雜場景協(xié)同” 的升級。該技術(shù)創(chuàng)新性地將代碼生成與工具調(diào)用能力結(jié)合,能應(yīng)對多步驟開發(fā)任務(wù)并形成智能化運轉(zhuǎn)。昇騰的 SmoothQuant 量化技術(shù)通過構(gòu)造數(shù)學(xué)等價變換,使大模型難以量化的激活值得到縮放并被輕松量化,并針對量化可能出現(xiàn)的性能波動,團隊借助昇騰特性優(yōu)化算法,有效抑制激活值異常,使能大模型高性能、低精度部署;昇騰 MindIE 推理引擎提供類OpenAI高級封裝接口和底層Token ID接口,使用底層的Token ID接口,可支持系統(tǒng)直接調(diào)用底層開發(fā)工具,實現(xiàn)更靈活定制開發(fā),實現(xiàn)Agent工具調(diào)用能力,最終使系統(tǒng)具備代碼補全、研發(fā)問答、缺陷檢測等一站式開發(fā)能力。
此研究成果推動軟件開發(fā)進入“高效、智能、自主化”新階段,對廣大開發(fā)人員具備重要意義。未來,北大團隊將繼續(xù)依托北京大學(xué) 鯤鵬昇騰科教創(chuàng)新卓越中心,探索新模型適配與領(lǐng)域化訓(xùn)練方法,讓智能開發(fā)工具覆蓋金融、能源、軍工等行業(yè),為我國自主創(chuàng)新技術(shù)體系注入全新動力。