国产激情AⅤ无码毛片_色播亚洲视频在线观看_亚洲无码熟妇破处在线观看_亚洲寡妇无码AV在线少妇

昇思人工智能框架峰會(huì) 基于MindSpore NLP玩轉(zhuǎn)DeepSeek

  發(fā)布時(shí)間:2025-12-17 03:36:38   作者:玩站小弟   我要評(píng)論
據(jù)悉,昇思MindSpore開源社區(qū)將于 2025 年 12 月 25 日在杭州舉辦昇思人工智能框架峰會(huì)。本次峰會(huì)在展區(qū)、CodeLabs、WorkShop等環(huán)節(jié)提供了豐富的案例,本篇文章以其中Cod 。

據(jù)悉,昇思昇思MindSpore開源社區(qū)將于 2025 年 12 月 25 日在杭州舉辦昇思人工智能框架峰會(huì)。人工本次峰會(huì)在展區(qū)、框架CodeLabs、基于WorkShop等環(huán)節(jié)提供了豐富的玩轉(zhuǎn)案例,本篇文章以其中CodeLabs中的昇思DeepSeek-OCR為例,深入介紹其技術(shù)實(shí)現(xiàn),人工更多案例歡迎來到峰會(huì)現(xiàn)場(chǎng)進(jìn)行體驗(yàn)和實(shí)操。框架

當(dāng)文本遇見視覺,基于AI模型正重新定義信息壓縮的玩轉(zhuǎn)邊界

在人工智能快速發(fā)展的今天,DeepSeek團(tuán)隊(duì)于2025年10月推出的昇思DeepSeek-OCR模型帶來了一場(chǎng)文本處理范式的革命。這一創(chuàng)新模型不僅實(shí)現(xiàn)了10倍壓縮率下97%的人工解碼精度,更探索了通過視覺模態(tài)壓縮長上下文的框架全新路徑。而昇思MindSpore框架的基于day0支持能力,則為這一前沿技術(shù)的玩轉(zhuǎn)快速部署應(yīng)用提供了堅(jiān)實(shí)基礎(chǔ)。

DeepSeek-OCR:重新定義文本壓縮的邊界

DeepSeek-OCR 是 DeepSeek AI 于 2025 年 10 月 發(fā)布的多模態(tài)模型,以探索視覺 - 文本壓縮邊界為核心目標(biāo),為文檔識(shí)別、圖像轉(zhuǎn)文本提供創(chuàng)新方案。其采用 DeepEncoder 視覺編碼器與 DeepSeek3B-MoE-A570M 混合專家解碼器的雙模塊架構(gòu),從 LLM 視角重新定義視覺編碼器功能,聚焦 “文檔解碼所需最少視覺 token” 這一核心問題,對(duì)研究 “一圖勝千言” 原理具有重要意義。

模型的核心技術(shù)突破體現(xiàn)在三個(gè)方面:

高壓縮比下的精度保持:實(shí)驗(yàn)表明,當(dāng)文本令牌數(shù)量在視覺令牌數(shù)量的10倍以內(nèi)(即壓縮比<10倍)時(shí),模型可以實(shí)現(xiàn)97%的解碼精度,即使在20倍壓縮率下仍保有約60%準(zhǔn)確率。

分層視覺編碼設(shè)計(jì):DeepEncoder采用三階段處理流程——首先使用SAM-base進(jìn)行局部感知(窗口注意力看清細(xì)節(jié)),然后通過卷積層進(jìn)行16倍下采樣,最后使用CLIP-large進(jìn)行全局語義理解。這種設(shè)計(jì)能夠在高分辨率輸入下保持低激活內(nèi)存。

多分辨率支持:模型提供Tiny/Small/Base/Large/Gundam五種配置,支持從512 x 512到1280×1280的不同分辨率輸入,其中Gundam版本專門針對(duì)大尺寸復(fù)雜文檔優(yōu)化。

在實(shí)際性能方面,DeepSeek-OCR在OmniDocBench測(cè)試中表現(xiàn)卓越,僅使用100個(gè)視覺token即超越GOT-OCR2.0模型,800個(gè)視覺token優(yōu)于MinerU2.0模型。支持PDF轉(zhuǎn)圖像、批量處理及Markdown格式輸出。

Day0支持:MindSpore NLP快速支持DeepSeek-OCR

MindSpore NLP作為基于昇思MindSpore的開源NLP庫,其核心優(yōu)勢(shì)在于與Hugging Face生態(tài)的全面兼容。這種兼容性設(shè)計(jì)使得任何基于Transformers架構(gòu)的模型都能在昇思MindSpore框架上無縫運(yùn)行,為DeepSeek-OCR的快速部署提供了技術(shù)基礎(chǔ)。

新增2行代碼,即可實(shí)現(xiàn)基于昇思MindSpore的一鍵適配

具體而言,MindSpore NLP提供了與Hugging Face完全一致的API接口,開發(fā)者可以使用熟悉的AutoModel、AutoTokenizer等類直接加載和運(yùn)行模型。這種設(shè)計(jì)極大降低了模型遷移的技術(shù)門檻,確保新發(fā)布的模型能夠?qū)崿F(xiàn)“day0”支持。

基于MindSpore NLP的兼容性特性,DeepSeek-OCR在昇思MindSpore上的部署變得異常簡(jiǎn)潔。整個(gè)過程主要包含三個(gè)關(guān)鍵步驟:

· 環(huán)境配置:安裝MindSpore NLP及相關(guān)依賴庫,確保昇思MindSpore版本兼容性

· 模型加載:使用MindSpore NLP+Transformers接口直接加載DeepSeek-OCR預(yù)訓(xùn)練權(quán)重

· 推理執(zhí)行:調(diào)用統(tǒng)一的API進(jìn)行文檔理解和視覺-文本壓縮任務(wù)

代碼如下圖所示:

這種標(biāo)準(zhǔn)化流程消除了復(fù)雜的模型轉(zhuǎn)換環(huán)節(jié),使研究者能夠?qū)W⒂趹?yīng)用開發(fā)而非環(huán)境適配。無論是處理掃描文檔、PDF轉(zhuǎn)換還是長文本壓縮,開發(fā)者都可以利用熟悉的Hugging Face編程習(xí)慣在昇思MindSpore生態(tài)中高效運(yùn)行DeepSeek-OCR。

如下圖所示,運(yùn)行腳本后,模型可識(shí)別掃描件中的文字,并轉(zhuǎn)換為MarkDown文件。

基于Expert合并的小MoE模型加速:權(quán)重融合計(jì)算優(yōu)化策略

DeepSeek-OCR的解碼器采用混合專家(MoE)架構(gòu),激活參數(shù)約570M。針對(duì)MoE模型訓(xùn)練中的性能挑戰(zhàn),昇思MindSpore提供了基于Expert合并的優(yōu)化方案,顯著提升了小MoE模型的效率。

基于Expert合并的小MoE模型加速技術(shù)核心在于通過權(quán)重預(yù)融合策略,將傳統(tǒng)動(dòng)態(tài)路由計(jì)算轉(zhuǎn)化為統(tǒng)一計(jì)算流,從根本上解決MoE架構(gòu)中的Host端調(diào)度瓶頸問題。

1、傳統(tǒng)MoE計(jì)算瓶頸分析

傳統(tǒng)MoE模型采用“專家視角”的計(jì)算模式,其核心瓶頸體現(xiàn)在兩個(gè)方面:

· 細(xì)碎算子調(diào)度開銷:傳統(tǒng)實(shí)現(xiàn)方式需要遍歷每個(gè)專家,為每個(gè)專家獨(dú)立執(zhí)行前向計(jì)算。這種循環(huán)遍歷模式導(dǎo)致大量小規(guī)模算子的頻繁調(diào)度,特別是當(dāng)專家數(shù)量增多時(shí),Host端的算子下發(fā)和調(diào)度開銷呈線性增長。

· 負(fù)載不均衡問題:由于不同專家處理的token數(shù)量差異顯著,計(jì)算過程中容易出現(xiàn)負(fù)載不均衡。某些熱門專家需要處理大量token,而其他專家可能處于空閑狀態(tài),這種不均衡進(jìn)一步加劇了設(shè)備利用率的下降。

2、權(quán)重預(yù)融合技術(shù)原理

基于Expert合并的加速方案通過FFN權(quán)重預(yù)融合技術(shù),將多個(gè)專家的計(jì)算任務(wù)合并為單一計(jì)算流:

· 權(quán)重合并機(jī)制:在模型初始化階段,將所有專家的FFN層權(quán)重進(jìn)行拼接融合,形成一個(gè)統(tǒng)一的超大型權(quán)重矩陣。以8專家MoE層為例,每個(gè)專家FFN層的輸入維度為d_model,中間維度為d_ffn,合并后的權(quán)重矩陣形狀從8個(gè)獨(dú)立的[d_model, d_ffn]矩陣轉(zhuǎn)變?yōu)榻y(tǒng)一的[8×d_model, d_ffn]矩陣。

· 統(tǒng)一計(jì)算流程:路由網(wǎng)絡(luò)輸出的選擇權(quán)重不再用于動(dòng)態(tài)激活不同專家,而是作為加權(quán)系數(shù)直接應(yīng)用于融合后的計(jì)算結(jié)果。具體而言,模型首先通過融合權(quán)重矩陣執(zhí)行一次統(tǒng)一的前向計(jì)算,然后根據(jù)路由權(quán)重對(duì)輸出進(jìn)行加權(quán)組合,避免了傳統(tǒng)的專家遍歷過程。

針對(duì)DeepSeekV2(DeepSeek-OCR LLM模塊)的改進(jìn)代碼如下:

在昇思MindSpore+昇騰的軟硬件協(xié)同環(huán)境中,這一技術(shù)大幅提升了DeepSeek-OCR的執(zhí)行速度,相較于原版實(shí)現(xiàn),推理token生成的性能提升3-4x,算力利用率由8%提升至30%+。這種基于Expert合并的加速思路,為小規(guī)模MoE模型的部署提供了一種新的優(yōu)化范式,特別是在對(duì)推理延遲敏感的端側(cè)和應(yīng)用場(chǎng)景中具有重要價(jià)值。

總結(jié)

DeepSeek-OCR與昇思MindSpore在昇騰硬件上的深度結(jié)合,標(biāo)志著文檔智能處理進(jìn)入了一個(gè)全新的發(fā)展階段。這一技術(shù)組合不僅展現(xiàn)了前沿AI模型的創(chuàng)新潛力,更體現(xiàn)了從算法、框架到硬件的全棧優(yōu)化價(jià)值。

展望未來,隨著多模態(tài)大模型技術(shù)的持續(xù)演進(jìn)和昇騰算力基礎(chǔ)設(shè)施的不斷完善,OCR模型與昇思MindSpore的深度結(jié)合將釋放更大潛力。從簡(jiǎn)單的文檔識(shí)別到復(fù)雜的知識(shí)抽取,從單頁處理到跨文檔分析,這一技術(shù)路徑正在開啟文檔智能的新篇章,為企業(yè)數(shù)字化轉(zhuǎn)型和AI普惠應(yīng)用提供堅(jiān)實(shí)的技術(shù)底座。

本次在杭州舉辦的昇思人工智能框架峰會(huì),將會(huì)邀請(qǐng)思想領(lǐng)袖、專家學(xué)者、企業(yè)領(lǐng)軍人物及明星開發(fā)者等產(chǎn)學(xué)研用代表,共探技術(shù)發(fā)展趨勢(shì)、分享創(chuàng)新成果與實(shí)踐經(jīng)驗(yàn)。歡迎各界精英共赴前沿之約,攜手打造開放、協(xié)同、可持續(xù)的人工智能框架新生態(tài)!

  • Tag:

相關(guān)文章

  • 藍(lán)寶石高管:內(nèi)存市場(chǎng)將在6

    12月16日消息,當(dāng)前PC硬件市場(chǎng)因價(jià)格上漲面臨的不確定性,導(dǎo)致許多人進(jìn)行恐慌性購買。但藍(lán)寶石的公關(guān)經(jīng)理Edward Crisler在接受Hardware Unboxed采訪時(shí),公開呼吁玩家不要盲目跟
    2025-12-17
  • 全國首座!開源鴻蒙泵房在深實(shí)現(xiàn)日?;\(yùn)行

    12月15日消息,“深圳發(fā)布”公眾號(hào)發(fā)文,在深圳市龍崗區(qū)百合星城一期,一座基于開源鴻蒙操作系統(tǒng)的智慧泵房正悄然改變城市供水的運(yùn)行模式。這里無需專人值守,系統(tǒng)能夠自主監(jiān)測(cè)水質(zhì)波動(dòng)
    2025-12-17
  • 湖南高速修訂條例禁摩托車上高速:近年來摩托高速事故大幅增加

    12月15日消息,據(jù)湖南交通運(yùn)輸官方消息,《湖南省高速公路條例修訂草案)》于上月進(jìn)行初次審議。此次修訂,主要針對(duì)管理權(quán)責(zé)、建設(shè)環(huán)節(jié)監(jiān)管、養(yǎng)護(hù)機(jī)制、經(jīng)營服務(wù)、巡查治堵等方面進(jìn)行制度完善和優(yōu)化。其中,&l
    2025-12-17
  • 外媒:澳大利亞邦迪海灘發(fā)生槍擊事件

    中新網(wǎng)12月14日電 綜合外媒最新消息,澳大利亞警方14日表示,正在應(yīng)對(duì)邦迪海灘發(fā)生的一起事件,并敦促公眾避開該區(qū)域,“現(xiàn)場(chǎng)所有人員都應(yīng)尋找掩體”。路透社援引當(dāng)?shù)孛襟w稱,邦迪海灘發(fā)生了槍擊事件,但目前
    2025-12-17
  • 哈啰雙線翻車:電動(dòng)車大規(guī)模斷服 Robotaxi當(dāng)街撞人

    你的哈啰兩輪電動(dòng)車,可能因2G網(wǎng)絡(luò)斷服而不再“智能”了。近日,《BUG》欄目進(jìn)入多個(gè)累計(jì)超千人的哈啰車主維權(quán)群。大量用戶反饋,自己的哈啰電動(dòng)車出現(xiàn)“斷服&rdquo
    2025-12-17
  • 商湯科技林海:我們正迎來新一輪“算力效能”戰(zhàn)略競(jìng)爭(zhēng)

    新浪科技訊 12月15日下午消息,商湯科技大裝置事業(yè)群智算中心總經(jīng)理林海近日指出,全球算力基礎(chǔ)設(shè)施正迎來新一輪“算力效能”戰(zhàn)略競(jìng)爭(zhēng),商湯大裝置作為國內(nèi)領(lǐng)先的AI基礎(chǔ)設(shè)施,在算電協(xié)同領(lǐng)域的探索正以體系化
    2025-12-17

最新評(píng)論