在近日公布的中國(guó)國(guó)際權(quán)威醫(yī)學(xué)多模態(tài)推理評(píng)測(cè)集MedXpertQA的MM子集榜單中,由中國(guó)企業(yè)緣啟智慧(北京)科技有限公司自主研發(fā)的閃耀醫(yī)療AI智能體MentX一舉斬獲中國(guó)區(qū)第一名,全球第二,國(guó)際國(guó)區(qū)力壓GPT-4o、權(quán)威全球GPT-5-mini等國(guó)際主流大模型,醫(yī)學(xué)醫(yī)學(xué)展現(xiàn)出“斷崖式”領(lǐng)先優(yōu)勢(shì)。評(píng)測(cè)
此次MedXpertQA評(píng)測(cè)為全球公開、多第中第標(biāo)準(zhǔn)化的模態(tài)多模態(tài)醫(yī)學(xué)推理挑戰(zhàn),涵蓋復(fù)雜臨床場(chǎng)景下的推理影像識(shí)別、病歷理解與診斷推理能力評(píng)估,中國(guó)吸引了來自中美歐多地的閃耀主流AI模型參與,被譽(yù)為“醫(yī)療AI領(lǐng)域的國(guó)際國(guó)區(qū)奧林匹克”。在這一國(guó)際化舞臺(tái)上,權(quán)威全球MentX不僅躋身全球前列,醫(yī)學(xué)醫(yī)學(xué)更以顯著優(yōu)勢(shì)成為中國(guó)唯一進(jìn)入第一梯隊(duì)的評(píng)測(cè)醫(yī)療智能體。
數(shù)據(jù)顯示,MentX在“多模態(tài)推理”(Reasoning)和“醫(yī)學(xué)理解”(Understanding)兩項(xiàng)核心指標(biāo)上分別取得69.38分和72.36分的優(yōu)異成績(jī),綜合得分70.19%,僅次于頂尖模型GPT-5(72.18%),但大幅領(lǐng)先于GPT-4o(42.8%)、GPT-5-mini(60.94%)及人類預(yù)執(zhí)業(yè)專家水平(45.53%),實(shí)現(xiàn)了對(duì)國(guó)際主流模型的全面超越。
尤為值得關(guān)注的是,排名領(lǐng)先的GPT-5系列模型訓(xùn)練數(shù)據(jù)主要基于歐美人群的醫(yī)療記錄,相比之下,MentX從研發(fā)之初即聚焦中國(guó)臨床實(shí)踐,依托國(guó)家衛(wèi)健委臨床醫(yī)學(xué)指南和醫(yī)學(xué)共識(shí),深度融合國(guó)人的病理特征、診療習(xí)慣,在電子病歷、醫(yī)學(xué)影像與實(shí)驗(yàn)室檢查等多源信息融合方面更具本土適應(yīng)性。
“這意味著,MentX不僅在技術(shù)指標(biāo)上趕超國(guó)際先進(jìn)水平,更在臨床實(shí)用性上更懂‘中國(guó)病、中國(guó)人’。”一位業(yè)內(nèi)專家向記者表示,“對(duì)于中國(guó)醫(yī)生和患者而言,一個(gè)基于本土臨床實(shí)踐、符合中國(guó)醫(yī)療流程的AI系統(tǒng),其輔助診斷的準(zhǔn)確性和可解釋性更具現(xiàn)實(shí)價(jià)值。”
據(jù)緣啟智慧方面介紹,MentX采用鏈?zhǔn)剿季S(Chain-of-Thought)推理架構(gòu),能夠模擬醫(yī)生循證診療過程,輸出清晰的診斷邏輯鏈,其強(qiáng)大的多模態(tài)融合能力可對(duì)B超、CT、MRI等影像與文本病歷進(jìn)行精準(zhǔn)解讀,甚至能準(zhǔn)確識(shí)別患者的咳嗽聲、皮膚的照片,實(shí)現(xiàn)全科、多模態(tài)醫(yī)學(xué)循證,像真正的醫(yī)生一樣“望聞問切”,顯著提升臨床決策效率。
業(yè)內(nèi)人士指出,MentX在國(guó)際評(píng)測(cè)中脫穎而出,標(biāo)志著中國(guó)醫(yī)療AI已從“跟跑”邁向“并跑”甚至局部“領(lǐng)跑”階段。隨著政策支持與技術(shù)迭代加速,國(guó)產(chǎn)醫(yī)療AI有望在基層醫(yī)療、慢病管理、智慧醫(yī)院等場(chǎng)景中加速落地。
緣啟智慧表示,未來將持續(xù)優(yōu)化MentX在真實(shí)世界環(huán)境中的泛化能力與安全性,推動(dòng)AI全科診斷系統(tǒng)在全國(guó)各級(jí)醫(yī)療機(jī)構(gòu)普及應(yīng)用,助力“健康中國(guó)”戰(zhàn)略縱深推進(jìn)。
頂: 3153踩: 3
中國(guó)AI閃耀國(guó)際權(quán)威醫(yī)學(xué)評(píng)測(cè)!MentX多模態(tài)醫(yī)學(xué)推理全球第二 中國(guó)區(qū)第一
人參與 | 時(shí)間:2025-12-05 08:17:11
評(píng)論專區(qū)
相關(guān)文章
- 官宣:神舟二十一號(hào)航天員乘組近日將第一次出艙
- 蘋果19年老將跳槽!iOS 26液態(tài)玻璃創(chuàng)造者被Meta挖走
- 329買內(nèi)存條一眨眼漲價(jià)到999!美光突然宣布退出零售存儲(chǔ)業(yè)務(wù) 專攻HBM
- 新國(guó)標(biāo)電動(dòng)車爬坡動(dòng)力實(shí)測(cè):速度跟人跑一樣 被舊標(biāo)車嗖嗖超車
- 索泰新款迷你游戲主機(jī)首發(fā)20999元起:RTX 5070 Ti獨(dú)顯 僅8.48L
- 吳建豪暴瘦:身高1米8僅100斤
- 戴維·瓊斯《DAVY x JONES》耕升RTX 5060 踏雪 OC海盜冥界冒險(xiǎn)
- 12月3日人民幣對(duì)美元中間價(jià)報(bào)7.0754元 上調(diào)40個(gè)基點(diǎn)
- TCL科技COO王成:AI賦能 讓產(chǎn)業(yè)發(fā)展更具韌性與活力
- 蘋果19年老將跳槽!iOS 26液態(tài)玻璃創(chuàng)造者被Meta挖走





