首頁知識正文

Gemini 3中文測評結果發(fā)布：首超GPT

企業(yè)錄(www.falconvsmonkey.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶知識 2025-12-06 12:14:10

11月19日消息，中文2025年末全球AI競技場再掀波瀾，測評測評機構SuperCLUE最新報告顯示：谷歌Gemini-3-Pro-Preview在SuperCLUE 9月中文大模型基準測評中獲得了70.80的結果總分。

它超越 GPT-5(high) 1.43 分，發(fā)布較GPT-5.1(high)落后1.71分，首超位居全球第二。中文Gemini-2.5-Pro目前排名全球第七。測評

Gemini-3-Pro-Preview的結果推理效率相較于Gemini-2.5-Pro有些許提升，從平均每題花費32.2秒降低到31.9秒。發(fā)布推理成本從24.5元/百萬Tokens上升到32.0元/百萬Tokens。首超

據(jù)了解，中文本次測評覆蓋六大核心維度，測評數(shù)學推理、結果科學推理、發(fā)布代碼生成（含web開發(fā)）、首超智能體Agent（多輪工具調(diào)用）、幻覺控制、精確指令遵循。

與GPT-5.1(high)相比，Gemini-3-Pro-Preview的優(yōu)勢集中體現(xiàn)在幻覺控制，科學推理旗鼓相當，而在其他四個方面全面落敗。

友情鏈接