游客發(fā)表
發(fā)帖時(shí)間:2025-12-05 07:57:37
11月19日消息,中文2025年末全球AI競(jìng)技場(chǎng)再掀波瀾,測(cè)評(píng)測(cè)評(píng)機(jī)構(gòu)SuperCLUE最新報(bào)告顯示:谷歌Gemini-3-Pro-Preview在SuperCLUE 9月中文大模型基準(zhǔn)測(cè)評(píng)中獲得了70.80的結(jié)果總分。
它超越 GPT-5(high) 1.43 分,發(fā)布較GPT-5.1(high)落后1.71分,首超位居全球第二。中文Gemini-2.5-Pro目前排名全球第七。測(cè)評(píng)
Gemini-3-Pro-Preview的結(jié)果推理效率相較于Gemini-2.5-Pro有些許提升,從平均每題花費(fèi)32.2秒降低到31.9秒。發(fā)布推理成本從24.5元/百萬(wàn)Tokens上升到32.0元/百萬(wàn)Tokens。首超
據(jù)了解,中文本次測(cè)評(píng)覆蓋六大核心維度,測(cè)評(píng)數(shù)學(xué)推理、結(jié)果科學(xué)推理、發(fā)布代碼生成(含web開(kāi)發(fā))、首超智能體Agent(多輪工具調(diào)用)、幻覺(jué)控制、精確指令遵循。
與GPT-5.1(high)相比,Gemini-3-Pro-Preview的優(yōu)勢(shì)集中體現(xiàn)在幻覺(jué)控制,科學(xué)推理旗鼓相當(dāng),而在其他四個(gè)方面全面落敗。
相關(guān)內(nèi)容
隨機(jī)閱讀
熱門排行
友情鏈接