&

知識: Kimi最強開源思考模型 Kimi K2 Thinking發(fā)布：推理等超越GPT
時間：2010-12-5 17:23:32 作者：休閑來源：熱點查看：評論：0
內(nèi)容摘要：11月7日消息，日前，月之暗面宣布發(fā)布Kimi K2Thinking，這是Kimi 迄今能力最強的開源思考模型。目前，該模型已上線kimi.com和最新版Kimi手機應(yīng)用的常規(guī)對話模式。據(jù)了解，Kim
11月7日消息，最強日前，開源月之暗面宣布發(fā)布Kimi K2 Thinking，思考這是模型Kimi 迄今能力最強的開源思考模型。
目前，布推該模型已上線kimi.com和最新版Kimi手機應(yīng)用的最強常規(guī)對話模式。
據(jù)了解，開源Kimi K2 Thinking原生掌握“邊思考，思考邊使用工具”的模型能力，在人類最后的布推考試（Humanity's Last Exam）、自主網(wǎng)絡(luò)瀏覽能力（BrowseComp）、最強復(fù)雜信息收集推理（SEAL-0）等多項基準測試中表現(xiàn)達到SOTA水平，開源超越GPT-5。思考
在Agentic搜索、模型Agentic編程、布推寫作和綜合推理能力等方面也取得全面提升。
據(jù)介紹，該模型無需人類干預(yù)，即可自主實現(xiàn)高達300輪的工具調(diào)用和持續(xù)穩(wěn)定的多輪思考能力，從而幫助用戶解決更復(fù)雜的問題。
人類最后的考試是一項涵蓋100多個專業(yè)領(lǐng)域的終極封閉式學(xué)術(shù)測試。
在允許使用工具——搜索、Python、網(wǎng)絡(luò)瀏覽工具的同等情況下，Kimi K2 Thinking在這項基準評測中取得了44.9%的SOTA成績。
根據(jù)官方示例顯示，Kimi K2 Thinking經(jīng)過5輪搜索和推理，結(jié)合每輪搜索到的新信息，層層深入，最終推理出了答案：
此外，在復(fù)雜搜索和瀏覽場景中，Kimi K2 Thinking模型也表現(xiàn)出色。
BrowseComp是由OpenAI發(fā)布的一個專門評估AI Agent網(wǎng)絡(luò)瀏覽能力的基準測試，這項測試的初衷是衡量AI Agent在信息過載環(huán)境中展現(xiàn)出的堅持性與創(chuàng)造力，即能否像人類研究員一樣“刨根問底”。
在這項極具挑戰(zhàn)的任務(wù)上，人類平均只能達到29.2%的成績。
Kimi K2 Thinking在這項基準測試中展現(xiàn)出極強的鉆研能力，以60.2%的成績成為新的SOTA模型。
在長程規(guī)劃和自主搜索能力的驅(qū)動下，Kimi K2 Thinking可借助多達上百輪的“思考→搜索→瀏覽網(wǎng)頁→思考→編程”動態(tài)循環(huán)，持續(xù)地提出并完善假設(shè)、驗證證據(jù)、進行推理，并構(gòu)建出邏輯一致的答案。
這種邊主動搜索邊持續(xù)思考的能力，使Kimi K2 Thinking能夠?qū)⒛：议_放式的問題分解為清晰、可執(zhí)行的子任務(wù)。
在官方示例中，Kimi K2 Thinking經(jīng)過兩輪搜索和思考，先根據(jù)股票回購的已知信息找到了這家制造快速的公司，然后在美國證券交易委員會（SEC）的官網(wǎng)上找到了股票回購公告信息，得出了準確的答案：
AMD最強X3D處理器！9950X3D2將用全新CCD：沖擊更高頻率
 亞馬遜云科技首席執(zhí)行官 Matt Garman：亞馬遜云業(yè)務(wù)年增220億美元，增量超半數(shù)《財富》500強企業(yè)全年收入

最近更新

2025-12-05 08:26:24
文遠知行 WePilot 3.0 硬核輸出！星途星紀元ES問鼎“最嚴”智駕大賽
2025-12-05 08:26:24
“熊貓杯”慢壘聯(lián)賽分站賽結(jié)束共辦52站完賽近千場
2025-12-05 08:26:24
中新電競對話清融：在幻想人生里，依然是職業(yè)選手
2025-12-05 08:26:24
虛標容量、無3C認證禁止登機中消協(xié)點名充電寶退貨問題
2025-12-05 08:26:24
魯大師11月新機性能/流暢/AI榜：榮耀性能/AI雙冠 OPPO流暢稱王，華為“隱形參戰(zhàn)”
2025-12-05 08:26:24
《西游記續(xù)集》沙僧扮演者劉大剛?cè)ナ溃合砟?8歲
2025-12-05 08:26:24
深藍汽車壓到地磚連人帶車被彈飛！網(wǎng)友：電池爛了都沒起火
2025-12-05 08:26:24
火車票最低4折！1300余趟列車淡季打折

熱門排行

2025-12-05 08:26:24
AMD最強X3D處理器！9950X3D2將用全新CCD：沖擊更高頻率
2025-12-05 08:26:24
深圳警方“空中哨兵”護航十五運突發(fā)警情秒級響應(yīng)
2025-12-05 08:26:24
三星超級品牌周手機、家電狂歡：最高滿減1000元
2025-12-05 08:26:24
就要改寫馬拉松歷史的他，離開了這個世界
2025-12-05 08:26:24
阿里千問辦公能力升級：文檔可一站式操作，PPT生成免費
2025-12-05 08:26:24
關(guān)于PS6的一切：5080級性能！原生掌機兼容PS4/5
2025-12-05 08:26:24
小薩馬蘭奇擔(dān)任形象大使 2025上海中心高塔競速挑戰(zhàn)賽將于11月開賽
2025-12-05 08:26:24
“杭州六小龍”首聚烏鎮(zhèn) 馮驥回應(yīng)為何起名游戲科學(xué)

友情鏈接

真水深火熱！年薪178萬元不夠花：美國1/4家庭陷入月光困境

廣汽集團與阿里云達成全棧AI戰(zhàn)略合作

中國廠商不買英偉達只是開始！摩爾線程終于要上市了募資80億猛攻高端GPU

国产激情AⅤ无码毛片_色播亚洲视频在线观看_亚洲无码熟妇破处在线观看_亚洲寡妇无码AV在线少妇

Kimi最強開源思考模型 Kimi K2 Thinking發(fā)布：推理等超越GPT