您的當(dāng)前位置:首頁 > 百科 > 豆包語音識別模型2.0發(fā)布:能聽懂字看懂圖 支持13種外語 正文
時(shí)間:2025-12-06 00:01:42 來源:網(wǎng)絡(luò)整理 編輯:百科
12月5日消息,今日,火山引擎發(fā)布豆包語音識別模型2.0Doubao-Seed-ASR-2.0),依托Seed混合專家大語言模型架構(gòu)構(gòu)建。據(jù)介紹,2.0版本模型推理能力提升,可以通過深度理解上下文完成
12月5日消息,豆包懂字今日,語音火山引擎發(fā)布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0),識別依托Seed混合專家大語言模型架構(gòu)構(gòu)建。模型
據(jù)介紹,發(fā)布2.0版本模型推理能力提升,看懂可以通過深度理解上下文完成精準(zhǔn)識別,圖支上下文整體關(guān)鍵詞召回率提升20%。持種
同時(shí)支持多模態(tài)視覺識別,外語不僅“聽懂字”還能“看懂圖”,豆包懂字通過單圖和多圖等視覺信息輸入讓文字識別更精準(zhǔn)。語音
此外,識別2.0版本還支持日語、模型韓語、發(fā)布德語、看懂法語等 13 種海外語種的精準(zhǔn)識別。
并且重點(diǎn)針對專有名詞、人名、地名、品牌名稱及易混淆多音字等復(fù)雜場景進(jìn)行了升級。
以歷史人物生平討論場景為例,當(dāng)用戶提及蘇轍貶謫地“筠(yún)州”時(shí),如果模型缺乏推理能力會易將其誤識別為同音的“云州”“鄆州”等。
而豆包語音識別模型2.0可依托“當(dāng)前討論蘇軾、蘇轍”這一背景,即便上下文從沒出現(xiàn)過“筠州”,也能通過邏輯推理鎖定用戶所指的特定地名,最終實(shí)現(xiàn)對多音字地名的精準(zhǔn)識別。
目前,豆包語音識別模型2.0已上線火山方舟體驗(yàn)中心并對外提供API服務(wù)。
華麗變身AI NAS!Intel重新定義:這才是NAS的未來2025-12-05 23:49
LMArena最新排名:文心大模型5.02025-12-05 23:40
華為奪中國成人智能手表線上第一 幾乎是蘋果、小米之和2025-12-05 23:13
“一帶一路”自然災(zāi)害防治和應(yīng)急管理國際合作機(jī)制擴(kuò)容2025-12-05 22:56
凱里·川田博之去世 《真人快打》制作人發(fā)文緬懷:首個(gè)塑造“尚宗”形象的演員2025-12-05 22:44
“一帶一路”自然災(zāi)害防治和應(yīng)急管理國際合作機(jī)制擴(kuò)容2025-12-05 22:32
蘋果iOS 26.1正式版發(fā)布:新增液態(tài)玻璃透明度調(diào)節(jié)、鬧鐘要滑動關(guān)閉2025-12-05 22:29
2K/210Hz僅739元!微星MAG 275QF E21顯示器圖賞2025-12-05 22:05
斯諾克英錦賽:中國選手四戰(zhàn)一勝 龐俊旭晉級八強(qiáng)2025-12-05 21:38
北京道路新增上百個(gè)電子鏡頭:處罰不禮讓斑馬線、駕車接打電話等行為2025-12-05 21:17
首款豆包手機(jī)賣斷貨 豆包回應(yīng):近期無貨 備貨傳聞不實(shí)2025-12-05 23:57
轉(zhuǎn)發(fā)周知!這種羽絨服穿得越久危害越大2025-12-05 23:56
中國移動:eSIM需具備機(jī)卡鎖定能力!境內(nèi)禁止下載境外運(yùn)營商數(shù)據(jù)2025-12-05 23:44
荒野求生女選手冷美人熬走80人 男選手:她真厲害2025-12-05 23:29
無聊的無人機(jī)市場 終于卷出了這么一個(gè)怪物2025-12-05 23:27
30歲小伙長期熬夜誘發(fā)腦膜炎:智力退回3歲 生活不能自理2025-12-05 22:54
中國移動:eSIM需具備機(jī)卡鎖定能力!境內(nèi)禁止下載境外運(yùn)營商數(shù)據(jù)2025-12-05 21:56
年輕人的第一輛純電轎跑!零跑Lafa5預(yù)售:10.58萬起2025-12-05 21:43
索尼命途多舛 內(nèi)存危機(jī)對PS6來說是一場噩夢2025-12-05 21:23
銳龍7 9800X3D網(wǎng)游、酷睿Ultra 9 285K對比:Intel搭配頂級8400MHz內(nèi)存依然差距巨大2025-12-05 21:18