国产激情AⅤ无码毛片_色播亚洲视频在线观看_亚洲无码熟妇破处在线观看_亚洲寡妇无码AV在线少妇

您的當(dāng)前位置:首頁 > 百科 > 豆包語音識別模型2.0發(fā)布:能聽懂字看懂圖 支持13種外語 正文

豆包語音識別模型2.0發(fā)布:能聽懂字看懂圖 支持13種外語

時(shí)間:2025-12-06 00:01:42 來源:網(wǎng)絡(luò)整理 編輯:百科

核心提示

12月5日消息,今日,火山引擎發(fā)布豆包語音識別模型2.0Doubao-Seed-ASR-2.0),依托Seed混合專家大語言模型架構(gòu)構(gòu)建。據(jù)介紹,2.0版本模型推理能力提升,可以通過深度理解上下文完成

12月5日消息,豆包懂字今日,語音火山引擎發(fā)布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0),識別依托Seed混合專家大語言模型架構(gòu)構(gòu)建。模型

據(jù)介紹,發(fā)布2.0版本模型推理能力提升,看懂可以通過深度理解上下文完成精準(zhǔn)識別,圖支上下文整體關(guān)鍵詞召回率提升20%。持種

同時(shí)支持多模態(tài)視覺識別,外語不僅“聽懂字”還能“看懂圖”,豆包懂字通過單圖和多圖等視覺信息輸入讓文字識別更精準(zhǔn)。語音

此外,識別2.0版本還支持日語、模型韓語、發(fā)布德語、看懂法語等 13 種海外語種的精準(zhǔn)識別。

并且重點(diǎn)針對專有名詞、人名、地名、品牌名稱及易混淆多音字等復(fù)雜場景進(jìn)行了升級。

以歷史人物生平討論場景為例,當(dāng)用戶提及蘇轍貶謫地“筠(yún)州”時(shí),如果模型缺乏推理能力會易將其誤識別為同音的“云州”“鄆州”等。

而豆包語音識別模型2.0可依托“當(dāng)前討論蘇軾、蘇轍”這一背景,即便上下文從沒出現(xiàn)過“筠州”,也能通過邏輯推理鎖定用戶所指的特定地名,最終實(shí)現(xiàn)對多音字地名的精準(zhǔn)識別。

目前,豆包語音識別模型2.0已上線火山方舟體驗(yàn)中心并對外提供API服務(wù)。