可靈2.6模型上線!語音、音效與畫面一鍵直出 重構(gòu)AI視頻創(chuàng)作工作流
12月3日,可靈可靈推出視頻生成2.6模型,模型該模型提供了里程碑式的上線I視“音畫同出”能力,徹底改變了傳統(tǒng)AI視頻生成模型“先無聲畫面、語音音效后人工配音”的畫面工作流程。它能夠在單次生成中,鍵直輸出包含自然語言、出重動作音效以及環(huán)境氛圍音的頻創(chuàng)完整視頻,重構(gòu)了AI視頻創(chuàng)作工作流,作工作流極大提升創(chuàng)作效率??伸`
▲ 可靈2.6功能界面
重構(gòu)AI視頻創(chuàng)作工作流 中文語音生成效果全球領(lǐng)先
可靈2.6模型升級了文生音畫、模型圖生音畫兩大功能,上線I視輸入文本或是語音音效輸入圖片結(jié)合提示詞文本,均可直接生成帶有語音、畫面音效及環(huán)境音的鍵直視頻。語音當(dāng)前支持生成中文以及英文,生成視頻長度最長支持10秒。
該升級重構(gòu)了傳統(tǒng)AI視頻創(chuàng)作“先生成無聲的視頻,再結(jié)合其他軟件完成后期聲音制作”的工作流,創(chuàng)作者使用可靈2.6模型,能夠直接生成包含人聲、環(huán)境與效果音效的視頻,極大提升了創(chuàng)作者的工作效率。
▲ 可靈2.6能夠生成包含人聲、環(huán)境與效果音效的完整視頻
通過對物理世界聲音與動態(tài)畫面的深度語義對齊,可靈2.6模型在音畫協(xié)同、音頻質(zhì)量和語義理解上表現(xiàn)亮眼。
音畫協(xié)同上,可靈2.6模型生成的視頻,在語音節(jié)奏、環(huán)境音與畫面動作上緊密呼應(yīng),實現(xiàn)了對畫面動態(tài)與聲音節(jié)奏的深度對齊,避免了傳統(tǒng)工作流可能產(chǎn)生的“畫面一套、聲音一套”的割裂體驗。
音頻質(zhì)量上,在支持人聲、音效、環(huán)境聲等多類型聲音生成的基礎(chǔ)上,生成的音頻音質(zhì)更干凈、層次更豐富,整體聽感更接近真實的混音效果,滿足專業(yè)級創(chuàng)作對聲音細(xì)節(jié)的高要求。
語義理解上,該模型對多種場景下的文本描述、口語表達(dá)和復(fù)雜劇情有較強(qiáng)的語義理解能力,能夠更準(zhǔn)確地把握創(chuàng)作者意圖,從而輸出邏輯更嚴(yán)密、更貼合用戶需求的音畫內(nèi)容。同時,可靈2.6模型在中文語音生成效果上保持全球領(lǐng)先。
一鍵“音畫同出” 廣告營銷、自媒體、電商等創(chuàng)作場景迎來效率革命
可靈2.6模型支持的聲音類型包括說話、對話、旁白、唱歌、Rap、環(huán)境音效、混合音效等多種聲音的單獨或混合生成,能夠廣泛地應(yīng)用于廣告營銷、自媒體、電商等行業(yè)視頻內(nèi)容創(chuàng)作中,極大提升創(chuàng)作效率。
例如在廣告營銷行業(yè),可靈2.6模型可一鍵生成含有旁白介紹、演員對白、商品展示音效等綜合聲音效果的廣告短片,極大降低廣告片拍攝的成本,提升效率。
▲ 可靈2.6生成短片故事
在自媒體領(lǐng)域,可靈2.6模型的應(yīng)用則更加廣泛。通過多人對白能力,創(chuàng)作者可以創(chuàng)作包含訪談節(jié)目、劇情演繹、搞笑短劇等多類型的內(nèi)容創(chuàng)作,還可以借助模型的音樂表演能力,進(jìn)行唱歌、說唱表演、樂器演奏等類型的內(nèi)容創(chuàng)作。運用可靈2.6模型,可大幅度降低自媒體創(chuàng)作者的創(chuàng)作成本與難度。
在電商領(lǐng)域,通過單人獨白、旁白解說等能力,能夠完成商品展示、產(chǎn)品講解等電商領(lǐng)域的視頻內(nèi)容創(chuàng)作,提升商家的經(jīng)營效率。
可靈2.6模型的推出,進(jìn)一步降低了內(nèi)容創(chuàng)意行業(yè)視頻創(chuàng)作的成本與難度,未來可靈AI也會持續(xù)開發(fā)更多實用功能,為創(chuàng)作者提供更優(yōu)質(zhì)、方便的AI視頻創(chuàng)作工具。