色屁屁WWW影院免费观看入口,亚洲 欧美 激情 小说 另类 ,久久精品国产亚洲av麻豆图片 ,亚洲 欧美 激情 小说 另类

集團(tuán)站

可靈AI推出“多圖參考”功能 進(jìn)一步攻克AI視頻一致性難題

2025-02-06

來源:互聯(lián)網(wǎng)

近日,快手可靈AI正式面向全球推出“多圖參考”模式,該功能能夠理解和整合多個(gè)圖片中的不同主體,根據(jù)用戶的文字描述,創(chuàng)造性地生成融合視頻,進(jìn)一步攻克了AI視頻生成中的一致性難題。

目前,全球用戶均可在可靈1.6模型下,使用“多圖參考”功能。用戶只需選擇圖生視頻,上傳1-4張參考圖,框選圖片中需要使用的人物、動(dòng)物、物品或場(chǎng)景,并通過“提示詞”描述它們之間的變化或互動(dòng),可靈AI即可結(jié)合所有參考內(nèi)容并遵從指令生成視頻。

用戶可以上傳一張或多張同一主體(人物、動(dòng)物、影視角色或物品等)的圖片,模型會(huì)以這些圖片為參考,生成統(tǒng)一風(fēng)格的視頻,幫助用戶在制作AI視頻時(shí)保證多鏡頭中的主體一致。例如,用戶上傳貓、夾克、太陽鏡三張圖片,并輸入提示詞“一只身穿夾克、戴著太陽鏡的擬人化貓?jiān)谖枧_(tái)上轉(zhuǎn)身并對(duì)著鏡頭擺姿勢(shì),”隨后進(jìn)行生成,就可以得到符合指令的視頻。

此外,用戶還可以通過參考圖來指定場(chǎng)景、服裝和動(dòng)作等,讓人物在特定環(huán)境中完成特定“演出”,大幅提升創(chuàng)作的可控性。例如,我們分別上傳一個(gè)老爺爺、一杯咖啡、咖啡館場(chǎng)景三張參考圖片,并輸入相應(yīng)提示詞“一個(gè)卡通風(fēng)格的老爺爺在咖啡館里,端起咖啡杯”來進(jìn)行生成,便可得到老爺爺坐在咖啡館里喝咖啡的視頻 。

同時(shí),“多圖參考”還可以支持不同角色之間的互動(dòng)。用戶可以上傳多個(gè)人物、動(dòng)物或者影視角色等圖片,并用文字描述他們之間的互動(dòng)。例如,我們分別上傳小男孩、柯基犬兩張參考圖,并輸入提示詞“一個(gè)可愛的小男孩在撫摸一只柯基犬”,即可生成下圖所示的視頻。

此前,可靈AI已在全球上線“人臉模型”功能,支持用戶通過上傳多段視頻來訓(xùn)練、定制人臉模型,并參照該人臉模型繼續(xù)生成視頻內(nèi)容。作為業(yè)內(nèi)首個(gè)視頻模型定制功能,“人臉模型”創(chuàng)新性地滿足了用戶創(chuàng)作多個(gè)包含同一人物鏡頭的需求。

隨著“多圖參考”功能的推出,可靈AI進(jìn)一步解決了視頻生成中的一致性難題,幫助用戶充分發(fā)揮創(chuàng)造力,自由組合各種圖片元素,打造獨(dú)特的創(chuàng)意場(chǎng)景,探索更多可能。



更多新聞
學(xué)而思位晨:“新質(zhì)學(xué)習(xí)力”是要用AI技術(shù)幫孩子和家長(zhǎng)減負(fù)

學(xué)而思位晨:“新質(zhì)學(xué)習(xí)力”是要用AI技術(shù)幫孩子和家長(zhǎng)減負(fù)

谷歌開源諾獎(jiǎng)化學(xué)模型 Alphafold3,推動(dòng) AI 變革生物領(lǐng)域

谷歌開源諾獎(jiǎng)化學(xué)模型 Alphafold3,推動(dòng) AI 變革生物領(lǐng)域

AI驅(qū)動(dòng)零售創(chuàng)新,騰訊云攜手行業(yè)專家共探智能化轉(zhuǎn)型之路

AI驅(qū)動(dòng)零售創(chuàng)新,騰訊云攜手行業(yè)專家共探智能化轉(zhuǎn)型之路