字節(jié)跳動 AI 助手豆包被曝開啟視頻生成內(nèi)測 進軍視頻創(chuàng)作領(lǐng)域
11月7日,根據(jù)《科創(chuàng)板日報》的報道字節(jié)跳動大模型AI助手“豆包”正式推出視頻生成內(nèi)測,標(biāo)志著公司正式進軍AI視頻創(chuàng)作領(lǐng)域。此次推出的視頻生成模型可支持圖片文字一鍵生成成片、動態(tài)運鏡、多鏡頭一致性,并允許用戶自由選擇風(fēng)格與比例,適用于電商營銷、動畫教育、城市文旅等多種行業(yè)應(yīng)用。
據(jù)報道,火山引擎總裁譚待表示,豆包視頻生成大模型在多風(fēng)格、多比例、一致性和多鏡頭生成方面達到了業(yè)界先進水平。與市面上現(xiàn)有的視頻生成工具不同,豆包的視頻生成模型能夠處理更復(fù)雜的任務(wù),例如多主體交互、動態(tài)動作和多鏡頭切換。這使得創(chuàng)作者可以生成更加自然連貫的影片,并且人物樣貌、服裝細節(jié)和頭飾在不同鏡頭下都能保持一致,接近實拍效果。
豆包視頻生成模型采用了先進的DiT架構(gòu),通過高效的計算單元,使得視頻能夠在大動態(tài)與運鏡中自由切換。用戶可以利用變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等多種鏡頭語言,實現(xiàn)更加豐富的視頻效果。此外,豆包還具備專業(yè)級的光影布局和色彩調(diào)和,使得生成的視頻在視覺效果上更加美觀和真實。
在風(fēng)格選擇方面,豆包的視頻生成模型支持多種藝術(shù)風(fēng)格,包括3D動畫、2D動畫、國畫、黑白畫、厚涂等,且能夠適配電影、電視、電腦、手機等多種設(shè)備的顯示比例。無論是企業(yè)場景中的電商營銷、教育培訓(xùn),還是專業(yè)創(chuàng)作者的藝術(shù)創(chuàng)作,豆包都能提供強有力的創(chuàng)作支持。
據(jù)火山引擎介紹,豆包視頻生成模型目前已經(jīng)在Pixeldance和Seaweed兩個版本上開展了邀測,企業(yè)用戶可以通過火山引擎官網(wǎng)提交測試申請。字節(jié)跳動此次進入視頻生成領(lǐng)域,無疑為創(chuàng)作者提供了更多的創(chuàng)作自由,同時也為相關(guān)行業(yè)提供了更為便捷和高效的內(nèi)容生產(chǎn)工具。