阿里通義大模型Wan2.2-I2V-Flash 上線 圖生視頻提速12倍
8月11日,阿里云正式發(fā)布通義萬相(Wan)大模型的最新版本W(wǎng)an2.2-I2V-Flash,該模型在圖生視頻(Image-to-Video)任務(wù)中實(shí)現(xiàn)重大突破,推理速度較前代Wan2.1提升12倍,同時(shí)成本大幅優(yōu)化,定價(jià)僅為0.1元/秒。此外,其“抽卡”成功率(即高質(zhì)量視頻生成率)提升123%,為影視、廣告等視覺創(chuàng)作領(lǐng)域提供高效工具。
據(jù)官方介紹,Wan2.2-I2V-Flash的核心優(yōu)勢體現(xiàn)在三方面:
1. 極速生成:通過架構(gòu)優(yōu)化,模型響應(yīng)效率顯著提高,適合實(shí)時(shí)或批量視頻生成需求。
2. 精準(zhǔn)控制:支持復(fù)雜運(yùn)鏡指令(如推拉、搖移)和特效提示詞(如粒子、光影),生成畫面更符合專業(yè)級影視要求。
3. 風(fēng)格一致性:對輸入圖像的風(fēng)格(如插畫、寫實(shí)、CG)保持高度還原,動(dòng)態(tài)效果自然合理。
此次更新是阿里通義萬相系列模型的又一次迭代。早在7月28日,阿里已開源Wan2.2的三個(gè)子模型,包括文生視頻(T2V)、圖生視頻(I2V)和統(tǒng)一視頻生成(IT2V),其中前兩者采用MoE(混合專家)架構(gòu),總參數(shù)量27B,激活參數(shù)14B,在保證生成質(zhì)量的同時(shí)降低計(jì)算消耗。開源模型還首創(chuàng)“電影美學(xué)控制系統(tǒng)”,可精細(xì)調(diào)節(jié)光影、色彩等元素,接近專業(yè)電影制作水平。
目前,Wan2.2-I2V-Flash已通過阿里云百煉平臺(tái)開放API調(diào)用,開發(fā)者可快速集成至工作流。業(yè)內(nèi)分析認(rèn)為,該模型將加速短視頻、游戲、電商等內(nèi)容生產(chǎn)領(lǐng)域的效率革新,而其高性價(jià)比也有望推動(dòng)AI視頻生成技術(shù)的大規(guī)模商用。