阿里云通義千問(wèn)發(fā)布Qwen-Image-Edit 圖像編輯AI邁入精準(zhǔn)可控新時(shí)代
8月19日,阿里云旗下通義千問(wèn)團(tuán)隊(duì)正式推出Qwen-Image-Edit圖像編輯模型,標(biāo)志著AI圖像處理技術(shù)從生成向精準(zhǔn)編輯的重要跨越。這款基于20B參數(shù)Qwen-Image模型進(jìn)一步訓(xùn)練的創(chuàng)新產(chǎn)品,成功實(shí)現(xiàn)了對(duì)圖像內(nèi)容從語(yǔ)義到像素級(jí)別的雙重控制。
Qwen-Image-Edit的創(chuàng)新之處在于其獨(dú)特的雙通道處理架構(gòu)。通過(guò)同時(shí)接入Qwen2.5-VL模型和VAE編碼器,該技術(shù)既能理解圖像的深層語(yǔ)義,又能精確控制視覺(jué)外觀表現(xiàn)。這種雙重能力使其不僅可以完成IP形象創(chuàng)作、物體旋轉(zhuǎn)等需要保持語(yǔ)義一致的高階編輯,還能實(shí)現(xiàn)文字修改、元素增減等要求局部精確控制的低階操作。特別是在文字編輯方面,模型能夠精準(zhǔn)保持原有字體風(fēng)格,支持中英文雙語(yǔ)的無(wú)縫修改。
從官方展示的案例來(lái)看,該技術(shù)已具備豐富的實(shí)用價(jià)值。在創(chuàng)意設(shè)計(jì)領(lǐng)域,可以快速生成MBTI十六型人格表情包等IP衍生內(nèi)容;在商業(yè)攝影后期,能輕松完成人物背景替換、服裝調(diào)整等復(fù)雜操作;對(duì)于平面設(shè)計(jì)行業(yè),則提供了直接修改海報(bào)文字的便捷工具。更令人印象深刻的是其"鏈?zhǔn)骄庉?quot;能力,通過(guò)分步驟漸進(jìn)修正,最終實(shí)現(xiàn)了《蘭亭集序》書法作品的精準(zhǔn)修復(fù),展現(xiàn)出處理復(fù)雜文化內(nèi)容的潛力。