欧美三级不卡/成人97视频/四虎成人精品永久免费av九九 /国产一区二区精品91 - 成人三级在线播放

谷歌推出Gemini 2.5 Flash圖像編輯模型 AI修圖精度與角色一致性顯著提升

2025-08-27 16:36:59   |   唐薇   |   324

8月27日,谷歌DeepMind于8月26日正式發布新一代圖像生成與編輯模型Gemini 2.5 Flash。該模型在Gemini應用中實現了更精準的文字指令驅動圖像編輯能力,能夠在修改圖片時保持人物、動物或物體的外觀一致性,并在多項任務中表現優于OpenAI的GPT-4o,顯示出谷歌在多模態AI生成領域的持續進步。

與此前圖像生成工具相比,Gemini 2.5 Flash在根據復雜文本修改圖像方面展現出更高準確率。其最大亮點為“角色一致性”功能——在生成多張圖像時,即使背景、光線或主體姿態發生變化,模型仍能保持同一角色或物體的外觀統一。這一能力特別適合品牌宣傳、產品多角度展示和系列化視覺內容的批量制作。

該模型支持高精度的局部圖像編輯,用戶無需手動選擇區域即可通過文字指令實現背景虛化、物體移除、瑕疵修復和色彩調整等操作。此外,Gemini 2.5 Flash還具備多圖像融合能力,可一次性合并最多三張圖像,例如將產品圖像自然嵌入室內場景中,生成高度逼真的合成畫面。

“風格遷移”也是此次升級的重要功能,用戶可將某種紋理、色彩或圖案應用到目標對象上,同時保持其原有形狀與結構細節。更引人注目的是,模型還展現出初步的“現實推理”能力,能夠模擬簡單因果關系,例如生成“氣球飛向仙人掌并被刺破”的連貫畫面。

目前,Gemini 2.5 Flash的圖像編輯功能已在Gemini應用中上線,用戶需手動切換至“Flash”模型方可使用。生成圖像均帶有可見水印和不可見的SynthID數字水印,以聲明其AI生成屬性。開發者現可通過Gemini API、Google AI Studio和Vertex AI平臺接入該模型,其定價為每百萬輸出token 30美元,單張圖像處理成本約0.039美元。


特別提醒:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾,請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時發送相關信息至bireading@163.com,本站將會在48小時內處理完畢。

谷歌推出Gemini 2.5 Flash圖像編輯模型 AI修圖精度與角色一致性顯著提升

2025-08-27 16:36:59 瀏覽量: 324 作者: 唐薇

8月27日,谷歌DeepMind于8月26日正式發布新一代圖像生成與編輯模型Gemini 2.5 Flash。該模型在Gemini應用中實現了更精準的文字指令驅動圖像編輯能力,能夠在修改圖片時保持人物、動物或物體的外觀一致性,并在多項任務中表現優于OpenAI的GPT-4o,顯示出谷歌在多模態AI生成領域的持續進步。

與此前圖像生成工具相比,Gemini 2.5 Flash在根據復雜文本修改圖像方面展現出更高準確率。其最大亮點為“角色一致性”功能——在生成多張圖像時,即使背景、光線或主體姿態發生變化,模型仍能保持同一角色或物體的外觀統一。這一能力特別適合品牌宣傳、產品多角度展示和系列化視覺內容的批量制作。

該模型支持高精度的局部圖像編輯,用戶無需手動選擇區域即可通過文字指令實現背景虛化、物體移除、瑕疵修復和色彩調整等操作。此外,Gemini 2.5 Flash還具備多圖像融合能力,可一次性合并最多三張圖像,例如將產品圖像自然嵌入室內場景中,生成高度逼真的合成畫面。

“風格遷移”也是此次升級的重要功能,用戶可將某種紋理、色彩或圖案應用到目標對象上,同時保持其原有形狀與結構細節。更引人注目的是,模型還展現出初步的“現實推理”能力,能夠模擬簡單因果關系,例如生成“氣球飛向仙人掌并被刺破”的連貫畫面。

目前,Gemini 2.5 Flash的圖像編輯功能已在Gemini應用中上線,用戶需手動切換至“Flash”模型方可使用。生成圖像均帶有可見水印和不可見的SynthID數字水印,以聲明其AI生成屬性。開發者現可通過Gemini API、Google AI Studio和Vertex AI平臺接入該模型,其定價為每百萬輸出token 30美元,單張圖像處理成本約0.039美元。


,

Copyright ©2018 鉍讀網 All Rights Reserved.

京ICP備18051707號

京公網安備 11011302001633號