谷歌向部分私人用戶開放 Veo 和 Imagen 3 生成式 AI 模型
12月5日,從今天開始,谷歌 Vertex AI Google Cloud 套件的客戶可以開始使用Veo從文本提示和圖像生成視頻。然后,從下周開始,谷歌將向這些用戶提供其最新的文本轉圖像框架 Imagen 3。
Veo 是谷歌推出的全新 AI 視頻生成模型,也是全球首個由超大規模云提供商推出的圖像轉視頻模型。通過文本提示或圖像輸入,Veo 能夠生成“連貫且一致”的視頻內容,支持 1080p 分辨率并且可持續播放 一分鐘以上。用戶可以直接通過上傳的圖片(無論是 AI 生成還是人工拍攝)作為起點,創造動態視覺內容。
谷歌展示的示例視頻強調了 Veo 的創造力和技術潛力,但也揭示了一些限制。例如,在烤棉花糖的視頻中,棉花糖未能正確模擬受熱變化;在音樂會場景中,手部細節存在偽影。與 Veo 相輔相成,Imagen 3 是谷歌的最新文本轉圖像框架,具備更先進的細節表現、光影處理和偽影減少能力。谷歌聲稱,Imagen 3 在圖像質量方面超越了前代版本。然而,測試樣本顯示,該模型在某些情況下仍需進一步改進。例如,針對“閃光攝影”的提示生成的圖像,拍攝對象未能完美契合提示意圖。
谷歌希望通過這兩款 AI 模型,加速生成式 AI 在企業客戶中的應用。谷歌引用其研究數據稱,采用生成式 AI 的公司中有 86% 實現了收入增長,進一步表明生成式 AI 的潛在商業價值。然而,一項由 Appen 進行的調查也指出,人工智能項目的投資回報率在 2023 至 2024 年間下降了 4.6 個百分點,說明這一領域仍面臨成本效益挑戰。