谷歌Gemini 1.5評價OpenAI Sora的視頻 質疑存在多處不合理
近日,谷歌的人工智能模型 Gemini 1.5 對 OpenAI Sora 生成的一段視頻進行了評價,稱其在視覺上很吸引人,但一些不合理之處可以看出其不是真實的視頻。
雙方分別發布了各自的最新技術:谷歌推出 Gemini 1.5 Pro,OpenAI 則推出了文本轉視頻工具 Sora。Sora 的發布時機引發猜測,有人認為 OpenAI 是為了轉移公眾對谷歌 Gemini 1.5 的注意力。
谷歌一位高管在 X 平臺上分享了對 Sora 生成視頻的詳細分析,Gemini 1.5 Pro 以 Sora 生成的日本一條既有雪景又有櫻花盛開的街道視頻為例,指出視頻存在明顯不合理之處。
根據 Gemini 1.5 Pro 的分析,大雪紛飛和盛開的櫻花同時出現并不符合常理,因為櫻花通常在春季開放,不會伴有降雪。而且雪的下落方式非常均勻,這不是現實生活中通常的降雪方式。此外,視頻中的人物雖然身處大雪環境,卻并未穿著任何冬裝,這也顯得非常違和。
Gemini 1.5 在分析中總結道:“總而言之,這段視頻雖然視覺上很吸引人,但其中的矛盾之處表明它并非現實生活中的場景。”
Sora 是一款能夠生成長達 60 秒視頻的文本轉視頻工具,可以創建包含細節豐富的場景、復雜攝像機運動以及具有豐富情感的多個人物畫面,許多人將其稱為視頻生成領域的 “ChatGPT 時刻”。
而谷歌的 Gemini 1.5 則擁有驚人的 100 萬詞條上下文窗口,遠超 GPT-4 Turbo 的 12.8 萬和 Anthropic Claude 2.1 的 20 萬。這意味著它可以一次處理大量信息,包括 1 小時的視頻、11 小時的音頻以及超過 30,000 行代碼或 70 萬字的代碼庫。