Sora刷屏視頻出現多處失誤OpenAI回應:正在積極改進
近日,據外媒報道,Sora所生成的視頻內容已經得到了影視行業人士的普遍認可。許多人認為,雖然Sora在視頻畫質、細節、光影和色彩等方面表現出色,但在涉及鏡頭運動角度和更精細內容調控方面仍存在不足。
一位紀錄片從業者表示,目前Sora還不能直接用于影視作品,因為其精細度還不夠。然而,他也認為Sora已經足夠震撼,完全可以用于前期開發,尤其是概念設計。
在直觀感受上,Sora模型產出的視頻運鏡自然,物體運動符合規律,鏡頭間邏輯一致性好,但邏輯性會差一點。具體表現在Sora視頻內容中,如一分鐘的東京街頭女郎漫步場景中,女郎走路過程中存在腿部變形、腿部交叉換位時錯亂等錯誤。
Sora是一種基于深度學習的視頻生成模型,它可以根據用戶輸入的文本或語音提示,自動合成出高質量的視頻內容。Sora的核心技術是OpenAI的大規模自監督語言模型GPT-3,它可以理解自然語言,并將其轉化為視頻序列。Sora的目標是成為一個世界模擬器,能夠為用戶提供各種可能的場景和體驗。
針對目前Sora存在的不成熟之處,OpenAI方面表示承認并正在積極改進。他們在《作為世界模擬器的視頻生成模型》技術報告中坦誠地指出了Sora作為模擬器的許多限制,如難以準確模擬復雜場景的物理原理、無法理解因果關系、可能混淆提示的空間細節等。OpenAI表示將繼續努力提升Sora的性能和精度,以期在未來為影視行業帶來更多創新和突破。