OpenAI首席技術官透露Sora將于今年推出 加入音頻生成功能
近日,據《華爾街日報》報道,OpenAI首席技術官米拉・穆拉蒂在接受采訪時表示,公司計劃在今年推出名為Sora的新產品,但可能需要等待幾個月的時間。
穆拉蒂透露,除了向公眾提供Sora外,OpenAI還計劃為其加入音頻生成功能,以增強場景的逼真感。此外,公司還計劃允許用戶編輯Sora生成的內容,因為AI工具并不總能產生準確的結果。她表示,公司正在努力尋找方法,使用戶能夠自行編輯和創作影音內容。
對于Sora的訓練數據,穆拉蒂沒有透露太多細節,僅表示這些數據都是公開的或獲得許可的。她還提到,Sora使用的內容主要來自Shutterstock,但并沒有確定是否還使用了YouTube、Facebook和Instagram等平臺上的視頻。
另外,穆拉蒂指出,Sora在發布后很可能無法生成包含公眾人物的影音,并且生成的視頻將帶有AI水印。此前,Sora核心團隊成員在WVFRM播客頻道上表示,目前Sora仍處于反饋獲取階段,并不是一個完整的產品,暫時不會向公眾開放。
在此背景下,另一個文生視頻平臺Pika于3月10日宣布推出新功能,允許用戶在Pika生成的視頻中無縫生成和整合聲音。用戶可以通過提示詞描述想要的聲音,也可以讓Pika根據視頻內容自動生成聲音。
隨著人工智能技術的不斷發展,視頻生成和編輯工具的功能越來越強大,用戶將能夠更輕松地創建出高質量的影音內容。