欧美三级不卡/成人97视频/四虎成人精品永久免费av九九 /国产一区二区精品91 - 成人三级在线播放

谷歌 DeepMind 推出 AI 視頻配音技術 為無聲視頻生成動態背景音樂

2024-06-19 09:06:19   |   弘樂   |   641

6月19日,谷歌旗下的人工智能實驗室 DeepMind 宣布了一項突破性的“video-to-audio”技術,該技術利用 AI 模型為無聲視頻生成背景音樂,標志著視頻音頻合成領域的重大進展。

據鉍讀了解,DeepMind 的“video-to-audio”模型能夠根據無聲視頻生成背景音樂和音效,盡管目前還需要用戶提供提示詞進行音效的預設。這一技術通過結合視頻內容與用戶提示詞,實現視頻與音頻的動態匹配,為視頻創作和多媒體制作提供了新的可能性。

其工作原理:

1. 視頻拆解:首先,模型會將輸入的無聲視頻進行拆解,提取視頻畫面的特征。

2. 提示詞結合:用戶提供文字提示,描述視頻可能的聲音或音效場景。例如,對于一條描述“在黑暗中行走”的視頻,提示詞可以是“電影、恐怖片、音樂、緊張、混凝土上的腳步聲”。

3. 擴散模型生成:利用擴散模型,結合視頻特征和提示詞進行反復運算,最終生成與視頻內容協調的背景音效。

這一技術使得 AI 能夠在生成過程中自動調整音效,使其與視頻中的場景、情緒和動作保持一致。例如,對于一段懸疑片段,AI 可以生成令人緊張的音樂和腳步聲,以增強觀眾的觀影體驗。

當前,DeepMind 的模型依然存在一些局限性:提示詞依賴:需要開發者輸入提示詞進行預設,不能完全獨立生成音效。口型同步:尚無法精確同步視頻中人物的對白和口型。展望未來,DeepMind 表示正在努力優化模型,使其能夠直接根據視頻內容生成背景音效,無需依賴提示詞。此外,未來版本的模型還將提升對白同步的能力,確保音效與視頻中的人物口型準確匹配。

這一技術的潛在應用范圍廣泛,包括但不限于,電影和視頻制作:為無聲視頻自動生成背景音效,減少人工音效合成的成本和時間。游戲開發:動態生成游戲場景中的背景音樂和音效,提升玩家的沉浸感。虛擬現實和增強現實:增強沉浸式體驗,通過動態音效提供更真實的互動感。

特別提醒:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾,請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時發送相關信息至bireading@163.com,本站將會在48小時內處理完畢。

谷歌 DeepMind 推出 AI 視頻配音技術 為無聲視頻生成動態背景音樂

2024-06-19 09:06:19 瀏覽量: 641 作者: 弘樂

6月19日,谷歌旗下的人工智能實驗室 DeepMind 宣布了一項突破性的“video-to-audio”技術,該技術利用 AI 模型為無聲視頻生成背景音樂,標志著視頻音頻合成領域的重大進展。

據鉍讀了解,DeepMind 的“video-to-audio”模型能夠根據無聲視頻生成背景音樂和音效,盡管目前還需要用戶提供提示詞進行音效的預設。這一技術通過結合視頻內容與用戶提示詞,實現視頻與音頻的動態匹配,為視頻創作和多媒體制作提供了新的可能性。

其工作原理:

1. 視頻拆解:首先,模型會將輸入的無聲視頻進行拆解,提取視頻畫面的特征。

2. 提示詞結合:用戶提供文字提示,描述視頻可能的聲音或音效場景。例如,對于一條描述“在黑暗中行走”的視頻,提示詞可以是“電影、恐怖片、音樂、緊張、混凝土上的腳步聲”。

3. 擴散模型生成:利用擴散模型,結合視頻特征和提示詞進行反復運算,最終生成與視頻內容協調的背景音效。

這一技術使得 AI 能夠在生成過程中自動調整音效,使其與視頻中的場景、情緒和動作保持一致。例如,對于一段懸疑片段,AI 可以生成令人緊張的音樂和腳步聲,以增強觀眾的觀影體驗。

當前,DeepMind 的模型依然存在一些局限性:提示詞依賴:需要開發者輸入提示詞進行預設,不能完全獨立生成音效。口型同步:尚無法精確同步視頻中人物的對白和口型。展望未來,DeepMind 表示正在努力優化模型,使其能夠直接根據視頻內容生成背景音效,無需依賴提示詞。此外,未來版本的模型還將提升對白同步的能力,確保音效與視頻中的人物口型準確匹配。

這一技術的潛在應用范圍廣泛,包括但不限于,電影和視頻制作:為無聲視頻自動生成背景音效,減少人工音效合成的成本和時間。游戲開發:動態生成游戲場景中的背景音樂和音效,提升玩家的沉浸感。虛擬現實和增強現實:增強沉浸式體驗,通過動態音效提供更真實的互動感。

,

Copyright ©2018 鉍讀網 All Rights Reserved.

京ICP備18051707號

京公網安備 11011302001633號