欧美三级不卡/成人97视频/四虎成人精品永久免费av九九 /国产一区二区精品91 - 成人三级在线播放

NVIDIA 推出 Fugatto 可以根據(jù)文本提示創(chuàng)建音頻

2024-11-26 10:08:48   |   微觀獵人   |   2745

11月26日,據(jù)報道,NVIDIA 宣布推出一款名為 Foundational Generative Audio Transformer Opus 1(簡稱 Fugatto)的實驗性生成式 AI 模型。被稱為“聲音的瑞士軍刀”,F(xiàn)ugatto 能夠從文本提示生成音頻內(nèi)容,也可以對現(xiàn)有的音樂、語音和聲音文件進行高精度修改。目前,NVIDIA 尚未透露是否會向公眾開放 Fugatto,或何時推出商業(yè)版本。

據(jù)報道,F(xiàn)ugatto 由全球頂尖 AI 研究人員團隊共同開發(fā),具備強大的 多語言和多口音能力。NVIDIA 應(yīng)用音頻研究經(jīng)理 Rafael Valle 表示,該項目的目標是“創(chuàng)建一個能夠像人類一樣理解和生成聲音的模型”。

該模型不僅可以生成逼真的聲音,還能根據(jù)上下文和預(yù)訓(xùn)練指令完成復(fù)雜的音頻任務(wù)。例如,它可以生成具有特定口音的情緒化語音,或模擬大自然中動態(tài)變化的聲音場景,例如暴雨穿越地面的沖擊聲。

NVIDIA 在公告中列舉了 Fugatto 的多種潛在應(yīng)用場景。Fugatto 可以幫助音樂制作人快速生成歌曲原型,從而節(jié)省創(chuàng)作時間。用戶還能嘗試不同的風(fēng)格、聲音和樂器,探索新的創(chuàng)作方向。Fugatto 還能夠根據(jù)用戶需求,用特定聲音生成學(xué)習(xí)材料,為語言學(xué)習(xí)和其他教育工具提供個性化支持。游戲開發(fā)者可利用 Fugatto 為游戲中的音效生成多種變體,根據(jù)玩家選擇和游戲情境調(diào)整音頻表現(xiàn),增強沉浸式體驗。Fugatto 的設(shè)計使其在經(jīng)過微調(diào)后,能夠完成超出預(yù)訓(xùn)練任務(wù)的復(fù)雜需求,例如結(jié)合多種音效生成自然音景或特殊場景的音頻。

特別提醒:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字、圖片等內(nèi)容的真實性、完整性、及時性本站不作任何保證或承諾,請自行核實相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時發(fā)送相關(guān)信息至bireading@163.com,本站將會在48小時內(nèi)處理完畢。

NVIDIA 推出 Fugatto 可以根據(jù)文本提示創(chuàng)建音頻

2024-11-26 10:08:48 瀏覽量: 2745 作者: 微觀獵人

11月26日,據(jù)報道,NVIDIA 宣布推出一款名為 Foundational Generative Audio Transformer Opus 1(簡稱 Fugatto)的實驗性生成式 AI 模型。被稱為“聲音的瑞士軍刀”,F(xiàn)ugatto 能夠從文本提示生成音頻內(nèi)容,也可以對現(xiàn)有的音樂、語音和聲音文件進行高精度修改。目前,NVIDIA 尚未透露是否會向公眾開放 Fugatto,或何時推出商業(yè)版本。

據(jù)報道,F(xiàn)ugatto 由全球頂尖 AI 研究人員團隊共同開發(fā),具備強大的 多語言和多口音能力。NVIDIA 應(yīng)用音頻研究經(jīng)理 Rafael Valle 表示,該項目的目標是“創(chuàng)建一個能夠像人類一樣理解和生成聲音的模型”。

該模型不僅可以生成逼真的聲音,還能根據(jù)上下文和預(yù)訓(xùn)練指令完成復(fù)雜的音頻任務(wù)。例如,它可以生成具有特定口音的情緒化語音,或模擬大自然中動態(tài)變化的聲音場景,例如暴雨穿越地面的沖擊聲。

NVIDIA 在公告中列舉了 Fugatto 的多種潛在應(yīng)用場景。Fugatto 可以幫助音樂制作人快速生成歌曲原型,從而節(jié)省創(chuàng)作時間。用戶還能嘗試不同的風(fēng)格、聲音和樂器,探索新的創(chuàng)作方向。Fugatto 還能夠根據(jù)用戶需求,用特定聲音生成學(xué)習(xí)材料,為語言學(xué)習(xí)和其他教育工具提供個性化支持。游戲開發(fā)者可利用 Fugatto 為游戲中的音效生成多種變體,根據(jù)玩家選擇和游戲情境調(diào)整音頻表現(xiàn),增強沉浸式體驗。Fugatto 的設(shè)計使其在經(jīng)過微調(diào)后,能夠完成超出預(yù)訓(xùn)練任務(wù)的復(fù)雜需求,例如結(jié)合多種音效生成自然音景或特殊場景的音頻。

,

Copyright ©2018 鉍讀網(wǎng) All Rights Reserved.

京ICP備18051707號

京公網(wǎng)安備 11011302001633號