淘寶新專利可生成個性化數(shù)字人
天眼查知識產(chǎn)權(quán)信息顯示,3月15日,淘寶(中國)軟件有限公司申請的“基于數(shù)字人的視頻生成與交互方法、設(shè)備、存儲介質(zhì)與程序產(chǎn)品”專利公布。
摘要顯示,本申請實施例基于用戶的聲音特征和情感標簽進行文本轉(zhuǎn)語音處理,以及基于用戶的聲音特征和表情系數(shù)之間的映射關(guān)系進行語音轉(zhuǎn)表情處理,并基于語音信號和表情系數(shù)渲染數(shù)字人模型,以得到數(shù)字人模型的視頻數(shù)據(jù)。該專利精準地模擬用戶的聲音特征,確保了數(shù)字人的語音輸出不僅聽起來自然,而且實現(xiàn)數(shù)字人的個性化驅(qū)動,提高數(shù)字人在聲音和動態(tài)形象方面的逼真度,進而提高用戶體驗,提升了數(shù)字人的互動性、真實感和沉浸感。