微軟亞洲研究院推出VASA-1工具可以將照片變成視頻
在人工智能技術不斷演進的今天,微軟亞洲研究院推出了一款名為 VASA-1 的新型實驗性人工智能工具,引發了廣泛的關注和熱議。這款工具能夠實時創建栩栩如生的說話面孔,只需一張靜態圖像或一幅繪畫以及現有的音頻文件即可。然而,盡管該技術展示出了驚人的潛力,但也引發了人們對其潛在濫用的擔憂。
VASA-1 的功能似乎令人難以置信,它可以為靜態圖像生成面部表情和頭部動作,并匹配適當的嘴唇動作。研究人員上傳了大量示例,這些示例足以欺騙人們認為它們是真實的。然而,仔細觀察后可以發現,示例中的嘴唇和頭部動作仍然有些機械化且不同步,暗示著這項技術仍處于發展階段。
盡管如此,人們對 VASA-1 的濫用潛力感到擔憂。研究人員已經意識到這一點,并決定暫時不發布相關產品,直到確定他們的技術將被負責任地使用并符合適當的規定。然而,他們并未透露是否計劃實施某些保護措施,以防止不良行為者將其用于邪惡目的,例如制作深度偽造色情或錯誤信息活動。
據鉍讀網了解,研究人員仍然相信 VASA-1 的技術具有許多潛在的好處。他們表示,該技術可以用于增強教育公平,改善溝通障礙者的可及性,并為有需要的人提供陪伴和治療支持。此外,他們還暗示 VASA-1 可以用于提供與人們可以交談的人工智能角色的程序。
根據公布的論文,VASA-1 在 VoxCeleb2 數據集上進行了訓練,該數據集包含了超過 100 萬條來自 YouTube 視頻的話語,涉及 6,112 名名人。盡管該工具是在真實面孔上進行訓練的,但據稱它也適用于藝術照片,例如《蒙娜麗莎》。研究人員甚至將其與安妮·海瑟薇病毒式傳播的李爾·韋恩《狗仔隊》的音頻文件有趣地結合在一起,展示了其令人愉悅的效果。