OpenAI 推出 ChatGPT 實時視頻交互功能 多模態 AI 再進一步
12月13日,OpenAI 宣布在其聊天機器人 ChatGPT 中引入全新視頻交互功能,使其能夠實時處理和回應視頻推送中的內容。這一突破標志著 ChatGPT 從文本和圖像理解進一步邁向多模態交互領域。
在周四的直播活動中,OpenAI 展示了 ChatGPT 的這一新增功能。通過智能手機攝像頭,ChatGPT 能夠識別物體并對屏幕上顯示的內容進行對話式反應。例如:即時協助:用戶可以在應用程序中請求 ChatGPT 協助完成任務,如回復消息或整理文檔。生活指南:用戶可以通過攝像頭掃描物品,獲得例如制作咖啡或組裝家具的實時指導。
OpenAI 表示,從周四起,ChatGPT Plus 和 ChatGPT Pro 的付費用戶即可率先體驗這一功能。企業客戶和教育領域用戶則需等到 2025 年 1 月才能接入。
自兩年前推出以來,ChatGPT 一直引領文本聊天機器人的技術革新。此次新增的視頻功能,是 OpenAI 持續推動多模態技術的又一里程碑。通過結合文本、圖像、音頻和視頻的響應能力,ChatGPT 正逐步進化為更具吸引力和實用性的全能數字助理。