OpenAI升級ChatGPT 多模態AI實現文本圖像無縫創作
3月26日,人工智能技術迎來重大突破。OpenAI于本周二宣布,其ChatGPT聊天機器人已升級為多模態AI系統,不僅能處理文本,還能根據復雜指令生成高質量圖像,甚至整合語音、視頻等交互方式。
此次升級讓ChatGPT的創作能力大幅提升。例如,用戶只需描述一個四宮格漫畫的情節,包括角色設定和對話內容,AI就能迅速生成符合要求的完整漫畫圖像。相比此前版本,新版ChatGPT能更精準地理解并融合多樣化概念,實現更富創意的視覺表達。
這一技術突破源于OpenAI最新模型GPT-4o的支持,它不僅強化了文本生成能力,還整合了圖像、語音和視頻處理功能,使AI能更自然地與用戶互動。
值得注意的是,OpenAI此次并未采用傳統的獨立模塊設計,而是將文本與圖像生成技術深度融合。研究員加布里埃爾·吳(Gabriel Goh)表示:“我們不再將文本和圖像視為獨立任務,而是讓AI協同學習,從而更靈活地應對復雜需求。” 在實際測試中,新版ChatGPT已能處理傳統AI難以完成的創意任務,例如生成“三角形車輪的自行車”等非常規圖像。
OpenAI表示,該功能已向所有用戶開放,包括免費用戶和訂閱ChatGPT Plus(20美元/月)、ChatGPT Pro(200美元/月)的付費用戶。此次升級標志著AI技術正從單一功能向全能型助手加速演進。