OpenAI升級ChatGPT 多模態AI實現文本圖像無縫創作

2025-03-26 16:31:59 | 微觀獵人 | 1043

3月26日，人工智能技術迎來重大突破。OpenAI于本周二宣布，其ChatGPT聊天機器人已升級為多模態AI系統，不僅能處理文本，還能根據復雜指令生成高質量圖像，甚至整合語音、視頻等交互方式。

此次升級讓ChatGPT的創作能力大幅提升。例如，用戶只需描述一個四宮格漫畫的情節，包括角色設定和對話內容，AI就能迅速生成符合要求的完整漫畫圖像。相比此前版本，新版ChatGPT能更精準地理解并融合多樣化概念，實現更富創意的視覺表達。

這一技術突破源于OpenAI最新模型GPT-4o的支持，它不僅強化了文本生成能力，還整合了圖像、語音和視頻處理功能，使AI能更自然地與用戶互動。

值得注意的是，OpenAI此次并未采用傳統的獨立模塊設計，而是將文本與圖像生成技術深度融合。研究員加布里埃爾·吳（Gabriel Goh）表示：“我們不再將文本和圖像視為獨立任務，而是讓AI協同學習，從而更靈活地應對復雜需求。” 在實際測試中，新版ChatGPT已能處理傳統AI難以完成的創意任務，例如生成“三角形車輪的自行車”等非常規圖像。

OpenAI表示，該功能已向所有用戶開放，包括免費用戶和訂閱ChatGPT Plus（20美元/月）、ChatGPT Pro（200美元/月）的付費用戶。此次升級標志著AI技術正從單一功能向全能型助手加速演進。

特別提醒：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾，請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益，請及時發送相關信息至bireading@163.com，本站將會在48小時內處理完畢。

最新資訊更多》

1 谷歌Nano Banana圖像編輯功能爆火：單日超2億次編輯
2 螞蟻國際推出 AI 智能體支付解決方案，可識別用戶支付意圖、全流程追溯詢證
3 DeepSeek 被曝正研發新一代 AI 智能體模型
4 美團閃購宣布推出零售行業首個“退貨免運費”服務
5 《黑神話》將開官方衍生品線下店
6 谷歌Chrome 140穩定版正式發布無痕模式新增IP保護與腳本攔截能力
7 追覓發布30余款新品、十余項全球首創，勾勒全場景智能未來
8 三星Galaxy秋季新品品鑒會：AI生態全面進化，Tab S11系列領銜登場
9 索尼發布 PS Link PC 驅動程序，方便 Win PC 用戶使用 PS Link 音頻設備
10 《DOTA2》2025 年國際邀請賽 (TI14) 首日對陣出爐，9 月 4 日開戰
11 蘋果獲觸覺引擎減震新專利 iPhone抗跌落能力將迎來革新
12 亞馬遜推出 AI 購物新功能 Lens Live，手機對著實物掃掃就能找同款

OpenAI升級ChatGPT 多模態AI實現文本圖像無縫創作

2025-03-26 16:31:59 瀏覽量： 1043 作者：微觀獵人

這一技術突破源于OpenAI最新模型GPT-4o的支持，它不僅強化了文本生成能力，還整合了圖像、語音和視頻處理功能，使AI能更自然地與用戶互動。

合作伙伴

關于我們
阿里云

京公網安備 11011302001633號

公眾號二維碼

京ICP備18051707號

京公網安備 11011302001633號