字節跳動 AI 助手豆包上線圖片理解功能 一鍵“讀圖”解讀更多信息
12月4日,字節跳動旗下 AI 助手豆包推出全新圖片理解功能,進一步提升用戶交互體驗。根據最新更新,用戶可通過豆包 App 或 PC 客戶端新增的照片與相機按鈕,上傳圖片以識別內容,享受智能化的“讀圖”服務。
豆包的圖片理解功能能夠快速識別圖片中包含的元素和基本特征,并針對用戶需求提供進一步信息。例如,用戶上傳某景點的照片后,豆包可識別并提供景點位置;上傳影視截圖,則可查詢角色出處及相關影視作品信息。這一功能讓圖像內容的探索和應用更加便捷。
此次圖片理解功能的推出,是豆包繼視頻生成功能內測后的又一技術突破。11月,豆包上線視頻生成功能測試,支持用戶將圖片和文字一鍵轉換為視頻,并提供動態運鏡、多鏡頭一致性及多樣化風格比例選擇,為內容創作帶來了全新可能。
根據 IDC 于今年9月發布的移動端大模型應用市場競爭力分析報告,豆包在市場影響力、用戶活躍度和用戶粘性方面均表現優異。然而,由于其偏娛樂化的產品定位,用戶對功能豐富度的要求較高,目前功能深度與體驗上還有進一步提升空間。