OpenAI 發布首款 AI 智能體 Operator 可實現網頁操作自動化
1 月 24 日,據報道,OpenAI 正式推出其首款 AI 智能體 Operator。Operator 能夠代理用戶在網頁上完成復雜任務,例如預訂餐廳或在線購物,為用戶提供更加智能化的交互體驗。
目前,Operator 已向美國地區的 Pro 版訂閱用戶 開放使用。OpenAI 表示,這項功能將在未來逐步擴展至 Plus、Team 和 Enterprise 用戶,并最終集成到 ChatGPT 的核心功能中,進一步豐富其產品生態。
Operator 由 OpenAI 最新研發的 CUA(Cognitive User Agent)模型 提供技術支持,結合了以下關鍵能力,GPT-4o 的視覺處理能力:能夠“看見”網頁內容,識別并理解網頁上的文字、圖片、按鈕等元素。高級推理能力:通過強化學習進行訓練,具備分析復雜任務并制定解決方案的能力。
在官方演示中,Operator 展示了其高效完成任務的能力,例如:在餐廳預訂系統中選擇合適的時間和座位并完成預訂。在購物網站上選擇商品、填寫收貨信息并完成支付流程。盡管 Operator 已被譽為“市面上最強的 AI 代理”,OpenAI 也坦言這項技術距離真正替代人類操作還有很長的路要走。Operator 可能會在某些任務中犯錯,但 OpenAI 承諾將在未來數月內持續優化該技術,提升其可靠性和適用性。