夸克AI超級框發(fā)布新“AI相機(jī)”
4月28日,據(jù)報道,阿里巴巴AI旗艦應(yīng)用夸克AI超級框正式發(fā)布全新AI相機(jī),上新“拍照問夸克”功能。基于視覺理解與思考推理模型能力,夸克AI相機(jī)能深入理解用戶意圖,更好地實(shí)現(xiàn)視覺搜索、多輪問答、圖像處理與創(chuàng)作。
在工作、學(xué)習(xí)、生活各類場景中,面對復(fù)雜物體、表格和圖形時,用戶往往難以準(zhǔn)確描述真實(shí)需求。基于AI超級框背后的視覺理解和推理模型能力,“拍照問夸克”能在手機(jī)和電腦上進(jìn)行圖片搜索、問答、思考、編輯以及創(chuàng)作。多模態(tài)產(chǎn)品入口和交互體驗(yàn),讓AI相機(jī)成為AI時代用戶表達(dá)問題和獲取信息的重要方式。
“拍照問夸克”能精準(zhǔn)識別圖片中的人物、物體和諸多細(xì)節(jié),能深入理解用戶需求并聯(lián)想相關(guān)問題。比如,拍照搜索文物時自動關(guān)聯(lián)歷史背景,上傳商品圖片時一鍵跳轉(zhuǎn)淘寶同款鏈接。無論是人物、動物、植物、建筑、風(fēng)景、美食、藝術(shù)品、商品、外文資料還是故障代碼,夸克都能做到秒級識別,經(jīng)過多輪問答和深度思考后,給出同類產(chǎn)品中的最佳回答。
此外,“拍照問夸克”將搜索、掃描、修圖、翻譯、創(chuàng)作等能力聚合為統(tǒng)一入口。針對較為復(fù)雜的圖像,用戶可一次上傳10張圖片進(jìn)行深度推理并完成各類復(fù)雜任務(wù)。
目前,夸克已具備超百個專業(yè)Agent和原子能力,包括搜索、健康、學(xué)習(xí)、旅游、商品、創(chuàng)作等,持續(xù)通過模型能力升級來優(yōu)化Agent組合策略,滿足用戶對圖像信息的個性化需求。