谷歌推出增強(qiáng)版生成式AI工具Imagen 3和Gems定制機(jī)器人
近日,據(jù)報(bào)道,谷歌本周正在為其生成式人工智能工具帶來(lái)新的升級(jí),這些工具最初在Google I/O 2024大會(huì)上進(jìn)行了預(yù)告。從本周開始,谷歌將推出其Imagen圖像生成器的下一代版本,同時(shí)重新引入生成人物圖像的功能。此外,谷歌的Gemini聊天機(jī)器人也將增加一個(gè)名為Gems的新功能,這是一種自定義指令機(jī)器人,類似于OpenAI的ChatGPT定制GPT。
Imagen 3是谷歌圖像生成器的最新版本,被公司描述為“在圖像質(zhì)量上樹立了新標(biāo)準(zhǔn)”。Imagen 3配備了先進(jìn)的防護(hù)欄,旨在避免過(guò)度糾正多樣性的問(wèn)題,這類問(wèn)題曾導(dǎo)致一些歷史AI圖像在網(wǎng)上引發(fā)爭(zhēng)議。谷歌表示,Imagen 3在多項(xiàng)基準(zhǔn)測(cè)試中的表現(xiàn)優(yōu)于其他同類圖像生成模型。
根據(jù)Gemini產(chǎn)品經(jīng)理Dave Citron的介紹,Imagen 3允許用戶在生成圖像時(shí)添加附加提示,以便獲得更精確的結(jié)果。此外,Imagen 3還集成了Google的SynthID工具,可以為生成的圖像加水印,明確標(biāo)識(shí)這些圖片是人工智能生成的,而非真實(shí)照片。
盡管Imagen 3恢復(fù)了人物圖像生成功能,但谷歌已采取措施防止生成“照片般逼真、可識(shí)別的人物”,以避免深度偽造等問(wèn)題。兒童、暴力、血腥或性愛(ài)場(chǎng)景仍然被禁止生成。Dave Citron指出,這些改進(jìn)旨在確保生成內(nèi)容的安全性和道德性。
從本周開始,Imagen 3將向所有用戶開放,而生成人物的功能將首先向付費(fèi)用戶提供。講英語(yǔ)的Gemini Advanced、Business和Enterprise用戶將在未來(lái)幾天內(nèi)可以使用此功能。
在Google I/O 2024大會(huì)上預(yù)覽的Gems功能現(xiàn)在也即將推出。Gems是谷歌對(duì)OpenAI GPT技術(shù)的回應(yīng),旨在為用戶提供個(gè)性化的聊天機(jī)器人體驗(yàn)。通過(guò)Gems,用戶可以創(chuàng)建具備特定指令的定制機(jī)器人,用來(lái)應(yīng)對(duì)各種挑戰(zhàn)性任務(wù)。
Citron在新聞稿中表示:“通過(guò)Gems,你可以組建一個(gè)專家團(tuán)隊(duì),幫助你思考復(fù)雜項(xiàng)目,為即將舉行的活動(dòng)集思廣益,或者為社交媒體帖子撰寫出色的標(biāo)題。”Gems能夠記住詳細(xì)的指令,幫助用戶節(jié)省在重復(fù)性、繁瑣或困難任務(wù)上花費(fèi)的時(shí)間。
Gems目前在桌面和移動(dòng)設(shè)備上都可以使用,但僅適用于Gemini Advanced、Business和Enterprise訂閱者。用戶需要付費(fèi)計(jì)劃才能體驗(yàn)這些功能。