波士頓動力公司利用 ChatGPT 使其機器狗Spot能與人對話
近日,據報道,波士頓動力公司發布了一段視頻,展示了 Spot 的一個新功能:使用人工智能 (AI) 生成的語音與人類進行對話。在視頻中,我們看到 Spot 扮演了一個穿著高禮帽、留著小胡子的“高級管家”,用英國口音向參觀者介紹公司的各個部門。Spot 不僅能夠回答問題,還能夠根據環境和情境調整自己的語氣和內容,甚至還能夠做出一些幽默和詩歌。
據鉍讀網了解,波士頓動力公司 (Boston Dynamics) 一直以其創造出的令人驚嘆的機器人而聞名,其中最著名的就是四足機器人 Spot。Spot 可以在各種地形上行走,執行各種任務,甚至展示出一些藝術才能。那么,波士頓動力公司是如何讓 Spot 能夠“說話”的呢?答案是使用了 OpenAI 的 ChatGPT API,以及一些開源的大型語言模型 (LLM)。這些模型可以根據給定的文本或圖像生成自然和流暢的語言。波士頓動力公司的工程師們為 Spot 的每個房間提供了一個簡短的腳本,然后讓 Spot 通過其抓手和身體上的攝像頭獲取圖像信息,并結合 LLM 生成合適的響應。此外,Spot 還配備了揚聲器和文本到語音轉換的功能,以及一個可以模仿說話動作的“嘴巴”。
波士頓動力公司表示,這個項目旨在探索 AI 和機器人技術的交叉點,以及如何提高機器人與人類之間的互動和溝通。該公司認為,使用 LLM 可以讓機器人具備文化背景、常識知識和靈活性,從而更好地適應不同的任務和場景。例如,用戶可以通過與機器人交談來分配任務給機器人,而不需要復雜的編程或操作。
當然,這個項目也有一些趣味性和娛樂性。視頻中展示了 Spot 的不同角色和性格,包括 20 年代考古學家、青少年和莎士比亞時間旅行者。Spot 還展現了一些諷刺和自嘲的個性,例如當被要求創作一首俳句時,它說:“發電機在一個沒有歡樂的房間里低聲哼著。就像我的靈魂一樣。”或者當被問到 Stretch 機器人是做什么用的時,它說:“Stretch 是我們為瑜伽愛好者設計的機器人。”