專訪思必馳俞凱:專業化語言大模型是通用人工智能落地發展的核心
“大模型是人工智能的新時代。對話式的語言大模型是整個人工智能大模型進一步突破的核心。而專業化的語言大模型,是真正的通用人工智能落地的發展的核心。”思必馳聯合創始人、首席科學家、上海交通大學教授俞凱在2023全球智博會上表示。
俞凱作為一名人工智能的從業者,更是一名研究者,他對目前大模型的行業發展和趨勢有著自己的見解。“在接受采訪時他表示,以GPT為代表的通用大模型是人工智能發展的一個集中式突破,包括對話智能技術、深度學習大模型技術、工程化能力以及大數據的整體突破。而基礎AI技術創新,必須最終走入產業,結合場景應用才會變得有價值。”
通用模型 助力產業迭代
以ChatGPT為代表的通用人工智能技術,通過數據和算力效能的變化,催生出海量的新商業模式。而數字人、個人助理、搜索引擎等應用基于通用人工智能基礎架構的變化,更引發了產業創新迭代,俞凱認為其對產業的影響主要體現在以下四個方面。
首先,通用人工智能技術對搜索引擎產生了革命性變化。搜索引擎之前是通過篩選關鍵詞,推薦給用戶全部答案,讓用戶自行篩選模式。現在,更傾向于提出一個問題,搜索引擎能直接給出回答,而且這個答案可能比此前的關鍵詞搜索更加豐富、多元。在垂直領域,變化更巨大。比如文獻的搜索衍變成為直接給出更準確、豐富的資料,給用戶提供了更得力的幫助。
其次,通用人工智能技術正在重塑辦公模式,僅僅輸入一句簡短的文字,就能生成初稿;只要提供簡要演示的信息、想要的風格,點擊生成,一份排版精美、動畫豐富的PPT就誕生了……當辦公軟件得到人工智能的加持,人們的工作方式或許會從根本上發生變化。辦公效率將大幅提升,辦公場景從此改變。
再次,用戶可以應用通用人工智能技術做內容創作。無論是生成一篇文章,生成一個郵件,其高效、快速、多風格的內容為創新應用拓展、創作成本降低等提供了有力支撐,大模型正在成為內容生產的創新引擎。
最后,就是和物理世界的連接。因為通用人工智能技術可以生成代碼,而代碼是連接最基礎的物理設備的基本協議。當只需要一句話就可以轉成代碼來操作系統,人工智能就變成了一個物理操作系統。
俞凱認為,在技術的迭代發展上,ChatGPT本質就是一個統計類的深度學習對話通用大模型。而思必馳應該算是國內最早一批去進行統計類對話模型的產業化研究的公司之一,并且在任務型對話上也取得了實際的研究成績和應用成績。俞凱表示,思必馳已有的語音和語義的通用基礎模型,已經達到億級參數。在通用基礎模型技術方面,目前思必馳使用千塊GPU卡量級的超算資源,并正在整合擴展資源,在已有算法研究和數據積累的基礎上,將億級參數模型擴展到百億以上量級。
伴隨人工智能技術發展的,便一直是“AI有所為、有所不為”的討論。俞凱表示,技術本身是中性的,關鍵是運用技術的人,應該向善、不作惡。生成式AI面臨的兩大挑戰,一是數據合規,包括數據來源合規、數據處理合規、數據生成合規;二是應用邊際,包括需要從人員管理上、工程化實現、場景領域上去規范應用邊界,如何更好地“協助人類”而不是“替代人類”,甚至是淪為deep fake的幫兇。
涌現能力 加速落地發展
基于語言大模型的通用對話系統的出現產生了巨大的轉變,在深度學習時代,產生了很多的之前沒有的能力,叫做涌現能力。俞凱表示:“所有涌現能力的產生,一定不是自然而然的,它的涌現能力的產生,‘大’很重要,具有產生新可能,甚至于無窮無盡的可能性,也是大模型‘涌現’的前提條件。”