專訪思必馳俞凱：專業化語言大模型是通用人工智能落地發展的核心

2023-06-27 18:26:00 | |

“大模型是人工智能的新時代。對話式的語言大模型是整個人工智能大模型進一步突破的核心。而專業化的語言大模型，是真正的通用人工智能落地的發展的核心。”思必馳聯合創始人、首席科學家、上海交通大學教授俞凱在2023全球智博會上表示。

俞凱作為一名人工智能的從業者，更是一名研究者，他對目前大模型的行業發展和趨勢有著自己的見解。“在接受采訪時他表示，以GPT為代表的通用大模型是人工智能發展的一個集中式突破，包括對話智能技術、深度學習大模型技術、工程化能力以及大數據的整體突破。而基礎AI技術創新，必須最終走入產業，結合場景應用才會變得有價值。”

f2363bbfbfcfd4022d53c5666cb70f3

通用模型助力產業迭代

以ChatGPT為代表的通用人工智能技術，通過數據和算力效能的變化，催生出海量的新商業模式。而數字人、個人助理、搜索引擎等應用基于通用人工智能基礎架構的變化，更引發了產業創新迭代，俞凱認為其對產業的影響主要體現在以下四個方面。

首先，通用人工智能技術對搜索引擎產生了革命性變化。搜索引擎之前是通過篩選關鍵詞，推薦給用戶全部答案，讓用戶自行篩選模式。現在，更傾向于提出一個問題，搜索引擎能直接給出回答，而且這個答案可能比此前的關鍵詞搜索更加豐富、多元。在垂直領域，變化更巨大。比如文獻的搜索衍變成為直接給出更準確、豐富的資料，給用戶提供了更得力的幫助。

其次，通用人工智能技術正在重塑辦公模式，僅僅輸入一句簡短的文字，就能生成初稿；只要提供簡要演示的信息、想要的風格，點擊生成，一份排版精美、動畫豐富的PPT就誕生了……當辦公軟件得到人工智能的加持，人們的工作方式或許會從根本上發生變化。辦公效率將大幅提升，辦公場景從此改變。

再次，用戶可以應用通用人工智能技術做內容創作。無論是生成一篇文章，生成一個郵件，其高效、快速、多風格的內容為創新應用拓展、創作成本降低等提供了有力支撐，大模型正在成為內容生產的創新引擎。

最后，就是和物理世界的連接。因為通用人工智能技術可以生成代碼，而代碼是連接最基礎的物理設備的基本協議。當只需要一句話就可以轉成代碼來操作系統，人工智能就變成了一個物理操作系統。

俞凱認為，在技術的迭代發展上，ChatGPT本質就是一個統計類的深度學習對話通用大模型。而思必馳應該算是國內最早一批去進行統計類對話模型的產業化研究的公司之一，并且在任務型對話上也取得了實際的研究成績和應用成績。俞凱表示，思必馳已有的語音和語義的通用基礎模型，已經達到億級參數。在通用基礎模型技術方面，目前思必馳使用千塊GPU卡量級的超算資源，并正在整合擴展資源，在已有算法研究和數據積累的基礎上，將億級參數模型擴展到百億以上量級。

伴隨人工智能技術發展的，便一直是“AI有所為、有所不為”的討論。俞凱表示，技術本身是中性的，關鍵是運用技術的人，應該向善、不作惡。生成式AI面臨的兩大挑戰，一是數據合規，包括數據來源合規、數據處理合規、數據生成合規；二是應用邊際，包括需要從人員管理上、工程化實現、場景領域上去規范應用邊界，如何更好地“協助人類”而不是“替代人類”，甚至是淪為deep fake的幫兇。

涌現能力加速落地發展

基于語言大模型的通用對話系統的出現產生了巨大的轉變，在深度學習時代，產生了很多的之前沒有的能力，叫做涌現能力。俞凱表示：“所有涌現能力的產生，一定不是自然而然的，它的涌現能力的產生，‘大’很重要，具有產生新可能，甚至于無窮無盡的可能性，也是大模型‘涌現’的前提條件。”

11ea2ed0266a7a5f07e76521975999d

涌現能力的背后，則進一步隱含著三個非常重要的技術：情景學習、思維鏈和指令學習。情景學習深刻改變了傳統機器學習的范式，只需要通過一系列精心設計的提示語句，對任務進行詳細描述，然后再輔以一些情景例子，就能夠讓模型參考著既定例子完成特定任務。

指令學習則使模型能夠理解并執行各種自然語言指令，將任務指令化以便機器理解。人類只需要在少量的任務上進行指令化，在經歷大概40多個任務指令化之后，對模型進行適度微調，就很容易泛化到上百、上千種任務，即使它從來沒有見過。而思維鏈則使得模型具有了推理的能力，讓本來模型不會解的一個個復雜問題，分解成很多簡單問題，然后通過逐一解決簡單問題，最終使得復雜問題迎刃而解。

AI技術更不能單靠底層原始創新來推動發展，其落地應用需要結合行業認知和客戶需求輸出整體性、結果導向性的實用解決方案。采訪的最后，俞凱說：“希望所有的產業伙伴和研究伙伴和我們一起共創大模型未來的生態。讓深度學習的下一代大模型可以在促進數字經濟發展方面發揮重要作用。”

思必馳將于7月12日在蘇州舉辦DFM- 2 大模型及創新技術應用成果發布會，發布屬于自己的東風大模型。在發布會上，思必馳也會詳細解讀DFM- 2 在行業落地的應用情況，而這款大模型表現如何，我們也拭目以待。

特別提醒：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾，請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益，請及時發送相關信息至bireading@163.com，本站將會在48小時內處理完畢。