Meta公司發(fā)布Code Llama AI編程工具升級(jí)版Code Llama 70B
Meta公司的CEO扎克伯格在最近的一次發(fā)布會(huì)上宣布,他們對其代碼生成AI模型 Code Llama 70B進(jìn)行了更新,使其成為了目前市場上“最大、性能最優(yōu)的模型”。Code Llama 70B是一款能夠根據(jù)用戶的關(guān)鍵詞或自然語言輸入生成代碼的工具,它可以支持多種編程語言,包括Python、Java、C++等。
Code Llama 70B的前身是去年8月發(fā)布的Code Llama工具,當(dāng)時(shí)它引起了開發(fā)者社區(qū)的廣泛關(guān)注,因?yàn)樗堑谝粋(gè)能夠免費(fèi)提供給所有人使用的代碼生成AI模型。Meta公司表示,新版的 Code Llama 70B 在訓(xùn)練數(shù)據(jù)和模型規(guī)模上都有了顯著的提升,從而提高了生成代碼的質(zhì)量和準(zhǔn)確性。
Meta公司在其官方博客上介紹了Code Llama 70B的一些技術(shù)細(xì)節(jié)。據(jù)悉,這個(gè)模型基于 1TB 的代碼和代碼相關(guān)數(shù)據(jù)進(jìn)行訓(xùn)練而來,其中包括了來自 GitHub、Stack Overflow、Codeforces 等平臺(tái)的大量開源代碼、問題答案、編程競賽題目等。這些數(shù)據(jù)涵蓋了不同的編程領(lǐng)域和難度,從而使得 Code Llama 70B 能夠適應(yīng)不同的用戶需求和場景。
Meta公司還展示了 Code Llama 70B 在 HumanEval 基準(zhǔn)測試中的表現(xiàn)。HumanEval 是一個(gè)用于評(píng)估代碼生成AI模型的標(biāo)準(zhǔn),它由一系列人工設(shè)計(jì)的編程問題組成,要求模型根據(jù)問題描述生成正確且可運(yùn)行的代碼。Meta 公司稱,Code Llama 70B在這個(gè)測試中的準(zhǔn)確率達(dá)到了 53%,超過了目前最先進(jìn)的GPT-3.5模型的 48.1%,但仍然低于 OpenAI 在其最新論文中給出的 GPT-4 模型的 67%。
除了Code Llama 70B這個(gè)通用版本之外,Meta公司還提供了兩個(gè)針對特定編程語言優(yōu)化的版本:Code Llama - Python 和 Code Llama - Instruct。這兩個(gè)版本分別專注于 Python 和指令式編程語言(如 C、C++、Java 等),并且在相應(yīng)的語言環(huán)境中表現(xiàn)更好。Meta 公司表示,這三個(gè)版本都可以免費(fèi)用于研究和商業(yè)用途,并且已經(jīng)托管在代碼存儲(chǔ)庫Hugging Face上,用戶可以通過網(wǎng)頁或API的方式訪問和使用它們。
Meta 公司表示,Code Llama 70B是其在代碼生成AI領(lǐng)域的重要里程碑,也是其致力于打造“元宇宙”的一部分。扎克伯格在發(fā)布會(huì)上說:“我們相信,通過讓更多人能夠輕松地創(chuàng)建和分享代碼,我們可以加速元宇宙的發(fā)展,并且讓更多人參與其中。Code Llama 70B是我們?yōu)榇俗龀龅呐χ唬覀兿M軌驗(yàn)殚_發(fā)者帶來更多的便利和樂趣。”