欧美三级不卡/成人97视频/四虎成人精品永久免费av九九 /国产一区二区精品91 - 成人三级在线播放

OpenAI 發布全新o1 模型 可模擬人類思考、處理問題

2024-09-13 09:16:07   |   微觀獵人   |   1486

9月13日,據報道OpenAI 傳聞中的“草莓”(Strawberry)AI 模型現已面世,正式名稱為“o1”,是該公司首款具備“推理”能力的模型。OpenAI 表示 o1 模型的發布,是其邁向類人 AI 宏偉目標的關鍵一步。 OpenAI 公司表示從今天起,ChatGPT Plus 和 Team 用戶將可訪問 o1-preview 和 o1-mini,而 Enterprise 和 Edu 用戶則將在下周初獲得訪問權限。 OpenAI 表示計劃將 o1-mini 的訪問權限擴展至所有 ChatGPT 免費用戶,但尚未確定發布日期。

OpenAI 表示對該模型進行特殊訓練,能夠比人類更快地回答更復雜的問題。與之同時發布的還有 o1-mini,一個更小、成本更低的版本。o1 模型目前處于“預覽”階段,官方強調該模型相關開發尚處于初期階段,相比較 GPT-4o 模型,使用成本更高且速度更慢,但在編寫代碼和解決多步驟問題方面表現更為優秀。

開發者獲取 o1 的訪問權限成本相當高昂:如果調用 API,o1-preview 的輸入詞元(tokens)費用為每百萬個成本 15 美元,輸出詞元費用為每百萬個 60 美元。相比之下,GPT-4o 的輸入詞元費用為每百萬個 5 美元,輸出詞元費用為每百萬個 15 美元。因此 o1 模型輸入詞元費用提高了 2 倍,輸出詞元費用提高了 3 倍。 

OpenAI 的研究負責人 Jerry Tworek 表示,o1 采用了有別于當前模型的訓練方法,并他并未透露具體細節。他提到,o1“采用了全新的優化算法和專門為其定制的訓練數據集進行訓練。”

報道稱 OpenAI 在訓練 o1 模型中使用一種稱為強化學習(reinforcement learning)的技術,來自行解決問題,該技術通過獎勵和懲罰來教導系統。隨后,o1 采用“思維鏈”來處理查詢,類似于人類通過逐步推理來解決問題的方式。

由于采用了這種新的訓練方法,OpenAI 表示模型應該會更加準確。Tworek 表示:“我們不能說已經解決了幻覺問題,但至少從觀測的結果來看,這個模型產生的幻覺明顯減少”。

o1 模型與 GPT-4o 的主要區別在于,它能夠比前代更好地處理復雜的編程和數學問題,并能解釋其推理過程,這是 OpenAI 所強調的。OpenAI 的首席研究官 Bob McGrew 表示:這款模型在解答 AP 數學考試題目上的表現無疑比我更出色,而我大學時還輔修了數學。他提到,OpenAI 還讓 o1 參加了國際數學奧林匹克競賽的資格考試,GPT-4o 僅正確解決了 13% 的問題,o1 模型能夠解決 83% 的問題。

在名為 Codeforces 競賽的在線編程比賽中,這一新型模型達到了參賽者中的第 89 位,OpenAI 聲稱該模型的下一次更新將在物理、化學和生物學中的挑戰性基準任務上表現“與博士生相當”。

同時,o1 在許多領域的能力不及 GPT-4o。它在世界事實知識方面的表現也不如后者。此外,它不具備瀏覽網頁、處理文件和圖像的能力。盡管如此,該公司認為它代表了一類全新的功能。將其命名為 o1,意在表明“將計數器重置回 1”。

特別提醒:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾,請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時發送相關信息至bireading@163.com,本站將會在48小時內處理完畢。

OpenAI 發布全新o1 模型 可模擬人類思考、處理問題

2024-09-13 09:16:07 瀏覽量: 1486 作者: 微觀獵人

9月13日,據報道OpenAI 傳聞中的“草莓”(Strawberry)AI 模型現已面世,正式名稱為“o1”,是該公司首款具備“推理”能力的模型。OpenAI 表示 o1 模型的發布,是其邁向類人 AI 宏偉目標的關鍵一步。 OpenAI 公司表示從今天起,ChatGPT Plus 和 Team 用戶將可訪問 o1-preview 和 o1-mini,而 Enterprise 和 Edu 用戶則將在下周初獲得訪問權限。 OpenAI 表示計劃將 o1-mini 的訪問權限擴展至所有 ChatGPT 免費用戶,但尚未確定發布日期。

OpenAI 表示對該模型進行特殊訓練,能夠比人類更快地回答更復雜的問題。與之同時發布的還有 o1-mini,一個更小、成本更低的版本。o1 模型目前處于“預覽”階段,官方強調該模型相關開發尚處于初期階段,相比較 GPT-4o 模型,使用成本更高且速度更慢,但在編寫代碼和解決多步驟問題方面表現更為優秀。

開發者獲取 o1 的訪問權限成本相當高昂:如果調用 API,o1-preview 的輸入詞元(tokens)費用為每百萬個成本 15 美元,輸出詞元費用為每百萬個 60 美元。相比之下,GPT-4o 的輸入詞元費用為每百萬個 5 美元,輸出詞元費用為每百萬個 15 美元。因此 o1 模型輸入詞元費用提高了 2 倍,輸出詞元費用提高了 3 倍。 

OpenAI 的研究負責人 Jerry Tworek 表示,o1 采用了有別于當前模型的訓練方法,并他并未透露具體細節。他提到,o1“采用了全新的優化算法和專門為其定制的訓練數據集進行訓練!

報道稱 OpenAI 在訓練 o1 模型中使用一種稱為強化學習(reinforcement learning)的技術,來自行解決問題,該技術通過獎勵和懲罰來教導系統。隨后,o1 采用“思維鏈”來處理查詢,類似于人類通過逐步推理來解決問題的方式。

由于采用了這種新的訓練方法,OpenAI 表示模型應該會更加準確。Tworek 表示:“我們不能說已經解決了幻覺問題,但至少從觀測的結果來看,這個模型產生的幻覺明顯減少”。

o1 模型與 GPT-4o 的主要區別在于,它能夠比前代更好地處理復雜的編程和數學問題,并能解釋其推理過程,這是 OpenAI 所強調的。OpenAI 的首席研究官 Bob McGrew 表示:這款模型在解答 AP 數學考試題目上的表現無疑比我更出色,而我大學時還輔修了數學。他提到,OpenAI 還讓 o1 參加了國際數學奧林匹克競賽的資格考試,GPT-4o 僅正確解決了 13% 的問題,o1 模型能夠解決 83% 的問題。

在名為 Codeforces 競賽的在線編程比賽中,這一新型模型達到了參賽者中的第 89 位,OpenAI 聲稱該模型的下一次更新將在物理、化學和生物學中的挑戰性基準任務上表現“與博士生相當”。

同時,o1 在許多領域的能力不及 GPT-4o。它在世界事實知識方面的表現也不如后者。此外,它不具備瀏覽網頁、處理文件和圖像的能力。盡管如此,該公司認為它代表了一類全新的功能。將其命名為 o1,意在表明“將計數器重置回 1”。

,

Copyright ©2018 鉍讀網 All Rights Reserved.

京ICP備18051707號

京公網安備 11011302001633號