外界對 OpenAI「草莓(Strawberry )」計畫的關注由來已久,但很長時間以來都是:只聞其聲,不見其人。這種局面可能很快就會被打破。
The Information 在最新的報導中披露,兩位測試過「草莓」模型的人士表示,OpenAI 可能將在接下來的兩週內發布「草莓」模型,並上線 ChatGPT。但不同於 GPT-4o、GPT-4o mini 正在優化使用體驗和成本,「草莓」的目標是再一次讓大模型向 AGI 前進。
圖/ The Information
那些取消 ChatGPT Plus 的用戶,可能又要重新訂閱了,但據稱新模型將擁有一個讓人「amazing」的定價。
01 “草莓”成熟時,大模型也要「成熟」
OpenAI 將在未來兩週內推出「草莓」的消息,無疑引起了業界的廣泛關注,因為這不僅是OpenAI 在大語言模型領域的新嘗試,也可能是對人工智慧推理能力一次新的革命性提升。
根據目前流出的資訊來看,相較於以往的 GPT 模型,「草莓」在處理複雜問題、執行多步驟任務方面展現出前所未有的潛力,使其成為通用人工智慧(AGI)邁出的重要一步。
首先,「草莓」計畫的核心亮點是大幅增強了推理能力。據報道,「草莓」能夠自主完成深度研究任務,這意味著它不再僅限於生成答案,而是能夠提前規劃、自動導航互聯網,甚至自主解決高度複雜的科學問題。
相較於現有的GPT-4 系列模型,「草莓」被寄予了厚望,可以幫助AI 更好地模仿人類的思維過程,尤其是在數學和科學領域表現突出,成功解決了此前困擾大模型的多步驟推理問題。
除了推理能力的突破,「草莓」還引入了名為「後訓練(Post-training)」的新技術,即在完成大數據集的預訓練後,進一步對模型進行調整,使其在特定任務上表現更加出色。
關於 STaR 的一篇論文,圖/ arXiv
這個方法類似於史丹佛大學開發的「自學推理者(STaR)」模型,透過自我生成訓練數據,AI 能夠不斷迭代優化自身智慧水準。這使得「草莓」在應對複雜任務時能夠表現得更為靈活和高效,尤其是執行長時間任務(LHT)時,其規劃能力和執行能力均顯著提升。
然而,儘管「草莓」計畫充滿了潛力,但先前也有爆料指出了早期測試中暴露出的一些問題。例如,在處理簡單任務時,反應速度偶爾過慢,且其記憶對話的功能尚不穩定。這些問題顯然會影響使用體驗,但也是新科技在探索中的必然過程。
關鍵是推出之時,OpenAI 能否解決或改善這些問題。
但無論如何,「草莓」或當下最可能引領 AI 推理能力質變的大模型,這也讓業界內外對於「草莓」的期待愈發高漲。因為它不僅意味著大語言模型的發展進入了新的階段,也讓我們看到了實現 AGI 的曙光。
02 OpenAI 宮變「導火線」:從 Q* 到草莓
「草莓」計畫的誕生並非一蹴而就,它的根源可以追溯到 OpenAI 早期一個代號為「Q」的秘密計畫。對很多人來說,「Q」這個代號可能不熟悉,但一定知道去年底的 OpenAI 宮鬥事件。
2023 年末,OpenAI 突然爆發了宮鬥級別的管理層震盪,CEO 山姆·奧特曼(Sam Altman)被董事會短暫罷免,而直接導火線正是“Q*”項目的安全風險與爭議。
「OpenAI 的靈魂」:左二為奧特曼、左四位伊利亞,圖/ OpenAI
事情的起因可以追溯到「Q」的初步測試階段,當時專案展示了在解決數學和科學推理問題上的驚人成果,特別是在一些複雜的多步驟問題上,模型的表現超越了現有的大模型。這讓部分研究者感到興奮的同時,也產生了深深的憂慮 。 這些突破預示著,OpenAI 可能正在快速逼近通用人工智慧(AGI),這一發展超出了某些董事會成員的預期。他們擔心 AI 的快速演化帶來不可控的風險,甚至可能對社會產生深遠的影響。 OpenAI 內部,圍繞著「Q」是否該繼續推進的爭論愈演愈烈。
部分董事會成員認為專案的推進過於激進,尤其是涉及 AGI 的潛在危險,應該更加謹慎對待 。最終,分歧達到了頂點,奧特曼在未與董事會充分溝通的情況下加速推進了“Q*”,引發了他短暫離職的戲劇性事件。
但事實上矛盾是以另一方的離場作為結果。奧特曼回歸之後,作為 OpenAI 靈魂人物、首席科學家的伊利亞(Ilya Sutskever)再也沒有現身官方發布活動,並在 GPT-4o 發布後官宣離職。
圖/ X
3 天后,另一位 OpenAI「超級對齊」團隊負責人 Jan Leike 也宣布了離職。而同時,「Q*」計畫仍在加速推進,並演變成了後來更廣為人知的「草莓」計畫。
今年夏天,奧特曼還在 X 上發布了一張草莓的實拍圖,一度引起了“草莓”即將落地的猜測。
圖/ X
03 重新向 AGI 進發:「草莓」重新定義 AI?
過去近兩年,大模型廠商的方向顯然已經發生了一些改變。最早,整個產業都把 OpenAI 的 Scaling Law 奉為金科玉律,每一代生成式 AI 模型的演化都伴隨著龐大參數量的提升,背後的依據是參數越大,智慧湧現的潛力就越高。
但到了 2024 年,各家大模型其實在放緩對「參數規模」的追逐,開始轉向中小型參數規模、更具成本效益的模型。 7 月,就連 OpenAI 也推出了 GPT-4o mini,更不用說此前,國內和國外的知名大模型基本上都已經推出了中等規模或者較小規模的模型。
在這個大背景下,OpenAI 的「草莓」計畫仍然顯得與眾不同。在「草莓」專案上,OpenAI 不再透過堆疊參數規模來獲得智慧湧現,而是試圖透過優化模型的推理邏輯,透過增強推理能力和自我訓練演算法,突破了傳統 AI 的效能瓶頸。
從目前透露的情況來看,「草莓」似乎不僅具備了類似人類的推理能力,能為解決複雜的多步驟問題提供了新的可能性。例如在科學研究、複雜決策、數據分析等領域,傳統的語言模型往往只能透過簡單的文本生成來應對,而「草莓」則能夠根據問題的複雜性自主生成解決方案,並進行推理驗證。
圖/ DALL·E 生成
這種轉變對推動 AI 真正從「工具」到「智慧助理」的角色轉變至關重要,也將使更多企業受益於 AI 推理能力的進步。
另一方面,「草莓」在某種程度上也具備了自我迭代、自我提升的能力,接近 AI 領域夢寐以求的「遞歸自我改進(Recursive Self-Improvement)」。透過自我生成訓練資料並進行迭代優化,「草莓」能夠在過程中「學習」如何更有效地解決複雜問題,並且在應對新任務時,能夠利用現有的經驗快速適應。
然而,「草莓」計畫當然也有一些不可忽視的挑戰。例如大規模使用中的穩定性表現,又例如引發 OpenAI 宮變的「安全」問題。此外還有一個更實際問題是,與現有的GPT-4 等多模態模型相比,據稱「草莓」仍然缺乏多模態處理能力,這也意味著它在處理影像、影片等複雜數據時可能面臨限制。
還有價格。
首先要說明的是,在官方還未發布甚至官宣定價之前,實際「草莓」模型的價格是個未知數。但幾乎可以肯定,「草莓」模型的訓練和推理成本都會更貴。而根據 The Information 的消息來源表示,OpenAI 高層一度討論過將「草莓」模型和「Orion」模型(可能是 GPT-5)的訂閱價格定在:
2000 美元/月。
你沒看錯,不是 20 美元(目前 ChatGPT Plus 的定價),也不是 200 美元,而是 2000 美元。儘管只是「一度討論過」,甚至可能只是面對企業用戶,但從中也能體現出「草莓」的高成本,以及 OpenAI 在一定程度上的自信。
目前 Plus 的價格,圖/ ChatGPT
或許,如何平衡高推理能力、成本、使用者體驗等面向之間的關係,是「草莓」計畫必須面對的問題。也就說,OpenAI 推出不同等級、不同價格的「草莓」也沒未必沒有可能。
但無論如何,前提條件還是「草莓」要有足夠優秀、亮眼的表現,就如 2022 年末橫空出世的 ChatGPT(GPT-3.5)一般。
而在未來兩週內,OpenAI 是否能以「草莓」計畫再次定義 AI 的邊界,值得所有人拭目以待。
寫在最後,如果大家需要對AI工具進行付費,可以選擇開通虛擬卡付款。牛牛Visa@Master Card就是一個專門提供虛擬卡的平台,有興趣的朋友可以添加客服TG(@bullbull1999)諮詢了解。