中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>
    • 關(guān)于ZAKER 合作
      量子位 52分鐘前

      馬斯克開始瘋狂劇透 Grok 5 了

      馬斯克的Grok 5偷偷藏不住了。

      剛剛 ARC-AGI 榜單官宣出現(xiàn)新SOTA,用的還是Grok 4+ 程序合成技術(shù)微調(diào)

      好小汁,啥時候開始 Grok 都彎道超車了?OpenAI、Anthropic、谷歌一眾明星模型都被壓一頭。

      一石激起千層浪,網(wǎng)友紛紛發(fā)問,那等Grok5出來,豈不是……

      馬斯克也隨即出來回應(yīng):

      我現(xiàn)在認(rèn)為 Grok 5 能達(dá)到 AGI。

      順便附贈了一堆有關(guān) Grok 5 的爆料。

      馬斯克瘋狂劇透 Grok 5

      這事還得從 Grok 4 超越預(yù)期的表現(xiàn)說起,發(fā)布才兩個月就登上多個榜單第一的寶座,而就在剛剛,ARC Prize 發(fā)布了兩個最新的ARC-AGI榜單 SOTA 方案:

      都是開源的。

      都使用的是 Grok 4 作為基礎(chǔ)模型。

      都實現(xiàn)了帶測試自適應(yīng)的程序合成外循環(huán)。

      先簡單介紹一下 ARC-AGI 排行榜,其旨在評估 AI 解決復(fù)雜難題的能力,類似于人類的智力測試,從而反映 LLM 的推理能力。

      測試任務(wù)包含 v1 和 v2 版本,v2 需要 LLM 完成更多的多步驟推理,一般來說,即使是最優(yōu)秀的 LLM 也只能在 v2 中獲得16%的準(zhǔn)確率。

      GPT-5在二者上的得分依次是 65.7% 和 9.9%,Claude Opus 4的得分是 35.7% 和 8.6%,而Grok 4則是 66.7% 和 16%。

      Jeremy Berman 的新方案則是在 Grok 4 基礎(chǔ)上,用英語替代了傳統(tǒng)的 Python,最終得分來到 79.6% 和 29.44%。

      Eric Pang 則在 Jeremy 的工作上,設(shè)計了一個受DreamCoder啟發(fā)、LLM 輔助的程序合成系統(tǒng),能夠通過從不斷擴展的程序庫中學(xué)習(xí)來解決越來越難的任務(wù)。

      雖然得分沒有進(jìn)一步升高(77.1% 和 26%),但是成功讓每個任務(wù)的平均費用得以下降(v1:8.42 美元→ 2.56 美元;v2:30.4 美元→ 3.97 美元)。

      當(dāng)問及兩位作者選擇 Grok 4 的理由,他們均表示,這是他們測試下來效果最好的模型。

      當(dāng)中所體現(xiàn)出的 AGI 潛力,也讓馬斯克感到自豪,隨即透露了一系列有關(guān)Grok 5的消息。

      老馬表示,這才只是 Grok 4,而 Grok 5 將很有可能達(dá)成AGI。

      而這個可能性也許能達(dá)到 10% 或者更高,要知道他此前并不認(rèn)為 Grok 版本會出現(xiàn) AGI。

      與此同時,他表示Grok 5 將會在幾周之內(nèi)開始訓(xùn)練

      加上此前他曾表示 Grok 5 將在今年年底前推出,或許我們將在不久后見證新的 "LLM 怪物 " 誕生。

      所以為什么老馬能對 Grok 5 抱以如此強烈的信心呢?

      訓(xùn)練數(shù)據(jù)及硬件資源的投入

      歸根結(jié)底,是馬斯克在 Grok 訓(xùn)練中投入之深。

      據(jù)悉,Grok 5 將擁有較之前代更多的訓(xùn)練數(shù)據(jù)。

      Grok 4 的訓(xùn)練量是 Grok 2 的 100 倍、Grok 3 的 10 倍,而 Grok 5 則只會更多。

      馬斯克擁有一整套的最新真實數(shù)據(jù)收集體系,其中xAI可以為其提供最新的直接數(shù)據(jù),特斯拉可以定期利用 FSD 和攝像頭捕獲圖像從而生成數(shù)據(jù),而擎天柱機器人也能從現(xiàn)實世界中生成大量數(shù)據(jù)。

      可以說,馬斯克在當(dāng)下數(shù)據(jù)為王的時代,最不缺的就是數(shù)據(jù)。

      此外,xAI 在硬件資源上也投入頗多,目標(biāo)在 5 年內(nèi)完成相當(dāng)于 5000 萬臺 H100 GPU 同等算力的部署。

      其專門為 Grok 系列打造的超級計算集群Colossus,已經(jīng)部署了約 23 萬張 GPU。其中包括 3 萬張 NVIDIA GB200(基于 Nvidia 的 Blackwell 架構(gòu)),將會持續(xù)為 Grok 提供強大的算力支持。

      不過 Grok 5 究竟能否真正實現(xiàn) AGI,網(wǎng)友們對此也提出了質(zhì)疑:畢竟要成為 AGI 靠的可不僅僅是數(shù)據(jù)和馬斯克的聲明,一切還得看成品

      所以究竟誰才是能吃到第一只 AGI 螃蟹的 AI 公司,且讓我們拭目以待。

      參考鏈接:

      [ 1 ] https://x.com/elonmusk/status/1968196086193066365

      [ 2 ] https://jeremyberman.substack.com/p/how-i-got-the-highest-score-on-arc-agi-again

      [ 3 ] https://ctpang.substack.com/p/e760eba7-c8b3-4fda-b631-61b89dd0d0fd

      [ 4 ] https://www.tomshardware.com/tech-industry/artificial-intelligence/elon-musk-says-xai-is-targeting-50-million-h100-equivalent-ai-gpus-in-five-years-230k-gpus-including-30k-gb200s-already-reportedly-operational-for-training-grok

      一鍵三連「點贊」「轉(zhuǎn)發(fā)」「小心心」

      歡迎在評論區(qū)留下你的想法!

      年度科技風(fēng)向標(biāo)「2025 人工智能年度榜單」評選報名開啟啦!我們正在尋找 AI+ 時代領(lǐng)航者 點擊了解詳情

      企業(yè)、產(chǎn)品、人物 3 大維度,共設(shè)立了 5 類獎項,歡迎企業(yè)報名參與

      一鍵關(guān)注 點亮星標(biāo)

      科技前沿進(jìn)展每日見

      相關(guān)標(biāo)簽

      相關(guān)閱讀

      最新評論

      沒有更多評論了