中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>

量子位 52分鐘前

馬斯克開始瘋狂劇透 Grok 5 了

馬斯克的Grok 5偷偷藏不住了。

剛剛 ARC-AGI 榜單官宣出現(xiàn)新SOTA，用的還是Grok 4+ 程序合成技術(shù)微調(diào)。

好小汁，啥時候開始 Grok 都彎道超車了？OpenAI、Anthropic、谷歌一眾明星模型都被壓一頭。

一石激起千層浪，網(wǎng)友紛紛發(fā)問，那等Grok5出來，豈不是……

馬斯克也隨即出來回應(yīng)：

我現(xiàn)在認(rèn)為 Grok 5 能達(dá)到 AGI。

順便附贈了一堆有關(guān) Grok 5 的爆料。

馬斯克瘋狂劇透 Grok 5

這事還得從 Grok 4 超越預(yù)期的表現(xiàn)說起，發(fā)布才兩個月就登上多個榜單第一的寶座，而就在剛剛，ARC Prize 發(fā)布了兩個最新的ARC-AGI榜單 SOTA 方案：

都是開源的。

都使用的是 Grok 4 作為基礎(chǔ)模型。

都實現(xiàn)了帶測試自適應(yīng)的程序合成外循環(huán)。

先簡單介紹一下 ARC-AGI 排行榜，其旨在評估 AI 解決復(fù)雜難題的能力，類似于人類的智力測試，從而反映 LLM 的推理能力。

測試任務(wù)包含 v1 和 v2 版本，v2 需要 LLM 完成更多的多步驟推理，一般來說，即使是最優(yōu)秀的 LLM 也只能在 v2 中獲得16%的準(zhǔn)確率。

GPT-5在二者上的得分依次是 65.7% 和 9.9%，Claude Opus 4的得分是 35.7% 和 8.6%，而Grok 4則是 66.7% 和 16%。

Jeremy Berman 的新方案則是在 Grok 4 基礎(chǔ)上，用英語替代了傳統(tǒng)的 Python，最終得分來到 79.6% 和 29.44%。

Eric Pang 則在 Jeremy 的工作上，設(shè)計了一個受DreamCoder啟發(fā)、LLM 輔助的程序合成系統(tǒng)，能夠通過從不斷擴展的程序庫中學(xué)習(xí)來解決越來越難的任務(wù)。

雖然得分沒有進(jìn)一步升高（77.1% 和 26%），但是成功讓每個任務(wù)的平均費用得以下降（v1：8.42 美元→ 2.56 美元；v2：30.4 美元→ 3.97 美元）。

當(dāng)問及兩位作者選擇 Grok 4 的理由，他們均表示，這是他們測試下來效果最好的模型。

當(dāng)中所體現(xiàn)出的 AGI 潛力，也讓馬斯克感到自豪，隨即透露了一系列有關(guān)Grok 5的消息。

老馬表示，這才只是 Grok 4，而 Grok 5 將很有可能達(dá)成AGI。

而這個可能性也許能達(dá)到 10% 或者更高，要知道他此前并不認(rèn)為 Grok 版本會出現(xiàn) AGI。

與此同時，他表示Grok 5 將會在幾周之內(nèi)開始訓(xùn)練。

加上此前他曾表示 Grok 5 將在今年年底前推出，或許我們將在不久后見證新的 "LLM 怪物 " 誕生。

所以為什么老馬能對 Grok 5 抱以如此強烈的信心呢？

訓(xùn)練數(shù)據(jù)及硬件資源的投入

歸根結(jié)底，是馬斯克在 Grok 訓(xùn)練中投入之深。

據(jù)悉，Grok 5 將擁有較之前代更多的訓(xùn)練數(shù)據(jù)。

Grok 4 的訓(xùn)練量是 Grok 2 的 100 倍、Grok 3 的 10 倍，而 Grok 5 則只會更多。

馬斯克擁有一整套的最新真實數(shù)據(jù)收集體系，其中xAI可以為其提供最新的直接數(shù)據(jù)，特斯拉可以定期利用 FSD 和攝像頭捕獲圖像從而生成數(shù)據(jù)，而擎天柱機器人也能從現(xiàn)實世界中生成大量數(shù)據(jù)。

可以說，馬斯克在當(dāng)下數(shù)據(jù)為王的時代，最不缺的就是數(shù)據(jù)。

此外，xAI 在硬件資源上也投入頗多，目標(biāo)在 5 年內(nèi)完成相當(dāng)于 5000 萬臺 H100 GPU 同等算力的部署。

其專門為 Grok 系列打造的超級計算集群Colossus，已經(jīng)部署了約 23 萬張 GPU。其中包括 3 萬張 NVIDIA GB200（基于 Nvidia 的 Blackwell 架構(gòu)），將會持續(xù)為 Grok 提供強大的算力支持。

不過 Grok 5 究竟能否真正實現(xiàn) AGI，網(wǎng)友們對此也提出了質(zhì)疑：畢竟要成為 AGI 靠的可不僅僅是數(shù)據(jù)和馬斯克的聲明，一切還得看成品。

所以究竟誰才是能吃到第一只 AGI 螃蟹的 AI 公司，且讓我們拭目以待。

參考鏈接：

[ 1 ] https://x.com/elonmusk/status/1968196086193066365

[ 2 ] https://jeremyberman.substack.com/p/how-i-got-the-highest-score-on-arc-agi-again

[ 3 ] https://ctpang.substack.com/p/e760eba7-c8b3-4fda-b631-61b89dd0d0fd

[ 4 ] https://www.tomshardware.com/tech-industry/artificial-intelligence/elon-musk-says-xai-is-targeting-50-million-h100-equivalent-ai-gpus-in-five-years-230k-gpus-including-30k-gb200s-already-reportedly-operational-for-training-grok

一鍵三連「點贊」「轉(zhuǎn)發(fā)」「小心心」

歡迎在評論區(qū)留下你的想法！

— 完 —

年度科技風(fēng)向標(biāo)「2025 人工智能年度榜單」評選報名開啟啦！我們正在尋找 AI+ 時代領(lǐng)航者點擊了解詳情

企業(yè)、產(chǎn)品、人物 3 大維度，共設(shè)立了 5 類獎項，歡迎企業(yè)報名參與

一鍵關(guān)注點亮星標(biāo)

科技前沿進(jìn)展每日見

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費視頻剪輯工具

相關(guān)標(biāo)簽

nvidia 人工智能 python

相關(guān)閱讀

天鋇公布新款eGPU顯卡塢：可直接安裝一臺迷你電腦

快科技 13分鐘前

DeepSeek首次回應(yīng)蒸餾OpenAI質(zhì)疑：沒有故意加入合成數(shù)據(jù)

快科技 25分鐘前

IDC：上半年全球開放式耳機占比突破10%，耳夾式產(chǎn)品領(lǐng)跑增長

36氪 2小時前

恒生聚源吳震操談AI爆款攻略：數(shù)據(jù)決定未來，三大場景落地指南

21世紀(jì)經(jīng)濟報道 1小時前

對NVIDIA不滿徹底決裂：EVGA退出顯卡市場已有三年

快科技 2小時前

LG電子推自愿裁員最高補償三年工資

快科技 3小時前

梁文鋒論文登上《自然》封面；李飛飛放出3D AI新成果

21世紀(jì)經(jīng)濟報道 4小時前

技嘉X870 AORUS Tachyon加持：銳龍7 9800X3D超頻新世界紀(jì)錄！突破7.3GHz大關(guān)

快科技 4小時前

中國智能手機銷量全線下跌！僅華為、OPPO上漲

快科技 5小時前

融資數(shù)億、核心技術(shù)全自研，這家衛(wèi)星通信廠商打破海外壟斷

36氪 5小時前

無人配送車市場爆發(fā)，新玩家還有機會嗎？

鈦媒體 6小時前

2025 ITValue Summit 數(shù)字價值年會

鈦媒體 6小時前

我國科學(xué)家成功開發(fā)出首例氫負(fù)離子原型電池

36氪 7小時前

一圖看懂：大疆DJI Mini 5 Pro無人機九大升級

快科技 7小時前

美團押注AI+本地生活，AI幫你花錢真的靠譜？

21世紀(jì)經(jīng)濟報道昨天

最新評論

沒有更多評論了

量子位

訂閱

覺得文章不錯，微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

熱門訂閱換一批

Z科技

專注科技財經(jīng)新聞報道

Blockchain News