中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>
    • 關(guān)于ZAKER 合作
      IT之家 17分鐘前

      螞蟻集團(tuán)已部署萬(wàn)卡規(guī)模國(guó)產(chǎn)算力群

      IT 之家 11 月 9 日消息,據(jù)《科創(chuàng)板日?qǐng)?bào)》報(bào)道,11 月 8 日,在 2025 年世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)前沿人工智能模型論壇上,螞蟻集團(tuán)平臺(tái)技術(shù)事業(yè)群總裁駱驥表示,在算力方面,螞蟻已部署萬(wàn)卡規(guī)模的國(guó)產(chǎn)算力集群,適配自研與各主流開(kāi)源模型,訓(xùn)練任務(wù)穩(wěn)定性超過(guò) 98%,訓(xùn)練與推理性能可媲美國(guó)際算力集群,并全面應(yīng)用于安全風(fēng)控領(lǐng)域的大模型訓(xùn)練與推理服務(wù)。

      IT 之家注意到,今年 3 月,螞蟻集團(tuán) Ling 團(tuán)隊(duì)在預(yù)印版 Arxiv 平臺(tái)發(fā)表技術(shù)成果論文《每一個(gè) FLOP 都至關(guān)重要:無(wú)需高級(jí) GPU 即可擴(kuò)展 3000 億參數(shù)混合專(zhuān)家 LING 大模型》,宣布推出兩款不同規(guī)模的 MoE (混合專(zhuān)家)大語(yǔ)言模型 —— 百靈輕量版(Ling-Lite)與百靈增強(qiáng)版(Ling-Plus),并提出一系列創(chuàng)新方法,實(shí)現(xiàn)在低性能硬件上高效訓(xùn)練大模型,顯著降低成本。

      實(shí)驗(yàn)表明,其 3000 億參數(shù)的 MoE 大模型可在使用國(guó)產(chǎn) GPU 的低性能設(shè)備上完成高效訓(xùn)練,性能與完全使用英偉達(dá)芯片、同規(guī)模的稠密模型及 MoE 模型相當(dāng)。

      當(dāng)前,MoE 模型訓(xùn)練通常依賴(lài)英偉達(dá) H100 / H800 等高性能 GPU,成本高昂且芯片短缺,限制了其在資源受限環(huán)境中的應(yīng)用。螞蟻集團(tuán) Ling 團(tuán)隊(duì)提出" 不使用高級(jí) GPU" 擴(kuò)展模型的目標(biāo),通過(guò)創(chuàng)新訓(xùn)練策略,突破資源與預(yù)算限制。具體策略包括:架構(gòu)與訓(xùn)練策略革新,采用動(dòng)態(tài)參數(shù)分配與混合精度調(diào)度技術(shù);升級(jí)訓(xùn)練異常處理機(jī)制,自適應(yīng)容錯(cuò)恢復(fù)系統(tǒng)縮短中斷響應(yīng)時(shí)間;優(yōu)化模型評(píng)估流程,自動(dòng)化評(píng)測(cè)框架壓縮驗(yàn)證周期超 50%;突破工具調(diào)用能力,基于知識(shí)圖譜的指令微調(diào)提升復(fù)雜任務(wù)執(zhí)行精度。

      相關(guān)標(biāo)簽

      相關(guān)閱讀

      最新評(píng)論

      沒(méi)有更多評(píng)論了
      IT之家

      IT之家

      數(shù)碼,科技,生活

      訂閱

      覺(jué)得文章不錯(cuò),微信掃描分享好友

      掃碼分享

      熱門(mén)推薦

      查看更多內(nèi)容