【太平洋科技快訊】近日,據(jù)相關曝料透露,深度求索計劃于下個月發(fā)布其下一代 AI 大模型 DeepSeek-R2。據(jù)悉,該模型在性能和成本上都取得了顯著突破,并實現(xiàn)了全產(chǎn)業(yè)鏈的自主可控,有望對現(xiàn)有 AI 服務市場產(chǎn)生重大影響。
在訓練和推理性能上,DeepSeek-R2 表現(xiàn)出色?;谌A為昇騰 910B 芯片集群進行訓練,該模型在 FP16 精度下達到 512 PetaFLOPS 的計算能力,芯片使用效率高達 82%,這一性能相當于英偉達上一代 A100 訓練集群的 91%。在推理方面,DeepSeek-R2 的速度達到每秒 320 tokens,比前代模型有顯著提升,并且在復雜邏輯推理任務上的準確率提升了 83%。
此外,DeepSeek-R2 預計將比 GPT-4 的成本降低 97%,這預示著其可能顛覆現(xiàn)有 AI 服務的定價模式。分析師預計,DeepSeek-R2 的定價將顯著低于 OpenAI 的同類產(chǎn)品,這無疑將極大地提升其市場競爭力。