由 DeepSeek 團(tuán)隊(duì)共同完成、梁文鋒擔(dān)任通訊作者的 DeepSeek-R1 推理模型研究論文,登上了國(guó)際權(quán)威期刊《自然(Nature)》的封面。與今年 1 月發(fā)布的 DeepSeek-R1 的初版論文相比,本次論文披露了更多模型訓(xùn)練的細(xì)節(jié),并正面回應(yīng)了模型發(fā)布之初的蒸餾質(zhì)疑。DeepSeek-R1 也是全球首個(gè)經(jīng)過(guò)同行評(píng)審的主流大語(yǔ)言模型。Nature 評(píng)價(jià)道:目前幾乎所有主流的大模型都還沒(méi)有經(jīng)過(guò)獨(dú)立同行評(píng)審,這一空白 " 終于被 DeepSeek 打破 "。(第一財(cái)經(jīng))
36氪
12小時(shí)前