【太平洋科技快訊】9 月 18 日消息,由 DeepSeek 團隊共同完成、梁文鋒擔任通訊作者的 DeepSeek-R1 推理模型研究論文,登上國際權威期刊《自然》 ( Nature ) 第 645 期封面。
與今年 1 月發(fā)布的初版論文相比,本次發(fā)表的版本披露了更多模型訓練的技術細節(jié),并對發(fā)布初期外界對模型蒸餾的質疑作出正面回應。
DeepSeek-R1 成為全球首個經過同行評審的主流大語言模型。Nature 評價道:目前幾乎所有主流大模型都還沒有獨立同行評審,這一空白 " 終于被 DeepSeek 打破 "。