藍(lán)鯨新聞 6 月 6 日訊(記者 武靜靜)大模型 " 軍備競(jìng)賽 " 還在持續(xù),越來越多企業(yè)爭(zhēng)相投入開源模型、拼算力、搶生態(tài)。在競(jìng)逐白熱化的當(dāng)下,多數(shù)公司選擇圍繞開源模型進(jìn)行微調(diào)與應(yīng)用開發(fā)。但傳神語聯(lián)選擇了一條不同的路——自研底座大模型,構(gòu)建具備長(zhǎng)期記憶和個(gè)性化能力的完整智能系統(tǒng)。
成立于 2005 年的傳神語聯(lián),是一家從語言服務(wù)起家的企業(yè),卻在 AI 技術(shù)迭代的多個(gè)關(guān)鍵節(jié)點(diǎn)持續(xù)投入,從最初的機(jī)器翻譯、知識(shí)圖譜,到如今的大模型系統(tǒng) " 任度 ",已形成一套覆蓋通用智能與垂直行業(yè)的技術(shù)架構(gòu)。
此次,「藍(lán)鯨科技」采訪了傳神語聯(lián)創(chuàng)始人何恩培,想理解這樣一家 AI 公司,為什么在開源浪潮中堅(jiān)持創(chuàng)新,又如何在中醫(yī)等復(fù)雜領(lǐng)域中推進(jìn) " 大模型 " 的落地。
2016 年,何恩培在一次演講中講出一句話:" 原創(chuàng)不是設(shè)計(jì)出來的,是走出來的。" 彼時(shí),大模型還未成為風(fēng)口," 開源替代 " 也還不是主流話題。而這句話,如今成為傳神語聯(lián)在 AI 時(shí)代差異化路線的注腳。面對(duì)當(dāng)前的大模型 AI 浪潮,公司正在構(gòu)建一個(gè)從基礎(chǔ)大模型到行業(yè)大模型的體系化服務(wù)。
在接受「藍(lán)鯨科技」采訪中,何恩培數(shù)次強(qiáng)調(diào),傳神的路與主流不同。他堅(jiān)持原始創(chuàng)新,不只是出于技術(shù)潔癖,而是源自早期的發(fā)現(xiàn):他們自己開發(fā)的技術(shù)系統(tǒng) " 走得比開源更遠(yuǎn) ",也更適合做 " 結(jié)構(gòu)化的中國(guó)知識(shí)系統(tǒng) "。
這條技術(shù)路線,也造就了 " 極低成本、高適應(yīng)性 " 的大模型系統(tǒng)。以訓(xùn)練成本為例,他們自研的成本僅為 DeepSeek 的十分之一到二十分之一。
何恩培告訴「藍(lán)鯨科技」,對(duì)傳神語聯(lián)而言,大模型只是開始。他們要構(gòu)建的,是一個(gè)能體現(xiàn) " 數(shù)推雙腦 " 價(jià)值的完整人工智能系統(tǒng)。這個(gè)系統(tǒng)不僅僅是 " 說話 " 的智能,而是具備感知、理解、記憶和決策能力的 " 類人智能 "。
" 語言模型是意,但完整的智能還要有‘眼耳鼻身’。" 何恩培用佛家術(shù)語來形容這種結(jié)構(gòu)。
發(fā)力垂直模型,大模型同時(shí)可以有長(zhǎng)短期記憶
目前,傳神語聯(lián)在通用大模型——任度大模型基礎(chǔ)之上,押注在另一個(gè)趨勢(shì)上:垂直行業(yè)模型的崛起。
" 未來,60% 到 70% 的市場(chǎng)會(huì)由垂直行業(yè)模型占據(jù)。" 何恩培判斷,通用大模型雖然耀眼,但難以深入具體行業(yè),無法替代真正理解領(lǐng)域知識(shí)的智能體。從醫(yī)學(xué)到工業(yè)、政務(wù)、金融、教育……每個(gè)行業(yè)的知識(shí)和語境,都會(huì)長(zhǎng)出一個(gè)‘專屬智能’。"
此次,傳神語聯(lián)在基礎(chǔ)大模型任度大模型之上,發(fā)布了新的任度 · 歸藏大模型,將作為用戶的貼身助理,提供更深度的個(gè)性化服務(wù)。
歸藏大模型名字靈感源于上古典籍《歸藏》,據(jù)介紹其在現(xiàn)有大模型技術(shù)的基礎(chǔ)上,通過不同于 RAG、Fine-Tuning 和上下文記憶的方式,實(shí)現(xiàn)了高效的實(shí)時(shí)學(xué)習(xí)和長(zhǎng)期記憶能力。
" 現(xiàn)有方案都存在明顯局限:RAG 僅通過外部數(shù)據(jù)庫搜索,知識(shí)并未真正融入模型,導(dǎo)致理解深度和精度不足;Fine-Tuning 雖然能實(shí)現(xiàn)長(zhǎng)期記憶,但成功率低、成本高,且極易破壞原有神經(jīng)網(wǎng)絡(luò)的完整性,影響模型性能;而上下文記憶則只是臨時(shí)的短期記憶。" 何恩培提到。
他進(jìn)一步解釋稱,歸藏大模型通過將新增知識(shí)動(dòng)態(tài)、高效且低成本地直接壓縮到神經(jīng)網(wǎng)絡(luò)中,實(shí)現(xiàn)了真正的長(zhǎng)期記憶,并且在增量訓(xùn)練時(shí)能保持原有神經(jīng)網(wǎng)絡(luò)的完整性不被破壞。" 歸藏支持整個(gè)神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)學(xué)習(xí),能夠?qū)崿F(xiàn)跨文件、跨對(duì)話的精準(zhǔn)理解和輸出,即使重新打開對(duì)話框也能記住歷史信息和用戶數(shù)據(jù),甚至能靈活修改和刪除記憶,使大模型不再是用戶的‘過客’,而是擁有一個(gè)能記住其習(xí)慣和喜好的個(gè)人助手或伴侶。"
何恩培將歸藏大模型比做鋼鐵俠中的 " 賈維斯 "," 它不僅僅是追求自身知識(shí)的增加,更重要的是能夠記住用戶,做到‘心里有你’。這種能力使得模型能夠變成用戶的個(gè)人助手或伴侶,能夠記住你與它說過的話,甚至在很長(zhǎng)時(shí)間后仍然記得。"
" 讓 AI 像中醫(yī)一樣思考 "
此外,針對(duì)醫(yī)療行業(yè),公司還發(fā)布了 " 任度 · 素問 " 中醫(yī)大模型。
何恩培稱," 素問 " 中醫(yī)大模型源自中醫(yī)經(jīng)典,目標(biāo)不僅是回答中醫(yī)問題,而是模擬中醫(yī)的認(rèn)知體系與診斷邏輯。任度 · 素問中醫(yī)大模型基于傳神語聯(lián)全自研的混合熵(moH)技術(shù)架構(gòu),打造 " 專家級(jí)主動(dòng)問診、營(yíng)養(yǎng)師級(jí)食療規(guī)劃 " 的中醫(yī) AI 助手,為用戶提供智能問診、辨證分析、方劑推薦、健康管理等全流程服務(wù),讓用戶享受到個(gè)性化的中醫(yī)診療體驗(yàn)。
何恩培透露," 素問 " 的 B 端發(fā)展方向是作為醫(yī)生的 " 孿生 ",主要服務(wù)于醫(yī)療專業(yè)人士以及醫(yī)療機(jī)構(gòu),然后服務(wù)普通患者。
在實(shí)測(cè)中,只需要說出自己的身體癥狀,素問作為醫(yī)生的 " 孿生 " 智能體,就能夠復(fù)制并輔助醫(yī)生,特別是像老中醫(yī)那樣專家的問診能力,從而顯著提升醫(yī)生的問診效率。它的核心功能在于能像專家一樣進(jìn)行問診,有效突破傳統(tǒng)中醫(yī)大夫有限的接診量,賦能醫(yī)生服務(wù)更多患者。
素問不僅能問診、應(yīng)答,還能整合醫(yī)理知識(shí)圖譜與案例推理,朝著 " 實(shí)時(shí)學(xué)習(xí) + 長(zhǎng)期記憶 " 的目標(biāo)演進(jìn)。何恩培認(rèn)為:" 人腦之所以智慧,是因?yàn)槟軐W(xué)也能記。AI 也該如此。"
為此,團(tuán)隊(duì)開發(fā)了 " 層進(jìn)式訓(xùn)練方法 ":將模型訓(xùn)練過程分為醫(yī)理、醫(yī)方、醫(yī)驗(yàn)三個(gè)階段,仿佛從《黃帝內(nèi)經(jīng)》開始,逐步修煉成一位臨床醫(yī)家。 這種方式避免了當(dāng)前通用大模型 " 混合數(shù)據(jù)、權(quán)重沖突 " 的問題,也讓模型具有專家式的問診能力。
" 我們不是讓 AI 回答中醫(yī)問題,而是像中醫(yī)一樣思考。"何恩培說。
在更遠(yuǎn)的未來,何恩培設(shè)想:" 我們能不能構(gòu)建一個(gè)不依賴西方范式的 AI 認(rèn)知系統(tǒng)?" 這個(gè)問題,不只是技術(shù)挑戰(zhàn),更是一種愿景。