當(dāng)人工智能從實(shí)驗(yàn)室走向產(chǎn)業(yè)應(yīng)用,我們正見(jiàn)證著一場(chǎng)靜默卻深刻的范式革命。
在鈦媒體2025 ITValue Summit前瞻之AI落地指南系列的首場(chǎng)直播中,釘釘CTO朱鴻、壹生檢康創(chuàng)始人王強(qiáng)宇與鈦媒體聯(lián)合創(chuàng)始人劉湘明的對(duì)話,核心命題直指AI落地的本質(zhì):專屬模型能否成為行業(yè)共識(shí)?
從"不敢想"訓(xùn)練自己的模型,到如今"能做到"90%準(zhǔn)確率的婦科行業(yè)專屬模型,王強(qiáng)宇的回答揭示了技術(shù)演進(jìn)的必然邏輯——當(dāng)通用大模型的能力邊界逐漸清晰,企業(yè)開始意識(shí)到智能體的上限本質(zhì)上是模型能力的天花板。這種認(rèn)知轉(zhuǎn)變并非一蹴而就,而是經(jīng)歷了從prompt工程到RAG技術(shù),最終走向自訓(xùn)練模型的螺旋式上升過(guò)程。
特別值得注意的是,壹生檢康將婦科大模型準(zhǔn)確率從70%提升至90.2%的實(shí)踐,同時(shí)還通過(guò)了國(guó)家婦產(chǎn)科衛(wèi)生高級(jí)職稱(正高)考試,不僅證明了中小企業(yè)也能訓(xùn)練高精度模型,更展示了一條可復(fù)制的技術(shù)路徑:均勻的數(shù)據(jù)分布、高質(zhì)量的精標(biāo)數(shù)據(jù)、高效的訓(xùn)練流程,這三者構(gòu)成了專屬模型訓(xùn)練的"鐵三角"。
朱鴻提出的"AI下半場(chǎng)是問(wèn)AI要效果"的觀點(diǎn),進(jìn)一步深化了這場(chǎng)技術(shù)革命的內(nèi)涵。他敏銳地指出,企業(yè)應(yīng)用AI正經(jīng)歷三個(gè)層次的演進(jìn):從知識(shí)管理到經(jīng)營(yíng)決策,最終指向生產(chǎn)工藝流程的自動(dòng)化。
這種分層認(rèn)知揭示了AI落地的漸進(jìn)性——它不是一蹴而就的技術(shù)顛覆,而是逐步深入業(yè)務(wù)骨髓的漸進(jìn)改造。
釘釘定位為"AI基礎(chǔ)設(shè)施提供者"的戰(zhàn)略選擇,恰恰回應(yīng)了這一需求:通過(guò)全鏈路工具鏈降低專屬模型訓(xùn)練門檻,讓企業(yè)無(wú)需從零開始搭建技術(shù)底座。
對(duì)話中最具啟發(fā)性的討論聚焦于專屬模型訓(xùn)練的現(xiàn)實(shí)挑戰(zhàn)。王強(qiáng)宇坦言過(guò)程中多次"練不下去"的困境,這些技術(shù)卡點(diǎn)包括訓(xùn)練數(shù)據(jù)質(zhì)量不佳、訓(xùn)練流程不規(guī)范、強(qiáng)化學(xué)習(xí)效果不穩(wěn)定等。這些因素促使他們找到了解決方案——與釘釘團(tuán)隊(duì)深度共創(chuàng)。
這種合作模式打破了傳統(tǒng)甲乙方關(guān)系,形成了算法專家與行業(yè)know-how的化學(xué)反應(yīng)。朱鴻特別強(qiáng)調(diào)的"信任建立"與"目標(biāo)共識(shí)",道出了AI落地中最容易被忽視卻至關(guān)重要的因素:技術(shù)實(shí)現(xiàn)必須與業(yè)務(wù)目標(biāo)對(duì)齊。當(dāng)企業(yè)清楚定義"什么是足夠好的模型"時(shí),技術(shù)團(tuán)隊(duì)才能有的放矢地優(yōu)化訓(xùn)練策略。
關(guān)于智能體與行業(yè)模型的爭(zhēng)論,實(shí)質(zhì)上反映了AI應(yīng)用的不同哲學(xué)取向。王強(qiáng)宇"智能體更多是‘術(shù)’,行業(yè)模型才是‘道’"的觀點(diǎn),引發(fā)了關(guān)于AI價(jià)值創(chuàng)造方式的深層思考。這種觀點(diǎn)并非否定智能體的價(jià)值,而是強(qiáng)調(diào)數(shù)據(jù)驅(qū)動(dòng)的行業(yè)模型才是釋放AI潛力的根本。
展望未來(lái),對(duì)話傳遞出一個(gè)明確信號(hào):專屬模型正在成為AI落地的共識(shí)路徑。這種共識(shí)的形成源于三個(gè)關(guān)鍵因素:技術(shù)可行性(基礎(chǔ)大模型+大數(shù)據(jù)的有效組合)、商業(yè)合理性(按效果付費(fèi)的商業(yè)模式創(chuàng)新)、生態(tài)完備性(平臺(tái)型企業(yè)的基礎(chǔ)設(shè)施支持)。
附上本期直播時(shí)間軸,幫你快速跳轉(zhuǎn)感興趣的部分
00:45 智能體上限是模型能力,自訓(xùn)練模型成為出路
14:21 AI下半場(chǎng),可能是大數(shù)據(jù)小模型的時(shí)代
29:00 專屬模型訓(xùn)練,卡點(diǎn)在哪
40:03 只做Agent不做行業(yè)模型,相當(dāng)于只做"面子"不做"里子"
以下為對(duì)話實(shí)錄,經(jīng)編輯整理:
智能體上限是模型能力,自訓(xùn)練模型成為出路
劉湘明:各位觀眾大家好,歡迎來(lái)到鈦媒體舉辦的AI落地指南系列的直播的第一場(chǎng)。今天也特別高興邀請(qǐng)到了兩位嘉賓,他們是釘釘CTO朱鴻(一粟)、壹生檢康創(chuàng)始人王強(qiáng)宇。
去年9月份,強(qiáng)宇在鈦媒體三亞的IT價(jià)值峰會(huì)上面有一個(gè)很重要的發(fā)布,過(guò)去一年,產(chǎn)品做了哪些升級(jí)迭代?
王強(qiáng)宇:其實(shí)最重要的迭代就是我們從做Prompt和RAG,變成是自己訓(xùn)練一個(gè)婦科大模型。因?yàn)槲覀冎饾u發(fā)現(xiàn),盡管我們做了很復(fù)雜的Prompt,智能體的準(zhǔn)確率到了70%左右,再往上走就非常難。
我們從今年1月份開始考慮自己訓(xùn)練模型,當(dāng)時(shí)正好也是DeepSeek比較火的時(shí)候。DeepSeek的開源給了我們訓(xùn)練模型的新思路。在三月底四月初的時(shí)候,我們和釘釘團(tuán)隊(duì)做了一些交流,他們很快就提出來(lái)說(shuō)可以支持我們,支持中小企業(yè)創(chuàng)業(yè)公司來(lái)做模型的訓(xùn)練,我們就在釘釘?shù)膶儆?xùn)練平臺(tái)上做了很多共創(chuàng)。
早期主要是從SFT需要的環(huán)境和卡的算力去考慮,之后也是把數(shù)據(jù)標(biāo)注的問(wèn)題做了重新的梳理,包括訓(xùn)練的整個(gè)流程,我們最新發(fā)布版本的婦科大模型準(zhǔn)確率,在六個(gè)癥狀上面可以達(dá)到90.2%。我們也用在了我們自己的"閨蜜醫(yī)生"產(chǎn)品上,一個(gè)32B的小模型只需要2張4090卡就可以跑通(含推理)。
這說(shuō)明,小模型完全可以訓(xùn)練出來(lái),也完全可以跑得起來(lái)。閨蜜醫(yī)生是個(gè)toC的應(yīng)用,解決了很多15-25歲女生遇到的各種婦科問(wèn)題,所以我們覺(jué)得這個(gè)路徑完全可以走得通,這也是我們這次和鈦媒體一起來(lái)聊這個(gè)話題的原因。
劉湘明:你在鈦媒體上發(fā)了兩篇文章,效果都非常好,都是這種非常深度的技術(shù),你提到關(guān)鍵的優(yōu)化,包括針對(duì)一些合成數(shù)據(jù),高質(zhì)量的數(shù)據(jù),對(duì)這種診斷的準(zhǔn)確率提升有很大關(guān)鍵的作用,到底是做的哪些事情呢?
王強(qiáng)宇:主要做了這么幾件事情。
首先就是數(shù)據(jù)的準(zhǔn)備工作,從數(shù)據(jù)的清洗到數(shù)據(jù)的分布,我想先解釋一下什么叫精標(biāo)數(shù)據(jù),對(duì)于醫(yī)學(xué)來(lái)說(shuō),其實(shí)我們說(shuō)的婦科的六大癥狀就是從月經(jīng)不調(diào)到異常出血,到外陰瘙癢,到白帶異常等六個(gè)癥狀。我們過(guò)去的數(shù)據(jù)其實(shí)沒(méi)有很均勻地分布在這六個(gè)癥狀,所以首先我們把數(shù)據(jù)做了一個(gè)很均勻的分布;
第二,我們把數(shù)據(jù)從癥狀信息到思考過(guò)程,到診斷的結(jié)論,做了一次非常認(rèn)真的標(biāo)注,從幾萬(wàn)條數(shù)據(jù)中提取出來(lái)幾千條精標(biāo)數(shù)據(jù);
第三,我們跟釘釘團(tuán)隊(duì)共創(chuàng)。釘釘也有支持我們的算法團(tuán)隊(duì)一起共創(chuàng)和研究pipeline(流水線并行),因?yàn)樵?strong>有了算力以后,需要有一個(gè)步驟去分步去訓(xùn)練這個(gè)模型,我們把過(guò)去二十多個(gè)小時(shí)的訓(xùn)練時(shí)間壓縮到了7個(gè)小時(shí),這個(gè)過(guò)程其實(shí)就離不開釘釘對(duì)我們非常具體的共創(chuàng)和支持。
我們每次訓(xùn)練都會(huì)做迭代和數(shù)據(jù)優(yōu)化,準(zhǔn)確率逐漸從70%多到83%,最后幾天才到90%。
當(dāng)然這里面還有一件事情我覺(jué)得比較重要,就是從管理監(jiān)督學(xué)習(xí)的SFT到算法專家調(diào)整獎(jiǎng)勵(lì)參數(shù)、函數(shù)等,有了釘釘這樣的一個(gè)平臺(tái),我們創(chuàng)業(yè)公司就有一個(gè)更好的底座和基礎(chǔ)來(lái)訓(xùn)練。
所以其實(shí)我覺(jué)得最大的一個(gè)收獲,toC應(yīng)用有數(shù)據(jù)和算力還不夠,需要有行業(yè)專家來(lái)一起來(lái)做這件事情,過(guò)程還是比較曲折的,中間有幾次都練不下去了,在訓(xùn)練環(huán)境上,在數(shù)據(jù)的標(biāo)注的方法上,在訓(xùn)練的整個(gè)的流程上面,其實(shí)都有很多地方是有一些know-how的。
劉湘明:聽(tīng)強(qiáng)宇剛才的介紹,其實(shí)你們跟釘釘?shù)暮献?,其?shí)跟原來(lái)甲方乙方的合作好像不太一樣了,一粟能不能介紹一下?
朱鴻(一粟):隨著通用大模型能力越來(lái)越強(qiáng),好像公眾都已經(jīng)普遍在接觸AI了,我們發(fā)現(xiàn)AI技術(shù)逐漸成熟,尤其像強(qiáng)化學(xué)習(xí)這樣的技術(shù),能夠大幅降低訓(xùn)練成本。
我們的基本判斷就是,AI大模型的下半場(chǎng)就是問(wèn)AI要效果,70分可能只是及格,我們要實(shí)現(xiàn)具體任務(wù)的高準(zhǔn)確度,一定要通過(guò)科學(xué)的訓(xùn)練方法,產(chǎn)生出一個(gè)有效果保障的模型,這是釘釘需要去做的事情。
確實(shí)如強(qiáng)宇所講,訓(xùn)練模型實(shí)際上也是真的是需要勇氣,因?yàn)槲粗臇|西太多。訓(xùn)練模型本身并不是一個(gè)高度確定性的事情,尤其是我們現(xiàn)在還在幾十張卡的訓(xùn)練環(huán)境,如果我們走向百卡、千卡甚至萬(wàn)卡的訓(xùn)練,預(yù)計(jì)挑戰(zhàn)會(huì)更多。
關(guān)于這件事情的價(jià)值,就是進(jìn)入到企業(yè)級(jí)AI領(lǐng)域,我們也有一些思考,企業(yè)用AI一般分成三個(gè)層次。
第一個(gè)就是做企業(yè)知識(shí)的管理,提升信息檢索或企業(yè)內(nèi)部問(wèn)答的效率,門檻也不會(huì)很高,我走訪了可能幾十家企業(yè),90%的企業(yè)都已經(jīng)在內(nèi)部開始實(shí)施知識(shí)庫(kù)的應(yīng)用。
第二個(gè)層次就是經(jīng)營(yíng)決策類的輔助,對(duì)經(jīng)營(yíng)管理做出一些輔助決策,優(yōu)化資源的配置,比如說(shuō)像電商里的銷量預(yù)測(cè),價(jià)格的一些優(yōu)化,或者搭建大數(shù)據(jù)的看板。我們也做了一些嘗試,在招聘領(lǐng)域做簡(jiǎn)歷的初查,這些應(yīng)用也開始在各行各業(yè)里面產(chǎn)生一些新的效果,但是Agent的能力上限,其實(shí)就是模型的創(chuàng)新,模型的能力有多少,Agent很難去超越,所以我們就有這個(gè)決心去和行業(yè)共創(chuàng)垂直行業(yè)大模型。
我們也希望能夠更快進(jìn)入到企業(yè)應(yīng)用AI的第三個(gè)層次,就是生產(chǎn)工藝流程的自動(dòng)化,融入到企業(yè)的核心流程里,推動(dòng)像制造行業(yè)的智能制造、供應(yīng)鏈的優(yōu)化、庫(kù)存的智能調(diào)度,包括我們看到一些行業(yè)多模態(tài)模型的應(yīng)用,老師傅的經(jīng)驗(yàn)可以被訓(xùn)練到模型里,比如在產(chǎn)線聽(tīng)到鍋爐或者發(fā)動(dòng)機(jī)的聲音異常,老師傅一聽(tīng)就知道可能出問(wèn)題了。
但如果沒(méi)有非常昂貴的監(jiān)測(cè)系統(tǒng)的話,實(shí)際上我們可以用非常廉價(jià)的這種設(shè)備,結(jié)合一些新的標(biāo)注,讓老師傅來(lái)成為這個(gè)模型的訓(xùn)練師標(biāo)注師,通過(guò)訓(xùn)練模型的方式,能夠產(chǎn)生一個(gè)AI識(shí)別鍋爐的聲音的功能,診斷下是否有安全隱患。
類似于這樣的小模型,其實(shí)也能夠在企業(yè)經(jīng)營(yíng)、生產(chǎn)管理上產(chǎn)生效果。所以釘釘大模型的下半場(chǎng),我們的定位就是為千行百業(yè)做專屬模型,認(rèn)真做好AI的基礎(chǔ)設(shè)施,提供全鏈路的專屬模型打造工具鏈,做好服務(wù),也是要跟我們的客戶行業(yè)標(biāo)桿一起,探索AI能夠?yàn)槠髽I(yè)未來(lái)帶來(lái)什么樣的價(jià)值,我們做好賦能的工作。
劉湘明:強(qiáng)宇剛才也介紹了很多,那么,做行業(yè)模型這件事的源泉和邏輯是什么?
王強(qiáng)宇:我非常認(rèn)同一粟講的觀點(diǎn),智能體的上限是模型的能力。我們?nèi)ツ?月份參加了鈦媒體的數(shù)字價(jià)值峰會(huì),但走到12月份的時(shí)候,我們已經(jīng)發(fā)現(xiàn),其實(shí)靠智能體已經(jīng)走不下去了。
我覺(jué)得行業(yè)模型的訓(xùn)練是智能體走下去的一個(gè)必然、一個(gè)終局的選擇。當(dāng)然正好也出現(xiàn)了通義QWEN,能力很強(qiáng),又出現(xiàn)了DeepSeek,確實(shí)也有關(guān)系,昨天晚上我跟一個(gè)朋友在聊,他們也說(shuō)到,可能下半場(chǎng)是大數(shù)據(jù)小模型的時(shí)代。
行業(yè)模型就是我們認(rèn)為的大數(shù)據(jù)小模型的時(shí)代。從我們自己訓(xùn)練模型的體會(huì),我們最深刻地體會(huì),可能還是深度共創(chuàng),釘釘是具備這樣的土壤和環(huán)境的。所以我其實(shí)很感謝釘釘,既非常敏銳地看到了這樣的一個(gè)機(jī)遇,又非常開放地給垂直公司這樣的機(jī)會(huì)。
因?yàn)閷?duì)于中小創(chuàng)業(yè)公司來(lái)說(shuō),有幾個(gè)很大的瓶頸。第一個(gè)就是算力資源,我們都很清楚,由于地緣政治的原因,算力資源對(duì)中小企業(yè)來(lái)說(shuō)是非常難的,不是光有錢的問(wèn)題,可能有錢也不一定買得到。
第二,就是訓(xùn)練環(huán)境的搭建。釘釘團(tuán)隊(duì)給了我們非常大的支持。因?yàn)樗麄冇幸恍┳鲞^(guò)行業(yè)訓(xùn)練或者做過(guò)基模訓(xùn)練的工程師和專家,可以幫助我們快速搭建行業(yè)模型的訓(xùn)練環(huán)境。這看起來(lái)好像沒(méi)有那么難,但是實(shí)際上自己要摸索蠻長(zhǎng)時(shí)間。
第三,就是訓(xùn)練方法,有數(shù)據(jù)是不是就能訓(xùn)練出一個(gè)高準(zhǔn)確度的模型?不一定,因?yàn)槟阈枰幸粋€(gè)正確的訓(xùn)練方法,這就是我們經(jīng)常說(shuō)的算力、算法和數(shù)據(jù)的關(guān)系。打個(gè)比方,數(shù)據(jù)相當(dāng)于做菜的原材料,光有原材料是不是就能做一桌好菜,你還要有很好的烹飪的方法,烹飪的流程,這個(gè)就是釘釘提供的東西,所以這幾個(gè)東西其實(shí)釘釘都能夠很好地提供。
釘釘又是很懂行業(yè)的一個(gè)應(yīng)用,所以我覺(jué)得這才是未來(lái)中小企業(yè)釋放數(shù)據(jù)活力的場(chǎng)景。
劉湘明:一粟有什么補(bǔ)充么?
朱鴻:我簡(jiǎn)單補(bǔ)充一下。強(qiáng)宇講得很好,從成本上來(lái)講分三部分:第一部分是數(shù)據(jù),第二部分是整個(gè)算力以及工程鏈路,第三塊是算法的人才成本。
釘釘希望能夠?yàn)槠髽I(yè)實(shí)現(xiàn)一個(gè)按效果付費(fèi)的訓(xùn)練,按需付費(fèi)的推理。
在AI技術(shù)發(fā)展的早期,這個(gè)投資大家也不確定,投下去到底能產(chǎn)生多少的價(jià)值,釘釘愿意為各行各業(yè)去提供一個(gè)效果導(dǎo)向的專屬AI工廠,送進(jìn)來(lái)的就是很好的原料,數(shù)據(jù)是企業(yè)的私有,以及企業(yè)的業(yè)務(wù)專家人才。
我們是算法,對(duì)這些數(shù)據(jù)的質(zhì)量以及訓(xùn)練的目標(biāo)做測(cè)試,確定投入下去有效果,整個(gè)訓(xùn)練過(guò)程有可能產(chǎn)生一些問(wèn)題,這些問(wèn)題都是釘釘去解決。我們希望在雙方投入下去之前,就對(duì)模型的能力就有一個(gè)共識(shí),基于這個(gè)共識(shí),我們一起努力地把這個(gè)專屬模型有效地生產(chǎn)出來(lái),所以釘釘希望在AI的這個(gè)時(shí)代,實(shí)現(xiàn)AI按效果付費(fèi)的商業(yè)化的解決方案。
劉湘明:特別好。因?yàn)榇蠹椰F(xiàn)在到AI時(shí)代都在談按效果付費(fèi),釘釘好像第一個(gè)把這個(gè)大旗舉起來(lái),我想追問(wèn)一句,就是你說(shuō)按效果付費(fèi),你們的底氣來(lái)自于什么地方?因?yàn)閯偛乓舱劦搅耍鋵?shí)之前我們過(guò)去幾十年,大家都想走這條路。
朱鴻:這個(gè)底氣,第一來(lái)自于阿里云,尤其像大模型的訓(xùn)練過(guò)程中,積累沉淀下來(lái)的知識(shí),以及最大的算力供給。我們可以在非常短的時(shí)間內(nèi)去調(diào)度百卡甚至千卡的算力。我們也期望未來(lái)每家企業(yè)都有不止一個(gè)專屬模型,并且能夠通過(guò)釘釘上的數(shù)據(jù)閉環(huán)鏈路,實(shí)現(xiàn)一個(gè)模型可以每天迭代。就像我們現(xiàn)在開發(fā)釘釘?shù)膽?yīng)用,快速迭代適應(yīng)業(yè)務(wù)的一些不確定性。
整個(gè)阿里集團(tuán),包括釘釘積累的經(jīng)驗(yàn)、知識(shí)、人才,以及釘釘已經(jīng)連接了中國(guó)最廣泛的企業(yè),尤其是像制造行業(yè)、零售行業(yè)的標(biāo)桿客戶。他們有這樣的意愿和我們共創(chuàng)。
這也是釘釘一直以來(lái)堅(jiān)守的產(chǎn)品文化,我們不去定義太多,不是站在自己平臺(tái)的角度去定義產(chǎn)品,而是跟我們的客戶去共創(chuàng)。
產(chǎn)品來(lái)源于真實(shí)的場(chǎng)景需求,將阿里的技術(shù)普惠化,讓技術(shù)和業(yè)務(wù)比較深入地去結(jié)合,以最終效果為導(dǎo)向去衡量。當(dāng)然最重要的就是客戶的信任,才有這樣的一個(gè)底氣。
劉湘明:話題回到強(qiáng)宇這邊,你們有沒(méi)有估算過(guò)效果是什么樣的?
王強(qiáng)宇:這其實(shí)也是我想聊的話題,從六月底達(dá)到90%準(zhǔn)確度之后,我們很快就已經(jīng)部署到閨蜜醫(yī)生這么一個(gè)to C應(yīng)用上。剛剛我們和美年大健康的合作伙伴還在演示我們的產(chǎn)品,我們其實(shí)就部署了幾張4090的卡,回答的速度和準(zhǔn)確度,跟DeepSeek已經(jīng)在體驗(yàn)上沒(méi)什么差別,我們也有一個(gè)功能是深度思考的,叫問(wèn)癥狀的功能。
每天幾千個(gè)、上萬(wàn)個(gè)用戶已經(jīng)在用,我們的客戶已經(jīng)都在用這個(gè)婦科大模型,效果還是令人滿意的。
第二,我們現(xiàn)在已經(jīng)準(zhǔn)備向一些醫(yī)院開放這樣的能力了,特別是一些??漆t(yī)院,婦科的醫(yī)院。我們其實(shí)也在跟醫(yī)院聊,通過(guò)醫(yī)院的數(shù)據(jù)訓(xùn)練醫(yī)院的專科大模型。
中國(guó)其實(shí)有很多這樣的專科醫(yī)院,我們覺(jué)得應(yīng)用場(chǎng)景非常廣闊,很多醫(yī)院的數(shù)據(jù)拿出來(lái)訓(xùn)練以后,可以很快這個(gè)專屬模型達(dá)到醫(yī)院的頂尖水平。
相當(dāng)于每一個(gè)患者來(lái)這里預(yù)問(wèn)診的時(shí)候,就等于是醫(yī)院最好的專家來(lái)幫他做問(wèn)診,再分解到線下的問(wèn)診,極大可以釋放醫(yī)院數(shù)據(jù)的能量和能力。
第三,我們跟釘釘也在繼續(xù)訓(xùn)練婦科模型,下一步的目標(biāo)就是從婦科到婦產(chǎn)科,另外我們的目標(biāo)是通過(guò)婦產(chǎn)科的正高考試,目前最新的情況已經(jīng)到60多分了,已經(jīng)及格了,我們希望能到75分以上。
剛才一粟講的按效果付費(fèi),我們不知道其他行業(yè)怎么樣,就我們這個(gè)行業(yè),我覺(jué)得完全是有機(jī)會(huì)的。
劉湘明:剛才提到了準(zhǔn)確率,你可能需要跟觀眾做一些科普,在醫(yī)療行業(yè)里面普遍的診斷準(zhǔn)確率大概是什么狀態(tài)?
王強(qiáng)宇:這個(gè)數(shù)字聽(tīng)眾聽(tīng)了以后,可能會(huì)比較失望。我們通過(guò)非官方的數(shù)據(jù)看到,三甲醫(yī)院的估準(zhǔn)率可能在30%到40%左右。當(dāng)然這是非官方數(shù)據(jù),不太準(zhǔn)確哈。
那么出現(xiàn)這樣問(wèn)題的原因是什么?
第一,醫(yī)生的就診時(shí)間太短,我們都看過(guò)專家門診,醫(yī)生他也是人,他也不是神仙,在沒(méi)有完全讀到你的病歷之前,他就要給你做判斷,這個(gè)非常難。
第二,現(xiàn)在中國(guó)醫(yī)院的數(shù)據(jù)還沒(méi)有打通,你在A醫(yī)院看的這個(gè)病,到B醫(yī)院可能它是不連接的。醫(yī)生沒(méi)有辦法像AI匯總數(shù)據(jù),來(lái)判斷你的疾病,所以這也造成了誤診的問(wèn)題。
所以90%的準(zhǔn)確度其實(shí)已經(jīng)很高了。當(dāng)然,這指的是醫(yī)生判斷的第一概率的疾病是什么,他跟真正專家線下標(biāo)準(zhǔn)來(lái)比較,可以到90%的匹配度。
AI的本質(zhì)是普惠人民,就是讓更多的人在醫(yī)生不需要工作的情況下,把自己的癥狀放給醫(yī)生,醫(yī)生大概判斷你可能是一個(gè)什么樣疾病,這肯定可以極大提高人民群眾的就診的體驗(yàn)。
劉湘明:剛才你也提到一個(gè)很關(guān)鍵的問(wèn)題,說(shuō)有幾次訓(xùn)練搞不下去了。直播間的人很多是行家,有人在問(wèn)這個(gè)到底卡在哪兒,能不能跟大家交流一下細(xì)節(jié)?行家們都關(guān)注細(xì)節(jié)。
王強(qiáng)宇:第一個(gè)細(xì)節(jié)就是,我們?cè)谟?xùn)練的過(guò)程中,有一段時(shí)間發(fā)現(xiàn)準(zhǔn)確度怎么也上不去了,到了70它就掉回來(lái)了。我們就很困惑為啥上不去,算力也夠,就是跑不通,就是上不去。
后來(lái)我們就發(fā)現(xiàn),問(wèn)題出在數(shù)據(jù)上,我們后來(lái)跟一粟團(tuán)隊(duì)的算法專家一起討論,首先數(shù)據(jù)在六大領(lǐng)域是要均勻的,我記得是好像是外陰瘙癢這個(gè)癥狀,我們數(shù)據(jù)就很少,可能只有幾千條數(shù)據(jù),所以碰到這個(gè)癥狀的時(shí)候,機(jī)器就不懂,他就訓(xùn)不出來(lái)。我們后來(lái)很快花了很多時(shí)間去調(diào)整數(shù)據(jù)的分布,做精標(biāo)數(shù)據(jù)的分布。
第二卡點(diǎn),訓(xùn)練流程可能不一定對(duì),模型需要一個(gè)很正確的pipeline訓(xùn)練步驟。你先要去做什么樣的訓(xùn)練,后面再做什么。我們?cè)阝伱襟w發(fā)的文章,基本上都核心的know-how說(shuō)出來(lái)了,基本上沒(méi)有怎么做保留。
后來(lái)我們和一粟團(tuán)隊(duì)建立流程之后,其實(shí)很快就找到了一條正確的道路。按照這個(gè)流程準(zhǔn)備數(shù)據(jù),準(zhǔn)備數(shù)據(jù)了以后分步來(lái)訓(xùn)練,然后就看到準(zhǔn)確率就逐漸地提高了。當(dāng)然在強(qiáng)化學(xué)習(xí)上面可能還有一些困難和問(wèn)題還沒(méi)有完全解決。
因?yàn)槲覀兒髞?lái)發(fā)現(xiàn),強(qiáng)化學(xué)習(xí)真的要讓它出現(xiàn)好的結(jié)果,可能你需要的數(shù)據(jù)質(zhì)量,包括分布可能有更高的要求。所以我們現(xiàn)在通過(guò)獎(jiǎng)勵(lì)函數(shù)去做更深的共創(chuàng)和研究。
劉湘明:一粟還有什么補(bǔ)充么?
朱鴻:我覺(jué)得第一個(gè)挑戰(zhàn)還是一開始的信任。雙方在第一周的合作里面,共同地建立起工作目標(biāo)的認(rèn)知,我們就是要做到高分,而且是有時(shí)間要求,我覺(jué)得這是第一個(gè)挑戰(zhàn)。
前面講到的數(shù)據(jù)問(wèn)題,數(shù)據(jù)的配方確實(shí)是模型產(chǎn)生真正能力的關(guān)鍵,在這方面下了不少的功夫,那今天的技術(shù)人員在這個(gè)模型能力上不去的時(shí)候,診斷到底哪里有問(wèn)題。這還是基于模型訓(xùn)練的專業(yè)知識(shí),專家經(jīng)驗(yàn)來(lái)判斷能夠給出定位問(wèn)題,快速反饋以及雙方一起再把這個(gè)問(wèn)題解決,如果設(shè)置目標(biāo)很低,其實(shí)他并不滿足行業(yè)的生產(chǎn)的要求。
劉湘明:我們?cè)谌ツ暝谌齺喴灿懻撨^(guò),大家很容易達(dá)到一個(gè)好像看著不錯(cuò)的分值,有的人說(shuō)是三四十分,有的人說(shuō)是六七十分。但是真正達(dá)到可用的優(yōu)秀狀態(tài),其實(shí)中間有一個(gè)很難突破的瓶頸。也想請(qǐng)兩位分享一下,你覺(jué)得到底是什么地方是卡點(diǎn),怎么去突破這個(gè)瓶頸。
王強(qiáng)宇:深度共創(chuàng)其實(shí)還蠻難的。我覺(jué)得釘釘在這一點(diǎn)上我特別認(rèn)可,剛才一粟也說(shuō)了,釘釘是千行萬(wàn)業(yè)的釘釘,釘釘?shù)亩ㄎ挥衅栈莸乃枷?,一個(gè)大公司很難跟一個(gè)創(chuàng)業(yè)公司在一起做很深度的共創(chuàng)。
無(wú)招回到阿里之后,他還是把這個(gè)共創(chuàng)的大旗和文化重新樹立起來(lái)了。大家都其實(shí)看過(guò)無(wú)招第一段創(chuàng)業(yè),如果沒(méi)有那家公司,可能釘釘?shù)恼Q生至少要晚幾年。
所以我覺(jué)得共創(chuàng)的文化和共創(chuàng)的精神,是解決卡點(diǎn)的精神和文化內(nèi)因。我們跟一粟團(tuán)隊(duì)之間也非常親密無(wú)間在合作。我們沒(méi)有說(shuō)這個(gè)數(shù)據(jù)不能給你看,你不能來(lái)了解我的這個(gè)know-how,一粟也沒(méi)有覺(jué)得這個(gè)算法不是我的事,我為什么要替你去研究這個(gè)事。
回到模型訓(xùn)練這個(gè)事,連大模型都能訓(xùn)練出來(lái),行業(yè)模型訓(xùn)練不出來(lái)么,肯定訓(xùn)練的出來(lái)。我作為一個(gè)創(chuàng)始人的角度,我理解就是說(shuō)技術(shù)的困難確實(shí)有,但你做這件事情的精力夠不夠?是不是真的愿意把這些數(shù)據(jù)問(wèn)題拿出來(lái)。
畢竟行業(yè)模型也不需要去做一個(gè)基模的創(chuàng)新,這些問(wèn)題從理論上來(lái)說(shuō),其實(shí)都是有方案可以解決的,只是說(shuō)能解到什么程度。釘釘很快補(bǔ)充了和吸引了很多算法人才進(jìn)來(lái),這可能也是解決問(wèn)題的另外一個(gè)原因,這部分可能一粟可以更多講一下。
朱鴻:行業(yè)模型要成功,關(guān)鍵的就是大模型算法或者工程技術(shù)人員和懂這個(gè)行業(yè)的人,大家互相信任,能夠結(jié)合在一起訓(xùn)練模型。
我們可以看到,今天在行業(yè)里面,通用大模型的能力在不斷提升,它實(shí)際上是利用了公開的幾乎所有的知識(shí),把它壓縮到了一個(gè)大模型里?,F(xiàn)在跑出來(lái)的模型應(yīng)用,最多的是代碼生成的模型,AI產(chǎn)品可以幫助工程師更快掌握全棧技術(shù),了解技術(shù)原理,因?yàn)锳I把互聯(lián)網(wǎng)上學(xué)到的技術(shù)文檔、知識(shí),代碼都學(xué)習(xí)了。
隨著AI的技術(shù)發(fā)展,我覺(jué)得懂AI的行業(yè)人才也會(huì)越來(lái)越多,在行業(yè)里面的大模型更多被應(yīng)用,被訓(xùn)練出來(lái),被生產(chǎn)出來(lái),所以要達(dá)到今天這個(gè)效果,我認(rèn)為還是要讓AI技術(shù)更加普及,能夠到各個(gè)行業(yè)里去,跟行業(yè)的專家一起把行業(yè)大模型能力定義標(biāo)準(zhǔn),我覺(jué)得AI效果的卡點(diǎn)肯定不是在算力上,一定還是在數(shù)據(jù)和人才的組合。
只做Agent不做行業(yè)模型,相當(dāng)于只做"面子"不做"里子"
劉湘明:后邊一個(gè)問(wèn)題可能是比較有爭(zhēng)議性,拆開兩部分問(wèn):一部分其實(shí)是強(qiáng)宇,今年很熱的一個(gè)話題就是Agent智能體,你們?nèi)ツ觊_始折騰這個(gè)事情,然后Agent今天變得非常的熱;再回到一粟這邊,釘釘其實(shí)把很多的關(guān)注度放在了行業(yè)模型的開發(fā)建設(shè)上,基本沒(méi)有談智能體。你們?cè)趺纯创悄荏w和行業(yè)模型未來(lái)的發(fā)展,沿著你們的思路,未來(lái)會(huì)有哪些機(jī)會(huì)?
王強(qiáng)宇:這個(gè)話題我也是挺想說(shuō)一說(shuō)的,智能體今年其實(shí)確實(shí)很熱,包括MCP,包括智能體的一些公司Manus等,我是很認(rèn)同一粟的觀點(diǎn),智能體的上限是模型的能力。
如果說(shuō)是一個(gè)辯論大賽的話,我肯定是支持行業(yè)模型和垂直模型才是更好的AI下半場(chǎng)的未來(lái)的觀點(diǎn),因?yàn)橹悄荏w做得再好,你可能能做的事情就是把它的應(yīng)用做得更絲滑、做得更方便,比如說(shuō)MCP形態(tài),可以把這個(gè)事情做得完成度更高。
但是如果我們不能把行業(yè)的數(shù)據(jù)挖掘出來(lái),其實(shí)等于放著一個(gè)金礦,你沒(méi)有去采。而是天天研究怎么能把門面做得更好看一點(diǎn),門面做得好看,數(shù)據(jù)的威力發(fā)揮不出來(lái),那么AI的算法算力怎么能夠發(fā)揮作用。
我們作為行業(yè)應(yīng)用公司,肯定是要把數(shù)據(jù)的力量真正發(fā)揮出來(lái),讓數(shù)據(jù)用到該到的地方去,我非常支持釘釘在行業(yè)數(shù)據(jù)這一塊的研究,而且從千行萬(wàn)業(yè)的角度來(lái)看,行業(yè)模型訓(xùn)練才是最大能釋放中小企業(yè)和各個(gè)行業(yè)公司生產(chǎn)力的機(jī)會(huì)。
因?yàn)橹悄荏w可能影響的就是這些PaaS的公司,但是我覺(jué)得還不是特別根本。所以我其實(shí)有一個(gè)觀點(diǎn),這個(gè)觀點(diǎn)有點(diǎn)偏執(zhí),我覺(jué)得智能體更多的就是"術(shù)"方面的事情,"道"的問(wèn)題還是要解決數(shù)據(jù)和訓(xùn)練的問(wèn)題。
這個(gè)觀點(diǎn)對(duì)不對(duì),也要未來(lái)去驗(yàn)證,但是在今天這個(gè)時(shí)間點(diǎn),我們來(lái)談智能體更遠(yuǎn)的未來(lái)是什么,我覺(jué)得肯定離不開模型,離不開行業(yè)模型的訓(xùn)練,離不開這些數(shù)據(jù)使用的價(jià)值。
AI時(shí)代跟上一個(gè)數(shù)據(jù)時(shí)代肯定是相關(guān)聯(lián)的,數(shù)據(jù)才是真正的原材料。如果沒(méi)有原材料,AI時(shí)代怎么能夠跑得起來(lái)好的應(yīng)用?這是我的一個(gè)觀點(diǎn)。
我還想補(bǔ)充一點(diǎn)卡點(diǎn)的問(wèn)題,我們公司其實(shí)也是一個(gè)跨界的團(tuán)隊(duì)。當(dāng)你做一個(gè)行業(yè)的時(shí)候,可能你需要跨界,除了算法工程師、應(yīng)用工程師以外,我們還有一個(gè)全職的醫(yī)學(xué)團(tuán)隊(duì),他們都是醫(yī)生出身,我最近聽(tīng)說(shuō)螞蟻有個(gè)團(tuán)隊(duì)中也有好幾十個(gè)醫(yī)生,所以就是說(shuō)真正要把應(yīng)用做到很好,創(chuàng)業(yè)者可能也要組建一個(gè)創(chuàng)業(yè)團(tuán)隊(duì),在AI時(shí)代才會(huì)有機(jī)會(huì)把行業(yè)做得非常深入。
朱鴻:Agent和模型,我覺(jué)得是在AI技術(shù)發(fā)展過(guò)程中,大家的側(cè)重點(diǎn)也在不斷演進(jìn),整個(gè)行業(yè)里面模型訓(xùn)練的迭代速度越來(lái)越快。
從GPT 3.5到現(xiàn)在通義千問(wèn)的迭代速度,過(guò)去可能一年一個(gè)模型,現(xiàn)在一個(gè)月好幾個(gè)模型,我當(dāng)然希望企業(yè)自己的模型也能夠按日來(lái)迭代。只有這樣,企業(yè)才能真正把AI的技術(shù)價(jià)值發(fā)揮出來(lái)
我覺(jué)得整個(gè)行業(yè)從業(yè)者都要積極思考,這里面會(huì)涉及到非常多的技術(shù)。比如去年大家談很多微調(diào),微調(diào)成本也不低的,今年更多就是強(qiáng)化學(xué)習(xí),明年會(huì)不會(huì)有新的技術(shù)出來(lái),我想一定會(huì)有。
這些技術(shù)迅速地被應(yīng)用起來(lái),原來(lái)需要做很多的Agent編排,這個(gè)工程工作是不是會(huì)被新訓(xùn)練的模型自動(dòng)解決掉,讓整個(gè)應(yīng)用的體驗(yàn)變得更好,我想這一定是一個(gè)動(dòng)態(tài)變化的過(guò)程。
我相信模型本身的能力會(huì)不斷加大,但是企業(yè)的知識(shí)最終都是被訓(xùn)到專有數(shù)據(jù)庫(kù),它不會(huì)在一個(gè)智能體的編排的流程上。
劉湘明:強(qiáng)宇下定決心把重點(diǎn)從Agent智能體轉(zhuǎn)到行業(yè)模型的訓(xùn)練上,這個(gè)決心有多難?剛才也談到了行業(yè)模型,你們都覺(jué)得是一個(gè)更值得關(guān)注的趨勢(shì),企業(yè)尤其中小企業(yè)需要做好哪些準(zhǔn)備?
王強(qiáng)宇:是這樣的,我們當(dāng)時(shí)從Agent轉(zhuǎn)到模型訓(xùn)練,我們自己也在回顧當(dāng)時(shí)的決策流程,其實(shí)我覺(jué)得當(dāng)時(shí)的決策流程還挺平滑的,很自然地覺(jué)得應(yīng)該去做模型了。
我們就開了一個(gè)合伙人的會(huì),我現(xiàn)在回顧可能有幾個(gè)因素:第一個(gè)就是DeepSeek的出現(xiàn),大家都知道DeepSeek出現(xiàn)了以后,對(duì)整個(gè)AI行業(yè)帶來(lái)很大的一個(gè)沖擊,我們就發(fā)現(xiàn)原來(lái)基模還可以做得更好。
第二,還是智能體的上限是模型的能力,做到百分之六七十的時(shí)候,其實(shí)要再提高這個(gè)準(zhǔn)確度,已經(jīng)很難再往上提高,你自己看到這個(gè)瓶頸,所以你就自然會(huì)想到,我有數(shù)據(jù)可以微調(diào),可以后訓(xùn)練。我們也當(dāng)時(shí)看了很多論文,特別是強(qiáng)化學(xué)習(xí)發(fā)展得很快的,DeepSeek在強(qiáng)化學(xué)習(xí)算法上做了很多創(chuàng)新,才能把訓(xùn)練成本大幅下降。這也是回到模型訓(xùn)練的一個(gè)原因,當(dāng)然我們也有這樣的算法專家,能夠看到這個(gè)趨勢(shì)。
簡(jiǎn)單地說(shuō),就是兩個(gè)因素,一個(gè)是你的準(zhǔn)確度上不去了,但又想追求更好的體驗(yàn)給用戶,要給用戶更準(zhǔn)確的結(jié)果,肯定去想新的辦法,這很自然。第二個(gè)就是說(shuō)因?yàn)轭愃朴贒eepSeek這樣的模型出現(xiàn),包括算法的迭代,我記得有位院士說(shuō)的一段話特別有意思,現(xiàn)在看起來(lái)也是在驗(yàn)證那句話。就說(shuō)AI行業(yè)現(xiàn)在發(fā)展很有意思,算力、算法在變革,現(xiàn)在看起來(lái)數(shù)據(jù)也可能會(huì)變革,它幾個(gè)要素都在輪流變革,輪流變革就會(huì)帶動(dòng)這個(gè)行業(yè)輪流的創(chuàng)新和發(fā)展。
現(xiàn)在看起來(lái)真的是按照這個(gè)邏輯在走,所以我覺(jué)得這一輪為什么我們看好行業(yè)模型,我覺(jué)得釘釘?shù)倪x擇非常正確,除了使命正確以外,就是幫助中小企業(yè)來(lái)做普惠創(chuàng)新正確以外,其實(shí)數(shù)據(jù)給了大家這樣的機(jī)會(huì)。
回到剛才那個(gè)問(wèn)題,當(dāng)時(shí)選擇做模型訓(xùn)練還挺自然的。一個(gè)創(chuàng)業(yè)公司最重要的事情是要有自己的獨(dú)立思考能力。而不是智能體熱我就做智能體,模型熱我就做模型,我覺(jué)得肯定是不對(duì)的,應(yīng)該是依據(jù)客戶價(jià)值和你的方向去做。
劉湘明:最后一個(gè)問(wèn)題留給一粟,你剛才也談了很多,可能很多企業(yè)也躍躍欲試,可能想訓(xùn)練自己的模型。他們?cè)诟斸敽献髦埃枰龊媚男?zhǔn)備呢?
朱鴻:我認(rèn)為投入做這個(gè)事情可能也要一把手決定,客戶需要有數(shù)據(jù),過(guò)去十年以來(lái),很多客戶通過(guò)釘釘實(shí)現(xiàn)從無(wú)紙化再到組織在線,很多業(yè)務(wù)系統(tǒng)都已經(jīng)完成了數(shù)據(jù)積累,但是有數(shù)據(jù)和AI ready的數(shù)據(jù),中間還是有些距離,所以我們會(huì)去積極評(píng)估。
雙方的決心還是非常關(guān)鍵的,我們希望周期也不能太長(zhǎng),所以企業(yè)在數(shù)據(jù)準(zhǔn)備和決心上如果有這樣的共識(shí),實(shí)際上我們主要的評(píng)估就是否具備一定的示范性。
劉湘明:那對(duì)于人才方面有沒(méi)有什么要求,因?yàn)槠鋵?shí)AI人才基本上都被大廠抓走了,是吧?
朱鴻:對(duì)企業(yè)來(lái)講,我們更需要的是去懂這個(gè)業(yè)務(wù)的老師傅,他能夠?qū)δP偷哪芰ψ龀稣_的評(píng)估。只要建立好這樣的一個(gè)專家?guī)?,我們就有信心,把這個(gè)模型給確認(rèn)好。
劉湘明:強(qiáng)宇有什么補(bǔ)充?
王強(qiáng)宇:我覺(jué)得釘釘現(xiàn)在正在形成標(biāo)準(zhǔn),以后可能不需要我這樣的人。但是需要老師傅,產(chǎn)品經(jīng)理,包括對(duì)客戶很了解的人。其實(shí)釘釘一樣可以把它拆解出來(lái)。
因?yàn)獒斸斢凶銐虻乃惴ê退懔Φ膶<?,我甚至還會(huì)有外圍的咨詢公司來(lái)建設(shè)生態(tài)。我覺(jué)得完全有可能訓(xùn)練出行業(yè)模型。