WAIC 世界人工智能大會展會上熙熙攘攘,格靈深瞳 CEO 吳一洲發(fā)現(xiàn)會場比往年更熱鬧,現(xiàn)場的人和產(chǎn)品的畫像更豐富,而且許多大公司展現(xiàn)出的 AI 單點(diǎn)應(yīng)用深度也讓人印象深刻。AI 應(yīng)用真正走進(jìn)產(chǎn)業(yè)的脈絡(luò)更為清晰了。
在鈦媒體 2025 ITValue Summit 前瞻 WAIC 現(xiàn)場版:AI 落地指南系列的直播中,吳一洲與鈦媒體聯(lián)合創(chuàng)始人劉湘明聚焦視覺智能的進(jìn)化和 AI 技術(shù)升級下的技術(shù)廠商展開對話。
格靈深瞳一直深耕視覺算法和多模態(tài)大模型技術(shù)研發(fā),經(jīng)歷過上一個技術(shù)時代的技術(shù)企業(yè)在這一波智能浪潮中有明顯不同的感受——產(chǎn)品有了 " 成長性 "。吳一洲在對話中反復(fù)強(qiáng)調(diào)的一點(diǎn)是:要讓產(chǎn)品能用起來、用得好,而且有持續(xù)性的成長性。這不僅是格靈深瞳對產(chǎn)品的要求,也是作為技術(shù)廠商與客戶共創(chuàng)的愿景。
" 以前,我們會給客戶一個通用工具,現(xiàn)在有了智能體 Agent 之后,變成了個性化、有記憶的工具,相當(dāng)于一個搭檔、一個執(zhí)行合伙人,應(yīng)用上更細(xì)化、更成熟了。" 吳一洲介紹說,經(jīng)過近幾年的演進(jìn),格靈深瞳構(gòu)建了由模型、算法、軟硬一體的產(chǎn)品和服務(wù)形成的端到端的體系。不過,她仍然非常理性,認(rèn)為當(dāng)前 AI 距離真正的落地應(yīng)用、在行業(yè)里跟專家超融合一樣去深化應(yīng)用,還有一段距離,這是在不斷與客戶共創(chuàng)的過程中得出的越發(fā)清晰的認(rèn)知。
AI 應(yīng)用尚不成熟的局面,也給產(chǎn)品解決方案提供商帶來一個挑戰(zhàn):過去按許可證(license)付費(fèi)的邏輯,今天演變成了為效果、性能付費(fèi)等等有待明確的標(biāo)準(zhǔn)。
" 現(xiàn)在收費(fèi)標(biāo)準(zhǔn)確實(shí)非常離散?,F(xiàn)在主要面臨三重困境:一是定價標(biāo)準(zhǔn)缺失,服務(wù)價值缺乏行業(yè)基準(zhǔn);二是商業(yè)模式模糊,介于基礎(chǔ)設(shè)施、技術(shù)服務(wù)、產(chǎn)品工具以及咨詢服務(wù)之和;三是雙向預(yù)期偏差,客戶對效果認(rèn)知不統(tǒng)一,供應(yīng)商服務(wù)成熟度待驗(yàn)證。這個問題本質(zhì)是產(chǎn)業(yè)成熟度問題,需經(jīng)歷服務(wù)定價的帕累托優(yōu)化過程。" 吳一洲坦言,這是供需雙方對最終把工具實(shí)際用起來、并且是可持續(xù)用起來,要付出的時間和成本預(yù)期能不能一致的認(rèn)知問題。
AI 時代變化不定,吳一洲更相信掌握技術(shù)的自主權(quán),同時也保持與生態(tài)合作、互助互利的開放態(tài)度,在既有的金融、泛安防、政務(wù)、體育四大優(yōu)勢領(lǐng)域繼續(xù)深耕。" 硬件、數(shù)據(jù)采集以及持續(xù)優(yōu)化、認(rèn)知、服務(wù)、大規(guī)模部署、大規(guī)模算法升級、大規(guī)模調(diào)試的難點(diǎn)…… " 吳一洲坦言," 坑 " 其實(shí)是數(shù)不盡的,而且面向不同客戶、不同場景的 " 坑 " 其實(shí)不太一樣," 我們積累的經(jīng)驗(yàn)是在一些特定的行業(yè)、場景里深耕下去,盡量跟客戶一起少踩一些‘坑’,但其實(shí)沒有捷徑可走。"
附上本期直播時間軸 , 幫你快速跳轉(zhuǎn)感興趣的部分:
05:55 在賽道中跑出身位優(yōu)勢的關(guān)鍵
09:13 那些年踩過的 " 坑 "
21:42 如何讓能力基礎(chǔ)不同的客戶都跑起來?
28:34 市場、技術(shù)、客戶不斷變化,戰(zhàn)略重點(diǎn)如何調(diào)整?
31:39 技術(shù)要自主,但界限在哪里?
34:25 收費(fèi)、交付的挑戰(zhàn)如何解決?
以下為對話實(shí)錄 , 經(jīng)筆者整理 :
劉湘明:大家好,歡迎來到《數(shù)字價值觀察室》在 WAIC 世界人工智能大會的現(xiàn)場。一洲,你這兩天在大會有什么感受,有什么發(fā)現(xiàn),跟大家分享一下。
吳一洲:第一個感受還是火爆,而且是多方位的。以前是深度參與 AI 產(chǎn)業(yè)的人關(guān)注這個大會,現(xiàn)在有各種年齡、各種職業(yè)、各種產(chǎn)業(yè)里的人都涌向了這個大會。大家都在觀察有沒有新的事物、新的應(yīng)用、新的思想。
第二,明顯感覺產(chǎn)品越來越豐富,更具象化了。從單純關(guān)注模型、智能體,到現(xiàn)在我們看到了具身智能、企業(yè)級應(yīng)用、個人助理,以及端到端的產(chǎn)品,能感覺出來大家在 AI 的這片土壤里長出了很多新鮮的事物,也給我們帶來了很多的新想法。
我觀察了一些大廠的成果,像頭部科技企業(yè)展臺 ( 如阿里巴巴、螞蟻集團(tuán) ) 突破單純 AI 模型展示,深度融合云計算與大數(shù)據(jù)時代的技術(shù)積淀。其中螞蟻集團(tuán)呈現(xiàn)的業(yè)務(wù)視角下的 AI 應(yīng)用實(shí)踐,為行業(yè)深度集成提供了一些重要參考。國家電網(wǎng)展區(qū)是展示 AI 與核心業(yè)務(wù)的深度融合范例,其在分揀機(jī)器人等硬件設(shè)備中實(shí)現(xiàn)原生級創(chuàng)新,印證 " 專家型轉(zhuǎn)型 " 理念 --- 即 AI 系統(tǒng)需與行業(yè)專家形成智能規(guī)劃與決策層面的深度協(xié)同。此外,消費(fèi)級 AI 硬件展區(qū) ( 以具身智能、AI 眼鏡為代表 ) 直觀呈現(xiàn)大模型技術(shù)的生活化應(yīng)用路徑,具有普適性示范價值。
劉湘明:回到主題,格靈深瞳一直在計算機(jī)視覺和大數(shù)據(jù)分析領(lǐng)域深耕了很多年。所以我也想請問一下,在這個賽道里面,現(xiàn)在跑出一些身位的優(yōu)勢,你覺得關(guān)鍵是什么?
吳一洲:我們只能說在某一些具體的場景下是有優(yōu)勢的,直白地說,現(xiàn)在談優(yōu)勢還為時尚早。
我們是視覺、小模型 CV 算法起家,從 2019 年開始布局大模型,尤其是視覺大模型基座,這兩年我們也推出了自己的 Glint-MVT 視覺基礎(chǔ)模型。可以看到,我們其實(shí)一直在堅(jiān)持布局 AI 視覺這部分,我們認(rèn)為這是多模態(tài)以及人工智能應(yīng)用中不可分割的一部分。AI 不只有語言的部分,還有感知的部分,而且感知部分占比還是很高的。
在堅(jiān)持這樣一個主賽道的情況下,我們做了很多產(chǎn)品,我覺得真正在場景中有優(yōu)勢,還是要讓產(chǎn)品能用起來、用得好,而且持續(xù)性的有成長性。原來工具類的產(chǎn)品每一次升級是靠新版本發(fā)布,但 AI 自身有一種迭代能力,不是單純靠外界編程的。
在小模型時代,我們的迭代力是不夠的?,F(xiàn)在我們替換了自己的大模型、以及很多生態(tài)合作伙伴一起擁抱了大模型基座之后,明顯能感受到冷啟動的能力,以及自身每一次發(fā)布新版基座模型的時候,上面的算法本質(zhì)上有了一次新的演變,我們能感覺到它自己有成長性了,就像一個孩子一樣生長的力量。
可能談得上一些優(yōu)勢的地方,是我們對于工程化、成本,以及過程中踩過的 " 坑 "、怎么規(guī)避踩 " 坑 ",還有對團(tuán)隊(duì)的配置、對事物的理解,我覺得是有經(jīng)驗(yàn)的。
我們也構(gòu)建了模型、算法、軟硬一體的產(chǎn)品、服務(wù)這么一套端到端的體系。但是離真正的深化應(yīng)用、在行業(yè)里跟專家超融合一樣去深化應(yīng)用,我覺得還是有一點(diǎn)進(jìn)程的。
劉湘明:能不能跟大家分享一下踩了哪些 " 坑 "?
吳一洲:抽象提煉來說,有以下幾點(diǎn)。
第一,硬件,在各種 GPU 上適配,是一個大家都面臨痛苦的點(diǎn)。
第二,數(shù)據(jù)采集以及持續(xù)優(yōu)化,不同的人標(biāo)注能力不一樣,出來的結(jié)果不一樣。
第三,認(rèn)知,以前人們可能期待短期內(nèi)達(dá)到測試結(jié)果,現(xiàn)在大家更關(guān)注如何系統(tǒng)性構(gòu)建 AI 應(yīng)用的體系,這個過程之中可能也會誕生新的 " 坑 ",但至少大家對短期測試效果的追逐更理性了一些。
第四,服務(wù)。以前信息化建設(shè)過程中,服務(wù)的 " 坑 " 是安裝部署實(shí)施,但現(xiàn)在的服務(wù),更多的是專家跟客戶一起共同解決問題、共同成長,這個挺難的。而且,對于這樣一個服務(wù)的付費(fèi)價格的認(rèn)知也是不太一致的,客戶可能認(rèn)為這是一個單純的售后服務(wù),但其實(shí)不是,這樣的服務(wù)是決定產(chǎn)品能不能用好的最關(guān)鍵的點(diǎn)。
當(dāng)然,我們還面臨大規(guī)模部署、大規(guī)模算法升級、大規(guī)模調(diào)試的難點(diǎn)…… " 坑 " 其實(shí)是數(shù)不盡的,而且不同客戶、不同場景的 " 坑 " 其實(shí)不太一樣。我們積累的經(jīng)驗(yàn)是在一些特定的行業(yè)、場景里深耕下去,盡量跟客戶一起少踩一些 " 坑 ",但其實(shí)沒有捷徑可走。
劉湘明:這兩年的技術(shù)的升級,給格靈深瞳的業(yè)務(wù)和布局帶來哪些新的變化?
吳一洲:最大的變化其實(shí)還不在于我們自身,客戶的變化是最大的。這兩年,客戶對全面擁抱 AI 的熱忱是非常高昂的,帶來了很多暢想。
我們跟以前的自己相比,對待新事物(發(fā)展預(yù)期)更有耐心了。賽道上、行業(yè)上沒有大的變化,更多是從底座開始,在行業(yè)里去深化和多元化技術(shù)——從基礎(chǔ)的模型到硬件,如何更好地嵌入到客戶的業(yè)務(wù)流程使用中,如何讓客戶的個體化的使用感更強(qiáng)。以前,我們會給客戶一個通用工具,現(xiàn)在有了智能體 Agent 之后,工具變成了個性化、有記憶的,相當(dāng)于一個搭檔、一個執(zhí)行合伙人,應(yīng)用上更細(xì)化、更成熟了。
第二個比較大的變化,我們以視覺起家,在擁抱當(dāng)前非常明確的多模態(tài)趨勢時,也做了很多調(diào)整:第一,我們要吸納更多人才進(jìn)來,現(xiàn)在的年輕人對大模型、智能體的接受程度、擁抱程度、熱忱是非常高的。我們的團(tuán)隊(duì)在更加年輕化,我們也鼓勵大家抱有充分開放的心態(tài),熱忱地?fù)肀Ц鞣N各樣的技術(shù),核心還是得嘗試。另外,對于我們做底層的同事們來說,他們一定要站在這個浪潮里面,當(dāng)弄潮兒,不能過早地去評判。
所以,格靈深瞳既保持了在行業(yè)以及應(yīng)用體系的穩(wěn)定性和執(zhí)著,同時也是更加開放。從人才、視覺技術(shù)、生態(tài)多維度,越來越廣泛,這兩年都是在以交朋友為主,建立朋友圈,也充分參與別人的朋友圈,充分地打開我們的開放性。
劉湘明:現(xiàn)在你們最重要的幾個場景是什么呢?
吳一洲:第一大場景還是在金融;接下來還有泛安防,也是我們始終會堅(jiān)持的場景;第三,政務(wù)場景,尤其是涉及到高安全領(lǐng)域的政務(wù)場景,我們會做較細(xì)的深耕;我們還一直在體育訓(xùn)練賽道持續(xù)地發(fā)布產(chǎn)品,保留在 To C 領(lǐng)域的觸達(dá)。
劉湘明:金融這些年的應(yīng)用、需求有什么變化?
吳一洲:金融客戶對 AI 技術(shù)非常熱忱,他們應(yīng)該是較早系統(tǒng)性布局?jǐn)?shù)據(jù)中心 ( IDC ) 基礎(chǔ)設(shè)施,并在風(fēng)控、營銷及安保等核心場景持續(xù)投入資源開展技術(shù)驗(yàn)證的。當(dāng)前大模型時代的關(guān)鍵轉(zhuǎn)變在于 : 客戶不再局限單一流程優(yōu)化,而是提出更深層的跨領(lǐng)域融合需求。
例如,安保視頻分析數(shù)據(jù)自然賦能風(fēng)控決策體系,這種協(xié)同效應(yīng)突破了傳統(tǒng)信息化孤島模式。其本質(zhì)變革源于底層技術(shù)架構(gòu)的統(tǒng)一化 : 基于大模型與智能體構(gòu)建的公共基座,使原本分散的部門數(shù)據(jù)資產(chǎn) ( 雖仍保持權(quán)屬獨(dú)立 ) 在應(yīng)用層面實(shí)現(xiàn)無縫貫通。相較于大數(shù)據(jù)時代依賴人工連接 " 煙囪系統(tǒng) " 的刻意整合,新范式通過統(tǒng)一技術(shù)基座促成業(yè)務(wù)部門視角轉(zhuǎn)換——從關(guān)注系統(tǒng)建設(shè)歸屬轉(zhuǎn)向聚焦使用價值,最終形成更自然的跨域協(xié)同機(jī)制。
劉湘明:不同的行業(yè)和企業(yè),數(shù)字化的基礎(chǔ)是差別非常大的,大模型的能力更是參差不齊。你們現(xiàn)在對能力基礎(chǔ)不同的客戶,怎么讓他們都能夠跑起來。
吳一洲:基礎(chǔ)不一致,可以用不同的方式解決。對于基礎(chǔ)非常好的客戶,比如金融銀行或者安防行業(yè),很多時候客戶給我們帶來的啟發(fā)更大,因?yàn)槲覀兣惆榭蛻艉芏嗄炅?,會完全從客戶的業(yè)務(wù)視角、從規(guī)劃到落地的視角來去思考。很多時候,客戶已經(jīng)開始跟我們討論更深層次的智能孿生、智能迭代的問題,比如,如何讓采集行為本身具備智能,從采集到分析、決策支持整個閉環(huán)過程具備智能,帶著規(guī)劃演進(jìn)、迭代升級。
但是,對于一些數(shù)字化基礎(chǔ)較弱的行業(yè)或者客戶,好處是他們可以跳過很多不必要的迭代過程,直接進(jìn)入智能時代。
但核心還是認(rèn)知問題,對于最終把工具實(shí)際用起來,并且是可持續(xù)用起來,要付出的時間跟成本是什么樣子?本質(zhì)在于大家對這個問題的預(yù)期能不能一致。
劉湘明:針對不同起點(diǎn)、不同基礎(chǔ)的客戶,你們的產(chǎn)品策略是什么樣的?
吳一洲:針對前瞻型客戶采用共創(chuàng)研發(fā)模式,將咨詢環(huán)節(jié)納入研發(fā)體系,重點(diǎn)突破行為數(shù)據(jù)與因果關(guān)系的采集瓶頸;面向入門級客戶則提供直效型標(biāo)準(zhǔn)化產(chǎn)品,通過最小化使用成本建立初步價值認(rèn)知,分階段實(shí)現(xiàn) " 可用→好用 " 的體驗(yàn)演進(jìn)。這種策略既滿足深度定制需求,也保障技術(shù)普惠可行性。
劉湘明:市場在變化,技術(shù)在變化,客戶也在變化,格靈深瞳的戰(zhàn)略重點(diǎn)會是什么樣的?
吳一洲:有幾個比較關(guān)鍵的要素。第一,技術(shù)跟進(jìn)一定要牢牢地掌握在自己手里。所有技術(shù)的深入都是一塊硬骨頭,不管是我們自己的 Glint- MVT 視覺基礎(chǔ)模型,還是未來要發(fā)布的多模態(tài)大模型。很多人也在問我,為什么已經(jīng)有很多多模態(tài)大模型的情況下你們還要做一個?首先,這個模型肯定是有格靈深瞳的特點(diǎn),比如在視頻分析、垂直細(xì)分的工具、模型的精煉上一定是有我們自己特點(diǎn)的;第二,要跟進(jìn)這個開放的時代,要知道怎么用、怎么去解決問題。" 改一改就用了 " 跟 " 深入地自己完整走一遍這個過程 ",帶來的認(rèn)知是不一樣的,我們會走得非常扎實(shí)。相關(guān)工具也會慢慢多元化起來,而且我們會全面地開放給客戶、開放給生態(tài),互利互助。
第二,在前面提到的四個行業(yè),已經(jīng)足夠我們端到端深耕了。把任何一個行業(yè)做好,都是非常非常難的。在我設(shè)想中,再過幾年,在格靈深瞳的前端行業(yè)里,可能行業(yè)專家本身所占的比例會大幅度提升,并不是單純使用 AI 能力的專家。不過,距離我們跟客戶在行業(yè)里真正感知和用好技術(shù),我覺得還有一段時間。
劉湘明:你剛才說了一個特別好的點(diǎn),就是技術(shù)的跟進(jìn),怎么把技術(shù)掌握在自己手里邊。但其實(shí)每個人理解的技術(shù)是不一樣,這個界限你是劃在哪?哪些是留給自己去做的,哪些可能合作伙伴去做,哪些可能是要那些大廠花上百億去干的事情?
吳一洲:現(xiàn)在格局已經(jīng)越來越明顯了,決策框架基于三要素評估:資金規(guī)模、人才儲備、時間成本。其實(shí)我們做視覺大模型也是跟大廠充分建立生態(tài)、互利互助的;第二,我們把自己最擅長的技術(shù)拿出來給大家用,比如今年下半年計劃發(fā)布的視覺基礎(chǔ)模型 Glint- MVT 的新版本,在視頻分析處理和理解上(性能)比較好,因?yàn)槲覀冊谝曨l領(lǐng)域是要扎深的,這是主線;其他的,我覺得都是要靠生態(tài),因?yàn)楝F(xiàn)在進(jìn)入到深水區(qū),每一件事情所要付出的成本以及實(shí)現(xiàn)難度都超乎想象。
劉湘明:如果按性能效果收費(fèi),交付的挑戰(zhàn)因素有哪些 ? 如何解決 ?
吳一洲:現(xiàn)在收費(fèi)標(biāo)準(zhǔn)確實(shí)非常離散?,F(xiàn)在主要面臨三重困境:一是定價標(biāo)準(zhǔn)缺失,服務(wù)價值缺乏行業(yè)基準(zhǔn);二是商業(yè)模式模糊,介于基礎(chǔ)設(shè)施服務(wù)與咨詢公司形態(tài)之和;三是雙向預(yù)期偏差,客戶對效果認(rèn)知不統(tǒng)一,供應(yīng)商服務(wù)成熟度待驗(yàn)證。這個問題本質(zhì)是產(chǎn)業(yè)成熟度問題,需經(jīng)歷服務(wù)定價的帕累托優(yōu)化過程。
劉湘明:客戶在 AI 落地時最緊迫、最重要的問題是什么 ?
吳一洲:關(guān)鍵痛點(diǎn)集中于兩大維度 : 一是人才瓶頸維度,缺乏兼具決策能力與落地經(jīng)驗(yàn)的復(fù)合型人才,理想狀態(tài)是業(yè)務(wù)專家與 AI 專家的 " 雙重屬性融合 " 體現(xiàn)在同一個人身上;二是目標(biāo)管理維度,對 AI 的預(yù)期目標(biāo)多元且時效要求高,但落地過程中受到成本約束等因素影響,容易導(dǎo)致實(shí)際效果的波動,所以需要更聚焦、更純粹地理解和解決項(xiàng)目的本質(zhì)問題。根本解決方案在于培育 AI 原生思維,使技術(shù)應(yīng)用成為業(yè)務(wù)決策的本能組成部分。
劉湘明:謝謝一洲,特別坦率而且非常有洞見的分享。
評!加入創(chuàng)新場景 50 榜單評選
2025 年度「創(chuàng)新場景 TOP 50」榜單評選征集啟動
申報日期:即日起 ~8 月 22 日止
公開投票及專家評審:2025 年 8 月 23 日起 ~8 月 31 日止
申報鏈接:https://m.tmtpost.com/post/cj5(請使用 PC 端申報,暫不支持手機(jī)端)