年入近 10 億
兩位中科大學霸創(chuàng)業(yè) 13 年
1976 年,黃偉出生于一個軍人家庭,這使得他的性格堅毅果斷、喜歡思考。
他與科大訊飛創(chuàng)始人劉慶峰同為中科大校友,晚三屆入學,是劉慶峰師弟。1999 年劉慶峰創(chuàng)辦科大訊飛時,黃偉仍在攻讀學位。
中科大求學期間,黃偉碩士研究醫(yī)學圖像三維可視化,博士攻讀語音方向,均屬數(shù)字信號處理領(lǐng)域。這一從圖像到語音的研究路徑,為后來多模態(tài)大模型的興起埋下伏筆。
博士畢業(yè)后,黃偉進入上海交大生物醫(yī)學工程博士后流動站。2004 年,摩托羅拉與上海交大合作開展博士后項目,他加入摩托羅拉中國研究中心擔任資深研究員。
金融危機期間,摩托羅拉將語音識別團隊出售給 Nuance,黃偉拒絕被收編,于 2009 年加入盛大網(wǎng)絡(luò)創(chuàng)新院,并于次年創(chuàng)建語音分院。
他帶領(lǐng)的盛大語音團隊曾獲國際認可:2010 - 2011 年,在美國國家標準技術(shù)署(NIST)聲紋識別評測(SRE)大賽中,團隊力壓麻省理工、斯坦福研究中心、IBM 等對手,在 9 個單項任務(wù)中斬獲 5 項第一,綜合指標位列榜首。
2011 年,黃偉的師弟梁家恩加入盛大語音分院擔任高級研究員。
同年,搭載 Siri 的 iPhone 4s 問世,全球智能語音創(chuàng)業(yè)浪潮興起。因盛大創(chuàng)新院戰(zhàn)略調(diào)整,語音團隊從創(chuàng)新院剝離至盛大掌門科技,黃偉與梁家恩于 2012 年共同創(chuàng)立云知聲。
彼時,iPhone 4s 搭載 Siri 引發(fā)全球智能語音創(chuàng)業(yè)熱潮,黃偉敏銳捕捉到智能語音作為人機交互入口的潛力。
云知聲創(chuàng)始人 &CEO 黃偉,創(chuàng)業(yè)邦攝
2012 年 7 月,云知聲成立并推出語音云平臺。
創(chuàng)業(yè)初期,黃偉掏空積蓄并借款 200 萬元。" 買房子貸款都沒貸過這么多錢,但為了實現(xiàn) AI 夢想,值得。" 他回憶道。
云知聲定位人工智能底層技術(shù)與應(yīng)用研發(fā),技術(shù)演進緊跟行業(yè)趨勢:從判別式 AI 的 1.0 階段(語音識別、圖像識別),到大模型崛起后的生成式 AI 2.0 階段,每一步都與行業(yè)同頻。
黃偉將人類需求總結(jié)為 " 快樂 " 與 " 健康 " 的二元命題:抖音、泡泡瑪特滿足情緒價值,醫(yī)療健康則承載生存剛需?;诖?,團隊在 2013 年便進軍醫(yī)療 AI" 無人區(qū) " ——盡管當時多數(shù)醫(yī)院信息化基礎(chǔ)薄弱,但提前布局暗合 " 搶占未來先機 " 的邏輯。
2014 年,云知聲選定醫(yī)療、物聯(lián)網(wǎng)(IOT)兩大商業(yè)化場景,提出 " 云端芯一體化 " 戰(zhàn)略。2018 年推出邊緣交互式 AI 語音芯片 UniOne 系列,2023 年提供約 1300 萬顆消費級 AI 語音芯片。
大模型領(lǐng)域,云知聲 2016 年建立 Atlas 人工智能基礎(chǔ)設(shè)施,2017 年推出基于 BERT 的大語言模型 UniCore,2023 年發(fā)布擁有 600 億參數(shù)的自有大模型山海大模型。
據(jù) Frost&Sullivan 數(shù)據(jù),按 2024 年收入計,云知聲是中國第四大 AI 解決方案提供商,在國內(nèi)生活 AI 解決方案市場排名第三,醫(yī)療 AI 服務(wù)及解決方案市場排名第四。
截至 2024 年,客戶數(shù)量達 576 家,覆蓋華為、美的、格力、京東、北京協(xié)和醫(yī)院、平安集團、吉利汽車等頭部企業(yè)。
不靠人脈、構(gòu)建 " 信任標桿 "
拿下中國頂尖醫(yī)院客戶
" 每個醫(yī)生平均每天花三個小時來寫病歷,現(xiàn)在只需要一個小時。"
云知聲通過 AI 語音 + 醫(yī)療,提升醫(yī)生工作效率與醫(yī)療質(zhì)量,同時降低醫(yī)院運營成本。其服務(wù)涵蓋智能導(dǎo)診、醫(yī)學影像輔助診斷及醫(yī)保支付管理等多場景。
北京協(xié)和醫(yī)院成為了云知聲醫(yī)療領(lǐng)域首個客戶,本質(zhì)上是云知聲希望在行業(yè)內(nèi)形成 " 標桿效應(yīng) ",降低新客戶的決策門檻。尤其是在 ToB 領(lǐng)域,燈塔客戶的口碑是最直接的市場通行證。
黃偉認為,與中小客戶合作,對行業(yè)理解容易相對片面,而錨定頭部客戶的需求更能直擊行業(yè)終極命題——與協(xié)和醫(yī)院合作使團隊深入掌握臨床體系與診療流程,快速積累行業(yè)經(jīng)驗。
這一策略凸顯了 To B 與 To C 的核心差異:To C 依賴產(chǎn)品經(jīng)理對人性的洞察,To B 則需嚴格遵循 " 客戶需要什么就做什么 " 的邏輯。
早期,云知聲憑借技術(shù)硬實力而非人脈資源打動協(xié)和醫(yī)院。
" 你早期沒有品牌優(yōu)勢、沒有客戶案例,你越找人,別人越覺得你沒有實力,沒有人敢合作。" 黃偉談到。
2016 年,黃偉每日清晨 7 點參與協(xié)和醫(yī)院晨會,與信息處、分管副院長及各科室負責人討論信息化需求。" 醫(yī)院不看學術(shù)指標,而是直接在病房測試,各種口音、專業(yè)術(shù)語都是考驗。"
學術(shù)指標僅反映生產(chǎn)環(huán)境下的語音翻譯準確率,而實際應(yīng)用中,復(fù)雜環(huán)境(如嘈雜背景、方言口音)與醫(yī)學專用名詞會進一步降低識別準確率,對技術(shù)提出更高要求。
黃偉強調(diào),技術(shù)落地需通過 " 自下而上 " 路徑,讓醫(yī)生、科室主任等實際使用者從技術(shù)層面認可能力。
通常,To B 合作中,頭部客戶決策極為理性:技術(shù)需在復(fù)雜場景(嘈雜環(huán)境、方言口音、專業(yè)術(shù)語)中證明穩(wěn)定性,產(chǎn)品必須直擊臨床痛點。
服務(wù)能力也是 To B 合作的核心支撐。
醫(yī)院要求 7 × 24 小時即時響應(yīng),系統(tǒng)故障需短時間內(nèi)解決,這對團隊執(zhí)行力與企業(yè)文化提出了更高要求。
招股書顯示,2022 - 2024 年,云知聲醫(yī)療業(yè)務(wù)收入分別為 1.1 億元、1.5 億元、2.0 億元,占總收入比例從 18.9% 穩(wěn)步提升至 21.2%。
其標準化產(chǎn)品模式依托 " 云端芯一體化 " 戰(zhàn)略:將 AI 能力模塊化,如同預(yù)制件搭積木,實現(xiàn)快速場景適配。
云知聲在醫(yī)療賽道的優(yōu)勢源于 " 時間杠桿 " ——當同行仍在為醫(yī)療數(shù)據(jù)與行業(yè)認知的 " 雞生蛋 " 困境掙扎時,團隊已通過十年臨床落地積累上百家醫(yī)院信任資產(chǎn)。
然而,醫(yī)療業(yè)務(wù)并非易事。
云知聲從 2013 - 2014 年啟動戰(zhàn)略規(guī)劃,至 2016 年才實現(xiàn)產(chǎn)品落地,期間耗時兩年多打磨產(chǎn)品:進行 PVC 測試、醫(yī)院試用,直至醫(yī)生將其視為工作剛需,在嚴肅臨床場景中站穩(wěn)腳跟。
這種扎根垂直領(lǐng)域的耐心與積累,是互聯(lián)網(wǎng)巨頭等平臺型公司短期內(nèi)難以復(fù)制的。
這種壁壘在大模型技術(shù)切換時尤為顯著——老客戶僅需從底層將 BERT 模型升級為山海大模型,即可完成產(chǎn)品迭代,省去了商務(wù)成本。
正如黃偉所言,當年在醫(yī)院走廊抱著服務(wù)器調(diào)參數(shù)的堅持,最終實現(xiàn)了技術(shù)升級的 " 絲滑切換 ",而這份穿越周期的耐心,正是 AI 醫(yī)療賽道最稀缺的護城河。
把芯片當做 " 硬件 SDK"
即插即用降低客戶門檻
物聯(lián)網(wǎng)業(yè)務(wù)也同樣遵循技術(shù)與需求匹配的邏輯。
2014 年云知聲搭建 " 云 - 端 - 芯 " 產(chǎn)品體系,2018 年推出面向高低端市場的 AI 語音芯片 " 雨燕 "" 蜂鳥 " 并交付格力。
通過與格力合作,逐步拓展至奧克斯、TCL 等客戶,2024 年芯片出貨量達 3600 萬顆且預(yù)計持續(xù)增長。
黃偉指出,物聯(lián)網(wǎng)智能化需求不斷演進:六七年前汽車尚未普及語音交互,如今 10 萬元級車型已將其作為標配。
基于此,云知聲將智能化能力延伸至汽車領(lǐng)域,客戶涵蓋奔馳、吉利、東風等。他類比觸摸屏普及后用戶習慣的變化,認為車內(nèi)、家庭場景的自然語言交互需求將外溢至更多空間,如深圳地鐵已實現(xiàn)語音購票。
云知聲智能駕艙演示,創(chuàng)業(yè)邦攝
云知聲智慧生活業(yè)務(wù)是營收主力,解決方案覆蓋智能家居(語音控制家電)、車載語音(安全交互)、智慧交通(系統(tǒng)管理)、金融服務(wù)(業(yè)務(wù)提效)、物聯(lián)網(wǎng)(設(shè)備互聯(lián))等領(lǐng)域。
招股書顯示,2022 - 2024 年該業(yè)務(wù)收入分別為 4.9 億元、5.8 億元、7.4 億元,占總收入比例超 78%,客戶數(shù)量從 389 家增至 411 家,涵蓋中國大型保險集團、深圳地鐵 20 號線等。
云知聲 AI 家居芯片模組,創(chuàng)業(yè)邦攝
構(gòu)筑 " 一橫一縱 "
開始向其他行業(yè)復(fù)制
據(jù)黃偉介紹,云知聲的戰(zhàn)略布局可概括為 " 一橫一縱 "。
" 一橫 " 覆蓋消費電子、汽車、家居、酒店等物聯(lián)網(wǎng)場景,輸出通用人工智能能力,如同 " 高品質(zhì)的水 " 滿足多元需求——無論用戶身份(教授、農(nóng)民等)或地域(南北差異),只要不涉及專業(yè)問題,均可通過該能力服務(wù)千行百業(yè)。
" 一縱 " 聚焦醫(yī)療知識密集型場景,醫(yī)學的高專業(yè)門檻(培養(yǎng)醫(yī)生需 10 年以上)使其具備深度挖掘價值。
當前,云知聲 AI 能力正從 " 醫(yī)生助手 " 升級為 " 醫(yī)生導(dǎo)師 ":早期類似 " 學生記錄、老專家看病 ",如今通過山海大模型可在診療中實時提醒關(guān)鍵問題、減少漏診誤診。例如西南某醫(yī)院,大模型會在問診時同步提示潛在風險。
值得一提的是,經(jīng)過 2 年的發(fā)展,2024 年山海大模型的收入達到 7420 萬元,客戶已達 65 家。
黃偉指出," 一橫一縱 " 兩個戰(zhàn)略方向承載著不同的技術(shù)與商業(yè)價值。
" 一橫 " 重在廣度——通過通用能力快速覆蓋多場景;" 一縱 " 重在深度——以醫(yī)療為切入點挑戰(zhàn)技術(shù)天花板。
醫(yī)療業(yè)務(wù)的核心并非收入規(guī)模,而是服務(wù)頂尖醫(yī)院的數(shù)量與質(zhì)量(如協(xié)和、友誼醫(yī)院),這些醫(yī)院豐富的醫(yī)學知識庫如同 " 醫(yī)學圖書館 ",醫(yī)生高頻使用產(chǎn)品相當于積累數(shù)萬名 " 模型訓練師 ",這種 " 內(nèi)化知識 " 模式比直接銷售更具長期價值。
他強調(diào),醫(yī)療的價值不僅在于技術(shù)突破,更在于 AI 輔助甚至超越人類醫(yī)生的潛力——醫(yī)生的每一次精準診斷都可能救命,這種社會價值遠超收入或毛利的衡量。
目前,縱向的醫(yī)療能力已開始向其他知識密集型行業(yè)復(fù)制,如保險(協(xié)助醫(yī)保局、保險公司審核費用清單)、法律(與國內(nèi)大律所合作)。其中,保險領(lǐng)域已拓展六七個新客戶,進入小規(guī)模深耕階段;法律則是今年初步嘗試。
未來,醫(yī)療場景仍將是云知聲的重點,目標是做到全球技術(shù)領(lǐng)先;保險會繼續(xù)鞏固,法律則探索深化,逐步形成獨立業(yè)務(wù)板塊。
賣模型是偽命題
只賣基于大模型的產(chǎn)品和方案
過去 "Copy to China" 模式在互聯(lián)網(wǎng)時代可行(如搜索引擎、電子支付可直接復(fù)制美國模式),但如今美國科技公司的商業(yè)模式需結(jié)合中國本土實際。
黃偉認為,團隊既要借鑒國際經(jīng)驗,也要適應(yīng)國情差異。
以醫(yī)療行業(yè)為例,業(yè)內(nèi)常探討 SaaS 模式,但醫(yī)院普遍不接受。
云知聲采用 " 接近 SaaS 的模式 " 應(yīng)對:通過產(chǎn)品化、模塊化收費(如按需組合 A、B、C 等功能模塊,底層技術(shù)統(tǒng)一),靈活滿足客戶需求。他類比 " 做水 " ——無論客戶將 " 水 " 制成礦泉水、果汁還是其他飲品,本質(zhì)是提供底層能力,外界認為的 " 雜 " 并非核心問題。
這一模式支撐了云知聲度過艱難時期:疫情期間項目制模式(依賴線下溝通、長周期交付)難以為繼,標準化模塊交付卻讓企業(yè)持續(xù)運營。
云知聲的核心戰(zhàn)略是 2014 年確定的 " 云端芯一體化 ":專注做產(chǎn)品而非項目,既能支持私有化部署(如醫(yī)療場景),也能適配公有云需求(如車載場景),滿足差異化要求。
如今,DeepSeek 的爆發(fā)對行業(yè)而言有著多重意義。
在黃偉看來,首先證明中國本土團隊的科技創(chuàng)新能力——百人規(guī)模團隊可在技術(shù)上抗衡海外百億美金投入的巨頭;其次完成全民大模型科普,客戶從被動接受轉(zhuǎn)為主動尋求應(yīng)用," 不用大模型就 out" 成為共識。
實際上,市場分層早已明確:
有 AI 能力的客戶無需服務(wù);沒有 AI 能力的客戶是核心目標;中間層客戶嘗試自建團隊,用免費開源模型三個月后效果僅從 60 分提升至 75 分,遠未達行業(yè) 95 分及格線,最終因成本高、場景適配差回歸專業(yè)團隊。
這種 " 自己干花 3000 萬,外包花 1000 萬 " 的成本對比,推動企業(yè)理性選擇。
" 賣模型就是個偽命題。" 黃偉指出,有技術(shù)的企業(yè)早已用開源模型自建體系(DeepSeek 免費版性能超多數(shù)采購產(chǎn)品),沒技術(shù)的企業(yè)即便拿到模型也難以駕馭。
因此,云知聲從不賣模型,只賣基于山海大模型的產(chǎn)品和解決方案。
AI 創(chuàng)業(yè)者要忘掉博士標簽
做一個真正商業(yè)組織的 CEO
常有人問黃偉 " 什么時候更難 ",他的回答是 " 明天更難 " ——創(chuàng)業(yè)的艱難是持續(xù)的,每一天都充滿挑戰(zhàn)。
他笑稱,若早知創(chuàng)業(yè)如此辛苦,當初或許不會選擇這條路。
但他強調(diào),創(chuàng)業(yè)本質(zhì)上需要理想主義:
若一開始就把路徑規(guī)劃得清晰周全,或許根本不該開始,因為創(chuàng)業(yè)本就是 " 九死一生 ";而一旦啟動,就必須具備長期主義的心態(tài),像張一鳴說的 " 延遲滿足感 ",即便當下取得成績,也需保持清醒,因為后續(xù)可能面臨狂風暴雨。
而所謂樂觀,不過是熬過明天的結(jié)果——不樂觀,便撐不過當下。
他坦言自己原本性格謹慎,但軍人家庭的成長背景賦予他骨子里的堅韌——遇到困難時,他總愿咬牙堅持。
黃偉的經(jīng)驗是,每一次克服困難的過程,不僅是解決問題,更會提升克服困難的能力,包括技術(shù)、手段和心力;隨著能力提升,面對中等困難時再頂一頂就能解決,能力進一步提升,心態(tài)也更堅韌。
就像打怪升級,最初并未預(yù)料到創(chuàng)業(yè)會有這么多困難。
階段性困難是企業(yè)的普遍挑戰(zhàn),但只要努力堅持,總會有朋友信任支持。這讓黃偉相信," 每到絕處總能逢生 "。
他特別提醒,年輕創(chuàng)業(yè)者如今面臨的挑戰(zhàn)遠超十年前,需避免 " 唯技術(shù)論 " ——博士學歷、論文成果僅是起點,而非終點,應(yīng)忘掉 " 博士 " 標簽,真正以商業(yè)組織 CEO 的身份思考,將技術(shù)、產(chǎn)品、商業(yè)深度融合。
創(chuàng)業(yè)的征途上,孤獨本是常態(tài)。許多心緒,如深海潛流,難與團隊言說,更無法向外人道明,唯有獨自沉淀,默然消化。
黃偉自有一套與自我和解的方式:泳池里的往返劃水,是與水流對話,滌蕩疲憊;偶爾沉浸于音樂的褶皺里,任旋律撫慰心神;或是獨往古寺,在晨鐘暮鼓中尋一份澄明;亦或與三五好友圍坐,茶香裊裊間閑話家常。
這些細碎的瞬間,皆是他調(diào)整狀態(tài)的隱秘出口。
最后,他感嘆,創(chuàng)業(yè)本就是一場漫長的修行,需以全維度的能力去丈量征途。唯有不斷走出安逸的樊籬,在千頭萬緒中尋得技術(shù)、商業(yè)與自我狀態(tài)的微妙平衡,方能在時代的浪潮中,穩(wěn)穩(wěn)接住每一次挑戰(zhàn)。
本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責任的權(quán)利。如需轉(zhuǎn)載或有任何疑問,請聯(lián)系 editor@cyzone.cn。