2025 年 11 月 8 日,在世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)上,360 數(shù)字安全集團(tuán)正式發(fā)布《大模型安全白皮書》(以下簡稱 " 白皮書 ")。該白皮書首次系統(tǒng)性闡釋大模型運(yùn)行時(shí)的五大關(guān)鍵風(fēng)險(xiǎn),建設(shè)性地提出 " 外筑‘以模治模’動(dòng)態(tài)屏障,內(nèi)固‘平臺(tái)原生’安全底座 " 的核心理念,并源于實(shí)戰(zhàn),提供了可落地的安全解決方案,為大模型應(yīng)用拉起了全鏈路安全防線,助力推動(dòng)人工智能行業(yè)向 " 安全、向善、可信、可控 " 方向穩(wěn)健發(fā)展。


隨著大模型技術(shù)加速滲透政務(wù)、金融、能源、醫(yī)療等重點(diǎn)行業(yè),一個(gè)不容忽視的現(xiàn)實(shí)是—— AI 越智能,安全風(fēng)險(xiǎn)越致命。
白皮書以 2025 年國內(nèi)外多起典型大模型安全事件為切入點(diǎn),系統(tǒng)性歸納了威脅大模型安全的五大關(guān)鍵風(fēng)險(xiǎn):
首先是基礎(chǔ)設(shè)施安全風(fēng)險(xiǎn),包括設(shè)備控制、供應(yīng)鏈漏洞、拒絕服務(wù)攻擊以及算力資源濫用等問題;其次是內(nèi)容安全風(fēng)險(xiǎn),涉及不符合核心價(jià)值觀、虛假或違規(guī)內(nèi)容、大模型幻覺,以及提示注入攻擊等;第三類是數(shù)據(jù)與知識(shí)庫安全風(fēng)險(xiǎn),數(shù)據(jù)泄露、越權(quán)訪問、隱私濫用和知識(shí)產(chǎn)權(quán)問題日益突出;第四是智能體安全風(fēng)險(xiǎn),隨著智能體自主性增強(qiáng),插件調(diào)用、算力調(diào)度、數(shù)據(jù)流轉(zhuǎn)等環(huán)節(jié)的安全邊界更加模糊;最后是用戶端安全風(fēng)險(xiǎn),包括權(quán)限控制、API 調(diào)用監(jiān)控、惡意腳本執(zhí)行以及 MCP 執(zhí)行安全等。
這些風(fēng)險(xiǎn)相互交織,形成傳統(tǒng)安全方案難以應(yīng)對(duì)的復(fù)雜威脅矩陣,嚴(yán)重威脅個(gè)人權(quán)益、企業(yè)發(fā)展乃至國家安全。

面對(duì)上述復(fù)雜挑戰(zhàn),白皮書基于實(shí)戰(zhàn)經(jīng)驗(yàn),給出了 " 外掛式安全 + 平臺(tái)原生安全 " 雙軌治理策略 —— 前者像 AI 的 " 外部保鏢 ",靈活應(yīng)對(duì)實(shí)時(shí)風(fēng)險(xiǎn);后者像 AI 的 " 內(nèi)置鎧甲 ",從根源筑牢安全基礎(chǔ),兩者配合形成全鏈路防護(hù)網(wǎng)。

該方式具備兩大優(yōu)勢(shì):一是適配性強(qiáng)、部署成本低,可作為通用組件快速接入不同企業(yè)環(huán)境,避免重復(fù)開發(fā);二是響應(yīng)迅速,具備獨(dú)立監(jiān)測(cè)與攔截機(jī)制,可在毫秒級(jí)別識(shí)別并阻斷實(shí)時(shí)威脅,如異常算力消耗或惡意內(nèi)容。
平臺(tái)原生安全則聚焦大模型數(shù)據(jù)、知識(shí)庫、智能體及客戶端等環(huán)節(jié),將安全能力嵌入核心組件,強(qiáng)化配套組件安全與全流程合規(guī)管控。
360 提供的企業(yè)級(jí)知識(shí)庫、智能體構(gòu)建與運(yùn)營平臺(tái)、智能體客戶端等產(chǎn)品,均基于這一理念開發(fā),將安全深度植入平臺(tái)底層,全面滿足國家與行業(yè)合規(guī)要求,為智能體應(yīng)用提供全鏈路保障。
簡言之,外掛式安全如同" 建成后加裝的防盜系統(tǒng) ",平臺(tái)原生安全則如" 建造時(shí)內(nèi)置的防火結(jié)構(gòu) ",二者協(xié)同,從外至內(nèi)構(gòu)筑大模型的安全防線。通過這一體系,360 實(shí)現(xiàn)了主動(dòng)發(fā)現(xiàn)、動(dòng)態(tài)演進(jìn)的安全檢測(cè)能力,有效應(yīng)對(duì)復(fù)雜多變的大模型安全威脅。
縱深防御:7 大能力守好大模型安全門
基于 " 外防風(fēng)險(xiǎn)、內(nèi)固架構(gòu) " 的大模型安全核心理念,360 給出一份覆蓋大模型安全全鏈路解決方案。該方案通過七大核心產(chǎn)品能力,共同組成 " 外掛式 " 與 " 平臺(tái)原生 " 相結(jié)合的縱深防御體系。
其中," 外掛式 " 安全能力不侵入大模型原生架構(gòu),通過外部工具實(shí)現(xiàn)靈活、快速的動(dòng)態(tài)防護(hù)。該體系下的四大產(chǎn)品——大模型衛(wèi)士算力主機(jī)安全系統(tǒng)、檢測(cè)系統(tǒng)、防護(hù)系統(tǒng)、幻覺檢測(cè)與緩解系統(tǒng)——共同構(gòu)建了外部屏障,重點(diǎn)應(yīng)對(duì)大模型基礎(chǔ)設(shè)施風(fēng)險(xiǎn),如算力劫持、供應(yīng)鏈投毒,以及大模型內(nèi)容風(fēng)險(xiǎn),如提示詞注入、模型幻覺與違規(guī)內(nèi)容,實(shí)現(xiàn)了從算力層到內(nèi)容層的實(shí)時(shí)監(jiān)測(cè)與主動(dòng)防御。
" 平臺(tái)原生安全 " 則如同為大模型應(yīng)用注入了 " 安全基因 ",將防護(hù)能力深度內(nèi)嵌于其核心組件之中。這一理念具體體現(xiàn)在三大平臺(tái)產(chǎn)品上:企業(yè)級(jí)知識(shí)庫從根本上守護(hù)數(shù)據(jù)與知識(shí)安全;智能體構(gòu)建和運(yùn)營平臺(tái)確保智能體行為全程可控;智能體客戶端則筑牢用戶端入口的安全防線。三者協(xié)同,從底層架構(gòu)解決了數(shù)據(jù)泄露、智能體行為失控及終端濫用等內(nèi)生性安全挑戰(zhàn),為 AI 應(yīng)用的穩(wěn)定可靠運(yùn)行奠定了內(nèi)生性基礎(chǔ)。

未來,還將聯(lián)合產(chǎn)學(xué)研各界,共同推動(dòng)安全標(biāo)準(zhǔn)建設(shè)與技術(shù)共享,攜手共建安全、可信的 AI 生態(tài)。讓 AI 世界更安全、更美好。