7 月 17 日,OpenAI 推出的 ChatGPT 智能體系震撼亮相。該系統(tǒng)融合了 Operator 遠(yuǎn)程瀏覽器執(zhí)行能力、Deep Research 網(wǎng)絡(luò)信息整合技術(shù)及 ChatGPT 對話優(yōu)勢,是統(tǒng)一智能體平臺的集大成者。
它擁有自主思考和行動能力,能從技能庫中主動挑選合適工具,完成各類超復(fù)雜任務(wù),借助 " 內(nèi)置計算機(jī) " 代表用戶執(zhí)行多步驟任務(wù),突破了傳統(tǒng)問答的局限。實(shí)際操作中,其表現(xiàn)令人驚嘆。
這個智能體到底有多強(qiáng)大?用戶給出結(jié)婚請柬信息,10 分鐘內(nèi)就能得到男裝、鞋子推薦,附帶禮物建議及鏈接;依據(jù)棒球賽程,能規(guī)劃出貫穿全美 30 座棒球隊的觀賽路線,推薦酒店,并用電子表格和可視化路線圖呈現(xiàn);面對查看日歷并匯報客戶會議的指令,也能快速整理信息。
技術(shù)架構(gòu)上,它通過虛擬計算機(jī)處理任務(wù),在推理與執(zhí)行間靈活切換,多工具集成是亮點(diǎn),還配備多種網(wǎng)絡(luò)工具。
安全方面,敏感操作前會征求用戶授權(quán),具備主動監(jiān)督和風(fēng)險緩解功能,拒絕高風(fēng)險任務(wù),保障用戶控制權(quán)。
從底層技術(shù)來看,ChatGPT Agent 的發(fā)布離不開模型迭代的支撐。2025 年上半年,AI Agent 模型競爭白熱化。
年初,DeepSeek 憑借強(qiáng)化學(xué)習(xí)創(chuàng)新,打破 OpenAI 在推理模型賽道的壟斷,縮小了國內(nèi)外技術(shù)差距,激發(fā)了行業(yè)創(chuàng)新活力。
隨后,OpenAI 推出 o3 Pro、Anthropic 發(fā)布 Claude 4 系列、Google 推出 Gemini 2.5 Pro,頭部廠商迭代速度遠(yuǎn)超預(yù)期。
Meta 也宣布投資 150 億美元給數(shù)據(jù)標(biāo)簽公司 Scale AI,并重組 AI 部門。
國內(nèi)大廠與 "AI 六小龍 " 同樣積極,阿里發(fā)布通義千問 3.0、字節(jié)推出豆包 1.6 版本,產(chǎn)品迭代迅猛。
以 DeepSeek 的 R1 模型為例,其在模型后訓(xùn)練階段大規(guī)模應(yīng)用強(qiáng)化學(xué)習(xí),即便標(biāo)注數(shù)據(jù)少,也顯著提升了推理能力,實(shí)現(xiàn)推理性能的 Scaling Law。
這一突破推動更多企業(yè)投身相關(guān)研究,提升了 AI Agent 整體技術(shù)水平,為 ChatGPT Agent 這樣的強(qiáng)大智能體奠定了基礎(chǔ)。
隨著模型技術(shù)的不斷進(jìn)步,AI Agent 的應(yīng)用也從概念走向了實(shí)際落地,在多個領(lǐng)域展現(xiàn)出巨大的價值。
在編程領(lǐng)域,AI Agent 成果顯著,程序員借助 AI coding 工具,通過自然語言描述需求,就能自動生成代碼框架、查找漏洞、重構(gòu)代碼,大幅節(jié)省時間、提高軟件質(zhì)量。ChatGPT Agent 的加入,憑借多工具協(xié)作和復(fù)雜任務(wù)處理能力,將為編程領(lǐng)域帶來更高效智能的體驗(yàn)。
不止編程領(lǐng)域,在設(shè)計和音視頻創(chuàng)作等多個行業(yè),AI Agent 的探索與實(shí)踐也在如火如荼地進(jìn)行。
設(shè)計領(lǐng)域,世界首個專業(yè)設(shè)計智能體 Lovart,能從理解需求到交付完整品牌視覺方案,實(shí)現(xiàn)全流程自動化。用戶通過自然語言,就能將創(chuàng)意轉(zhuǎn)化為 2D 圖像、矢量圖形、3D 模型等專業(yè)設(shè)計,降低門檻,提高效率。
音視頻創(chuàng)作領(lǐng)域,萬興科技的萬興超媒 Agent 依托相關(guān)大模型,為創(chuàng)作者打造全流程智能助手,整合資源與工具,推動創(chuàng)作流程智能化、自動化轉(zhuǎn)型。ChatGPT Agent 憑借信息整合與任務(wù)執(zhí)行能力,有望與這些應(yīng)用互補(bǔ),為行業(yè)帶來新變革。
而在我們熟悉的日常生活場景中,AI Agent 的應(yīng)用潛力也在逐步釋放。ChatGPT Agent 能智能瀏覽網(wǎng)頁、篩選結(jié)果、運(yùn)行代碼、分析數(shù)據(jù),甚至生成 PPT 和 Excel。策劃婚禮時,它能自主打開瀏覽器推薦禮服、預(yù)訂酒店、準(zhǔn)備禮物,任務(wù)執(zhí)行中可與用戶互動,接受中斷和修改指令,實(shí)現(xiàn)高效人機(jī)協(xié)作,展現(xiàn)出提升生活便利性的無限可能。
隨著應(yīng)用場景的不斷拓展,AI Agent 的能力也在持續(xù)提升,朝著更強(qiáng)大的智能邁進(jìn)。其自主決策與環(huán)境感知能力不斷增強(qiáng),不再依賴預(yù)設(shè)規(guī)則,能像人類一樣根據(jù)環(huán)境和任務(wù)需求分析決策。
如自動駕駛領(lǐng)域,AI Agent 需實(shí)時感知路況等信息并做出駕駛決策。ChatGPT Agent 執(zhí)行任務(wù)時,也能理解環(huán)境信息,靈活調(diào)整操作,適應(yīng)復(fù)雜現(xiàn)實(shí)世界。
同時,AI Agent 的工具使用與協(xié)作能力也在持續(xù)增強(qiáng),能與 Gmail、Github 等外部工具交互,深度嵌入用戶工作流。處理復(fù)雜任務(wù)時,可協(xié)同使用文本瀏覽器、可視化瀏覽器、終端等多種工具,高效完成任務(wù)。
多 Agent 協(xié)作成為研究熱點(diǎn),未來有望像人類團(tuán)隊一樣分工解決復(fù)雜問題,ChatGPT Agent 的多工具集成能力便體現(xiàn)了其強(qiáng)大協(xié)作力。
從商業(yè)前景來看,AI Agent 領(lǐng)域可以說是機(jī)遇與挑戰(zhàn)并存。AI Agent 成為 2025 年 AI 領(lǐng)域核心熱詞,被視為當(dāng)年戰(zhàn)略技術(shù)趨勢之首。
據(jù) Markets and Markets 數(shù)據(jù),預(yù)計 2030 年全球市場規(guī)模將達(dá) 471 億美元,復(fù)合年增長率 44.8%。隨著技術(shù)成熟和場景拓展,其將在企業(yè)服務(wù)、智能家居等多領(lǐng)域廣泛應(yīng)用,創(chuàng)造巨大價值,ChatGPT Agent 的發(fā)布將加速市場發(fā)展。
不過,AI Agent的商業(yè)模式目前仍處于探索階段。
現(xiàn)階段訂閱與 token 付費(fèi)模式并存,如 ChatGPT Agent 為 Pro 用戶每月提供 400 次額度,Plus 和 Team 用戶 40 次,用戶可按需擴(kuò)展。
但多 Agent 協(xié)同結(jié)算等問題仍待解決,產(chǎn)品核心壁壘構(gòu)建也面臨挑戰(zhàn),各大 AI 企業(yè)還在探索獨(dú)特商業(yè)優(yōu)勢。
例如垂類 AI Agent 依托行業(yè)知識,在編程、設(shè)計等場景優(yōu)先落地,積極探索 ToC 硬件和長鏈條規(guī)劃創(chuàng)新等。
AI Agent的進(jìn)化還在加速,離走入千家萬戶,可能只差一個爆款應(yīng)用了。相信一向擅長應(yīng)用落地的國產(chǎn) AI廠商,在商業(yè)開發(fā)方面會交出令人眼前一亮的答卷。