精品一级片内射视网站下载_免费国产激情自拍电影在线_国产成人综合亚洲日韩欧美_成人高清免费毛片_日韩av午夜免费观看_yase视频国产精品_黄色精品毛片少妇_日韩高清在线观看一二三区_午夜电影网写真在线观看_雷安ss劲爆车白色液体

登錄甲子光年
其他登錄方式
登錄即表示你已閱讀并同意
《甲子光年用戶注冊協(xié)議隱私政策
找回密碼
獲取驗證碼
注冊甲子光年
獲取驗證碼
注冊即表示你已閱讀并同意
《甲子光年用戶注冊協(xié)議隱私政策
綁定手機號
獲取驗證碼
登錄即表示你已閱讀并同意
《甲子光年用戶注冊協(xié)議隱私政策
完善資料
登錄即表示你已閱讀并同意
《甲子光年用戶注冊協(xié)議隱私政策
微信登錄
掃描二維碼 | 授權(quán)登錄甲子光年
AI Agent落地“卡殼”?騰訊云用100毫秒沙箱打通“最后一公里”
作者:王藝 編輯:栗子 2025-12-26


Agent跑起來,Infra先鋪路。


作者|王藝

編輯|栗子


2025年,Agent很忙。


上半年忙著比誰的模型更聰明,下半年忙著解決一個更現(xiàn)實的問題:怎么讓這些聰明的Agent真正“動起來”?


有些企業(yè)滿懷期待地引入“數(shù)字員工”,希望它們能自動完成數(shù)據(jù)整理、客戶服務(wù)、代碼編寫等重復(fù)性工作,然而現(xiàn)實卻頻頻“打臉”:任務(wù)執(zhí)行到一半突然中斷,面對突發(fā)流量時響應(yīng)遲緩,算力成本居高不下,甚至因為安全漏洞讓企業(yè)數(shù)據(jù)面臨風(fēng)險。


這不是個別現(xiàn)象。據(jù)Gartner測算,2028年全球Agent市場規(guī)模將達到2850億美元,屆時15%的日常業(yè)務(wù)決策將由Agent自主完成,33%的企業(yè)軟件將原生嵌入Agentic AI能力;IDC則指出,2024年中國AI Agent軟件市場收入規(guī)模首次突破50億元人民幣,預(yù)計2028年將躍升至8520億元人民幣,2023~2028年復(fù)合年增長率高達72.7%。其中,面向企業(yè)端的應(yīng)用長期占據(jù)98%以上份額。


但當(dāng)這些在Demo中表現(xiàn)驚艷的Agent投入真實的高并發(fā)業(yè)務(wù)環(huán)境時,便頻頻陷入“跑不動、不安全、不兼容”的窘境。


問題的癥結(jié)在于:傳統(tǒng)云計算基礎(chǔ)設(shè)施與Agent的原生特征之間,存在著代際錯配。Agent的高自主性、長會話、突發(fā)負(fù)載等特點,難以被為傳統(tǒng)應(yīng)用設(shè)計的架構(gòu)所支撐。


于是,行業(yè)逐漸形成共識——“Agent跑起來,Infra先鋪路。”


Agent Infra,這個從技術(shù)后臺走向幕前的新賽道,正在成為決定AI Agent規(guī)模化落地的關(guān)鍵變量。


1.從AI Infra到Agent Infra:一場范式革命


要理解Agent Infra的價值,需要先看清楚AI應(yīng)用正在經(jīng)歷的范式轉(zhuǎn)變。


傳統(tǒng)AI應(yīng)用追求的是“確定性”——輸入相同的數(shù)據(jù),輸出相同的結(jié)果。


但Agent的出現(xiàn)打破了這一切。它具備不確定性、復(fù)雜性和自主性。想象你在使用一個傳統(tǒng)的數(shù)據(jù)分析軟件。你輸入同一份銷售數(shù)據(jù),每次都會得到相同的報表,這就是確定性。


但當(dāng)你換成Agent來做同樣的工作,情況就不一樣了。今天它可能重點分析地區(qū)差異,明天可能關(guān)注季節(jié)趨勢,后天又可能發(fā)現(xiàn)價格敏感性。


這種不確定性源于大模型的概率推理機制,讓Agent的行為難以精確預(yù)測。企業(yè)在應(yīng)用Agent時必須接受這種不確定性,同時通過工程手段將其控制在可接受范圍內(nèi)。


當(dāng)這個Agent出現(xiàn)錯誤時,排查就成了一場偵探游戲——是因為你的提問方式(Prompt)有歧義?還是它從歷史對話(記憶)中提取了錯誤信息?抑或是調(diào)用的數(shù)據(jù)源(知識庫)本身就有問題?


在傳統(tǒng)軟件中,你可以單步調(diào)試、逐行排查;但在Agent系統(tǒng)中,這些組件像一團亂麻,相互影響又難以拆解。這就是復(fù)雜性,它讓傳統(tǒng)的調(diào)試方法失去用武之地。


最讓人擔(dān)心的是自主性。傳統(tǒng)軟件只會做你讓它做的事,但Agent會“自作主張”。它可能自己決定調(diào)用某個API、執(zhí)行某段代碼、訪問某個網(wǎng)站。


這種能力讓它能夠處理復(fù)雜任務(wù),但也帶來了風(fēng)險:如果它被惡意提示詞誘導(dǎo),可能做出危險操作;如果它對權(quán)限邊界理解錯誤,可能越權(quán)訪問敏感數(shù)據(jù)。


在傳統(tǒng)軟件的安全模型中,“自主行動”通常意味著系統(tǒng)被入侵了;但對Agent來說,自主行動恰恰是它的核心價值。如何讓這種自主性既強大又安全,是基礎(chǔ)設(shè)施必須解決的問題。


這三大特征并非孤立存在,它們相互交織,構(gòu)成了AI Agent范式的核心。不確定性與復(fù)雜性是自主性的內(nèi)在體現(xiàn),而自主性則將前兩者帶來的風(fēng)險具象化。


騰訊云產(chǎn)品團隊在思考Agent Infra的演進邏輯時,提出了一個核心觀點:云計算的發(fā)展史,就是在企業(yè)應(yīng)用架構(gòu)不斷演進的過程中,持續(xù)化解“偶然復(fù)雜度”的過程。從單體應(yīng)用時代的IaaS,到微服務(wù)時代的容器治理平臺,再到大數(shù)據(jù)時代的一站式數(shù)據(jù)引擎,每一次技術(shù)躍遷都是為了讓開發(fā)者從基礎(chǔ)設(shè)施的繁瑣中解放出來,專注于業(yè)務(wù)創(chuàng)新。

云計算發(fā)展史,圖源:GeeksforGeeks

Agent時代同樣如此。當(dāng)Agent需要執(zhí)行代碼、訪問網(wǎng)絡(luò)、操作數(shù)據(jù)庫時,傳統(tǒng)的云基礎(chǔ)設(shè)施已經(jīng)無法滿足其“高頻、輕量、突發(fā)、即時響應(yīng)”的工作模式。


Agent Infra的出現(xiàn),正是云計算對這一新型工作負(fù)載挑戰(zhàn)的必然回應(yīng)。隨著AI競爭焦點從模型能力轉(zhuǎn)向基礎(chǔ)設(shè)施支撐能力,Agent Infra已成為全球云廠商爭奪的戰(zhàn)略高地。


在國際市場,三大云廠商已展現(xiàn)出鮮明的技術(shù)路徑和戰(zhàn)略側(cè)重。


  • AWS憑借在云計算基礎(chǔ)設(shè)施領(lǐng)域的深厚積累,于今年7月推出Agent Core預(yù)覽版,它基于Lambda FaaS深度定制全托管運行時,提供記憶管理、身份驗證、代碼執(zhí)行等工具,強調(diào)安全、可擴展和多Agent協(xié)作。值得注意的是,Agent Core專注于保障Agent運行,而非構(gòu)建Agent本身。


  • 微軟Azure選擇了生態(tài)協(xié)同的差異化路徑,在今年5月推出AI Foundry Agent Service,深度集成NVIDIA NIM微服務(wù)與AgentIQ工具包,形成從模型優(yōu)化到Agent調(diào)度的全鏈路能力。依托Functions FaaS的事件驅(qū)動架構(gòu),它支持1小時長時運行與企業(yè)級IAM權(quán)限管理。


  • 谷歌GCP則走輕量化與普適性路線,Vertex AI Agent Builder聚焦構(gòu)建和管理多Agent系統(tǒng),用低代碼降低了Agent開發(fā)門檻,讓企業(yè)無需深厚編程能力即可構(gòu)建客服、HR問答等場景的智能體。


盡管技術(shù)路徑各異,但云廠商們都有一個共同的目標(biāo):為Agent提供更高彈性、更低延遲、更強安全、更長會話的保障,支撐其真正落地千萬級企業(yè)場景。


2.沙箱:Agent跑起來的第一道關(guān)


在Agent Infra的諸多能力中,沙箱是最關(guān)鍵的一環(huán)。它為Agent提供隔離、監(jiān)控、記錄、約束的受控執(zhí)行環(huán)境,是智能體與真實世界之間的安全邊界。


但問題在于,傳統(tǒng)沙箱太慢。


傳統(tǒng)虛擬機的啟動方式為長時間運行設(shè)計,動輒需要數(shù)秒甚至數(shù)十秒,對于需要即時響應(yīng)的Agent來說,這種延遲是不可接受的。容器雖然啟動快,但隔離性不足,共享內(nèi)核帶來的安全風(fēng)險讓企業(yè)望而卻步。


騰訊云Agent Infra團隊的解決方案是:不在舊技術(shù)上“打補丁”,而是專門為Agent設(shè)計一套全新的底座——Cube(MicroVM Runtime)。


Cube并非從零開始。它源自騰訊云成熟的Serverless體系,每天承載著百億級調(diào)用。在Agent時代,這些經(jīng)過大規(guī)模驗證的能力被系統(tǒng)性地引入沙箱服務(wù)。其核心突破體現(xiàn)在三個維度:


首先是速度上的突破。


傳統(tǒng)虛擬機啟動需要完整的系統(tǒng)引導(dǎo)過程。Cube通過“運行時快照”技術(shù),將一個已就緒的沙箱固化成模板,通過內(nèi)存映射恢復(fù)的方式,Cube只需約40毫秒就能交付一個安全沙箱,加上網(wǎng)絡(luò)、鑒權(quán)等開銷,端到端啟動時長穩(wěn)定在100毫秒級別。


這是什么概念?人眨一次眼需要100~150毫秒。當(dāng)你眨眼的瞬間,騰訊云已經(jīng)為你的Agent準(zhǔn)備好了一個完整的執(zhí)行環(huán)境。


其次是安全上的加強。


速度不能以犧牲安全為代價。Cube保留了虛擬機級別的強隔離能力,每個Agent的行為都運行在獨立、可審計、可約束的執(zhí)行環(huán)境中。代碼執(zhí)行、網(wǎng)絡(luò)訪問、系統(tǒng)調(diào)用均受嚴(yán)格策略控制,任何越界行為會被即時阻斷。


騰訊云首創(chuàng)的“會話與實例綁定”機制更進一步:每個用戶會話分配一個獨立的輕量虛擬機,會話結(jié)束后徹底銷毀、清零內(nèi)存,從根源上杜絕數(shù)據(jù)泄露風(fēng)險。


最后是并發(fā)上的提升。


Agent的工作負(fù)載極不穩(wěn)定——可能長時間空閑,也可能突然涌來海量請求。Cube通過資源提前池化(網(wǎng)絡(luò)、進程、磁盤等預(yù)創(chuàng)建),實現(xiàn)了單機同時拉起2000+沙箱,平臺整體可瞬時調(diào)度10萬級沙箱的實例。


這種“即開即用、用完即銷毀”的Serverless架構(gòu),讓企業(yè)無需按最高負(fù)載囤積機器,資源利用率提升至80%以上,算力成本大幅降低。

騰訊云沙箱,圖源:騰訊云

目前,騰訊云Agent沙箱服務(wù)已經(jīng)開放內(nèi)測,支持代碼沙箱(Python、JavaScript)、瀏覽器沙箱和計算機沙箱等多種類型,兼容主流社區(qū)開源協(xié)議(如MCP)以及RESTful API、SDK、CLI等多種接入方式。


3.不只是沙箱:Agent Runtime的全棧思考


盡管已經(jīng)將沙箱技術(shù)做到了行業(yè)領(lǐng)先,騰訊云對Agent Infra的理解,遠(yuǎn)不止于一個高性能沙箱。


今年9月,在全球數(shù)字生態(tài)大會上,騰訊云正式發(fā)布了Agent Runtime解決方案,集成了執(zhí)行引擎、云沙箱、上下文服務(wù)、網(wǎng)關(guān)、安全可觀測等核心模塊。這套方案背后,體現(xiàn)的是騰訊云對Agent全生命周期管理的系統(tǒng)性思考。

騰訊云Agent Runtime解決方案,圖源:騰訊云

執(zhí)行引擎扮演著“智能調(diào)度中心”的角色。它由Agent Server(決策中樞)、MCP Server(工具集成層)和沙箱應(yīng)用三個原子化模塊組成,支持會話親和調(diào)度、實例級安全隔離。值得一提的是,執(zhí)行引擎支持會話持續(xù)運行7天,并能暫停保留30天,這對于需要長時間運行的復(fù)雜Agent任務(wù)至關(guān)重要。


上下文服務(wù)解決了Agent的“記憶”問題。如何從對話中提煉關(guān)鍵信息并沉淀為“長期記憶”,且在不浪費資源的前提下實現(xiàn)記憶存儲與檢索,是企業(yè)落地Agent的重大技術(shù)門檻。騰訊云將記憶管理云化為通用服務(wù),降低了企業(yè)的開發(fā)難度。


網(wǎng)關(guān)與安全可觀測則提供了全鏈路的安全防護。從模型服務(wù)接入、工具調(diào)用流量管理,到機密計算、日志服務(wù)、全鏈路安全與可觀測,騰訊云構(gòu)建了一套完整的安全體系。


這種自下而上的分層演進邏輯與海外云廠商的布局思路不謀而合,但騰訊云在底層性能上的突破,讓其在這場競賽中占據(jù)了先發(fā)優(yōu)勢。


以騰訊元寶為例,其AI編程功能就運行在Agent Runtime之上。通過云沙箱提供的安全隔離環(huán)境,元寶可以即時生成并執(zhí)行代碼,實測運行速度遠(yuǎn)超同類產(chǎn)品。


騰訊產(chǎn)品團隊強調(diào),元寶只是Agent Runtime眾多應(yīng)用場景之一。這套基礎(chǔ)設(shè)施的真正價值,在于它為所有開發(fā)者提供了一個安全、高性能、Serverless的Agent運行環(huán)境,讓他們能夠?qū)W⒂跇I(yè)務(wù)邏輯,而不是陷入底層基礎(chǔ)設(shè)施的泥潭。


以一家專注于Agent瀏覽器的公司為例,其核心技術(shù)挑戰(zhàn)是訓(xùn)練智能體自動完成瀏覽器通用任務(wù)(信息檢索、表單填寫、在線購物等),整個后訓(xùn)練流程包含模型推理、執(zhí)行軌跡生成、沙箱執(zhí)行和模型訓(xùn)練四個環(huán)節(jié),單輪訓(xùn)練需要并發(fā)啟動近萬個Session和對應(yīng)數(shù)量的PC/瀏覽器沙箱環(huán)境。傳統(tǒng)方案中,沙箱啟動時間過長成為制約訓(xùn)練效率的主要瓶頸。


在引入騰訊云沙箱后,該公司不僅能使用騰訊云的全球算力資源池靈活調(diào)配,可承載十萬級的Session并發(fā)創(chuàng)建能力,沙箱的啟動時間也提速到100毫秒級別。


此外,Agent Runtime的優(yōu)異表現(xiàn),并非源于單一的技術(shù)或產(chǎn)品,還在于其根植于騰訊公司內(nèi)部最龐大、最多樣化的業(yè)務(wù)生態(tài)。


騰訊內(nèi)部擁有從社交(微信)、游戲、文娛(視頻)、到支付、云計算等業(yè)界最豐富的應(yīng)用形態(tài)。目前,所有這些業(yè)務(wù)都在進行AI化轉(zhuǎn)型,并催生出大量獨特的Agent應(yīng)用。可以說,這些海量、復(fù)雜且高標(biāo)準(zhǔn)的內(nèi)部場景,成為了Agent Runtime產(chǎn)品最好的“磨刀石”和“試驗田”。


4.云原生的下一站:為Agent而生


盡管Agent Infra已經(jīng)成為行業(yè)熱點,但必須承認(rèn),這個領(lǐng)域仍處于早期階段。當(dāng)前的產(chǎn)品和解決方案,主要解決的是“能跑起來”的問題;而未來的演進方向,則是解決“跑得更好”的問題。


現(xiàn)階段,安全隔離、彈性供給、極致性能是AI Agent最緊迫的需求。而當(dāng)Agent能夠穩(wěn)定運行后,企業(yè)的需求會快速升級:如何讓Agent更智能、更可控、更易管理?


評估體系的構(gòu)建是第一個挑戰(zhàn)。傳統(tǒng)軟件有明確的測試標(biāo)準(zhǔn)——功能是否正確、性能是否達標(biāo)、有無bug。但Agent基于大模型,輸出具有不確定性,如何評估其“好壞”?如何建立客觀的評價指標(biāo)?如何確保Agent的能力不會退化?這些問題目前還沒有標(biāo)準(zhǔn)答案。


“第一,你要從工程思維,轉(zhuǎn)化成駕馭不確定性和復(fù)雜系統(tǒng)的思維,要去為它構(gòu)建評測體系,這種轉(zhuǎn)變是非常巨大的;第二,你不僅需要利用AI Coding的工具進行代碼生成,更是要用它改變你們之間的協(xié)同模式。這兩點都是巨大的挑戰(zhàn)。”騰訊云云原生產(chǎn)品副總經(jīng)理,騰訊云專家工程師于廣游說。


數(shù)據(jù)管理與回放是第二個挑戰(zhàn)。Agent在真實環(huán)境中的表現(xiàn),往往與實驗室環(huán)境有很大差異。如何收集和管理Agent的運行數(shù)據(jù)?如何回放歷史場景進行調(diào)試?如何構(gòu)建測試集確保可持續(xù)性?這需要基礎(chǔ)設(shè)施層提供系統(tǒng)化的支持。


記憶與上下文管理是第三個挑戰(zhàn)。未來的Agent不應(yīng)只是執(zhí)行單次任務(wù),而應(yīng)能夠從歷史交互中學(xué)習(xí)、在長期運行中積累經(jīng)驗、在上下文理解中不斷優(yōu)化。這要求基礎(chǔ)設(shè)施提供自動總結(jié)、學(xué)習(xí)沉淀、上下文壓縮等高階能力。


“假如你跟Agent說,請你幫我搜一個什么東西,Agent會拉出來非常多資料——這個工作并不是從一個RAG的數(shù)據(jù)庫中挑取處一個片段,而是真的要理解這個問題。為了訓(xùn)練這種能力,我們需要對模型進行進行了Search和代碼的RL(強化學(xué)習(xí)),而非讓模型自己進行反向傳播。這個訓(xùn)練過程占據(jù)了60%以上的時間。但是騰訊云的沙箱極大加速了這個過程,反映到用戶的感受上,其實就是很多Agent產(chǎn)品的能力在逐漸增強。”于廣游說。


當(dāng)前,騰訊云已經(jīng)在運維層和工具層建立了領(lǐng)先優(yōu)勢。未來,隨著安全層和智能化層能力的逐步完善,Agent Runtime有望成為一個真正意義上的“Agent操作系統(tǒng)”——就像iOS之于移動應(yīng)用、Kubernetes之于云原生應(yīng)用一樣,為Agent提供標(biāo)準(zhǔn)化的運行環(huán)境和開發(fā)范式。


2025年,我們見證了Agent從實驗室走向生產(chǎn)環(huán)境的關(guān)鍵轉(zhuǎn)折。Agent Infra的成熟與普及,正在從根本上降低AI智能體的應(yīng)用門檻。就像云計算讓每個企業(yè)都能享受到原本只有互聯(lián)網(wǎng)巨頭才具備的計算能力一樣,Agent Infra正在讓每個開發(fā)者都能構(gòu)建出原本需要龐大團隊才能完成的智能應(yīng)用。


這場變革才剛剛開始。正如騰訊云產(chǎn)品團隊所言,完備的Agent Infra新范式目前尚不存在,行業(yè)仍處于“共識落地為行動”的初期階段。但從100毫秒的沙箱啟動速度、10萬級的瞬時調(diào)度能力、會話級的安全隔離機制來看,騰訊云已經(jīng)在這條賽道上建立了清晰的技術(shù)領(lǐng)先優(yōu)勢。


當(dāng)Agent從Demo走向生產(chǎn),從實驗室走向企業(yè),它需要的不僅僅是一個“能用”的基礎(chǔ)設(shè)施,更需要一個“好用”的、專為其設(shè)計的云原生環(huán)境。


這或許就是Agent Infra存在的意義,也是騰訊云正在書寫的答案。


(封面圖來源:AI生成)


  • 41136
  • 385
  • 102
  • 0
評論