OpenAI不聲不響,又下了一手狠棋。
就在剛剛,Agents SDK迎來一次徹底的架構重寫。
原生harness、原生沙盒、Codex級的文件系統工具,外加七家頭部沙盒廠商一鍵接入。
3月初,GPT-5.4帶著原生computer use(計算機使用)高調登場時,開發者就已經吐槽過一件事。
模型能操作電腦了,可Agent跑在哪臺電腦上、怎麼保證跑起來不出事,還是得自己東拼西湊一套框架。
今晚這個缺口被OpenAI自己補上了。
一句話版本,OpenAI這次把Agents SDK從「聊天機器人的玩具」改造成了「生產級Agent的底座」。
harness負責控制流、模型調用、工具路由、暫停恢復;沙盒負責讀寫文件、裝依賴、跑代碼,兩層徹底解耦。
更狠的是,這一刀同時砍在了LangChain、CrewAI、LangGraph這些第三方Agent框架身上。
OpenAI下場把基建層做了,留給第三方的空間,肉眼可見地在收窄。
從「聊天機器人的玩具」到生產級底座
講這次升級之前,先得搞清楚原來的Agents SDK長啥樣。
2025年3月,OpenAI第一次推出Agents SDK,主打輕量、少抽象、幾行Python就能跑起來的賣點。
但這一版SDK,本質上是為聊天機器人場景做的。
一年多過去,模型在能力上的提升可謂是翻天覆地——一口氣能跑幾個小時、幾天,甚至幾周。
原來那套為聊天機器人設計的SDK,自然也就跟不上時代了。
這次的重寫,主要做了兩件事。
第一件,給模型配一個完整的運行框架——harness。
配置化記憶、感知沙盒的編排、類似Codex的文件系統工具、通過MCP調工具、通過skills漸進式披露信息、通過AGENTS.md自定義指令、用shell工具執行代碼、用apply patch工具編輯文件,全部打包進SDK原生支持。
熟悉Claude Code和Codex的開發者看到這套清單會很眼熟。
沒錯,OpenAI這次是把自家Codex過去一年踩過的坑、積累的最佳實踐,順手產品化塞進了SDK。
第二件,把harness和compute徹底分離。
harness跑在你的可信基建裡,管模型調用、審批、追蹤、運行狀態。compute是一個獨立的沙盒,專門負責讀寫文件、跑命令、裝包、吐產物。
兩層之間的接口標準化,API key和敏感憑證壓根兒不會進入模型生成代碼實際執行的那個環境。
結果就是,沙盒裡既沒有API密鑰,也沒有任何敏感憑證。沙盒本身完全隔離,甚至可以和網絡斷開,沒有任何對外流量。
這不是安全性能的小修小補。這是整個Agent架構的範式轉移。
900頁保險單100%提取一半PR出自Agent
harness/compute分離的第一個結果,是沙盒供應商的生態圖一夜鋪開。
這次發佈,Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel七家沙盒廠商同時被寫進官方支持列表。
七家能同時接入,關鍵在OpenAI給了一個叫Manifest的抽象層——一份描述Agent工作區的配置清單。
要掛載哪些本地文件、從哪個雲存儲拉數據、產物寫到哪裡,全寫在這份Manifest裡。AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2全覆蓋。
最關鍵的是這份Manifest和具體沙盒供應商解耦。
今天用E2B寫的Agent,明天想換成Modal跑,不用重寫代碼,改一行配置。哪家沙盒便宜、哪家離數據近,就切到哪家。
官方給了一個最小示例。讓一個Agent跑進本地沙盒,掛上一個財報目錄,對比FY2025和FY2024的三項財務指標,核心代碼不到20行。
另外兩個對長跑任務格外關鍵的新能力是,讓沙盒容器掛了也能從檢查點續命的快照和狀態恢復;以及解決擴展性問題的多沙盒並行+子Agent隔離環境。
由此,Agent第一次有了「掉線續命」和「分身作戰」的原生能力。
在一篇技術長文中,Modal技術團隊成員Erik Dunteman順手透露了一個細節——
Ramp已經用Modal跑了一支後臺編碼Agent大軍,公司超過一半的PR都是這些Agent自己創建的。
不僅如此,Stripe也在今年早些時候披露,內部的AI Agent每週產出超過1000個PR。
兩家公司的共同點是,在拿到成熟Agent基建之後,業務團隊的生產力出現了斷層式躍遷。
如今,OpenAI把這些曾經只有頭部公司才能攢出來的基建,變成了SDK裡開箱即用的默認配置。
https://modal.com/blog/building-with-modal-and-the-openai-agent-sdk
對此,FurtherAI CTO Sashank Gondala披露,他們的Agent啃下了一份900多頁的保險理賠記錄,提取成功率100%。
900多頁、100%、保險理賠記錄,這三個詞湊在一起的含金量老保險從業者一看就懂,業內最難啃的文檔之一,以前跑到某一頁崩掉是常態。
Tomoro AI研發工程師Douglas Adams給出了另一組硬數字,相同能力的Agent,這次需要的代碼量比以前少了6倍。
Box開發者關係負責人Carter Rabasa,則傳了一份業務數據並配上bash/python作為工具,讓agent在沙盒裡跑了一整套發票對賬業務流程。
沒想到,第一輪試水就跑通了。
沙盒對跑agent生成的代碼來說非常完美。
OpenAI下場做基建,LangChain們無處躲
到這一層,這次發佈對行業的衝擊才真正顯露。
LangChain、LangGraph、CrewAI、AutoGen這些第三方Agent框架,過去一年靠什麼活著?答案是靠補齊OpenAI原生SDK不夠「生產可用」的那塊空白。
編排、記憶管理、護欄、追蹤、多Agent協作,這些都是第三方框架的主戰場。
現在,OpenAI一次性把這些主戰場全接管了。
他們要做的就是Agent世界的基礎設施層,第三方框架從此要麼往更高層走(編排、垂直場景),要麼往更低層走(專用沙盒、專用工具),夾在中間的那塊地板,已經被OpenAI自己踩實了。
而且,OpenAI口中的「兼容所有沙盒服務商」,本身就是在把沙盒供應商納入OpenAI的生態位。
今天可能還是OpenAI的合作伙伴,明天的身份很可能就只是OpenAI生態下的「組件供應商」了。
Python先行,TypeScript還在排隊
雖然這一切目前還不完美。
harness和sandbox的新能力首發只上了Python,TypeScript版本排在後續更新計劃裡;SDK至今仍然停留在0.Y.Z版本號。
但方向已經非常清晰了。
GPT-5.4帶著原生computer use登臺,Agents SDK給它配齊了真正的運行環境。
下一步缺的,只是更多開發者把業務邏輯搭在這個基建之上。
從此,做Agent框架的創業公司會重新審視自己的定位。做沙盒的供應商開始算OpenAI流量能不能接得住。做業務層Agent應用的團隊盤算要不要遷移。
GPT-5.4出廠那天被一些人說成是「沒有驚喜的例行升級」。
40天后回頭看,真正的驚喜今天才發。
參考資料:
https://techcrunch.com/2026/04/15/openai-updates-its-agents-sdk-to-help-enterprises-build-safer-more-capable-agents/
https://modal.com/blog/building-with-modal-and-the-openai-agent-sdk
https://openai.com/index/the-next-evolution-of-the-agents-sdk/
https://x.com/OpenAIDevs/status/2044466699785920937
https://x.com/snsf/status/2044514160034324793
本文來自微信公眾號“新智元”,編輯:好睏 ,36氪經授權發佈。






