Claude Opus 4.6 和GPT-5.3 Codex接管軟件世界

avatar
36氪
02-06

這就非常有意思了。

就在今天(2026年2月6日),Anthropic和OpenAI跟約好了一樣,短短20分鐘裡先後扔出了兩枚深水炸彈,那就是,Claude Opus 4.6和GPT-5.3 Codex。

沒有預熱、沒有鋪墊,甚至沒有留給市場消化的時間。這是一場極其明確的 「模型遭遇戰」。

這場正面硬剛,清清楚楚標誌著AI競賽,已經從過去兩年的「聊天對話能力競賽」,正式切換到了一個全新階段,Agent自治時代。

要把兩家的發佈拆成「它們到底在強化啥能力」來看,差別其實特別明顯。

01

說重點,Anthropic那邊,核心三個點:可控的Agent行為邊界、任務拆解和執行的穩定性,還有更明確的人類監督和回滾機制。

它們沒把Agent吹成「什麼都能幹」的全能選手,重點就強調一點:Agent必須在清晰的規則、權限和審計框架下運行。

而OpenAI給出的方向,則明顯更激進:

更強的自主規劃能力、多步驟跨工具的持續執行,還有模型要對複雜目標負全責。說白了,信號很直接,Agent能接管一整個任務流程,從看懂目標到最後交出結果。

總結一句就是,Anthropic在強調「別出錯」,OpenAI在賭「先跑起來」。

這就是路線之爭啊。

很多人第一反應都是找benchmark、參數規模或者模型代際差異,但這次真沒必要盯著這些,因為這場競爭的本質是:AI到底該被做成「靠譜的執行工具」,還是「高度自主的行動系統」?

Chat 時代,模型的失敗成本是極低的。說錯一句話,用戶追問糾正或者直接忽略就行。但到了Agent時代,出錯的代價就翻著倍地漲。

Agent接管的是整個過程,它會自己拆任務、選工具,在你不盯著的時候一直運行,一旦出錯,那就是「它把事兒搞砸了」;也正因為這樣,兩家公司幾乎同時把重心轉到Agent上,卻走出了完全不同的路子。

為什麼是現在?為什麼這麼急?

背後至少有三個原因:第一,Chat類產品的形態已經到頂了,不管是日活、使用次數,還是用戶覺得「更聰明」的感知提升,都慢下來了;再在對話體驗上內卷,再往上衝的收益越來越少。

第二,企業真正想要「替我幹活」,自動化流程、研發協作、運營執行、分析決策這些場景,本質上都需要Agent。

第三,也是最關鍵的一點:誰先定下Agent的玩法,誰就有機會定義下一代AI的基礎設施,這就是搶生態位置的戰爭。

那麼,從產品邏輯看,Agent 意味著什麼?

如果說ChatGPT是「AI時代的搜索和內容入口」,那Agent更像企業裡的「數字員工」,是操作系統級別的自動執行層,是連接模型、工具和真實世界的核心。

這也意味著,評價AI的標準變了,過去看回答準不準、像不像人,接下來要看任務完成率高不高、連續運行穩不穩、出錯了能不能補救。

這對模型、平臺和開發者來說,都是一次難度大增的升級。

所以,有個信號很明確:分水嶺已經到了,接下來的競爭重點,是系統級能力的比拼,誰的Agent更靠譜、邊界更清晰,誰就能被企業真正用在生產流程裡。

02

那麼,SaaS 在這場 Agent 轉向中,處在什麼位置?

這兩天SaaS、AI應用大跌,一點都不意外,因為市場終於意識到一個更核心的問題:當Agent開始接管「做事」,傳統SaaS的價值根基就被動搖了。

過去二十年,SaaS的核心邏輯特別簡單,賣「工具使用權」。你公司有100個人,我就賣你100個賬號,本質上就是賣給你一套流程框架,讓人照著既定路徑點一點、填一填、操作一下。

效率提升靠「系統化」,不是「自動完成」。

Agent的出現,直接挑戰了這個前提,現在大家更關心,SaaS還剩多少價值?先說明白一點:Agent不會一下子把所有SaaS都取代掉。

真正的問題是,當Agent能跨系統執行任務時,SaaS的「界面價值」就塌了。

在Agent時代,用戶需求變成了:給Agent一個目標,它自己調用CRM、表格、BI、郵件、內部系統,直接交出結果。

這就意味著,很多SaaS引以為傲的東西,比如:功能菜單、操作路徑、使用培訓、用戶學習成本,在Agent面前,突然就不算護城河了。

市場現在就是在提前定價這個變化,SaaS正在被降維,這也是為啥Agent相關消息一密集,SaaS股就波動這麼大;資本也在重新算賬,如果用戶最後都是通過Agent用功能,那SaaS還能收多少溢價?

當使用入口從「人到系統」變成「Agent到系統」,SaaS就從「前臺產品」變成了「後端能力模塊」,而後端模塊,天生就要被壓價。

所以,真正危險的,是「流程型SaaS」。

特別依賴人工操作的,比如:重流程、輕智能的管理系統,靠操作複雜形成粘性的工具,還有需要大量人工維護、錄入、審批的產品。

這些系統存在的前提是人必須參與每一個步驟,但Agent的核心價值,恰恰是「把步驟本身自動化」。

那SaaS還有機會嗎?我覺得有,但前提是角色要變。

在Agent時代,SaaS要麼往上走,要麼往下沉。往上走,就變成Agent的「指揮台」和「控制層」,提供權限、審計、合規、結果驗證這些功能;往下沉,就變成Agent能調用的高質量能力接口,徹底做成API化、模塊化。

最危險的是騎牆,既想繼續賣界面和賬號,又沒法控制Agent的入口。所以,再回到今天這場「模型遭遇戰」,Anthropic和OpenAI的分歧,也會直接影響SaaS的命運。

Anthropic的路線,更利好那些強調合規、安全、邊界控制的企業SaaS;OpenAI的路線,則更可能加速「結果導向型Agent」對SaaS前臺的侵蝕。

你會發現,它們都在試著定義「誰能重新分配軟件產業鏈的價值」。

如果要給SaaS一個總結,大概是這句話:Agent是在逼著SaaS回答一個更殘酷的問題:你賣的,到底是工具,還是結果?而資本,已經先一步投出了自己的票。

03

既然這樣,以後SaaS的錢該怎麼收?這是一個關於商業模式、商業效率的底層問題。

過去二十年,SaaS行業的財富密碼特別簡單,就四個字:「按人頭收錢」。

你公司有100個人,我就賣你100個賬號,這背後有個大家都沒明說的想法:軟件只是工具,活兒還得人幹。因為人的產出是有限的,所以賬號數就代表了企業的規模和購買力。

在Claude 4.6和GPT-5.3這種「數字員工」面前,這個想法徹底崩了。

當Claude 4.6帶著它的「Agent小分隊」進場,它是來直接「替你幹活」的,現在你可能只需要1個主管,帶著1個AI代理就夠了。

這時候尷尬的事兒就來了,剩下的9個賬號,你退不退?肯定退啊。這是SaaS行業現在面臨的最恐怖的「死亡螺旋」:產品越先進、越智能,能收到的錢反而越少。

這種邏輯上的自相矛盾,直接把很多傳統SaaS廠商逼到了牆角,如果我把AI做得太好,就是在自砸飯碗;如果做得不好,隔壁那個全面擁抱Agent的小競爭對手,就會用更低的價格、更直接的結果把我幹掉。

說白了,以前SaaS賣「工具的使用權」,以後大家要買「任務的完成度」。核心差別是,以前買「過程」,以後買「結果」。

換個角度看更清楚:

你買一把電鑽,它是工具,得你自己鑽孔;只要家裡人多,每個人想鑽孔,你就得買好幾把。

如果現在有「自動鑽孔服務」,你只要說一句「我要在這個位置開個5厘米的洞」,洞就自己出來了,你還會關心電鑽是誰家的、長啥樣、有幾個按鈕嗎?根本不關心,你只在乎洞準不準。

這就是我一直說的,SaaS的「界面價值」正在塌陷。

過去,SaaS公司拼命搞UI、搞交互、培養用戶習慣、設計操作路徑,想方設法讓你覺得「這個軟件好用,我習慣了」。

這種習慣就是護城河,換一套系統,員工要重新培訓,成本太高。

Agent時代,這個護城河瞬間就成了廢墟,因為以後根本不是「人」在用軟件,是「Agent」在用;Agent沒感情,不需要精美的UI,也不需要用戶教育,只要一個API接口就行。

如果今天A廠商的接口一分鐘收一毛錢,明天B廠商收八分錢還更穩,Agent會毫不猶豫地切換過去;這就意味著,SaaS正在從「前臺產品」降維成「後端能力模塊」。

一旦變成後端模塊,就失去了對用戶的「控制權」,用戶只跟那個聰明的Agent說話,Agent背後接了誰家的接口,用戶可能根本不在乎。

這種權力移交對SaaS公司來說是致命的,因為後端模塊是標準化的,標準化就意味著要打價格戰,利潤薄得像紙。所以這兩天SaaS股跳水,資本擔心的就是這個:

所以,以後SaaS廠商會從「收租的地主」,變成「給模型打工的搬運工」。

04

既然界面價值塌了,那誰才是AI時代的「萬物入口」?或者說,Agent到底長在誰身上?

其實你可以試著把手機、電腦想象成一個巨大的「信息孤島集群」。大廠們為了守住自己的地盤,故意造了很多這種不連通的壁壘。

你想打個車,得先找到App圖標;你想處理數據,得在不同軟件之間來回切換,把自己當成「人肉數據線」。這種碎片化的交互,本質上是大廠們在收「注意力稅」。

但這次Claude 4.6和GPT-5.3的對撞,其實在宣告:這種靠「軟件牆」堆起來的壁壘,正在被Agent這種「強鹼」腐蝕掉。

當Agent開始接管任務,App會退化成一個個藏在幕後的零件,這意味著,互聯網的權力重心正在大規模「截流」,誰握著Agent的指令框,誰就握著整個數字世界的「調度權」,這是一個特別恐怖的流量漏斗。

你想想,以後你買機票、訂酒店、甚至寫一段代碼,都不會再想「去某個App逛逛」,Agent直接替你篩選、替你決策、替你執行。

這時候,那些原本握著入口的搜索引擎、垂直電商、社交軟件,會突然發現自己被「架空」了。

這也是為啥OpenAI和Anthropic這次這麼激進,甚至不惜得罪微軟、蘋果,也要搶桌面端的控制權,因為它們看得很透:誰定義了Agent的交互,誰就成了AI時代的事實操作系統。

這就好比在別人的地盤上,直接蓋了一層「空中樓閣」,底下的Windows或者iOS變成了純粹的供電系統和底層協議,而真正跟用戶接觸的那層「皮」,被Agent拿走了。

這種權力移交,還會直接導致硬件形態的「去中心化」。

我們之所以需要13英寸的屏幕、精準的鼠標、滿屏的圖標,是因為我們要親手操作那些複雜的軟件界面。

如果這一切都簡化成一個能隨時溝通的「數字經理人」,那我們手裡拿的是手機、眼鏡還是掛墜,其實已經不重要了,硬件會慢慢變「輕」,甚至輕到我們感覺不到它的存在。

大廠們辛辛苦苦修了二十年的生態圍牆,在Agent的邏輯裡,就像是馬車伕在汽車時代討論怎麼改進馬鞭。

大家會突然意識到,我們要的一直都是「拿到結果」。

在這個節點上,我們正在見證「數字主權」的重新分配,是模型公司繞過底層直接接管用戶?還是系統巨頭反手把Agent關進籠子裡?我不確定答案,但大廠們應該很快就會反應過來。

可以確定的是,我們正在告別一個以「軟件」為中心的互聯網,進入一個以「任務」為中心的數字世界。

在這個世界裡,用戶只關心一句話:這件事你能不能替我搞定。一旦「搞定事情」成為核心價值,入口就屬於最會調度能力、承擔結果、壓住風險的那一層。

好吧,注意,AI應用相關的板塊,最近還會跳水,模型公司還會漲,話只能說到這兒了。

本文來自微信公眾號“王智遠”(ID:Z201440),作者:王智遠,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論