大模型廠商，是時候告別Token狂歡了

ME News

Anthropic因第三方工具導致算力成本激增，宣佈限制Claude訂閱對OpenClaw等工具的訪問，暴露大模型在Agent時代訂閱制難以為繼的困境。

文章作者：楷楷

文章來源：伯虎財經（bohuFN）

“低價賣Token並對第三方開放，看起來很友好，但那是一個陷阱。”

近日，小米集團MiMo負責人羅福莉在X平臺發文，將Token價格戰比喻為“陷阱”，提醒大模型公司不應該盲目參與價格戰。

幾天之前，Anthropic突然宣佈切斷第三方工具對Claude訂閱的訪問權限，這也是羅福莉發文討論Token定價邏輯的契機。

在這場全民“養龍蝦”的Token狂歡中，羅福莉的公開信和Anthropic的“封殺令”，成為行業中罕見的“不同聲音”，給這股熱潮潑下了冷水。

但問題是，大模型廠商當真算不清這筆成本賬？還是說，這只是行業一場心照不宣的博弈，用狂燒的Token換取一張通往未來的入場券，賭的是AGI的未來。

如果是這樣的話，誰還能叫醒一個正在裝睡的人。

01 Anthropic撐不住了

幾天前，Anthropic向所有用戶發送郵件，宣佈自當地時間4月4日下午3點起，Claude Pro和Max訂閱將不再覆蓋OpenClaw等第三方工具的使用。

事出突然，Anthropic給用戶送了一筆一次性補貼，金額剛好等於一個月訂閱費。但相較於從前花200美元月費就能無限量調用Claude的好日子，這筆補貼顯然只是杯水車薪。

消息一出，社交媒體瞬間炸鍋，用戶們破口大罵，鋪天蓋地都是“過河拆橋”的論調，因為OpenClaw創始人彼得·斯坦伯格跟Anthropic的恩怨早已有之。

OpenClaw最初上線時命名為Clawdbot，由於名字跟Anthropic旗下的Claude高度相似，被Anthropic一份律師函要求改名，樑子算是結下了。

更重要的是，在OpenClaw驗證了市場對開源智能體的需求後，Anthropic隨即推出了Claude Cowork，除了安全考量之外，這也被認為是想用自家產品取代OpenClaw。

但這些都不足以解釋“封殺令”的全部，真正讓Anthropic下決心動刀的，是成本問題。

Anthropic在用戶信中提到，“第三方工具對系統造成了過大的壓力，我們必須優先保障使用我們核心產品的用戶體驗。”

外媒稱明星獨角獸Cursor曾在去年進行估算，發現每月200美元的Claude Code訂閱可能消耗高達2000美元的計算資源，說明Anthropic一直在進行鉅額補貼；也有其他分析師指出，Anthropic訂閱制實際消耗的算力成本或高達5000美元。

這意味著，大模型曾經的訂閱收費模式，在Agent時代恐怕難以跑通。

一方面，在Agent模式下，Token使用量正以幾何級增長速度膨脹。

當大模型還停留在對話層面時，單輪對話大約消耗1000-3000個Token，平臺只要統計出一個代表大部分用戶的用量均值，就可以跑通訂閱制。

但在Agent場景中，一個用戶背後可能同時跑著10個甚至100個Agent，每個Agent都在

7×24小時地執行任務，每次任務都會觸發多次模型推理，隨著交互次數不斷增多，就形成了“滾雪球式”的Token消耗，靠“少用”補貼“多用”的訂閱制也就失去了平衡。

作為參考，一個普通ChatGPT用戶即使天天聊天，月消耗也不過百萬級；而一個重度“養蝦”用戶，日均消耗Token則在3000萬-1億之間。

但另一方面，大模型企業的成本並沒有隨著用量暴增而自然下降，反而越走越高。

斯坦福大學的《2025年人工智能指數報告》指出，在高效小模型的驅動下，GPT-3.5 級別的模型推理成本已在過去兩年間下降到了原來的1/280，硬件成本每年下降 30%。

只是，推理成本雖然下降了，但訓練成本卻依然驚人。更重要的是，全球算力依然處於緊缺階段，越多用戶扎堆使用Agent，越推高了企業的運營成本。

以OpenAI為例，其對投資者表示，預計到2028年算力支出將達到1210億美元，屆時虧損可能會達到850億美元，或將超越已有上市公司的虧損記錄。

雖然Anthropic的訓練成本沒那麼高，約為OpenAI的40%左右，但當下也依然處於燒錢狀態，其自然不想再被第三方工具白薅羊毛。

（圖：OpenAI與Anthropic訓練成本對比）

02 卷Token價格是陷阱

Anthropic撐不住了，國產大模型企業又如何呢？

羅福莉可能是最能共鳴Anthropic的同行，她在社交平臺發文，稱 Claude Code大概率不賺錢，甚至可能在虧損，因為Claude Code的定價邏輯要成立，前提是用戶必須用 Anthropic 自己的框架，否則就會出問題。

她以OpenClaw作為案例，指出接入第三方框架可能帶來的問題：

“我觀察過OpenClaw的上下文管理，很糟糕。在單次用戶查詢裡，它會觸發多輪低價值工具調用，每次都是攜帶長上下文的獨立API請求，往往超過10萬Token。”

簡單來說，同一件事，OpenClaw會比Claude Code原生框架多跑幾遍，實際成本會達到訂閱價格的數十倍。在成本結構上，即便是使用OpenClaw的輕度用戶，也等同於重度用戶。

因此，低價售賣Token並對第三方開放看似對用戶友好，實則是陷阱。企業為了控制成本，只能降低算力或用更便宜的低智模型；用戶在低智模型上反覆碰壁，使用體驗也並不好。

可是，羅福莉這番發言卻是國內大模型行業中“少數的聲音”。至少在當下，大部分大廠及大模型企業還是將Token吞吐量視為衡量實力的重要指標。

全球大模型聚合路由平臺OpenRouter數據顯示，中國大模型的單週調用量已連續一個月超過海外模型，調用量位於前列的都是國產模型，比如小米、階躍星辰、Minimax等。

全球科技大廠也在推波助瀾，比如鼓勵員工多使用AI工具，Meta甚至列出了Token 消耗量排行榜，這已成為科技大廠的隱性KPI。

因此，Token之所以貴，不僅僅在於居高不下的成本，更因為這是一場暫時還看不到盡頭的消耗戰，當所有人都在拼命消耗更多Token，算力便永遠追不上被製造出來的需求。

況且，比起Token消耗到底是不是虛假繁榮這個問題，大模型企業，更難抵禦的是真金白銀的誘惑——在短短3個月裡，Anthropic的年化收入便從90億美元飆升至300 億美元。

卷Token價格或許是“陷阱”，但在全球大模型廠商“你追我趕”之際，誰都不願意先踩下“剎車”。

對於阿里、字節、騰訊等一線科技公司而言，大家圍繞AI超級入口爭奪已久，但還是無法擺脫“燒錢換流量”的互聯網打法，發紅包、增投流能激活DAU，可一旦沒有了“鈔能力”，用戶也會快速流失。

“龍蝦”則成為了新的契機。用戶完成部署後，就相當於將自己的“智能體助手”嵌入了某個雲平臺，不僅會產生源源不斷的Token消耗，個人數據也會沉澱在生態體系內，遷移成本將變得越來越高，大廠自然不會放過這個新的“生態入口”。

對於Kimi、智譜等二線廠商而言，“龍蝦”的出現帶動了算力需求，讓它們的模型能夠被調用起來，API增長也有故事可講，這足以驅動它們更賣力地銷售API。

從邏輯上來講，羅福莉對於Token的評價是對的，“價格內卷”不可能一直持續。但對於因為“龍蝦”而跑通增長敘事的大模型廠商而言，大家或許還想再“裝睡”一會兒。

03 效率比價格更重要

誰也無法叫醒一個裝睡的人，但現實或許可以——越來越高的Token消耗量並沒有帶來相應的利潤增長，這也是大模型企業無法迴避的問題。

以全面對標Anthropic的智譜為例，其在2025年交出了一份“高增長、高虧損”的成績單：全年總收入7.24億元，同比大增131.9%；全年虧損47.18億元，同比擴大59.5%。

智譜創始人張鵬曾表示，智譜要成為Anthropic的平替，甚至開玩笑稱Anthropic賣200美元，我們就賣200元人民幣。今年3月，智譜發佈了一鍵安裝的AutoClaw，個人版39元/月/3500萬Tokens，99元/月/1億Tokens，門檻確實不高。

但背後的賬單也非常沉重。2025年，智譜的研發開支為31.8億元，同比增長44.9%；沒有基礎設施的智譜，還需要給第三方算力供應商支付高額的採購費，從2022 年的1463萬元飆升至2025 年上半年的 11.45億元。

面對無法繞開兩大剛性支出——研發投入與算力成本，進入2026年以來，國內外雲廠商陸續對AI算力、存儲等相關產品進行調價，但國內模型相較於海外模型而言，依然便宜。

根據民銀證券2025年12月發佈的研報，國內大模型API平均價格約為 3.88 元/百萬 Tokens，而海外模型約為20.46 元/百萬 Tokens，是國內模型 API 價格的5倍以上。

價格優勢帶來了規模需求，在這一背景下，國內大模型廠商恐怕暫時還不會擺脫價格戰。但在Token消耗大於供給的當下，逐漸收緊免費額度和補貼也是大勢所趨。

羅福莉提到，大模型行業的出路不是更便宜的Token，而是“更高token效率的Agent框架”疊加“更強大高效的模型”，Agent時代不屬於燒算力最多的人，而是用算力最聰明的人。

這將推動大模型廠商往兩個方向發展：

一方面，從“算力規模”轉向“工程效率”的競爭，單純賣API的企業將面臨越來越近的天花板，要將模型層跟智能硬件、應用產品等深度結合起來，才能為商業模式注入更多可能性。

另一方面，推動Token收費的分層定價。當下，主流大模型的計費方式基本上涵蓋了訂閱制、按量計費以及Token Plan套餐，即超額後再按量付費。

長遠來看，Token定價除了簡單地“按量分層”，還可以按推理能力、任務數量等維度推出更精細化的付費體系，既能讓平臺緩解算力峰值的壓力，也能進一步增加收入。

比如DeepSeek悄悄上線了“快速模式”和“專家模式”兩個入口，被認為是分成模式的一種全新探索；火山引擎譚待表示，未來可能會孵化出垂直領域的智能體，按回答問題的數量收費。

當下，Token狂歡或許還會持續一段時間，但對整個大模型來說，Token成本已經成為每一個企業和用戶都無法忽視的成本因素。

說到底，大模型從來不是一門純粹的技術生意，而是一場關於效率與價值的博弈。大模型企業想做長久的生意，自然也要學會算賬，只有腳踏實地，才能更好仰望星空。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論