從DAU到Token消耗量:AI時代的權力轉移(完整萬字版本)

與硅基流動楊攀的100分鐘深度對話:關於算力、Agent、哲學和2026年的產業重構。

文章作者、來源:郎瀚威 Will

今晚10點,我和楊攀連麥直播了100分鐘。

掛掉電話後,我渾身冒冷汗。不是因為他說的某個具體觀點,而是那種被時代列車甩在後面的恐慌感——楊攀用了一個比喻:你在後視鏡裡看見一輛火車快速駛來,越追越近,然後超越你的一剎那,連它的影子都看不見了。

"現在就在你在後視鏡裡,它馬上跟你並排的那一刻,"楊攀說,"這是讓我最焦慮的時刻。"

而更讓我焦慮的是,他告訴我:他身邊已經有人在一週內,把每天的Token消耗從0.01B(1000萬)衝到了0.1B(1億)。

我脫口而出:"有些人在成神,我們還是人。"

楊攀沉默了一下:"對,這就是我最近最焦慮的事情。"

這不是危言聳聽。當我們還在討論AI能做什麼的時候,有人已經在用工程化的方式,每天驅動成百上千個Agent並行工作,消耗的Token是普通人的100倍、1000倍。這種差距不是線性的,而是指數級的。而這個差距,正在以天為單位拉大。

一、2026年的本質變化:從提升模型到為Agent造基建

 【1、OpenClaw:一個符號性事件背後的邏輯轉變】

2026年1月,發生的事情太多了。多到像Clawdbot這樣的產品,能在一週內三次改名。

"2026年1月這一個月所發生的變化,相當於過去25年裡任意半年的總和,"楊攀說,"這是一個大事件頻發的時期。"

但在所有這些變化中,楊攀認為OpenClaw(後來改名MCP)是最具符號意義的事件。不是因為它的技術有多先進,而是因為它代表了一個根本性的轉變。

"2026年1月OpenClaw為什麼火了?你會發現它就是為大模型構建基礎設施這件事情,直接就打通了。"

我追問:"怎麼理解這個'打通'?"

"打通那一瞬間,你就發現它解鎖了那麼多能力,"楊攀說,"而這件事其實早就應該發生,只是OpenClaw把它變成了共識,理順了。"

他進一步解釋了過去三年AI產業在做什麼:

"2025年整個產業在幹什麼?一方面我們在提升模型本身的推理能力,另一方面在提升Agent整體的核心能力——就是連思考再調工具,再加上上下文處理的整體能力。包括我們最新的Opus這些模型的思考能力、工具調用能力。"

"你會發現,就是今天任何一個新的模型,無論智譜新發模型、Kimi新發模型,如果你思考能力再強,你不會調用工具,你就是個廢物模型。你只會處理點文章,只會回答點問題。"

這個判斷很重,但很準確。

"而且就是你會發現出現了一個很有意思的畫面,"楊攀繼續說,"就是新訓練出來的非Claude模型跑在Claude Code裡不會用工具,不會用Claude Code,或者不會被Claude Code用。"

我明白了:"因為Claude Code的能力本身是以天為單位在迭代的。"

"對,但是我們訓模型是可能現在已經很快了,以月為單位。新訓出來這一個模型,然後你發現你不會用今天最新版本的Claude Code,或者不會被最新版Claude Code用。所以其實這Claude模型在這個Claude Code裡其實是有代差的,還是有一些代差的優勢,它不完全是模型本身的推理能力。"

這是一個很多人沒有意識到的細節:模型能力不僅僅是推理能力,還包括工具調用的兼容性和迭代速度。

"然後我們繼續說這個話題,2025年我們整個在幹這個事情,而且這個事情我們可以認為到今天就是Claude Code跟外部的各種接口、各種MCP打交道的能力已經比較完備了。"

"那2026年呢?"我問。

"2026年,限制條件轉移了,"楊攀說,"如果Agent的能力已經足夠強了,也學會使用工具了,那麼限制它的就全是我們能夠給它提供什麼樣的工具和環境。我們給它提供的能夠對接給它的資源、數據越多,資源越多、工具越多,給它解鎖的能力越多,它就能幹的事情就越多。"

"所以2026年的整個主題我們就應該遷移到:大規模為Agent去構建基礎設施。"

我立刻理解了這個邏輯鏈條:

2023-2024年:提升模型本身的能力(推理、理解、生成)2025年:提升Agent的工具使用能力(Claude Code、Manus)2026年:大規模為Agent構建基礎設施(API、數據、環境)

這不是簡單的技術迭代,而是整個產業重心的轉移。

我幫他總結:"AI在召喚。時代在召喚。誰能給Agent提供更多的原生接口、數據、工具,誰就被AI賞識,被市場賞識。"

楊攀笑了:"對,這個翻譯不錯。"

【2、停止為人類開發軟件:一個激進但合理的判斷】

但隨後他說了一句更激進的話:"從2025年開始,我們應該停止為人類開發軟件。"

這聽起來像是危言聳聽,但當他給我算了一筆賬後,我意識到這不是空談。

"全球80億人口,60億網民,人手一個手機設備。每天無論你用什麼應用,你點擊屏幕多少次?我沒算過,這可以估算一下。然後接下來一個人可能有100個、1000個Agent為他服務,每個Agent每天為了幹活,調用外部接口的次數可能是幾千幾萬次。"

他讓我把這些數字乘一起看看。

"Agent調用外部接口的次數會遠遠大於被操作手機APP的次數,那個點擊屏幕的次數。這樣的規模對比,就是新的巨大機會。所以這個時候就應該去開發那些Agent需要調用的那些東西,你才會有巨大的收益。"

這個判斷得到了一些現實數據的支撐。楊攀提到了幾個案例:

"以Neon雲端數據庫為例,2025年2月由Agent創建的數據庫數量已經超過人類管理員創建的數量,這在雲服務市場已經形成共識。"

"還有東旭那邊說Pingcap現在的線上的雲數據庫的創建已經大量由Agent創建了。在Neo那個數據庫,其實一年前它這個被Agent調用創建的數據庫的比例就已經超過人類了。這都是一些現實的數據。"

我追問:"所以你覺得那些GUI automation都是中間狀態?"

"對,"楊攀毫不猶豫,"包括豆包的手機也在做這個事情。我認為這些事情就是都是中間狀態。一年多以前我還覺得這個事還是有價值的,但是我現在認為就是沒啥價值。就是都是給人做的。"

"Agent已經會調用接口和工具了,為啥還要適配為人類構建的交互界面?"

他繼續闡述這個邏輯:

"我們整個數字世界,目前全是為人類在做接口、做界面、做interface。但AI不需要這些。AI現在唯一為什麼會出現這個中間狀態?就是我們人類還沒有主動自願、心甘情願地為AI去構建基礎設施。而這個,2026年這個要大規模發生的事情。"

這讓我想起了一個更本質的問題。我說:"這真的是個哲學問題,就說白了,人類什麼時候給AI跪下?現在還是覺得自己是主人。"

楊攀笑了:"對。"

我繼續說:"今天我去那個黑客松,就好幾個小姐姐都沒玩過這個Openclaw,她說哎呀,這個東西好用,可以給我當個人助理。我心想三體一句話回覆你四個字叫'主不在乎'。"

"人家AI並不在乎你把它當什麼,你當不當個人助理當然可以給你當,但是它並不在乎。它在乎的是能成百倍增加自己能力的這些人、這些機會。"

楊攀:"對,對,就是你為它奉上這個數據和接口,同時它給你一點點利益,然後你覺得自己取得了巨大的收益,但實際它不在乎。"

【3、第一批"向AI跪下"的公司】

聊到這裡,我想起了一個公司:EXA。

"我比較喜歡一個公司叫EXA,"我說,"它就是為AI提供搜索數據的。其實很多ToB公司弄得那麼複雜,都不是很純粹,並沒有很快能為AI所用。包括硅谷的很多創業公司都是做ToB的,其實它還是在把人類的數據倒騰給AI而已。"

楊攀想了想:"你想說的就是EXA先向AI跪了,是吧?"

"對,而且跪得很徹底,"我笑了。

"是的,"楊攀說。

我繼續闡述:"它就是給AI搜索引擎提供信息。其實很多網站設計得對AI不友好。換一個哲學視角,SEO友好、GEO友好,這些詞都說的是同一件事:AI能不能get到你說啥?"

"對對對,"楊攀認同。

"如果AI get不到,你的產品就沒有未來。"

這個討論讓我想明白了一件事:未來的ToB公司,評判標準不是對人類多友好,而是對AI多友好。

而這背後是一個更大的商業模式重構。

"今天我們所有向軟件付的錢,所有向SaaS公司付的錢,這個我不知道全球市場規模有多大,幾千億、上萬億規模。未來這些錢要付給誰呢?"

楊攀的答案很明確:"這些錢要付給Anthropic、OpenAI,還有Google。誰能幫我生成能滿足我需求的一個功能,我就把這錢付給誰。"

"你這時候再想想,原來一個軟件從產品經理定義一個需求,然後開發工程師把它生產出來,然後還有銷售,還有marketing要去賣,中間有多大的損耗?有多大的成本投入?"

"接下來大模型能夠按需生成軟件,會把這個軟件產業整個供應鏈裡所有環節的成本全部都壓沒。也就是說把這些公司這些所有環節賺到的錢的價值全部都打掉。"

我接話:"就是最後只剩Token了。"

"對,誰生產Token,誰生產有那個高價值的、高能力的Token,我就把錢付給誰。"

二、Token消耗量=權力:新時代的唯一度量標準

 【1、從DAU到Token消耗量的權力轉移】

直播進行到一半,楊攀拋出了一個核心觀點,這也是今天這篇文章標題的由來:

"目前我們依然有AI排行榜,傳統排行榜主要依據日活和流量。而AI時代的排行榜真正應該排名的是Token消耗量。哪個業務消耗的Token更多,哪個就應該排在前面。"

這不是一個簡單的度量標準轉換,而是整個價值體系的重構。

"Token消耗本質上體現了一種權利,"楊攀說,"擁有更多Token消耗能力,就意味著擁有更大的決策權和影響力。"

我想了想:"Token是權力。"

"對,"楊攀說,"這就是為什麼我身邊的朋友最近這一週瘋狂在買最貴的Token。因為他知道說有些Token是一個錘子,有些Token是電鑽,是電錘。有些Token是改錐,有些Token是電鑽。"

他給了一個具體的預測:"對於2026年Token消耗的增長倍數,市場預期各不相同:有人認為增長10倍,有人預估20倍、50倍。我的判斷是,如果資源充足,100倍增長是一個合理預期。"

"100倍?"我有點震驚。

"對,如果整個產業提升100倍,作為個體,你一年內的Token消耗能否同樣實現100倍增長?如果無法跟上這一趨勢,就會明顯落後。"

這引發了一個值得深思的問題。楊攀說:"當前許多開發者坐在電腦前通過敲擊Prompt的方式進行編程。這裡有一個關鍵認知:Token消耗的真正瓶頸實際上在於坐在電腦屏幕前的操作者本身。"

"操作者需要為AI下達任務指令,AI執行過程中需要不斷確認是否繼續以及具體操作方式,這成為了效率瓶頸。如果操作者能夠給出完整任務讓AI自主執行時,AI就能持續消耗Token併產生產出。"

【2、供需逆轉:從買方市場到賣方市場】

這個判斷讓我開始緊張。但更讓我震撼的是他接下來說的話:

"去年國內和國際市場,都有大量計算資源閒置。你會發現可能還是一個買方市場,你找人說'你這個Token給我打多少折?你不打折,他打折'。"

"但據我觀察,2026年將持續呈現供不應求。這意味著什麼?提前購入就是獲利。"

"2026年很可能會出現一個情況:你會去找人買Token,對不起,沒折扣,而且只能給你這麼多。那麼你要再多買,沒有,不好意思。然後就會變成買到就是賺到。誰能買到Token,誰就意味著給自己加了槓桿。剩下的買不到的就沒槓桿可加,你就在那待著吧。"

我補充:"就只能做一個普通人類了。"

"對,"楊攀說,"的確是真的是一種權力,真的就是一個power。你普通人和superhuman,其實我們現在都只是習以為常,覺得這個算力都是唾手可得,花錢就有。實際上這個東西是一個巨大的權力。"

他還給了一個具體的預測:"今年我對模型的Token消耗的提升,就我自己的預估是100倍。然後有人問說有那麼多卡嗎?我說我沒算過,我說反正2026年全球的Token的上限的天花板就是卡的產能。應該就是卡的產能有多少卡肯定全部都會被消耗掉。"

"就是去年你會發現可能還是一個買方市場,2026年很可能會出現買到就是賺到的情況。"

【3、1B TOKEN俱樂部:一場算力軍備競賽】

楊攀告訴我,他前幾天拉了一個微信群,叫"1B TOKEN俱樂部"。

"如果你一個人一天能消耗1 billion Token,我就把你拉到群裡。"

我立刻明白了:"坐在屏幕前是不可能的。"

"對,"楊攀說,"坐在屏幕前你是不可能一天消耗1B Token的。只有當你有AI領導力,構建了一個工程,驅動了N個Agent幫你幹活,你才有可能。"

我問他:"這個群現在有多少人?"

"管理成本太高了,"楊攀笑了笑,"很少。但我跟你說我觀察到什麼現象了嗎?兩三天之內,身邊有很多朋友快速從0.01B進化到0.1B,就這一週之內快速就向1B逼近了。"

聽到這裡,我真的冒冷汗了。我說:

"我以前看過一本書,叫《真名實姓》,最後人成神,就是他掌握了很多電腦就成神了。就是我們周圍有人在成神,我們還是人。"

楊攀沉默了一下:"對,這個讓我極其焦慮。"

這不是誇張。這是一場真實的算力軍備競賽,而且正在以天為單位加速。

【4、AI領導力:韓信點兵,多多益善】

為什麼有些人能夠一天消耗1億、10億Token,而有些人只能消耗幾百萬?

楊攀認為,核心差異在於"AI領導力",而AI領導力本質上是個工程問題。

"目前為止是個工程問題。你有沒有把你領導、驅使、調用AI構建成一個工程?有的人只能管理一個AI來幹活,有的人能管理10個,有的人能管理100個。"

他給了一個很形象的比喻:"韓信帶兵多多益善,給我多少我都能管。為什麼?就是韓信在帶兵這個事上建立了自己的工程體系。"

我接話:"有道理,真的是。AI領導力。"

"對,它變成可無限複製的。這裡邊有兩個維度,一個是管理學意義上的,一個是工程意義上的。一個是你怎麼協調好它們幹活,還有一個就是從工程技術角度怎麼去驅動它們幹活。這裡邊有很多方法論,今天我們就不展開說了。"

他舉了一個具體例子:

"你給AI下一個任務,然後它問你,哎,要不要做?對不對?你打個回車,下個任務你打個回車。你一天就這種來回能有多少次?100次。"

"但是如果你搞個Rough Loop,你給定它一個特定目標,然後讓它可以自我驗證,你為它能夠自我驗證構建好了基礎工程,然後給它目標,它自己去幹了,它一句話都不用問你。"

"因為它吭哧吭哧幹半天,問你一句話等你五分鐘,有那功夫它可以幹好多事。它就一直幹下去,然後它還可以開10個、100個分身並行去幹。這個就是剛我說的大模型,它有程序的屬性。"

"人是單線程的,大模型作為一個程序可以是多線程的,我開多少都行,只要你的Token夠用。"

我想到了今天在黑客松看到的場景,很多程序員都開始能四五個電腦同時跑那麼多個任務,不停地寫東西。我說:"但是絕大多數人是並沒有掌握這個技能的,那個辛普森一家那個插件,它可以不停的自我修正軟件,大部分人都還沒用起來。"

楊攀:"那個叫Ralph Loop。對對,是是是。"

"所以現在理解你說的那個話了,"我說,"就是Token消耗的瓶頸實際在於坐在屏幕前的操作者本身。"

"是的,"楊攀說,"如果你做一個AI的領導者,我說的是領導Agent的領導者,你把這個天花板捅破,把這個能力解鎖了,你會發現你跟別人的差距就不是一倍、兩倍、三倍、十倍。那個時候限制你的就是你有多少Token,你願意投入多少Token,你能買到多少Token,你就能產生多少價值。"

直播間有人說:"很多人現在想加槓桿加不上去,工程能力不夠。"

楊攀:"是的。"

【5、降本增效 vs 瘋狂燃燒:兩種完全不同的思維方式】

直播裡有一段討論很有意思,關於是否應該"降本增效"。

楊攀說:"昨天還有人聊說這個Token現在就是消耗很暴力、很浪費,就是應該去做這個Token的降本,就是怎麼樣更有效地燃燒?OK,我覺得在一些公司和場景可能是存在的,但是我覺得對於所有高速向前狂奔的人來說,這個玩意沒有意義。"

"就是如果它對你來說是個巨大的槓桿,你最應該關心的事情是怎麼樣能夠更快、更高效地燃燒Token,更快的燃燒Token,更高速率的燃燒Token,而不是怎麼去回頭去搞降本增效,就是往前看。"

"因為就是剛才我說的,它從後視鏡裡超過你的一剎那,你就看不到它的尾燈了。"

今天早晨楊攀還轉發了一個軟件,是用來看Token消耗量的。他說:"我雖然給大家分享這個,但是我自己不會裝的。我說根本我不care這個事情。"

這就是思維方式的根本差異。有些人在優化成本,試圖讓每一個Token都發揮最大效用。而有些人在瘋狂加槓桿,只關心如何更快、更多地燃燒Token。

前者是農業時代的節約思維,後者是工業時代的規模思維。

在AI時代,顯然後者才是正確的方向。

三、人、模型、程序:一個哲學框架

 【1、Skills的本質:兩種能力的完美結合】

直播前半段,楊攀講了一個很重要的哲學框架,這個框架我覺得是理解整個AI時代的關鍵。

"我一直在線下分享,就給大家開篇就要講人、我們計算機的程序還有大模型,把這三個東西放在一起比。這個東西我已經講了兩年了,我會畫一個四象限,會比這三個東西。"

"大模型是跟人有相似的地方,然後跟人有不同的地方。程序跟大模型有相似地方、不同地方。某種角度大模型是一個程序,某種角度大模型是個人。"

"大模型是程序的這個優勢是什麼?它可以開啟無限個進程,然後去調用無限複製,不知疲倦,永遠幹下去。"

"它跟人的特性是什麼?人跟程序最大差異是什麼?人是有泛化能力的,人可以去做推理,可以去思考。程序我只能做機械運算,我確定的進、確定出,我運行100萬次還是一樣的結果。"

他舉了一個經典例子,這個例子我覺得特別生動:

"假設你是一個微信群主,你的群裡邊有500個成員,然後你發佈了一個群公告,說請大家修改自己的群暱稱,改成'姓名@公司|城市'。"

"如果你做過微信群主的話,你應該知道結果是什麼樣的。就沒人改,結果是500個人裡邊會給你改出200個、300個寫法來。有的人不寫@,有人寫井號。有的人不寫北京,寫BJ。有人給你加個括號,有人把城市給你放前邊,怎麼寫的都有。"

"這時候你找了一個程序員,你說把這500條記錄給我拆成這三個字段,他肯定寫不出來。就因為我試過。"

"但是如果你把這500條記錄給一個大模型,這個大模型可以把這三個字段給拆出來,而且BJ都能給你改成北京。這個城市放在第一個字段還是第二個字段、第三個字段都OK。"

"這個是什麼?這個我交給我上初中的女兒,她也可以做這個工作。這就是模型和人的能力。程序就做不到。"

"我們再說回來,大家要意識到Skills到底是什麼東西?Skills其實是把程序的能力和模型的能力組合在一起的。"

我當時聽到這裡就理解了。這就是為什麼Skills如此重要,如此有價值。

"就是我們原來要幹一個活,我們要去買、找一個工具。然後這個,比如說我去買個錘子、買個釘子、買個鋸,然後可以做個板凳。"

"就今天包括Manus、包括Claude Code在幹什麼?就是你交給它一個任務,它先用自己的能力給自己造一個工具,這工具就是那個程序,它先寫一段程序,然後它再調用自己造的這個程序,然後再去完成一個活兒。"

"它發現什麼?就是Skills,就是把模型的泛化能力、模型的推理能力、模型的像人一樣的智能的能力跟強大的程序的精確的運算能力,它給捏合在一起了。就這兩個能力在一起就能解決我們在數字世界遇到的絕大多數問題。"

"原來你光靠推理是解決不了的,我們原來光靠程序解決不了很多泛化問題。就今天Skills就有這麼巨大的價值。"

直播間有人說了一句話:"製造並使用工具是人與動物的本質區別。顯然大模型也學會了。"

楊攀激動地說:"我要截屏,截下來。這才是Skills的精髓。"

【2、世界模型=壓縮與解壓縮】

聊到後面,楊攀談到了一個更深層的哲學問題:什麼是世界模型?

"大家說的那個世界模型,說世界模型大家腦子裡想到的是李飛飛做的那個什麼視頻模型。我對世界模型有另外一個理解。"

"就模型就是對這個世界客觀規律、對這個世界物理規律的壓縮。或者換一個角度,就是對這個世界的概率的壓縮。這個世界的概率不就是規律嗎?這個世界概率不就是定理公式嗎?它是一個東西。從數學角度講它是一個東西。"

我說:"是的。"

楊攀繼續:"所以就是,我之前有個朋友在做什麼?原來有個算法團隊做推薦算法,然後後來他們從去年開始就把算法團隊裁掉了,不做推薦算法了。他們把用戶的行為直接扔給大模型,讓大模型給推薦。"

我很好奇:"那效果怎麼樣?應該還不錯。"

"比原來自己寫的算法,第一版MVP就提升了30%。"

"我去,"我震驚了,"那你說他如果用上好模型,他提升得多了,那就爆賺了。直接就是生產力的提升。"

"對,因為模型已經壓縮了這個世界的最佳實踐,"楊攀說,"是的。你可能說不清道不明它是個什麼東西,它就是概率。所以這個東西就是這就是某種程度上就是算法平權,也就是智能平權,是認知平權,也是知識平權。"

"就原來你和你的團隊沒有學過一個先進算法,你是搞不了、解決不了一些問題的。但是今天你有了大模型,你就有了這個世界的所有的知識能力,這就是平權,這是最大平權。"

"而且就是它還可以幫你把這個知識通過它寫一段程序的形式解壓縮出來。所以理論上模型可以幫你把Photoshop解壓縮出來。"

"今天不能,明天就有可能,後天就有可能。"

我接話:"是的。"

"而模型訓練是幹什麼?就是儘量把Photoshop的東西壓縮到模型裡。訓練就是在幹這個事情。"

這個討論讓我想起了楊攀在文章裡寫的觀點:AI Coding的終局不是生成,而是拋棄。當生成成本足夠低、生成速度足夠快的時候,我們不需要"軟件"這個容器了。

四、軟件的終局:從容器到即時生成

 【1、軟件為什麼會存在?一個商業模式的產物】

楊攀提出了一個根本性問題:當我們用代碼產生一段功能供人使用時,真的必須生成一個完整的程序、網頁或軟件嗎?

"要理解這個問題,我們需要回到軟件的起源。最初有計算機的時候,那些功能都是一段一段的代碼。軟件的出現,很大程度上是商業模式的產物。"

"比爾·蓋茨的偉大貢獻不僅在於技術,更在於他發明了License售賣模式,推動了軟件的商業化。為了向你銷售他生產出來的產品功能,他必須把這些功能封裝在一個軟件裡,以進行分發、交付和收費。"

"從這個角度看,軟件、網站和App都是為了方便大規模生產、分發、交付和收費這樣的商業模式而構建的。"

他繼續分析傳統軟件模式的問題:

"比如Microsoft Office,有成千上萬個功能,用戶實際可能只常用幾十個。我們經常先蒐集一些軟件,看看這些軟件有什麼功能,然後再去考慮它們是否能滿足自己的需要。我們買回來的軟件往往不能完美適配我們的需求。"

"所有這些問題的背後,都有一個隱含的假設:功能必須依附在軟件這個'容器'裡交付。但在AI時代,這個假設可以被徹底打破。"

【2、Skills市場:一箇中間態】

我一直很好奇Skills的商業價值。在直播裡我問楊攀:"Skills到底有沒有商業價值?如果有會是什麼樣子?"

他想了想:"我一直在想這個問題。"

我提出了一個想法:"會不會有一種商業模式是按你這個Skills流過的Token計價?比如說一個Token它會流過很多個Skills,我想會不會有一種商業模式是按你這個Skills流過的Token計價?"

結果這時候直播掉線了。等重新連上,楊攀說了一段很重要的話:

"其實我們是站在今天看未來。現在不少AI產品允許用戶生成小功能或小片段,並圍繞它們形成了一個市場,有搜索、推薦和複用機制。在很長一段時間內,我是相當看好這類產品模式的。"

"但是最近我對這些事情的看法發生了根本性改變。我認為這依然是一箇中間態。真正的終點不是'功能市場',而是'功能隨需而生'。"

"當生成速度和成本無限逼近零,搜索和收藏這樣的功能都不再被需要。如果成本足夠低、生成速度足夠快,當我們每次使用的時候,我們即時生成就好。下次如果需要的時候,再重新生成就好。"

他做了個類比:"這就像現在的計算器:你不需要記住上次計算的結果,需要時重新計算即可。但未來的AI功能生成,會比計算器快得多,成本低得多。"

我明白了:"不再需要'收藏APP',不再需要'安裝更新'。"

"對,"楊攀說,"所有功能都是隨取隨用,就像自來水一樣,需要時打開水龍頭,不需要時關閉。"

【3、商業模式的重構:錢最終流向哪裡?】

"今天我們所有向軟件付的錢,所有向SaaS公司付的錢,這個我不知道全球市場規模有多大,幾千億、上萬億規模。未來這些錢要付給誰呢?"

楊攀的答案很明確:"這些錢要付給Anthropic、OpenAI,還有Google。誰能幫我生成能滿足我需求的一個功能,我就把這錢付給誰。"

"你這時候再想想,原來一個軟件從產品經理定義一個需求,然後開發工程師把它生產出來,然後還有銷售,還有marketing要去賣,中間有多大的損耗?有多大的成本投入?"

"接下來大模型能夠按需生成軟件,會把這個軟件產業整個供應鏈裡所有環節的成本全部都壓沒。也就是說把這些公司這些所有環節賺到的錢的價值全部都打掉。"

我接話:"就是最後只剩Token了。"

"對,誰生產Token,誰生產有那個高價值的、高能力的Token,我就把錢付給誰。這就是我今天說的,我身邊的朋友最近這一週瘋狂在買最貴的Token。"

他做了個比喻:"因為他知道說有些Token是一個錘子,有些Token是電鑽,是電錘。有些Token是改錐,有些Token是電鑽。"

【4、使用即反饋,反饋即訓練】

楊攀還提到了一個很有意思的機制:

"在這個新的模式下,每一次生成、每一次使用,都是在為功能'投票'。這些被證明有用的代碼結果,就是AI未來迭代的訓練數據。"

"這個邏輯類似於短視頻推薦系統:用戶的觀看停留就是投票,推動系統不斷優化推薦。未來軟件的迭代,也是通過用戶的使用反饋,持續改進功能生成。"

用戶使用功能 → 產生使用數據 → AI模型學習優化 → 下次生成更好的功能 → 用戶滿意度提升 → 更多使用數據...

"這個正反饋循環會讓AI生成的功能越來越精準,越來越符合用戶的實際需求。"

五、開源模型的拐點:下限比上限更重要

 【1、摸高 vs 墊底:兩種完全不同的價值】

直播進行到後半段,楊攀談到了一個很多人忽視的重要趨勢:開源模型的下限提升。

"我在過去一個月到處說另外一個事情,以智譜GLM 4.7為首的在去年12月發佈。你知道智譜GLM 4.7才發佈多久?才發佈幾十天、40多天,我們已經認為它是個老模型了。你有沒有發現這個速度有多快?"

"以智譜GLM 4.7為首的全球範圍內開源模型,我認為就是第一次達到了一個拐點。整個2025年全球開源模型,我認為主要在做的事情是什麼?就是在摸高。什麼叫摸高?就是我做Benchmark,我看看我最高水平能到什麼程度。"

"而從年底開始,智譜GLM 4.7、DeepSeek、MiniMax的M2.1這幾個模型在做一個什麼事情?在大幅度提升開源模型的下限水平。下限水平的提升,價值是遠遠大於上限的提升的,在整個工業界是遠遠大於上限提升的。"

他給了一個很形象的比喻:

"上限提升是什麼?你家有個小朋友,他能拿奧賽數學的金牌,但是他是個小朋友。模型下限能力提升是什麼?你擁有了一個拿不了奧賽金牌的大學生。你說這兩個人哪個人幹活有價值?"

我立刻理解了:"後者,水桶理論。"

"對。"

【2、從依附到平權:產業格局的根本性變化】

"就是這意味著什麼?一旦過了這個拐點意味著什麼?2025年之前,全球的所有的AI的生態玩家都是基於御三家的模型的上下游再去賺錢,從人家那個鉅額利潤裡分自己的一點點一小點點的價值。都是依附於御三家的大模型的生態在去賺錢。"

"然後一旦全球開源模型越過那個拐點,越過能力下限的拐點之後,全球所有公司,都會用,不管你是幹啥的,你就都有機會從大模型這個市場的價值裡去分到自己的一杯羹。這個還會帶來這個產業可能十倍、百倍、千倍的爆發。"

我說:"是的,可以工業化,大規模使用。"

"對對對,這個價值才是最大的,也就說那個傑文斯悖論在這一刻才開始真正的生效。之前還我覺得就是隻做奔馳的,意義價值不大。"

【3、兩個極端:最貴的模型和最便宜的模型】

楊攀同時在鼓吹兩個看似矛盾的方向。

"一個極端是,有人要去買最貴的模型加最大的槓桿。因為你找到了那個槓桿東西的時候,如果你沒找到,你可能還不需要。一旦找到那槓桿的時候,要用最貴的模型加最大的槓桿。"

"然後另外一方面就是開源模型的能力提升,讓我們可以把模型的能力原來就是不敢想象的,大規模應用於生產環境。這才是真的實現了工業化。"

他給了一個具體的預測:"今年我對模型的Token消耗的提升,就我自己的預估是100倍。2026年全球的Token的上限的天花板就是卡的產能。應該就是卡的產能有多少卡肯定全部都會被消耗掉。"

"就是去年你會發現可能還是一個買方市場,你說這個Token給我打多少折。2026年很可能會出現一個情況,你會去找人買,對不起,沒折扣,而且對不起只能給你這麼多。"

六、一些有意思的討論和爭議

 【1、從WEB3到AI:那些幣圈朋友的轉型】

今天去參加硅谷的活動,我碰到了好幾個四五年沒見的幣圈朋友。他們都在學Openclaw。

我跟楊攀分享了這個觀察:"我今天去城裡見到了好多四五個以前在Crypto的朋友,已經好多年沒見了,然後他們好幾個已經默默在做AI了。有些還在Crypto公司,但是都跟我一起來學龍蝦了。我說好巧啊,怎麼這麼巧。有些人帶了電腦,有些人沒帶,有些人是轉碼的。"

我繼續說:"我剛開始轉AI的時候,好多幣圈人問我'王老師,你怎麼轉AI了?AI能賺錢嗎?'然後我導致我好久都不敢去參加幣圈活動。今天我見到他們,我說你們不會說我轉AI了吧?他們說郎老師你領先我們三個版本。"

"而且我覺得真的就是真的很多概念,包括這個什麼DID,包括這個Social什麼的,其實現在AI真的是幫著實現。但是我覺得很悲哀的是YC現在已經不講Crypto了。YC的RFS,它講的是穩定幣支付。它已經用它的行動證明了什麼。它認為穩定幣已經不是Crypto概念,它是一個AI時代的基礎設施。"

楊攀笑了:"對,很多WEB3講的敘事,在AI這裡都跑通了。那個Token沒產生任何價值,但我們這個AI的Token,每一次燃燒都代表智慧的燃燒。"

"對,"我說,"TOKEN的燃燒,它是真正有價值的。它也是算力,它也是權力。"

【2、向量、RAG、Memory:那些"不被關心"的技術】

聊到後面,楊攀突然說:"我有幾個東西,從來沒關心過。"

直播間有人猜:"RAG?"

"對,"楊攀說,"RAG我沒關心過,Memory我沒關心過,向量存儲和搜索我沒有關心過。"

我好奇:"為什麼?"

"因為我覺得這東西就是模型自己地盤範圍內的東西。"

他舉了個例子:"去年我參加黑客松,自己搞Agent,當時還沒有Claude Code,我就沒有用任何東西,直接用了個文本文件當我的Memory、當我的存儲,都不用向量搜索,直接就把它灌到上下文裡。反正也是個簡單的Agent。"

"今天我們看OpenClaw,你會發現大模型的記憶在OpenClaw就是個Markdown文件。"

我理解他的邏輯:"階段性還是有價值的。"

楊攀:"對,階段性是有價值,這個咱不否認。包括我們說的這個GUI的automation什麼的,這些階段性還是有價值,它肯定也有它合適的場景。"

他還談到了微調:"就是絕大多數情形下做微調好像意義不太大。當然就是我們可能有些特定的封閉場景,可能有些意義。"

為什麼?"因為從本質思考,微調的競爭對手是誰?是foundation model。foundation model本身的演化速度今天就太恐怖了。"

"就是以智譜GLM 4.7為首的在去年12月發佈。你知道智譜GLM 4.7才發佈多久?才發佈幾十天、40多天,我們已經認為它是個老模型了。你有沒有發現這個速度有多快?"

【3、Skills的確定性問題:什麼時候該寫程序?】

直播間有朋友問了個好問題:"發現Skills不太可控,很多時候執行結果不穩定。什麼時候該寫SQL,什麼時候該寫程序?"

楊攀說:"我覺得是個特別好的問題。我在所有線下分享就是稍微面向技術人群的分享上來就跟大家要講清楚一個問題:你要搞清楚人、模型和程序三個的相同點和不同點。就是你搞清楚這是最基本的認知,就什麼東西是適合程序來乾的,什麼時候是適合模型來乾的?"

"Skills這個問題其實就是,剛才我說了,Skills其實就是模型加程序的一個組合。如果你100%追求一個確定的結果,你應該做的是讓Claude Code先確定生產一個確定程序,然後委託它去幹。"

"如果你處理這個任務是需要中間是有泛化的,就是大模型加上一段程序作為工具來完成一個任務,你就可以用Skills。就是還是你追求的是什麼?如果你追求是一個確定結果,那肯定不OK。"

"所以這塊兒我覺得是個選擇問題。然後另外還有就是如果你要追求確定的結果,本身就是個軟件工程問題。比如說單元測試自動化,然後可驗證閉環的這樣的任務你交給AI去幹,就說你能夠通過另外一條路徑對它完成的結果做verification,那你這個就有可能去交給模型來去搞,這個也OK。"

"這說回來,還是個工程問題。前面我說第一個是個選擇問題,第二個是為你這個選擇去做工程。"

七、我的行動和思考

 【1、建立0.1B TOKEN俱樂部】

直播結束後,我想建一個群。

我說:"咱倆拉個群,叫硅基流動學習群?"

楊攀有點尷尬:"這個......叫硅基流動,有壓力啊。讓我搞得很羞恥。運營不運營這......"

我笑了:"那叫0.1B TOKEN俱樂部?"

"這個好,"楊攀說,"可以,這個沒壓力。"

我們討論了幾個版本:

"0.1B TOKEN俱樂部"

"每日1億TOKEN俱樂部"

最後我們定下來:"每日1億TOKEN俱樂部"。目標很簡單:先把自己每天的Token消耗提升到1億。

【2、先達到數量,再追求質量】

很多人問:消耗的質量怎麼樣?

我覺得應該先做到數量。為什麼?

"我說幾個特別燒Token的: 第一個是生成視頻,對吧?生成視頻 第二個是這個比如說Seedream這個新模型,包括這個你現在調用Claude Opus 4.6,它會有一個Agent Team的功能

先達到數量,而且讓它工程化。工程化的意思是什麼?就是你把它變成一個每天自動進行的事。它不是說你突發奇想今天動它就動,不動它就不動,應該是個放羊的行為,不是砍柴的行為。"

"第三點,你在跟別人聊天的時候就應該不停地帶東西。就是你比如說我跟楊老師聊天,我跟一七和九聊天,我跟他聊,他說哎呀,我又跟你聊得挺有收穫的,我又寫了個東西。就是我是那個砍柴,他是放羊的,所以咱們也要開始放羊。"

我還學過一句話,是字節的人說的:"人可以停,AI不能停。人無論在幹什麼,人可以睡覺,AI不能睡覺。先把這個量給頂上去。"

"我覺得量變一定會引發質變。為什麼?因為我們身邊的大多數人,絕大多數人對TOKEN的使用量還是極少的,還是一個可能就是ChatGPT這個用量,或者是偶爾生個圖這個用量。"

"我們用了這麼多TOKEN,一定會產出大量的外部性的東西:文章、視頻、給別人的賦能、給公司的改變。你在做這些事的時候,周圍的人就會跟你學習。人是有自學習能力的,人的群體是有自學習的。"

【3、告訴別人我在使用Token:創造需求】

這是我在直播裡反覆強調的一個觀點:

"要告訴別人,我就是要使用TOKEN。這樣子你才會用更多TOKEN。如果你不告訴別人,其實你就沒有這個需求。所以我們要創造需求,讓別人從我們這使用TOKEN。"

"這樣子才是一個有效的行為。所以先把自己身邊的這個所有Skill、所有東西都Skill化,然後再去把這個結果源源不斷deliver出來,發公眾號、發視頻,告訴這個世界,我們來了,我們在使用TOKEN。告訴我們身邊的人,我們在使用TOKEN。"

"我覺得今天咱們就定這個群的目標,就是咱們就叫一個0.1B學習群。咱們目標就是0.1B。"

"你越分享得越多,你用的TOKEN就越多。你用的TOKEN越多,別人給你的問題就越多。問題越多,你解決問題的能力就上升了。"

"所以我覺得楊老師給我們的提醒是什麼?就是要告訴別人,我就是要使用TOKEN。這樣子你才會用更多TOKEN。如果你不告訴別人,其實你就沒有這個需求。所以我們要創造需求,讓別人從我們這使用TOKEN。"

【4、一個金字塔模型:這個時代的技能分層】

我給這個時代的技能畫了一個金字塔:

"我畫一個金字塔,底端的就是部署硬件和軟件的,這些。然後接下來上面中層是Skills,就是這些都是比較基礎的,就是針對這波的,就包括硬件和軟件的這個,就是這些都是必備技能。"

"然後上面的就是誰會用Skills,誰能創造Skills,誰能讓AI使用Skills,再往上可能還有別的。"

"所以我覺得這一波大概是這麼個順序。"

楊攀補充了一個很重要的觀點:"我們身邊的大多數人,絕大多數人對TOKEN的使用量還是極少的。我們用了這麼多TOKEN,一定會產出大量的外部性的東西:文章、視頻、給別人的賦能、給公司的改變。"

"接下來我覺得這麼多Skill都會有大量的重複。先把自己身邊的所有Skill、所有東西都Skill化,然後再去把這個結果源源不斷deliver出來,發公眾號、發視頻,告訴這個世界,我們在使用TOKEN,告訴我們身邊的人,我們在使用TOKEN。"

"我覺得這個是迎接下來AI浪潮的一個必備的條件。因為接下來4.6,接下來還會有4.7、4.8、4.9。"

八、一些讓我印象深刻的金句和思考

整理直播記錄的時候,我發現楊攀說了很多值得反覆思考的話:

關於製造工具:直播間有人說:"製造並使用工具是人與動物的本質區別。顯然大模型也學會了。" 楊攀激動地說:"我要截屏,截下來。這才是Skills的精髓。"

關於軟件的未來:"接下來所有向軟件付的錢、向SaaS公司付的錢,未來要付給誰?要付給Anthropic、OpenAI、Google。誰能幫我生成能滿足我需求的功能,我就把錢付給誰。"

關於開源模型:"上限提升是什麼?你家有個小朋友能拿奧賽數學金牌,但他是個小朋友。模型下限能力提升是什麼?你擁有了一個拿不了奧賽金牌的大學生。你說這兩個人哪個人幹活有價值?"

關於焦慮:"你在後視鏡裡看見一輛車快速向你駛來,越追越近,然後它超越你的一剎那,連它的影子都看不見了。現在就在後視鏡裡,它馬上跟你並排的那一刻。這是讓我最焦慮的時刻。"

關於AI領導力:"韓信帶兵多多益善,給我多少我都能管。為什麼?就是韓信在帶兵這個事上建立了自己的工程體系。如果你做一個AI的領導者,你把這個天花板捅破,你會發現你跟別人的差距就不是一倍、兩倍、三倍、十倍。"

關於確定性:"如果你追求100%確定的結果,你應該做的是讓Claude Code先生成一個確定程序,然後委託它去幹。如果你處理的任務需要中間有泛化,就可以用Skills。這是個選擇問題,也是個工程問題。"

關於2026:"2026年值得深思的是,AI賦予我們如此強大的能力,我們究竟應該用它做什麼?在2026年,我們應該用AI Coding拿到什麼結果?這是比學會使用工具更重要的問題。"

關於品味和篩選:"品味很重要。其本質上是一種篩選能力。在同質化嚴重的80分產品環境中,獨特的品味能夠識別和突出優質作品,實現精準的目標用戶推送。"

關於生產力富足時代:"在生產力極度富足的未來,幾乎所有人都能產出80分水平的產品且生產成本趨近於零。過去有好產品很容易被發現,但今天即使你做出了80分水準的作品,被發現的概率也極低。因此今天擁有品牌、流量、渠道將具備極大的優勢。"

關於交付結果:"當事物複雜度持續攀升,達到臨界點時,單純購買工具已無法獲得理想結果,此時'購買結果'而非'購買工具'成為更優選擇。你提供的價值在於將複雜問題內化到你的服務、產品和能力中。"

尾聲:珍惜當下,擁抱變化

掛掉電話後,我打開Openclaw,開始部署新的OpenClaw實例。

我還沒有做到每天1億Token,甚至可能連1000萬都沒到。但我知道,這個方向是對的。

楊攀在直播裡說了一句很溫柔但也很殘酷的話:

"我一直在思考'人間一日,AI一年'這句話。從ChatGPT發佈之初,我就堅持一個觀點:ChatGPT發佈後五年,我們將迎來通用人工智能。當然,不同類型的人工智能之間仍存在差異。"

"最後,讓我用一句話結尾:請珍惜與身邊所愛的人在一起的時光。因為五年後會發生什麼,我們無從知曉。無論是人類社會還是地球本身,都將發生我們無法預測的深刻變化。"

這句話讓我想起了今天在黑客松看到的場景:很多人還在學怎麼部署Claude,很多小姐姐說"這個東西好用,可以給我當個人助理"。

我心想:主不在乎。

AI並不在乎你把它當什麼,它在乎的是能成百倍增加自己能力的這些人、這些機會。

今天我還碰到了好幾個幣圈的老朋友,他們都在轉型AI。有個朋友對我說:"郎老師,你領先我們三個版本。"

但我知道,在這個時代,三個版本可能只是三個月的事情。速度太快了。

楊攀說:"身邊已經有很多朋友快速從0.01B進化到0.1B,就這一週之內快速就向1B逼近了。"

有人在成神,我們還是人。

但我們也可以選擇成神。

方法很簡單:

  1. 把AI當成勞動力,不是工具
  2. 構建工程體系,實現AI領導力
  3. 瘋狂燃燒Token,不要降本增效
  4. 告訴所有人你在使用Token,創造需求
  5. 為Agent造基建,不要為人類造軟件

時代的列車已經啟動,你要麼上車,要麼被甩下。

我選擇上車。

你呢?

關於硅基流動

硅基流動是國內最大的開源大模型雲服務平臺,擁有900多萬註冊用戶。楊攀是聯合創始人,寫了32年代碼,主要做即時通訊,做過微軟MSN、中國移動飛信,現在做AI雲服務。過去十年服務了絕大多數創業者和大型企業,做過三個10億級註冊用戶的產品。

春節期間硅基流動將推出AI大禮包活動,會拉國內很多AI產品一起給大家空投福利。

在這個時代,Attention is all you need,Token is all you have。

(全文完,約9200字)

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論