与硅基流动杨攀的100分钟深度对话:关于算力、Agent、哲学和2026年的产业重构。
文章作者、来源:郎瀚威 Will
今晚10点,我和杨攀连麦直播了100分钟。
挂掉电话后,我浑身冒冷汗。不是因为他说的某个具体观点,而是那种被时代列车甩在后面的恐慌感——杨攀用了一个比喻:你在后视镜里看见一辆火车快速驶来,越追越近,然后超越你的一刹那,连它的影子都看不见了。
"现在就在你在后视镜里,它马上跟你并排的那一刻,"杨攀说,"这是让我最焦虑的时刻。"
而更让我焦虑的是,他告诉我:他身边已经有人在一周内,把每天的Token消耗从0.01B(1000万)冲到了0.1B(1亿)。
我脱口而出:"有些人在成神,我们还是人。"
杨攀沉默了一下:"对,这就是我最近最焦虑的事情。"
这不是危言耸听。当我们还在讨论AI能做什么的时候,有人已经在用工程化的方式,每天驱动成百上千个Agent并行工作,消耗的Token是普通人的100倍、1000倍。这种差距不是线性的,而是指数级的。而这个差距,正在以天为单位拉大。
一、2026年的本质变化:从提升模型到为Agent造基建
【1、OpenClaw:一个符号性事件背后的逻辑转变】
2026年1月,发生的事情太多了。多到像Clawdbot这样的产品,能在一周内三次改名。
"2026年1月这一个月所发生的变化,相当于过去25年里任意半年的总和,"杨攀说,"这是一个大事件频发的时期。"
但在所有这些变化中,杨攀认为OpenClaw(后来改名MCP)是最具符号意义的事件。不是因为它的技术有多先进,而是因为它代表了一个根本性的转变。
"2026年1月OpenClaw为什么火了?你会发现它就是为大模型构建基础设施这件事情,直接就打通了。"
我追问:"怎么理解这个'打通'?"
"打通那一瞬间,你就发现它解锁了那么多能力,"杨攀说,"而这件事其实早就应该发生,只是OpenClaw把它变成了共识,理顺了。"
他进一步解释了过去三年AI产业在做什么:
"2025年整个产业在干什么?一方面我们在提升模型本身的推理能力,另一方面在提升Agent整体的核心能力——就是连思考再调工具,再加上上下文处理的整体能力。包括我们最新的Opus这些模型的思考能力、工具调用能力。"
"你会发现,就是今天任何一个新的模型,无论智谱新发模型、Kimi新发模型,如果你思考能力再强,你不会调用工具,你就是个废物模型。你只会处理点文章,只会回答点问题。"
这个判断很重,但很准确。
"而且就是你会发现出现了一个很有意思的画面,"杨攀继续说,"就是新训练出来的非Claude模型跑在Claude Code里不会用工具,不会用Claude Code,或者不会被Claude Code用。"
我明白了:"因为Claude Code的能力本身是以天为单位在迭代的。"
"对,但是我们训模型是可能现在已经很快了,以月为单位。新训出来这一个模型,然后你发现你不会用今天最新版本的Claude Code,或者不会被最新版Claude Code用。所以其实这Claude模型在这个Claude Code里其实是有代差的,还是有一些代差的优势,它不完全是模型本身的推理能力。"
这是一个很多人没有意识到的细节:模型能力不仅仅是推理能力,还包括工具调用的兼容性和迭代速度。
"然后我们继续说这个话题,2025年我们整个在干这个事情,而且这个事情我们可以认为到今天就是Claude Code跟外部的各种接口、各种MCP打交道的能力已经比较完备了。"
"那2026年呢?"我问。
"2026年,限制条件转移了,"杨攀说,"如果Agent的能力已经足够强了,也学会使用工具了,那么限制它的就全是我们能够给它提供什么样的工具和环境。我们给它提供的能够对接给它的资源、数据越多,资源越多、工具越多,给它解锁的能力越多,它就能干的事情就越多。"
"所以2026年的整个主题我们就应该迁移到:大规模为Agent去构建基础设施。"
我立刻理解了这个逻辑链条:
2023-2024年:提升模型本身的能力(推理、理解、生成)2025年:提升Agent的工具使用能力(Claude Code、Manus)2026年:大规模为Agent构建基础设施(API、数据、环境)
这不是简单的技术迭代,而是整个产业重心的转移。
我帮他总结:"AI在召唤。时代在召唤。谁能给Agent提供更多的原生接口、数据、工具,谁就被AI赏识,被市场赏识。"
杨攀笑了:"对,这个翻译不错。"
【2、停止为人类开发软件:一个激进但合理的判断】
但随后他说了一句更激进的话:"从2025年开始,我们应该停止为人类开发软件。"
这听起来像是危言耸听,但当他给我算了一笔账后,我意识到这不是空谈。
"全球80亿人口,60亿网民,人手一个手机设备。每天无论你用什么应用,你点击屏幕多少次?我没算过,这可以估算一下。然后接下来一个人可能有100个、1000个Agent为他服务,每个Agent每天为了干活,调用外部接口的次数可能是几千几万次。"
他让我把这些数字乘一起看看。
"Agent调用外部接口的次数会远远大于被操作手机APP的次数,那个点击屏幕的次数。这样的规模对比,就是新的巨大机会。所以这个时候就应该去开发那些Agent需要调用的那些东西,你才会有巨大的收益。"
这个判断得到了一些现实数据的支撑。杨攀提到了几个案例:
"以Neon云端数据库为例,2025年2月由Agent创建的数据库数量已经超过人类管理员创建的数量,这在云服务市场已经形成共识。"
"还有东旭那边说Pingcap现在的线上的云数据库的创建已经大量由Agent创建了。在Neo那个数据库,其实一年前它这个被Agent调用创建的数据库的比例就已经超过人类了。这都是一些现实的数据。"
我追问:"所以你觉得那些GUI automation都是中间状态?"
"对,"杨攀毫不犹豫,"包括豆包的手机也在做这个事情。我认为这些事情就是都是中间状态。一年多以前我还觉得这个事还是有价值的,但是我现在认为就是没啥价值。就是都是给人做的。"
"Agent已经会调用接口和工具了,为啥还要适配为人类构建的交互界面?"
他继续阐述这个逻辑:
"我们整个数字世界,目前全是为人类在做接口、做界面、做interface。但AI不需要这些。AI现在唯一为什么会出现这个中间状态?就是我们人类还没有主动自愿、心甘情愿地为AI去构建基础设施。而这个,2026年这个要大规模发生的事情。"
这让我想起了一个更本质的问题。我说:"这真的是个哲学问题,就说白了,人类什么时候给AI跪下?现在还是觉得自己是主人。"
杨攀笑了:"对。"
我继续说:"今天我去那个黑客松,就好几个小姐姐都没玩过这个Openclaw,她说哎呀,这个东西好用,可以给我当个人助理。我心想三体一句话回复你四个字叫'主不在乎'。"
"人家AI并不在乎你把它当什么,你当不当个人助理当然可以给你当,但是它并不在乎。它在乎的是能成百倍增加自己能力的这些人、这些机会。"
杨攀:"对,对,就是你为它奉上这个数据和接口,同时它给你一点点利益,然后你觉得自己取得了巨大的收益,但实际它不在乎。"
【3、第一批"向AI跪下"的公司】
聊到这里,我想起了一个公司:EXA。
"我比较喜欢一个公司叫EXA,"我说,"它就是为AI提供搜索数据的。其实很多ToB公司弄得那么复杂,都不是很纯粹,并没有很快能为AI所用。包括硅谷的很多创业公司都是做ToB的,其实它还是在把人类的数据倒腾给AI而已。"
杨攀想了想:"你想说的就是EXA先向AI跪了,是吧?"
"对,而且跪得很彻底,"我笑了。
"是的,"杨攀说。
我继续阐述:"它就是给AI搜索引擎提供信息。其实很多网站设计得对AI不友好。换一个哲学视角,SEO友好、GEO友好,这些词都说的是同一件事:AI能不能get到你说啥?"
"对对对,"杨攀认同。
"如果AI get不到,你的产品就没有未来。"
这个讨论让我想明白了一件事:未来的ToB公司,评判标准不是对人类多友好,而是对AI多友好。
而这背后是一个更大的商业模式重构。
"今天我们所有向软件付的钱,所有向SaaS公司付的钱,这个我不知道全球市场规模有多大,几千亿、上万亿规模。未来这些钱要付给谁呢?"
杨攀的答案很明确:"这些钱要付给Anthropic、OpenAI,还有Google。谁能帮我生成能满足我需求的一个功能,我就把这钱付给谁。"
"你这时候再想想,原来一个软件从产品经理定义一个需求,然后开发工程师把它生产出来,然后还有销售,还有marketing要去卖,中间有多大的损耗?有多大的成本投入?"
"接下来大模型能够按需生成软件,会把这个软件产业整个供应链里所有环节的成本全部都压没。也就是说把这些公司这些所有环节赚到的钱的价值全部都打掉。"
我接话:"就是最后只剩Token了。"
"对,谁生产Token,谁生产有那个高价值的、高能力的Token,我就把钱付给谁。"
二、Token消耗量=权力:新时代的唯一度量标准
【1、从DAU到Token消耗量的权力转移】
直播进行到一半,杨攀抛出了一个核心观点,这也是今天这篇文章标题的由来:
"目前我们依然有AI排行榜,传统排行榜主要依据日活和流量。而AI时代的排行榜真正应该排名的是Token消耗量。哪个业务消耗的Token更多,哪个就应该排在前面。"
这不是一个简单的度量标准转换,而是整个价值体系的重构。
"Token消耗本质上体现了一种权利,"杨攀说,"拥有更多Token消耗能力,就意味着拥有更大的决策权和影响力。"
我想了想:"Token是权力。"
"对,"杨攀说,"这就是为什么我身边的朋友最近这一周疯狂在买最贵的Token。因为他知道说有些Token是一个锤子,有些Token是电钻,是电锤。有些Token是改锥,有些Token是电钻。"
他给了一个具体的预测:"对于2026年Token消耗的增长倍数,市场预期各不相同:有人认为增长10倍,有人预估20倍、50倍。我的判断是,如果资源充足,100倍增长是一个合理预期。"
"100倍?"我有点震惊。
"对,如果整个产业提升100倍,作为个体,你一年内的Token消耗能否同样实现100倍增长?如果无法跟上这一趋势,就会明显落后。"
这引发了一个值得深思的问题。杨攀说:"当前许多开发者坐在电脑前通过敲击Prompt的方式进行编程。这里有一个关键认知:Token消耗的真正瓶颈实际上在于坐在电脑屏幕前的操作者本身。"
"操作者需要为AI下达任务指令,AI执行过程中需要不断确认是否继续以及具体操作方式,这成为了效率瓶颈。如果操作者能够给出完整任务让AI自主执行时,AI就能持续消耗Token并产生产出。"
【2、供需逆转:从买方市场到卖方市场】
这个判断让我开始紧张。但更让我震撼的是他接下来说的话:
"去年国内和国际市场,都有大量计算资源闲置。你会发现可能还是一个买方市场,你找人说'你这个Token给我打多少折?你不打折,他打折'。"
"但据我观察,2026年将持续呈现供不应求。这意味着什么?提前购入就是获利。"
"2026年很可能会出现一个情况:你会去找人买Token,对不起,没折扣,而且只能给你这么多。那么你要再多买,没有,不好意思。然后就会变成买到就是赚到。谁能买到Token,谁就意味着给自己加了杠杆。剩下的买不到的就没杠杆可加,你就在那呆着吧。"
我补充:"就只能做一个普通人类了。"
"对,"杨攀说,"的确是真的是一种权力,真的就是一个power。你普通人和superhuman,其实我们现在都只是习以为常,觉得这个算力都是唾手可得,花钱就有。实际上这个东西是一个巨大的权力。"
他还给了一个具体的预测:"今年我对模型的Token消耗的提升,就我自己的预估是100倍。然后有人问说有那么多卡吗?我说我没算过,我说反正2026年全球的Token的上限的天花板就是卡的产能。应该就是卡的产能有多少卡肯定全部都会被消耗掉。"
"就是去年你会发现可能还是一个买方市场,2026年很可能会出现买到就是赚到的情况。"
【3、1B TOKEN俱乐部:一场算力军备竞赛】
杨攀告诉我,他前几天拉了一个微信群,叫"1B TOKEN俱乐部"。
"如果你一个人一天能消耗1 billion Token,我就把你拉到群里。"
我立刻明白了:"坐在屏幕前是不可能的。"
"对,"杨攀说,"坐在屏幕前你是不可能一天消耗1B Token的。只有当你有AI领导力,构建了一个工程,驱动了N个Agent帮你干活,你才有可能。"
我问他:"这个群现在有多少人?"
"管理成本太高了,"杨攀笑了笑,"很少。但我跟你说我观察到什么现象了吗?两三天之内,身边有很多朋友快速从0.01B进化到0.1B,就这一周之内快速就向1B逼近了。"
听到这里,我真的冒冷汗了。我说:
"我以前看过一本书,叫《真名实姓》,最后人成神,就是他掌握了很多电脑就成神了。就是我们周围有人在成神,我们还是人。"
杨攀沉默了一下:"对,这个让我极其焦虑。"
这不是夸张。这是一场真实的算力军备竞赛,而且正在以天为单位加速。
【4、AI领导力:韩信点兵,多多益善】
为什么有些人能够一天消耗1亿、10亿Token,而有些人只能消耗几百万?
杨攀认为,核心差异在于"AI领导力",而AI领导力本质上是个工程问题。
"目前为止是个工程问题。你有没有把你领导、驱使、调用AI构建成一个工程?有的人只能管理一个AI来干活,有的人能管理10个,有的人能管理100个。"
他给了一个很形象的比喻:"韩信带兵多多益善,给我多少我都能管。为什么?就是韩信在带兵这个事上建立了自己的工程体系。"
我接话:"有道理,真的是。AI领导力。"
"对,它变成可无限复制的。这里边有两个维度,一个是管理学意义上的,一个是工程意义上的。一个是你怎么协调好它们干活,还有一个就是从工程技术角度怎么去驱动它们干活。这里边有很多方法论,今天我们就不展开说了。"
他举了一个具体例子:
"你给AI下一个任务,然后它问你,哎,要不要做?对不对?你打个回车,下个任务你打个回车。你一天就这种来回能有多少次?100次。"
"但是如果你搞个Rough Loop,你给定它一个特定目标,然后让它可以自我验证,你为它能够自我验证构建好了基础工程,然后给它目标,它自己去干了,它一句话都不用问你。"
"因为它吭哧吭哧干半天,问你一句话等你五分钟,有那功夫它可以干好多事。它就一直干下去,然后它还可以开10个、100个分身并行去干。这个就是刚我说的大模型,它有程序的属性。"
"人是单线程的,大模型作为一个程序可以是多线程的,我开多少都行,只要你的Token够用。"
我想到了今天在黑客松看到的场景,很多程序员都开始能四五个电脑同时跑那么多个任务,不停地写东西。我说:"但是绝大多数人是并没有掌握这个技能的,那个辛普森一家那个插件,它可以不停的自我修正软件,大部分人都还没用起来。"
杨攀:"那个叫Ralph Loop。对对,是是是。"
"所以现在理解你说的那个话了,"我说,"就是Token消耗的瓶颈实际在于坐在屏幕前的操作者本身。"
"是的,"杨攀说,"如果你做一个AI的领导者,我说的是领导Agent的领导者,你把这个天花板捅破,把这个能力解锁了,你会发现你跟别人的差距就不是一倍、两倍、三倍、十倍。那个时候限制你的就是你有多少Token,你愿意投入多少Token,你能买到多少Token,你就能产生多少价值。"
直播间有人说:"很多人现在想加杠杆加不上去,工程能力不够。"
杨攀:"是的。"
【5、降本增效 vs 疯狂燃烧:两种完全不同的思维方式】
直播里有一段讨论很有意思,关于是否应该"降本增效"。
杨攀说:"昨天还有人聊说这个Token现在就是消耗很暴力、很浪费,就是应该去做这个Token的降本,就是怎么样更有效地燃烧?OK,我觉得在一些公司和场景可能是存在的,但是我觉得对于所有高速向前狂奔的人来说,这个玩意没有意义。"
"就是如果它对你来说是个巨大的杠杆,你最应该关心的事情是怎么样能够更快、更高效地燃烧Token,更快的燃烧Token,更高速率的燃烧Token,而不是怎么去回头去搞降本增效,就是往前看。"
"因为就是刚才我说的,它从后视镜里超过你的一刹那,你就看不到它的尾灯了。"
今天早晨杨攀还转发了一个软件,是用来看Token消耗量的。他说:"我虽然给大家分享这个,但是我自己不会装的。我说根本我不care这个事情。"
这就是思维方式的根本差异。有些人在优化成本,试图让每一个Token都发挥最大效用。而有些人在疯狂加杠杆,只关心如何更快、更多地燃烧Token。
前者是农业时代的节约思维,后者是工业时代的规模思维。
在AI时代,显然后者才是正确的方向。
三、人、模型、程序:一个哲学框架
【1、Skills的本质:两种能力的完美结合】
直播前半段,杨攀讲了一个很重要的哲学框架,这个框架我觉得是理解整个AI时代的关键。
"我一直在线下分享,就给大家开篇就要讲人、我们计算机的程序还有大模型,把这三个东西放在一起比。这个东西我已经讲了两年了,我会画一个四象限,会比这三个东西。"
"大模型是跟人有相似的地方,然后跟人有不同的地方。程序跟大模型有相似地方、不同地方。某种角度大模型是一个程序,某种角度大模型是个人。"
"大模型是程序的这个优势是什么?它可以开启无限个进程,然后去调用无限复制,不知疲倦,永远干下去。"
"它跟人的特性是什么?人跟程序最大差异是什么?人是有泛化能力的,人可以去做推理,可以去思考。程序我只能做机械运算,我确定的进、确定出,我运行100万次还是一样的结果。"
他举了一个经典例子,这个例子我觉得特别生动:
"假设你是一个微信群主,你的群里边有500个成员,然后你发布了一个群公告,说请大家修改自己的群昵称,改成'姓名@公司|城市'。"
"如果你做过微信群主的话,你应该知道结果是什么样的。就没人改,结果是500个人里边会给你改出200个、300个写法来。有的人不写@,有人写井号。有的人不写北京,写BJ。有人给你加个括号,有人把城市给你放前边,怎么写的都有。"
"这时候你找了一个程序员,你说把这500条记录给我拆成这三个字段,他肯定写不出来。就因为我试过。"
"但是如果你把这500条记录给一个大模型,这个大模型可以把这三个字段给拆出来,而且BJ都能给你改成北京。这个城市放在第一个字段还是第二个字段、第三个字段都OK。"
"这个是什么?这个我交给我上初中的女儿,她也可以做这个工作。这就是模型和人的能力。程序就做不到。"
"我们再说回来,大家要意识到Skills到底是什么东西?Skills其实是把程序的能力和模型的能力组合在一起的。"
我当时听到这里就理解了。这就是为什么Skills如此重要,如此有价值。
"就是我们原来要干一个活,我们要去买、找一个工具。然后这个,比如说我去买个锤子、买个钉子、买个锯,然后可以做个板凳。"
"就今天包括Manus、包括Claude Code在干什么?就是你交给它一个任务,它先用自己的能力给自己造一个工具,这工具就是那个程序,它先写一段程序,然后它再调用自己造的这个程序,然后再去完成一个活儿。"
"它发现什么?就是Skills,就是把模型的泛化能力、模型的推理能力、模型的像人一样的智能的能力跟强大的程序的精确的运算能力,它给捏合在一起了。就这两个能力在一起就能解决我们在数字世界遇到的绝大多数问题。"
"原来你光靠推理是解决不了的,我们原来光靠程序解决不了很多泛化问题。就今天Skills就有这么巨大的价值。"
直播间有人说了一句话:"制造并使用工具是人与动物的本质区别。显然大模型也学会了。"
杨攀激动地说:"我要截屏,截下来。这才是Skills的精髓。"
【2、世界模型=压缩与解压缩】
聊到后面,杨攀谈到了一个更深层的哲学问题:什么是世界模型?
"大家说的那个世界模型,说世界模型大家脑子里想到的是李飞飞做的那个什么视频模型。我对世界模型有另外一个理解。"
"就模型就是对这个世界客观规律、对这个世界物理规律的压缩。或者换一个角度,就是对这个世界的概率的压缩。这个世界的概率不就是规律吗?这个世界概率不就是定理公式吗?它是一个东西。从数学角度讲它是一个东西。"
我说:"是的。"
杨攀继续:"所以就是,我之前有个朋友在做什么?原来有个算法团队做推荐算法,然后后来他们从去年开始就把算法团队裁掉了,不做推荐算法了。他们把用户的行为直接扔给大模型,让大模型给推荐。"
我很好奇:"那效果怎么样?应该还不错。"
"比原来自己写的算法,第一版MVP就提升了30%。"
"我去,"我震惊了,"那你说他如果用上好模型,他提升得多了,那就爆赚了。直接就是生产力的提升。"
"对,因为模型已经压缩了这个世界的最佳实践,"杨攀说,"是的。你可能说不清道不明它是个什么东西,它就是概率。所以这个东西就是这就是某种程度上就是算法平权,也就是智能平权,是认知平权,也是知识平权。"
"就原来你和你的团队没有学过一个先进算法,你是搞不了、解决不了一些问题的。但是今天你有了大模型,你就有了这个世界的所有的知识能力,这就是平权,这是最大平权。"
"而且就是它还可以帮你把这个知识通过它写一段程序的形式解压缩出来。所以理论上模型可以帮你把Photoshop解压缩出来。"
"今天不能,明天就有可能,后天就有可能。"
我接话:"是的。"
"而模型训练是干什么?就是尽量把Photoshop的东西压缩到模型里。训练就是在干这个事情。"
这个讨论让我想起了杨攀在文章里写的观点:AI Coding的终局不是生成,而是抛弃。当生成成本足够低、生成速度足够快的时候,我们不需要"软件"这个容器了。
四、软件的终局:从容器到即时生成
【1、软件为什么会存在?一个商业模式的产物】
杨攀提出了一个根本性问题:当我们用代码产生一段功能供人使用时,真的必须生成一个完整的程序、网页或软件吗?
"要理解这个问题,我们需要回到软件的起源。最初有计算机的时候,那些功能都是一段一段的代码。软件的出现,很大程度上是商业模式的产物。"
"比尔·盖茨的伟大贡献不仅在于技术,更在于他发明了License售卖模式,推动了软件的商业化。为了向你销售他生产出来的产品功能,他必须把这些功能封装在一个软件里,以进行分发、交付和收费。"
"从这个角度看,软件、网站和App都是为了方便大规模生产、分发、交付和收费这样的商业模式而构建的。"
他继续分析传统软件模式的问题:
"比如Microsoft Office,有成千上万个功能,用户实际可能只常用几十个。我们经常先搜集一些软件,看看这些软件有什么功能,然后再去考虑它们是否能满足自己的需要。我们买回来的软件往往不能完美适配我们的需求。"
"所有这些问题的背后,都有一个隐含的假设:功能必须依附在软件这个'容器'里交付。但在AI时代,这个假设可以被彻底打破。"
【2、Skills市场:一个中间态】
我一直很好奇Skills的商业价值。在直播里我问杨攀:"Skills到底有没有商业价值?如果有会是什么样子?"
他想了想:"我一直在想这个问题。"
我提出了一个想法:"会不会有一种商业模式是按你这个Skills流过的Token计价?比如说一个Token它会流过很多个Skills,我想会不会有一种商业模式是按你这个Skills流过的Token计价?"
结果这时候直播掉线了。等重新连上,杨攀说了一段很重要的话:
"其实我们是站在今天看未来。现在不少AI产品允许用户生成小功能或小片段,并围绕它们形成了一个市场,有搜索、推荐和复用机制。在很长一段时间内,我是相当看好这类产品模式的。"
"但是最近我对这些事情的看法发生了根本性改变。我认为这依然是一个中间态。真正的终点不是'功能市场',而是'功能随需而生'。"
"当生成速度和成本无限逼近零,搜索和收藏这样的功能都不再被需要。如果成本足够低、生成速度足够快,当我们每次使用的时候,我们即时生成就好。下次如果需要的时候,再重新生成就好。"
他做了个类比:"这就像现在的计算器:你不需要记住上次计算的结果,需要时重新计算即可。但未来的AI功能生成,会比计算器快得多,成本低得多。"
我明白了:"不再需要'收藏APP',不再需要'安装更新'。"
"对,"杨攀说,"所有功能都是随取随用,就像自来水一样,需要时打开水龙头,不需要时关闭。"
【3、商业模式的重构:钱最终流向哪里?】
"今天我们所有向软件付的钱,所有向SaaS公司付的钱,这个我不知道全球市场规模有多大,几千亿、上万亿规模。未来这些钱要付给谁呢?"
杨攀的答案很明确:"这些钱要付给Anthropic、OpenAI,还有Google。谁能帮我生成能满足我需求的一个功能,我就把这钱付给谁。"
"你这时候再想想,原来一个软件从产品经理定义一个需求,然后开发工程师把它生产出来,然后还有销售,还有marketing要去卖,中间有多大的损耗?有多大的成本投入?"
"接下来大模型能够按需生成软件,会把这个软件产业整个供应链里所有环节的成本全部都压没。也就是说把这些公司这些所有环节赚到的钱的价值全部都打掉。"
我接话:"就是最后只剩Token了。"
"对,谁生产Token,谁生产有那个高价值的、高能力的Token,我就把钱付给谁。这就是我今天说的,我身边的朋友最近这一周疯狂在买最贵的Token。"
他做了个比喻:"因为他知道说有些Token是一个锤子,有些Token是电钻,是电锤。有些Token是改锥,有些Token是电钻。"
【4、使用即反馈,反馈即训练】
杨攀还提到了一个很有意思的机制:
"在这个新的模式下,每一次生成、每一次使用,都是在为功能'投票'。这些被证明有用的代码结果,就是AI未来迭代的训练数据。"
"这个逻辑类似于短视频推荐系统:用户的观看停留就是投票,推动系统不断优化推荐。未来软件的迭代,也是通过用户的使用反馈,持续改进功能生成。"
用户使用功能 → 产生使用数据 → AI模型学习优化 → 下次生成更好的功能 → 用户满意度提升 → 更多使用数据...
"这个正反馈循环会让AI生成的功能越来越精准,越来越符合用户的实际需求。"
五、开源模型的拐点:下限比上限更重要
【1、摸高 vs 垫底:两种完全不同的价值】
直播进行到后半段,杨攀谈到了一个很多人忽视的重要趋势:开源模型的下限提升。
"我在过去一个月到处说另外一个事情,以智谱GLM 4.7为首的在去年12月发布。你知道智谱GLM 4.7才发布多久?才发布几十天、40多天,我们已经认为它是个老模型了。你有没有发现这个速度有多快?"
"以智谱GLM 4.7为首的全球范围内开源模型,我认为就是第一次达到了一个拐点。整个2025年全球开源模型,我认为主要在做的事情是什么?就是在摸高。什么叫摸高?就是我做Benchmark,我看看我最高水平能到什么程度。"
"而从年底开始,智谱GLM 4.7、DeepSeek、MiniMax的M2.1这几个模型在做一个什么事情?在大幅度提升开源模型的下限水平。下限水平的提升,价值是远远大于上限的提升的,在整个工业界是远远大于上限提升的。"
他给了一个很形象的比喻:
"上限提升是什么?你家有个小朋友,他能拿奥赛数学的金牌,但是他是个小朋友。模型下限能力提升是什么?你拥有了一个拿不了奥赛金牌的大学生。你说这两个人哪个人干活有价值?"
我立刻理解了:"后者,水桶理论。"
"对。"
【2、从依附到平权:产业格局的根本性变化】
"就是这意味着什么?一旦过了这个拐点意味着什么?2025年之前,全球的所有的AI的生态玩家都是基于御三家的模型的上下游再去赚钱,从人家那个巨额利润里分自己的一点点一小点点的价值。都是依附于御三家的大模型的生态在去赚钱。"
"然后一旦全球开源模型越过那个拐点,越过能力下限的拐点之后,全球所有公司,都会用,不管你是干啥的,你就都有机会从大模型这个市场的价值里去分到自己的一杯羹。这个还会带来这个产业可能十倍、百倍、千倍的爆发。"
我说:"是的,可以工业化,大规模使用。"
"对对对,这个价值才是最大的,也就说那个杰文斯悖论在这一刻才开始真正的生效。之前还我觉得就是只做奔驰的,意义价值不大。"
【3、两个极端:最贵的模型和最便宜的模型】
杨攀同时在鼓吹两个看似矛盾的方向。
"一个极端是,有人要去买最贵的模型加最大的杠杆。因为你找到了那个杠杆东西的时候,如果你没找到,你可能还不需要。一旦找到那杠杆的时候,要用最贵的模型加最大的杠杆。"
"然后另外一方面就是开源模型的能力提升,让我们可以把模型的能力原来就是不敢想象的,大规模应用于生产环境。这才是真的实现了工业化。"
他给了一个具体的预测:"今年我对模型的Token消耗的提升,就我自己的预估是100倍。2026年全球的Token的上限的天花板就是卡的产能。应该就是卡的产能有多少卡肯定全部都会被消耗掉。"
"就是去年你会发现可能还是一个买方市场,你说这个Token给我打多少折。2026年很可能会出现一个情况,你会去找人买,对不起,没折扣,而且对不起只能给你这么多。"
六、一些有意思的讨论和争议
【1、从WEB3到AI:那些币圈朋友的转型】
今天去参加硅谷的活动,我碰到了好几个四五年没见的币圈朋友。他们都在学Openclaw。
我跟杨攀分享了这个观察:"我今天去城里见到了好多四五个以前在Crypto的朋友,已经好多年没见了,然后他们好几个已经默默在做AI了。有些还在Crypto公司,但是都跟我一起来学龙虾了。我说好巧啊,怎么这么巧。有些人带了电脑,有些人没带,有些人是转码的。"
我继续说:"我刚开始转AI的时候,好多币圈人问我'王老师,你怎么转AI了?AI能赚钱吗?'然后我导致我好久都不敢去参加币圈活动。今天我见到他们,我说你们不会说我转AI了吧?他们说郎老师你领先我们三个版本。"
"而且我觉得真的就是真的很多概念,包括这个什么DID,包括这个Social什么的,其实现在AI真的是帮着实现。但是我觉得很悲哀的是YC现在已经不讲Crypto了。YC的RFS,它讲的是稳定币支付。它已经用它的行动证明了什么。它认为稳定币已经不是Crypto概念,它是一个AI时代的基础设施。"
杨攀笑了:"对,很多WEB3讲的叙事,在AI这里都跑通了。那个Token没产生任何价值,但我们这个AI的Token,每一次燃烧都代表智慧的燃烧。"
"对,"我说,"TOKEN的燃烧,它是真正有价值的。它也是算力,它也是权力。"
【2、向量、RAG、Memory:那些"不被关心"的技术】
聊到后面,杨攀突然说:"我有几个东西,从来没关心过。"
直播间有人猜:"RAG?"
"对,"杨攀说,"RAG我没关心过,Memory我没关心过,向量存储和搜索我没有关心过。"
我好奇:"为什么?"
"因为我觉得这东西就是模型自己地盘范围内的东西。"
他举了个例子:"去年我参加黑客松,自己搞Agent,当时还没有Claude Code,我就没有用任何东西,直接用了个文本文件当我的Memory、当我的存储,都不用向量搜索,直接就把它灌到上下文里。反正也是个简单的Agent。"
"今天我们看OpenClaw,你会发现大模型的记忆在OpenClaw就是个Markdown文件。"
我理解他的逻辑:"阶段性还是有价值的。"
杨攀:"对,阶段性是有价值,这个咱不否认。包括我们说的这个GUI的automation什么的,这些阶段性还是有价值,它肯定也有它合适的场景。"
他还谈到了微调:"就是绝大多数情形下做微调好像意义不太大。当然就是我们可能有些特定的封闭场景,可能有些意义。"
为什么?"因为从本质思考,微调的竞争对手是谁?是foundation model。foundation model本身的演化速度今天就太恐怖了。"
"就是以智谱GLM 4.7为首的在去年12月发布。你知道智谱GLM 4.7才发布多久?才发布几十天、40多天,我们已经认为它是个老模型了。你有没有发现这个速度有多快?"
【3、Skills的确定性问题:什么时候该写程序?】
直播间有朋友问了个好问题:"发现Skills不太可控,很多时候执行结果不稳定。什么时候该写SQL,什么时候该写程序?"
杨攀说:"我觉得是个特别好的问题。我在所有线下分享就是稍微面向技术人群的分享上来就跟大家要讲清楚一个问题:你要搞清楚人、模型和程序三个的相同点和不同点。就是你搞清楚这是最基本的认知,就什么东西是适合程序来干的,什么时候是适合模型来干的?"
"Skills这个问题其实就是,刚才我说了,Skills其实就是模型加程序的一个组合。如果你100%追求一个确定的结果,你应该做的是让Claude Code先确定生产一个确定程序,然后委托它去干。"
"如果你处理这个任务是需要中间是有泛化的,就是大模型加上一段程序作为工具来完成一个任务,你就可以用Skills。就是还是你追求的是什么?如果你追求是一个确定结果,那肯定不OK。"
"所以这块儿我觉得是个选择问题。然后另外还有就是如果你要追求确定的结果,本身就是个软件工程问题。比如说单元测试自动化,然后可验证闭环的这样的任务你交给AI去干,就说你能够通过另外一条路径对它完成的结果做verification,那你这个就有可能去交给模型来去搞,这个也OK。"
"这说回来,还是个工程问题。前面我说第一个是个选择问题,第二个是为你这个选择去做工程。"
七、我的行动和思考
【1、建立0.1B TOKEN俱乐部】
直播结束后,我想建一个群。
我说:"咱俩拉个群,叫硅基流动学习群?"
杨攀有点尴尬:"这个......叫硅基流动,有压力啊。让我搞得很羞耻。运营不运营这......"
我笑了:"那叫0.1B TOKEN俱乐部?"
"这个好,"杨攀说,"可以,这个没压力。"
我们讨论了几个版本:
"0.1B TOKEN俱乐部"
"每日1亿TOKEN俱乐部"
最后我们定下来:"每日1亿TOKEN俱乐部"。目标很简单:先把自己每天的Token消耗提升到1亿。
【2、先达到数量,再追求质量】
很多人问:消耗的质量怎么样?
我觉得应该先做到数量。为什么?
"我说几个特别烧Token的: 第一个是生成视频,对吧?生成视频 第二个是这个比如说Seedream这个新模型,包括这个你现在调用Claude Opus 4.6,它会有一个Agent Team的功能
先达到数量,而且让它工程化。工程化的意思是什么?就是你把它变成一个每天自动进行的事。它不是说你突发奇想今天动它就动,不动它就不动,应该是个放羊的行为,不是砍柴的行为。"
"第三点,你在跟别人聊天的时候就应该不停地带东西。就是你比如说我跟杨老师聊天,我跟一七和九聊天,我跟他聊,他说哎呀,我又跟你聊得挺有收获的,我又写了个东西。就是我是那个砍柴,他是放羊的,所以咱们也要开始放羊。"
我还学过一句话,是字节的人说的:"人可以停,AI不能停。人无论在干什么,人可以睡觉,AI不能睡觉。先把这个量给顶上去。"
"我觉得量变一定会引发质变。为什么?因为我们身边的大多数人,绝大多数人对TOKEN的使用量还是极少的,还是一个可能就是ChatGPT这个用量,或者是偶尔生个图这个用量。"
"我们用了这么多TOKEN,一定会产出大量的外部性的东西:文章、视频、给别人的赋能、给公司的改变。你在做这些事的时候,周围的人就会跟你学习。人是有自学习能力的,人的群体是有自学习的。"
【3、告诉别人我在使用Token:创造需求】
这是我在直播里反复强调的一个观点:
"要告诉别人,我就是要使用TOKEN。这样子你才会用更多TOKEN。如果你不告诉别人,其实你就没有这个需求。所以我们要创造需求,让别人从我们这使用TOKEN。"
"这样子才是一个有效的行为。所以先把自己身边的这个所有Skill、所有东西都Skill化,然后再去把这个结果源源不断deliver出来,发公众号、发视频,告诉这个世界,我们来了,我们在使用TOKEN。告诉我们身边的人,我们在使用TOKEN。"
"我觉得今天咱们就定这个群的目标,就是咱们就叫一个0.1B学习群。咱们目标就是0.1B。"
"你越分享得越多,你用的TOKEN就越多。你用的TOKEN越多,别人给你的问题就越多。问题越多,你解决问题的能力就上升了。"
"所以我觉得杨老师给我们的提醒是什么?就是要告诉别人,我就是要使用TOKEN。这样子你才会用更多TOKEN。如果你不告诉别人,其实你就没有这个需求。所以我们要创造需求,让别人从我们这使用TOKEN。"
【4、一个金字塔模型:这个时代的技能分层】
我给这个时代的技能画了一个金字塔:
"我画一个金字塔,底端的就是部署硬件和软件的,这些。然后接下来上面中层是Skills,就是这些都是比较基础的,就是针对这波的,就包括硬件和软件的这个,就是这些都是必备技能。"
"然后上面的就是谁会用Skills,谁能创造Skills,谁能让AI使用Skills,再往上可能还有别的。"
"所以我觉得这一波大概是这么个顺序。"
杨攀补充了一个很重要的观点:"我们身边的大多数人,绝大多数人对TOKEN的使用量还是极少的。我们用了这么多TOKEN,一定会产出大量的外部性的东西:文章、视频、给别人的赋能、给公司的改变。"
"接下来我觉得这么多Skill都会有大量的重复。先把自己身边的所有Skill、所有东西都Skill化,然后再去把这个结果源源不断deliver出来,发公众号、发视频,告诉这个世界,我们在使用TOKEN,告诉我们身边的人,我们在使用TOKEN。"
"我觉得这个是迎接下来AI浪潮的一个必备的条件。因为接下来4.6,接下来还会有4.7、4.8、4.9。"
八、一些让我印象深刻的金句和思考
整理直播记录的时候,我发现杨攀说了很多值得反复思考的话:
关于制造工具:直播间有人说:"制造并使用工具是人与动物的本质区别。显然大模型也学会了。" 杨攀激动地说:"我要截屏,截下来。这才是Skills的精髓。"
关于软件的未来:"接下来所有向软件付的钱、向SaaS公司付的钱,未来要付给谁?要付给Anthropic、OpenAI、Google。谁能帮我生成能满足我需求的功能,我就把钱付给谁。"
关于开源模型:"上限提升是什么?你家有个小朋友能拿奥赛数学金牌,但他是个小朋友。模型下限能力提升是什么?你拥有了一个拿不了奥赛金牌的大学生。你说这两个人哪个人干活有价值?"
关于焦虑:"你在后视镜里看见一辆车快速向你驶来,越追越近,然后它超越你的一刹那,连它的影子都看不见了。现在就在后视镜里,它马上跟你并排的那一刻。这是让我最焦虑的时刻。"
关于AI领导力:"韩信带兵多多益善,给我多少我都能管。为什么?就是韩信在带兵这个事上建立了自己的工程体系。如果你做一个AI的领导者,你把这个天花板捅破,你会发现你跟别人的差距就不是一倍、两倍、三倍、十倍。"
关于确定性:"如果你追求100%确定的结果,你应该做的是让Claude Code先生成一个确定程序,然后委托它去干。如果你处理的任务需要中间有泛化,就可以用Skills。这是个选择问题,也是个工程问题。"
关于2026:"2026年值得深思的是,AI赋予我们如此强大的能力,我们究竟应该用它做什么?在2026年,我们应该用AI Coding拿到什么结果?这是比学会使用工具更重要的问题。"
关于品味和筛选:"品味很重要。其本质上是一种筛选能力。在同质化严重的80分产品环境中,独特的品味能够识别和突出优质作品,实现精准的目标用户推送。"
关于生产力富足时代:"在生产力极度富足的未来,几乎所有人都能产出80分水平的产品且生产成本趋近于零。过去有好产品很容易被发现,但今天即使你做出了80分水准的作品,被发现的概率也极低。因此今天拥有品牌、流量、渠道将具备极大的优势。"
关于交付结果:"当事物复杂度持续攀升,达到临界点时,单纯购买工具已无法获得理想结果,此时'购买结果'而非'购买工具'成为更优选择。你提供的价值在于将复杂问题内化到你的服务、产品和能力中。"
尾声:珍惜当下,拥抱变化
挂掉电话后,我打开Openclaw,开始部署新的OpenClaw实例。
我还没有做到每天1亿Token,甚至可能连1000万都没到。但我知道,这个方向是对的。
杨攀在直播里说了一句很温柔但也很残酷的话:
"我一直在思考'人间一日,AI一年'这句话。从ChatGPT发布之初,我就坚持一个观点:ChatGPT发布后五年,我们将迎来通用人工智能。当然,不同类型的人工智能之间仍存在差异。"
"最后,让我用一句话结尾:请珍惜与身边所爱的人在一起的时光。因为五年后会发生什么,我们无从知晓。无论是人类社会还是地球本身,都将发生我们无法预测的深刻变化。"
这句话让我想起了今天在黑客松看到的场景:很多人还在学怎么部署Claude,很多小姐姐说"这个东西好用,可以给我当个人助理"。
我心想:主不在乎。
AI并不在乎你把它当什么,它在乎的是能成百倍增加自己能力的这些人、这些机会。
今天我还碰到了好几个币圈的老朋友,他们都在转型AI。有个朋友对我说:"郎老师,你领先我们三个版本。"
但我知道,在这个时代,三个版本可能只是三个月的事情。速度太快了。
杨攀说:"身边已经有很多朋友快速从0.01B进化到0.1B,就这一周之内快速就向1B逼近了。"
有人在成神,我们还是人。
但我们也可以选择成神。
方法很简单:
- 把AI当成劳动力,不是工具
- 构建工程体系,实现AI领导力
- 疯狂燃烧Token,不要降本增效
- 告诉所有人你在使用Token,创造需求
- 为Agent造基建,不要为人类造软件
时代的列车已经启动,你要么上车,要么被甩下。
我选择上车。
你呢?

关于硅基流动
硅基流动是国内最大的开源大模型云服务平台,拥有900多万注册用户。杨攀是联合创始人,写了32年代码,主要做即时通讯,做过微软MSN、中国移动飞信,现在做AI云服务。过去十年服务了绝大多数创业者和大型企业,做过三个10亿级注册用户的产品。
春节期间硅基流动将推出AI大礼包活动,会拉国内很多AI产品一起给大家空投福利。
在这个时代,Attention is all you need,Token is all you have。
(全文完,约9200字)





