链研社的想法

中国算力的「效率革命」，比让存储扩充生产线还有效一个反直觉的事实：中国AI公司正在用更少的内存，跑出差不多的效果，论文是开源的，这可能会让海外御三家 OpenAI、Anthropic、gemini 的推理成本降低一个量级，毛利提高，同时对内存的需要也降一个量级。 DeepSeek的MLA架构、KV缓存优化以及各类模型量化技术为例，这些动作直接且大幅地降低了推理阶段的显存占用量和带宽需求，单位Token的生成成本断崖式下跌。智谱的超高速推理，阿里和小米千问的缓存计费直接砍到十分之一。这些动作的本质是什么？都是在算法压缩效率，算力被利用到了极致。但市场在用旧地图找新路美股AI 还在不断堆资本开支，提前锁定大额的产能和算力，7000 亿资本开支足够让整个 AI 上下游的产业链狂欢。这个逻辑没错，对算力和内存需求确实还很大，增长也很快。但问题是，它忽略了另一条曲线，中国对算力优化的效率提升空间，同样大得惊人。所有人都在赌「卖水人」能持续赚钱，但没人注意到挖金矿的人突然学会了循环用水。如果中国AI公司把内存使用效率再压缩50%，那么靠资本开始撑估值的存储股，叙事还成立吗？目前AI硬件产业链的暴利，很大程度上建立在对最高端HBM高带宽内存的绝对依赖上。如果模型对内存的需求量级下降，那可能会直接打破原有头部厂商的垄断溢价，靠资本支出撑估值的存储股和算力股的底层逻辑就会松动。好像整个市场没人认真计算中国在算法层的效率革命，到底能省下多少内存但是客观来说如果推理成本和内存使用率压缩50%，可能带来的是AI Agent全天候高频API调用、AI 落地应用的大爆发。单次用量少了，但总调用频次如果增加10倍，总体内存和算力的绝对需求依然是暴增的。中国算力比让存储扩充生产线还有效，可能会打破原有头部厂商的垄断溢价，这是目前需要留意的风险，以及算力效率这条路到底能走多远，能否持续进步优化。不确定的是，这个「未被计价」的窗口期有多长。也许三个月，也许一年。

来自推特

免责声明：以上内容仅为作者观点，不代表Followin的任何立场，不构成与Followin相关的任何投资建议。

喜欢