中国算力的「效率革命」,比让存储扩充生产线还有效 一个反直觉的事实:中国AI公司正在用更少的内存,跑出差不多的效果,论文是开源的,这可能会让海外御三家 OpenAI、Anthropic、gemini 的推理成本降低一个量级,毛利提高,同时对内存的需要也降一个量级。 DeepSeek的MLA架构、KV缓存优化以及各类模型量化技术为例,这些动作直接且大幅地降低了推理阶段的显存占用量和带宽需求,单位Token的生成成本断崖式下跌。智谱的超高速推理,阿里和小米千问的缓存计费直接砍到十分之一。这些动作的本质是什么?都是在算法压缩效率,算力被利用到了极致。 但市场在用旧地图找新路 美股AI 还在不断堆资本开支,提前锁定大额的产能和算力,7000 亿资本开支足够让整个 AI 上下游的产业链狂欢。这个逻辑没错,对算力和内存需求确实还很大,增长也很快。但问题是,它忽略了另一条曲线,中国对算力优化的效率提升空间,同样大得惊人。 所有人都在赌「卖水人」能持续赚钱,但没人注意到挖金矿的人突然学会了循环用水。 如果中国AI公司把内存使用效率再压缩50%,那么靠资本开始撑估值的存储股,叙事还成立吗? 目前AI硬件产业链的暴利,很大程度上建立在对最高端HBM高带宽内存的绝对依赖上。如果模型对内存的需求量级下降,那可能会直接打破原有头部厂商的垄断溢价,靠资本支出撑估值的存储股和算力股的底层逻辑就会松动。 好像整个市场没人认真计算中国在算法层的效率革命,到底能省下多少内存 但是客观来说如果推理成本和内存使用率压缩50%,可能带来的是AI Agent全天候高频API调用、AI 落地应用的大爆发。单次用量少了,但总调用频次如果增加10倍,总体内存和算力的绝对需求依然是暴增的。 中国算力比让存储扩充生产线还有效,可能会打破原有头部厂商的垄断溢价,这是目前需要留意的风险,以及算力效率这条路到底能走多远,能否持续进步优化。 不确定的是,这个「未被计价」的窗口期有多长。也许三个月,也许一年。

来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论