中國算力的「效率革命」,比讓存儲擴充生產線還有效 一個反直覺的事實:中國AI公司正在用更少的內存,跑出差不多的效果,論文是開源的,這可能會讓海外御三家 OpenAI、Anthropic、gemini 的推理成本降低一個量級,毛利提高,同時對內存的需要也降一個量級。 DeepSeek的MLA架構、KV緩存優化以及各類模型量化技術為例,這些動作直接且大幅地降低了推理階段的顯存佔用量和帶寬需求,單位Token的生成成本斷崖式下跌。智譜的超高速推理,阿里和小米千問的緩存計費直接砍到十分之一。這些動作的本質是什麼?都是在算法壓縮效率,算力被利用到了極致。 但市場在用舊地圖找新路 美股AI 還在不斷堆資本開支,提前鎖定大額的產能和算力,7000 億資本開支足夠讓整個 AI 上下游的產業鏈狂歡。這個邏輯沒錯,對算力和內存需求確實還很大,增長也很快。但問題是,它忽略了另一條曲線,中國對算力優化的效率提升空間,同樣大得驚人。 所有人都在賭「賣水人」能持續賺錢,但沒人注意到挖金礦的人突然學會了循環用水。 如果中國AI公司把內存使用效率再壓縮50%,那麼靠資本開始撐估值的存儲股,敘事還成立嗎? 目前AI硬件產業鏈的暴利,很大程度上建立在對最高端HBM高帶寬內存的絕對依賴上。如果模型對內存的需求量級下降,那可能會直接打破原有頭部廠商的壟斷溢價,靠資本支出撐估值的存儲股和算力股的底層邏輯就會鬆動。 好像整個市場沒人認真計算中國在算法層的效率革命,到底能省下多少內存 但是客觀來說如果推理成本和內存使用率壓縮50%,可能帶來的是AI Agent全天候高頻API調用、AI 落地應用的大爆發。單次用量少了,但總調用頻次如果增加10倍,總體內存和算力的絕對需求依然是暴增的。 中國算力比讓存儲擴充生產線還有效,可能會打破原有頭部廠商的壟斷溢價,這是目前需要留意的風險,以及算力效率這條路到底能走多遠,能否持續進步優化。 不確定的是,這個「未被計價」的窗口期有多長。也許三個月,也許一年。
來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
分享



