链研社的想法

中國算力的「效率革命」，比讓存儲擴充生產線還有效一個反直覺的事實：中國AI公司正在用更少的內存，跑出差不多的效果，論文是開源的，這可能會讓海外御三家 OpenAI、Anthropic、gemini 的推理成本降低一個量級，毛利提高，同時對內存的需要也降一個量級。 DeepSeek的MLA架構、KV緩存優化以及各類模型量化技術為例，這些動作直接且大幅地降低了推理階段的顯存佔用量和帶寬需求，單位Token的生成成本斷崖式下跌。智譜的超高速推理，阿里和小米千問的緩存計費直接砍到十分之一。這些動作的本質是什麼？都是在算法壓縮效率，算力被利用到了極致。但市場在用舊地圖找新路美股AI 還在不斷堆資本開支，提前鎖定大額的產能和算力，7000 億資本開支足夠讓整個 AI 上下游的產業鏈狂歡。這個邏輯沒錯，對算力和內存需求確實還很大，增長也很快。但問題是，它忽略了另一條曲線，中國對算力優化的效率提升空間，同樣大得驚人。所有人都在賭「賣水人」能持續賺錢，但沒人注意到挖金礦的人突然學會了循環用水。如果中國AI公司把內存使用效率再壓縮50%，那麼靠資本開始撐估值的存儲股，敘事還成立嗎？目前AI硬件產業鏈的暴利，很大程度上建立在對最高端HBM高帶寬內存的絕對依賴上。如果模型對內存的需求量級下降，那可能會直接打破原有頭部廠商的壟斷溢價，靠資本支出撐估值的存儲股和算力股的底層邏輯就會鬆動。好像整個市場沒人認真計算中國在算法層的效率革命，到底能省下多少內存但是客觀來說如果推理成本和內存使用率壓縮50%，可能帶來的是AI Agent全天候高頻API調用、AI 落地應用的大爆發。單次用量少了，但總調用頻次如果增加10倍，總體內存和算力的絕對需求依然是暴增的。中國算力比讓存儲擴充生產線還有效，可能會打破原有頭部廠商的壟斷溢價，這是目前需要留意的風險，以及算力效率這條路到底能走多遠，能否持續進步優化。不確定的是，這個「未被計價」的窗口期有多長。也許三個月，也許一年。

來自推特

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論