avatar
链研社
73,125個推特粉絲
關注
穿越牛熊的数据派交易员|运营老炮|Web3创业OG|币安广场创作者,奉行周期大于一切,关注真正影响投资决策的信息
動態
avatar
链研社
中國算力的「效率革命」,比讓存儲擴充生產線還有效 一個反直覺的事實:中國AI公司正在用更少的內存,跑出差不多的效果,論文是開源的,這可能會讓海外御三家 OpenAI、Anthropic、gemini 的推理成本降低一個量級,毛利提高,同時對內存的需要也降一個量級。 DeepSeek的MLA架構、KV緩存優化以及各類模型量化技術為例,這些動作直接且大幅地降低了推理階段的顯存佔用量和帶寬需求,單位Token的生成成本斷崖式下跌。智譜的超高速推理,阿里和小米千問的緩存計費直接砍到十分之一。這些動作的本質是什麼?都是在算法壓縮效率,算力被利用到了極致。 但市場在用舊地圖找新路 美股AI 還在不斷堆資本開支,提前鎖定大額的產能和算力,7000 億資本開支足夠讓整個 AI 上下游的產業鏈狂歡。這個邏輯沒錯,對算力和內存需求確實還很大,增長也很快。但問題是,它忽略了另一條曲線,中國對算力優化的效率提升空間,同樣大得驚人。 所有人都在賭「賣水人」能持續賺錢,但沒人注意到挖金礦的人突然學會了循環用水。 如果中國AI公司把內存使用效率再壓縮50%,那麼靠資本開始撐估值的存儲股,敘事還成立嗎? 目前AI硬件產業鏈的暴利,很大程度上建立在對最高端HBM高帶寬內存的絕對依賴上。如果模型對內存的需求量級下降,那可能會直接打破原有頭部廠商的壟斷溢價,靠資本支出撐估值的存儲股和算力股的底層邏輯就會鬆動。 好像整個市場沒人認真計算中國在算法層的效率革命,到底能省下多少內存 但是客觀來說如果推理成本和內存使用率壓縮50%,可能帶來的是AI Agent全天候高頻API調用、AI 落地應用的大爆發。單次用量少了,但總調用頻次如果增加10倍,總體內存和算力的絕對需求依然是暴增的。 中國算力比讓存儲擴充生產線還有效,可能會打破原有頭部廠商的壟斷溢價,這是目前需要留意的風險,以及算力效率這條路到底能走多遠,能否持續進步優化。 不確定的是,這個「未被計價」的窗口期有多長。也許三個月,也許一年。
avatar
链研社
推薦這個群友的開源項目 plan-tree 項目的切入點是把你和 AI 討論過的方案、做出來的決策、當前的進度、下次應該從哪裡繼續,統統沉澱成一棵 Markdown 規劃樹。 它不替你做決策,讓你的決策更清晰完整 解決了兩個 AI 編程中最重要兩件事。 第一,對齊成本。每次開新會話,直接丟規劃樹進去,不用重新講背景。 第二,強迫你真的想清楚。 當你要把決策寫進規劃樹的時候,你會發現很多「差不多懂了」其實是「說不清楚」。強迫你把模糊的認知變成結構化的文字,這個過程本身就是在澄清思路。 plan-tree 用的「大循環模式」工作流,說的是,先充分討論、澄清、形成可落地方案形成文檔,再讓 AI 批量執行,執行完之後,再把進度、證據和剩餘問題回寫到規劃樹。 先把樹種好,再讓機器去砍柴。 我覺得這才是 AI 編程應該有的姿勢。 你想想看,AI 時代最稀缺的不是執行力,執行力 AI 給了,而是方向感,是那種「我知道我在做什麼、為什麼這麼做、下一步去哪裡」的方向感。 plan-tree 就是幫你保留這種清醒的工具。 能降低AI 實現功能的偏移,如果你也有相同的問題推薦你試試
huangserva
@servasyy_ai
🔥🔥Strongly recommend this group member's work!! It has helped me tremendously with my recently developed multi-Agent product! It transforms short-term plans into a long-term, stable, and structured tree. plan-tree is a skill for long-term preservation of project planning
loading indicator
Loading..