Skill膨脹時代，龍蝦之父掏出了一把手術刀

ME News

那些認真對待上下文預算的人，會比那些無腦堆Skill的人，獲得更好的AI輔助體驗。

文章作者、來源：0x9999in1，ME News

TL;DR

當前主流AI編程助手的Skill/插件生態，正經歷"野蠻生長後的消化不良"——重複、冗餘、殭屍技能堆積，嚴重侵蝕寶貴的上下文窗口資源。
龍蝦之父（Lobster Dad）開源了一個專門給Skill做"全身體檢"的元技能（Meta-Skill），覆蓋五大核心功能：預算審計、重複檢測、閒置篩查、根目錄審計、描述精簡。
上下文窗口是AI大模型最稀缺的資源之一，每一個冗餘Skill的存在，都在用無意義的token搶佔你真正需要的推理空間。
這個工具的核心價值不是"又多了一個Skill"，而是用一個Skill去治理所有Skill——它是基礎設施級別的。
Skill生態的混亂不是個別現象，而是結構性問題。沒有審計機制的插件系統，終將走向熵增。
開源意味著社區可以在此基礎上迭代，這可能是Skill治理標準化的起點。

先說現狀：你的Skill倉庫，可能已經是個垃圾場

這話難聽。但你打開自己的AI助手配置，數一數裝了多少Skill，再想想上一次用到的是哪幾個。

答案大概率讓人沉默。

2025年下半年開始，Cursor、Windsurf、Codex、Claude Code等AI編程工具集體進入"Skill軍備競賽"。社區貢獻者瘋狂輸出，官方內置庫不斷膨脹，個人配置層層疊加。

結果呢？

一個典型的重度用戶，Skill數量輕鬆突破50個。其中能被日常觸發的，可能不到10個。剩下的40個，安靜地躺在那裡，每次對話啟動時被加載進上下文，默默吃掉token預算，然後——什麼都不做。

這不是浪費。這是犯罪。

為什麼這麼說？因為上下文窗口不是無限的。即便到了2026年，主流模型的有效上下文長度在128K到200K token之間，聽起來很多對不對？但你算算：系統提示詞、對話歷史、代碼片段、文件內容、工具定義、Skill描述……真正留給"思考"的空間，遠沒有你想象的寬裕。

每多一個無用Skill的描述文本佔據200個token，50個就是10000 token。一萬個token，夠模型多讀400行代碼了。

這不是理論推演。這是每天都在發生的事。

為什麼沒人管？因為"加"比"減"容易一萬倍

人類有個根深蒂固的心理偏差：添加偏好（Addition Bias）。

面對問題，我們本能地想"加點什麼"來解決，而不是"減掉什麼"。2021年發表在《Nature》上的研究明確指出，人類在改進事物時系統性地忽略"減法方案"，即便減法更有效。

Skill生態完美復現了這個偏差。

社區貢獻者寫了新Skill，發佈。用戶覺得"說不定有用"，安裝。官方覺得"功能覆蓋面廣"，內置。

誰來刪？誰來審計？誰來說"這個Skill跟那個重複了，幹掉一個"？

沒有人。

因為刪除沒有激勵。寫一個新Skill，能獲得star、能被社區認可、能寫進簡歷。清理一箇舊Skill？什麼都得不到。

這就是結構性困境。不是技術問題，是激勵機制問題。

直到有人決定：我不管激勵，這事我來幹。

龍蝦之父出手：用一個Skill，治理所有Skill

龍蝦之父是誰？如果你混AI編程工具社區，這個ID你不會陌生。長期活躍在Codex和Claude生態的深度玩家，以系統性思考和工程化潔癖著稱。"龍蝦之父"這個稱呼本身就帶著社區的認可——能被冠以"之父"，說明在某個垂直領域，他就是那個繞不過去的人。

這次他開源的東西，本質上是一個元技能（Meta-Skill）。

什麼叫元技能？就是"管理技能的技能"。它不幫你寫代碼，不幫你調API，不幫你生成文檔。它只做一件事：給你現有的所有Skill做一次徹底的、量化的、可執行的體檢。

五大功能，逐個拆解。

功能一：技能提示詞預算審計

這是最硬核的一個。

它做的事情很直接：計算每個Skill佔用的上下文token空間，算出各自佔總預算的百分比，然後給出優化建議。

為什麼這很重要？因為絕大多數用戶對"Skill到底吃了多少資源"這件事，完全沒有感知。

你以為裝了一個Skill只是多了一個功能。實際上，每個Skill的描述文本、參數定義、示例代碼、觸發規則，全部要寫進系統提示詞。模型每次推理，都要先"讀"一遍這些內容，才能決定是否調用。

這就像你揹著一個登山包，裡面裝了50件工具。你以為"帶著不虧"，但每多一公斤，你的體能消耗就多一分。等你真正需要衝刺的時候，你已經沒力氣了。

預算審計做的事，就是把揹包打開，告訴你："這把瑞士軍刀佔了3公斤但你從來沒用過，扔了吧。"

功能二：重複技能檢測

這個功能解決的問題，可能比你想象的嚴重。

它的掃描範圍覆蓋四個層級：

Codex內置庫
插件緩存
代碼庫
個人技能根目錄

跨層級掃描同名、描述相似、功能重疊的技能，標記冗餘項。

為什麼會有重複？原因很多。

官方內置了一個"代碼格式化"Skill，你不知道，又從社區裝了一個功能幾乎一樣的。兩個Skill，做同一件事，佔兩份預算。

或者更隱蔽的：你半年前寫了一個自定義Skill處理JSON解析，後來官方更新，內置庫里加了一個更好的。你的舊版本還在，沒人告訴你該刪了。

重複檢測不只看名字。名字不同但描述高度相似的，一樣會被標出來。這才是真正有技術含量的部分——它要做語義層面的相似度比對，不是簡單的字符串匹配。

功能三：未使用技能篩查

基於歷史日誌，識別長期未被調用的"殭屍技能"。

這個邏輯很清晰：如果一個Skill在過去30天、60天、90天裡從未被觸發過，大概率說明兩種情況——要麼你的工作流不需要它，要麼它的觸發條件設計有問題導致模型從不選擇它。

無論哪種，結論一樣：它在白白消耗預算。

這個功能輸出的是一份"清理候選清單"。注意，是"候選"，不是直接刪除。最終決策權在用戶手裡。這個設計很剋制，也很聰明——它知道自己的邊界在哪裡。

有些Skill確實是低頻但關鍵的。比如"數據庫遷移輔助"，你可能三個月才用一次，但用的時候救命。所以篩查結果是參考，不是判決。

功能四：技能根目錄審計

這個功能偏"運維"屬性，但極其實用。

它做的事：統計所有Skill的來源目錄，標註啟用/禁用狀態，梳理加載鏈路。

為什麼需要這個？因為Skill的來源是多元的。有的來自全局配置，有的來自項目級配置，有的來自插件自動注入，有的來自用戶手動創建。

當Skill數量少的時候，你心裡有數。當數量膨脹到幾十個，你已經搞不清"這個Skill是從哪來的""我能不能安全地刪掉它""刪了會不會影響其他東西"。

根目錄審計就是給你畫一張地圖。告訴你每個Skill住在哪裡、誰加載了它、它現在是活的還是死的。

有了這張地圖，你才能安全地動手術。

功能五：描述精簡優化

最後一個功能，看起來最"小"，實際上槓杆極大。

它做的事：找出那些描述過於冗長的Skill，推薦精簡方案。

為什麼描述長度這麼重要？回到前面說的：Skill描述是要寫進系統提示詞的。每個字都是token。一個Skill的描述如果能從200 token壓縮到80 token，節省的空間乘以Skill數量，總量非常可觀。

很多社區貢獻的Skill，描述寫得像論文摘要——背景、動機、適用場景、注意事項、示例輸入輸出，洋洋灑灑。寫的人用心良苦，但從工程角度看，這是過度設計。

模型需要的描述是：精準、唯一、可區分。用最少的詞讓模型明白"這個Skill幹什麼、什麼時候該調用它"就夠了。多餘的每一個字，都是對上下文預算的浪費。

描述精簡這個功能，本質上是在做"提示詞工程的逆向優化"——不是寫更好的提示詞，而是把已有的提示詞壓得更短，同時不損失信息量。

含金量在哪？不是功能，是思維方式

五個功能拆完了。單看每一個，似乎都不算"驚天動地"。但組合在一起，它代表的是一種思維範式的轉變：

從"創造更多Skill"到"治理現有Skill"。

這件事的含金量，不在代碼量，不在算法複雜度，而在——終於有人把這個問題當成"一等公民"來對待了。

過去兩年，AI工具生態的注意力全在"做加法"。更多模型、更多功能、更多插件、更多Skill。跑得快，跑得猛，沒人回頭看。

但任何一個有工程經驗的人都知道：系統的複雜度增長到一定程度，如果沒有對應的治理機制，它會坍塌。

不是可能。是一定。

軟件工程裡有個概念叫"技術債"。每一個臨時方案、每一次"先這樣吧"、每一個沒有清理的冗餘，都是在借債。借得越多，利息越高，直到某天你發現所有精力都在還債，沒有餘力做新事情。

Skill生態的技術債，已經到了必須正視的時刻。

龍蝦之父這個工具，本質上是一個債務審計器。它不幫你還債，但它告訴你：你欠了多少、欠在哪裡、哪些該優先還。

這比"又寫了一個好用的Skill"有價值得多。

開源的意義：從個人工具到社區標準

龍蝦之父選擇開源，這個決策本身值得說道。

他完全可以把這個工具做成付費插件。市場需求明確，痛點真實存在，付費用戶不會少。但他選擇了開源。

為什麼？

我猜有兩層考量。

第一層：這個工具要真正發揮價值，需要社區共建。不同AI平臺的Skill加載機制不同、日誌格式不同、目錄結構不同。一個人適配不過來，但一百個貢獻者可以。

第二層：他可能想推動的不只是一個工具，而是一個標準。Skill治理應該怎麼做？審計的維度有哪些？預算分配的最佳實踐是什麼？這些問題，需要社區共識才能形成答案。

開源是形成共識的最好方式。

回顧軟件工程歷史，ESLint之於JavaScript代碼規範、Black之於Python格式化、Prettier之於前端代碼風格——這些工具之所以成為事實標準，都是因為開源讓社區參與了規則的制定。

龍蝦之父的這個Meta-Skill，有沒有可能成為Skill治理的ESLint？

現在判斷太早。但方向是對的。

一個更深的問題：Skill系統本身該不該重新設計？

審計工具解決的是"存量問題"。但如果我們把視角拉高一層，會發現一個更根本的問題：

為什麼Skill會失控？

答案是：當前的Skill系統缺乏生命週期管理。

一個Skill被創建之後，它就永遠存在了。沒有過期機制、沒有版本淘汰、沒有活躍度衰減。它像一個永遠不會死的進程，佔著資源，直到有人手動kill它。

對比一下操作系統的進程管理：有創建、有調度、有休眠、有終止。生命週期完整閉環。

再對比一下包管理器的依賴管理：npm audit檢查安全漏洞、npm outdated檢查過期依賴、npm prune清理無用包。治理工具是生態的一部分。

Skill系統呢？創建→使用→……沒了。中間缺失了大量環節。

龍蝦之父的工具，本質上是在用外部工具彌補系統設計的缺失。它很有用，但它也暴露了一個事實：AI工具平臺在Skill治理方面的基礎設施，還處於原始階段。

這不是批評。這是發展階段的必然。2024到2025年，平臺方的首要目標是"讓生態跑起來"，治理可以後面再說。但到了2026年中，生態已經跑起來了。是時候補課了。

寫在最後

回到最初的問題：你的AI助手裡，有多少Skill是活的？

如果你答不上來，說明你需要做一次體檢。

龍蝦之父給了工具。免費的。開源的。五個維度，全覆蓋。

用不用，是你的事。

但有一點我很確定：那些認真對待上下文預算的人，會比那些無腦堆Skill的人，獲得更好的AI輔助體驗。

因為AI不是萬能的。它的注意力有限、它的記憶有限、它的推理資源有限。你給它的信息越精準、越乾淨，它回饋你的輸出就越好。

這不是玄學。這是信息論。

Shannon早在1948年就告訴我們：信道容量有限，噪聲越多，有效信息傳輸率越低。

你的Skill列表裡那些殭屍技能，就是噪聲。

幹掉它們。

參考引用

Adams, G. S., Converse, B. A., Hales, A. H., & Klotz, L. E. (2021). People systematically overlook subtractive changes. Nature, 592(7853), 258–261.
Shannon, C. E. (1948). A Mathematical Theory of Communication. Bell System Technical Journal, 27(3), 379–423.
OpenAI. (2024). GPT-4 Turbo context window and token limits documentation. https://platform.openai.com/docs/models
Anthropic. (2025). Claude model card: Context window utilization and system prompt overhead. https://docs.anthropic.com/en/docs/about-claude/models
Cursor Team. (2025). Rules & Skills: How custom instructions are loaded into context. Cursor Documentation.
npm Documentation. (2025). npm-audit, npm-prune: Managing package lifecycle. https://docs.npmjs.com/cli
龍蝦之父. (2026). Skill Health Check Meta-Skill [開源項目]. GitHub Repository.
Sculley, D., et al. (2015). Hidden Technical Debt in Machine Learning Systems. Advances in Neural Information Processing Systems (NeurIPS), 28.

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論