Skill膨脹時代,龍蝦之父掏出了一把手術刀

那些認真對待上下文預算的人,會比那些無腦堆Skill的人,獲得更好的AI輔助體驗。

文章作者、來源:0x9999in1,ME News

TL;DR

  • 當前主流AI編程助手的Skill/插件生態,正經歷"野蠻生長後的消化不良"——重複、冗餘、殭屍技能堆積,嚴重侵蝕寶貴的上下文窗口資源。
  • 龍蝦之父(Lobster Dad)開源了一個專門給Skill做"全身體檢"的元技能(Meta-Skill),覆蓋五大核心功能:預算審計、重複檢測、閒置篩查、根目錄審計、描述精簡。
  • 上下文窗口是AI大模型最稀缺的資源之一,每一個冗餘Skill的存在,都在用無意義的token搶佔你真正需要的推理空間。
  • 這個工具的核心價值不是"又多了一個Skill",而是用一個Skill去治理所有Skill——它是基礎設施級別的。
  • Skill生態的混亂不是個別現象,而是結構性問題。沒有審計機制的插件系統,終將走向熵增。
  • 開源意味著社區可以在此基礎上迭代,這可能是Skill治理標準化的起點。

先說現狀:你的Skill倉庫,可能已經是個垃圾場

這話難聽。但你打開自己的AI助手配置,數一數裝了多少Skill,再想想上一次用到的是哪幾個。

答案大概率讓人沉默。

2025年下半年開始,Cursor、Windsurf、Codex、Claude Code等AI編程工具集體進入"Skill軍備競賽"。社區貢獻者瘋狂輸出,官方內置庫不斷膨脹,個人配置層層疊加。

結果呢?

一個典型的重度用戶,Skill數量輕鬆突破50個。其中能被日常觸發的,可能不到10個。剩下的40個,安靜地躺在那裡,每次對話啟動時被加載進上下文,默默吃掉token預算,然後——什麼都不做。

這不是浪費。這是犯罪。

為什麼這麼說?因為上下文窗口不是無限的。即便到了2026年,主流模型的有效上下文長度在128K到200K token之間,聽起來很多對不對?但你算算:系統提示詞、對話歷史、代碼片段、文件內容、工具定義、Skill描述……真正留給"思考"的空間,遠沒有你想象的寬裕。

每多一個無用Skill的描述文本佔據200個token,50個就是10000 token。一萬個token,夠模型多讀400行代碼了。

這不是理論推演。這是每天都在發生的事。

為什麼沒人管?因為"加"比"減"容易一萬倍

人類有個根深蒂固的心理偏差:添加偏好(Addition Bias)。

面對問題,我們本能地想"加點什麼"來解決,而不是"減掉什麼"。2021年發表在《Nature》上的研究明確指出,人類在改進事物時系統性地忽略"減法方案",即便減法更有效。

Skill生態完美復現了這個偏差。

社區貢獻者寫了新Skill,發佈。用戶覺得"說不定有用",安裝。官方覺得"功能覆蓋面廣",內置。

誰來刪?誰來審計?誰來說"這個Skill跟那個重複了,幹掉一個"?

沒有人。

因為刪除沒有激勵。寫一個新Skill,能獲得star、能被社區認可、能寫進簡歷。清理一箇舊Skill?什麼都得不到。

這就是結構性困境。不是技術問題,是激勵機制問題。

直到有人決定:我不管激勵,這事我來幹。

龍蝦之父出手:用一個Skill,治理所有Skill

龍蝦之父是誰?如果你混AI編程工具社區,這個ID你不會陌生。長期活躍在Codex和Claude生態的深度玩家,以系統性思考和工程化潔癖著稱。"龍蝦之父"這個稱呼本身就帶著社區的認可——能被冠以"之父",說明在某個垂直領域,他就是那個繞不過去的人。

這次他開源的東西,本質上是一個元技能(Meta-Skill)。

什麼叫元技能?就是"管理技能的技能"。它不幫你寫代碼,不幫你調API,不幫你生成文檔。它只做一件事:給你現有的所有Skill做一次徹底的、量化的、可執行的體檢。

五大功能,逐個拆解。

功能一:技能提示詞預算審計

這是最硬核的一個。

它做的事情很直接:計算每個Skill佔用的上下文token空間,算出各自佔總預算的百分比,然後給出優化建議。

為什麼這很重要?因為絕大多數用戶對"Skill到底吃了多少資源"這件事,完全沒有感知。

你以為裝了一個Skill只是多了一個功能。實際上,每個Skill的描述文本、參數定義、示例代碼、觸發規則,全部要寫進系統提示詞。模型每次推理,都要先"讀"一遍這些內容,才能決定是否調用。

這就像你揹著一個登山包,裡面裝了50件工具。你以為"帶著不虧",但每多一公斤,你的體能消耗就多一分。等你真正需要衝刺的時候,你已經沒力氣了。

預算審計做的事,就是把揹包打開,告訴你:"這把瑞士軍刀佔了3公斤但你從來沒用過,扔了吧。"

功能二:重複技能檢測

這個功能解決的問題,可能比你想象的嚴重。

它的掃描範圍覆蓋四個層級:

  • Codex內置庫
  • 插件緩存
  • 代碼庫
  • 個人技能根目錄

跨層級掃描同名、描述相似、功能重疊的技能,標記冗餘項。

為什麼會有重複?原因很多。

官方內置了一個"代碼格式化"Skill,你不知道,又從社區裝了一個功能幾乎一樣的。兩個Skill,做同一件事,佔兩份預算。

或者更隱蔽的:你半年前寫了一個自定義Skill處理JSON解析,後來官方更新,內置庫里加了一個更好的。你的舊版本還在,沒人告訴你該刪了。

重複檢測不只看名字。名字不同但描述高度相似的,一樣會被標出來。這才是真正有技術含量的部分——它要做語義層面的相似度比對,不是簡單的字符串匹配。

功能三:未使用技能篩查

基於歷史日誌,識別長期未被調用的"殭屍技能"。

這個邏輯很清晰:如果一個Skill在過去30天、60天、90天裡從未被觸發過,大概率說明兩種情況——要麼你的工作流不需要它,要麼它的觸發條件設計有問題導致模型從不選擇它。

無論哪種,結論一樣:它在白白消耗預算。

這個功能輸出的是一份"清理候選清單"。注意,是"候選",不是直接刪除。最終決策權在用戶手裡。這個設計很剋制,也很聰明——它知道自己的邊界在哪裡。

有些Skill確實是低頻但關鍵的。比如"數據庫遷移輔助",你可能三個月才用一次,但用的時候救命。所以篩查結果是參考,不是判決。

功能四:技能根目錄審計

這個功能偏"運維"屬性,但極其實用。

它做的事:統計所有Skill的來源目錄,標註啟用/禁用狀態,梳理加載鏈路。

為什麼需要這個?因為Skill的來源是多元的。有的來自全局配置,有的來自項目級配置,有的來自插件自動注入,有的來自用戶手動創建。

當Skill數量少的時候,你心裡有數。當數量膨脹到幾十個,你已經搞不清"這個Skill是從哪來的""我能不能安全地刪掉它""刪了會不會影響其他東西"。

根目錄審計就是給你畫一張地圖。告訴你每個Skill住在哪裡、誰加載了它、它現在是活的還是死的。

有了這張地圖,你才能安全地動手術。

功能五:描述精簡優化

最後一個功能,看起來最"小",實際上槓杆極大。

它做的事:找出那些描述過於冗長的Skill,推薦精簡方案。

為什麼描述長度這麼重要?回到前面說的:Skill描述是要寫進系統提示詞的。每個字都是token。一個Skill的描述如果能從200 token壓縮到80 token,節省的空間乘以Skill數量,總量非常可觀。

很多社區貢獻的Skill,描述寫得像論文摘要——背景、動機、適用場景、注意事項、示例輸入輸出,洋洋灑灑。寫的人用心良苦,但從工程角度看,這是過度設計。

模型需要的描述是:精準、唯一、可區分。用最少的詞讓模型明白"這個Skill幹什麼、什麼時候該調用它"就夠了。多餘的每一個字,都是對上下文預算的浪費。

描述精簡這個功能,本質上是在做"提示詞工程的逆向優化"——不是寫更好的提示詞,而是把已有的提示詞壓得更短,同時不損失信息量。

含金量在哪?不是功能,是思維方式

五個功能拆完了。單看每一個,似乎都不算"驚天動地"。但組合在一起,它代表的是一種思維範式的轉變:

從"創造更多Skill"到"治理現有Skill"。

這件事的含金量,不在代碼量,不在算法複雜度,而在——終於有人把這個問題當成"一等公民"來對待了。

過去兩年,AI工具生態的注意力全在"做加法"。更多模型、更多功能、更多插件、更多Skill。跑得快,跑得猛,沒人回頭看。

但任何一個有工程經驗的人都知道:系統的複雜度增長到一定程度,如果沒有對應的治理機制,它會坍塌。

不是可能。是一定。

軟件工程裡有個概念叫"技術債"。每一個臨時方案、每一次"先這樣吧"、每一個沒有清理的冗餘,都是在借債。借得越多,利息越高,直到某天你發現所有精力都在還債,沒有餘力做新事情。

Skill生態的技術債,已經到了必須正視的時刻。

龍蝦之父這個工具,本質上是一個債務審計器。它不幫你還債,但它告訴你:你欠了多少、欠在哪裡、哪些該優先還。

這比"又寫了一個好用的Skill"有價值得多。

開源的意義:從個人工具到社區標準

龍蝦之父選擇開源,這個決策本身值得說道。

他完全可以把這個工具做成付費插件。市場需求明確,痛點真實存在,付費用戶不會少。但他選擇了開源。

為什麼?

我猜有兩層考量。

第一層:這個工具要真正發揮價值,需要社區共建。不同AI平臺的Skill加載機制不同、日誌格式不同、目錄結構不同。一個人適配不過來,但一百個貢獻者可以。

第二層:他可能想推動的不只是一個工具,而是一個標準。Skill治理應該怎麼做?審計的維度有哪些?預算分配的最佳實踐是什麼?這些問題,需要社區共識才能形成答案。

開源是形成共識的最好方式。

回顧軟件工程歷史,ESLint之於JavaScript代碼規範、Black之於Python格式化、Prettier之於前端代碼風格——這些工具之所以成為事實標準,都是因為開源讓社區參與了規則的制定。

龍蝦之父的這個Meta-Skill,有沒有可能成為Skill治理的ESLint?

現在判斷太早。但方向是對的。

一個更深的問題:Skill系統本身該不該重新設計?

審計工具解決的是"存量問題"。但如果我們把視角拉高一層,會發現一個更根本的問題:

為什麼Skill會失控?

答案是:當前的Skill系統缺乏生命週期管理。

一個Skill被創建之後,它就永遠存在了。沒有過期機制、沒有版本淘汰、沒有活躍度衰減。它像一個永遠不會死的進程,佔著資源,直到有人手動kill它。

對比一下操作系統的進程管理:有創建、有調度、有休眠、有終止。生命週期完整閉環。

再對比一下包管理器的依賴管理:npm audit檢查安全漏洞、npm outdated檢查過期依賴、npm prune清理無用包。治理工具是生態的一部分。

Skill系統呢?創建→使用→……沒了。中間缺失了大量環節。

龍蝦之父的工具,本質上是在用外部工具彌補系統設計的缺失。它很有用,但它也暴露了一個事實:AI工具平臺在Skill治理方面的基礎設施,還處於原始階段。

這不是批評。這是發展階段的必然。2024到2025年,平臺方的首要目標是"讓生態跑起來",治理可以後面再說。但到了2026年中,生態已經跑起來了。是時候補課了。

寫在最後

回到最初的問題:你的AI助手裡,有多少Skill是活的?

如果你答不上來,說明你需要做一次體檢。

龍蝦之父給了工具。免費的。開源的。五個維度,全覆蓋。

用不用,是你的事。

但有一點我很確定:那些認真對待上下文預算的人,會比那些無腦堆Skill的人,獲得更好的AI輔助體驗。

因為AI不是萬能的。它的注意力有限、它的記憶有限、它的推理資源有限。你給它的信息越精準、越乾淨,它回饋你的輸出就越好。

這不是玄學。這是信息論。

Shannon早在1948年就告訴我們:信道容量有限,噪聲越多,有效信息傳輸率越低。

你的Skill列表裡那些殭屍技能,就是噪聲。

幹掉它們。

參考引用

  1. Adams, G. S., Converse, B. A., Hales, A. H., & Klotz, L. E. (2021). People systematically overlook subtractive changes. Nature, 592(7853), 258–261.
  2. Shannon, C. E. (1948). A Mathematical Theory of Communication. Bell System Technical Journal, 27(3), 379–423.
  3. OpenAI. (2024). GPT-4 Turbo context window and token limits documentation. https://platform.openai.com/docs/models
  4. Anthropic. (2025). Claude model card: Context window utilization and system prompt overhead. https://docs.anthropic.com/en/docs/about-claude/models
  5. Cursor Team. (2025). Rules & Skills: How custom instructions are loaded into context. Cursor Documentation.
  6. npm Documentation. (2025). npm-audit, npm-prune: Managing package lifecycle. https://docs.npmjs.com/cli
  7. 龍蝦之父. (2026). Skill Health Check Meta-Skill [開源項目]. GitHub Repository.
  8. Sculley, D., et al. (2015). Hidden Technical Debt in Machine Learning Systems. Advances in Neural Information Processing Systems (NeurIPS), 28.

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論