Skill膨胀时代，龙虾之父掏出了一把手术刀

ME News

那些认真对待上下文预算的人，会比那些无脑堆Skill的人，获得更好的AI辅助体验。

文章作者、来源：0x9999in1，ME News

TL;DR

当前主流AI编程助手的Skill/插件生态，正经历"野蛮生长后的消化不良"——重复、冗余、僵尸技能堆积，严重侵蚀宝贵的上下文窗口资源。
龙虾之父（Lobster Dad）开源了一个专门给Skill做"全身体检"的元技能（Meta-Skill），覆盖五大核心功能：预算审计、重复检测、闲置筛查、根目录审计、描述精简。
上下文窗口是AI大模型最稀缺的资源之一，每一个冗余Skill的存在，都在用无意义的token抢占你真正需要的推理空间。
这个工具的核心价值不是"又多了一个Skill"，而是用一个Skill去治理所有Skill——它是基础设施级别的。
Skill生态的混乱不是个别现象，而是结构性问题。没有审计机制的插件系统，终将走向熵增。
开源意味着社区可以在此基础上迭代，这可能是Skill治理标准化的起点。

先说现状：你的Skill仓库，可能已经是个垃圾场

这话难听。但你打开自己的AI助手配置，数一数装了多少Skill，再想想上一次用到的是哪几个。

答案大概率让人沉默。

2025年下半年开始，Cursor、Windsurf、Codex、Claude Code等AI编程工具集体进入"Skill军备竞赛"。社区贡献者疯狂输出，官方内置库不断膨胀，个人配置层层叠加。

结果呢？

一个典型的重度用户，Skill数量轻松突破50个。其中能被日常触发的，可能不到10个。剩下的40个，安静地躺在那里，每次对话启动时被加载进上下文，默默吃掉token预算，然后——什么都不做。

这不是浪费。这是犯罪。

为什么这么说？因为上下文窗口不是无限的。即便到了2026年，主流模型的有效上下文长度在128K到200K token之间，听起来很多对不对？但你算算：系统提示词、对话历史、代码片段、文件内容、工具定义、Skill描述……真正留给"思考"的空间，远没有你想象的宽裕。

每多一个无用Skill的描述文本占据200个token，50个就是10000 token。一万个token，够模型多读400行代码了。

这不是理论推演。这是每天都在发生的事。

为什么没人管？因为"加"比"减"容易一万倍

人类有个根深蒂固的心理偏差：添加偏好（Addition Bias）。

面对问题，我们本能地想"加点什么"来解决，而不是"减掉什么"。2021年发表在《Nature》上的研究明确指出，人类在改进事物时系统性地忽略"减法方案"，即便减法更有效。

Skill生态完美复现了这个偏差。

社区贡献者写了新Skill，发布。用户觉得"说不定有用"，安装。官方觉得"功能覆盖面广"，内置。

谁来删？谁来审计？谁来说"这个Skill跟那个重复了，干掉一个"？

没有人。

因为删除没有激励。写一个新Skill，能获得star、能被社区认可、能写进简历。清理一个旧Skill？什么都得不到。

这就是结构性困境。不是技术问题，是激励机制问题。

直到有人决定：我不管激励，这事我来干。

龙虾之父出手：用一个Skill，治理所有Skill

龙虾之父是谁？如果你混AI编程工具社区，这个ID你不会陌生。长期活跃在Codex和Claude生态的深度玩家，以系统性思考和工程化洁癖著称。"龙虾之父"这个称呼本身就带着社区的认可——能被冠以"之父"，说明在某个垂直领域，他就是那个绕不过去的人。

这次他开源的东西，本质上是一个元技能（Meta-Skill）。

什么叫元技能？就是"管理技能的技能"。它不帮你写代码，不帮你调API，不帮你生成文档。它只做一件事：给你现有的所有Skill做一次彻底的、量化的、可执行的体检。

五大功能，逐个拆解。

功能一：技能提示词预算审计

这是最硬核的一个。

它做的事情很直接：计算每个Skill占用的上下文token空间，算出各自占总预算的百分比，然后给出优化建议。

为什么这很重要？因为绝大多数用户对"Skill到底吃了多少资源"这件事，完全没有感知。

你以为装了一个Skill只是多了一个功能。实际上，每个Skill的描述文本、参数定义、示例代码、触发规则，全部要写进系统提示词。模型每次推理，都要先"读"一遍这些内容，才能决定是否调用。

这就像你背着一个登山包，里面装了50件工具。你以为"带着不亏"，但每多一公斤，你的体能消耗就多一分。等你真正需要冲刺的时候，你已经没力气了。

预算审计做的事，就是把背包打开，告诉你："这把瑞士军刀占了3公斤但你从来没用过，扔了吧。"

功能二：重复技能检测

这个功能解决的问题，可能比你想象的严重。

它的扫描范围覆盖四个层级：

Codex内置库
插件缓存
代码库
个人技能根目录

跨层级扫描同名、描述相似、功能重叠的技能，标记冗余项。

为什么会有重复？原因很多。

官方内置了一个"代码格式化"Skill，你不知道，又从社区装了一个功能几乎一样的。两个Skill，做同一件事，占两份预算。

或者更隐蔽的：你半年前写了一个自定义Skill处理JSON解析，后来官方更新，内置库里加了一个更好的。你的旧版本还在，没人告诉你该删了。

重复检测不只看名字。名字不同但描述高度相似的，一样会被标出来。这才是真正有技术含量的部分——它要做语义层面的相似度比对，不是简单的字符串匹配。

功能三：未使用技能筛查

基于历史日志，识别长期未被调用的"僵尸技能"。

这个逻辑很清晰：如果一个Skill在过去30天、60天、90天里从未被触发过，大概率说明两种情况——要么你的工作流不需要它，要么它的触发条件设计有问题导致模型从不选择它。

无论哪种，结论一样：它在白白消耗预算。

这个功能输出的是一份"清理候选清单"。注意，是"候选"，不是直接删除。最终决策权在用户手里。这个设计很克制，也很聪明——它知道自己的边界在哪里。

有些Skill确实是低频但关键的。比如"数据库迁移辅助"，你可能三个月才用一次，但用的时候救命。所以筛查结果是参考，不是判决。

功能四：技能根目录审计

这个功能偏"运维"属性，但极其实用。

它做的事：统计所有Skill的来源目录，标注启用/禁用状态，梳理加载链路。

为什么需要这个？因为Skill的来源是多元的。有的来自全局配置，有的来自项目级配置，有的来自插件自动注入，有的来自用户手动创建。

当Skill数量少的时候，你心里有数。当数量膨胀到几十个，你已经搞不清"这个Skill是从哪来的""我能不能安全地删掉它""删了会不会影响其他东西"。

根目录审计就是给你画一张地图。告诉你每个Skill住在哪里、谁加载了它、它现在是活的还是死的。

有了这张地图，你才能安全地动手术。

功能五：描述精简优化

最后一个功能，看起来最"小"，实际上杠杆极大。

它做的事：找出那些描述过于冗长的Skill，推荐精简方案。

为什么描述长度这么重要？回到前面说的：Skill描述是要写进系统提示词的。每个字都是token。一个Skill的描述如果能从200 token压缩到80 token，节省的空间乘以Skill数量，总量非常可观。

很多社区贡献的Skill，描述写得像论文摘要——背景、动机、适用场景、注意事项、示例输入输出，洋洋洒洒。写的人用心良苦，但从工程角度看，这是过度设计。

模型需要的描述是：精准、唯一、可区分。用最少的词让模型明白"这个Skill干什么、什么时候该调用它"就够了。多余的每一个字，都是对上下文预算的浪费。

描述精简这个功能，本质上是在做"提示词工程的逆向优化"——不是写更好的提示词，而是把已有的提示词压得更短，同时不损失信息量。

含金量在哪？不是功能，是思维方式

五个功能拆完了。单看每一个，似乎都不算"惊天动地"。但组合在一起，它代表的是一种思维范式的转变：

从"创造更多Skill"到"治理现有Skill"。

这件事的含金量，不在代码量，不在算法复杂度，而在——终于有人把这个问题当成"一等公民"来对待了。

过去两年，AI工具生态的注意力全在"做加法"。更多模型、更多功能、更多插件、更多Skill。跑得快，跑得猛，没人回头看。

但任何一个有工程经验的人都知道：系统的复杂度增长到一定程度，如果没有对应的治理机制，它会坍塌。

不是可能。是一定。

软件工程里有个概念叫"技术债"。每一个临时方案、每一次"先这样吧"、每一个没有清理的冗余，都是在借债。借得越多，利息越高，直到某天你发现所有精力都在还债，没有余力做新事情。

Skill生态的技术债，已经到了必须正视的时刻。

龙虾之父这个工具，本质上是一个债务审计器。它不帮你还债，但它告诉你：你欠了多少、欠在哪里、哪些该优先还。

这比"又写了一个好用的Skill"有价值得多。

开源的意义：从个人工具到社区标准

龙虾之父选择开源，这个决策本身值得说道。

他完全可以把这个工具做成付费插件。市场需求明确，痛点真实存在，付费用户不会少。但他选择了开源。

为什么？

我猜有两层考量。

第一层：这个工具要真正发挥价值，需要社区共建。不同AI平台的Skill加载机制不同、日志格式不同、目录结构不同。一个人适配不过来，但一百个贡献者可以。

第二层：他可能想推动的不只是一个工具，而是一个标准。Skill治理应该怎么做？审计的维度有哪些？预算分配的最佳实践是什么？这些问题，需要社区共识才能形成答案。

开源是形成共识的最好方式。

回顾软件工程历史，ESLint之于JavaScript代码规范、Black之于Python格式化、Prettier之于前端代码风格——这些工具之所以成为事实标准，都是因为开源让社区参与了规则的制定。

龙虾之父的这个Meta-Skill，有没有可能成为Skill治理的ESLint？

现在判断太早。但方向是对的。

一个更深的问题：Skill系统本身该不该重新设计？

审计工具解决的是"存量问题"。但如果我们把视角拉高一层，会发现一个更根本的问题：

为什么Skill会失控？

答案是：当前的Skill系统缺乏生命周期管理。

一个Skill被创建之后，它就永远存在了。没有过期机制、没有版本淘汰、没有活跃度衰减。它像一个永远不会死的进程，占着资源，直到有人手动kill它。

对比一下操作系统的进程管理：有创建、有调度、有休眠、有终止。生命周期完整闭环。

再对比一下包管理器的依赖管理：npm audit检查安全漏洞、npm outdated检查过期依赖、npm prune清理无用包。治理工具是生态的一部分。

Skill系统呢？创建→使用→……没了。中间缺失了大量环节。

龙虾之父的工具，本质上是在用外部工具弥补系统设计的缺失。它很有用，但它也暴露了一个事实：AI工具平台在Skill治理方面的基础设施，还处于原始阶段。

这不是批评。这是发展阶段的必然。2024到2025年，平台方的首要目标是"让生态跑起来"，治理可以后面再说。但到了2026年中，生态已经跑起来了。是时候补课了。

写在最后

回到最初的问题：你的AI助手里，有多少Skill是活的？

如果你答不上来，说明你需要做一次体检。

龙虾之父给了工具。免费的。开源的。五个维度，全覆盖。

用不用，是你的事。

但有一点我很确定：那些认真对待上下文预算的人，会比那些无脑堆Skill的人，获得更好的AI辅助体验。

因为AI不是万能的。它的注意力有限、它的记忆有限、它的推理资源有限。你给它的信息越精准、越干净，它回馈你的输出就越好。

这不是玄学。这是信息论。

Shannon早在1948年就告诉我们：信道容量有限，噪声越多，有效信息传输率越低。

你的Skill列表里那些僵尸技能，就是噪声。

干掉它们。

参考引用

Adams, G. S., Converse, B. A., Hales, A. H., & Klotz, L. E. (2021). People systematically overlook subtractive changes. Nature, 592(7853), 258–261.
Shannon, C. E. (1948). A Mathematical Theory of Communication. Bell System Technical Journal, 27(3), 379–423.
OpenAI. (2024). GPT-4 Turbo context window and token limits documentation. https://platform.openai.com/docs/models
Anthropic. (2025). Claude model card: Context window utilization and system prompt overhead. https://docs.anthropic.com/en/docs/about-claude/models
Cursor Team. (2025). Rules & Skills: How custom instructions are loaded into context. Cursor Documentation.
npm Documentation. (2025). npm-audit, npm-prune: Managing package lifecycle. https://docs.npmjs.com/cli
龙虾之父. (2026). Skill Health Check Meta-Skill [开源项目]. GitHub Repository.
Sculley, D., et al. (2015). Hidden Technical Debt in Machine Learning Systems. Advances in Neural Information Processing Systems (NeurIPS), 28.

来源

免责声明：以上内容仅为作者观点，不代表Followin的任何立场，不构成与Followin相关的任何投资建议。

喜欢