那些认真对待上下文预算的人,会比那些无脑堆Skill的人,获得更好的AI辅助体验。
文章作者、来源:0x9999in1,ME News

TL;DR
- 当前主流AI编程助手的Skill/插件生态,正经历"野蛮生长后的消化不良"——重复、冗余、僵尸技能堆积,严重侵蚀宝贵的上下文窗口资源。
- 龙虾之父(Lobster Dad)开源了一个专门给Skill做"全身体检"的元技能(Meta-Skill),覆盖五大核心功能:预算审计、重复检测、闲置筛查、根目录审计、描述精简。
- 上下文窗口是AI大模型最稀缺的资源之一,每一个冗余Skill的存在,都在用无意义的token抢占你真正需要的推理空间。
- 这个工具的核心价值不是"又多了一个Skill",而是用一个Skill去治理所有Skill——它是基础设施级别的。
- Skill生态的混乱不是个别现象,而是结构性问题。没有审计机制的插件系统,终将走向熵增。
- 开源意味着社区可以在此基础上迭代,这可能是Skill治理标准化的起点。
先说现状:你的Skill仓库,可能已经是个垃圾场
这话难听。但你打开自己的AI助手配置,数一数装了多少Skill,再想想上一次用到的是哪几个。
答案大概率让人沉默。
2025年下半年开始,Cursor、Windsurf、Codex、Claude Code等AI编程工具集体进入"Skill军备竞赛"。社区贡献者疯狂输出,官方内置库不断膨胀,个人配置层层叠加。
结果呢?
一个典型的重度用户,Skill数量轻松突破50个。其中能被日常触发的,可能不到10个。剩下的40个,安静地躺在那里,每次对话启动时被加载进上下文,默默吃掉token预算,然后——什么都不做。
这不是浪费。这是犯罪。
为什么这么说?因为上下文窗口不是无限的。即便到了2026年,主流模型的有效上下文长度在128K到200K token之间,听起来很多对不对?但你算算:系统提示词、对话历史、代码片段、文件内容、工具定义、Skill描述……真正留给"思考"的空间,远没有你想象的宽裕。
每多一个无用Skill的描述文本占据200个token,50个就是10000 token。一万个token,够模型多读400行代码了。
这不是理论推演。这是每天都在发生的事。
为什么没人管?因为"加"比"减"容易一万倍
人类有个根深蒂固的心理偏差:添加偏好(Addition Bias)。
面对问题,我们本能地想"加点什么"来解决,而不是"减掉什么"。2021年发表在《Nature》上的研究明确指出,人类在改进事物时系统性地忽略"减法方案",即便减法更有效。
Skill生态完美复现了这个偏差。
社区贡献者写了新Skill,发布。用户觉得"说不定有用",安装。官方觉得"功能覆盖面广",内置。
谁来删?谁来审计?谁来说"这个Skill跟那个重复了,干掉一个"?
没有人。
因为删除没有激励。写一个新Skill,能获得star、能被社区认可、能写进简历。清理一个旧Skill?什么都得不到。
这就是结构性困境。不是技术问题,是激励机制问题。
直到有人决定:我不管激励,这事我来干。
龙虾之父出手:用一个Skill,治理所有Skill
龙虾之父是谁?如果你混AI编程工具社区,这个ID你不会陌生。长期活跃在Codex和Claude生态的深度玩家,以系统性思考和工程化洁癖著称。"龙虾之父"这个称呼本身就带着社区的认可——能被冠以"之父",说明在某个垂直领域,他就是那个绕不过去的人。
这次他开源的东西,本质上是一个元技能(Meta-Skill)。
什么叫元技能?就是"管理技能的技能"。它不帮你写代码,不帮你调API,不帮你生成文档。它只做一件事:给你现有的所有Skill做一次彻底的、量化的、可执行的体检。
五大功能,逐个拆解。

功能一:技能提示词预算审计
这是最硬核的一个。
它做的事情很直接:计算每个Skill占用的上下文token空间,算出各自占总预算的百分比,然后给出优化建议。
为什么这很重要?因为绝大多数用户对"Skill到底吃了多少资源"这件事,完全没有感知。
你以为装了一个Skill只是多了一个功能。实际上,每个Skill的描述文本、参数定义、示例代码、触发规则,全部要写进系统提示词。模型每次推理,都要先"读"一遍这些内容,才能决定是否调用。
这就像你背着一个登山包,里面装了50件工具。你以为"带着不亏",但每多一公斤,你的体能消耗就多一分。等你真正需要冲刺的时候,你已经没力气了。
预算审计做的事,就是把背包打开,告诉你:"这把瑞士军刀占了3公斤但你从来没用过,扔了吧。"
功能二:重复技能检测
这个功能解决的问题,可能比你想象的严重。
它的扫描范围覆盖四个层级:
- Codex内置库
- 插件缓存
- 代码库
- 个人技能根目录
跨层级扫描同名、描述相似、功能重叠的技能,标记冗余项。
为什么会有重复?原因很多。
官方内置了一个"代码格式化"Skill,你不知道,又从社区装了一个功能几乎一样的。两个Skill,做同一件事,占两份预算。
或者更隐蔽的:你半年前写了一个自定义Skill处理JSON解析,后来官方更新,内置库里加了一个更好的。你的旧版本还在,没人告诉你该删了。
重复检测不只看名字。名字不同但描述高度相似的,一样会被标出来。这才是真正有技术含量的部分——它要做语义层面的相似度比对,不是简单的字符串匹配。
功能三:未使用技能筛查
基于历史日志,识别长期未被调用的"僵尸技能"。
这个逻辑很清晰:如果一个Skill在过去30天、60天、90天里从未被触发过,大概率说明两种情况——要么你的工作流不需要它,要么它的触发条件设计有问题导致模型从不选择它。
无论哪种,结论一样:它在白白消耗预算。
这个功能输出的是一份"清理候选清单"。注意,是"候选",不是直接删除。最终决策权在用户手里。这个设计很克制,也很聪明——它知道自己的边界在哪里。
有些Skill确实是低频但关键的。比如"数据库迁移辅助",你可能三个月才用一次,但用的时候救命。所以筛查结果是参考,不是判决。
功能四:技能根目录审计
这个功能偏"运维"属性,但极其实用。
它做的事:统计所有Skill的来源目录,标注启用/禁用状态,梳理加载链路。
为什么需要这个?因为Skill的来源是多元的。有的来自全局配置,有的来自项目级配置,有的来自插件自动注入,有的来自用户手动创建。
当Skill数量少的时候,你心里有数。当数量膨胀到几十个,你已经搞不清"这个Skill是从哪来的""我能不能安全地删掉它""删了会不会影响其他东西"。
根目录审计就是给你画一张地图。告诉你每个Skill住在哪里、谁加载了它、它现在是活的还是死的。
有了这张地图,你才能安全地动手术。
功能五:描述精简优化
最后一个功能,看起来最"小",实际上杠杆极大。
它做的事:找出那些描述过于冗长的Skill,推荐精简方案。
为什么描述长度这么重要?回到前面说的:Skill描述是要写进系统提示词的。每个字都是token。一个Skill的描述如果能从200 token压缩到80 token,节省的空间乘以Skill数量,总量非常可观。
很多社区贡献的Skill,描述写得像论文摘要——背景、动机、适用场景、注意事项、示例输入输出,洋洋洒洒。写的人用心良苦,但从工程角度看,这是过度设计。
模型需要的描述是:精准、唯一、可区分。用最少的词让模型明白"这个Skill干什么、什么时候该调用它"就够了。多余的每一个字,都是对上下文预算的浪费。
描述精简这个功能,本质上是在做"提示词工程的逆向优化"——不是写更好的提示词,而是把已有的提示词压得更短,同时不损失信息量。
含金量在哪?不是功能,是思维方式
五个功能拆完了。单看每一个,似乎都不算"惊天动地"。但组合在一起,它代表的是一种思维范式的转变:
从"创造更多Skill"到"治理现有Skill"。
这件事的含金量,不在代码量,不在算法复杂度,而在——终于有人把这个问题当成"一等公民"来对待了。
过去两年,AI工具生态的注意力全在"做加法"。更多模型、更多功能、更多插件、更多Skill。跑得快,跑得猛,没人回头看。
但任何一个有工程经验的人都知道:系统的复杂度增长到一定程度,如果没有对应的治理机制,它会坍塌。
不是可能。是一定。
软件工程里有个概念叫"技术债"。每一个临时方案、每一次"先这样吧"、每一个没有清理的冗余,都是在借债。借得越多,利息越高,直到某天你发现所有精力都在还债,没有余力做新事情。
Skill生态的技术债,已经到了必须正视的时刻。
龙虾之父这个工具,本质上是一个债务审计器。它不帮你还债,但它告诉你:你欠了多少、欠在哪里、哪些该优先还。
这比"又写了一个好用的Skill"有价值得多。
开源的意义:从个人工具到社区标准
龙虾之父选择开源,这个决策本身值得说道。
他完全可以把这个工具做成付费插件。市场需求明确,痛点真实存在,付费用户不会少。但他选择了开源。
为什么?
我猜有两层考量。
第一层:这个工具要真正发挥价值,需要社区共建。不同AI平台的Skill加载机制不同、日志格式不同、目录结构不同。一个人适配不过来,但一百个贡献者可以。
第二层:他可能想推动的不只是一个工具,而是一个标准。Skill治理应该怎么做?审计的维度有哪些?预算分配的最佳实践是什么?这些问题,需要社区共识才能形成答案。
开源是形成共识的最好方式。
回顾软件工程历史,ESLint之于JavaScript代码规范、Black之于Python格式化、Prettier之于前端代码风格——这些工具之所以成为事实标准,都是因为开源让社区参与了规则的制定。
龙虾之父的这个Meta-Skill,有没有可能成为Skill治理的ESLint?
现在判断太早。但方向是对的。
一个更深的问题:Skill系统本身该不该重新设计?
审计工具解决的是"存量问题"。但如果我们把视角拉高一层,会发现一个更根本的问题:
为什么Skill会失控?
答案是:当前的Skill系统缺乏生命周期管理。
一个Skill被创建之后,它就永远存在了。没有过期机制、没有版本淘汰、没有活跃度衰减。它像一个永远不会死的进程,占着资源,直到有人手动kill它。
对比一下操作系统的进程管理:有创建、有调度、有休眠、有终止。生命周期完整闭环。
再对比一下包管理器的依赖管理:npm audit检查安全漏洞、npm outdated检查过期依赖、npm prune清理无用包。治理工具是生态的一部分。
Skill系统呢?创建→使用→……没了。中间缺失了大量环节。
龙虾之父的工具,本质上是在用外部工具弥补系统设计的缺失。它很有用,但它也暴露了一个事实:AI工具平台在Skill治理方面的基础设施,还处于原始阶段。
这不是批评。这是发展阶段的必然。2024到2025年,平台方的首要目标是"让生态跑起来",治理可以后面再说。但到了2026年中,生态已经跑起来了。是时候补课了。
写在最后
回到最初的问题:你的AI助手里,有多少Skill是活的?
如果你答不上来,说明你需要做一次体检。
龙虾之父给了工具。免费的。开源的。五个维度,全覆盖。
用不用,是你的事。
但有一点我很确定:那些认真对待上下文预算的人,会比那些无脑堆Skill的人,获得更好的AI辅助体验。
因为AI不是万能的。它的注意力有限、它的记忆有限、它的推理资源有限。你给它的信息越精准、越干净,它回馈你的输出就越好。
这不是玄学。这是信息论。
Shannon早在1948年就告诉我们:信道容量有限,噪声越多,有效信息传输率越低。
你的Skill列表里那些僵尸技能,就是噪声。
干掉它们。
参考引用
- Adams, G. S., Converse, B. A., Hales, A. H., & Klotz, L. E. (2021). People systematically overlook subtractive changes. Nature, 592(7853), 258–261.
- Shannon, C. E. (1948). A Mathematical Theory of Communication. Bell System Technical Journal, 27(3), 379–423.
- OpenAI. (2024). GPT-4 Turbo context window and token limits documentation. https://platform.openai.com/docs/models
- Anthropic. (2025). Claude model card: Context window utilization and system prompt overhead. https://docs.anthropic.com/en/docs/about-claude/models
- Cursor Team. (2025). Rules & Skills: How custom instructions are loaded into context. Cursor Documentation.
- npm Documentation. (2025). npm-audit, npm-prune: Managing package lifecycle. https://docs.npmjs.com/cli
- 龙虾之父. (2026). Skill Health Check Meta-Skill [开源项目]. GitHub Repository.
- Sculley, D., et al. (2015). Hidden Technical Debt in Machine Learning Systems. Advances in Neural Information Processing Systems (NeurIPS), 28.





