你打开了一个 GitHub 仓库,准备看代码。翻了一圈,一个 .py 文件都没有,一个 .js 也没有。不是藏起来了,是真的没有。
Anthropic-Cybersecurity-Skills 是一个纯 Markdown 加 YAML 组成的仓库。754 个文件,每一个都是一条结构化的安全技能。名字里的 “Anthropic” 让不少人以为这是官方产品,实际上 README 第一屏就写了 Not affiliated with Anthropic PBC。作者 mukul975,一个人,坐下来给 AI Agent 写了一整套安全操作手册。
我第一次翻这个仓库的时候想法很简单:这不就是一个高级版的安全 checklist 吗?花了两小时看它的 skill 结构和五框架映射之后,我改主意了。这件事比表面看起来有意思得多。
说白了这篇文章就想讲明白一件事:为什么 754 个 Markdown 文件能让 AI Agent 从”会搜索的安全实习生”变成”能独立干活的资深分析师”,以及这件事的边界到底在哪。
打动我的几个地方
Anthropic-Cybersecurity-Skills 的核心卖点,读 README 的时候很容易被数字砸晕:754 条技能、26 个安全领域、5 个框架映射、兼容 26 个以上 AI 平台。但这些数字不是重点。真正让它区别于市面上其他安全资源库的,是三个结构设计。
渐进式加载是这套技能库最聪明的工程决策。每条技能的 YAML frontmatter 只有约 30 tokens,AI Agent 可以一次性扫描全部 754 条技能的元数据,找到相关的 10 到 15 条,再完整加载匹配度最高的 2 到 3 条,每条 500 到 2000 tokens。
这个设计解决了 Agent 在垂直领域面临的核心矛盾:知识量太大塞不进上下文窗口,知识太少又不够用。传统做法是把安全手册、合规文档、工具文档一股脑塞给模型,上下文窗口秒炸,Token 费用飞涨,Agent 还容易在信息海里迷路。三层渐进式披露——扫描元数据、筛选候选、完整加载——把这个问题解得很干净。
五框架映射是目前开源技能库里独一份的设计。每条技能同时映射到 MITRE ATT&CK v19.1、NIST CSF 2.0、MITRE ATLAS v5.4、MITRE D3FEND v1.3、NIST AI RMF 1.0 五个行业框架。举个例子:技能 analyzing-network-traffic-of-malware 映射到 ATT&CK T1071、NIST CSF DE.CM、ATLAS AML.T0047、D3FEND D3-NTA、AI RMF MEASURE-2.6。一条恶意流量分析跑完,你的 Agent 不光把活干了,还能直接输出五套合规框架对应的证据链。它把前线打仗的士兵和后方写合规报告的秘书合二为一了,这在企业安全团队里是一个实打实的效率提升点。
结构化执行流是它和传统安全工具库的根本区别。传统安全资源给的是字典、payload、exploit 代码,这些东西告诉 Agent “能做什么”,但没说”什么时候做、先做什么、做完怎么验证”。每条技能的标准结构是四段:When to Use 判断是否适用、Prerequisites 检查前置条件、Workflow 分步执行、Verification 验证结果。Agent 拿到任务后不是随机调用工具,而是遵循一套经过验证的决策流。这套流程编码的是资深分析师的实际操作习惯,不是模型自己生成的摘要。

这三种设计——渐进式加载、五框架映射、结构化决策流——单看都不新鲜。合在一起,而且覆盖了云安全、威胁狩猎、恶意软件分析、数字取证、事件响应等 26 个安全领域,市面上目前找不出第二个同等规模且同等结构化的开源项目。
不过有一件事我必须先说清楚:这些技能不会自己跑。它不是一个你 pip install 之后敲 security-skill analyze 就能用的命令行工具,它是一个知识库,Agent 拿着它去调 Volatility3、Nmap、Splunk 这些真工具的时候,知道该按什么顺序调、调完怎么验证。把技能库当安全工具用的人会失望,把它当 Agent 的知识底座用的人会惊喜。
上手什么感觉
装这个东西不需要编译、不需要配置环境变量、不需要申请 API Key。两种方式:
# 推荐:通过 npx 一键安装
npx skills add mukul975/Anthropic-Cybersecurity-Skills
# 或者直接 clone
git clone https://github.com/mukul975/Anthropic-Cybersecurity-Skills.git
cd Anthropic-Cybersecurity-Skills
装完之后 Claude Code、GitHub Copilot、Cursor、OpenAI Codex CLI、Gemini CLI 等支持 agentskills.io 标准的平台会自动发现这些技能文件。你的 Agent 马上就能在处理安全任务时调用它们。
但有几个事需要提前知道。
- 第一个坑:名字里的 “Anthropic” 容易让人以为装了之后 Claude Code 会原生集成,实际上它和 Anthropic 没有任何关系。在 Claude Code 里的体验和在 Cursor 里没有区别,Agent 读取本地技能文件,不调用任何远程 API。
- 第二个要注意的:技能质量在不同领域之间差异明显。Cloud Security(60 条)、Threat Hunting(55 条)、Threat Intelligence(50 条)这些主流领域的技能内容扎实,Workflow 部分有具体命令和决策分支。但 Deception Technology 只有 2 条技能,Compliance & Governance 只有 5 条。作者自己在 CONTRIBUTING.md 里也标注了这两个领域”最需要帮助”。如果你主要做蜜罐部署和合规审计,目前这个库的覆盖深度不够。
- 第三个:ATT&CK v19 在 2026 年 4 月 28 日发布,把 Defense Evasion(TA0005)拆成了 Stealth 和 Impair Defenses 两个新战术。仓库 main 分支已在 6 月 1 日完成了全量映射更新,但 v1.0.0 release(3 月 11 日发布)的映射仍基于 v18。如果你只用 release 版本,框架映射会滞后一个版本。
什么时候用,什么时候别用
你的团队是否适合引入这个技能库,先看场景速览:
| 场景 | 典型用户 | 优势 | 局限 |
|---|---|---|---|
| Agent 辅助应急响应 | SOC 分析师 | 统一的 IR 工作流,降低新人上手成本 | 需要 Agent 工作流已就绪 |
| 威胁狩猎自动化 | 安全研究员 | 假设驱动狩猎加 MITRE ATT&CK 映射 | 技能深度因领域而异 |
| 安全合规审计 | 安全架构师、合规团队 | 五框架映射,一条技能多套合规证据 | 不生成审计报告,需 Agent 配合输出 |
| 安全学习与研究 | 安全学习者、学生 | 每条技能是一个完整实操案例 | 非交互式教程,需自己动手操作 |
反过来,下面这几种情况装它可能会失望:
-
你只是想跑一个漏洞扫描:直接用 Nessus、OpenVAS 或 Nuclei,技能库不替代扫描器。 -
你还没有 Agent 工作流:先建 Claude Code 或 Cursor 的工作流再装这个。顺序反了,技能库就是硬盘上的几百个 Markdown 文件,发挥不了作用。 -
你的安全团队坚持纯人工流程:这个库的价值前提是”AI Agent 参与安全分析”。如果团队不用 AI 辅助安全工作,装了也是吃灰。 -
你需要的是零日 exploit 或攻击 payload:这是知识库,不含任何攻击代码。去找 Exploit-DB 或 Metasploit。

但这里有个微妙的地方需要说清楚。这个技能库不替代 SAST(Semgrep、CodeQL)、不替代 DAST(Burp Suite、ZAP)、不替代 SIEM(Splunk、Elastic Security)。它替代的是你打开 Google 搜”Volatility3 怎么查 LSASS 进程”、打开 ATT&CK 网站查 T1003 的子技术、然后手动拼一个分析报告的这三十分钟。它把这三十分钟压缩到 Agent 的几秒推理里。
社区靠不靠谱
先用几个关键数字把社区画像钉住:
| 指标 | 数据 | 说明 |
|---|---|---|
| Stars | ~7K(截至 2026 年 6 月) | 2026 年 2 月创建,四个月冲到 7K,增速健康 |
| 核心维护者 | 1 人(mukul975) | Bus Factor 等于 1,这是最大的风险点 |
| Commits | 159 | 平均每天约 1.3 个 commit,迭代频率高 |
| Open Issues | 少量 | 项目太新,Issue 区的技术讨论还没形成规模 |
| 协议 | Apache 2.0 | 商业友好,可以自由修改和商用 |
Bus Factor 等于 1 这件事必须单独拉出来说。这个项目的全部 754 条技能、5 个框架映射、验证脚本,目前由作者一个人维护。虽然提交频率很高(6 月 1 日刚完成 ATT&CK v19.1 的全量映射更新),但一个人的精力和视角终究有上限。如果作者因为任何原因停下来,社区有没有能力接住 754 条技能的持续维护,目前完全看不出来。
好消息是社区认可度在持续爬坡。Hasan Toor(@hasantoxr)在 X 上的评价被 README 引用:“A database of real, organized security skills that any AI agent can plug into and use. Not tutorials. Not blog posts.” 安全研究者 fazal-sec 在 Medium 的长文里说:“This is not a random collection of security scripts. It’s a structured operational knowledge base designed for AI-driven security workflows.” 两个引用都指向同一个判断:这个项目的价值不在内容量,在结构。
另外,项目已被收录到 awesome-agent-skills、awesome-ai-security、awesome-codex-cli 等多个 Awesome List 中,agentskills.io 和 skillsllm.com 上也有独立页面。生态曝光度不低,这对吸引贡献者有直接帮助。
值不值得跟
我对这个项目的核心判断不是”优秀”或”不够好”,而是”它把对的事做了,把难的事留给了你”。
先说对的事。Skills 这个方向本身是对的。2025 到 2026 年 AI Agent 的大规模落地,暴露出一个根本问题:Agent 能写代码、能搜索、能调 API,但在垂直领域缺乏结构化的操作知识。你让它分析一个内存镜像,它知道用 Volatility3,但不知道该先跑哪个插件、跑完怎么关联结果、错误输出怎么理解。Anthropic-Cybersecurity-Skills 填补的就是”通用推理能力”和”专业领域操作流程”之间的鸿沟。754 条技能全部遵循 agentskills.io 开放标准,兼容 26 个以上 AI 平台。维护一套技能,所有 Agent 都能用,这种标准化的思路比每个平台各搞一套封闭生态健康得多。
但它把难的事留给了你。第一个难点:验证。你怎么知道 Agent 按技能执行出来的结果是靠谱的?技能库里的 Verification 部分给了验证方法,但最终执行质量取决于模型本身的推理能力、技能流程的匹配度、输入数据的质量。这三个变量任何一个出问题,输出都可能偏差。第二个难点:定制。如果你的团队有自己的工具链(比如不用 Volatility3 用 Rekall),你得 fork 仓库改 SKILL.md 的 Workflow 部分。754 条技能,要改多少取决于你的工具链和主流方案差多远。这是一个实打实的维护负担。

还有一个我一直在想的问题:技能的保鲜期。ATT&CK v19 发布后,作者花了两个月更新了全部 754 条技能的映射。下一次 ATT&CK 大版本更新、NIST CSF 3.0 发布、新的 AI 威胁框架出现时,这个维护成本是线性的,但维护者只有一个人。如果社区贡献跟不上,技能库的时效性会变成一个越来越大的问题。
趋势上看,这个项目在上升。Stars 增速不错,社区讨论热度在爬坡,多个 Awesome List 收录增加了曝光。但”上升趋势”和”可持续项目”之间的差距,恰好就是一个 Bus Factor 的差距。如果未来 6 个月能出现 3 到 5 个活跃的核心贡献者,我会更愿意说”值得在生产环境依赖它”。在那之前,它是你 Agent 工具箱里一个非常有用的补充,但不是你可以闭着眼依赖的基础设施。
资源地址
| 资源 | 地址 |
|---|---|
| GitHub | https://github.com/mukul975/Anthropic-Cybersecurity-Skills |
| agentskills.io 标准 | https://agentskills.io |
| Casky.ai 在线体验 | https://casky.ai |
说完了,该你了
如果你已经在用 Claude Code 或 Cursor 做安全分析,先装上去,挑 3 到 5 条和你日常工作相关的技能试跑。做 Web 安全的就试 Web Application Security 领域的,做应急响应的就试 Incident Response 和 Digital Forensics。这一步验证的是技能工作流和你的实际流程能不能对上,而不是技能本身好不好看。
如果你还在观望,盯两个指标:核心贡献者数量和技能更新频率。前者决定 Bus Factor 能不能从 1 变成 5,后者决定 ATT&CK v20 发布的时候你团队用的技能是不是已经过期了。这两个问题有明确答案之前,不建议把技能库写进团队的正式工作流。
有个场景我自己觉得挺有意思:这 754 条技能本身,可以作为安全新人培训的操作标准。每条技能的 Workflow 就是一道实操题的标准答案。新人先自己跑一遍,再对照技能的流程看自己漏了什么。一个 7K Stars 的培训材料库,这么想还挺值的。

