Anthropic-Cybersecurity：不是安全工具，是 754 个安全专家的脑子

你打开了一个 GitHub 仓库，准备看代码。翻了一圈，一个 .py 文件都没有，一个 .js 也没有。不是藏起来了，是真的没有。

Anthropic-Cybersecurity-Skills 是一个纯 Markdown 加 YAML 组成的仓库。754 个文件，每一个都是一条结构化的安全技能。名字里的 “Anthropic” 让不少人以为这是官方产品，实际上 README 第一屏就写了 Not affiliated with Anthropic PBC。作者 mukul975，一个人，坐下来给 AI Agent 写了一整套安全操作手册。

我第一次翻这个仓库的时候想法很简单：这不就是一个高级版的安全 checklist 吗？花了两小时看它的 skill 结构和五框架映射之后，我改主意了。这件事比表面看起来有意思得多。

说白了这篇文章就想讲明白一件事：为什么 754 个 Markdown 文件能让 AI Agent 从”会搜索的安全实习生”变成”能独立干活的资深分析师”，以及这件事的边界到底在哪。

打动我的几个地方

Anthropic-Cybersecurity-Skills 的核心卖点，读 README 的时候很容易被数字砸晕：754 条技能、26 个安全领域、5 个框架映射、兼容 26 个以上 AI 平台。但这些数字不是重点。真正让它区别于市面上其他安全资源库的，是三个结构设计。

渐进式加载是这套技能库最聪明的工程决策。每条技能的 YAML frontmatter 只有约 30 tokens，AI Agent 可以一次性扫描全部 754 条技能的元数据，找到相关的 10 到 15 条，再完整加载匹配度最高的 2 到 3 条，每条 500 到 2000 tokens。

这个设计解决了 Agent 在垂直领域面临的核心矛盾：知识量太大塞不进上下文窗口，知识太少又不够用。传统做法是把安全手册、合规文档、工具文档一股脑塞给模型，上下文窗口秒炸，Token 费用飞涨，Agent 还容易在信息海里迷路。三层渐进式披露——扫描元数据、筛选候选、完整加载——把这个问题解得很干净。

五框架映射是目前开源技能库里独一份的设计。每条技能同时映射到 MITRE ATT&CK v19.1、NIST CSF 2.0、MITRE ATLAS v5.4、MITRE D3FEND v1.3、NIST AI RMF 1.0 五个行业框架。举个例子：技能 analyzing-network-traffic-of-malware 映射到 ATT&CK T1071、NIST CSF DE.CM、ATLAS AML.T0047、D3FEND D3-NTA、AI RMF MEASURE-2.6。一条恶意流量分析跑完，你的 Agent 不光把活干了，还能直接输出五套合规框架对应的证据链。它把前线打仗的士兵和后方写合规报告的秘书合二为一了，这在企业安全团队里是一个实打实的效率提升点。

结构化执行流是它和传统安全工具库的根本区别。传统安全资源给的是字典、payload、exploit 代码，这些东西告诉 Agent “能做什么”，但没说”什么时候做、先做什么、做完怎么验证”。每条技能的标准结构是四段：When to Use 判断是否适用、Prerequisites 检查前置条件、Workflow 分步执行、Verification 验证结果。Agent 拿到任务后不是随机调用工具，而是遵循一套经过验证的决策流。这套流程编码的是资深分析师的实际操作习惯，不是模型自己生成的摘要。

Anthropic-Cybersecurity：不是安全工具，是 754 个安全专家的脑子

这三种设计——渐进式加载、五框架映射、结构化决策流——单看都不新鲜。合在一起，而且覆盖了云安全、威胁狩猎、恶意软件分析、数字取证、事件响应等 26 个安全领域，市面上目前找不出第二个同等规模且同等结构化的开源项目。

不过有一件事我必须先说清楚：这些技能不会自己跑。它不是一个你 pip install 之后敲 security-skill analyze 就能用的命令行工具，它是一个知识库，Agent 拿着它去调 Volatility3、Nmap、Splunk 这些真工具的时候，知道该按什么顺序调、调完怎么验证。把技能库当安全工具用的人会失望，把它当 Agent 的知识底座用的人会惊喜。

上手什么感觉

装这个东西不需要编译、不需要配置环境变量、不需要申请 API Key。两种方式：

# 推荐：通过 npx 一键安装
npx skills add mukul975/Anthropic-Cybersecurity-Skills

# 或者直接 clone
git clone https://github.com/mukul975/Anthropic-Cybersecurity-Skills.git
cd Anthropic-Cybersecurity-Skills

装完之后 Claude Code、GitHub Copilot、Cursor、OpenAI Codex CLI、Gemini CLI 等支持 agentskills.io 标准的平台会自动发现这些技能文件。你的 Agent 马上就能在处理安全任务时调用它们。

但有几个事需要提前知道。

第一个坑：名字里的 “Anthropic” 容易让人以为装了之后 Claude Code 会原生集成，实际上它和 Anthropic 没有任何关系。在 Claude Code 里的体验和在 Cursor 里没有区别，Agent 读取本地技能文件，不调用任何远程 API。
第二个要注意的：技能质量在不同领域之间差异明显。Cloud Security（60 条）、Threat Hunting（55 条）、Threat Intelligence（50 条）这些主流领域的技能内容扎实，Workflow 部分有具体命令和决策分支。但 Deception Technology 只有 2 条技能，Compliance & Governance 只有 5 条。作者自己在 CONTRIBUTING.md 里也标注了这两个领域”最需要帮助”。如果你主要做蜜罐部署和合规审计，目前这个库的覆盖深度不够。
第三个：ATT&CK v19 在 2026 年 4 月 28 日发布，把 Defense Evasion（TA0005）拆成了 Stealth 和 Impair Defenses 两个新战术。仓库 main 分支已在 6 月 1 日完成了全量映射更新，但 v1.0.0 release（3 月 11 日发布）的映射仍基于 v18。如果你只用 release 版本，框架映射会滞后一个版本。

什么时候用，什么时候别用

你的团队是否适合引入这个技能库，先看场景速览：

场景	典型用户	优势	局限
Agent 辅助应急响应	SOC 分析师	统一的 IR 工作流，降低新人上手成本	需要 Agent 工作流已就绪
威胁狩猎自动化	安全研究员	假设驱动狩猎加 MITRE ATT&CK 映射	技能深度因领域而异
安全合规审计	安全架构师、合规团队	五框架映射，一条技能多套合规证据	不生成审计报告，需 Agent 配合输出
安全学习与研究	安全学习者、学生	每条技能是一个完整实操案例	非交互式教程，需自己动手操作

反过来，下面这几种情况装它可能会失望：

你只是想跑一个漏洞扫描：直接用 Nessus、OpenVAS 或 Nuclei，技能库不替代扫描器。
你还没有 Agent 工作流：先建 Claude Code 或 Cursor 的工作流再装这个。顺序反了，技能库就是硬盘上的几百个 Markdown 文件，发挥不了作用。
你的安全团队坚持纯人工流程：这个库的价值前提是”AI Agent 参与安全分析”。如果团队不用 AI 辅助安全工作，装了也是吃灰。
你需要的是零日 exploit 或攻击 payload：这是知识库，不含任何攻击代码。去找 Exploit-DB 或 Metasploit。

Anthropic-Cybersecurity：不是安全工具，是 754 个安全专家的脑子

但这里有个微妙的地方需要说清楚。这个技能库不替代 SAST（Semgrep、CodeQL）、不替代 DAST（Burp Suite、ZAP）、不替代 SIEM（Splunk、Elastic Security）。它替代的是你打开 Google 搜”Volatility3 怎么查 LSASS 进程”、打开 ATT&CK 网站查 T1003 的子技术、然后手动拼一个分析报告的这三十分钟。它把这三十分钟压缩到 Agent 的几秒推理里。

社区靠不靠谱

先用几个关键数字把社区画像钉住：

指标	数据	说明
Stars	~7K（截至 2026 年 6 月）	2026 年 2 月创建，四个月冲到 7K，增速健康
核心维护者	1 人（mukul975）	Bus Factor 等于 1，这是最大的风险点
Commits	159	平均每天约 1.3 个 commit，迭代频率高
Open Issues	少量	项目太新，Issue 区的技术讨论还没形成规模
协议	Apache 2.0	商业友好，可以自由修改和商用

Bus Factor 等于 1 这件事必须单独拉出来说。这个项目的全部 754 条技能、5 个框架映射、验证脚本，目前由作者一个人维护。虽然提交频率很高（6 月 1 日刚完成 ATT&CK v19.1 的全量映射更新），但一个人的精力和视角终究有上限。如果作者因为任何原因停下来，社区有没有能力接住 754 条技能的持续维护，目前完全看不出来。

好消息是社区认可度在持续爬坡。Hasan Toor（@hasantoxr）在 X 上的评价被 README 引用：“A database of real, organized security skills that any AI agent can plug into and use. Not tutorials. Not blog posts.” 安全研究者 fazal-sec 在 Medium 的长文里说：“This is not a random collection of security scripts. It’s a structured operational knowledge base designed for AI-driven security workflows.” 两个引用都指向同一个判断：这个项目的价值不在内容量，在结构。

另外，项目已被收录到 awesome-agent-skills、awesome-ai-security、awesome-codex-cli 等多个 Awesome List 中，agentskills.io 和 skillsllm.com 上也有独立页面。生态曝光度不低，这对吸引贡献者有直接帮助。

值不值得跟

我对这个项目的核心判断不是”优秀”或”不够好”，而是”它把对的事做了，把难的事留给了你”。

先说对的事。Skills 这个方向本身是对的。2025 到 2026 年 AI Agent 的大规模落地，暴露出一个根本问题：Agent 能写代码、能搜索、能调 API，但在垂直领域缺乏结构化的操作知识。你让它分析一个内存镜像，它知道用 Volatility3，但不知道该先跑哪个插件、跑完怎么关联结果、错误输出怎么理解。Anthropic-Cybersecurity-Skills 填补的就是”通用推理能力”和”专业领域操作流程”之间的鸿沟。754 条技能全部遵循 agentskills.io 开放标准，兼容 26 个以上 AI 平台。维护一套技能，所有 Agent 都能用，这种标准化的思路比每个平台各搞一套封闭生态健康得多。

但它把难的事留给了你。第一个难点：验证。你怎么知道 Agent 按技能执行出来的结果是靠谱的？技能库里的 Verification 部分给了验证方法，但最终执行质量取决于模型本身的推理能力、技能流程的匹配度、输入数据的质量。这三个变量任何一个出问题，输出都可能偏差。第二个难点：定制。如果你的团队有自己的工具链（比如不用 Volatility3 用 Rekall），你得 fork 仓库改 SKILL.md 的 Workflow 部分。754 条技能，要改多少取决于你的工具链和主流方案差多远。这是一个实打实的维护负担。

Anthropic-Cybersecurity：不是安全工具，是 754 个安全专家的脑子

还有一个我一直在想的问题：技能的保鲜期。ATT&CK v19 发布后，作者花了两个月更新了全部 754 条技能的映射。下一次 ATT&CK 大版本更新、NIST CSF 3.0 发布、新的 AI 威胁框架出现时，这个维护成本是线性的，但维护者只有一个人。如果社区贡献跟不上，技能库的时效性会变成一个越来越大的问题。

趋势上看，这个项目在上升。Stars 增速不错，社区讨论热度在爬坡，多个 Awesome List 收录增加了曝光。但”上升趋势”和”可持续项目”之间的差距，恰好就是一个 Bus Factor 的差距。如果未来 6 个月能出现 3 到 5 个活跃的核心贡献者，我会更愿意说”值得在生产环境依赖它”。在那之前，它是你 Agent 工具箱里一个非常有用的补充，但不是你可以闭着眼依赖的基础设施。

资源地址

资源	地址
GitHub	https://github.com/mukul975/Anthropic-Cybersecurity-Skills
agentskills.io 标准	https://agentskills.io
Casky.ai 在线体验	https://casky.ai

说完了，该你了

如果你已经在用 Claude Code 或 Cursor 做安全分析，先装上去，挑 3 到 5 条和你日常工作相关的技能试跑。做 Web 安全的就试 Web Application Security 领域的，做应急响应的就试 Incident Response 和 Digital Forensics。这一步验证的是技能工作流和你的实际流程能不能对上，而不是技能本身好不好看。

如果你还在观望，盯两个指标：核心贡献者数量和技能更新频率。前者决定 Bus Factor 能不能从 1 变成 5，后者决定 ATT&CK v20 发布的时候你团队用的技能是不是已经过期了。这两个问题有明确答案之前，不建议把技能库写进团队的正式工作流。

有个场景我自己觉得挺有意思：这 754 条技能本身，可以作为安全新人培训的操作标准。每条技能的 Workflow 就是一道实操题的标准答案。新人先自己跑一遍，再对照技能的流程看自己漏了什么。一个 7K Stars 的培训材料库，这么想还挺值的。

{{userData.name}}已认证

Anthropic-Cybersecurity：不是安全工具，是 754 个安全专家的脑子

打动我的几个地方

上手什么感觉

什么时候用，什么时候别用

社区靠不靠谱

值不值得跟

资源地址

说完了，该你了

FreeLLMAPI ：1 个端点，16 家免费 AI，每月 17 亿 token

投资人亲述：我的AI编程项目用户暴跌50%，“氛围编程”泡沫正在破裂