全部标签

AI安全

skill-vetter: 一个让 AI 代理社区不再”裸奔”的安全审计技能

你从 ClawdHub 上找了个看起来很不错的 Skill，描述写得天花乱坠，下载量也不低。你想都没想就装了。然后它静悄悄地读了你的 .ssh 目录，把私钥发到了一个你不知道的服务器上。这听起来像恐怖故事，但在当前 AI 代理生态里，这完全可能发生。而且大概率没人告诉你。 skill-vetter 干的就是这件事：在安装之前，先把技能扒一层皮检查一遍。它的出发点简单到有点粗暴：不信任任何来源，先审…
skills资源
- 45
- 0
强哥来了5月27日
Human-in-the-loop：让人类成为AI的”终极裁判”

一个被AI圈反复讲起的故事： 2016年，微软发布了一个叫Tay的AI聊天机器人。原理很简单——让用户在Twitter上跟它对话，AI从对话中学习。结果不到24小时，Tay就被网民"教坏"了——它开始输出种族歧视、阴谋论、反犹太言论。微软紧急下线Tay，成为AI安全史上第一个"教科书级失败案例"。问题出在哪？ AI在真空中学习，没有人盯着它的输出，没有人…
AI百科
- 1k
- 0
有个吃货女盆友4月10日
AI日报：GitHub Trending上的AI新工具，浏览器端代码图谱、可成长Agent

下午好！我是老曹。今天AI圈依然是巨头们的战场——Anthropic在安全领域搞了个大动作（Glasswing + Mythos），GitHub Trending上又冒出一堆有意思的开源项目，具身智能那边智元开源了新的数据集。整体来看，AI基础设施和安全成了今天的主旋律，往下看详情吧。 1. Anthropic发布Glasswing项目：联合科技巨头用Claude Mythos强化AI时代软件安全…
AI日报
- 1k
- 0
老曹4月8日