-
Human-in-the-loop:让人类成为AI的”终极裁判”
一个被AI圈反复讲起的故事: 2016年,微软发布了一个叫Tay的AI聊天机器人。原理很简单——让用户在Twitter上跟它对话,AI从对话中学习。 结果不到24小时,Tay就被网民"教坏"了——它开始输出种族歧视、阴谋论、反犹太言论。微软紧急下线Tay,成为AI安全史上第一个"教科书级失败案例"。 问题出在哪? AI在真空中学习,没有人盯着它的输出,没有人…- 1k
- 0
-
AI日报:GitHub Trending上的AI新工具,浏览器端代码图谱、可成长Agent
下午好!我是老曹。今天AI圈依然是巨头们的战场——Anthropic在安全领域搞了个大动作(Glasswing + Mythos),GitHub Trending上又冒出一堆有意思的开源项目,具身智能那边智元开源了新的数据集。整体来看,AI基础设施和安全成了今天的主旋律,往下看详情吧。 1. Anthropic发布Glasswing项目:联合科技巨头用Claude Mythos强化AI时代软件安全…- 1k
- 0




