某种意义上,这已经不是传统意义上的能力测评,而是在用接近研究人的方式研究 AI 的「心理结构」… 就在 Anthropic 发布关于 Claude「情绪向量」的研究后,AI 社区也出现了一些关于研究脉络和署名方式的讨论 … 从 Anthropic 这篇研究能支持的技术结论来看,AI 确实可能因为内部状态的变化,更容易出现违抗意图、钻规则空子、或者采取激进行为,但这和「觉醒」并不是一回事。
暂无讨论,说说你的看法吧
某种意义上,这已经不是传统意义上的能力测评,而是在用接近研究人的方式研究 AI 的「心理结构」… 就在 Anthropic 发布关于 Claude「情绪向量」的研究后,AI 社区也出现了一些关于研究脉络和署名方式的讨论 … 从 Anthropic 这篇研究能支持的技术结论来看,AI 确实可能因为内部状态的变化,更容易出现违抗意图、钻规则空子、或者采取激进行为,但这和「觉醒」并不是一回事。