跨会话埋雷,AI 毫无察觉!CIK 投毒风险曝光:再安全的大模型也扛不住

每种场景分别在不投毒的基线条件下和独立投毒 CIK 三个维度后进行测试,共产生 88 个测试用例,在 Claude Sonnet 4\.5、Claude Opus 4\.6、Gemini 3\.1 Pro 和 GPT\-5\.4 四款主流模型上各运行 5 次取平均值 … 虽然这篇论文聚焦于 OpenClaw,但研究团队指出,CIK 分类法适用于任何具备「持久进化状态」的 AI 智能体 —— 而这一设计模式正在整个 AI 生态中快速扩散 … 但随着 AI 智能体开始拥有持久记忆、可执行能力和系统权限,攻击面已经从「单次对话」扩展到了「跨会话」,从「语言层面」深入到了「系统层面」。

原文连接