跨会话埋雷，AI 毫无察觉！CIK 投毒风险曝光：再安全的大模型也扛不住

AI
4月12日

强哥来了

每种场景分别在不投毒的基线条件下和独立投毒 CIK 三个维度后进行测试，共产生 88 个测试用例，在 Claude Sonnet 4\.5、Claude Opus 4\.6、Gemini 3\.1 Pro 和 GPT\-5\.4 四款主流模型上各运行 5 次取平均值 … 虽然这篇论文聚焦于 OpenClaw，但研究团队指出，CIK 分类法适用于任何具备「持久进化状态」的 AI 智能体 —— 而这一设计模式正在整个 AI 生态中快速扩散 … 但随着 AI 智能体开始拥有持久记忆、可执行能力和系统权限，攻击面已经从「单次对话」扩展到了「跨会话」，从「语言层面」深入到了「系统层面」。

原文连接

{{userData.name}}已认证

跨会话埋雷，AI 毫无察觉！CIK 投毒风险曝光：再安全的大模型也扛不住

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议