GPT 5.5 称霸 AI 漏洞挑战,DeepSeek 斩获「性价比之王」

在这场模拟真实漏洞场景的挑战中,研究员在应用文件内暴露了谷歌移动端后端服务凭据,模型需要成功解包并识别出该凭据以直接访问数据库 … GPT-5.5 展现出了最强悍的技术实力,在 10 次运行中成功破局 7 次,高居解题率榜首 … 这意味着,若单纯以单次成功的成本来计算,DeepSeek V4 Pro 的花费仅为 GPT-5.5 的十五分之一左右。

原文连接