微软发布 ASSERT 开源框架：让开发者更高效地评测 AI 智能体和应用行为

2026-6-3 12:29:25

微软今日宣布推出开源框架 ASSERT（Adaptive Spec-driven Scoring for Evaluation and Regression Testing，自适应规范驱动评分），旨在将自然语言写成的行为规范直接转换为可执行的评估流程。据介绍，ASSERT 能够从产品需求、政策文件或系统提示等文本出发，自动生成测试场景、数据集、评估指标和计分卡，并针对目标模型、应用或智能体运行测试。该框架建立在这样一个前提之上：行为规范本身应当成为评估的核心输入，而非仅仅作为背景参考。

圈主管理员

热门评论

该帖子评论已关闭

图片审查中...

编辑答案：我的回答：最多上传一张图片和一个附件

表情

图片

附件

取消编辑

{{userData.name}}已认证

微软发布 ASSERT 开源框架：让开发者更高效地评测 AI 智能体和应用行为

偷瞄答案

{{userData.name}}已认证

微软发布 ASSERT 开源框架：让开发者更高效地评测 AI 智能体和应用行为

偷瞄答案

您还未加入该AI圈子