OpenAI 推出 GeneBench-Pro 基准测试，用于评估 AI 模型生物学计算能力

2026-7-2 9:17:37

主要用于评估 AI 模型在生物学计算任务中的真实研究能力，重点衡量模型面对杂乱数据时的分析判断、方法选择，以及研究结果是否足以支撑后续决策。具体来看，GeneBench-Pro 基准测试任务覆盖基因组学、定量生物学和转化医学等多个方向，总共包含 129 道题目，分布在 10 个大领域和 21 个子领域，涵盖范围包括统计遗传学、群体遗传学、功能基因组学、蛋白质组学等，每道题都会给模型一份接近真实科研环境的数据集，以及简短的实验背景说明和一个与后续决策相关的目标问题。

圈主管理员

热门评论

该帖子评论已关闭

图片审查中...

编辑答案：我的回答：最多上传一张图片和一个附件

表情

图片

附件

取消编辑

{{userData.name}}已认证

OpenAI 推出 GeneBench-Pro 基准测试，用于评估 AI 模型生物学计算能力

偷瞄答案

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议

{{userData.name}}已认证

OpenAI 推出 GeneBench-Pro 基准测试，用于评估 AI 模型生物学计算能力

偷瞄答案

您还未加入该AI圈子

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议