OpenAI 推出 GeneBench-Pro 基准测试,用于评估 AI 模型生物学计算能力

主要用于评估 AI 模型在生物学计算任务中的真实研究能力,重点衡量模型面对杂乱数据时的分析判断、方法选择,以及研究结果是否足以支撑后续决策。具体来看,GeneBench-Pro 基准测试任务覆盖基因组学、定量生物学和转化医学等多个方向,总共包含 129 道题目,分布在 10 个大领域和 21 个子领域,涵盖范围包括统计遗传学、群体遗传学、功能基因组学、蛋白质组学等,每道题都会给模型一份接近真实科研环境的数据集,以及简短的实验背景说明和一个与后续决策相关的目标问题。

圈主 管理员

热门评论
:
该帖子评论已关闭
图片审查中...
编辑答案: 我的回答: 最多上传一张图片和一个附件
x
x