>
正文
OpenAI发布LifeSciBench评估基准
2026-06-19 23:29

午方 AI 获悉,OpenAI 正式推出 LifeSciBench 评估基准,旨在量化人工智能系统在现实世界科学研究场景中的综合效能。该基准由 173 位具备博士学位及生物技术或制药行业经验的研究人员共同构建,包含 750 项精心设计的任务,覆盖 7 种科研工作流程及 7 个生物学科领域。

LifeSciBench 着重考察 AI 在证分析、科学推理及科学交流等复杂维度的表现,而非局限于单一事实性问答。数据显示,超过 79% 的任务涉及多步骤推理,平均每题需经历约 4 个推理环节,并附带 1,062 份真实研究数据文件,包括论文、图表、序列数据及结构文件等。

免责声明:本内容为作者独立观点,不代表平台立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。
标签:
LifeSciBench
分享:
back