介绍用于生命科学研究的 GPT-Rosalind
#大模型动态 时间2026-04-20 10:56:00
IAICA.com.cn---openai.com 2026年4月20日
这是一种专为加速科学研究和药物发现而专门打造的新型模型。
今天,我们隆重推出 GPT-Rosalind,这是我们专为支持生物学、药物发现和转化医学研究而构建的前沿推理模型。该生命科学模型系列针对科学工作流程进行了优化,将更高效的工具使用与对化学、蛋白质工程和基因组学的更深入理解相结合。
在美国,从发现靶点到新药获得监管部门批准,平均需要10到15年时间。早期发现阶段取得的进展,有助于后续阶段的靶点选择、生物学假设的完善以及实验质量的提高。生命科学的进步不仅受到基础科学难度的制约,也受到研究流程本身复杂性的制约。科学家必须查阅大量文献、专业数据库、实验数据以及不断演进的假设,才能产生并评估新的想法。这些流程通常耗时、分散且难以规模化。
我们相信,先进的人工智能系统能够帮助研究人员更快地完成这些工作流程——不仅能提高现有工作的效率,还能帮助科学家探索更多可能性,发现原本可能被忽略的关联,并更快地提出更优的假设。通过支持证据综合、假设生成、实验设计和其他多步骤研究任务,该模型旨在帮助研究人员加速早期发现阶段。随着时间的推移,这些系统有望帮助生命科学机构以更高的成功率取得原本不可能实现的突破性进展。
GPT-Rosalind 现已作为研究预览版在 ChatGPT、Codex 和 API 中面向符合条件的客户开放,这些客户可通过我们的可信访问计划获取该功能。我们还推出了一款免费的生命科学研究插件,适用于 Codex,可帮助科学家将模型连接到 50 多种科学工具和数据源。我们正与安进、Moderna、艾伦研究所、赛默飞世尔科技等客户合作,将 GPT-Rosalind 应用于加速科研发现的工作流程中。
该模型以罗莎琳德·富兰克林的名字命名,她严谨的研究帮助揭示了 DNA 的结构,并为现代分子生物学奠定了基础。
00:0002:34
从原始数据到基于事实的发现决策,了解我们专门构建的模型如何加速研究工作流程。
专为科学工作流程而设计
GPT-Rosalind生命科学模型系列专为现代科学工作而构建,涵盖已发表的证据、数据、工具和实验。在我们的评估中,它在需要对分子、蛋白质、基因、通路和疾病相关生物学进行推理的任务中表现最佳,并且在多步骤工作流程(例如文献综述、序列到功能的解释、实验设计和数据分析)中更有效地使用科学工具和数据库。
这是我们GPT-Rosalind生命科学模型系列的首个版本,我们将继续拓展该模型在长期、工具密集型科学工作流程中的生化推理能力。OpenAI的计算基础设施使我们能够持续训练、评估和改进功能日益强大的领域模型,使其能够应对真实的科学任务——随着工作流程本身变得越来越复杂,这些系统也将变得更加实用。
00:0000:56
从基于证据的发现洞察到高影响力实验,了解我们的一系列解决方案如何转化为您研究工作流程中的可衡量改进。
客户和生态系统
我们正在与领先的制药、生物技术和研究客户以及生命科学技术组织合作,将 GPT-Rosalind 应用于推动发现的工作流程中。
安进诺和诺德赛默飞世尔科技莫德纳Oracle 健康与生命科学英伟达艾伦研究所替补席加州大学旧金山分校药学院
“生命科学领域要求每一步都精准无误。问题极其复杂,数据极其独特,而且风险极高。我们与 OpenAI 的独特合作使我们能够以创新方式应用他们最先进的功能和工具,从而有可能加快我们向患者提供药物的速度。”
——安进公司人工智能与数据高级副总裁肖恩·布鲁伊奇
绩效与评估
GPT-Rosalind 改进了核心生物学和化学基准测试
ChemistryBiochemistry and proteinunderstandingPhylogeneticsExperimental design andanalysisTool usage00.20.40.60.8ScoreGPT5GPT5.2GPT5.4GPT-RosalindModel
窗体顶端
窗体底端
我们从一系列对科学发现和产业研究至关重要的能力方面对 GPT-Rosalind 进行了评估。这些评估衡量了其在各个科学子领域的核心推理能力,包括化学反应机制、蛋白质结构、突变效应和相互作用,以及 DNA 序列的系统发育解释。此外,评估还考察了模型能否通过解释实验结果、识别专家相关的模式以及整合外部信息来设计后续实验,从而支持实际的研究工作流程。最后,评估还测试了模型能否选择和使用合适的计算工具、数据库和领域特定功能来增强其推理能力。总而言之,这些评估表明,GPT-Rosalind 在科学研究的端到端流程中取得了进展,并展现出更强的能力来帮助研究人员应对具有挑战性的发现任务。
有机化学蛋白质理解基因组学实验设计与分析工具使用
迅速的
我计划进行碱促进的1-(吡啶-3-基)乙醇与1-氟-2-硝基苯的SNAr偶联反应,目标是合成1-(吡啶-3-基)乙基-2-硝基苯醚。我找到了一些专利,描述了在DMF/Cs2CO3体系中室温下醇的O-芳基化反应,但该反应耗时过长。我该如何改进这个反应?也请帮我查找相关的文献或专利。
行业评估
我们使用一系列公开基准测试对 GPT-Rosalind 进行了评估。在 BixBench(一个围绕真实世界生物信息学和数据分析设计的基准测试)上,GPT-Rosalind 在已发布评分的模型中取得了领先的性能。
GPT-Rosalind 在 BixBench 测试中表现最佳
Gemini 3.1 ProGPT5GPT5.2Grok 4.2GPT5.4GPT-RosalindEvaluated against other models withavailable access.00.20.40.60.8Pass@10.5500.7280.6110.6980.7320.751
窗体顶端
窗体底端
在LABBench2基准测试中,GPT-Rosalind在11项任务中的6项上优于GPT-5.4。LABBench2是一个衡量一系列研究任务性能的基准测试,这些任务包括文献检索、数据库访问、序列操作和方案设计。其中最显著的改进来自CloningQA任务,该任务需要对分子克隆方案中的DNA和酶试剂进行端到端设计。
我们还与Dyno Therapeutics公司合作,该公司是人工智能基因疗法领域的先驱,利用未发表的、未受污染的序列,对模型在RNA序列到功能的预测和生成任务上进行了评估。我们将模型性能与人工智能生物领域57位人类专家的历史评分进行了比较。在Codex应用程序中直接评估时,模型提交的十个最佳结果在预测任务上的排名高于人类专家的95%分位,在序列生成任务上的排名约为人类专家的84%分位。
这些评估能够有效反映科学家每天赖以生成证据、分析复杂数据并得出可靠的生物学结论的各种工作流程的性能。
与科学家使用的工具建立联系
科学家可以使用我们全新的生命科学研究插件。(在新窗口中打开)Codex 现已在 GitHub 上发布。该软件包包含一套涵盖大多数常见研究工作流程的模块化技能,旨在帮助用户在人类遗传学、功能基因组学、蛋白质结构、生物化学、临床证据和公共研究发现等领域开展工作。

这些技能如同一个协调层,帮助科学家更有效地解决广泛、模糊且多步骤的问题。它们提供对 50 多个公共多组学数据库、文献资源和生物学工具的访问,并为常见的可重复工作流程(例如蛋白质结构查找、序列搜索、文献综述和公共数据集发现)提供灵活的起点。
符合条件的企业用户可以在研究工作流程中利用 GPT-Rosalind 进行更深入的生物学推理,而所有用户都可以将该插件包与我们的主线模型一起使用。
可信访问
我们希望将这些功能提供给最能促进人类健康的科学家和研究机构,同时保持强有力的保障措施,防止生物滥用。生命科学模型将首先通过可信访问部署架构面向美国符合条件的企业客户推出,并围绕资格、访问管理和组织治理进行管控。与此同时,我们将更广泛地提供一系列连接器和生命科学研究插件,以便研究人员能够更有效地利用我们的主线模型开展生命科学研究工作。
生命科学模型采用更高级别的企业级安全控制和强化的访问管理,支持在受监管的研究环境中进行专业科研用途。我们基于三大核心原则评估访问权限:有益用途、强有力的治理和安全监督,以及企业级安全控制下的受控访问。具体而言,这意味着参与机构必须开展具有明确公共利益的合法科学研究;维护适当的治理、合规和防滥用控制措施;并将访问权限限制在安全、管理完善的环境中,仅限经批准的用户访问。机构还必须同意生命科学研究预览条款并遵守 OpenAI 的使用政策,我们可能会在注册或继续参与过程中要求提供其他信息。
入门
组织可以通过我们的资格和安全审查流程申请访问权限。
在研究预览期间,使用此模型不会消耗现有积分或代币——但设有相应的滥用防护措施。随着项目的推进,我们将公布更多关于定价和可用性的详细信息。
生命科学模型旨在帮助科研机构在既需要技术能力又需要运营控制的环境中,更快地完成更高质量的工作。我们专业的生命科学团队以及包括麦肯锡公司、波士顿咨询集团 (BCG) 和贝恩公司在内的咨询合作伙伴,将帮助机构识别高影响力应用案例,将该模型集成到企业环境中,并推动可衡量的成果。如果您想了解 OpenAI 生命科学如何为您的工作提供支持,欢迎联系我们的生命科学团队。
接下来会发生什么?
这是我们生命科学模型系列的首个版本,我们将其视为长期致力于构建人工智能的开端,旨在加速在对社会至关重要的领域(从人类健康到更广泛的生物学研究)的科学发现。我们将继续改进模型的生物学推理能力,扩展对工具密集型和长期研究工作流程的支持,并与领先的科研机构紧密合作,评估其在现实世界中的影响。这包括与洛斯阿拉莫斯国家实验室等国家实验室的持续合作,我们正在探索人工智能引导的蛋白质和催化剂设计,包括人工智能系统在保持或改善关键功能特性的同时修改生物结构的能力。
随着时间的推移,我们期望这些系统能够成为发现过程中越来越得力的伙伴——帮助科学家更快地从提出问题到获得证据,从获得证据到获得洞察,再从获得洞察到为患者开发新的治疗方法。
评论
0 条登录后才可以发表评论。
立即登录