智东西
编译 高远瞩
编辑 漠影

智东西4月17日消息,新药研发平均耗时10到15年,这是生命科学领域长期面临的困境。如今,OpenAI将目光投向这一赛道。4月16日,OpenAI发布了其首个行业专用高级推理模型GPT-Rosalind,专为生物学、药物发现和转化医学定制,试图用AI的力量大幅压缩早期研发周期,提高整个管线的成功率。

该模型得名于DNA双螺旋结构的关键贡献者罗莎琳德·富兰克林,已作为研究预览版登陆ChatGPT、Codex及API,目前仅向符合条件的美国企业客户开放,且预览期内不消耗现有额度。

与此同时,OpenAI还开源了Codex生命科学研究插件,免费连接超50个公共数据库与生物信息学工具,并已与安进(Amgen)、莫德纳(Moderna)、洛斯阿拉莫斯(Los Alamos)国家实验室等机构达成首批合作。


一、行业专用模型:OpenAI为何选中生命科学?

OpenAI将生命科学作为行业专用模型的切入口,背后有清晰的战略逻辑。

一款新药从靶点发现到监管批准平均需要10到15年,而早期发现阶段的任何效率提升,都会在下游产生复合效应——更优的靶点选择、更强的生物学假设、更高质量的实验设计,最终提高整个研发管线的成功率。然而,科学家的工作流长期被大量文献、专业数据库、实验数据和不断演化的假设所拖累,耗时、碎片化且难以规模化。


▲GPT-Rosalind 在化学、实验设计与分析等关键任务上的得分均明显优于前代模型

GPT-Rosalind针对科学工作流进行了深度优化,将工具使用能力与化学、蛋白质工程、基因组学的理解相结合,支持证据整合、假设生成、实验规划等多步研究任务。

OpenAI表示,该模型不仅让现有工作更高效,更能帮助科学家探索更多可能性、发现被忽略的联系,并更快地得出更好的假设。

二、RNA预测超95%人类专家,多项基准领先

在性能评估中,GPT-Rosalind在生物信息学基准BixBench上,取得了已发布模型中的最高分。


▲GPT-Rosalind 在 BixBench 上的表现全面超越 Gemini、Grok 及 GPT 系列前代模型

在涵盖文献检索、序列操作、实验方案设计等11项任务的LABBench2基准中,GPT-Rosalind有6项任务优于OpenAI最新的通用旗舰模型GPT-5.4,其中最显著的提升来自分子克隆实验设计(CloningQA)。

更为关键的验证来自与AI基因疗法公司Dyno Therapeutics的合作。双方使用未公开、无污染的RNA序列,评估模型在序列到功能预测和序列生成上的表现。历史数据中,AI生物学领域的人类专家共有57个得分。

当直接在Codex应用中评估时,GPT-Rosalind在十次提交中的最佳结果:序列功能预测排名高于95%的人类专家,序列生成排名约为84%的人类专家。

三、开源插件+顶级合作:打造生命科学AI生态

除了模型本身,OpenAI还同步在GitHub上开源了Codex生命科学研究插件。该插件集成了超过50个公共多组学数据库、文献源和生物信息学工具,涵盖人类遗传学、功能基因组学、蛋白质结构、生物化学、临床证据等方向。插件对所有用户免费,不限于GPT-Rosalind,普通模型也可使用,为科研人员提供了一个灵活、可复用的工作流编排层。


▲OpenAI Codex 的「Life Science: Research」插件,提供覆盖多领域的生命科学研究工作流,支持路由、证据合成与并行子代理分析

在生态合作方面,OpenAI已与安进(Amgen)、莫德纳(Moderna)、艾伦研究所(Allen Institute)、赛默飞世尔科技(Thermo Fisher Scientific)等机构合作,将GPT-Rosalind嵌入实际研发工作中。

安进公司AI与数据高级副总裁Sean Bruich表示:“生命科学领域每一步都要求精准,问题极其复杂,风险极高。与OpenAI的合作让我们能以创新的方式应用其最先进的能力,加速药物送达患者。”

此外,OpenAI正与洛斯阿拉莫斯国家实验室探索AI引导的蛋白质和催化剂设计,包括在保持或改善关键功能的前提下修改生物结构。

结语:OpenAI入场垂直赛道,前路仍待破局

GPT-Rosalind在RNA预测等任务上表现亮眼,其开源插件也以免费的形式降低了科研工具的使用门槛。

但其争议同样不容忽视:该模型目前仅面向美国企业客户,技术普惠性受限;在LABBench2的11项任务中仍有5项未超越通用模型,性能优势尚不全面。此外,该模型以罗莎琳德·富兰克林命名,被批评是在消费一位曾遭受不公的女科学家,而非真正的致敬。

在安全层面,OpenAI虽强调通过信任访问机制(trusted access)防范生物技术滥用,但批评者认为,任何强大的生物学推理模型都可能被恶意用于设计危险病原体或毒素,而目前缺乏独立的第三方安全评估来验证这一制度的有效性。

就在GPT-Rosalind发布前两天,OpenAI推出了面向防御性网络安全的GPT-5.4-Cyber,竞争对手Anthropic也发布了前沿AI模型Mythos。

AI巨头正加速向行业垂直模型赛道渗透,但生命科学领域的特殊性决定了,从技术突破到最终成药,中间仍隔着漫长的临床验证和监管审批。开源插件或许能降低科研的工作门槛,但技术公平性、安全性验证等问题,仍是其走向广泛落地前必须直面的大山。

来源:OpenAI、路透社、BlockBeats