打开APP

恩和发布 BPL 协议语言,定义生物制造的「工业级编译器」

Biology Protocol Language 已在 bioRxiv 上线,代码完全开源。

近日,恩和科技在《bioRxiv》发布Biology Protocol Language(BPL)及其生成管线BPL-COGEN,首次为生物实验协议建立了一套形式化的语言体系,打通了Physical AI进入物理世界的标准接口。

BPL是专为生物实验协议设计的可编译、可验证的形式化语言。BPL-COGEN把自然语言协议自动翻译为BPL程序,由一个300亿参数微调大语言模型与确定性编译器构成“生成—验证—修复”闭环。

在基于300篇《Nature Protocols》论文的基准测试中,BPL-COGEN实现95.1%的首轮一致性,通过2轮编译-仿真闭环将正确率推进至98.6%。目前,相关代码已在GitLab完全开源(MIT License)。

AI已会“思考”,但还不会“动手”

当前,AI已经能在数字世界生成假设与设计实验。材料科学领域已经出现自主驱动的Self-driving Lab。但在生物学领域,无论上游AI多么强大,其输出最终仍须被翻译为物理操作,而这一过程,至今仍依赖自然语言文本

这是一个半导体和软件行业几十年前就已跨越的问题。半导体设计通过Verilog和VHDL完成了从自然语言向硬件描述语言的跃迁,软件工程通过类型化语言确立了可验证的稳定性。生物学一直缺少与之对应的、具备编译器验证能力的底层语言,这正是当前AI驱动实验设计与可复现物理执行之间的速率限制环节。

代价是清晰的。《Nature》在2016年针对1,576名研究者的调查显示,超过70%的人无法复现他人实验,超过一半的人无法复现自己的实验(Baker, *Nature*, 2016)。恩和团队的论文进一步将问题归纳为三个维度:

协议精确度。典型指令中常隐藏浓度、时间、体积等多处未明分支点。几十条此类指令叠加,使实验可复现性完全依赖于人员的经验补全。

协议验证。自然语言缺乏在执行前模拟物理一致性的机制,内部逻辑错误往往只能靠人工判断甚至“实验失败”才能察觉。

跨平台可迁移性。一项跨四个实验室的合成生物学研究发现,名义一致的协议在不同实验室间产生了两倍以上的转化效率差异(Beal et al., 2016, 2020),根源不在生物本身,而在执行上下文的隐性差别。

科学的累积,源于方法可被复现与忠实传递。若协议无法被无歧义表达与跨环境复用,AI 生成的实验设计就无法稳定落地。

BPL设计: AI负责生成,BPL-COGEN负责仿真与验证

BPL用形式化规范取代自然语言的歧义。在这套类型系统下,所有隐性参数都必须显式声明;任何违反物理规律的操作(如“将固态粉末加入空容器后取上清液”)将在编译阶段直接被拦截,从而避免了错误流入真实实验台。

为配合这一语言体系,团队构建了BPL-COGEN自动化编译器。它将一个300亿参数微调大语言模型与确定性编译器耦合在“生成—验证—修复”的闭环机制中:自然语言SOP被归一化,转换为BPL,根据编译器诊断反复修正,直到所有物理、量纲、状态约束全部满足。LLM负责理解科学家的意图,编译器负责验证物理世界的约束。

(b)Bounded agentic workflow: (1) SOP input with optional lab catalog, (2) BPL-Nano-30B code generation, (3) three-gate compiler validation (parse, semantic, and plan/validate gates), (4) diagnostic-guided repair loop (max 3 attempts), and (5) output artifact generation. (c) BPL compiler architecture: six-layer compilation pipeline.

实验验证:多维度证实三大难题的解决

团队从三个层面对BPL-COGEN进行系统性验证。

大规模文本评测。在300篇Nature Protocols论文上,BPL-COGEN实现95.1%的首轮一致性。经2轮编译-仿真闭环达98.6%的迭代正确率。

(a) LLM validation scores across processed variants. Overall score, experiment match, protocol validity, and phase completeness all remained high (mean: 95.1). This panel establishes that BPL outputs are not only structurally regularized, but also remain faithful to the underlying experiment.

(b) Compilation success rate by attempt number: 82.3% of protocols compile on the first attempt; the repair loop resolves an additional 16.3%, leaving only 1.4% unresolved after three attempts

分子生物学验证。同一份BPL源码同时编译至手动操作与自动化设备两种执行上下文,均产生可复现的实验结果。证明了协议在执行模态上的可迁移性。

GFP fluorescence measurement of cell cultures with IPTG induction. Medium: negative control without cells.

分析化学迁移验证。在不同设备上下文之间迁移后,类胡萝卜素的表征获得了可比的分析结果,验证了协议的设备无关可迁移性。

(b) HPLC chromatogram (C18, 4.6 × 250 mm, 5 μm; 32 min). (c) UHPLC chromatogram (Kinetex C18, 2.1 × 50 mm, 1.7 μm; 2.1 min). All five compounds (retinol, retinal, retinyl acetate, lycopene, β-carotene) achieved baseline resolution with preserved elution order.

这三项验证共同确认:BPL与BPL-COGEN同时解决了长期困扰行业的协议精确度、可验证性、跨平台可迁移性三大核心难题。

在SAION物理AI平台中的定位

BPL是恩和SAION物理AI平台“认知—控制—执行”三层架构中执行层的标准接口。向下,它下发指令到生物铸造厂的自动化设备与人类操作员;向上,它回流结构化的实验执行数据,驱动认知层与控制层的持续进化。

结合此前SAION AI平台在文献阅读到质粒设计与湿实验组装的100%正确率、质粒构建90%成功率,BPL的引入使物理AI闭环的执行层首次具备了可验证、可迁移的标准协议基础。

在AI+生物制造全球图景中的意义

生物制造领域AI技术的核心价值,在于能否真实推动兑现数千万元乃至数亿元的经济效益。当AI真正驱动产业链、产品、订单的经济价值兑现时,它在产业中才获得存在的意义。BPL的提出,是恩和把“AI 兑现产业价值”落到执行层的具体动作。

据相关机构预测,至2035年全球生物制造市场规模将达到约6万亿美元。纵观工业史,所有制造业从“作坊”走向“工业化”的关键点,都伴随着形式化协议标准的建立。作为首 个具备“编译时物理验证 + 跨平台可迁移”双能力的工程级方案,BPL为这一万亿级赛道的标准化推进提供了关键基础设施。

正如研究团队在论文中所指出的:BPL-COGEN提供了生物领域物理具身AI所需的关键基础。只有当AI能够以一种可被验证的语言“说清楚自己想做什么”,自主实验室代理才在工程上成为可能。生物制造的工程边界,正被重新定义。

论文原文:Song, R., Fu, Y., Zhao, Z., Yu, J., Yuan, Q., & Chen, C. T. (2026). Towards autonomous biology: Compiler-Verified Protocols as a Foundation for Real World AI Execution. bioRxiv, 2026-05.

【本文经授权发布,不代表投资界立场。本平台仅提供信息存储服务。】
【免责声明】:本文不构成任何投资建议。市场有风险,投资需谨慎。
如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。

相关资讯

相关企业

AI数据总览

最新资讯

热门TOP5热门机构 | VC情报局

去投资界看更多精彩内容
【声明:本页面数据来源于公开收集,未经核实,仅供展示和参考。本页面展示的数据信息不代表投资界观点,本页面数据不构成任何对于投资的建议。特别提示:投资有风险,决策请谨慎。】