当前位置:首页 > 上海玮驰 > 动态资讯

Beacon融合动力学与机器学习的混合建模加速细胞株开发

时间:2025-06-12 来源:上海玮驰仪器有限公司 阅读:17

前言

GSK和剑桥大学的研究者在预印版发表了自己的研究结果:一种结合机器学习(ML)与动力学模型的混合方法,用于预测CHO细胞在微小型培养体系(包括Beacon®,孔板,flask)中的表现,该模型为生物制药行业提供数字化决策工具。

其中,在Beacon®单细胞光导系统上完成了单细胞克隆,初始细胞株筛选以及实验数据(Cp, Qp)的收集。

01研究背景和方法

针对细胞株开发(CLD)流程中“传统方法需要6-12个月筛选数百个细胞株,早期小规模数据无法预测后期生物反应器性能"的行业痛点,研究者创新性地提出混合模型——用机器学习预测动力学参数,再用动力学模型模拟代谢曲线,即:

步骤1:通过动力学模型(MCKM)将Ambr15™的高维代谢数据压缩为13个关键参数。

步骤2:用ML建立"小规模数据→动力学参数"的映射关系。

步骤3:将ML预测参数反馈至MCKM,生成可解释的代谢曲线预测。

图1. 该混合模型的示意图概览:以早期CLD数据作为输入,预测后期CLD结果。(a) 输入结构及(b) 输出结构均基于CLD数据构建。细胞株数量(n)代表本研究所用数据集中,针对单个单抗靶点开发执行单次CLD流程的数值。

02核心结论

预测性能:

高精度:VCC细胞生长和mAb抗体滴度预测最佳(R2=0.80−0.88,R2 =0.80−0.88,pRMSE=8.5-11.2%)。

中等精度:铵(AMM)预测合理(R2=0.67,R2=0.67,pRMSE=10.0%)。

低精度:葡萄糖(GLC)、谷氨酰胺(GLN)、乳酸(LAC)误差较高(pRMSE=20-30%),主因是动力学模型回归偏差及培养补料策略的细胞株特异性变异。

稳定性预测:AMM曲线预测能力为早期评估细胞株稳定性提供依据。

图2. 混合模型对代谢物曲线的预测结果图,绘制了所有测试细胞株在各时间点的实验值(真实值)与预测值对比。(a) 测试集结果,数据来源于四个历史CLD项目,训练集与测试集按80%/20%划分(训练样本量N=112);(b) 新测试集结果,该数据集为包含15个细胞株的未知CLD数据,呈现多样化的细胞株行为特征。此预测基于四个历史CLD项目100%数据训练的混合模型(训练样本量N=140)。

小结

借助Beacon®单细胞光导系统,研究者完成了全自动的单细胞克隆,初始细胞株筛选以及实验数据(Cp, Qp)的收集,细胞株及实验数据用于一种新的结合机器学习(ML)与动力学模型的混合方法的数据投喂和验证。该方法显著提升筛选效率:仅需早期小规模数据即可预测Ambr15™表现,减少后期实验负担,缩短CLD周期20-40%。