近日,华南理工大学生物科学与工程学院的韩双艳教授团队在《Journal of Cleaner Production》期刊上发表了一篇题为“Global optimization of multiply enzyme synergic treatment in the pulp and paper industry through machine learning methodology”的研究论文。该研究针对造纸制浆的多参数耦合环境,构建了基于机器学习的多酶活性预测与工艺优化体系,较传统实验方法不仅缩短了研发周期,也显著降低了中试成本,可为制浆造纸企业实时生成工艺自适应的酶复配定制方案。论文第一作者为我校博士研究生杨曼丽,通讯作者为韩双艳教授,华南理工大学生物科学与工程学院为第一单位。
在全球加速推进碳中和目标的战略背景下,造纸工业作为能源密集型行业面临绿色转型的紧迫挑战,酶法预处理虽具环保优势,但催化活性易受温度、pH值、化学助剂等十余种变量影响,且多酶协同存在不可预测的拮抗效应,参数优化需反复实验,传统中试调试周期长达数月,导致中试验证成本激增。
该研究模拟真实造纸环境,收集纤维素酶(EG1)、木聚糖酶(XYN)和果胶酶(Ba)在五维变量空间(pH 6-9、温度30-70°C、停留时间10-60 min、10种添加剂、8种浓度梯度)的218组活性数据,采用六种机器学习算法(岭回归/高斯过程回归/支持向量回归/贝叶斯回归/XGBoost/MLP)构建预测模型。经十折交叉验证与网格搜索优化,XGBoost在单酶预测中表现最优(测试集R²=0.93,RMSE=0.089),显著优于传统多元线性回归(R²=0.514)。针对双酶协同优化,基于单酶模型生成5812组预测数据构建新数据集,创新性采用双路径优化策略:遗传算法(GA)以总酶活性最大化为目标,可在10秒内输出最优解(如酶XYN+Ba+助剂AKD最佳条件:pH 8.0/50°C/70 min/0.003%),NSGA-II算法经200代迭代(55-60秒)生成100组帕累托最优解平衡酶活性冲突。实验验证表明,GA方案实测活性达预测值90.2%,NSGA-II成功解析酶活性权衡关系。
图1.机器学习指导多酶复配的工作流程图
该研究得到了国家重点研发计划(2021YFC2100405、2022YFC2105501)的资助,论文链接https://doi.org/10.1016/j.jclepro.2025.146013。