欢迎访问杭州布瑞利斯化工科技有限公司,致力于打造发展光催化技术融合平台!

198-8415-9221

高压氢气发生器
更多

新闻资讯

了解你所想了解

网站首页 >> 新闻资讯 >>技术交流 >> 人工智能参与连续流合成的过程优化
详细内容

人工智能参与连续流合成的过程优化



引言




随着连续制造技术发展,活性药物成分(APIs)和精细化学品合成从传统批次生产向连续流生产转变。连续流生产虽有诸多优势,但过程优化面临挑战,传统优化方法效率低、成本高、易受主观因素影响,这凸显了对新方法的需求,以帮助研究人员获得最合适的工艺参数并更有效地分析实验数据。近年来,化学与信息科学的融合促进了利用连续流合成通过程序化方法进行自主参数选择和反应优化。优化方法在此过程中至关重要。开发高精度回归算法和强大的泛化能力可以显著提高优化效率并降低试验成本。贝叶斯优化算法是一种不确定性驱动的方法,在连续流合成中有应用潜力。大连理工大学陶胜洋教授团队提出一种自优化贝叶斯算法(SOBayesian),将其应用于含氮杂环酰胺的连续流合成过程优化,通过对吡啶基苯甲酰胺的Buchwald - Hartwig反应进行研究,验证了该算法的有效性,经过不到30轮的迭代优化,良率达到79.1%,随后通过减少先验数据进行优化,成功减少了27.6%的实验次数,显着降低了实验成本,为连续流合成过程优化提供了新方法。

实验部分




1




 实验材料

实验所用原料试剂均为市售产品,纯度达标且未经额外纯化直接使用。




2




连续流实验

采用Vapourtec R-系列流动合成仪,配备标准PFA盘管反应器、柱反应器、进料泵和100 psi背压阀等组件,软件控制管道切换,实验后更换硅胶、清洗管道。




3




反应评估

利用Agilent 1260 infinity II HPLC跟踪2 - 溴吡啶浓度,样品经甲醇稀释后进行分析。




4




自优化贝叶斯算法

以GPR为代理模型,基于Python平台和scikit - learn、scikit - optimize库开发。将数据分训练集(90%)和测试集(10%),定义径向基函数核(RBF)、Matern 核、有理二次核(RQ)和DotProduct核,迭代选择最优核预测,通过贝叶斯超参数优化器选择学习率和最大重启次数,采用n折交叉验证(5组先验数据用4折),基于均方误差(MSE)评估模型。


1740982315568.png

图1: 吡啶基苯甲酰胺流动合成实验。(a)平台配置。(b)连续流动反应路径及优化变量。(c)贝叶斯优化的合成工艺流程。



《结果与讨论》

1. 连续流合成优化实验构建

Buchwald - Hartwig反应需选择合适配体和碱,本实验选用1,8 - 二氮杂二环 [5.4.0] 十一 - 7 - 烯(DBU)和4,5 - 双(二苯基膦)- 9,9 - 二甲基呫吨(xantphos)分别作为碱和配体,乙酸钯为预催化剂,N,N - 二甲基甲酰胺(DMF)为溶剂。优化变量包括反应温度、停留时间、各反应物当量,以产率为目标函数,设定较宽优化范围形成大规模参数空间,算法在此空间搜索最优参数。

2. 先验数据选择与优化结果分析

先验数据量影响优化过程,为研究其影响,分别用14组和5组先验数据进行实验。两组数据均收敛到相同最优反应条件(80 min停留时间、148°C反应温度、1.9 当量 4 - 甲氧基苯甲酰胺、2.9当量DBU、19.9 mol% xantphos),产率达79.1%。14组先验数据优化需29次实验、15次迭代;5组先验数据优化需21次实验、16次迭代,虽实验次数少但迭代次数多,表明减少先验数据可降低总实验次数,但更多先验数据可减少迭代次数,不过不一定降低总成本。

3. 自优化贝叶斯算法逻辑分析

在GPR算法中,‘alpha’和‘n_restart_optimizer’是关键超参数。‘alpha’影响核函数平滑度和模型对新数据拟合,‘n_restart_optimizer’影响全局最优解获取和训练时间,通过迭代优化选择最佳超参数,并结合n折交叉验证提升模型性能。核函数决定数据点相似性和模型能力,本算法迭代测试四种核函数,结果显示RQ核在不同先验数据下表现最佳,因其对非线性关系泛化能力强。与先进Dragonfly算法对比,SOBayesian算法在不同采样方法和含误差数据下均能有效优化,且受实验误差影响小,适用性广。

4. 反应参数表征与分析

计算各特征SHAP值发现,反应时间、温度、配体当量对产率影响较大,呈正相关,是动力学主导因素;而4 - 甲氧基苯甲酰胺当量影响小,表明酰胺浓度非关键因素,且卤原子离去速率非反应速率限制步骤,芳基卤化物氧化加成可能是速率决定步骤。先验数据量影响特征重要性评估,优化后模型对各特征拟合能力提升,自优化贝叶斯算法在不同先验数据下优化效果稳定且减少实验次数。

1740982346258.png


图2: 优化实验的SHAP值。(a)5组和 (b)14组先验数据在迭代前和最后一次迭代后每个特征参数的平均绝对SHAP值,(c)优化前和(d)优化后5组先验数据以及(e)优化前和(f)优化后14组先验数据的每个特征参数的SHAP值。


四、结论

连续流合成是合成活性药物成分的重要手段之一,其工艺参数的高效快速优化受到广泛关注。针对该问题,提出了一种自优化的贝叶斯算法。针对小数据集开发的高斯过程回归模型,动态调整结构,自我优化,效果与目前的先进算法相当或更好。通过将自适应策略应用于模型训练过程,在先前的优化中进行核迭代,以及将n倍交叉验证与贝叶斯超参数优化相结合,增强了模型的泛化能力。该算法不设置获取函数,算法过程中只遍历整个参数空间,也避免了陷入局部极值陷阱。以Buchwald-Hartwig反应合成吡啶基苯甲酰胺为例,利用该算法对其连续流合成工艺参数进行优化。分别使用14组和5组先验数据进行优化,均收敛到相同的反应条件,使用较少的先验数据可以减少27.6%的实验次数。在最佳反应条件下,实际产率达到79.1%。总之,我们提出的算法为连续流合成中的参数优化提供了参考解决方案,有助于开发更高效、可持续的化学合成工艺。

 

seo seo