过程工程学报 ›› 2024, Vol. 24 ›› Issue (7): 833-842.DOI: 10.12034/j.issn.1009-606X.223308
杨婷, 董亚超*, 都健
Ting YANG, Yachao DONG*, Jian DU
摘要: 交叉偶联反应是现代有机合成中碳-碳键生成最有效的方法之一,有效地对催化剂进行筛选、优化对于提高药物、精细化学品的研发效率有重要作用。针对Suzuki-Miyaura及Buchwald-Hartwig交叉偶联反应建立了基于有机反应数据库的卷积神经网络模型及相关方法,用于适宜反应的催化剂(含配体)预测和速率常数预测,同时基于随机森林算法建立对比模型。结果表明,基于卷积神经网络的催化剂预测模型在Suzuki-Miyaura交叉偶联反应数据集中前三准确率达85%,在Buchwald-Hartwig交叉偶联反应数据集中前三准确率达92%,能够正确推荐反应催化剂。获得模型推荐的催化剂后,基于催化剂的结构特征使用ECFP4分子指纹及K-Means算法对反应进行聚类分析,在此基础上进行反应速率常数预测。将催化剂文本生成随机数字标签,与反应物、产物的ECFP4分子指纹进行拼接,形成描述整个反应的反应指纹作为模型的输入。为划分为3个聚类的数据集与原数据集分别建立速率常数预测模型并进行对比。结果表明,在两类交叉偶联反应数据集上使用聚类方法的速率常数预测模型性能有显著提高。基于卷积神经网络的交叉偶联反应催化剂及速率常数预测方法有望应用于其他有机合成反应,并进一步将形成的模型用于反应条件控制及优化。