人工智能是近年才逐渐进入人们视野的一门学科,一项技术。提到人工智能,很多人第一个想到的可能就是2017年5月27日的那场与柯洁人机大战,以3比0的总比分击败当时世界排名第一的柯洁。AlphaGo是一款围棋人工智能程序,而能使它越战越勇的秘诀就是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。
而如今这种技术已经应用于越来越多的领域,尤其是它可以合成前所未有的新材料并预测各种化学合成。而用于化学合成起源于1967年Elias James Corey提出了具有严格逻辑性的“逆合成分析原理”,以及合成过程中的有关原则和方法。按照他的原理,使很多合成难度较大的有机化合物,得到较高的收率而获得成功。Corey还开创了运用计算机技术进行有机合成设计。按照他的原理,他和他的学生卫普克编制了第一个计算机辅助有机合成路线设计程序(DCSS)。由于Corey提出有机合成的“逆合成分析方法”并成功地合成50多种药剂和百余种天然化合物,对有机合成有重大贡献,而获得1990年诺贝尔化学奖。
在web of science数据库通过对关键词“machine learning”和“deep neural networks”检索,筛选关于材料化学能源领域发现,关于机器学习已经发表了6335篇
而且发表论文数也成逐年上升的趋势。而深度神经网络相关也有831篇。
注:由于数据库中有很多重叠部分,比如说有些文章是有关材料化学的但是文章题目没有体现,web of science在分类时会把它分到计算机相关方向,这样也就造成了数据存在不准确性,而我们仍然统计只是说明材料化学领域人工智能相关研究一直处于上升阶段,也为了更直观的表达,所以读者朋友们对数据有不同看法的可以和我们联系,我们一定认真聆听教诲!
而近两年各大顶级期刊更是争先发表机器学习合成新材料、预测化学合成的成果,比如近期Science和Nature相继发表了关于人工智能预测化学反应的研究。
上图是普林斯顿大学Abigail G. Doyle、Merck Sharp & Dohme公司Spencer D. Dreher等人发表在Science上题为“Predicting reaction performance in C–N cross-coupling using machine learning”的成果,研究小组证明了机器学习可以用来预测多维化学空间中合成反应的性能,使用通过高通量实验获得的数据。通过创建脚本来计算和提取原子,分子和振动描述符,用于钯催化的Buchwald-Hartwig芳基卤化物与4-甲基苯胺在各种潜在抑制添加剂存在下的交叉偶联反应。使用这些描述符作为输入和反应产量作为输出,表明随机森林算法提供了比线性回归分析显著改进的预测性能。
相对于Science这篇文章,Mark P. Waller等人发表在Nature上这篇文章(Planning chemical syntheses with deep neural networks and symbolic AI,DOI: 10.1038/nature25978 )反应类型更加全面,研究小组利用逆向合成法,对现存的1000多万个反应体系构建神经网络,根据产物能预测推算合成反应,而且比之前传统的计算方法快30倍以上。“逆向合成是有机化学的终极学科,化学家需要数年才能掌握它——就如同下棋一样,除了学习专业知识,还需要很好的直觉和创造性。”这是论文作者采访时说的话,而通过逆向合成,越来越多的反应被人们掌握。
国内关于这方面的研究也在不断进入白热化阶段,前不久西安交大孙军教授、丁向东教授团队提出了一个基于机器学习技术的材料设计方法,并应用于加速设计开发新型压电材料。这一设计思路是一个由数据采集、统计模型、实验设计、结果反馈组成的循环回路;通过对回路的多次循环,实现对材料目标性能的快速优化。区别于以往以预测结果为导向的实验设计,上述循环最大的不同之处在于利用预测结果的不确定性(uncertainty)进行实验设计,仅仅通过三组实验就成功开发了一种具有高电致应变的无铅压电材料。同时,本文还比较了不同的实验设计策略,发现平衡考虑预测值与不确定性的策略在材料开发中更加高效。(Accelerated Discovery of Large Electrostrains in BaTiO3-Based Piezoelectrics Using Active Learning,DOI: 10.1002/adma.201702884)
新材料的合成也并不陌生,早在2016年美国西北大学工程系和Los Alamos国家实验室将机器学习和密度泛函理论计算相结合,为新材料的设计创造出指南,并指出材料所具有的一些实用电性能,如铁电性能和压电性能。课题组通过建立数据库,在所调查的3000种以上材料中,数据科学方法发现了超过200种可能的理想材料。而通过机器学习分析,就将可能的理想材料缩小至19种(Learning from data to design functional materials without inversion symmetry,DOI:10.1038/ncomms14282)。
不得不承认,人工智能时代已经来临,它们的工作有些时候人力真是无法企及。有些人会发出疑问,如果人工智能发展成熟,那么我们这些传统从业人员是否会被取代?对于这个问题现在回答还为时过早,人工智能虽然前景巨大,但是有一点可以肯定的是人的思想和创造力是独一无二的,人工智能更应该成为我们探索未知领域的工具,减少失败的成本。试想一下,谁会有时间和精力去验证上万个甚至十万个反应的正确性呢?人工智能对于这些来说意义非凡,好好利用这一工具或许可以将某一领域的研究进程推进数十年!