本文将聚焦 3D 打印材料开发,用四个具体案例对目前先进方法进行解读,以期让读者从整体上对机器学习在材料开发应用方面有认知和把握。
本文首发自 HyperAI 超神经微信公众号~
以 AlphaFold 为代表,机器学习在生物制药、蛋白质结构预测等领域,已经有了喜人的研究成果,尤其是几何深度学习 (Geometric deep learning) 在原子结构建模方面取得的巨大进展,有望为计算材料科学中开放性问题提供解决思路。
但是,与药物样分子 (drug-like molecule) 和蛋白质相比,材料建模也面临两个主要挑战:
* 大部分材料没有合适的表示方法。开发成功的机器学习模型,需要特定材料的归纳偏置 (inductive biase),这要求输入必须是具备一定格式或规律的,比如我们可以用 2D 图结构来表示分子,用序列表示蛋白质,这在材料领域是无法实现的,加上大部分材料需要在周期性边界条件 (periodic boundary conditions) 下进行表示,这给表征学习和生成模型都带来了很大挑战。
* 材料类别五花八门、多种多样,如无机晶体、聚合物、催化表面、纳米多孔材料等等,每种材料结构的表示方法不同,都需要专属 task/数据集。
尤其以 3D 打印材料的开发和性能优化为例,更面临着过度依赖专业知识、重复试验、性能取舍等方面的制约。本文将围绕该主题,分享当下前沿的科研成果和方法。
1. 波士顿大学:A Bayesian experimental autonomous researcher for mechanical design(2020)
阅读完整论文:
https://www.science.org/doi/full/10.1126/sciadv.aaz1708
基于贝叶斯优化的自动 3D 打印和测试平台,可以加速高压缩韧度 structure 的探索。结合贝叶斯优化和高通量自主实验,科研人员开发了一个贝叶斯实验自动研究员 ( Bayesian experimental autonomous researcher,简称 BEAR ),除快速实验外,BEAR 还基于所有可用结果对实验进行迭代。
用 BEAR 研究增材制造组件力学
利用 BEAR,科研人员可以探索 structure 参数家族的韧度,同时使得识别高性能 structure 所需的实验数量,与基于网格的搜索相比减少了近 60 倍。这些结果显示了机器学习在数据稀少的实验领域的价值。
2. 纽约大学:Combining automated microfluidic experimentation with machine learning for efficient polymerization design(2020)
阅读完整论文:
https://www.nature.com/articles/s42256-020-0166-5
科研人员开发了一个微流控反应器 (microfluidic reactor),用于筛选锆茂(zirconocene,一种化合物)催化剂,并结合拉丁超立方算法,提高催化剂的开发效率。
锆茂金属催化剂自动热成像微反应器系统工艺流程图
在实验过程中,科研人员提出了一个用机器学习辅助自动显微化学反应器 (machine-learning-assisted automated microchemical reactors) 研究聚合反应的方法论,采用自行设计的微反应器原型,结合自动化和原位红外热成像技术,进行了高效、迅速的实验,绘制锆茂金属聚合催化剂的反应空间,获得基本动力学参数。
实验使得化学废物减少了两个数量级,催化剂的发现从数周减少到数小时。
3. 英国利物浦大学:A mobile robotic chemist(2020)
阅读完整论文:
https://www.nature.com/articles/s41586-020-2442-2
科研人员开发了一个移动机器人(模块化、灵活、可自行移动,而非仪器)寻找更优的水中制氢光催化剂。
该机器人自主运行超过 8 天,由一系列贝叶斯搜索算法驱动,在具有 10 个变量的空间内,进行了 688 次实验。
结果表明,这种自主探索得出的光催化剂混合物的活性,比最初的配方高 6 倍。
自动量子点合成机器人诞生,整合了一个基于机器学习的实验选择和流体化学来探索多目标性能。然而,整个过程是在流体中进行的,这也导致一定程度上无法涵盖某些更复杂的配方-加工-性能关系。
同时,每次实验的成本和耗时都很高,材料供应比较有限,因此,收集大量的数据成为困难。此外,对于许多现实中的应用,通常要满足多个性能标准,而这也增加性能空间探索的复杂性,很难找到最优解。
这种情况下,指导设计空间采样的多目标优化方法则可以有效减少实验次数。
1. 麻省理工学院:Accelerated discovery of 3D printing materials using data-driven multiobjective optimization
阅读完整论文:
https://www.science.org/doi/10.1126/sciadv.abf7435
科研人员利用机器学习加速具有最佳机械性能制约 (trade-off) 的增材制造 (additive manufacturing) 材料的开发。同时开发了一个多目标优化算法,通过提出混合主要配方创造性能更佳的材料,从而自动指导实验设计。
该系统的 workflow 示意图
( A ) 配方分配。
( B ) 配方混合。
( C ) 用于样品制造的 3D 打印机。
( D ) 样品后处理与紫外线 (UV) 固化和加热。
( E ) 性能数据提取的压缩试验。
( F ) 贝叶斯优化算法的配方和性能评估,输出建议的新配方测试。
该算法与一个半自主制造平台相结合,可大大减少执行实验的数量和解决问题的总时间。在不了解主要配方的情况下,所提出的方法自行开发了 12 种最佳配方,并在 30 次实验迭代后将发现的性能空间扩大了 288 倍。这种方法有望轻松地推广到其他材料设计系统并实现材料的自动发现。
实验结果表明,完成一个迭代周期的实验只需要 6797 秒(不到 2h),只有转运样品的步骤需要人工完成,极大加速了 3D 打印材料的开发流程。
阿里云《2021 年 3D 打印行业发展研究报告》中显示,近年来,3D 打印受到国际社会的广泛关注。以美国为例,其在 3D 打印技术上投入大量的人力、物力和财力,研发出更为丰富的打印材料,促使这一技术日趋成熟。目前 3D 打印也已成为美国增长最快的工业之一。
与此相对,国内在材料开发方面起步较晚,但随着国家的重点关注,3D 打印行业市场潜力无疑巨大。有行业机构预测,2025 年中国 3D 打印市场有望增长至 635 亿元,其中 3D 打印材料约占三分之一,市场规模将达数百亿。可以推断,3D 打印行业已成为引领新一轮产业变革的核心技术之一,而 3D 打印材料作为其中的中上游,重要性不言而喻。
如今来看,在这片巨大的蓝海中,机器学习正凭借其强大的预测性能,加速驱动 3D 打印行业的发展。因此,对于众多企业而言,谁能抢先抓住机遇在其中胜出,也将意味着将顺利站上变革风口。