关键词:大数据、材料信息学、计算材料学、高通量计算
写在前面
最近“人工智能(AI)”的风头很盛。如果说前几年国内所有行业都在追求“互联网+”的话,那这几年,以及未来几年,国内所有行业可能都会追求“人工智能+”。这可不是空穴来风,国务院甚至已经下达了人工智能未来发展规划(且看《国务院关于印发新一代人工智能发展规划的通知》。
这么看来,“三百六十行,行行写代码”的未来生活真是越来越清晰了。要是在目前这个时代,用不上先进的信息/效率工具来充实自己,来强大自己,还真有可能被快速发展的时代所抛弃。
要说信息科技目前在材料科学领域的成功应用,那是有目共睹的:通过计算机的降噪和球差矫正算法,最先进的透射电子显微镜已经能够达到亚埃级别的分辨能力;通过计算力学、计算材料学可以完成宏观、微观(微米、纳米)不同尺度下的材料理论模拟,成功预测不少高性能新材料;通过材料数据库的构建,工业界各企业能够快速选取适当性能的材料,为自己所用,很好地兼顾了性能与成本的平衡…而今,随着信息科技的不断发展,我们迎来了新的技术——通过对大量数据的计算收集,完成人类难以胜任的分析任务,从而发现材料结构与性能之间的规律。这就是目前“数据智能”技术可以给我们材料科研工作者们带来的一大有力工具。
研究背景
“高通量(high-throughput)”,顾名思义,意味着较大的流量。在这里,可以理解为巨大的数据流量。人类习惯于通过小样本数据进行规律寻找,进行学习。这样的学习效率很高,也是我们人类传统的学习和研究习惯。
但是计算机往往比较“笨”,目前还没有开发出能够通过小样本数据就能完成复杂学习的算法。不过,他们擅长与做重复的事情。又脏又累的机械工作,计算机可以轻松胜任。人类的精力只能保证完成少量的信息输入,而计算机可以快速获取大量信息,再快速(机械)处理,最后输出。因此,在大数据的处理方面,计算机的出现和发展,拓展了人类所能达到的信息处理水平。
今天所介绍的是一篇在Nature Material期刊上发表的关于”高通量计算“在材料设计方面应用的综述。
本文着重对高通量“计算”进行了介绍,并声明本文中的“高通量材料研究(HT material research)”与“材料性能的综合评价(combinatorial evaluation of material properties)”不同。此处的“高通量“特指数据量过大,而不能直接研究,必需通过计算机自动化完成的此类研究。(原文:Here we defne HT as the throughput of data that is way too high to be produced or analysed by the researcher’s direct intervention, and must therefore be performed automatically: HT implies an automatic flow from ideas to results. Te confusion of HT with combinatorial approaches is thus resolved. Te latter, in fact, specifes how the degrees of freedom are investigated, whereas HT strictly defnes the overwhelming and automatic flow of the investigations.)
高通量计算通过三个结合紧密的步骤完成:
- 材料合成模拟
- 合理的材料信息存储
- 材料性能表征及其选择
材料合成模拟的数学建模是很重要的一个步骤。由于人类对微观世界的研究尚未完全(是目前物理研究的一大前沿——凝聚态物理及弦理论),因此或多或少地,材料合成生长模型及其性能表征会有其局限性。但科学家们还是进行了大量有意义的探索。
以下是文献中有所报道的材料模拟中所关注的部分指标。
综述主要内容
文章主要从目前现状及其发展展望两个角度对”高通量计算“进行介绍。笔者通过Docear对其文章结构整理如下:
接下来,笔者将对图表进行简要分析。
写在后面
高通量方法极大地拓展了材料科研工作者所能探索的范围。如下图所示。
引自:Celiz, a D. et al. Materials for stem cell factories of the future. Nat Mater 13, 570–579 (2014).
该综述只讨论了”高通量“的一个方面,即”高通量计算(high-throughput computation)“。而由于理论的缺陷,材料计算模拟的结果,目前的实际可靠性还是不如实验结果。
因此不得不引出与”高通量“相关的另外一个研究方向——高通量实验(high-throughput experimentation)。自动化实验室——只需调整材料合成原料及材料制备压力、温度等参数,保持实验流程不变,从而获得fali多组对比实验数据——是一个比较好的例子。
另一个比较好的例子或许是利用扩散偶进行不同合金成分合金性能的表征。通过过扩散偶(两种或两种以上的相互紧贴的纯金属)在较高温度下所发生的扩散现象,可以获得连续变化的合金成分。通过对合金局部的成分表征,及局部性能表征(如硬度测试、导电率测试等),可以得到多组对应良好的材料成分-性能数据,极大节省了实验成本和时间。
上图展示了最理想状态下扩散偶可以达到的效果。如使用该方法进行合金局部TSC(Thermally stimulated current, 差热分析)测试,预测将能够在较少时间(不太确定,扩散所需时间较长)和较少材料下进行合金相图测定。
由于笔者学识所限,难免出现内容错漏的情况,望各位读者批评指正!
Email: mozheyang@outlook.com