当前位置: 编码机 >> 编码机介绍 >> 科学智能峰会专家观点总结报告AI4S科学
“AIforScience”全新范式已经成为当前的重要趋势,人工智能与传统科学的结合,深刻影响着生物计算、材料计算、工业仿真等各个领域,而其最为核心的底层算法创新更是推动AIforScience趋势的关键力量。AI4S科学创新前沿分论坛,汇集了各个领域的专家,围绕机器学习辅助的计算成像、机器学习加速物理规律发现、百亿原子规模分子动力学、DeePKS机器学习辅助泛函、深度生成模型变分自由能计算、大体系燃烧模拟、势能函数预训练大模型等多个话题进行了分享。作为AI4S科研范式最根本的动力来源,科学创新前沿始终牵动着整个行业的发展,同时也让下游的应用和基础设施建设成为可能,共同迈向无限可能的未来。
计算成像关心的问题是如何有效的感知数据并重建高质量的图像以辅助人们进行决策。传统的图像感知以硬件设计为主,而图像重建和分析是数学与统计方法的主战场。长久以来图像感知、重建和分析三个环节发展相对独立,融通性较弱,但在机器学习得以长足发展的今天,这一状况在逐渐发生改变。北京大学北京国际数学研究中心、国际机器学习研究中心董彬副教授围绕深度学习给计算成像所带来的机遇与挑战,介绍了如何将传统的图像重建算法与机器学习方法相结合来设计数据驱动与任务驱动的成像算法,从而实现计算成像中三个环节的有机融合。受到数值偏微分方程的启发,他将深度神经网络和离散微分方程建立了联系,并由此诱导了新的网络构架。通过设计的PDE-Net实现了系统识别,这些研究逐渐发展出了一种机理与数据融合的算法设计模式,并应用于科学计算中的许多其他问题。数据带来的整合的潜力,给计算成像带来了很多机遇。
科学发现是揭示事物运动新机制、发现一般性新规律、阐明新原理的过程,并模型化、定量化、理论化,以预言新现象,提出新概念。中国科学技术大学微尺度物质科学国家研究中心胡素磊副研究员认为物理启示和机器学习共同促进了材料科学的发展。以纳米粒子生长为例,胡老师认为灵感或物理直接驱动了其动力学规律的揭示,从而实现可控制并维持其长期稳定性;而数据驱动的例子是将Lifshitz-Slyozov-Wagner(LSW)理论作为极限推广到纳米尺度。物理直觉、分解简化、数据驱动、解析推导、机器学习、密度泛函、多尺度耦合、神经网络势分子模拟、数值模拟方法深度融合揭示了材料输运一般性规律,建立了多尺度可预测数学模型,提出了催化剂与载体相互作用的Sabatier原理,为抗烧结纳米催化材料设计提供了基础。
传统的分子动力学方法无法兼顾效率和精度,近年来人工智能的蓬勃发展为解决这一难题提供了新的可能。基于深度学习方法的DeePMD以大量的第一性原理计算数据来拟合原子之间的势能面,从而以经典分子动力学的效率进行高精度的模拟。该方法和超级计算机的结合更是斩获戈登贝尔奖,使得高精度计算的体系大小和计算速度上获得了几个数量级的提升。中科院计算所贾伟乐副研究员等人在此基础上,通过模型压缩的方法,将复杂的嵌入层神经网络压缩为五阶多项式,同时结合核函数融合的方法并去除神经网络中的冗余零,从而极大减小了计算中内存的消耗,实现了百亿原子的动力学模拟。AI驱动的第一性原理分子动力学在第一性原理计算数据获得,高精度模型的训练以及超大规模的体系模拟三个方面上依然存在进一步提升的空间,在将来有机会发挥出更大的潜力。
微观粒子复杂多体作用产生计算的维数灾难,限制了大体系探索,而机器学习方法可以压缩维数灾难带来的问题。北京科学智能研究院欧琪研究员介绍了机器学习辅助泛函DeePKS以及结合DeePMD的应用。DeePKS可以学习低精度和高精度泛函的能量差,相较于DeePMD,DeepKS训练所需的数据点大大减小且泛化能力更强,可以通过DeepKS生成DeepMD所需的大量数据,以减小计算成本。DeePKS结合DeePMD的方法应用于凝聚态水体系以及氯化钠水溶液,计算精度分别达到高精度泛函SCAN0和SCAN的水平,实现了大体系杂化泛函的动力学模拟。ABACUS-DeePKS模型的出现建立了经典动力学模拟与第一性原理计算之间的桥梁,将给大体系动力学模拟带来新的可能性。这种可能性不仅体现在从慢到快的量变上,更体现在从无到有的质变上——此前受限于计算资源而无法模拟的物质结构性质将能够被深入探索。
变分自由能计算不仅是物理学家费曼的心愿,也是AIforScience的一个历史机遇。中科院物理所的王磊研究员介绍了基于深度生成模型的变分自由能计算,如今丰富的数据量、更高级的计算机以及深度生成模型的产生使得运用自由能最小化原理进行计算成为可能。传统的生成模型在机器学习的典型应用是对生成概率建模并从模型中提取新的样本,运用到统计物理中,生成模型可以对变分自由能做最小化处理。变分自由能计算能够很好地解决量子多级以及费米子问题。深度生成模型的变分自由能计算应用前景广阔,很多量子多级问题比如均匀电子气、氢的相图这些有长期争议的历史遗留问题都要依靠该方法来解决。
传统的模拟燃烧反应的方法考虑了燃烧反应过程中的详细机理,是一个涉及多组分,多反应的过程,面临着维数灾难等问题。上海交通大学自然科学研究院与数学科学学院许志钦副教授介绍了将神经网络模型用于加速燃烧反应模拟的工作。基于神经网络,可以从燃烧反应的详细机理中提取出骨架机理,提取影响反应的关键信息,对原有的模型进行简化,从而加速模拟。通过DeepMR方法获取的机理规模小,同时保持高精度。该方法对燃烧这种涉及多组分化学反应,流体等复杂体系具有很好的效果,反映了AI用于解决复杂系统,多体系统难以准确高效模拟的优势。
深度势能(DeePMD)方法实现了分子动力学模拟精度与速度的最大程度的统一,但由于模型迁移能力不足,很难实现传统AI领域的预训练大模型策略,每次数据获取和训练开销巨大。来自深势科技算法团队的张铎研究员介绍了近期对DeePMD进行的大幅优化与改进,通过对元素类型更优的编码以及利用关键的注意力机制,极大提高了模型容量和迁移能力,获得了覆盖元素周期表大多常见元素的大型预训练模型。在不同数据集上的迁移学习结果表明,模型能大幅降低新场景对数据的依赖。就像BERT的出现彻底改变了自然语言处理领域的研究范式,DeePMD的预训练大模型将大幅降低模型训练所需数据量及训练成本、提高模型预测精度,进而对基础科研、材料设计、药物设计等领域产生重大而深远的影响。
视频回放:
转载请注明:http://www.aideyishus.com/lkyy/7132.html