Trupti Mohanty 1,Maitrey Mehta 2,Hasan M. Sayeed 1,Vivek Srikumar 2,Taylor D. Sparks 1 * 1材料科学与工程系,犹他大学,盐湖城,UT-84112,UT-84112。2 Kahlert计算学院,犹他大学,盐湖城,UT-84112,美国。 *通信:泰勒·D·斯帕克斯(Taylor D. Sparks),材料科学与工程系,犹他大学,盐湖城,UT-84112,美国,电子邮件:sparks@eng.utah.utah.utah.utah.utah.utah.utain摘要生成晶体结构,从文本描述中直接从文本描述中,标志着材料中的重要进步,可为您提供概念的流动路径。 将生成模型纳入晶体结构预测(CSP)为提高效率和创新提供了变革的机会。 虽然大型语言模型(LLM)在理解和生成文本方面表现出色,但它们在材料发现中的潜力仍然在很大程度上没有探索。 在这里,我们介绍了Crystext,这是一种从简单文本提示中生成晶体结构的高级方法,以材料组成和空间组编号为条件。 利用量化的低级别适应性(Qlora)进行微调,我们的方法可以直接从输入描述中直接从输入描述中产生有效且可扩展的CIF形成结构,从而消除了对后处理后的需求,从而确保了快速推理的有效微调。 对MP-20基准数据集的评估显示了高结构匹配速率和有效的RMSE指标,展示了该框架生成晶体结构的能力,这些晶体结构忠实地坚持指定的组成和晶体对称性。2 Kahlert计算学院,犹他大学,盐湖城,UT-84112,美国。*通信:泰勒·D·斯帕克斯(Taylor D. Sparks),材料科学与工程系,犹他大学,盐湖城,UT-84112,美国,电子邮件:sparks@eng.utah.utah.utah.utah.utah.utah.utain摘要生成晶体结构,从文本描述中直接从文本描述中,标志着材料中的重要进步,可为您提供概念的流动路径。将生成模型纳入晶体结构预测(CSP)为提高效率和创新提供了变革的机会。虽然大型语言模型(LLM)在理解和生成文本方面表现出色,但它们在材料发现中的潜力仍然在很大程度上没有探索。在这里,我们介绍了Crystext,这是一种从简单文本提示中生成晶体结构的高级方法,以材料组成和空间组编号为条件。利用量化的低级别适应性(Qlora)进行微调,我们的方法可以直接从输入描述中直接从输入描述中产生有效且可扩展的CIF形成结构,从而消除了对后处理后的需求,从而确保了快速推理的有效微调。对MP-20基准数据集的评估显示了高结构匹配速率和有效的RMSE指标,展示了该框架生成晶体结构的能力,这些晶体结构忠实地坚持指定的组成和晶体对称性。通过对船体上方的能量进行调节,我们进一步证明了水晶产生稳定的晶体结构的潜力。我们的工作强调了LLM在文本贡献的逆设计中的变革性作用,从而加速了新材料的发现。关键字:晶体结构预测(CSP),大语言模型(LLMS),量化低级适应性(Qlora)介绍传统方法,例如高通量筛选和第一原则计算在晶体结构预测(CSP)中一直是关键的[1-3] [1-3],但在计算上是昂贵的,并且是计算且具有时间量的范围,它们的化学范围跨越了范围,散布了范围的量表。利用变异自动编码器(VAE)[5-9]和生成对抗网络(GAN)[10-14]的生成方法加快了稳定的晶体结构的发现。然而,这些模型通常难以准确代表离散的原子类型及其连续的3D位置,同时结合了晶体对称性。基于扩散的模型[14-18]试图通过引入对称性的扩散过程[16]或整合诸如周期性,翻译和旋转诸如Equivariant denoising机制[17]之类的约束来解决这些局限性[17]。这些模型有效地生成具有对称约束的稳定结构,但它们在用户交互中的灵活性有限。他们对预定义的数值输入的依赖需要
主要关键词