图1。(a)140,120结构的T-SNE可视化以及晶体系统和元素数量的统计数据。(b)合成性LLM的训练过程。使用PU学习模型构建平衡的数据集,将批次转换为材料字符串,然后用Lora进行微调。(c)1,401,562结构的CLSCORE分布和用于滤除非混合结构的CLSCORE范围。(d)前体和方法LLM的培训过程。37,654个化学公式及其前体和合成方法的数据对是从文献中收集的,并用洛拉进行了微调。(e)使用LLM预测合成性和建议前体的总体工作流程。首先将晶体结构转换为材料字符串。然后由合成性LLM预测其合成性。基于化学公式,llms的前体和方法提供了一批潜在的前体及其反应能。