建立肽序列与原纤维形成之间的基本关系对于理解蛋白质错误折叠过程和指导生物材料设计至关重要。在这里,我们将全原子分子动力学(MD)模拟与人工intel-ligence(AI)相结合,以研究短肽序列排列的细微变化如何影响其形成原纤维的倾向。我们的结果表明,疏水残基的分布和电荷簇的分布很小,可以显着影响成核速率和跨β结构的稳定性。为了快速扩展此分析,我们开发了一个主动学习 - 增强的框架 - 用于分子动力学的机器学习(ML4MD),从而根据MD衍生的聚合数据迭代地完善了其预测。ML4MD有效筛选了许多肽排列,并指导发现先前未识别的原纤维式序列,从而在接收器操作特征(ROC)曲线(AUC)下达到0.939的接收器下方。总体而言,ML4MD通过将详细的原子模拟与快速和高敏锐的ML预测整合在一起,简化了淀粉样蛋白样肽的合理设计。