摘要 自主物理科学正在彻底改变材料科学。在这些系统中,机器学习以闭环方式控制实验设计、执行和分析。主动学习是机器学习领域中的最佳实验设计,它选择每个后续实验以最大限度地利用知识来实现用户目标。通过实施科学机器学习(也称为归纳偏置工程人工智能),可以进一步提高自主系统的性能,它将物理定律(例如吉布斯相律)的先验知识融入算法中。随着主动学习策略的数量、多样性和用途的增长,对现实世界参考数据集进行基准测试的必要性也随之增加。我们提供了一个参考数据集,并以各种获取函数的形式展示了它用于基准测试主动学习策略的用途。主动学习策略用于快速识别三元材料系统中具有最佳物理特性的材料。数据来自实际的 Fe-Co-Ni 薄膜库,包括先前获取的材料成分、X 射线衍射图以及磁矫顽力和克尔旋转这两个功能特性的实验数据。流行的主动学习方法以及最近的科学主动学习方法因其材料优化性能而受到基准测试。我们讨论了算法性能、材料搜索空间复杂度和先验知识的结合之间的关系。简介
摘要。关键字:分子设计·生成建模·模型·搜索·梁搜索·解码语言模型分子设计是由于有效分子的较大搜索空间而导致的化学合作问题之一。现有的方法基于两种关键编码方法:分子图和文本微笑。分子图编码方法具有表达性和化学意识,因为它们包括原子,键和其他分子证券。基于微笑的方法没有考虑任何化学信息,并将这些分子视为一系列特征。当前的生成分子图和基于微笑的模型了解输入的分布,然后从学习分配中进行采样以生成新的分子。基于微笑的方法容易产生无效的分子,并且尚不在化学上意识到。尽管如此,大型语言模型(LLM)在NATU语言处理(NLP)中的成功导致了强大的LLM方法的开发,这些方法与最先进的分子基于图形的方法具有竞争力。本文显示了如何通过梁搜索对基于碎片的微笑LLM进行训练和采样,以提高产生的分子的有效性,新颖性和独特性。我们在两个标准分子设计数据集上评估了该模型:锌和PCBA。我们表明,我们的模型可以生成具有较高va效率,新颖性和唯一性的精确分子,同时记录结果与最先进的基于分子图的方法相当或更好。
摘要 - 本文解决了在实际环境中自主检查中对象目标导航的问题。对象目标导航对于在各种设置中实现有效的检查至关重要,通常要求机器人在大型搜索空间内识别目标对象。当前的对象检查方法没有人为效率,因为它们通常无法像人类那样在事先和常识知识之前引导。在本文中,我们引入了一个框架,该框架使机器人能够使用先前的环境空间配置和语义常识知识的语义知识。我们提出了将语义先验知识与机器人的观察结果相结合的搜索(对象检查任务的语义推理),以更有效地搜索和导航到目标对象。SEEK维持两个表示:动态场景图(DSG)和关系语义网络(RSN)。RSN是一个紧凑而实用的模型,可估计在DSG中的空间元素中找到目标对象的概率。我们提出了一个新颖的概率计划框架,以使用关系语义知识来搜索对象。我们的仿真分析表明,根据对象目标检查任务的效率,在本研究中检查了基于经典计划和大型语言模型(LLMS)的方法。我们在城市环境中验证了对物理机器人的方法,展示了其在现实世界检查场景中的实用性和有效性。
我们考虑使用多个移动代理将包裹从指定源集体递送到图中指定目标位置的问题。每个代理从图的某个顶点开始;它可以沿着图的边缘移动,并且可以在移动过程中从一个顶点拾起包裹并将其放在另一个顶点。但是,每个代理的能量预算有限,只能遍历长度为 B 的路径;因此,多个代理需要协作才能将包裹运送到目的地。给定图中代理的位置及其能量预算,寻找可行移动计划的问题称为协作递送问题,之前已经对其进行了研究。先前结果中的一个悬而未决的问题是,当递送必须遵循预先给定的固定路径时会发生什么。虽然这种特殊约束减少了可行解决方案的搜索空间,但我们表明寻找可行计划的问题仍然是 NP 难题(与原始问题一样)。我们考虑该问题的优化版本,即在给定代理的初始位置的情况下,要求每个代理的最佳能量预算 B,从而实现可行的交付计划。与该问题的一般版本已知结果相比,我们证明了该问题的固定路径版本存在更好的近似值(至少对于每个代理单次拾取的限制情况)。我们为有向和有向路径提供了多项式时间近似算法
我的论文重点关注生成模型及其在离散数据中的应用。我们提出了新颖的算法,将最先进的生成模型的见解与离散数据类型的领域特定知识相结合。这些算法旨在增强与训练数据的属性相似性,提高数据有效性,并提高生成输出的整体质量。我的论文的第一部分研究了使用上下文无关语法将几何图像转换为离散表示。我们讨论了在大型搜索空间中识别合适表示的有效且可扩展的技术。我的论文的第二部分研究了变分自动编码器 (VAE) 在恢复嵌入在低维流形中的高维数据时的行为,评估了它们恢复流形及其上的数据密度的能力。将我们对 VAE 的探索扩展到离散数据领域,特别是在分子数据生成中,我们发现一种增强 VAE 对连续数据的流形恢复的方法也显著改善了离散数据生成。我们使用 ChEMBL 数据集和两个较小的蛋白质靶标活性分子数据集研究了它的优点和局限性。最后,为了解决生成稳定三维分子的难题,该论文将不可微分化学预言机 GFN2-xTB 融入去噪过程,以改善几何形状和稳定性。该方法已在 QM9 和 GEOM 等数据集上得到验证,表明生成的分子具有更高的稳定率。
随着交互式数据流的提供量增加,作为物联网 (IoT) 的一部分部署的、可通过远程微服务访问的智能设备和传感器的数量和功能将急剧增加。这为通过在不同工作流配置中互连这些微服务来快速构建新应用程序提供了机会。挑战在于发现所需的微服务,包括来自受信任合作伙伴和更广泛社区的微服务,同时能够在不同的网络条件下稳健运行。本文概述了一种工作流方法,该方法提供可验证的可信服务的去中心化发现和编排,以支持多方操作。该方法基于采用自主主权身份研究的模式,特别是可验证凭证,以隐私保护和安全的方式在同行之间基于服务描述和先前服务使用情况的证明共享信息。这为批准和评估不同服务的质量提供了一个动态的、基于信任的框架。整理这些新的服务描述并与基于向量符号架构 (VSA) 的现有分散式工作流研究相结合,为高效、可信的服务发现提供了增强的语义搜索空间,这对于支持各种新兴的边缘计算环境是必不可少的。设计了一种动态分散式服务发现系统的架构,并通过应用于使用可信对等方报告的异常检测服务经验来确定服务选择的场景来描述。© 2022 Elsevier BV 保留所有权利。
工程设计问题通常涉及大型状态和动作空间以及高度稀疏的奖励。由于无法穷尽这些空间,因此人类利用相关领域知识来压缩搜索空间。深度学习代理 (DLAgents) 之前被引入使用视觉模仿学习来模拟设计领域知识。本文以 DLAgents 为基础,并将其与一步前瞻搜索相结合,以开发能够增强学习策略以顺序生成设计的目标导向代理。目标导向的 DLAgents 可以采用从数据中学习到的人类策略以及优化目标函数。DLAgents 的视觉模仿网络由卷积编码器 - 解码器网络组成,充当与反馈无关的粗略规划步骤。同时,前瞻搜索可以识别由目标指导的微调设计动作。这些设计代理在一个无约束桁架设计问题上进行训练,该问题被建模为一个基于动作的顺序配置设计问题。然后,根据该问题的两个版本对代理进行评估:用于训练的原始版本和带有受阻构造空间的未见约束版本。在这两种情况下,目标导向型代理的表现都优于用于训练网络的人类设计师以及之前反馈无关的代理版本。这说明了一个设计代理框架,它可以有效地利用反馈来增强学习到的设计策略,还可以适应未见的设计问题。[DOI:10.1115/1.4051013]
组合疗法需要通过重新布线冗余途径来治疗已经对单层抗性的晚期癌症患者。由于潜在的药物组合数量,需要采用系统的方法来使用成本效益的方法来确定每个患者的安全有效组合。在这里,我们开发了一种精确的多目标优化方法,用于识别显示最大癌症选择性的成对或高阶组合。患者特异性组合的优先级是基于组合的治疗和非选择性效应所跨越的搜索空间中的帕累托优化。我们在BRAF-V600E黑色素瘤治疗中证明了该方法的表现,在那里,Optimal Solutions预测了vemurafenib批准的vemurafenib的许多共同抑制伙伴,Vemurafenib是一种选择性的BRAF-V600E抑制剂,批准了晚期黑色素瘤。我们通过实验验证了BRAF-V600E黑色素瘤细胞系中的许多预测,结果表明,通过使用成对和第三阶药物组合的MAPK/ERK和其他补偿途径组合,通过将MAPK/ERK和其他补偿途径组合进行组合来改善BRAF-V600E黑色素瘤细胞的选择性抑制。我们的机理 - 不足的优化方法广泛适用于各种癌症类型,它仅作为对成对药物组合的子集的输入测量,而无需目标信息或基因组谱。此类数据驱动的方法可能对超出癌症遗传依赖性范式的功能精度肿瘤应用有用,以优化癌症选择性的组合治疗。
摘要。控制工程中的重复和重要任务是在约束下进行调整,从概念上讲,仅通过噪声评估才能访问黑框函数。例如,在预设司法机构的控制练习参数中,通常会用工厂的反馈在线调整,并且只能尝试使用安全的Pa-Rameter值,例如不稳定。最近,已经针对这种重要的概率部署了机器学习方法,尤其是贝叶斯优化(BO)。为处理安全性,安全BO的算法,尤其是SafeOpt-type算法,这些算法在基于学习的控制,机器人技术和相邻领域方面享有很大知名度。但是,我们确定了实践安全的两个重要障碍。首先,SafeOPT型算法依赖于标志性的不确定性界限,大多数实现将这些算法替换为理论上不支持的启发式方法。第二,理论上有效的非确定性界限至关重要地取决于数量 - 目标函数的繁殖内核希尔伯特空间规范 - 目前无法使用已建立的先验工程知识可靠地绑定它。通过仔细的数值实验,我们表明这些问题确实会导致安全违规。为了克服这些问题,我们提出了Lipschitz仅安全的贝叶斯优化(LOSBO),这是一种仅依赖于已知Lipschitz为其安全而绑定的安全的BO算法。此外,我们提出了一个避免搜索空间网格的变体(LOS-GP-UCB),因此即使适用于适度的高维问题。
预测药物-靶标相互作用 (DTI) 是药物发现领域的一个重要研究领域。这意味着识别化合物和蛋白质靶标之间的相互作用。探索这些相互作用的湿实验室实验既昂贵又耗时。相反,更注重相互作用预测计算方法的干实验室环境有助于限制这些实验的搜索空间,并在开发新药之前提供线索。本文提出了一种称为 SRX-DTI 的新型药物-靶标相互作用预测方法。首先,我们从蛋白质序列中提取各种描述符,并将药物编码为 FP2 分子指纹。为了处理类别不平衡问题,我们提出了 One-SVM-US 技术来处理不平衡数据。我们还开发了 FFS-RF 算法,一种前向特征选择算法,并将其与随机森林 (RF) 分类器相结合,以最大化预测性能。前向特征选择算法在预测能力提高的前提下,向一组选定特征中添加新特征。该特征选择算法删除不相关的特征以获得最佳最优特征。最后,将具有最佳特征的平衡数据集提供给 XGBoost 分类器以识别 DTI。实验结果表明,我们提出的方法 SRX-DTI 在预测 DTI 方面比其他现有方法具有更高的性能。数据集和源代码可在以下位置获得:https://github.com/Khojasteh-hb/SRX-DTI 。
