深度加固学习(DRL)是一种在各种复杂环境中训练自主代理的方法。尽管在众所周知的环境中表现出色,但它仍然容易受到较小条件的变化,这引起了人们对其在现实世界应用中的可靠性的担忧。为了改善Usabil的影响,DRL必须表现出可信赖和稳健性。通过对环境动力学的良好适合对抗性攻击进行训练,通过训练代理人来训练代理商,将DRL鲁尔的鲁棒性转化为未知变化的鲁棒性。解决这个关键问题时,我们的工作对当代对抗攻击方法进行了深入分析,系统地对其进行了分类并比较其目标和操作机制。此分类提供了一个详细的见解,以了解对抗性攻击如何有效地评估DRL代理的弹性,从而为增强其稳健性铺平了道路。
endcript 2是一款友好的Web服务器,用于以符合方式提取和渲染对第四纪蛋白质结构信息的全面分析。这一重大升级已全面设计,以通过交互式3D可视化提高速度,准确性和USABIL。它需要对我们众所周知的序列比对渲染器Espript的新版本3进行优势,以减少计算时间来处理大量数据。从单个PDB输入或文件中,端目构图显示出与查询同源的蛋白质多种蛋白质对齐的高质量图,并根据残基保守性颜色。此外,还描述了实验二级结构元素以及一组相关的生物物理和结构数据。现在,所有这些信息和更多信息都在交互式3D Pymol表示上映射。多亏了其自适应和严格的算法,专家用户的初学者可以将设置修改为满足他们的需求。endcript也已被升级为开放平台,用于可视化来自外部Biotool Web服务器的多个生化和结构数据,并具有2D和3D表示。endcript 2和es- pript 3分别在http://endscript.ibcp.fr和http://espript.ibcp.fr上免费获得。
Elaine Schaertl Short Elaine.short@tufts.edu工程学院塔夫茨大学抽象基础模型是通往通用和用户友好机器人的有前途的途径。普遍的方法涉及培训“通才政策”,该政策像强化学习政策一样,使用观察结果来输出动作。尽管这种方法取得了很大的成功,但是在考虑与这些系统的部署和最终用户互动时,出现了一些问题。特别是,任务之间缺乏模块化意味着,当更新模型权重(例如,当用户提供反馈时)时,其他无关任务的行为可能会受到影响。这可能会对系统的解释性和USABIL产生负面影响。我们提供了一种替代方法,用于设计机器人基础模型的设计,策略参数的扩散(DPP),该方法生成独立的,特定于任务的策略。由于这些策略与基础模型分离,因此仅在用户想要通过反馈或个性化的情况下更新它们,从而使他们能够高度熟悉该策略。我们在模拟中证明了DPP的概念概念证明,然后讨论其局限性以及可解释的基础模型的未来。