自动驾驶汽车中的运动计划问题是计算上的[7],通常分解为三个子问题[15]:(i)任务计划; (ii)行为计划; (iii)本地计划。图。1。在我们的自动驾驶汽车中,任务计划者接收起始位置,并确定自动驾驶汽车必须驾驶的车道顺序。此序列被转换为intents(例如在下一个十字路口右转),并将其发送给行为计划者以及环境表示。行为计划者然后生成一系列高级参数化驱动器操作,以导航环境朝着指定目标。当地规划师发现了一个平稳的轨迹,可满足所需的行为和舒适感。最后,车辆控制器使用轨迹来确定转向,油门和制动命令。行为计划的早期方法使用有限的状态机[13,18]。由于驾驶问题的固有复合物,这种系统通常很难维护。状态机器的组合将问题分解为子问题,可以减轻这种缺乏可维护性[17]。国家机器的产生层次结构通常引入了优先表的需求[14],这是一个基于规则的系统也很熟悉的概念[5]。
▪将模型文件拖放到工作流画布上。ModeFrontier将从其中提取所有参数和响应。然后,您可以跳过工作流,然后直接转到计划者开始优化。
摘要 - 运动计划对于复杂的城市环境中的安全导航至关重要。从历史上看,运动策划者(MPS)已通过像卡拉这样的程序生成的模拟者进行了评估。但是,这种综合基准不会捕获现实世界的多代理相互作用。最近发布的MP基准标准 NUPLAN通过使用闭环仿真逻辑来增强现实世界驱动日志来解决此限制,从而有效地将固定的数据集变成了反应性模拟器。 我们分析了Nuplan记录的日志的特征,并发现每个城市都有其独特的驾驶行为,这表明健壮的计划者必须适应不同的环境。 我们学会用行为者(GravieNet)模拟这种独特的行为,该行为是一种图形卷积神经网络(GCNN),该卷积神经网络(GCNN)使用来自最近观察到的试剂历史的特征来预测反应性剂行为;从直觉上讲,一些侵略性的特工可能会导致铅车辆,而另一些则可能不会。 为了建模这种现象,cavenyet预测了代理运动控制器的参数,而不是直接预测其时空轨迹(就像大多数预报符一样)。 最后,我们提出了基于模型预测控制(MPC)计划者的AdapTivedRiver,该计划者展开了以行为网的预测为条件的不同世界模型。 我们的广泛实验表明,AdaptivedRiver在NUPLAN闭环计划基准上取得了最先进的结果,在14个硬式R-CLS上对先前的工作提高了2%,即使对从未见过的城市进行评估时也可以概括。NUPLAN通过使用闭环仿真逻辑来增强现实世界驱动日志来解决此限制,从而有效地将固定的数据集变成了反应性模拟器。我们分析了Nuplan记录的日志的特征,并发现每个城市都有其独特的驾驶行为,这表明健壮的计划者必须适应不同的环境。我们学会用行为者(GravieNet)模拟这种独特的行为,该行为是一种图形卷积神经网络(GCNN),该卷积神经网络(GCNN)使用来自最近观察到的试剂历史的特征来预测反应性剂行为;从直觉上讲,一些侵略性的特工可能会导致铅车辆,而另一些则可能不会。为了建模这种现象,cavenyet预测了代理运动控制器的参数,而不是直接预测其时空轨迹(就像大多数预报符一样)。最后,我们提出了基于模型预测控制(MPC)计划者的AdapTivedRiver,该计划者展开了以行为网的预测为条件的不同世界模型。我们的广泛实验表明,AdaptivedRiver在NUPLAN闭环计划基准上取得了最先进的结果,在14个硬式R-CLS上对先前的工作提高了2%,即使对从未见过的城市进行评估时也可以概括。
计划是行动之前的审议思维行为(Haslum 2006)。它基于世界的符号模型及其在其中作用的选项,通常在功能 - 无函数的一阶逻辑中定义。规划师必须找到一系列行动(计划),该动作从当前状态带到了期望的目标状态。纯粹的物理描述可以通过部分有序的语法式结构(分层任务网络或HTN)进行增强,描述专家知识,或实用,法律或操作要求。在本次演讲中,我将使用符号方法来调查各种自动得出计划的方法。这些符号方法 - 从某种意义上说 - 将计划问题转化为其他,更简单的符号代表,并推理了这些方法,以找到计划。作为这些方法的基础,我首先将在计划中介绍相关的理论结果。首先,我将讨论规划形式主义的表现力(Houler等人2014; Houler等。2016)和第二,HTN计划的计算复杂及其相关任务,例如HTN计划验证,计划修改和计划识别(Behnke,Houler和Biundo 2015; Behnke等; Behnke等人2016)。基于这些理论结果,我将开发为什么基于SAT的HTN计划以及如何进行基于SAT的HTN计划。为此,我将在顶级会议上调查我的几个公开(Behnke,Houler和Biundo 2017,2018,2019a,b; Behnke等人。接下来,我提出了表达以SAT(Houler and Behnke 2022)的升级经典计划的想法。2020; Behnke 2021) - 在其中,我开发了一个基于SAT的HTN问题计划者,包括找到最佳计划以及接地的能力,以作为预处理步骤。由此产生的计划是第一个基于SAT的计划者 - 事实证明,在出版时表现出了高效且优于所有其他提起的计划者。值得注意的是,Lisat是第一位计划者(被解除或扎根),仍然是唯一一个解决具有挑战性的有机合成基准的计划者,甚至可以证明所有计划的最佳性。最后,我介绍了具有象征性表示的计划概念(Behnke和Speck 2021; Behnke等人。2023) - 使用二进制决策图(BDD)紧凑地编码大量状态。使用BDD注释的finenite自动机的组合,我们可以结构
我们从多智能体强化学习 (MARL) 的角度研究了一个双层经济系统,我们称之为马尔可夫交换经济 (MEE)。MEE 涉及一个中央计划者和一组自利的智能体。智能体的目标是形成竞争均衡 (CE),其中每个智能体在每一步都短视地最大化自己的效用。中央计划者的目标是操纵系统以最大化社会福利,社会福利被定义为所有智能体效用的总和。在效用函数和系统动态都未知的环境中,我们建议通过 MARL 的在线和离线变体从数据中找到社会最优策略和 CE。具体而言,我们首先设计一个专门针对 MEE 的新型次优度量,这样最小化这样的度量就可以为计划者和智能体证明全局最优策略。其次,在线设置中,我们提出了一种称为 MOLM 的算法,该算法将探索的乐观原则与子博弈 CE 寻求相结合。我们的算法可以轻松结合用于处理大状态空间的一般函数逼近工具,并实现次线性遗憾。最后,我们根据悲观原则将算法调整为离线设置,并建立次优性的上限。
该工具包鼓励计划者对他们的愿景,我将他们的举措,行动计划和实现影响。它还包含案例研究,以激发新加坡的传统可能性。传统计划过程旨在促进活动组织者,场地,当地社区和利益相关者之间的更多参与。这包括与已建立的社区组织和机构合作,这些组织和机构是当地联系点,以提供支持和资源。国家志愿者和慈善中心是新加坡这种机构的一个典型例子,提供了宝贵的网络和专业知识来建立一个包容和关怀的社会。STB鼓励会议计划者和活动组织者利用该工具包,以最大程度地从其活动中产生长期积极影响。可以在此处下载传统工具包。
重要说明本文档中包含的信息仅作为一般建议。学生必须遵循课程和课程网站上列出的计划规则和要求。必须与您的计划持续时间列表和程序规则一起使用此计划者。学生需要检查他们在学习计划中选择的所有课程的先决条件,不兼容和限制。未来的课程可能会发生变化。本文档不打算作为进度或毕业检查。有关进步或毕业检查的更多信息,请联系科学学院。进一步的帮助查看本研究计划者文档中的常见问题(FAQ)页面。如果您需要进一步的建议或有其他问题,请联系:科学学院电子邮件:enquire@science.uq.edu.au电话:+61 7 3365 1888
作为无人驾驶汽车(通常称为无人机的无人机)的流行,人们对潜在滥用行为的担忧已经变得更加实际。无人机安全领域的新兴挑战之一是入侵无人机的拦截,尤其是当他们的存在可能导致伤害或违反法律时。拦截不合作的无人机需要复杂的处理,而该技术的一个有前途的分支涉及部署Interceptor无人机。为此,必须使用一种快速,强大的计划拦截轨迹的方法。在本文中,基于模型预测控制(MPC)基于基于基于的轨迹计划者(RL)控制策略。在模拟中评估,比较并测试了它们的效果,速度和鲁棒性。基于MPC的计划者还在现实世界中进行了测试。
重要说明本文档中包含的信息仅作为一般建议。学生必须遵循课程和课程网站上列出的计划规则和要求。必须与您的计划持续时间列表和程序规则一起使用此计划者。学生需要检查他们在学习计划中选择的所有课程的先决条件,不兼容和限制。未来的课程可能会发生变化。本文档不打算作为进度或毕业检查。有关进步或毕业支票的更多信息,请联系您的学校。进一步的帮助查看本研究计划者文档中的常见问题(FAQ)页面。如果您需要进一步的建议或有其他问题,请联系:化学和分子生物科学院电子邮件:enquiries@scmb.uq.uq.edu.au电话:+61 7 3365 3925
重要说明本文档中包含的信息仅作为一般建议。学生必须遵循课程和课程网站上列出的计划规则和要求。必须与您的计划持续时间列表和程序规则一起使用此计划者。学生需要检查他们在学习计划中选择的所有课程的先决条件,不兼容和限制。未来的课程可能会发生变化。本文档不打算作为进度或毕业检查。有关进步或毕业支票的更多信息,请联系您的学校。进一步的帮助查看本研究计划者文档中的常见问题(FAQ)页面。如果您需要进一步的建议或有其他问题,请联系:化学和分子生物科学院电子邮件:enquiries@scmb.uq.uq.edu.au电话:+61 7 3365 3925