摘要 - 自主驾驶中有效的决策依赖于其他交通代理的未来行为的准确推断。为了实现这一目标,我们提出了一个基于在线信念的行为预测模型,也提出了一个有效可观察到的马尔可夫决策过程(POMDP)的有效计划者。我们开发了一个基于变压器的预测模型,通过复发性神经记忆模型增强,以动态更新潜在信念状态并推断其他代理的意图。该模型还可以整合自我车辆的意图,以反映代理之间的闭环交互,并从离线数据和在线交互中学习。为了计划,我们采用了一个具有宏观动作的蒙特卡洛树搜索(MCT)计划者,从而通过搜索时间扩展的动作步骤来降低计算复杂性。在MCTS计划者中,我们使用预测的长期多模式轨迹来近似未来的更新,从而消除了迭代信念的更新和提高跑步效率。我们的方法还将深度Q学习(DQN)作为搜索事务,从而大大提高了MCTS计划者的性能。模拟环境的实验结果验证了我们提出的方法的有效性。在线信念更新模型可以显着提高预测的准确性和时间一致性,从而改善决策绩效。在MCT计划中,采用DQN作为搜索,大大提高了其性能,并优于基于模仿学习的先验。此外,我们表明,具有宏观动作的MCT计划在性能和效率方面大大优于香草方法。
因其指定职责的性质而需要援助的人员在服务方面具有最高优先级。示例包括对常规人员和预备役人员的部署前援助,尤其是在部署意外的情况下,以及对涉及重大旅行或危险任务的人员的遗产规划、授权书和预先医疗指示准备。下一个最高优先级是第 13 段定义的犯罪受害者。以及最无法从民间律师那里获得法律服务的人员(例如经济能力有限的初级士兵和初级军官)。武装部队其他部门的合格成员及其家属必须与海岸警卫队成员及其家属平等获得法律援助,除非海岸警卫队成员需要部署前的法律服务。第 15.b 段定义的法律援助指挥主任。在这些准则范围内管理服务,以确保海岸警卫队人员的准备就绪。他们可能会根据需求和资源限制某些服务。指挥部主任可能会将对其他服务成员的援助限制为他们在其分支机构内寻求法律援助提供者时可获得的援助。
海岸警卫队服役人员的三分之一。这些卫生服务对于维持服役人员的医疗准备和可部署性至关重要。通常,海岸警卫队的命令或当地诊所的条件迫使卫生服务发生变化,并需要扩大、重新安置、减少或改变技术或设施;因此,做出这些改变的决定需要系统的审查和批准政策,以确保变化符合海岸警卫队的计划和任务要求。这些变化可能是永久性的或暂时的,在卫生服务管理员、区域经理、诊所工作人员或指挥官看来可能微不足道。然而,当这些决定是在没有适当的权威审查的情况下孤立地做出的,项目的成本和延误就会增加。因此,常设政策和后续程序指导将确保技术和指挥当局对医疗服务提供的变化有适当的监督和批准权。
(b) 美国法典第 10 章 A 副标题第 II 部分和 E 副标题第 II 部分 (c) 军官入伍、评估与晋升,COMDTINST M1000.3(系列) (d) 海岸警卫队薪酬手册,COMDTINST M7220.29(系列) (e) 身体残疾评估系统,COMDTINST M1850.2(系列) (f) 海岸警卫队医疗手册,COMDTINST 6000.1(系列) (g) 在完成义务服务前离职时补偿高等教育费用,COMDTINST 1560.3(系列) (h) 军事药物滥用和行为成瘾计划,COMDTINST 1000.10(系列) (i) 纪律与行为,COMDTINST M1600.2(系列) (j) 军事司法手册,COMDTINST M5810.1 (系列)(k)行政调查手册,COMDTINST M5830.1(系列)(l)临时离职,COMDTINST M1040.6(系列)(m)现役解除或退伍证明,DD 表格 214,COMDTINST 1900.4(系列)(n)入伍、评估和晋升,COMDTINST M1000.2(系列)(o)人事与薪资程序手册,PPCINST M1000.2(系列)(p)海岸警卫队招募,COMDTINST M1100.2(系列)(q)军事任务和授权缺勤,COMDTINST M1000.8(系列)(r)士兵管理委员会手册,PSCINST M1910.1(系列)(s)军事民事和家属事务,COMDTINST M1700.1(系列)(t)总统对军队退役的认可 DoDI 1348.34(u)指挥部高级士兵领导(CSEL)评级部队总长(RFMC)和高级士兵领导(SEL)计划,COMDTINST 1306.1(系列)(v)预备役状态和参与,COMDTINST 1001.2(系列)(w)非正常退休服务信用,DoDI 1215.07(x)骚扰行为预防、应对和问责,COMDTINST 5350.6
部分可观察到的马尔可夫决策过程(POMDP)是在不确定性下进行计划的有力框架。他们允许对状态不确定性建模为一种信念概率分布。基于蒙特卡洛抽样的近似求解器,在放宽计算需求并执行在线计划方面取得了巨大的成功。然而,将许多动作和较长计划视野的比例扩展到复杂的现实域仍然是一个重大挑战,实现良好性能的关键点是指导采取行动选择程序,并使用针对特定应用程序域量身定制的域依赖性政策启发式方法。我们建议从任何求解器生成的执行trace traces中学习高质量的启发式方法。我们将信仰行动对转换为逻辑语义,并进行了数据和时间效率的归纳逻辑编程(ILP),以生成可解释的基于信念的政策规范,然后将其用作在线启发式方法。我们在两个臭名昭著的POMDP问题上彻底评估了我们的方法,涉及大型动作空间和较长的计划范围,即摇滚样本和Pocman。考虑了包括POMCP,Supstot和Adaops在内的不同最先进的在线POMDP求解器,我们表明,在答案集编程(ASP)中表达的启发式方法(ASP)屈服表现出优于神经网络,并且类似于最佳手工制作的任务 - 在较低计算时间内的特定特定的启发式方法。此外,它们已经概括为在训练阶段没有经历的更具挑战性的场景(例如,在岩石样品中增加岩石和网格大小,增加了地图的大小以及Pocman中鬼魂的侵略性)。
抽象的深入强化学习表明,在视频游戏,机器人控制,官方驾驶和药物发现等不同领域的跨不同领域取得了巨大的成就。部分可观察的域中的常见方法在很大程度上倾向于从高维观测(例如图像)中端到端学习,而没有明确推理真实状态。我们提出了一个替代方向,引入了部分规定的加固学习(PSRL)框架。PSRL的核心是受监督和无监督学习的融合。该方法利用州估计器从高维观测中提取监督的语义状态信息,这些观察通常在培训时完全可用。这产生了更容易解释的政策,这些政策由控制构成状态预测。并行,捕获了一个无透视的潜在表示。这两个 - 语义状态和潜在状态 - 然后融合并用作策略网络的输入。这种并置为从业者提供了灵活而动态的范围:从强调监督的状态信息到整合富裕的潜在见解。广泛的实验结果表明,通过合并这些双重表示,PSRL提供了有效的平衡,增强了模型,可以在保存的同时使用,并且通常明显胜过表现,这是通过奖励和收敛速度以传统方法设定的性能基准。
从现在到 2024 年 4 月 1 日,第 27 届 SOMDG 将继续获得 DHA 虚拟诊所 (VIPRR) 的协助,以帮助满足个人医疗准备 (IMR) 要求。如果您不需要亲自评估(航班状态、安全部队等),请按照以下步骤协调此预约;1) 登录 ASIMS https://asimsimr.health.mil/imr/MyImr.aspx 以完成您的定期健康评估问卷 (PHAQ)。
出勤(学院)和迟到(部门)政策:COMD BFA 和 AAS 学位是设计工作室课程。课堂实验室活动和与其他学生的互动是课程的重要组成部分。缺勤超过总课时 10% 可能会导致您的成绩下降 10%,因为无法达到参与的成果。这可能是对未能完成课堂学术要求的其他处罚的补充。缺席超过总课堂会议的 25% 是不允许的。任何两次“迟到”(15 分钟或以上)都等于 1 次缺席。学术诚信标准学生和所有处理信息、想法、文本、图像、音乐、发明和其他知识产权的人都应对其受众和来源在使用、注明和引用来源时保持准确和诚实。作为一个知识和专业工作者的社区,学院认识到其有责任提供信息素养和学术诚信方面的指导,提供良好实践的典范,并对违反学术诚信的行为做出警惕和适当的反应。因此,纽约城市大学禁止学术不诚实行为,并可受到处罚,包括不及格、停学和开除。有关学院学术诚信政策的更多信息,请参阅学院目录教学/学习方法
7.范围和权限。建议读者熟悉本指令中提到的指令和出版物,这些指令和出版物按数字系列顺序列出:行政备注,表格 CG-3307,COMDTINST 1000.14(系列);海岸警卫队军事奖章和奖励手册,COMDTINST M1650.25(系列);海岸警卫队文职奖励手册,COMDTINST M12451.1(系列);邮件管理邮政计划政策,COMDTINST 5110.1(系列);表格管理计划,COMDTINST 5213.9(系列);指令系统计划;指挥官指令(CI),ALCOAST 和其他出版物,COMDTINST 5215.6(系列);谅解备忘录/协议,COMDTINST 5216.18(系列);变更管理,COMDTINST 5224.5(系列);无障碍系统和技术计划(ASTP);第 508 节,5230.60(系列);海岸警卫队信息自由和隐私法手册,COMDTINST M5260.3(系列);组织管理,COMDTINST 5400.7(系列);网络安全治理,COMDTINST 5500.13(系列)(FOUO);为海岸警卫队出版印刷和装订材料,COMDTINST 5604.1(系列);为日常使用、官方仪式和特殊活动印刷行政文具,COMDTINST 5603.1(系列);
7. 环境方面和影响考虑。环境管理办公室指挥官 (CG-47) 审查了本指挥官指令及其所包含的一般政策,并确定本政策属于国土安全部 (DHS) 分类排除 A3。本指挥官指令不会导致现有环境条件发生任何重大变化,也不会违反任何适用的联邦、州或地方环境保护法律。行动提议者有责任评估本政策产生的所有未来具体行动是否符合《国家环境政策法》(NEPA)、其他适用的环境要求和美国海岸警卫队环境规划政策 COMDTINST 5090.1(系列)。