2030 战略的规模、范围和多层次的优先次序使得评估十分复杂。2030 战略的设计目标是广泛而灵活的。它引入了七个广泛的主题优先次序,其中制定了 100 多个子目标、行动和步骤。作为一项中期评估,本次评估对所涵盖的问题进行了筛选。它侧重于 2030 战略的实用性和实施情况,以克服亚太地区在实现其发展目标方面面临的重大挑战。为此,评估分析了大量亚行数据,审查了内部和外部文件,并研究了同行组织的战略。评估小组采访了大量亚行工作人员,包括大多数业务主管和大约一半的亚行国家主管。它咨询了许多在职和退休的高级职员,以获得更广泛的机构视角。也许最重要的是,评估小组与众多发展中成员国官员进行了交流,以了解他们对亚行及其战略的看法。鉴于该战略的广泛性及其对亚行业务的核心作用,存在着各种不同的看法和观点。本次评估对这些看法和观点进行了广泛的综合。
本文使用背面计划研究了一种新的基于模型的强化学习方法:混合(近似)动态编程更新和无模型更新,类似于DYNA架构。带有学习模型的背景计划通常比无模型的替代方案(例如Double DQN)差,即使前者使用的记忆和计算更大。基本问题是,学到的模拟可能是不准确的,并且经常会产生无效的状态,尤其是在迭代许多步骤时。在本文中,我们通过将背景计划限制为一组(摘要)子目标,并仅学习本地,子观念模型来避免这种限制。这种目标空间计划(GSP)方法在计算上更有效,自然地包含了时间抽象,以进行更快的长途径计划,并避免完全学习过渡动态。我们表明,我们的GSP算法可以从抽象空间中传播价值,以帮助各种基础学习者在不同的域中更快地学习显着的速度。关键字:基于模型的增强学习,时间抽象,计划
摘要:本研究重点考察有效行政权概念在地方政府与居民沟通方面的要求。我们关注公共行政的电子化,并希望通过公众参与重大自治事务的决策来加强公共行政,因为有效公共行政的实施与正确的管理方法息息相关。在研究的第一部分,我们分析了欧洲的法律和立法,并进一步探讨了欧洲地方政府概念如何影响地方当局与居民在实现直接民主手段方面的沟通。我们关注公共行政电子化的现状及其发展,包括网络安全。本研究的主要目标是使用批判性分析来评估斯洛伐克公共行政活动的法律监管。除了主要目标外,我们还有几个子目标,例如比较前捷克斯洛伐克国家公共行政电子化的发展情况。尤其是使用批判性分析和其他科学调查方法,我们从实践中寻找并找到选定应用问题的答案。我们还使用科学和教义解释以及科学文献和法学。根据我们的研究结果,我们提出了建议,以确保斯洛伐克共和国的智慧城市更有效地运作。
关于促进可再生能源使用的 2009/28/EC 指令(俗称可再生能源指令 (RED I))制定了一系列措施帮助欧盟实现 2020 年可再生能源占比 20% 的目标,作为更广泛的 2020 年气候和能源一揽子计划的一部分。RED I 为所有成员国设定了具有约束力的最低国家目标,以可再生能源在其最终能源消费总量中的份额计算。这些最低目标在成员国之间有所不同(从马耳他的 10% 到瑞典的 49%),但总体而言,欧盟可以实现 20% 的总体目标。RED I 包括到 2020 年每个成员国交通运输部门可再生能源份额达到 10% 的子目标,但这一目标总体上尚未实现。 1 RED I 还包括多项举措,以支持欧盟及其成员国推广可再生能源,特别是在跨境方面(统计转移、联合项目、联合支持计划、原产地担保)。此外,RED I 还详细定义了欧盟生物燃料可持续性标准及其计算方法。RED I 包含自己的报告和监测要求:成员国必须制定国家可再生能源行动计划,而委员会则每两年准备一次可再生能源进展报告。
摘要 - “嘿,机器人。让我们整理厨房。顺便说一句,我今天有背痛”。机器人系统如何从此抽象目标和代理条件中使用适当的任务分配的共享计划来设计共享计划?为此目的,已经对经典的AI任务计划进行了规定,但它涉及对不灵活的计划问题的繁琐定义。大型语言模型(LLM)通过自然语言(NL)的知识提取了机器人决策的有希望的概括能力。但是,将NL信息转换为受约束的机器人域仍然是一个挑战。在本文中,我们使用LLM作为NL信息和结构化的AI任务计划问题之间的翻译,以人为机器人的协作计划为目标。LLM生成了计划问题中编码的信息,包括从NL抽象目标中得出的特定子目标,以及基于NL代理条件的子距离分配的建议。在许多目标和代理条件下评估了框架,Plancollabnl,结果表明在大多数情况下都可以找到正确和可执行的计划。使用此框架,我们打算为HRC计划的生成增加灵活性和概括,从而消除了对受限计划问题和代理模型的手动和费力定义的需求。
虽然机器人代理人越来越擅长低级操纵技巧,但越来越多的大型语言模型计划者指导他们将综合任务分解为子目标。最近的作品表明这些语言模型也可能是有效的技能学习者。我们开发了HALP 2.0,这是一个模块化且可扩展的人类辅助语言计划中学习的框架,使用GPT-4提出了一系列技能课程,这些技能已被学到,使用,使用并智能地重复使用。我们的系统是为大型实验设计的,配备了用户友好的界面,并且可以扩展到新的技能学习框架。我们通过比较抽象的替代实现并通过合并新型框架来证明可扩展性。更重要的是,我们使用众包场景和任务数据集进行了针对GPT-4的重点研究,发现语言模型是技能重复使用和适应能力的能力。我们观察到,尽管性能取决于语言上下文,但提供优化的提示可以产生出色的技能再利用行为。我们设想,随着操纵原语和大型语言模型变得越来越强大,我们的系统将准备好综合其能力,以创建一个自治系统,以供终身学习,有一天可以在现实世界中部署。
摘要 - 基于模型的增强学习(RL)由于其样本效率而表现出了巨大的希望,但仍在与长马稀疏的任务中挣扎,尤其是在代理商从固定数据集中学习的离线设置中。我们假设由于缺乏长期计划功能,基于模型的RL代理在这些环境中挣扎,并且在环境的时间抽象模型中进行的计划可以减轻此问题。在本文中,我们做出了两个关键的贡献:1)我们引入了基于离线模型的RL算法IQL-TD-MPC,该算法扩展了模型预测性控制(TD-MPC)的状态时间差异学习(TD-MPC),并使用隐式Q-Gearning(IQL); 2)我们建议将IQL-TD-MPC用作层次设置的经理,并以任何离线离线RL算法作为工人。更具体地说,我们预先训练了一种时间抽象的IQL-TD-MPC管理器,以预测“意图嵌入”,该嵌入方式大致与子目标通过计划。我们表明,通过IQL-TD-MPC经理产生的意图嵌入的增强状态表示,可以显着改善离线脱机RL代理在某些最具挑战性的D4RL基准测试任务上的性能。例如,脱机RL算法AWAC,TD3-BC,DT和CQL均在中和大型抗蚁列任务上获得零或接近零的归一化评估得分,而我们的修改给出了40的平均得分。
SusWoodStoves 项目木质原木燃烧对挪威来说非常重要,它对住宅空间供暖有很大贡献,减轻了电网压力,并在电网断电或电费过高时提供能源安全。然而,木质原木燃烧也会造成空气污染,需要通过炉灶、建筑集成和价值链优化来提高可持续性,这一直是该项目的主要重点。总体目标是通过炉灶、建筑集成和价值链优化实现可持续的木质炉灶。子目标包括:1) 针对代表性炉灶技术和操作条件对木质炉灶的颗粒物和气体排放水平进行形态分析和量化;2) 通过减排和节能措施降低与气候和健康相关的排放水平;3) 炉灶的最佳建筑整合;4) 评估挪威现有和改进的炉灶技术以及不同炉灶建筑配置的连接系统的价值链绩效;5) 对木质炉灶在挪威能源市场中当前和未来的作用进行技术和社会经济评估;6) 制定挪威可持续木质炉灶路线图;7) 培养该领域的高技能候选人并培训行业合作伙伴;8) 监测该领域的活动和最新技术,并在适用时向行业合作伙伴和其他相关方传播知识。路线图制定的第一步是制定愿景,以进一步发展木质炉灶,使其成为 2050 年关键的可再生空间加热技术、贡献者和能源安全提供者。
设计空间的概念起源于问题空间的形成,并且在过去60年中一直是调查和辩论的主题。在信息处理理论的问题空间理论(Newell&Simon,1972)中,基于一般问题解决方案计算机程序(1957年),新约束,子目标和设计替代方案从问题空间中引起的新约束,子目标和设计替代方案会导致外部记忆表现形式的转变,例如模型和图纸,例如,会考虑到问题的变化。问题解决者检索系统,无论是人类还是计算能力系统,都会在搜索解决方案时不断修改和表征问题空间。那时,人们认为井和不确定的问题(Reitman 1964)或结构性不佳的问题(Newell 1969)被认为取决于问题解决者可用的问题解决方法和技术。对问题解决者容量的这种依赖性源于这样的观念,即没有结构性的问题,仅在有限的能力的范围内为解决问题的人(Simon 1973)正式形式化了结构性的问题,并且根据问题的目标,约束和生成的替代方案。一种认知设计理论的替代方法,后来成为反思实践(Schön1983; 1987)。在这种方法中,设计师通过思考和做事,因此知道行动(Argyris等人)(1985),将构建设计世界,并设定问题空间的维度以及他/她试图找到解决方案的举动(Schön,1992)。所处的认知研究方法(Clancey 1997)随后出现了许多与社会科学,行为和动态神经过程有关的学科和目标,以了解知识和行动的观点,并支持学习的想法,即学习发生在做某事时。所在的一词强调,感知机制因果关系将人类认知与环境和行动联系起来。位置涉及内部组织以及内部和外部组织之间发生的因果关系,改变了世界上的事物。新的观察方式和改变世界的改变方式随着时间的流逝而发展。作为一种研究方法,出现了适当的认知披露,以研究设计中的人类认知(Gero 1990)。设计是一种时间和多模式的活动,要求对位置的请求提供适当的解决方案,当这些请求打开时,请在解决问题的阶段发生在解决问题的阶段之前,要求发现问题和问题框架(Runco 1994; Runco和Nemiro,1994)。在过去的40年中,出现了解决问题的空间的替代视图,重点关注变化的最终目的,即解决方案空间。1.1设计空间在理解设计方面的一个有用的抽象是设计空间的概念,设计师探索了可能性的抽象空间(Amstel等人。2016; MacLean等。这两种观点都基于诸如协议分析等方法的设计认知研究(Goldschmidt,2014; Kan&Gero,2017)。虽然受约束的设计空间通常受到特定要求的限制,但开放的设计空间扩展2011)在问题空间内的探索开始,设计过程的问题解决观点(Goel&Pirolli,1992; Goel,1994; Goolschmidt,1997),而其他人则声称设计是通过产生解决方案空间的(Dorst,2019; Dorst&Cross 2001; Dorst&Cross 2001; Gero&Gero&cross&cross&verer&krer&krer&kumar; krer&kumar&kumar&kumar; 2009年;吉川,1981年)。另一种观点是,根据设计请求的限制水平和对创意探索的开放程度,设计空间可以受到限制或开放,这是本文报告的研究重点。
许多人都有拖延症,无法优先处理最重要的工作。为了帮助用户克服此类问题,Habitica 等游戏化生产力工具使用了启发式积分系统,但这可能会适得其反。我们最近提出了一种更有原则性的积分值计算方法,以避免此类问题。虽然理论上很有前景,但即使对于非常短的待办事项清单,也需要大量计算。在这里,我们提出了一种可扩展的近似方法,使我们的待办事项清单游戏化原则方法可在现实世界中使用。我们的方法利用人工智能来生成游戏化的待办事项清单,其中每个任务都受到一定数量的积分的激励,这些积分传达了该任务的长期价值。我们的新方法更具可扩展性的原因在于,它将计算用户如何最好地实现其目标的长期计划的问题分解为一系列较小的规划问题。我们通过将该方法应用于目标、子目标和任务数量不断增加的待办事项列表来评估该方法的可扩展性,并且我们还增加了目标层次结构的嵌套层数。我们发现该方法可以使 Web 和移动应用程序为相当大的待办事项列表计算出出色的积分系统,其中最多 576 个任务分布在最多 9 个不同的顶级目标上。我们的方法可通过 API 1 免费获得。这使得我们的方法易于在游戏化的 Web 应用程序和移动应用程序中使用。