接下来,我们为 SP 和 OSP 问题的复杂性建立上限。当选择规则不是策略证明时,可以通过为一个代理提供类型配置文件和可获利偏差来证明这一点。这种证明可以在多项式时间内进行检查,因此具有电路输入的 SP 决策问题属于共同 NP 。具有电路输入的 OSP 问题是否属于共同 NP ?也就是说,当给定选择规则不存在 OSP 机制时,是否总能快速证明不存在?我们通过利用先前开发的 O-dag 结构来证明这一点。我们发现,当且仅当其 O-dag 的某个非单例顶点没有子节点时,选择规则不存在 OSP 机制。因此,可以通过展示这样的顶点并证明它没有子节点来证明 OSP 问题不存在 -实例,这可以在多项式时间内完成。上述结果表明 SP 和 OSP 问题在电路输入下是共同 NP 完全的。也就是说,它们与共同 NP 中最难的问题一样难,但不会比它们更难。这意味着任何一个问题都可以在多项式时间内归结为另一个问题。总之,我们的结果表明,尽管考虑扩展形式会带来明显的障碍,但决定选择规则是否具有相应的 SP 机制或 OSP 机制同样复杂。有了表输入,人们可以在多项式时间内决定 OSP 问题并构建机制。有了电路输入,当所需的机制不存在时,总会有一个简短的断言证明。
计算统计与机器学习成立于 2016 年,研究机器学习的基础。我们专注于统计原理和计算效率的方法,使用概率和统计以及数值分析和优化技术。后者为设计学习算法和分析其计算特性提供了通用框架。前者为解决数据不确定性和描述学习算法的泛化特性提供了数学基础。我们一直活跃于机器学习理论和算法的不同领域。最近的兴趣包括算法公平性、强盗和零阶优化、双层优化和学习动态系统。
神经形态计算机的价值主要取决于我们对其进行编程以执行相关任务的能力。目前,神经形态计算机大多局限于从深度学习改编而来的机器学习方法。然而,如果我们能利用神经形态计算机的计算特性来发挥其全部功能,那么它的潜力将远远超出深度学习。神经形态编程必然不同于传统编程,需要我们对编程的总体思维方式进行范式转变。本文的贡献包括:1)对神经形态计算机背景下“编程”含义的概念分析;2)探索神经形态计算中前景广阔但被忽视的现有编程范式。目标是拓展神经形态编程方法的视野,从而使研究人员能够摆脱现有方法的束缚,探索新的方向。
摘要 — 近年来,受脑启发的超维计算 (HDC) 在医疗诊断、人类活动识别和语音分类等广泛应用中展示了良好的性能。尽管 HDC 越来越受欢迎,但其以内存为中心的计算特性使得联想内存实现由于海量数据的存储和处理而能耗巨大。在本文中,我们提出了一个系统的案例研究,利用 HDC 的应用级错误恢复能力,通过电压调节来降低 HDC 联想内存的能耗。对各种应用的评估结果表明,我们提出的方法可以在联想内存上节省 47.6% 的能耗,而准确度损失不超过 1%。我们进一步探索了两种低成本的错误屏蔽方法:字屏蔽和位屏蔽,以减轻电压调节引起的错误的影响。实验结果表明,提出的字屏蔽(位屏蔽)方法可以进一步提高节能效果,最高可达 62.3%(72.5%),准确度损失不超过 1%。
3. 国际人工智能标准制定 IEC 和 ISO 已经成立了联合委员会(ISO/IEC JTC 1/SC 42),负责开展人工智能标准化活动。该委员会标准化工作的现有结构包括以下工作组:基础标准、可信度、用例和应用、数据、人工智能和人工智能应用的计算方法和计算特性以及人工智能的治理影响。目前有 45 个国家积极参与这项工作,欧盟和欧洲国家也广泛参与,其中 20 个国家参与并担任召集人和编辑等共 18 个领导职位。SC 42 技术委员会由美国管理团队协调。除了 SC 42,其他 ISO 和 IEC 委员会也在进行人工智能标准化活动
摘要 量子计算机、相干伊辛机和数字退火机等新型计算设备的出现为硬件加速混合优化算法提供了新的机会。不幸的是,利用新型硬件平台展示无可置疑的性能提升面临着重大障碍。一个关键挑战是理解区分此类设备与现有优化方法的算法特性。通过精心设计人为的优化任务,这项工作为量子退火的计算特性提供了新的见解,并表明该模型有可能快速识别高质量解决方案的结构。与涵盖完整搜索和局部搜索的各种算法进行细致的比较表明,量子退火在所提出的优化任务上的表现是不同的。这一结果为时间尺度和优化问题类型提供了新的见解,在这些优化问题中,量子退火有可能比现有的优化算法提供显着的性能提升,并建议开发结合量子退火的最佳特性和最先进的经典方法的混合算法。
为了处理外部世界的信息,大脑依靠处理系统的层次结构,该系统在早期的新皮层区域启动并在海马上汇聚。该层次结构的组成部分具有明显不同的计算特性,海马支持更快的可塑性并采用更稀疏的表示。在这些系统的属性上进行了广泛的工作,但尚不清楚这些系统首先出现了如何以及为什么。我们使用元学习方法探讨了人工神经网络中处理系统的层次结构的出现。随着网络对一组任务进行优化,它们同时使用的元学习超级参数可以调节层的学习率和稀疏性。我们发现,这种元学习促进了较高的稀疏度。我们证明,互补学习系统的关键方面在网络中出现,并且跨层的稀疏性和学习率的大脑样分化。此外,当经过两种途径并接受了对单个项目识别和分类需求的任务进行训练时,模型捕获了海马内途径之间的不同特性。一起,这些结果表明,大脑中异质学习系统的组织可能是由于优化控制学习率和稀疏性的生物学变量而引起的。
自 19 世纪以来,动态物理系统的热力学和计算特性之间的关系一直是理论界关注的焦点,随着数字设备的能量成本在过去半个世纪中呈爆炸式增长,这一关系也具有越来越重要的实际意义。现实世界计算机最重要的热力学特征之一是,它们在有限的时间内以许多快速(共同)演化的自由度运行,远离热平衡。这种计算机还必须几乎始终遵守对其工作方式的多种物理约束。例如,所有现代数字计算机都是周期性过程,由全局时钟控制。另一个例子是,许多计算机都是模块化、分层系统,对其子系统的连接性有严格的限制。这种特性既适用于自然产生的计算机(如大脑或真核细胞),也适用于数字系统。现实世界计算机的这些特征在 20 世纪对计算过程热力学的分析中是不存在的,这些分析侧重于准静态慢速过程。然而,随机热力学领域在过去几十年中得到了发展——它提供了分析具有真实计算机特征的系统的形式化工具。我们在此认为,这些工具以及随机热力学领域目前正在开发的其他工具可能有助于我们在更深层次上理解动态系统的基本物理特性与其执行的计算之间的关系。
摘要 — 深度强化学习 (Dee p RL) 是自动驾驶汽车、机器人、监控等多个领域的一项关键技术。在深度强化学习中,使用深度神经网络或 KMO 德尔、ANA温柔地学习如何与环境互动以实现特定目标。深度强化学习算法架构的运行效率取决于若干因素,包括:( 1) 硬件架构对深度强化学习的基础内核和计算模式的适应性;( 2) 硬件架构的内存分层在通信层面的最小化能力; (3)硬件架构能够通过深度嵌套的高度不规则计算特性来隐藏深度强化学习算法中的开销引入。GP Us 一直是加速强化学习算法的流行方法,然而它们并不能最好地满足上述要求。最近的一些工作已经为特定的深度强化学习算法开发了高可定制加速器。然而,它们不能推广到所有可用的深度强化学习算法和 DNN 模型选择。在本文中,我们探索了开发现场框架的可能性,该框架可以加速各种深度强化学习算法,包括训练方法或 DNN 模型结构的变量。我们通过定义一个领域内特定的高级抽象或一类广泛使用的深度强化学习算法——基于策略的深度强化学习 (on-policy Deep R L) 来实现这个目标。此外,我们还对 CP U-GPU 和 CP U-FPGA 平台上最先进的基于策略的深度强化学习 (on-policy Deep R L) 算法的性能进行了系统分析。我们针对机器人和游戏这两个应用领域选择了两个代表性算法——PPO 和 A 2 C。我们展示了基于 FPG 的定制加速器,它们分别实现了高达 2.4 倍(PPO)和 8 倍(A 2 C)的训练速度提升,以及 1.7 倍(PPO)和 2.1 倍(A 2 C)的整体吞吐量提升。索引术语——强化学习、FPGA