Black-Box AI模型的激增促使需要解释内部机制并证明其可靠性是合理的,尤其是在高风险应用中,例如医疗保健和自动驾驶。由于缺乏对可解释的AI(XAI)的严格定义,已经开发了与解释性,可解释性和透明度有关的大量研究,以从各个角度解释和分析该模型。因此,通过详尽的论文清单,从各个方面对XAI研究进行全面概述变得具有挑战性。考虑到神经网络在AI研究中的普及,我们将重点缩小到XAI研究的特定领域:基于梯度的解释,可以直接用于神经网络模型。在这篇综述中,我们系统地探讨了迄今为止基于梯度的解释方法,并引入了一种新颖的分类法,将它们分类为四个不同的类别。然后,我们按时间顺序介绍了技术细节的本质,并强调了算法的演变。接下来,我们引入人类和定量评估以测量算法性能。更重要的是,我们证明了XAI中的一般挑战以及基于梯度的解释中的特定挑战。我们希望这项调查能够帮助研究人员了解最先进的进步及其相应的缺点,这可能引发他们对解决未来工作中这些问题的兴趣。
具有不完整输入数据(缺少模态)的多模式学习是实用且具有挑战性的。在这项工作中,我们对这一挑战进行了深入的分析,发现模式优势对模型训练具有显着的负面影响,从而极大地降低了缺失的模态性能。是由Grad-CAM激励的,我们引入了一种新颖的指标,梯度,以监测和减少在缺失情景中广泛存在的模态主导性。为了帮助该指标,我们提出了一种新颖的梯度引导的模态解耦(GMD)方法,以促进对主导方式的依赖性。特定的是,GMD从不同模态中删除了冲突的梯度成分,以实现这种去耦,从而显着提高了性能。此外,要弹性处理模态分配数据,我们设计了一个参数有效的动态共享(DS)框架,该框架可以根据是否可用,可以根据是否可用来求解网络参数。我们对三个流行的多模式基准进行了广泛的实验,包括Brats 2018用于医学分割,CMU-MOSI和CMU-MOSEI进行情感分析。结果表明,我们的方法可以显着胜过竞争对手,表明所提出的解决方案的有效性。我们的代码在此处发布:https://github.com/haowang420/gradient-gendient-gudide-modality-decoupling。
光子神经网络(PNN)已成为传统电子神经网络的有前途的替代品。然而,PNN的培训,尤其是在传统实践中被认为是高度有效的分析梯度下降算法的芯片实施,这仍然是一个重大挑战,因为物理系统并非差异。提出了诸如无梯度和数值梯度方法之类的训练方法,但它们却没有过度测量和有限的可伸缩性。最新的原位培训方法也受到成本挑战,需要昂贵的在线显示器和频繁的光学I/O切换。在这里,提出了一种物理感知的分析梯度培训(PAGT)方法,该方法在分裂和串联策略中计算分析梯度,从而克服了芯片在PNNS训练中造成的不良性引起的差异。在芯片上实施了多种训练案例,尤其是生成对抗网络,与原位方法相比,时间消耗显着降低(从31 h到62分钟),能源消耗降低了四倍。结果为训练混合光子 - 数字电子神经网络提供了低成本,实用和加速的解决方案。
近年来,在深入的强化学习中提出了各种强大的政策梯度算法。虽然所有这些算法都以策略梯度定理为基础,但特定的设计选择在各算法中都有很大差异。我们提供了对政策政策梯度算法的整体概述,以促进对其理论基础及其实际实施的理解。在此概述中,我们包括策略梯度定理的连续版本,收敛结果以及对实用算法的全面讨论的详细证明。我们比较了连续控制环境上最突出的算法,并提供了有关正规化益处的见解。所有代码均可在https://github.com/ matt00n/propictgradientsjax上找到。
在联邦强化学习(FRL)中,代理人旨在与每个代理商在其本地环境中行动而无需交换原始轨迹时进行协作。FRL的现有方法(a)都不提供任何容忍度的保证(针对行为不当的代理商),或(b)依靠可信赖的中央代理(单点失败)来汇总更新。我们提供了第一个分散的拜占庭式耐受性FRL法。为此,我们首先提出了一种新的集中式拜占庭故障稳定性政策梯度(PG)算法,该算法仅依赖于非耐受性PG的假设标准来改善现有方法。然后,作为我们的主要贡献,我们展示了如何利用强大的聚合和拜占庭式共识方法的结合,以消除对受信任的中央实体的需求。由于我们的结果代表了拜占庭式耐断层的非征料非凸优化的第一个样本复杂性分析,因此我们的技术贡献可能具有独立的利益。最后,我们为常见的RL环境证实了我们的理论结果,证明了分散的联邦W.R.T.的加速。对各种拜占庭攻击的参与代理的数量和弹性。
粘结曲线或令牌键合曲线(TBC)是将令牌价格与其供应相关联的数学功能。它用于确定代币的买卖价格,使其成为自动化的做市商,提供持续的流动性。与传统资产评估机制相比,粘结曲线的主要优点是每个阶段对资产评估的透明度和明确的,不可变的定义。
联合学习(FL)包括用于机器学习的分散培训算法的家族[1] - [3],使内部分裂能够在不集中培训数据的情况下协作训练模型。这种方法通过将培训计算分配到边缘来减轻数据中心的计算负担。但是,至关重要的是要注意,尽管联邦学习提供了一个分散的框架,但它可能无法继承客户的隐私。中央服务器收到的更新有可能无意间揭示有关客户培训数据的信息[4],[5]。保护客户对联合学习的隐私的流行策略包括基于差异的隐私(DP)和基于同型加密(HE)方法。DP的想法是在梯度上添加噪音,以保护梯度的保密性[6]。基于DP的学习算法的现有作品包括本地DP(LDP)[7],具有选择性参数更新[8],基于晶格[9]等的DP等。尽管可以直接采用DP,但它具有较弱的隐私保证和潜在准确性损失的缺点。他是一种加密技术,可以在加密数据上执行计算,而无需首先解密。在联邦学习的背景下,同构加密在确保个别参与者数据的隐私方面起着至关重要的作用。由于FL中的梯度的聚集仅涉及添加,因此许多最近的作品[10],[11]提议采用基于Paillier [12]的加性同构加密。某些基于晶格的问题,例如但是,一旦可以使用Shor的量子算法有效地将大整数构成大型整数[13],Paillier的安全性就会损坏。基于晶格的密码学被认为是抗量子的[14] - [16]。
摘要。这项研究重点是探索强化学习算法双胞胎的鲁棒性,延迟了深层确定性的政策梯度(TD3),尤其是在面对不确定性,噪音和钉子的表现方面。强化学习是一种机器学习范式,在该范式中,代理商学习如何执行任务并通过与环境的互动来优化长期奖励。这种学习方法在自动驾驶,游戏,机器人控制等领域具有广泛的应用。TD3是一种高级强化学习算法,在各种复杂的任务和环境中的性能非常出色。此外,TD3具有一些独特的性能优势,例如双Q批评结构和目标策略平滑,这在面对不确定性和噪音时可能会使其强大。虽然对增强学习的鲁棒性进行了广泛的研究,但相对缺乏专门针对TD3的研究。本研究旨在填补这一空白,并研究当添加不同类型的噪声或受到攻击时TD3的性能如何变化。这项研究的目的不仅旨在更深入地了解TD3算法本身,还旨在为增强学习鲁棒性的理论和实践提供强有力的支持。这项研究具有广泛的应用和学术价值,并有可能在强化学习领域推动进一步的进步。
功能分级的材料(FGM)在无机热电学的背景下被广泛探索,但尚未在有机热电学中进行。在这里,研究了掺杂梯度对化学掺杂共轭聚合物的热电特性的影响。柜台的平面漂移用于中等电场中,用于在由寡聚侧链的聚噻吩中创建侧向掺杂梯度,并用2,3,5,5,6-Tetra-fuoro-tetra-tetra-fuoro-tetrace-tetrachachacyanoquinainoimeneimetimethane(f 4 tcnq)(F 4 TCNQ)。拉曼显微镜表明,在50μm宽的通道上的偏置电压仅为5 V,足以触发反逆漂移,从而导致掺杂梯度。分级通道的有效电导率随偏置电压降低,而观察到Seebeck系数的总体增加,可产生高达八倍的功率因数。动力学蒙特卡洛模拟分级纤维的模拟解释了在高电导率下,在高电导率下seebeck系数的掷骰,以及由于高掺杂剂浓度下的库仑散射而增加的迁移率。因此,发现FGM概念是提高尚未最佳掺杂的有机半导体的热电性能的一种方式,这可以减轻新材料的筛选以及设备的制造。