项目:项目 / cifar10#i t取决于数据集种子:9999#i t的变化,用于标准化的运行#均值和标准偏差的变化取决于数据集的不同。 :[0.24697121432552785,0.2433893940435022,0.2615925905215076]早期_Stopping_patience:10 num_epochs:10 num_epochs:100适应#使用L r:5E -4#优化参数EPS:1E − 16#优化器参数验证_Metric:F1#f1 -score i用作v a l i i d a t i o n t i o n t i o pretration:true#foricednet -foricednet -fifficitynet -forificitynet the t i f1 _ r a t i o:0.8 v a l i d _ r a t i o:无#自动获得t e s t e s t _ r a t i o:无#自动获得Ensemble_module_list:#在集合中包含l o c a l o c a l o c a l地址
多任务学习假设能够从多个任务中学习的模型可以通过知识迁移实现更好的质量和效率,这是人类学习的一个关键特征。然而,最先进的 ML 模型依赖于每个任务的高度定制,并利用大小和数据规模而不是扩展任务数量。此外,持续学习将时间方面添加到多任务中,通常专注于研究常见的陷阱,例如灾难性遗忘,而不是将其作为构建下一代人工智能的关键组成部分进行大规模研究。我们提出了一种能够生成支持动态添加新任务的大规模多任务模型的进化方法。生成的多任务模型是稀疏激活的,并集成了基于任务的路由,可保证在模型扩展时计算成本有限并且每个任务添加的参数更少。所提出的方法依赖于知识分区技术来实现对灾难性遗忘和其他常见陷阱(如梯度干扰和负迁移)的免疫。我们通过实验证明,所提出的方法可以联合解决 69 个公共图像分类任务并取得有竞争力的结果,例如,与在公共数据上训练的最佳模型相比,通过实现 15% 的相对误差减少,提高了 cifar10 等竞争基准的最新水平。
摘要。机器学习 (ML) 在解决计算机视觉、语音识别、对象检测等各种问题方面取得了巨大成功。这一成功的主要原因是可用于训练深度神经网络 (DNN) 的大量数据集。但是,如果数据集包含敏感信息(例如医疗或财务记录),则无法公开发布。在这种情况下,数据隐私成为一个主要问题。加密方法为这个问题提供了一种可能的解决方案,但它们在 ML 应用程序上的部署并不简单,因为它们会严重影响分类准确性并导致大量计算开销。或者,可以使用混淆技术,但在视觉隐私和准确性之间保持良好的平衡具有挑战性。在这项工作中,我们提出了一种从原始私有数据集生成安全合成数据集的方法。在我们的方法中,给定一个在原始数据集上预先训练的具有批量归一化 (BN) 层的网络,我们首先记录逐层 BN 统计数据。接下来,使用 BN 统计数据和预训练模型,我们通过优化随机噪声来生成合成数据集,以使合成数据与原始模型的分层统计分布相匹配。我们在图像分类数据集 (CIFAR10) 上评估了我们的方法,并表明我们的合成数据可用于从头开始训练网络,从而产生合理的分类性能。1
由于具有二进制和事件驱动架构,脉冲神经网络 (SNN) 在节能神经形态芯片方面具有巨大潜力。SNN 主要用于分类任务,但在图像生成任务方面的探索有限。为了填补这一空白,我们提出了一种脉冲扩散模型,该模型基于矢量量化离散扩散模型。首先,我们开发了一个带有 SNN 的矢量量化变分自动编码器 (VQ-SVAE) 来学习图像的离散潜在空间。在 VQ-SVAE 中,使用脉冲发放率和突触后电位对图像特征进行编码,并设计了一个自适应脉冲生成器来以脉冲序列的形式恢复嵌入特征。接下来,我们在离散潜在空间中执行吸收态扩散,并构建一个带有 SNN 的脉冲扩散图像解码器 (SDID) 来对图像进行去噪。我们的工作是第一个完全从 SNN 层构建扩散模型的工作。在 MNIST、FMNIST、KMNIST、Letters 和 Cifar10 上的实验结果表明,Spiking-Diffusion 优于现有的基于 SNN 的生成模型。我们在上述数据集上分别实现了 37.50、91.98、59.23、67.41 和 120.5 的 FID,与最先进的工作相比,FID 减少了 58.60%、18.75%、64.51%、29.75% 和 44.88%。我们的代码将在 https://github.com/Arktis2022/Spiking-Diffusion 上提供。
在自然视觉中,反馈连接支持多功能的视觉推理,例如使遮挡或嘈杂的自下而上的感觉信息或介导纯自上而下的过程,例如想象力。但是,反馈途径学会产生这些功能的机械主义尚不清楚。我们提出,自上而下的效果通过进料和反馈途径之间的对齐方式出现,每个效果都优化了自己的目标。为了实现这种合作化,我们引入了反馈馈线对齐(FFA),这是一种学习算法,将反馈和馈电路径作为相互信用分配计算图,从而使对齐。在我们的研究中,我们证明了FFA在广泛使用的MNIST和CIFAR10数据集上进行分类和重建任务的有效性。值得注意的是,FFA中的对准机制具有反馈连接,具有新兴的视觉推理功能,包括降解,解决阻塞,幻觉和想象力。此外,与传统的背面传播方法(BP)方法相比,FFA提供了生物学知识。通过将信用分配的计算图将其重新用于目标驱动的反馈途径,FFA减轻了BP中遇到的重量传输问题,从而增强了学习算法的生物学知识。我们的研究表明,FFA是对视觉皮层中反馈连接如何支持灵活视觉功能的机制的有希望的概念概念。这项工作还有助于更广泛的视觉推断潜在的感知现象,并有影响,对开发更具生物学启发的学习算法有影响。
摘要。扩散模型在高质量产生中表现出色,但由于迭代采样而导致缓慢的推断。尽管最近的方法已成功地将扩散模型转换为单步生成器,但它们忽略了模型尺寸的减小,从而将其适用性限制在计算受约束的情况下。本文旨在通过探索推理步骤和模型大小的关节压缩来开发基于强大的整流流框架的小型,有效的一步扩散模型。使用两种操作,回流和蒸馏,整流的流框架训练一步生成模型。与原始框架相比,挤压型号的大小带来了两个新的挑战:(1)在回流过程中,大型老师和小学生之间的初始化不匹配; (2)小型学生模型上天真蒸馏的表现不佳。为了克服这些问题,我们提出了退火回退和流引导的蒸馏,这共同构成了我们的Slimflow框架。使用新颖的框架,我们训练一个一步扩散模型,其FID为5.02和1570万参数,在CIFAR10上表现优于先前最新的一步扩散模型(FID = 6.47,1940万参数)。在Imagenet 64×64和FFHQ 64×64上,我们的方法产生了与较大模型相当的小型单步扩散模型,从而展示了我们方法在创建紧凑,有效的一步扩散模型时的效率。
神经编码是系统神经科学中理解大脑如何处理来自环境的刺激的核心问题之一,此外,它也是设计脑机接口算法的基石,其中解码传入的刺激对于提高物理设备的性能至关重要。传统上,研究人员专注于将功能性磁共振成像 (fMRI) 数据作为解码视觉场景的神经信号。然而,我们的视觉感知在称为神经尖峰的事件中以毫秒为单位的快速时间尺度运行。很少有关于使用尖峰进行解码的研究。在这里,我们通过开发一种基于深度神经网络的新型解码框架来实现这一目标,称为尖峰图像解码器 (SID),用于从实验记录的视网膜神经节细胞群尖峰重建自然视觉场景,包括静态图像和动态视频。SID 是一个端到端解码器,一端是神经尖峰,另一端是图像,可以直接对其进行训练,以便以高精度的方式从尖峰重建视觉场景。与现有的 fMRI 解码模型相比,我们的 SID 在视觉刺激重建方面也表现出色。此外,借助脉冲编码器,我们展示了 SID 可以通过使用 MNIST、CIFAR10 和 CIFAR100 的图像数据集推广到任意视觉场景。此外,使用预先训练的 SID,可以解码任何动态视频,实现脉冲对视觉场景的实时编码和解码。总之,我们的结果为人工视觉系统的神经形态计算提供了新的启示,例如基于事件的视觉相机和视觉神经假体。
在生物神经系统中,不同的神经元能够自组织形成不同的神经回路,以实现多种认知功能。但是,尖峰神经网络的当前设计范式基于深度学习的结构。这种结构以前馈连接为主,而无需考虑不同类型的神经元,这显着阻止了尖峰神经网络在复杂的任务上意识到它们的潜力。将生物神经回路的丰富动力学特性用于对当前尖峰神经网络的结构进行建模。本文通过将饲喂和反馈连接与兴奋性和抑制性神经元相结合,提供了更具生物学上合理的进化空间。我们利用神经元的局部尖峰行为来适应发展神经回路,例如正向激发,正向抑制,反馈抑制和局部局部抑制峰值依赖性依赖性可塑性,并与全球误差信号结合使用突触量。通过使用进化的神经回路,我们构建了尖峰神经网络,用于图像分类和增强学习任务。使用具有丰富的神经回路类型的脑启发的神经电路演化策略(NEUEVO),进化的尖峰神经网络极大地增强了感知和强化学习任务的能力。Neuevo在CIFAR10,DVS-CIFAR10,DVS-GETURE和N-CALTECH101数据集上实现了最新的性能,并在ImageNet上实现了高级性能。与人工神经网络一起实现可相当的性能,结合了上政策和非政策深度加固学习算法。TheevolvedSpikingNeuralCircuitSlayThayThayThayThaythayTheFoundationForneFoundationFortheeFoundationFortheeFoundationFortheeFoldutionforpsects and voldicts具有功能。
联合学习(FL)促进了客户在培训共享的机器学习模型的情况下合作,而无需公开各个私人数据。尽管如此,FL仍然容易受到效用和隐私攻击的影响,特别是逃避数据中毒和建模反演攻击,从而损害了系统的效率和数据隐私。现有的范围通常专门针对特定的单一攻击,缺乏普遍性和全面的防守者的观点。为了应对这些挑战,我们介绍了f ederpography d efense(FCD),这是一个统一的单框架,与辩护人的观点保持一致。FCD采用基于行的转座密码加密,并使用秘密钥匙来对抗逃避黑框数据中毒和模型反转攻击。FCD的症结在于将整个学习过程转移到加密的数据空间中,并使用由Kullback-Leibler(KL)差异引导的新型蒸馏损失。此措施比较了本地预审最终的教师模型对正常数据的预测以及本地学生模型对FCD加密形式相同数据的预测的概率分布。通过在此加密空间中工作,FCD消除了服务器上的解密需求,从而导致了计算复杂性。我们证明了FCD的实践可行性,并将其应用于对基准数据集(GTSRB,KBTS,CIFAR10和EMNIST)上的Evasion实用程序攻击。我们进一步扩展了FCD,以抵御CI-FAR100数据集中的Split FL中的模型反转攻击。与第二最佳方法相比,我们在各种攻击和FL设置中进行的实验表明了对效用逃避(影响> 30)和隐私攻击(MSE> 73)的实际可行性和巨大性。
神经编码是系统神经科学中的核心问题之一,用于了解大脑如何从环境中处理刺激,此外,它也是设计脑与机器界面算法的基石,在该算法中,解码传入的刺激是高度要求的,以便更好地性能进行物理设备的性能。传统研究人员将功能性磁共振成像(fMRI)数据作为解码视觉场景感兴趣的神经信号。但是,我们的视觉感知在称为神经尖峰的事件方面以毫秒的快速时间尺度运行。几乎没有使用尖峰进行解码的研究。在这里,我们通过开发一个基于深层神经网络的新型解码框架(名为Spike-图像解码器(SID))来重建自然视觉场景(包括静态图像和动态视频),从实验记录的视网膜神经节细胞的尖峰中重建了新的解码框架。SID是一个端到端解码器,其一端为神经尖峰,另一端为图像,可以直接训练它,以使视觉场景以高度准确的方式从尖峰重建。与现有的fMRI解码模型相比,我们的SID在视觉刺激的重建方面也表现出色。此外,借助Spike编码器,我们证明SID可以通过使用MNIST,CIFAR10和CIFAR100的图像数据集将其推广到任意视觉场景。此外,有了预先训练的SID,可以解码任何动态视频,以实现通过Spikes对视觉场景进行实时编码和解码。©2020 Elsevier Ltd.保留所有权利。总的来说,我们的结果为人工视觉系统(例如基于事件的视觉摄像机和视觉神经图)提供了有关神经形态计算的新启示。
