摘要 迁移学习和元学习已有效提高多个领域的性能。它也已成功应用于缺乏数据的 EEG 解码。然而,由于实验设置的差异,例如电极数量、电极位置和任务定义不同,跨数据集的 EEG 数据迁移学习面临着独特的挑战。为了解决跨异构电极配置 EEG 数据集进行跨数据集训练的问题,我们引入了一种新方法 CoordinateAttention,它使用电极传感器的 3-D 坐标来学习电极位置之间的空间关系,从而动态生成用于特征提取的空间卷积核。我们表明,我们的模型在跨设置的 EEG 解码中具有良好的性能,并且对数据损坏具有鲁棒性。CoordinateAttention 是一种使用几何位置信息进行特征提取和数据融合的通用方法。
视觉转换器 (ViT) 已证明其在计算机视觉任务中比卷积神经网络 (CNN) 具有更高的精度。然而,为了在资源有限的边缘设备上有效部署,ViT 模型通常需要大量计算。这项工作提出了 Quasar-ViT,一种面向硬件的量化感知 ViT 架构搜索框架,以设计用于硬件实现的高效 ViT 模型,同时保持精度。首先,Quasar-ViT 使用我们的逐行灵活混合精度量化方案、混合精度权重纠缠和超网层缩放技术来训练超网。然后,它应用一种高效的面向硬件的搜索算法,结合硬件延迟和资源建模,从不同推理延迟目标下的超网中确定一系列最佳子网。最后,我们提出了一系列 FPGA 平台上的模型自适应设计,以支持架构搜索并缩小理论计算减少和实际推理加速之间的差距。我们搜索到的模型在 AMD/Xilinx ZCU102 FPGA 上分别实现了 101.5、159.6 和 251.6 帧每秒 (FPS) 的推理速度,对于 ImageNet 数据集的 top-1 准确率分别达到 80.4%、78.6% 和 74.9%,始终优于之前的研究。
扩散模型(DMS)已经实现了最新的(SOTA),从而导致LIDAR点云生成任务,从而受益于他们在抽样过程中稳定的训练和迭代精炼。但是,DMS由于其固有的降解过程而经常无法实际对LiDAR Raydrop噪声进行建模。为了保留迭代采样的强度,同时增强了射线噪声的产生,我们引入了Lidargrit,这是一种生成模型,该模型使用自动回应变压器在潜在空间而不是图像空间中迭代采样范围图像。此外,lidargrit还利用VQ-VAE分别解码范围和射线罩。我们的结果表明,与Kitti-360和Kitti Odometry数据集中的SOTA模型相比,Lidargrit的性能表现出色。代码可用:https://github.com/hamedhaghighi/lidargrit。
摘要近年来,变形金刚领导了自然语言处理的一场革命,而视觉变形者(VIT)承诺在计算机视觉中也这样做。广泛使用VIT的主要障碍是它们的计算成本。的确,给定图像分为一个贴片列表,vits计算每一层,每个贴片相对于所有其他贴片的注意力。在文献中,许多解决方案试图使用量化,知识蒸馏和输入扰动来降低注意力层的计算成本。在本文中,我们的目标是在这种情况下做出贡献。特别是,我们提出了一个使用加强学习来培训代理的框架,该框架是在培训VIT期间确定最不重要的补丁的代理商。一旦确定了此类斑块,AgentVit就将其删除,从而减少了VIT处理的斑块数量。我们的目标是减少VIT的训练时间,同时保持竞争性能。
3实施34 3.1模型体系结构。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。34 3.2培训和评估程序。。。。。。。。。。。。。。。。。。。。。。37 3.2.1损失和错误实现。。。。。。。。。。。。。。。。。。。。37 3.2.2数据增强实现。。。。。。。。。。。。。。。。。39 3.2.3训练循环。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。40 3.2.4注意推出实现。。。。。。。。。。。。。。。。。。。41 3.2.5 Grad-CAM实施。。。。。。。。。。。。。。。。。。。。。。。42 3.3实验。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。43 3.3.1定量实验。。。。。。。。。。。。。。。。。。。。。。。。43 3.3.2定性实验。。。。。。。。。。。。。。。。。。。。。。。。。45
深度学习模型在分析高维功能MRI(fMRI)数据的分析方面已使性能飞跃。然而,许多以前的方法对各种时间尺度的上下文表示次优敏感。在这里,我们提出了螺栓,这是一种血氧级依赖性变压器模型,用于分析多变量fMRI时间序列。螺栓利用一系列具有新型融合窗户注意机制的变压器编码器。编码是在时间序列中的时间段窗口上执行的,以捕获本地表示。为了暂时整合信息,在每个窗口中的基本令牌和来自相邻窗口的边缘令牌之间计算跨窗口的注意力。逐渐从局部到全球表示,窗口重叠的程度以及在整个级联反应中的数量逐渐增加。最后,一种新型的跨窗口正规化用于整个时间序列的高级分类特征。大规模公共数据集的全面实验证明了螺栓对最新方法的出色性能。此外,解释性分析是为了确定有助于建模决策最大程度贡献的具有里程碑意义的时间点和区域,证实了文献中突出的神经科学发现。
摘要 - 当两种或多种混合使用的药物会引起不良副作用时,即使使用药物单独使用不会造成伤害时,多药的问题也会引起不利的副作用。药物相互作用(DDIS)是这些反应的主要原因,导致发病率和死亡率增加。由于有害DDI的潜力呈指数增长,因此药物相互作用的预测对于患者的安全和有效的医疗保健管理越来越重要。在本文中,我们开发了Chembertaddi框架,该框架有效地结合了临床域数据,以单副作用特征表示,其富集化学分子表示,该化学分子表示源自Chemberta-77m-MLM,这是一个基于变压器的LAN- lan- gage模型。与五种最先进的方法相比,在基准数据集上进行的实验表现出色:decagon,deepwalk,dedicom,nnps和recrecal。评估表明,Chembertaddi的F1得分为0.94,AUROC为0.97,表现优于基线体系结构,并推广到新的引入的药物化合物。索引术语 - 转化,自然语言处理,分子表示学习,药物 - 药物相互作用,多药,Chemberta,神经网络,深度学习,注意机制,生物信息学
最大功率传输的幅度由端电压 V1 和 V2 定义。此外,端电压 V1 和 V2 在幅度和相位角 ρ 方面的差异表示变压器中的电压降,该电压降是通过短路阻抗 %Z 和负载电流得出的。考虑该图的负载端,以单位功率因数 (upf) 向电网抽取电流或注入电流。
理论上,神经群体活动反映了潜在的动态结构。可以使用具有显式动态的状态空间模型(例如基于循环神经网络 (RNN) 的模型)准确捕获此结构。但是,使用循环来显式建模动态需要对数据进行顺序处理,从而减慢脑机接口等实时应用的速度。在这里,我们介绍了一种非循环替代方案——神经数据转换器 (NDT)。我们通过将 NDT 应用于具有已知动态的合成数据集和来自猴子运动皮层的数据(在由 RNN 很好地建模的伸手任务期间),测试了 NDT 捕获自主动态系统的能力。NDT 可以对这些数据集以及最先进的循环模型进行建模。此外,它的非循环性可以实现 3.9 毫秒的推理,远低于实时应用的循环时间,并且比猴子伸手数据集上的循环基线快 6 倍以上。这些结果表明,明确的动力学模型对于建模自主神经群体动力学来说不是必需的。代码:github.com/snel-repo/neural-data-transformers。
近年来,随着社交媒体平台的繁荣,表情包逐渐成为网络交流的一部分。因此,检测表情包是否对个人或组织具有冒犯性对于确保互联网内容的多样性和可持续性至关重要。对表情包进行分类是否为恶意内容是一项具有挑战性的任务。此外,目前已经有很多工作集中在英语上(Truong 和 Lauw,2019 年;Xu 等,2019 年;Cai 等,2019 年),但针对泰米尔语的研究很少。泰米尔语表情包分类共享任务填补了这一空白。此共享任务的目标是检测从社交媒体平台收集的表情包是否为恶意内容。每个表情包都标有恶意或非恶意类别。此外,每张图片都嵌入了泰米尔语和拉丁字母的字幕转录。这是一个多模态分类任务,给定图像和文本对,系统必须将此对分类为 troll 或非 troll 类。在本文中,我们探索了一种用于泰米尔语 meme 分类的多模态转换器。根据图像和文本的特征,