摘要:诸如ChatGpt和其他大型语言模型(LLM)等变压器网络的功能引起了世界的关注。其性能基础的至关重要的计算机制依赖于将完整的输入序列(例如,句子中的所有单词)转换为一个长的“编码向量”,该序列使变压器可以在自然序列中学习长距离的时间依赖性。具体来说,应用于此编码向量的“自我注意力”通过计算输入序列中的单词对之间的关联来增强变形金刚中的时间上下文。我们建议,跨单个皮质区域或以整个脑规模的多个区域传播的神经活动波可以实施类似的编码原理。通过将最新的输入历史记录到每个时间时刻,皮层波可以使时间上下文从感觉输入的序列中提取,这是变压器中使用的计算原理。
基于个性化会话建议(PSR)扩展了传统的顺序推荐模型(通常是基于最近的活动会话建议下一个项目),以利用用户的历史会话在当前会话中进行短期推荐。但是,现有的PSR方法面临两个局限性:(1)将离线会话统一地视为静态数据,并依靠用户嵌入来表示个性化信息,以忽略随着时间的推移的动态演变,随着会话在实际应用中的进展可能会发生显着变化。(2)关注准确性,即推荐与最近互动相关的项目,忽略了多方面要求的平衡,以达到用户满意度,即多样性,新颖性和偶然性。因此,我们引入了多目标PSR(MOPSR)任务,并提出了层次决策变压器(HDT)框架,该框架严格地模拟了跨会话和内部用户的顺序优先转换,以平衡建议准确性与上述目标。要解决第一个问题,DT Inter-ensess DT通过维护目标状态,动态地跟踪用户在跨会话中的长期偏好。此目标状态是个性化信息,可以通过会议内的DT与短期状态合作提出建议。为了应对第二个限制,我们提出了会议和会议内意外回报,以权衡有关多样性,新颖性和偶然性的相关建议和用户偏好。层次回报可帮助推荐人准确地确定用户指示的信号以及多目标首选项的变化。为了验证我们的方法对MOPSR的有效性,我们将HDT应用于四个最先进的顺序推荐模型,并在两个公开可用的数据集上进行验证。实验结果表明,(1)HDT可以广泛概括顺序模型,以求解MOPSR任务,以逐步生成
变形金刚对自然语言处理产生了重大影响,最近证明了它们在计算机视觉中的潜力。他们在基本的计算机视觉任务中显示了卷积神经网络的有希望的结果。然而,科学界并未完全掌握视觉变形金刚的内部运作,也没有做出决策的基础,这强调了解释性方法的重要性。了解这些模型如何做出决定不仅可以改善其绩效,还可以建立对AI系统的信任。本研究探讨了为视觉变压器提出的不同解释性方法,并提出了根据其动机,结构和应用方案组织它们的分类法。此外,它提供了对评估标准的全面审查,可用于比较解释结果以及解释性工具和框架。最后,本文重点介绍了可以增强视觉变形金刚的解释性的基本但未开发的方面,并建议有前途的研究方向以进行未来的投资。关键字:解释性,视觉变压器,VIT,注意力,修剪。
3实施34 3.1模型体系结构。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。34 3.2培训和评估程序。。。。。。。。。。。。。。。。。。。。。。37 3.2.1损失和错误实现。。。。。。。。。。。。。。。。。。。。37 3.2.2数据增强实现。。。。。。。。。。。。。。。。。39 3.2.3训练循环。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。40 3.2.4注意推出实现。。。。。。。。。。。。。。。。。。。41 3.2.5 Grad-CAM实施。。。。。。。。。。。。。。。。。。。。。。。42 3.3实验。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。43 3.3.1定量实验。。。。。。。。。。。。。。。。。。。。。。。。43 3.3.2定性实验。。。。。。。。。。。。。。。。。。。。。。。。。45
摘要 迁移学习和元学习已有效提高多个领域的性能。它也已成功应用于缺乏数据的 EEG 解码。然而,由于实验设置的差异,例如电极数量、电极位置和任务定义不同,跨数据集的 EEG 数据迁移学习面临着独特的挑战。为了解决跨异构电极配置 EEG 数据集进行跨数据集训练的问题,我们引入了一种新方法 CoordinateAttention,它使用电极传感器的 3-D 坐标来学习电极位置之间的空间关系,从而动态生成用于特征提取的空间卷积核。我们表明,我们的模型在跨设置的 EEG 解码中具有良好的性能,并且对数据损坏具有鲁棒性。CoordinateAttention 是一种使用几何位置信息进行特征提取和数据融合的通用方法。
摘要。在本文中,我们引入了一个新的生成模型,即无自动编码器(DolfIN)的扩散布局变压器,该变压器在现有方法上可显着提高建模能力和透明度。Dolfin采用基于变压器的扩散过程来建模布局生成。除了有效的双向(非因果关节)序列表示外,我们还设计了一种自回归扩散模型(Dolfin-ar),该模型尤其擅长捕获邻居对象的丰富局部语义相关性,例如对齐,大小和重叠。在对标准的无条件布局生成基准进行评估时,Dolfin尤其优于各种指标的先前方法,例如FID,对齐,重叠,Maxiou和DocSim分数。此外,Dolfin的应用程序不仅仅是布局生成,因此它适用于对其他类型的几何结构(例如线段)进行建模。我们的实验既提出了定性和定量结果,以证明Dolfin的优势。
摘要。作为视觉变压器(VIT)的核心,自我注意力在建模长期空间相互作用方面具有很高的多功能性,因为每个查询都聚集在所有空间位置。尽管VIT在视觉任务中实现了有希望的表现,但自我注意力的复杂性与令牌长度相关。将VIT模型适应需要高输入分辨率的下游任务时,这会导致挑战性问题。前瞻性艺术试图通过引入稀疏的注意力(例如空间减少关注和窗户注意力)来解决这个问题。这些方法的一个常见点是,在计算注意力重量的情况下,所有图像/窗口令牌都连接在一起。在本文中,我们发现注意力重量与造成的计算冗余之间存在很高的相似性。为了解决这个问题,本文引入了新的关注,称为部分注意力,该问题通过减少注意图中的冗余信息来更有效地学习空间相互作用。我们注意力中的每个查询只与一小部分相关令牌相互作用。基于部分关注,我们提出了一个高效而通用的视觉变压器,名为Partialformer,该变压器在视觉任务之间的准确性和计算成本之间达到了良好的权衡。例如,在Imagenet-1K上,PartialFormer-B3超过1.7%的TOP-1准确性,同时节省25%的GFLOPS,而焦点T则超过0.8%,同时节省了30%的GFLOPS。
1 浦那 COEP 科技大学电气工程系主任 2、3、4、5 浦那 COEP 科技大学电气工程系学生 摘要:在改进电力系统中变压器的工作方式方面,可编程逻辑控制器 (PLC) 变得非常重要。它们帮助我们管理电流,确保电网保持稳定可靠。本摘要讨论了如何使用 PLC 专门在变压器之间共享负载,解释了这为何重要以及它的工作原理。PLC 就像智能负载共享系统背后的大脑。它们使用复杂的指令并快速处理数据以确保变压器均匀分配负载。使用 PLC 使我们能够密切关注电力的分配方式并根据需要进行调整,尤其是在电力需求上升或下降时。基于 PLC 的负载共享通过将传感器、开关和通信工具连接在一起来工作。这让 PLC 能够收集有关用电量和系统状况等信息的实时信息。有了这些数据,他们就可以做出明智的决定,决定如何平衡变压器之间的负载。为了使基于 PLC 的负载共享工作良好,我们需要创建适合每个变压器需求的自定义指令。这些指令告诉 PLC 如何读取数据、预测用电量变化并相应地调整负载共享。PLC 还可以帮助系统的不同部分顺利地相互通信。这意味着它们可以轻松共享信息并协同工作以平衡整个电网的负载。使用强大的通信工具,PLC 可以创建一个统一的系统来监控和控制变压器的工作方式,无论它们位于何处。PLC 的一大优点是它们非常灵活。它们可以调整以适应不同情况和不同类型的电力系统。这意味着基于 PLC 的负载共享可以轻松添加到现有电网中,从而更容易处理电力需求的变化和增长。简而言之,使用 PLC 在变压器之间共享负载是使电力系统更好地运行的一种明智方法。它们帮助我们密切关注事物,根据需要进行调整,并确保一切顺利运行,从而提高整个系统的效率、可靠性和弹性。关键词:PLC、继电器、远程控制、
电力是现代生活必不可少的,而变压器是稳定和有弹性的电网的重要组成部分,而电网又是美国基础设施和经济福祉的关键。变压器改变电压,使电力能够有效地从发电源流向最终用户(即用电的地方)。在新冠疫情期间,变压器制造行业是经历严重供应链中断的行业之一,而这些中断的影响在随后的几年里变得更加明显。目前,订购变压器的电力公司或发电开发商可能需要等待 2 到 4 年才能交货,而在 2020 年,等待时间仅为数月。2 美国一家大型电力变压器制造厂披露,新变压器订单的等待时间为 5 年。
电力对现代生活至关重要,变形金刚是稳定且有弹性的电网的关键组成部分,反过来又是美国(美国)基础设施和经济福祉的关键。变形金刚更改电力的电压,以使电力从发电源到消耗电力的最终用户的有效流动。在Covid-19大流行期间,变压器制造业是严重供应链中断的行业之一,这些干扰的影响仅在随后几年变得更加明显。目前,与2020年仅几个月的等待相比,订购变压器可能需要等待2至4 1年才能订购的电力或发电机开发人员。2美国的一个大型电力变压器制造工厂披露了新变压器订单的5年等待时间。