水平生成是程序内容产生(PCG)的主要重点,但是基于深度学习的方法受到稀缺培训数据的限制,即人为设计的水平。尽管是一个主导的框架,但生成的对抗网络(GAN)在产生的和人为实现的水平之间表现出很大的质量差距,以及培训成本上升,尤其是随着令牌复杂性的提高。在本文中,我们引入了一个基于扩散的生成模型,该模型仅从一个示例中学习。我们的方法涉及两个核心组成部分:1)有效而表达的水平代码,以及2)具有受限接收场的潜在denoing网络。首先,我们的方法利用令牌标签(类似于单词嵌入)来提供密集的表示。这种策略不仅超过了代表较大游戏水平的一式式编码,而且还可以提高稳定性并加速潜在扩散的收敛性。此外,我们将denoising网络体系结构调整为良好的接收领域,以局部数据的局部贴片,以促进单个例子学习。广泛的实验表明,与手动设计的水平相比,我们的模型能够生成风格一致的任意大小样本。它适合与基于GAN的方法更少的伪像的广泛水平结构。源代码可在https://github.com/shiqi-dai/ diffusioncraft上找到。
医学图像分析中深度学习的核心挑战之一是数据不足,尤其是对于3D脑成像,这可能会导致模型过度拟合和泛化。正规化策略(例如知识蒸馏)是通过惩罚预测性分布并引入其他知识来加强培训过程的强大工具来减轻问题。在本文中,我们通过惩罚细心的产出分布和中间代表来重新审视知识扭曲作为正规化范式。尤其是我们提出了一个信心正规知识蒸馏(CREG-KD)框架,该框架可以根据知识信心自适应地转移知识以进行蒸馏。提倡两种策略,以使教师和学生知识之间的全球和地方依赖性正规化。详细提出了一种封闭式的蒸馏机制,以通过将教师损失作为置信度得分来软化全球转移的知识。中间表示非常专心和局部完善,具有关键的摩西环境,以模仿有意义的特征。为了证明我们提出的框架的优越性,我们评估了两个大脑成像分析任务的框架(即基于阿尔茨海默氏病的疾病分类和大脑年龄估计,基于阿尔茨海默氏病神经影像学计划数据集,包括902名受试者和来自4个公共数据集的3655名受试者的同类。广泛的实验结果表明,CREG-KD比基线教师模型取得了一致的改进,并表现出了其他最先进的知识蒸馏方法,这表明Creg-KD是有希望的预测性能和普遍性的强大医学图像分析工具。
事件摄像机最近显示出对实用视觉任务的有益,例如行动识别,这要归功于其高度分辨率,功率效率和引起的隐私问题。然而,当前的研究是由1)处理事件的困难,因为它们的持续时间长时间和动态动作具有复杂而模棱两可的语义; 2)事件框架表示带有固定堆栈的冗余作用。我们发现语言自然传达了丰富的语义信息,从而使其在降低疾病的不确定性方面非常出色。鉴于此,我们提出了一种新颖的方法,这是第一次解决基于事件的动作识别的跨模式概念化的识别。我们的确切确切带来了两项技术贡献。首先,我们提出了一个自适应细粒事件(AFE)表示,以自适应地过滤固定对象的重复事件,同时保留动态的对象。这巧妙地增强了精确的性能,而无需额外的计算成本。然后,我们提出了一个基于概念推理的不确定性估计模块,该模块模拟了识别过程以丰富语义代表。尤其是,概念推理基于动作语义建立时间关系,而不必要的估计可以解决基于分布表示的动作的语义不确定性。实验表明,在PAF,HADDV和我们的SEACT数据集上,我们的确切确切识别获得了94.83%(+2.23%),90.10%(+2.23%),90.10%(+37.47%)和67.24%。
摘要。在医学图像分析的最新进展中,综合神经网络(CNN)和视觉变压器(VIT)设定了重要的基准。虽然前者通过其卷积行动占领了当地的效果,但后者通过利用自我发场机制来实现非凡的全球环境理解。然而,两种体系结构在有效地对医学图像中的长期依赖性建模时都表现出局限性,这是精确分割的关键方面。受到Mamba体系结构的启发,该建筑的熟练程度熟练地处理长序列和以提高计算效率作为状态空间模型(SSM)的全球上下文信息,我们提出了Mamba-Unet,这是一种新颖的体系结构,这是一种具有MAMBA能力的医学图像序列中的U-NET。mamba-unet采用了基于跳过连接的纯净视觉曼巴(VMAMBA)基于编码器的结构,以在网络的不同尺度上保留空间信息。此设计促进了一个全面的特征学习过程,捕获了复杂的细节和医学图像中更广泛的疾病环境。我们在VMAMBA块中引入了一种新颖的集成机制,以确保编码器和解码器路径之间的无缝连通性和信息流,从而增强分割性能。我们对公开可用的ACDC MRI心脏分割数据集进行了实验,并进行了Synapse CT CT腹部分割数据集。结果表明,在同一超参数设置下,Mamba-Unet在医疗图像分割中的表现优于几种类型的UNET 1。源代码和基线信息可在https://github.com/ziyangwang007/mamba- unet上获得。
从粗制的数据中发现细粒类别是一项实用且挑剔的任务,可以在对细粒度分析的需求和高注释成本之间弥合差距。以前的作品主要集中在实例级别的歧视上,以学习低级特征,但忽略了数据之间的半敏化相似性,这可能会预见这些模型学习紧凑的集群表示。在本文中,我们提出了DeNOCORE的邻域聚集(DNA),这是一个自我监督的框架,将数据的系统结构编码到嵌入空间中。特别是,我们检索了查询的k neart邻域,作为其积极的键,以捕获数据之间的语义相似性,然后从邻居那里汇总信息以学习紧凑的群集表示,这可以使细粒类别变得更加差异。但是,检索到的邻居可能会嘈杂,并且包含许多假阳性钥匙,从而可以降低学习式床的质量。为了应对这一挑战,我们提出了三个原则,以解决这些虚假的邻居以更好地表示学习。此外,我们从理论上证明我们框架的学习目标与聚类损失相同,该损失可以捕获数据之间的语义相似性以形成紧凑的细粒簇。在三个基准数据集上进行了广泛的例证表明,我们的方法可以检索更准确的邻居(准确性提高21.31%),并以较大的利润率(平均提高了三个指标的平均9.96%)。我们的代码和数据可在https://github.com/lackel/dna上找到。
在043 A高维空间中启用其语义相似性。044但是,此相似性计算过程045面临几个挑战。首先,查询与文档047之间的复杂SE-046摩西关系映射到标量相似性,该标量相似性无法重新触及足够的信息,并且很难在049架上持平(Brito and Iser,2023)。第二,当与长期文档进行交易时,例如具有256、051 512或更多令牌的文件,确定了与查询最相关的第052节,并且对相似性最大的053贡献最高的053是非常可取的,但挑战是挑战 - 054(Luo等人),2024; Günther等。,055 2024)。此外,许多NLP任务,例如SEN- 056 TENCE选择,搜索结果突出显示,针头057在干草堆中(Liu等人。,2024b; An等。,2024; 058 Wang等。,2024)和细粒度引用(Gao 059等人,2023;张等。,2024),需要对文本的深度和060细粒度的理解。061鉴于需要对细粒度的理解的需求,062只是将整个文档与查询保持一致的双重编码器似乎不足,因为它的召开对比损失主要强调全局065语义(Khattab和Zaharia,2020年)。com-066 pllement re-067 Triever的核心定位能力,我们提出了一个新颖而充满挑战的乐趣 - 068 damental问题:我们可以增强和整合069现有070检索器的信息本地化能力而无需牺牲其固有检索能力吗?首先,083072为了应对这些挑战,我们提出了一个073新颖的方法齿轮(ge neration-a u摘要074 r etrieval)。具体来说,我们将数据构建为075(查询文档信息)的三元组,但仍使用076对比度学习来优化相似度为-077 deween the查询和文档。在相同的078时间,我们设计了一个文本解码器,以在文档080中生成Rel-079 Evant Evant Evant-evant Ever-Graining信息,以增强RE-081 recy-081 threval和本地化功能。尽管082概念很简单,但仍有许多挑战。
摘要 — 集成复杂机器推理技术的基于意图的网络将成为未来无线 6G 系统的基石。基于意图的通信要求网络考虑数据传输的语义(含义)和有效性(在最终用户处)。如果 6G 系统要以更少的比特可靠地通信,同时为异构用户提供连接,这一点至关重要。本文与缺乏数据可解释性的最先进技术相反,提出了神经符号人工智能 (NeSy AI) 框架作为学习观察到的数据背后的因果结构的支柱。特别是,生成流网络 (GFlowNet) 的新兴概念首次在无线系统中用于学习生成数据的概率结构。此外,为了实现更高的语义可靠性,严格制定了一个用于学习最佳编码和解码函数的新型优化问题。开发了新的分析公式来定义语义消息传输的关键指标,包括语义失真、语义相似性和语义可靠性。这些语义度量函数依赖于知识库中语义内容的定义,而这种信息度量反映了节点的推理能力。仿真结果验证了高效通信的能力(使用更少的比特但具有相同的语义),并且与不利用推理能力的传统系统相比,性能明显更好。I. 引言未来的无线系统(例如 6G)如果要集成时间关键型自主系统应用,则必须在传输内容方面更加谨慎。正如香农 (Shannon) [1] 所指出的,传统无线系统注重可靠地发送物理比特,而不注重语义和有效性层。与传输全部数据相比,只发送对接收方有用的信息自然在延迟、带宽利用率和能量方面更有效率(不会影响可靠性)[2]。这是所谓基于意图的语义通信 (SC) 系统 [3] 的核心前提。基于意图的网络是一种自主系统,它定义了它们期望从网络获得的行为,例如“改善网络质量”,然后系统会自动将其转换为实时网络操作。整合语义和有效性方面以创建基于意图的无线网络需要重大的范式转变 [2]–[4]。它特别要求传输和接收节点不再只是盲目设备(来回传输数据),而是成为能够理解和推理数据及其生成方式的类脑设备。一种有前途的方法是将知识表示和推理工具与机器学习相结合。一旦智能嵌入到发送器和接收器中,通信设备就可以感知(数据采集)、预处理并高效通信,而不会产生不必要的网络瓶颈(通过发送大量不必要的数据)。尽管
要揭示人类大脑如何编码和约束词语,必须识别形态语义加工背后的复杂神经认知机制。形态加工涉及对给定词语的内部形态信息和结构的心理操作,整个过程总是与语义分析交织在一起(Chung, Tong, Liu, McBride-Chang, & Meng, 2010 ; Ip et al., 2017)。迄今为止,尽管形态学在字母语言处理中的作用已得到广泛探索(例如,Bölte、Jansma、Zilverstand和Zwitserlood,2009;Carrasco-Ortiz和Frenck-Mestre,2014;Leminen、Smolka、Dunabeitia和Pliatsikas,2019;Schremm、Nov en、Horne和Roll,2019),但尚不清楚中文形态学在阅读过程中如何表现。由于超过 70% 的中文词是由两个或三个构成字/词素复合而成的,因此书面中文通常被描述为形态音节(DeFrancis,1989),其中每个字对应一个音节/词素。因此,亚词汇层次的构成词素可能在介导词汇获取和整词加工中发挥重要作用。最近,越来越多的研究证明了汉语复合词阅读中词素效应和亚词汇加工的心理现实(例如,Huang, Lee, Huang, & Chou, 2011; Huang, Lee, Tsai, & Tzeng, 2011; Zhao, Wu, Li, & Guo, 2017 ; Gao, Wang, Zhao, & Yuan, 2021 )。然而,在汉语词汇阅读过程中,人类大脑如何编码形态约束的时空特征仍不清楚。有趣的是,有人将并列复合词(如“花草”、/faa1 cou2/、flower 和 grass、plant)嵌入视觉启动词汇决策任务中,研究了汉语形态结构加工的时间进程和时间特征(Chung et al.,2010)。事件相关电位(ERP)结果显示,纯形态结构效应仅在220 至300 毫秒的时间窗内检测到(额叶P250/P2效应),而经典的N400语义启动效应(表现在中央顶叶电极点)能够指示语义记忆网络的激活,这表明形态结构可能在早期复合词阅读过程中自动调节语义加工(Pylkköanen & Marantz,2003;Pylkköanen、Feintuch、Hopkins & Marantz,2004)。另一项研究也表明,具有相同形态结构的词对比具有不同结构的词对引起的 P2a 波幅更大(在额叶部位为 150 至 180 毫秒)(顾,余,马,2012)。这些发现表明,在汉语复合词阅读的早期阶段可能存在形态结构加工成分,并且独立于后期的词汇语义加工。然而,与早期加工理论(如 P250/P2、P2a)相反,最近的一系列研究表明,汉语形态加工在词汇后层面上暗示着有意识的过程(Allen、Badecker 和 Osterhout,2003;Newman、Ullman、Pancheva、Waligura 和 Neville,2007)。例如,研究发现,形态生产力较高的词(即从属结构)会引发明显更大的 P600