在这里,我们研究解码通过未知量子态传输的信息的问题。我们假设 Alice 将字母表编码为一组正交量子态,然后将其传输给 Bob。然而,介导传输的量子通道将正交状态映射到非正交状态,可能混合。如果没有准确的通道模型,那么 Bob 收到的状态是未知的。为了解码传输的信息,我们建议训练测量设备以在鉴别过程中实现尽可能最小的误差。这是通过用经典通道补充量子通道来实现的,经典通道允许传输训练所需的信息,并采用抗噪声优化算法。我们在最小误差鉴别策略的情况下演示了训练方法,并表明它实现了非常接近最优误差概率。特别是,在两个未知纯态的情况下,我们的建议接近 Helstrom 界限。对于更高维度中的大量状态,类似的结果也成立。我们还表明,减少训练过程中使用的搜索空间可以大大减少所需资源。最后,我们将我们的建议应用于相位翻转通道达到最佳误差概率的准确值的情况。
大型语言模型(LLMS)传统上依赖手动及时工程,这可能是耗时且容易受到人类偏见的影响。在本文中,我们提出了一个基于进化增强学习原理(EVORL)的对抗性进化增强学习(AERL)框架[Lin等,2023],以实现对AI剂的持续自我投资。我们的方法迭代生成,测试和完善了通过四个组件的提示或配置:(1)进化提示作者/改进器/改善者,(2)进化模型,(3)对抗模型和(4)法官。通过将候选模型暴露于对抗性的场景中,并通过进化运算符选择最佳变体,AERL促进了强大的,域特异性的解决方案,而无需重新进行过多的人类试验和错误。受到Evorl [Bai等,2023]中多目标优化技术的启发和对抗性训练方法[Goodfellow等人,2014],我们的经验性和有意义的示例来自分散财务(DEFI)(DEFI),代码生成,并且数学推理说明了我们框架的多功能性。结果表明,对抗性的进化策略可以在维持高适应性和性能的同时,诱导地减少人驱动的猜测。
利用预训练的扩散模型进行恢复已成为传统特定任务训练方法的偏爱替代品。以前的工作通过使用显式降解模型限制解决方案空间取得了值得注意的成功。但是,当面对复杂的降解时,这些方法通常无法精确建模。在本文中,我们提出了PGDIFF,通过引入部分指导,与现有作品相比,这种新观点更适合现实世界中的降级。我们的方法不是专门定义降解过程,而是建模所需的属性,例如高质量图像的图像结构和颜色统计,并在反向扩散过程中应用此指南。这些属性很容易获得,并且对退化过程没有任何假设。与先验的扩散结合在一起时,该部分指导可以在一系列恢复任务中提供吸引人的结果。此外,可以通过整合多个高质量的图像属性来扩展PGDIFF来处理复合任务,从而通过整合各自任务的指导来实现。实验结果表明,我们的方法不仅胜过现有的基于扩散的方法,而且还与特定于任务的模型竞争。
在Natu的语言任务中已经取得了重大进步,这在很大程度上归因于强大的大型语言模式(LLMS)的出现。这些模型已在充分和多样化的语料库中进行了预先培训,已经具有不可思议的能力理解语言的文化。尽管LLM大量用于许多高资源语言,但此类模型的可用性仍然是欧洲葡萄牙语的限制性。我们介绍了强大的欧洲葡萄牙解码器LLMGlória。为了预训练Glória,我们组装了一个全面的PT-PT文本语料库,其中包括来自各种来源的350亿个令牌。我们介绍了我们的训练方法,然后评估模型对多个下游任务的有效性。补充,为了评估我们的模型的语言模型功能,我们介绍了calame-pt(葡萄牙语的上下文意识语言建模评估),这是第一个葡萄牙零射击语言模型基准。评估表明,Glória在语言建模中显着超过现有的PT解码器模型,并且可以生成声音,知识丰富和相干的PT-PT文本。该模型还具有各种下游任务的强大潜力。1
构建用于 EEG 解码的独立于受试者的深度学习模型面临着跨不同数据集、受试者和记录会话的强协变量转移的挑战。我们解决这一困难的方法是使用简单的统计技术以及具有更多表示能力的可训练方法明确对齐深度学习模型各个层的特征分布。这与基于协方差的对齐方法 [1] 类似,后者通常用于黎曼流形上下文 [2]。本文提出的方法在 NeurIPS 会议 2 举办的 2021 年 EEG 迁移学习基准 (BEETL) 竞赛 1 中荣获第一名。竞赛的第一项任务是睡眠阶段分类,这需要将在年轻受试者身上训练的模型转移到对多名年龄较大的受试者进行推理,而无需个性化的校准数据,因此需要独立于受试者的模型。第二项任务需要将在一个或多个源运动想象数据集的受试者上训练的模型转移到两个目标数据集上进行推理,为多个测试对象提供一小组个性化校准数据。
纳米孔信号分析能够检测天然DNA和RNA测序的核苷酸修饰,从而在没有其他文库准备的情况下提供了准确的遗传/转录组和表观遗传信息。目前,只能直接对一组有限的修改(例如5-甲基胞霉素),而大多数其他则需要探索方法,这些方法通常以纳米孔信号与核苷酸参考的比对开始。我们提出了Uncalled4,这是一种用于纳米孔信号对准,分析和可视化的工具包。uncalled4具有有效的带信号对准算法,BAM信号对准文件格式,用于比较信号对准方法的统计数据以及基于K-MER的孔模型的可重复的DE NROVE训练方法,揭示了ONT尚未访问的途径的可能错误。我们在七个人类细胞系中的RNA 6-甲基趋化(M6A)检测应用于RNA 6-甲基丹宁(M6A),使用M6ANET鉴定的修饰比Nanopolish多26%,其中包括M6A已知在癌症中具有含义的几种基因。uncalled4可在github.com/skovaka/uncalled4上开放源4。
合作利用自动车辆和基础设施传感器数据可以显着增强自主驾驶感知能力。但是,不确定的时间异步和有限的通信条件会导致融合未对准并限制基础架构数据的利用。为了解决车辆基础结构合作3D(VIC3D)对象检测中的这些问题,我们提出了一个新型的合作检测框架(FFNET)。ffnet是一个基于流动的特征融合框架,它使用特征流预测模块来预测未来的特征并补偿异步。而不是从静止图像提取的特征图,而是利用顺序基础架构帧的时间连贯性。此外,我们引入了一种自我监督的训练方法,该方法使FFNET能够从原始基础架构序列中生成特征流,并具有特征预测能力。示例结果表明,我们所提出的方法的表现优于现有的合作检测方法,而仅需要约1/100的原始数据传输成本,并且在DAIR-V2X数据集中涵盖了一个模型中的所有延迟。代码可在https://github.com/haibao-yu/ffnet-vic3d上找到。
逐渐的域适应性(GDA),其中为学习者提供了辅助中间域,在许多情况下已经在理论上和经验上研究了。尽管在关键安全方案中起着至关重要的作用,但GDA模型的对抗性鲁棒性仍然没有探索。在本文中,我们采用了有效的渐进自我训练方法,并用副本自我训练(AST)替换香草自我训练。AST首先预测未标记的数据上的标签,然后对手在伪标记的分布上训练模型。有趣的是,我们发现逐渐的AST不仅提高了对抗性的准确性,而且可以提高目标域的清洁准确性。我们揭示这是因为当伪标签包含一部分不正确标签时,对抗性训练(AT)的性能要比标准训练更好。因此,我们首先介绍多类分类设置中逐渐AST的概括误差界限。然后,我们使用子集总和问题的最佳值在真实分布和伪标记分布上的对抗误差上桥接标准误差。结果表明,在具有不正确的伪标签的数据上,可能会获得比标准培训更紧密的结合。我们进一步提出了有条件的高斯分布的一个例子,以提供更多的见解,说明为什么逐渐的AST可以提高GDA的清洁精度。
生成流动网络(GFLOWNETS)最近出现了一类生成模型,是通过从非均衡奖励分布中学习来生成多样化和高质量分子结构的合适框架。以前朝这个方向的工作通常通过使用预定义的分子碎片作为构建块来限制探索,从而限制了可以访问的化学空间。在这项工作中,我们引入了原子Gflownets(A-GFNS),这是一种基本生成模型,利用单个原子作为基础,以更全面地探索类似药物的化学空间。我们使用离线药物样分子数据集提出了一种无监督的预训练方法,该方法在廉价但信息丰富的分子描述符上(例如药物类似性,拓扑极性表面积和合成可及性得分)对A-GFN进行了评论。这些特性是代理奖励,将A-GFN引导到具有理想的药理特性的化学空间区域。我们通过实施目标的微调过程来进一步进一步,该过程适应A-GFN以优化特定目标属性。在这项工作中,我们在锌15离线数据集上预认识了A-GFN,并采用了强大的评估指标来显示与药物设计中其他相关基线方法相比,我们的方法的有效性。
摘要:近年来,变分量子电路 (VQC) 在量子机器学习中的应用大幅增加。VQC 的灵感来自人工神经网络,它作为大规模参数化函数逼近器,在广泛的 AI 任务中实现了非凡的性能。VQC 已经通过利用量子计算中更强大的算法工具箱,在泛化和训练参数要求更少等方面取得了令人鼓舞的成果。VQC 的可训练参数或权重通常用作旋转门中的角度,而当前基于梯度的训练方法并未考虑到这一点。我们引入了 VQC 的权重重新映射,以将权重明确地映射到长度为 2 π 的区间,这从传统 ML 中汲取了灵感,其中数据重新缩放或规范化技术在许多情况下都表现出巨大的好处。我们使用一组五个函数,并以变分分类器为例,在 Iris 和 Wine 数据集上对它们进行评估。我们的实验表明,权重重新映射可以提高所有测试设置中的收敛性。此外,我们能够证明,与使用未修改的权重相比,权重重新映射可将 Wine 数据集的测试准确率提高 10%。