量子资源理论 (QRT) 为理解在量子信息处理中充当资源的固有量子力学属性提供了一个统一的理论框架,但由物理驱动的资源可能具有数学上难以分析的结构,例如最大资源状态的非唯一性、缺乏凸性和无限维度。我们在最小假设下研究一般 QRT 中的状态转换和资源度量,以找出物理驱动的量子资源的普遍属性,这些资源可能具有这种数学结构,其分析是难以处理的。在一般设置中,我们证明了一次性状态转换中最大资源状态的存在。同样通过分析渐近状态转换,我们发现了量子资源的催化复制,其中资源状态可以通过自由操作无限复制。在不假设最大资源状态唯一性的 QRT 中,我们制定了量子资源的提炼和形成任务,并分别基于提炼和形成引入了可提炼资源和资源成本。此外,我们引入了一致的资源度量来量化量子资源的数量,而不会与状态转换率相矛盾,即使在具有非唯一最大资源状态的 QRT 中也是如此。在先前的工作的基础上,我们展示了加性资源度量的唯一性定理,证明了一致资源度量的相应唯一性不等式;也就是说,量子状态的一致资源度量取值介于可提炼资源和状态的资源成本之间。这些公式和结果建立了
可靠的相同(不可区分)光子源是利用干涉效应的先决条件,而干涉效应是基于线性光学的量子计算及其应用(如玻色子采样)的必要组成部分。一般而言,可区分程度将决定特定方法的有效性,例如通过限制构造资源状态的保真度,或降低光学电路输出分布的复杂性。因此,设计高纯度和不可区分的光子源具有重要的实际意义。受魔法状态蒸馏的启发,我们提出了一种使用标准线性光学的协议,该协议可用于将光子源的不可区分性提高到任意精度。特别是,在小误差 ϵ 的渐近极限下,要将误差降低到 ϵ ′ < ϵ 需要 O (( ϵ/ϵ ′ ) 2 ) 个光子。我们证明该方案对光学元件中的检测和控制误差具有鲁棒性,并讨论了其他误差源的影响。
1 北京大学计算前沿研究中心,北京 100871,中国 2 北京大学计算机学院,北京 100871,中国 3 数学量子信息 RIKEN Hakubi 研究团队,RIKEN 先驱研究集群 (CPR) 和 RIKEN 量子计算中心 (RQC),日本埼玉县和光市 351-0198,日本 4 东京大学研究生院物理学系,东京文京区 113-0033,日本 5 东京大学基础科学系,东京 153-8902,日本 6 南洋理工大学物理与数学科学学院南洋量子中心,21 Nanyang Link,637371,新加坡 7 新加坡国立大学量子技术中心,3 Science Drive 2,117543,新加坡 8 CNRS-UNS-NUS-NTU 国际联合研究单位,UMI 3654,新加坡 117543,新加坡
1 东京大学基础科学系,东京 153-8902,日本 2 南洋理工大学数理科学学院南洋量子中心,新加坡 637371,新加坡 3 北京大学前沿计算研究中心,北京 100871,中国 4 北京大学计算机学院,北京 100871,中国 5 数学量子信息 RIKEN Hakubi 研究团队,RIKEN 先驱研究集群,以及 RIKEN 量子计算中心,埼玉县和光市 351-0198,日本 6 东京大学研究生院物理学系,东京文京区 113-0033,日本 7 新加坡国立大学量子技术中心,新加坡科学路 2 号 3 号,新加坡 117543,新加坡 8 CNRS-UNS-NUS-NTU 国际联合研究单位,UMI No. 3654,新加坡 117543,新加坡
GPT-2模型体系结构。GPT-2模型包含N变压器解码器块,如左图所示。每个解码器块(中心面板)包括一个多头蒙版的注意层,一个多层感知层,归一化和辍学层。剩余连接(与加法操作员的分支线)允许该块从上一个块的输入中学习。使用Q,K和V向量计算出注意力层(右图),以捕获输入序列中的顺序关系。
存在强化学习之类的应用,例如医学,其中政策需要被人类“解释”。用户研究表明,某些政策类可能比其他政策类更容易解释。但是,进行人类的政策解释性研究是昂贵的。此外,没有明确的解释性定义,即没有明确的指标来解释性,因此主张取决于所选的定义。我们解决了通过人类解释性的经验评估政策的问题。尽管缺乏明确的定义,但研究人员对“模拟性”的概念达成了共识:政策解释性应与人类如何理解所给出的政策行动有关。为了推进可解释的强化学习研究,我们为评估政策解释性做出了新的方法。这种新方法依赖于代理来进行模拟性,我们用来对政策解释性进行大规模的经验评估。我们使用模仿学习来通过将专家神经网络提炼为小程序来计算基线政策。然后,我们表明,使用我们的方法来评估基准解释性会导致与用户研究相似的结论。我们表明,提高可解释性并不一定会降低表现,有时会增加它们。我们还表明,没有政策类别可以更好地跨越各个任务的可解释性和绩效进行交易,这使得研究人员有必要拥有比较政策可解释性的方法。
摘要:药用植物在世界许多地方的制药行业中以多种方式用于获取药物。它们传统上尤其在发展中国家使用,在那里它们提供具有成本效益的治疗方法。然而,准确识别药用植物可能具有挑战性。本研究使用深度神经网络和知识提炼方法,该方法基于 8 种基于叶子的埃塞俄比亚药用植物的 4,026 张图像数据集。来自 ResNet50 教师模型的知识被应用于轻量级 2 层学生模型。针对效率进行优化的学生模型实现了 96.91% 的准确率,并且接近教师模型在未见测试数据上的 98.98% 的准确率。训练建立在优化策略之上,包括过采样、数据增强和学习率调整。为了理解模型的决策,我们使用了 LIME(局部可解释模型无关解释)和 Grad-CAM(梯度加权类激活映射)事后解释技术来突出显示对分类有贡献的有影响的图像区域。
我们提出了用于制备 Greenberger-Horne-Zeilinger (GHZ) 状态的优化提炼方案。我们的方法依赖于以受白噪声影响的 GHZ 状态作为输入来训练变分量子电路。通过对该方案进行一次迭代优化,我们发现可以提高 GHZ 状态的保真度,尽管进一步迭代会降低保真度。同样的方案,作用于相干失真的纯态输入,仅在某些特殊情况下有效。然而,我们表明,当在协议的两次迭代后优化输出时,可以实现截然不同的结果。在这种情况下,获得的方案在从受白噪声影响的输入中提炼 GHZ 状态方面更有效。此外,它们还可以纠正几种类型的相干纯态误差。
视觉模态是当前连续情绪识别方法中最主要的模态之一。与视觉模态相比,EEG 模态由于其固有的局限性(例如主体偏见和低空间分辨率)而相对不太可靠。这项工作尝试利用来自视觉模态的暗知识来改善 EEG 模态的连续预测。教师模型由级联卷积神经网络-时间卷积网络 (CNN-TCN) 架构构建,学生模型由 TCN 构建。它们分别由视频帧和 EEG 平均频带功率特征输入。采用两种数据划分方案,即试验级随机分流 (TRS) 和留一主体剔除 (LOSO)。独立的老师和学生可以产生优于基线方法的连续预测,并且使用视觉到 EEG 跨模态 KD 进一步改善了预测,具有统计显著性,即 TRS 的 p 值 < 0.01 和 p 值 < 0。 05 用于 LOSO 分区。训练后的学生模型的显着性图显示,与活跃价态相关的大脑区域并不位于精确的大脑区域。相反,它来自各个大脑区域之间的同步活动。与其他波段相比,频率为 18 − 30 Hz 和 30 − 45 Hz 的快速 beta 和 gamma 波对人类情绪过程的贡献最大。代码可在 https://github.com/sucv/Visual _ to _ EEG _ Cross _ Modal _ KD _ for _ CER 获得。
深度卷积神经网络的成功部分归功于海量带注释的训练数据。然而在实践中,获取医疗数据注释通常非常昂贵且耗时。考虑到具有相同解剖结构的多模态数据在临床应用中广泛可用,在本文中,我们旨在利用从一种模态(又称辅助模态)学到的先验知识(例如形状先验)来提高另一种模态(又称目标模态)的分割性能,以弥补注释的稀缺性。为了缓解由模态特定外观差异引起的学习困难,我们首先提出一个图像对齐模块(IAM)来缩小辅助和目标模态数据之间的外观差距。然后,我们提出了一种新颖的相互知识蒸馏(MKD)方案,以充分利用模态共享知识来促进目标模态分割。具体来说,我们将我们的框架制定为两个独立分割器的集成。每个分割器不仅从相应的注释中显式提取一种模态知识,而且还以相互引导的方式从其对应部分中隐式探索另一种模态知识。两个分割器的集合将进一步整合来自两种模态的知识,并在目标模态上生成可靠的分割结果。在公共多类心脏分割数据(即 MM-WHS 2017)上的实验结果表明,我们的方法通过利用额外的 MRI 数据在 CT 分割方面取得了很大的改进,并且优于其他最先进的多模态学习方法。