最近的研究表明,变压器可以通过模仿现有的RL算法来执行内在的增强学习(RL),从而使样本有效的适应能够适应无参数更新而无需看到的任务。但是,这些模型还继承了它们模仿的RL算法的次优行为。由于这些算法采用的逐渐更新规则,因此出现了此问题。基于模型的计划通过允许模拟在采取行动之前模拟潜在结果,提供了一种额外的机制来偏离次优行为,从而为这种限制提供了有希望的解决方案。我们没有学习Sepa-Rate Dynamics模型,而是提出了基于信用的RL框架(DICP)的蒸馏(DICP),在其中,变压器同时学习环境动力学并改善策略,并在内部进行改善。我们评估了跨多种离散和连续环境(包括暗室变体和元世界)的DICP。我们的结果表明,与基准相比,DICP可以达到最先进的性能,同时需要的环境相互作用要少得多,基本线包括无模型的对应物和现有的Meta-RL方法。该代码可在https://github.com/jaehyhyeon-son/dicp上获得。
6.8.2.2.3 基于 RAN 的通知区域更新到同一个 gNB/ng-eNB .......................................................................... 75 6.9 移动性中的安全处理 ............................................................................................................................. 75 6.9.1 一般规定 ............................................................................................................................................. 75 6.9.2 切换中的密钥处理 ............................................................................................................................. 75 6.9.2.1 一般规定 ............................................................................................................................................. 75 6.9.2.1.1 接入层 ............................................................................................................................................. 75 6.9.2.1.2 非接入层 ............................................................................................................................................. 77 6.9.2.2 上下文修改过程的密钥派生 ............................................................................................................. 77 6.9.2.3 切换期间的密钥派生 ............................................................................................................................. 77 6.9.2.3.1 gNB-CU 内切换和ng-eNB 内切换 ................................................................................................ 77 6.9.2.3.2 Xn 切换 .................................................................................................................................... 78 6.9.2.3.3 N2 切换 .................................................................................................................................... 78 6.9.2.3.4 UE 处理 ............................................................................................................................................. 80 6.9.3 移动性注册更新中的密钥处理 ............................................................................................................. 81 6.9.4 动态密钥更改 ............................................................................................................................................. 82 6.9.4.1 常规 ............................................................................................................................................. 82 6.9.4.2 NAS 密钥重新密钥化 ............................................................................................................................. 83 6.9.4.3 NAS 密钥刷新 ............................................................................................................................. 83 6.9.4.4 AS 密钥重新密钥化........................................................................................................................... 83 6.9.4.5 AS 键刷新 ..................................................................................................................................................................................................................................... 84 6.9.5 安全程序并发运行规则 .................................................................................................................... 84 6.9.5.1 与 AS 和 NAS 安全上下文同步相关的规则 ........................................................................................ 84 6.9.5.2 与并行 NAS 连接相关的规则 ............................................................................................................. 85 6.9.6 通过直接 NAS 重新路由在 AMF 重新分配注册中的安全处理 ............................................................. 85 6.10 双连接 ............................................................................................................................................. 85 6.10.1 简介 ............................................................................................................................................. 85 6.10.1.1 一般 ............................................................................................................................................. 85 6.10.1.2 具有 5GC 的 MR-DC 的双连接协议架构 ............................................................................. 85 6.10.2 DC 的安全机制和程序 ............................................................................................................. 86 SN 增加或修改 ................................................................................................................................................ 86 6.10.2.2 次节点密钥更新 ...................................................................................................................................... 88 6.10.2.2.1 概述 ................................................................................................................................................ 88 6.10.2.2.2 MN 发起 ............................................................................................................................................. 88 6.10.2.2.3 SN 发起 ............................................................................................................................................. 88 6.10.2.3 SN 发布和变更 ............................................................................................................................................. 88 6.10.3 建立 UE 和 SN 之间的安全上下文 ............................................................................................................. 88 6.10.3.1 SN 计数器维护 ................................................................................................................................ 88 6.10.3.2 密钥导出 ............................................................................................................................................. 89 6.10.3.3 安全算法协商......................................................................................................... 89 6.10.4 UE 和 SN 之间的流量保护.................................................................................................................... 89 6.10.5 切换程序 .............................................................................................................................................. 90 6.10.6 PDCP COUNT 检查的信令程序......................................................................................................................... 90 6.10.7 无线链路故障恢复 ...................................................................................................................................... 91 6.11 RRC 连接重建程序的安全处理 ............................................................................................................. 91 6.12 签约标识符隐私 ...................................................................................................................................... 92 6.12.1 签约永久标识符 ................................................................................................................................ 92 6.12.2 签约隐藏标识符 ................................................................................................................................ 93 6.12.3 签约临时标识符 ................................................................................................................................ 94 6.12.4 签约识别程序 ................................................................................................................................ 94 6.12.5 签约标识符解密功能(SIDF)................................................................................................................ 95 6.13 PDCP COUNT 检查的信令程序 .......................................................................................................................... 95 6.14 漫游安全机制的指导 ...................................................................................................................................... 96 6.14.1 概述 ...................................................................................................................................................... 96 6.14.2 安全机制 ............................................................................................................................................. 96 6.14.2.1 注册期间 UE 在 VPLMN 中的指导程序 ............................................................................................. 96 6.14.2.2 注册后 UE 在 VPLMN 中的指导程序 ............................................................................................. 98 6.14.2.3 SoR 计数器 ............................................................................................................................................. 100 6.15 通过 UDM 控制平面程序安全机制更新 UE 参数 ............................................................................................. 100 6.15.1 概述 ........................................................................................................................................................................................................... 100 6.15.2 安全机制 ...................................................................................................................................... 101 6.15.2.1 UE 参数更新程序 ...................................................................................................................... 101 6.15.2.2 UE 参数更新计数器 ................................................................................................................ 102
摘要:遗传算法(GA)比其他方法(例如梯度下降或随机搜索)更有用,尤其是对于具有许多局部最小值和Maxima的非不同的函数,例如梯度下降或随机搜索。标准GA方法的缺点之一是需要设置许多超参数,并且基于复杂规则而不是更直观的模糊规则,选择压力是基于复杂的规则。通过模糊逻辑调整此类参数的遗传算法的变体,以使参数更新原理更容易解释,构成模糊遗传算法(FGAS)的类别。本文提出了对具有N个特性和自动生成规则的两个相对模糊遗传算法(FGA)的修改,以及旨在改善模拟运行时的计算优化。在基准功能(Ackley,Griewank,Rastrigin和Schwefel)上评估了修改,并且选择了每个修改方法的最佳设置(即成员资格功能,术语数,T-norm和t-conorm)。将结果与标准GA和粒子群优化(PSO)进行了比较。结果表明,FGA方法可以使用缓存和最近的邻居方法进行优化,而不会失去准确性和收敛性。证明这两种修改后的方法在统计学上的表现明显比基线方法差。结果,我们提出了对现有两种算法的两种优化:通过缓存和测试其性能,通过规则生成和最近的邻居估算进行外推。
在动态环境中运行的边缘设备迫切需要能够持续学习而不会发生灾难性遗忘。这些设备中严格的资源限制对实现这一目标构成了重大挑战,因为持续学习需要内存和计算开销。使用忆阻器设备的交叉开关架构通过内存计算提供能源效率,并有望解决此问题。然而,忆阻器在电导调制中通常表现出低精度和高可变性,这使得它们不适合需要精确调制权重大小以进行整合的持续学习解决方案。当前的方法无法直接解决这一挑战,并且依赖于辅助高精度内存,导致频繁的内存访问、高内存开销和能量耗散。在这项研究中,我们提出了概率元可塑性,它通过调节权重的更新概率而不是大小来整合权重。所提出的机制消除了对权重大小的高精度修改,从而消除了对辅助高精度内存的需求。我们通过将概率元可塑性集成到以低精度忆阻器权重在错误阈值上训练的脉冲网络中,证明了所提机制的有效性。持续学习基准的评估表明,与基于辅助内存的解决方案相比,概率元可塑性实现了与具有高精度权重的最先进的持续学习模型相当的性能,同时用于附加参数的内存消耗减少了约 67%,参数更新期间的能量消耗减少了约 60 倍。所提出的模型显示出使用低精度新兴设备进行节能持续学习的潜力。
联合学习(FL)包括用于机器学习的分散培训算法的家族[1] - [3],使内部分裂能够在不集中培训数据的情况下协作训练模型。这种方法通过将培训计算分配到边缘来减轻数据中心的计算负担。但是,至关重要的是要注意,尽管联邦学习提供了一个分散的框架,但它可能无法继承客户的隐私。中央服务器收到的更新有可能无意间揭示有关客户培训数据的信息[4],[5]。保护客户对联合学习的隐私的流行策略包括基于差异的隐私(DP)和基于同型加密(HE)方法。DP的想法是在梯度上添加噪音,以保护梯度的保密性[6]。基于DP的学习算法的现有作品包括本地DP(LDP)[7],具有选择性参数更新[8],基于晶格[9]等的DP等。尽管可以直接采用DP,但它具有较弱的隐私保证和潜在准确性损失的缺点。他是一种加密技术,可以在加密数据上执行计算,而无需首先解密。在联邦学习的背景下,同构加密在确保个别参与者数据的隐私方面起着至关重要的作用。由于FL中的梯度的聚集仅涉及添加,因此许多最近的作品[10],[11]提议采用基于Paillier [12]的加性同构加密。某些基于晶格的问题,例如但是,一旦可以使用Shor的量子算法有效地将大整数构成大型整数[13],Paillier的安全性就会损坏。基于晶格的密码学被认为是抗量子的[14] - [16]。
尽管向量是计算编码单词含义最常用的结构,但它们无法表示对潜在含义的不确定性。模糊词可以通过其各种可能含义的概率分布来最好地描述。将它们放在上下文中应该可以消除其含义的歧义。同样,词汇蕴涵关系也可以使用概率分布来表征。然后,将层次顺序中较高位置的单词建模为其所包含单词含义的概率分布。DisCoCat 模型受到量子理论数学结构的启发,提出密度矩阵作为能够捕捉这种结构的词嵌入。在量子力学中,它们描述的是状态仅以不确定性已知的系统。初步实验已经证明了它们能够捕捉单词相似性、单词歧义性和词汇蕴涵结构。Word2Vec 模型的改编版 Word2DM 可以学习这种密度矩阵词嵌入。为了确保学习到的矩阵具有密度矩阵的属性,该模型学习中间矩阵并从中导出密度矩阵。这种策略导致参数更新不是最优的。本论文提出了一种用于学习密度矩阵词嵌入的混合量子-经典算法来解决这个问题。利用密度矩阵自然描述量子系统的事实,不需要中间矩阵,理论上可以规避经典 Word2DM 模型的缺点。变分量子电路的参数经过优化,使得量子比特的状态与单词的含义相对应。然后提取状态的密度矩阵描述并将其用作词嵌入。为词汇表中每个单词学习一组与其密度矩阵嵌入相对应的单独参数。在本论文中,已经在量子模拟器上执行了第一次实现。所利用的目标函数减少了同时出现的单词之间的距离,并增加了不同时出现的单词之间的距离。因此,可以通过评估学习到的词向量的相似性来衡量训练的成功程度。该模型是在词汇量较小的文本语料库上进行训练的。学习到的词向量显示了文本中单词之间的预期相似性。我们还将讨论在真实量子硬件上的实现问题,例如提取完整的状态表示和计算该模型的梯度。
1。Zuraw BL。遗传性血管性水肿。NEJM 2008; 359(10):1027-1036。2。tse K,Zuraw BL,认可和管理遗传性血管性水肿。克利夫兰诊所医学杂志2013; 80(5):297-308。3。Zuraw B,Farkas H.遗传性血管性水肿:流行病学,临床表现,加剧因素和预后。在saini s(ed)中。uptodate [Internet上的数据库]。沃尔瑟姆(MA):上升; 2022 [引用2022年2月]。可从:http://www.utdol.com/utd/index.do获得。4。Xu Y,Buyantseva LV,Agarwal NS,Olivieri K,Zhi YX,Craig TJ。有关遗传性血管性水肿的治疗更新。临床和实验过敏2013; 43:395-405。5。Maurer M,Magerl M,Ansotegui I等。国际WAO/EAACI遗传性血管性水肿管理指南 - 2017年修订和更新。过敏。2018年8月; 73(8):1575-1596。6。美国遗传性血管性水肿协会。hae症状[互联网上的网页]檀香山(HI):美国遗传性血管性水肿协会; (2018)[引用2021年4月29日]。可从以下网站获得:https://www.haea.org/symptoms.php。7。美国遗传性血管性水肿协会。HAE攻击触发器[互联网上的网页]檀香山(HI):美国遗传性血管性水肿协会; (2021)[引用2021年4月29日]。可从以下网站获得:https://www.haea.org/triggers.php。8。在saini s(ed)中。uptodate [Internet上的数据库]。Zuraw B,Farkas H.遗传性血管性水肿(由于C1抑制剂缺乏):一般护理和长期预防。沃尔瑟姆(MA):上升; 2022 [引用2022年2月]。可从:http://www.utdol.com/utd/index.do获得。9。Orladeyo®[包装插入]。 达勒姆(NC):Biocryst Pharmaceuticals,Inc。 2020年12月10日。 Cicardi M,Bork K,Caballero T,Craig T,Li HH,Longhurst H等。 基于循证的关于遗传性C1抑制剂缺乏的血管性水肿治疗管理的建议:国际工作组的共识报告。 欧洲过敏和临床免疫学杂志。 2012; 67:147-157 11。 19。 Gompels MM,Lock RJ,Abinum M,Bethune CA,Davies G,Grattan C等。 C1抑制剂缺乏:共识文件。 Clin Exp Immunol 2005; 141(1):189-90。 12。 20。 Zuraw BL,Bernstein JA,Lang DM,Craig T,Dreyfus D,Hsieh F等。 聚焦参数更新:遗传性血管性水肿,获得的C1抑制剂缺乏和血管紧张素转化酶抑制剂 - 相关血管性水肿。 J Allergy Clin Immunol 2013; 131(6):1491-3。 13。 21。 Bowen T,Cicardi M,Farkas H,Bork K,Longhurst HJ,Zuraw B等。 2010年国际共识算法用于遗传性血管性水肿的诊断,治疗和管理。 过敏,哮喘和临床免疫学2010; 6:24-36。 14。 22。 Busse PJ,Christiansen SC,Riedl MA,Banerji A,Bernstein JA,Castaldo AJ等。 2021 JAN; 9(1):132-150.e3。 有效07/01/2021。Orladeyo®[包装插入]。达勒姆(NC):Biocryst Pharmaceuticals,Inc。 2020年12月10日。Cicardi M,Bork K,Caballero T,Craig T,Li HH,Longhurst H等。基于循证的关于遗传性C1抑制剂缺乏的血管性水肿治疗管理的建议:国际工作组的共识报告。欧洲过敏和临床免疫学杂志。2012; 67:147-157 11。19。Gompels MM,Lock RJ,Abinum M,Bethune CA,Davies G,Grattan C等。C1抑制剂缺乏:共识文件。Clin Exp Immunol 2005; 141(1):189-90。12。20。Zuraw BL,Bernstein JA,Lang DM,Craig T,Dreyfus D,Hsieh F等。聚焦参数更新:遗传性血管性水肿,获得的C1抑制剂缺乏和血管紧张素转化酶抑制剂 - 相关血管性水肿。J Allergy Clin Immunol 2013; 131(6):1491-3。13。21。Bowen T,Cicardi M,Farkas H,Bork K,Longhurst HJ,Zuraw B等。2010年国际共识算法用于遗传性血管性水肿的诊断,治疗和管理。过敏,哮喘和临床免疫学2010; 6:24-36。14。22。Busse PJ,Christiansen SC,Riedl MA,Banerji A,Bernstein JA,Castaldo AJ等。2021 JAN; 9(1):132-150.e3。有效07/01/2021。美国海亚医疗咨询委员会2020年遗传性血管性水肿的指南。审查历史记录05/19/2021 - 创建和审查的可能是P&T。