由于沟通成本高,联合学习(FL)系统需要采样每一轮培训的客户的子集。因此,客户采样在FL系统中起着重要作用,因为它影响了用于训练机器学习模型的优化算法的收敛速率。尽管其重要性,但如何有效地对客户进行采样的工作有限。在本文中,我们将客户取样作为在线学习任务,并使用Bandit反馈进行,我们使用在线随机镜下降(OSMD)算法来解决,该算法旨在最大程度地减少采样差异。然后,我们在理论上展示了我们的采样方法如何在广泛使用的均匀采样上提高联合优化算法的收敛速度。通过模拟和实际数据实验,我们从经验上说明了拟议的客户采样算法的优势,而不是统一采样和现有的基于在线学习的采样策略。所提出的自适应采样程序适用于此处研究的FL概率,可用于改善随机优化程序的性能,例如随机梯度下降和随机坐标下降。
摘要-Multi-Access点协调(MAPC)和艺术智能和机器学习(AI/ML)被预计将是未来Wi-Fi的关键特征,例如即将到来的IEEE 80211亿次IEEE(Wi-Fi 8)及以后。在本文中,我们探索了一种基于在线学习的协调解决方案,以驱动空间重复使用(SR)的优化,该方法允许多个设备通过通过数据包检测(PD)调整(PD)调整和传输功率控制来控制干扰来执行同时传输。特别是,我们专注于多代理多武装匪徒(MA-MAB)设置,其中多个决策通过利用MAPC框架并研究各种算法和奖励共享机制来同时通过共存网络配置SR参数。我们使用良好的Wi-Fi模拟器Komondor评估了不同的MA-MAB实现,并证明,通过协调的mAb启用的AI-Native SR可以改善网络性能,而不是当前的Wi-Fi操作:平均吞吐量输入15%,而公平率提高了15%,而通过超过210%的最小访问量增加了最小的遍布量的最小范围,而将最高限制为210%以下MES,则可以提高33%的范围。索引术语 - 兵器,IEEE 802.11,机器学习,多访问点协调,多武器限制,空间重复使用,Wi-Fi
牛津英语词典定义精确医学是“旨在优化特定患者组的效率或治疗性有益的医疗服务,尤其是使用遗传或分子培养。”这并不是一个全新的想法:远古时代的医生已经认识到,医疗需要考虑患者特征的个体变化(Konstantinidou等,2017)。然而,现代的精确医学运动是通过事件的影响来实现的:诸如遗传学和药理学的科学进步,移动设备的技术进步和可穿戴传感器的技术进步以及计算和数据科学方面的方法论进步。本章是关于强盗算法的:与精密医学特殊相关的数据科学领域。的根源是贝尔曼,罗宾斯,莱和其他人的开创性作品,匪徒算法已经占据了现代数据科学的中心位置(请参阅Lattimore和Szepesvári(2020)的书,以进行最新处理)。强盗算法。由于精密药物专注于使用患者特征来指导治疗,因此上下文匪徒算法特别有用,因为它们旨在考虑此类信息。之前已经审查了Bandit算法在移动健康和数字表型等精确医学领域的作用(Tewari和Murphy,2017; Rabbi等,2019)。由于发表了这些评论,因此Bandit算法继续在移动健康中找到使用,并且在有关强盗算法的研究中已经出现了一些新的主题。本章是为诸如统计,机器学习和操作研究等领域的定量研究人员编写的,他们可能有兴趣更多地了解已在移动健康中使用的Bandit算法的算法和数学细节。我们已经组织了本章以实现两个目标。首先,我们要在Bandit算法中简明说明基本主题。第2节将帮助读者熟悉Precision Medicine和Mobile Health的应用工作中经常出现的基本问题设置和算法(例如,参见Paredes等人。(2014); Piette等。(2015); Rabbi等。(2015); Piette等。(2016); Yom-Tov等。(2017); Rindtor Q.等。(2019); Forman等。(2019); Liao等。(2020); Ameko等。(2020); Aguilera等。(2020); Tomkins等。(2021))。第二,我们要重点介绍一些对移动健康和精确药物应用很重要的高级主题,但其全部潜力仍有待实现。第3节将为读者提供有关非平稳性,对损坏的奖励,满足其他限制,算法公平和因果关系的强大的匪徒文献的有用入口。
设计具有靶向特性的分子对于从药物设计到设计可持续化学过程的应用至关重要[Bilodeau等,2022]。最近,诸如扩散或流匹配模型之类的生成模型成功地生成了与现有化学数据集相似的分子[Hoogeboom等,2022,Runcie and Mey,2023]。虽然扩散模型有望对复杂(高维或组合)空间进行采样,但它们自然不会导致设计通过在线反馈来优化特定属性。同时,贝叶斯优化技术会导致良好的性质最大化,但不容易扩展到复杂的域。因此:我们是否可以根据最佳概念结合生成模型产生有希望的分子的能力,同时根据生成分子的序列实现特性进一步证明?我们最近开始通过利用[Yuan等,2024,Uehara等,2024]的扩散模型来回答这个问题,并通过扩散模型为贝叶斯优化设计算法。现在,我们旨在将这些想法专门为实用方法,并在现实世界中的新分子设计问题上进行测试。
摘要 - 我们考虑在随机多臂匪徒中最佳手臂识别的问题,在每个臂在每个回合中进行一次采样的情况。这种统一的抽样制度是一个概念上简单的设置,与许多实际应用相关。目的是停止并正确识别概率至少1 -δ的最佳臂,同时保持低回合的数量。我们在此设置的样品复杂性上得出了一个下限。此后,我们提出了两个自然停止规则,该规则是Bernoulli强盗的:一个基于PPR Martingale置信序列,另一个基于GLR统计数据。两个规则均显示为δ→0匹配。我们的分析和实验表明,两个停止规则的相对性能取决于强盗实例的属性。
摘要 - 班迪斯作为序列学习的理论基础,也是现代收获系统的算法基础。但是,推荐系统通常依赖于用户敏感的数据,从而使隐私成为关键问题。本文有助于理解具有可信赖的集中决策者的土匪的差异隐私(DP),尤其是确保零集中差异隐私(ZCDP)的含义。首先,我们根据考虑的输入和相互作用协议进行形式化和比较DP的不同适应性。然后,我们提出了三种私人算法,即ADAC-UCB,ADAC-GOPE和ADAC-OFUL,用于三个土匪设置,即有限的武装匪徒,线性匪徒和线性上下文匪徒。三种算法共享一个通用算法蓝图,即高斯机制和自适应发作,以确保良好的隐私 - 实用性权衡。我们分析并限制了这三种算法的遗憾。我们的分析表明,在所有这些环境中,与遗憾的遗憾相比,强加了ZCDP的价格(渐近)可以忽略不计。接下来,我们将遗憾的上限与第一个Minimax下界补充了与ZCDP的匪徒的遗憾。为了证明下限,我们阐述了一种基于耦合和最佳运输的新证明技术。我们通过实验验证三种不同的匪徒设置的理论结果来得出结论。索引术语 - 差异隐私,多军匪徒,重新分析,下限
贡献。在本文中,我们系统地研究了近似凸函数优化的量子算法,并将其应用于零阶随机凸老虎机。量子计算是一项快速发展的技术,量子计算机的能力正在急剧提升,最近谷歌 [ 6 ] 和中国科学技术大学 [ 42 ] 已经达到了“量子至上”。在优化理论中,半定规划 [ 3 , 4 , 11 , 12 ]、一般凸优化 [ 5 , 15 ]、优化中的脱离鞍点问题 [ 41 ] 等问题的量子优势已被证明。然而,据我们所知,近似凸优化和随机凸优化的量子算法是广泛开放的。在本文中,我们使用量子零阶评估预言机 OF 来考虑这些问题,这是先前量子计算文献中使用的标准模型 [ 5 , 14 , 15 , 41 ]:
摘要 — 为满足移动用户日益增长的服务期望并避免频段切换速度慢的问题,设备到设备 (D2D) 通信在物联网 (IoT) 中受到了广泛研究关注。虽然新兴的 D2D 节点可以支持异构频段 [射频 (RF),包括 2.4 GHz/5 GHz 无线局域网 (WLAN)、38 GHz 毫米波 (mmWave) 和可见光通信 (VLC)],但物理限制(例如阻塞)要求用户设备在频段之间动态切换,以避免连接丢失和吞吐量下降。在本文中,我们研究了混合 RF-VLC 场景中用于直接用户数据处理的有效在线链路选择。首先,我们将多频段选择问题建模为多臂老虎机 (MAB) 问题。源/中继节点充当玩家,通过选择合适的臂(即可用频段(WLAN、mmWave 或 VLC))来最大化其长期反馈/奖励。然后,我们提出了一种在线、能量感知频段选择 (EABS) 方法,利用三种理论上有保证的 MAB 技术 [置信上限 (UCB)、汤普森采样 (TS) 和极小极大值