摘要 — 掩模优化是先进技术节点 VLSI 制造过程中的重要步骤。作为最具代表性的技术之一,光学邻近校正 (OPC) 被广泛应用于提高可印刷性。由于传统 OPC 方法消耗的计算开销过大,近期研究已将机器学习技术应用于高效的掩模优化。然而,现有的判别学习模型依赖给定的数据集进行监督训练,而生成学习模型通常利用代理优化目标进行端到端学习,这可能会限制可行性。在本文中,我们率先引入了用于掩模优化的强化学习 (RL) 模型,该模型无需利用可微代理即可直接优化首选目标。大量实验表明,我们的方法优于最先进的解决方案,包括学术方法和商业工具包。
摘要 — 掩模优化是先进技术节点 VLSI 制造过程中的重要步骤。作为最具代表性的技术之一,光学邻近校正 (OPC) 被广泛应用于提高可印刷性。由于传统 OPC 方法消耗的计算开销过大,近期研究已将机器学习技术应用于高效的掩模优化。然而,现有的判别学习模型依赖给定的数据集进行监督训练,而生成学习模型通常利用代理优化目标进行端到端学习,这可能会限制可行性。在本文中,我们率先引入了用于掩模优化的强化学习 (RL) 模型,该模型无需利用可微代理即可直接优化首选目标。大量实验表明,我们的方法优于最先进的解决方案,包括学术方法和商业工具包。
摘要:随着信息技术的快速发展,恶意软件已成为高级网络安全威胁,针对计算机系统,智能设备和大规模网络实时。传统检测方法通常由于准确性,适应性和响应时间的限制而无法识别出新的恶意软件变体。本文对实时恶意软件检测的机器学习算法进行了全面综述,并根据其方法和有效性对现有方法进行了分类。该研究研究了最新进步,并评估了各种机器学习技术在以最小的假阳性和提高可伸缩性检测恶意软件时的性能。此外,还讨论了关键挑战,例如对抗性攻击,计算开销和实时处理约束,以及潜在的解决方案以增强检测能力。进行了经验评估,以评估不同机器学习模型的有效性,为实时恶意软件检测的未来研究提供了见解。
分布式量子计算是一种很有前途的计算范式,可用于执行超出单个量子设备能力范围的计算。分布式量子计算中的隐私对于在存在不受信任的计算节点的情况下保持机密性和保护数据至关重要。在这项工作中,我们引入了基于量子二分相关器算法的新型盲量子机器学习协议。我们的协议减少了通信开销,同时保护了不受信任方的数据隐私。我们引入了强大的特定于算法的隐私保护机制,其计算开销低,不需要复杂的加密技术。然后,我们通过复杂性和隐私分析验证了所提协议的有效性。我们的发现为分布式量子计算的进步铺平了道路,为量子技术时代的隐私感知机器学习应用开辟了新的可能性。
毫米波小细胞与定向光束形成的密集部署是一种有前途的解决方案,可增强当前无线通信的净工作能力。但是,毫米波通信链路的可靠性可能会受到严重的路径,阻塞和耳聋的影响。作为一种款项,移动用户受到频繁的交接,这会限制用户吞吐量和移动终端的电池寿命。为了解决这个问题,我们的论文提出了一个深层的多代理控制学习框架,用于分布式移交管理,称为Rhando(增强移交)。我们将用户建模为代理商,他们在考虑相关成本的同时,学习如何执行移交以通过网络优化网络。所提出的SOUTIOT已完全分布,从而限制了信号传导和计算开销。数值结果表明,与传统方案相比,所提出的解决方案可以提供更高的吞吐量,同时大大限制了移交的频率。
分布式量子计算是一种很有前途的计算范式,可用于执行超出单个量子设备能力范围的计算。分布式量子计算中的隐私对于在存在不受信任的计算节点的情况下保持机密性和保护数据至关重要。在本信中,我们介绍了基于量子二分相关器算法的新型盲量子机器学习协议。我们的协议减少了通信开销,同时保护了不受信任方的数据隐私。我们引入了强大的特定于算法的隐私保护机制,其计算开销低,不需要复杂的加密技术。然后,我们通过复杂性和隐私分析验证了所提协议的有效性。我们的发现为分布式量子计算的进步铺平了道路,为量子技术时代的隐私感知机器学习应用开辟了新的可能性。
同态加密代表了一种通过启用计算直接在加密数据上执行的无需解密的转换方法来保护云计算的方法。本研究探讨了同构加密方案的潜力,以增强云存储的安全性和隐私性和敏感信息的处理。通过在整个计算过程中维护数据加密,同态加密可确保敏感数据仍然可以保护未经授权的访问和漏洞,即使在云环境中也是如此。该研究研究了各种同态加密技术,评估了其现实应用应用的性能,可伸缩性和实用性。此外,它解决了计算开销和实施复杂性等挑战,提出了解决方案,以优化和简化云计算中同构加密的使用。这项研究强调了在越来越多的云依赖的数字景观中推进加密技术以维护数据隐私的重要性。
一致性模型,该模型是为了减轻不同使用模型的采样阶段来减轻高计算开销的,在达到最先进的经验性能的同时,促进了单步抽样。集成到训练阶段时,一致性模型试图训练一系列一致性函数,能够在扩大过程的任何时间步长将任何点映射到其起点。尽管取得了经验成功,但对一致性培训的全面理论理解仍然难以捉摸。本文朝着建立一致性模型的理论基础迈出了第一步。我们证明,为了在分布中生成ε接近性的样品(通过某些Wasserstein Metric测量),它可以使用一致性学习的步骤数,以超过D 5 {2 {ε的顺序,并带有D数据维度。我们的理论对一致性模型的有效性和效率进行了严格的见解,从而阐明了它们在下游推理任务中的效用。
从人类反馈中学习(RLHF)已成为一种至关重要的方法,可以通过诸如近端政策优化(PPO),直接偏好优化(DPO)等方法来使大型语言模型与人类偏好相结合,见证了快速的算法进化,增强了Oneforce One-Out Out-Out Out Ont-Out(Rloo)(RLOO),Remax,Remax,Remax和Group Oppers Policy Optimation(GRPO)(GRP)(GRPO)。我们提出了增强++,这是经典增强算法的增强变体,该变体融合了PPO中的关键优化技术,同时消除了对评论家网络的需求。增强++实现了三个主要目标:(1)简单性(2)增强的训练稳定性,以及(3)减少了计算开销。通过广泛的经验评估,我们证明,与GRPO相比,增强++在保持可比性能的同时,具有比PPO更高的计算效率表现出卓越的稳定性。该实现可在https://github.com/openrlhf/openrlhf上获得。
现有的文本到图像生成模型反映甚至扩大了其培训数据中根深蒂固的社会偏见。这对于人类图像发生尤其关注,其中模型与某些人口统计组有偏见。现有的纠正此问题的尝试受到预训练模型的固有局限性的阻碍,并且无法实质上改善人口多样性。在这项工作中,我们引入了公平检索增强生成(Fairrag),这是一个新颖的框架,该框架对从外部图像数据库中检索到的参考图像进行了预训练的生成模型,以改善人类发电机的公平性。Fairrag可以通过轻质线性模块进行调节,该模块将图像投入到Textual空间中。为了提高公平性,Fairrag应用了简单但有效的借鉴策略,在生成过程中提供了来自Di-Verse人群的图像。广泛的实验表明,Fairrag在人口统计学多样性,图像文本比对和图像保真度方面构成了现有方法,同时在推断过程中产生了最小的计算开销。