投资组合管理(PM)是一项基本的金融贸易任务,它探讨了首都最佳定期重新分配到不同股票中以追求长期利润。强化学习(RL)最近显示了通过与金融市场互动来培训PM的盈利代理的潜力。但是,现有工作主要集中在固定股票上,这与投资者的实际需求不一致。具体来说,不同投资者的目标股票库差异很大,因为他们在市场国家和个别投资者上的差异可能会暂时调整他们希望进行交易的股票(例如,增加了一个受欢迎的股票),这会导致可自定义的股票库(CSP)。现有的RL方法可以重新验证RL代理,即使库存库发生了很小的变化,这会导致高计算成本和不稳定的性能。为了应对这一挑战,我们建议通过在全球股票库(GSP)中的一次性培训(GSP)中的一次射击培训,这是一个带有可掩盖股票代表的强化学习框架。具体来说,我们首先引入一种机制来掩盖目标池外部股票的表示。第二,我们通过自我监督的掩盖和重建过程学习有意义的股票表示。第三,重新加权的机械旨在使投资组合集中于有利的股票,并忽略了目标池外的股票。代码可在Pytorch 1中找到。通过对美国股票市场的8个子集库存库进行的实验实验,我们证明,在6个受欢迎的金融指标方面,Eartor的表现明显胜过14个州的总体基线,利润超过40%。
摘要 - 由于高级集成电路的特征大小不断收缩,因此分辨率增强技术(RET)被利用来改善光刻过程中的可打印性。光学接近校正(OPC)是旨在补偿面罩以生成更精确的晶圆图像的最广泛使用的RET之一。在本文中,我们提出了一种基于级别的OPC方法,具有高面膜优化质量和快速收敛。为了抑制光刻过程中条件爆发的干扰,我们会提供一个新的过程窗口感知的成本函数。然后,采用了一种新颖的基于动量的进化技术,该技术取得了重大改进。我们还提出了一种自适应共轭梯度方法,该方法有望具有更高的优化稳定性和更少的消耗时间。此外,图形过程(GPU)被利用用于加速所提出的算法。我们将输出掩码从机器学习基于掩码优化流中作为输入和工作作为重新定位掩码的后过程。ICCAD 2013基准测试的实验结果表明,我们的算法在解决方案质量和运行时开销中均优于以前的所有OPC算法。
摘要 - 由于高级集成电路的特征大小不断收缩,因此分辨率增强技术(RET)被利用来改善光刻过程中的可打印性。光学接近校正(OPC)是旨在补偿面罩以生成更精确的晶圆图像的最广泛使用的RET之一。在本文中,我们提出了一种基于级别的OPC方法,具有高面膜优化质量和快速收敛。为了抑制光刻过程中条件爆发的干扰,我们会提供一个新的过程窗口感知的成本函数。然后,采用了一种新颖的基于动量的进化技术,该技术取得了重大改进。我们还提出了一种自适应共轭梯度方法,该方法有望具有更高的优化稳定性和更少的消耗时间。此外,图形过程(GPU)被利用用于加速所提出的算法。我们将输出掩码从机器学习基于掩码优化流中作为输入和工作作为重新定位掩码的后过程。ICCAD 2013基准测试的实验结果表明,我们的算法在解决方案质量和运行时开销中均优于以前的所有OPC算法。
由于数据集较小且难以获取标签,使用机器学习从 EEG 等生物信号中解码信息一直是一项挑战。我们提出了一种基于重建的自监督学习模型,即 EEG 的掩蔽自动编码器 (MAEEG),通过学习使用 Transformer 架构重建掩蔽的 EEG 特征来学习 EEG 表示。我们发现,当仅给出少量标签时,MAEEG 可以学习显着改善睡眠阶段分类的表示(准确率提高约 5%)。我们还发现,基于重建的 SSL 预训练期间的输入样本长度和不同的掩蔽方式对下游模型性能有很大影响。具体而言,学习重建更大比例和更集中的掩蔽信号可带来更好的睡眠分类性能。我们的研究结果深入了解了基于重建的 SSL 如何帮助 EEG 的表征学习。
自监督预训练技术在 Document AI 中取得了显著进展。大多数多模态预训练模型使用掩码语言建模目标来学习文本模态的双向表示,但它们在图像模态的预训练目标上有所不同。这种差异增加了多模态表示学习的难度。在本文中,我们提出了 LayoutLMv3,以统一的文本和图像掩码来预训练用于 Document AI 的多模态 Transformer。此外,LayoutLMv3 还使用词块对齐目标进行预训练,通过预测文本词的相应图像块是否被掩码来学习跨模态对齐。简单的统一架构和训练目标使 LayoutLMv3 成为以文本为中心和以图像为中心的 Document AI 任务的通用预训练模型。实验结果表明,LayoutLMv3 不仅在以文本为中心的任务(包括表单理解、收据理解和文档视觉问答)中取得了最佳性能,而且在以图像为中心的任务(例如文档图像分类和文档布局分析)中也取得了最佳性能。代码和模型可在 https://aka.ms/layoutlmv3 上公开获取。