决策问题通常被建模为马尔可夫决策过程(MDP),在线学习者依次与未知环境进行互动以获得大量的预期累积奖励。在文献中提出了许多没有任何约束(因此允许自由探索任何州行动对)的RL算法(因此可以自由探索任何州行动对)(Azar et al。,2017年; Jin等。,2018年; Agarwal等。,2019年; Jin等。,2020年; Jia等。,2020年;周等人。,2021b;他等人。,2022)。以外,现有的“安全” RL算法通常是在需要预期累积的约束下设计的,2019年; Brantley等。,2020年;丁等。,2021; Pa-Ternain等。,2022)(请参阅第1.2节中的更多相关工作)。因此,必须避免在每个时间/步骤中避免不安全状态和动作的实际情况。
引言增强学习(RL)在改善各种应用程序中的在线决策方面表现出了很大的成功(包括游戏)(Silver等人2017),机器人控制(Andrychowicz等人。2020)等。但是,在许多实际情况下,必须考虑不仅仅是最大化奖励。安全性,道德考虑和对预定义约束的影响是至关重要的方面,特别是在机器人,财务和医疗保健等关键领域中。rl具有瞬时约束,通过引入代理必须在学习过程中的每个时间步骤中遵守的约束来解决这一需求。与对整个轨迹或情节施加的共同存在不同(Wei,Liu和Ying 2022a,B; Ghosh,Zhou和Shroff 2022; Ding等人2021;刘等。2021a; Bura等。2021; Wei等人。2023;辛格(Singh),古普塔(Gupta)和史罗夫(Shroff)2020;丁等。2021; Chen,Jain,
摘要:准确的瞬时电力峰值负载预测对于有效的容量计划和具有成本效益的电力网络建立至关重要。本文旨在通过采用包含各种优化和机器学习(ML)方法的模型来提高瞬时峰值预测的准确性。本研究使用多线性回归(MLR)方程来研究独立输入对峰负荷估计的影响。这项研究利用1980年至2020年的输入数据,包括进出口数据,人口和国内生产总值(GDP),以预测瞬时电力峰值负载为输出值。根据误差指标,包括平均绝对误差(MAE),均方根误差(MSE),平均绝对百分比误差(MAPE),均方根误差(RMSE)和r 2评估这些技术的有效性。比较扩展到流行的优化方法,例如粒子群优化(PSO),以及该领域的最新方法,包括蒲公英优化器(DO)和淘金热优化器(GRO)。与常规机器学习方法进行了比较,例如支持向量回归(SVR)和人工神经网络(ANN),就其预测准确性而言。调查结果表明,ANN和GRO方法会产生最小的统计错误。此外,相关矩阵表明GDP与瞬时峰负载之间存在牢固的正线性相关性。所提出的模型显示出强大的预测能力来估计峰负荷,而ANN和GRO的表现与其他方法相比表现出色。
。 palalego@urjc.s(P.-B。); D.B.--Á); Y.L.-T.-T。 carlos.galvezr@urjc.s(C.-R。); CSI的统一) Pharmom-urjc),28922 (Neugut-urjc),28922在Cabrera,9,28049西班牙马德里; 28046马德里西班牙马德里,西班牙,西班牙。); raquel.abalo@urjc.s(R.A.);电话。: +34-91-488-65-65(A. B.); +34-91-488-54(R.A.)
摘要 - 作为分辨率增强技术的关键技术之一(RET),光学接近校正(OPC)的计算成本过高,作为特征尺寸缩小的缩小。逆光刻技术(ILTS)将掩模优化过程视为反向成像问题,产生高质量的曲线掩模。但是,由于其时间消耗程序和过多的计算开销,ILT方法通常无法打印性能和制造性。在本文中,我们提出了DEVELSET,这是一种有效的金属层OPC引擎,该发动机替换了基于隐式级别设置表示的离散基于像素的掩码。使用GPU加速的岩性模拟器,Develset使用神经网络实现端到端掩模优化,以提供准优化的水平设置初始化,并使用基于CUDA的掩模优化器进行快速收敛。Develset-NET的骨干是一个基于变压器的多重型神经网络,它提供了一个参数选择器,以消除对手动参数初始化的需求。实验结果表明,DEVELSET框架在可打印性方面优于最先进的方法,同时实现快速运行时性能(约1 s)。我们期望这种增强的水平设定技术,再加上CUDA/DNN加速的关节优化范式,对工业面罩优化解决方案产生了重大影响。
ltimindtree是一家全球技术咨询和数字解决方案公司,它使各个行业的企业能够通过利用数字技术来重新构想业务模型,加速创新并最大化增长。作为700多个客户的数字化转型合作伙伴,Ltimindtree带来了广泛的领域和技术专业知识,以帮助促进融合世界中的卓越竞争差异化,客户体验和业务成果。由30多个国家 /地区的84,000多名才华横溢和企业家专业人士提供支持,Ltimindtree(一家Larsen&Toubro Group公司)结合了以前的Larsen和Toubro Infotech和Mindree的行业备受赞誉的优势,以解决最复杂的业务挑战和交付规模最高的业务挑战和交付。有关更多信息,请访问https://www.ltimindtree.com/
化学品的建议用途和使用限制 建议用途:洗手液 使用限制:这是一款个人护理或化妆品,在正常和合理可预见的使用情况下,对消费者和其他使用者来说是安全的。世界各地法规明确定义的化妆品和消费品无需向消费者提供 SDS。虽然这种材料不属于危险品,但该 SDS 包含宝贵的信息,这些信息对于在工业工作条件下以及在大量泄漏等不寻常和意外的暴露情况下安全处理和正确使用产品至关重要。应保留此 SDS 并供员工和该产品的其他用户使用。有关具体的预期用途指导,请参阅包装或说明书上提供的信息。
摘要 多感官身体错觉的证据表明,身体表征可能是可塑的,例如,通过体现外部物体。然而,根据当前任务需求调整身体表征也意味着,如果不再需要外部物体,它们就会脱离身体表征。在当前的网络研究中,我们引入了二维 (2D) 虚拟手的具象化,可以通过计算机鼠标或触摸板的主动移动来控制。在初始具象化之后,我们通过比较两种情况来探索脱离身体的情况:参与者要么继续移动虚拟手,要么停止移动并保持手静止。基于将身体表征概念化为一组多感官绑定的理论解释,如果身体表征不再通过相关的视觉运动信号更新,我们预计虚拟手会逐渐脱离身体。与我们的预测相反,一旦参与者停止移动虚拟手,它就会立即脱离身体。这个结果在两个后续实验中得到了复制。观察到的瞬间脱离肉身可能表明人类对虚拟环境中动作和身体的快速变化很敏感,因此会特别迅速地调整相应的身体表现。
小样本物体检测(FSOD)旨在通过少量参考样本对新类别的物体进行识别和定位,是一项颇具挑战性的任务。先前的研究通常依赖于微调过程将其模型迁移到新类别,而很少考虑微调的缺陷,从而导致了许多应用缺陷。例如,这些方法由于微调次数过多而无法在情节多变的场景中令人满意,并且它们在低质量(如低样本和类别不完整)支持集上的性能严重下降。为此,本文提出了一种即时响应小样本物体检测器(IR-FSOD),它可以在没有微调过程的情况下准确直接地检测新类别的物体。为了实现目标,我们仔细分析了 FSOD 设置下 Faster R-CNN 框架中各个模块的缺陷,然后通过改进这些缺陷将其扩展到 IR-FSOD。具体来说,我们首先为框分类器和 RPN 模块提出了两种简单但有效的元策略,以实现具有即时响应的新类别对象检测。然后,我们在定位模块中引入了两个显式推理,以减轻其对基类别的过度拟合,包括显式定位分数和半显式框回归。大量实验表明,IR-FSOD 框架不仅实现了具有即时响应的少量对象检测,而且在各种 FSOD 设置下在准确率和召回率方面也达到了最先进的性能。
在空间外观视野中,空间编码的SSVEP BCI在稳态视觉诱发对视觉闪烁刺激的反应的地形中利用了变化。与频率编码的SSVEP BCI相比,操作员不会注视任何闪烁的灯;因此,此范式可以减少视觉疲劳。其他优点包括高分类精度和简化的刺激设置。对范式的先前研究使用了固定持续时间的刺激间隔。对于频率编码的SSVEP BCIS,已经表明,动态调整试验持续时间可以提高系统的信息传输速率(ITR)。因此,我们研究了通过应用动态停止方法,是否可以为空间编码的BCI实现类似的增加。到此为止,我们引入了一个新的停止标准,该标准结合了分类结果的可能性及其在较大数据窗口中的性能。,BCI的平均ITR为28.4±6.4位/ min/ min,固定间隔,动态间隔将性能提高到81.1.1±44.4位/分钟。用户能够保持长达60分钟的连续操作的性能。我们建议动态响应时间可能是一种时间反馈,使操作员可以优化其大脑信号并补偿疲劳。