hal是一个多学科的开放访问档案,用于存款和传播科学研究文件,无论它们是否已发表。这些文件可能来自法国或国外的教学和研究机构,也可能来自公共或私人研究中心。
传统的强化学习 (RL) 策略通常以固定的控制率实施,通常忽略控制率选择的影响。这可能导致效率低下,因为最佳控制率会随任务要求而变化。我们提出了多目标软弹性演员评论家 (MOSEAC),这是一种使用弹性时间步骤动态调整控制频率的离策略演员评论家算法。该技术通过选择最低可行频率来最大限度地减少计算资源。我们证明 MOSEAC 在理论层面上收敛并产生稳定的策略,并在实时 3D 赛车游戏中验证了我们的发现。在能源效率和任务有效性方面,MOSEAC 明显优于其他可变时间步骤方法。此外,MOSEAC 表现出更快、更稳定的训练,展示了其在机器人技术中用于现实世界 RL 应用的潜力。
b'we提出了一个以福利为中心的博览会加强学习环境,在该环境中,代理商享受一组受益人的矢量值得奖励。给定福利函数W(\ xc2 \ xb7),任务是选择一个策略\ xcb \ x86 \ xcf \ x80,该策略大约优化了从start state s 0,即\ xcb \ xcb \ x86 \ xcf \ xcf \ xcf \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ x80 \ xmax \ xcf \ x80 w v \ xcf \ x80 1(s 0),v \ xcf \ x80 2(s 0),。。。,v \ xcf \ x80 g(s 0)。我们发现,福利最佳政策是随机的,依赖起始国家的。单个行动是错误是否取决于策略,因此错误的界限,遗憾分析和PAC-MDP学习不会容易概括为我们的设置。我们开发了对抗性的KWIK(KWIK-AF)学习模型,其中在每个时间步中,代理要么采取勘探行动或输出剥削策略,因此勘探行动的数量是有限的,并且每个利用策略都是\ xce \ xce \ xb5-Welfelfare-welfelfare-Wertal的最佳。最后,我们将PAC-MDP减少到Kwik-af,引入公平的显式探索漏洞利用者(E 4)学习者,并证明其Kwik-af学习了。
本文研究了如何在扩散模型中调整步进计划,该模型主要在当前实践中固定,缺乏理论基础和在Che sectizatizanized点上对最佳性能的保证。在本文中,我们提出了使用自适应时间稳定时间表的使用,并设计了两种具有优化的samper误差限制的算法EB:(1)连续扩散,我们将EB视为损失函数,将EB视为损失函数,以分散梯度点和运行梯度下降来调整它们; (2)对于离散扩散,我们提出了一种贪婪的算法,该算法仅调整一个离散点指向其在每种迭代中的最佳位置。我们进行了广泛的实验,这些实验表明了(1)在训练有素的模型中具有突出的产生能力,以及(2)在训练不足的模型中却过早可用的生成能力。该代码可在https://github.com/cyzkrau/adaptiveschedules上找到。
医学图像分割是一项具有挑战性的任务,许多数据集的大小和注释有限,这使其变得更加困难。去噪扩散概率模型 (DDPM) 最近在对自然图像分布进行建模方面显示出良好的前景,并成功应用于各种医学成像任务。这项工作重点关注使用扩散模型的半监督图像分割,特别是解决领域泛化问题。首先,我们证明较小的扩散步骤生成的潜在表示对于下游任务比较大的步骤更稳健。其次,我们利用这一见解提出了一种改进的集成方案,该方案利用信息密集的小步骤和较大步骤的正则化效应来生成预测。我们的模型在域转换设置中表现出明显更好的性能,同时在域内保持了有竞争力的性能。总的来说,这项工作突出了 DDPM 在半监督医学图像分割中的潜力,并提供了在域转换下优化其性能的见解。关键词:医学图像分割,半监督学习,生成模型
在能量受限的应用中,例如无线传感器节点、植入式医疗设备或便携式娱乐设备,为了延长系统电池寿命,必须采用超低功耗电路。具有中等采样率(0.01-1 Msps)和分辨率(8-10 位)的 ADC 是此类设备的关键组件。在不同的转换器架构中,SAR ADC 是最佳选择,因为它在功率效率、转换精度和设计复杂性之间实现了良好的平衡。在这种转换器中,主要的功耗源是数字控制电路和电容式 DAC 阵列。虽然数字功耗受益于技术进步,但电容阵列导致的功耗受到电容不匹配的限制,这几乎与技术无关。为此,已提出了大量 DAC 拓扑和开关算法,以在不影响精度的情况下降低 DAC 功耗。最新趋势是依靠传统二进制加权 (CBW) 阵列的高线性特性,采用亚 fF 范围内的全定制单位电容 [ 1 – 3 ]。事实上,通用设计套件提供的电容最小值远大于满足线性要求所需的值,导致阵列电容相当大,从而导致开关功率很高。这种方法需要额外努力来设计和建模单位电容或误差校正技术,从而增加了面积和电路复杂性。