相机曝光控制是通过控制曝光时间,增益和光圈来调整展示水平的任务,以达到给定场景的所需亮度和图像质量水平。调整较差的暴露参数导致暴露过度,暴露不足,模糊或嘈杂的图像,这可能会导致基于图像的应用程序中的性能降解,并且在最坏的情况下甚至是威胁生命的事故。因此,找到适当的相机暴露是确保计算机VI- sion应用功能的第一步,例如对象检测[5,16],语义分割[9,17],深度估计[10,26]和视觉传感器[1,13]。相机外观控制中有几个基本要求。必须保证快速收敛以在动态降低的情况下保持适当的暴露水平。此外,曝光控制环是相机系统中最低的循环之一。因此,必须考虑轻巧的算法设计用于车载级操作。最后,不应牺牲融合图像的质量以满足要求。此外,同时控制的参数数的数量也很重要,因为它会影响收敛时间和收敛图像的最终质量。单一控制方法[14,18,20]以一种方式控制暴露参数,以达到所需的暴露水平,而不是控制暴露参数。但是,收敛的参数通常不是最佳的,例如[长时间曝光时间,低增益]和[短曝光时间,高增益]对。结果,该值导致不良图像伪像,例如由于长时间的暴露时间或由于高增益而引起的严重噪声而导致运动模糊。关节曝光参数控制[7,8,8,21,23,24]通常需要在广泛的搜索空间中进行多个搜索步骤,以找到最佳组合。结果,它们会引起闪烁效果和缓慢的收敛速度。此外,由于其优化算法[7,8],图像评估指标[7,8,20,21]和GPU推论,因此需要高级计算复杂性[23]。在本文中,我们提出了一种新的联合暴露参数控制方法,该方法利用了增强学习来实现即时收敛和实时处理。所提出的框架由四个贡献组成:•简化的训练场,以模拟现实世界的di-verse和动态照明变化。•闪烁和图像属性感知奖励设计,以及用于实时处理的轻巧和直观的状态设计。•静态的动态照明课程学习,以提高代理的暴露能力。•域随机技术减轻训练场的限制并在野外实现无缝的一般性,而无需额外的训练。
Shi,Shaoshuai等。“运动变压器具有全球意图定位和本地运动的重新构成”。2022。Shi,Shaoshuai等。“ MTR ++:具有对称场景建模和指导意图查询的多代理运动预测。”2023。
扩散模型在图像生成中表现出了前所未有的ca。然而,它们从原始训练集中纳入并扩大了数据偏差(例如性别,年龄),从而限制了产生的IMEG的多样性。在本文中,我们在基于图像集的重新函数的指导下,使用增强学习(RL)提出了一种面向多样性的细调方法(RL)。具体而言,所提出的奖励函数(表示为多样性奖励),利用一组生成的信息来评估当前生成分配W.R.T.的覆盖范围。参考分布,由一组无偏见的图像表示。建立在分布差异估计的概率方法的基础上,差异奖励可以有效地用一小部分图像来测量相对分布差距。我们进一步将扩散过程作为多步决策问题(MDP),并通过最大化多样性奖励来应用策略梯度方法来微调扩散模型。在放样后选择任务上验证了奖励,其中根据多样性奖励值选择了最多样化的图像的子集。我们还展示了我们的RL微调框架的有效性,可以通过不同类型的扩散模型(包括班级条件模型和文本条件模型,例如stablediffusion)增强图像生成的多样性。
关于Holcim Holcim是创新和可持续建筑解决方案的全球领导者,净销售额在2023年为270亿瑞士法郎。在我们为人们和地球建立进步的目的的驱动下,我们的63,448名员工正在执行脱碳化建筑物的使命,同时改善所有人的生活水平。,我们赋予所有地区客户的客户能力以更少的速度建造,并具有广泛的低碳和圆形解决方案,从Ecopact和Ecoplanet到我们的循环技术平台Ecocycle®。通过创新的系统,从高架屋顶到PRB隔热材料,Holcim使建筑物在使用中更可持续,推动能源效率和绿色改造。以我们战略的核心可持续性,我们正在成为由SBTI验证的1.5°C目标的净零公司。
在Marwan Hamze博士的监督下,该项目是在东京科学大学的吉田教授实验室的国际四个月实习的一部分。主要目的是为加强机器人手臂控制学习的应用的应用做出贡献。我的工作包括在模拟和真实环境中为机器人组开发和实施控制算法。强化学习使避免复杂的运动学模型成为可能,从而为机器人提供通过与环境直接互动来优化其行为的能力。我将精力集中在优化XARM6机器人手臂控制上,并从科学文献中适应方法。我在模拟中首先测试了这些算法,然后将它们应用于真实环境以评估其稳健性。我的目标是获得加强对人形机器人控制的技能,以控制川崎的Kaleido机器人,尺寸为1.80 m,重80 kg。这个项目使我能够增强机器人技术和人工智能方面的技术技能,同时促进该扩展领域应用的研究。
最近,密集的潜在变量模型已显示出令人鼓舞的结果,但是它们的分布式和潜在的代码使它们降低了易于解释,并且对噪声的影响较低。另一方面,稀疏表示更为简约,提供了更好的解释性和噪声稳健性,但是由于涉及的复杂性和计算成本,很难实现稀疏性。在此过程中,我们提出了一种新颖的无监督学习方法,以利用逐渐稀疏的尖峰和平板分布作为我们的先验,以在发电机模型的潜在空间上强化稀疏性。我们的模型由自上而下的发电网络组成,该网络将潜在变量映射到观测值。我们使用最大似然采样来推断发电机后方向的潜在变量,并且推理阶段的尖峰和平板正则化可以通过将非信息性潜在维度推动到零来引起稀疏性。我们的实验表明,学到的稀疏潜在表示保留了大多数信息,我们的模型可以学习解开的语义,并赋予潜在代码的解释性,并增强分类和denosing任务的鲁棒性。
想象力,基于模型的推理和决策的神经基础对神经科学产生了很大的兴趣[5-7];在认知水平上,在动物和人类学习中已经假设并证明了模型学习和心理模拟[8-11]。其在基于人工模型的代理中的成功部署迄今已仅限于可用的确切过渡模型[12]或模型易于学习的域中的设置,例如符号环境或低维系统[13 - 16]。在代理无法使用模拟器的复杂域中,最近的成功由无模型方法主导[2,17]。在此类域中,采用标准计划方法的基于模型的代理的性能通常会遭受功能近似作用的模型错误[18,19]。这些错误在计划过程中复合了,导致过度优势和剂性能差。当前没有计划
我们使用两种互补视觉方式探索视觉增强学习(RL):基于框架的RGB凸轮和基于事件的动态视觉传感器(DVS)。iSTING多模式视觉RL方法在有效提取与任务相关的信息时经常遇到挑战。为了解决这个问题,我们提出了用于视觉RL的分解多模式表示(DMR)框架。它将输入分为三个不同的组成部分:与任务相关的效果(共同功能),RGB特异性噪声和DVS特异性噪声。共同创作表示与RL任务相关的两种模式中的完整信息;这两个噪声组件都受到数据重构损失以避免信息泄漏的约束,与共同创作形成对比,以最大程度地差异。广泛的经验表明,通过明确分开不同信息的类型,我们的方法可实现与最先进的方法相比,实质性改善的政策绩效。