抽象生成深度学习体系结构可以产生现实的高分辨率假图像,具有潜在的社会含义。评估这项技术的风险对公众需要更好地了解新颖生成方法可以生成现实数据的条件。在这种情况下的一个关键问题是:生成逼真的图像,特别是针对利基领域的真实图像有多容易。实现特定图像内容所需的迭代过程很难自动化和控制。尤其是对于罕见的阶层,很难评估忠诚度,这意味着生成的方法是否会产生现实的图像和对齐方式,这意味着(井)如何以人类的投入来指导一代。在这项工作中,我们对生成体系结构进行了大规模的经验评估,以生成合成卫星图像。我们专注于核电站作为罕见对象类别的一个例子 - 由于全球只有大约400个设施,因此对于许多其他情况,这种限制是示例性的,在许多其他情况下,培训和测试数据受到现实世界实例的限制限制的限制。我们通过从游戏引擎中获得的两种模式,文本输入和图像输入来生成综合图像,该图像允许对建筑物布局进行详细规范。生成的图像通过常用的指标进行评估,以进行自动评估,然后与我们进行的用户研究的人类判断进行比较,以评估其可信度。我们的结果表明,即使对于稀有物体,具有文本或详细建筑布局的真实合成卫星图像的产生也是可行的。但是,与以前的工作相一致,我们发现自动指标通常与人类的感知不符 - 实际上,我们发现常用的图像质量指标与人类评分之间存在很强的负相关性。我们认为,我们的发现使研究人员能够更好地评估不同生成方法的优势和劣势,尤其是针对利基领域和稀有物体类别,并可以帮助指导未来的生成方法改进。
Wush Wu [ctb](),Qiang Kou [ctb]() https://orcid.org/0000-0001-8804-4216>),米歇尔·兰[CTB]() https://orcid.org/0000-0003-4198-9911>),Radford Neal [ctb](),KENDON BELL [CTB] Matthew de Queljoe [CTB],Dmitry Selivanov [CTB],Ion Suruceanu [CTB],Bill Denney [CTB],Dirk Schumacher [CTB],AndrásSvraka[CTB],Sergey Fedorov [CTB] https://orcid.org/0000-0003-1878-3253>),Floris Vanderhaeghe [CTB](),Kevin Tappe [CTB] PEIKERT [CTB](),Mark van der loo [ctb]() https://orcid.org/0000-0003-2555-3878>),Moritz Beller [CTB](),塞巴斯蒂安·坎贝尔(Sebastian Campbell) https://orcid.org/0000-0002-1576-2126>),Dean Attali [CTB](),Michael Chirico Kevin Ushey [CTB]
自我监督的单眼深度估计(DE)是一种学习深度的方法,没有昂贵的深度地面真理。但是,它经常在移动物体上挣扎,这些物体违反了训练期间的静态场景假设。为了结束这个问题,我们介绍了一个粗到最新的训练策略,该策略利用了地面与先验接触的地面,该期望是在户外场景中大多数移动物体在地面上造成的。在粗糙的训练阶段,我们将动态类中的对象排除在再投入损失计算中,以避免深度学习不准确。为了对物体的深度进行精确的监督,我们提出了一种新颖的接地式差异平滑度损失(GDS-loss),该损失(GDS-loss)鼓励DE网络将物体的深度与其接地接触点保持一致。随后,在精细的训练阶段,我们完善了DE网络,以了解重新投影损失中对象的详细深度,同时通过使用基于成本量的加权因素利用我们的正则化损失来确保对移动对象区域的准确DE。我们的整体粗表表训练策略可以轻松地与无需修改的方法集成,从而显着提高了挑战性的城市景观和KITTI数据集的DE性能,尤其是在移动对象区域中。
摘要。传统的图像介绍任务旨在通过引用周围背景和前景来恢复所破裂的区域。但是,需求不断增长的对象擦除任务旨在消除对象并产生和谐的背景。以前的基于GAN的涂料方法与复杂的纹理产生斗争。基于新兴扩散模型的算法(例如稳定的扩散插图)具有产生新内容的能力,但它们通常会在擦除的物体的位置产生不一致的结果,并且需要高质量的文本提示输入。为了应对这些挑战,我们引入了魔术师,这是一个针对对象擦除任务量身定制的基于扩散模型的框架。它由两个阶段组成:内容初始化和可控生成。在后阶段,我们开发了两个插件模块,称为及时调整和语义意识到的注意力。此外,我们提出了一种数据构建策略,该策略生成了特别适合此任务的培训数据。Magiceraser在减轻不希望的伪像的同时,可以很好地控制内容产生。实验结果突出了我们在对象擦除任务中的有价值的进步。
摘要 - 在虚拟/增强/混合现实(VR/AR/MR)中,使用手持式触觉设备渲染软虚拟对象,这是由于手工的解剖学限制以及设计的未接地性质,这会影响执行器和传感器的选择,从而限制了由该设备显示的强制性和范围的选择。我们开发了一种电缆驱动的触觉设备,用于渲染涉及抓紧和挤压3D虚拟物体(软)物体(软)对象的净力,仅在索引纤维和拇指之间。使用建议的设备,我们研究了虚拟环境中软对象的感知。我们表明,可以通过控制视觉和触觉提示之间的关系来大大扩展对象刚度的范围,可以有效地传达给虚拟环境(VES)中的用户。我们提出,一个称为明显的刚度不同的单个变量可以预测操纵冲突下人类僵硬感知的模式,该变量可用于使VES中的一系列柔软物体用于比单独的触觉设备所能实现的范围更大的柔软物体。
摘要 - 机器人辅助手术(RAS)中的policy学习缺乏数据效率和多功能方法,这些方法表现出对于精致的手术干预的所需运动质量。为此,我们介绍了运动原始扩散(MPD),这是一种在RAS中模仿学习的新方法(IL),重点是轻柔地操纵可变形物体。该方法结合了基于扩散的模仿学习(DIL)的多功能性与概率动态运动原始基原始(PODMP)的高质量运动产生能力的多功能性。这种组合启动MPD可以轻柔地操纵可变形物体,同时保持数据效率对于稀缺的RAS应用至关重要。我们在状态和图像观察中评估了各种模拟和现实世界机器人任务的MPD。MPD在成功率,运动质量和数据效率方面优于最先进的DIL方法。项目页面:scheiklp.github.io/movement-promistive-diffusion
简介 卢森堡大公国承担登记义务的空间物体登记处(国家登记处)是根据 1974 年 11 月 12 日在纽约联合国大会通过的《关于登记射入外层空间物体的公约》(《公约》)和 2020 年 12 月 15 日《空间活动法》设立的。 2021 年 1 月 27 日,卢森堡加入了《空间物体登记公约》,成为该公约的第 70 个缔约国。 联合国大会于 1974 年通过了该公约,以协助识别空间物体,解决缔约国对其空间物体的责任问题,并确保各国和国际政府间组织提供的信息的开放获取。《登记公约》确保联合国秘书长建立和维护一个射入外层空间物体的中央登记处。因此,一旦发射空间物体,《登记公约》要求“登记国”尽快向秘书长提供有关所发射空间物体的信息。联合国在其网站上保存缔约国提供的有关空间物体和空间活动的信息。此外,《登记公约》要求卢森堡维护自己适当的空间物体登记册,这也体现在 2020 年 12 月 15 日法律第 7 章第 15 条中。在成为《登记公约》缔约国之前,卢森堡根据第 1721 B (XVI) 号决议自愿提供空间物体的登记信息。遵守公约后,登记提交符合公约第四条的规定。有关卢森堡已向联合国提交的空间物体登记信息,请参阅联合国外层空间事务办公室 (UNOOSA) 网站。
摘要:随着人工智能技术的快速发展,人工智能图像识别已成为解决传统环境监测难题的有力工具。本研究针对河湖环境中的漂浮物检测,探索一种基于深度学习的创新方法。通过精细分析静态和动态特征检测的技术路线,结合河湖漂浮物的特点,开发了完整的图像采集和处理流程。本研究重点介绍了三种主流深度学习模型SSD、Faster-RCNN和YOLOv5在漂浮物识别中的应用及性能比较。此外,还设计并实现了一套漂浮物检测系统,包括硬件平台构建和软件框架开发。经过严格的实验验证,该系统能够显著提高漂浮物检测的准确性和效率,为河湖水质监测提供了新的技术途径。关键词:图像识别;深度学习;河湖浮标检测
3D场景图预测的当前方法依赖于标记的数据集来训练固定的对象类和关系类别的固定模型。我们提供Open3DSG,这是一种在开放世界中学习3D场景图预测的替代方法,而无需标记的场景图数据。我们将3D场景图预测主链的功能与功能性开放世界2D Vision Language Foundation Models的功能空间相结合。这使我们能够通过从开放的词汇查询对象类,并以零摄像的方式从3D点云中预测3D场景图,并从接地的LLM中预测与场景图fea的接地LLM相对的关系,并查询对象类作为上下文。Open3DSG是第一个3D点云方法,不仅可以预测显式开放式唱机对象类,而且还可以预测不限于预定标签集的开放式关系 - 使得在预测的3D场景图中表达稀有物以及特定的对象和关系。我们的实验表明,Open3DSG可以有效地预测Arbitary对象类别及其复杂的对象间关系,描述了空间,支持性,语义和比较关系。