摘要:了解机器人必须在给定开放式任务中的非结构化环境中操纵对象。但是,现有的视觉负担预测方法通常仅在一组预定义的任务上手动注释的数据或条件。我们介绍了无监督的负担蒸馏(UAD),这是一种将负担知识从基础模型提炼到任务条件的辅助模型的方法,而无需任何手动注释。通过利用大型视觉模型和视觉模型的互补优势,UAD自动注释了一个具有详细的<指令,Visual Profiseance> Pairs的大规模数据集。仅在冷冻功能上训练一个轻巧的任务条件解码器,尽管仅在模拟中接受了对渲染的对象的培训,但UAD对野外机器人场景和各种人类活动表现出显着的概括。UAD提供的可负担性作为观察空间,我们展示了一项模仿学习政策,该政策证明了有希望的概括,可以看到对象实例,对象类别,甚至在培训大约10次演示后进行任务指令的变化。项目网站:https://gpt-affordance.github.io/。
最近几年见证了基于部分微分方程(PDES)解决科学问题的机器学习方法和物理领域特定见解的承诺。但是,由于数据密集型,这些方法仍然需要大量的PDE数据。这重新引入了对昂贵的数量PDE解决方案的需求,部分破坏了避免使用这些支出模拟的最初目标。在这项工作中,寻求数据效率,我们为PDE操作员学习设计了无监督的预培训。为了减少对模拟成本的训练数据的需求,我们在没有模拟解决方案的情况下挖掘了未标记的PDE数据,我们通过基于物理启发的基于重建的代理任务为神经操作员提供了预先介绍神经操作员。为了提高分布性能,我们进一步协助神经操作员灵活地利用一种基于相似性的方法,该方法学习了内在的示例,并导致了额外的培训成本或设计。对一组PDES的广泛经验评估表明,我们的方法具有高度的数据效率,更具生动性,甚至超出常规视觉预测的模型。我们在https://github.com/delta-lab-ai/data_effidiced_nopt上提供代码。
自动农作物识别是现代农业的重要分支。它为农田制图,农作物轮作分析,农田结构和农业用地使用监测提供了广泛的机会。遥感是一种通过实施各种植被指数(例如,标准化差异植被指数)结合机器学习和计算机视觉的技术,是一种可用于作物识别的潜在且有力的技术。当前的研究致力于对乌克兰监督机器识别的最新开发机器学习的准确性,即软件应用Agroland分类器,该分类器是基于Naas气候智能农业研究所的科学研究的结果而构建的。该应用程序采用了几种监督的机器学习方法,即多种规范的判别分析和逻辑回归,以区分冬季小麦,冬季大麦,冬季大麦,冬季菜籽,谷物玉米,大豆和向日葵等农作物。使用随机选择的标记的田地进行测试,每种作物100个田间。在乌克兰的所有领土上进行了测试。从农业监控地图平台中检索了月度归一化差异指数的输入值。已经确定,最高的作物识别精度与小麦有关(总准确度为82.0%,F1得分为0.90),而大豆的最差结果(占真实猜测的50.0%,F1得分为0.67)。需要进一步的详细测试和算法改进,并将继续进行。还观察到,识别精度高度取决于农作物种植的土壤气候条件。
摘要 - 点云注册是估计两个点云之间刚性转换矩阵的基本任务,并被视为下游视觉任务的先决条件。最近的工作试图使用可获得的RGB-D序列解决注册问题,而不是仅依靠点云,这可能并不总是可用。然而,由于多模式特征的简单串联和向量维度的增加,大多数现有的无监督RGB-D点云注册工作都难以获得细粒度,健壮,判别对应关系。这些方法通常遵循一个常见的范式:从输入数据中提取特征,估计对应关系并通过几何拟合获得转换矩阵。在这项工作中,我们设计了一个生成特征提取模块,以充分利用多模式信息,并寻求对通讯估计的新颖观点,该估算将源和目标点云中的点扩展到基于超矩形的嵌入中,并根据N-Dimensions space in-Dimensientions in-Dimensions in-Dimentions contractions in-Dimentimentions conteconsienss in-Dimentions contractions。每个基于高矩形的嵌入都是基于提出的生成特征提取模块的天然和歧视性语义的构建的,该模块涉及扩散分支,几何分支和点像素融合。我们利用生成模型的能力充分利用RGB-框架中的两种互补方式的信息。我们的代码将在以下网址发布:https://github.com/cbyan1003/dce。此外,这种独特的几何空间允许有效地计算交点量和模型概率概率,以估计对应关系。在3DMatch和扫描仪数据集上进行的广泛实验显示了该方法在这项具有挑战性的任务中的有效性,表现优于最先进的方法。
• 被选中的候选人将在 Helmholtz Munich 工作 36 个月,负责 MSCA-DN 项目。 • 根据 MSCA 津贴和接收机构的规定,博士候选人将获得有竞争力的薪酬。 Helmholtz Munich 已获得以下欧盟补助金来招募博士候选人 (DC):每月生活津贴 3,342 欧元;每月流动津贴 600 欧元;每月家庭津贴 660 欧元(仅在适用时)。请注意,最终的月薪总额将从上述金额中扣除所有由雇主承担的强制性国家劳动税(社会保障等)。此外,还提供资金用于技术和个人技能培训以及参与国际研究活动。 • 预计开始日期:2025 年 4 月至 9 月之间。我们鼓励届时毕业的最后一年硕士生申请。有关 IQ-BRAIN 职位的一般信息文件中提供了更多信息。
一方面,简单笔记本电脑的计算能力比几年前高。 div>另一方面,大量使用连接到互联网的设备有助于收集大量数据。 div>在这场计算革命之前,对数学概况保留了获得高级统计知识的访问。 div>今天,专为所有受众设计的特定软件的开发允许专业的专业人士使用这些工具来解决各自领域的问题。 div>在这一行中,近年来,Sutech一词被普及,从广义上讲,可以将监督当局定义为使用创新技术(机器学习和大数据)来支持其工作。 div>本课程非常实用且应用,将使用R和Python编程语言探索最受欢迎的ML工具的使用。 div>在具体主题中,例如:决策树将解决神经网络或深度学习自然语言处理非秘书学习:群集和降低一般全景维度。
• 被选中的候选人将在 Helmholtz Munich 工作 36 个月,负责 MSCA-DN 项目。 • 根据 MSCA 津贴和接收机构的规定,博士候选人将获得有竞争力的薪酬。 Helmholtz Munich 已获得以下欧盟补助金来招募博士候选人 (DC):每月生活津贴 3,342 欧元;每月流动津贴 600 欧元;每月家庭津贴 660 欧元(仅在适用时)。请注意,最终的月薪总额将从上述金额中扣除所有由雇主承担的强制性国家劳动税(社会保障等)。此外,还提供资金用于技术和个人技能培训以及参与国际研究活动。 • 预计开始日期:2025 年 4 月至 9 月之间。我们鼓励届时毕业的最后一年硕士生申请。有关 IQ-BRAIN 职位的一般信息文件中提供了更多信息。
抽象的异常是一个实例或向量,与数据集中的其余observaɵ子不类似。此类异常的同性恋不仅是一项具有挑战性的任务,而且是一个高度相关的终结事件。已经开发了几种算法来应对异常中的两个主要问题:detecɵng异常的比较标准,以及将通常或预期向量与异常分开的阈值。异常检测是无监督收入的一个实例,因为没有外部标签或类别分配给研究的数据。实际上,异常探测算法旨在将标签分配给分析的数据,并且该标签是向量所属的类,这可以是预期的或通常的实例或常规类别类别的类别。
摘要 - 不监督的单眼深度估计框架 - 作品显示出有希望的自主驱动性能。但是,现有的解决方案主要依靠一个简单的召集神经网络来进行自我恢复,该网络努力在动态,复杂的现实世界情景下估算精确的相机姿势。这些不准确的相机姿势不可避免地会恶化光度重建,并误导了错误的监督信号的深度估计网络。在本文中,我们介绍了Scipad,这是一种新颖的方法,它结合了无监督的深度置式联合学习的空间线索。具体来说,提出了一种置信度特征流估计器来获取2D特征位置翻译及其相关的置信度。同时,我们引入了一个位置线索聚合器,该位置线索聚合器集成了pseudo 3D点云中的depthnet和2D特征流入均匀的位置表示。最后,提出了一个分层位置嵌入喷油器,以选择性地将空间线索注入到鲁棒摄像机姿势解码的语义特征中。广泛的实验和分析证明了与其他最新方法相比,我们的模型的出色性能。非常明显的是,Scipad的平均翻译误差降低了22.2%,而Kitti Odometry数据集的相机姿势估计任务的平均角误差为34.8%。我们的源代码可在mias.group/scipad上找到。
3D面部绩效捕获是几种应用中的关键组成部分,包括AR或VR中的身临其境的触觉以及娱乐行业的视觉效果。生产高质量的恢复通常需要大量的财务,时间和资源投资。这不仅涉及昂贵的3D捕获设备[Beeler等。2010; Debevec等。2000],基于精确的标记跟踪系统[Bennett and Carter 2014]或头部安装式分配[Brito and Mitchell 2019],但也从演员那里进行了大量的捕捉时间。无标记的捕获设置是简化该管道的有希望的解决方案,但是高质量的结果仍然依赖于复杂的钻机[Helman等。2020]或大型个性化培训数据集[Laine等。2017; Wu等。2018]。在频谱的另一端是3D重建方法,可以在负担得起的消费者等级硬件中使用图像或视频操作。主要思想是使用3D面的统计模型 - 所谓的3D形态模型(3DMMS),它们使用基于优化的[Andrus等人都拟合到RGB图像或2D地标。2020; Zielonka等。2022]或基于学习的方法[Danecek等。2022;冯等人。2021; Retsinas等。2024]。统计模型的先验知识有助于克服问题的不良性质,而基于学习的技术的发展使姿势,照明和闭塞的前所未有的鲁棒性。但是,这是以较低的几何质量为代价的,仅提供了形状和表达的粗略近似,而该形状和表达却差不多。