摘要 - 从演示中学习的核心挑战是生成适应能力并可以推广到看不见的情况的表示。这项工作建议在不使用特定于任务的启发式方法的情况下学习这种表示形式,而在全球框架中叠加本地技能,在多次参考框架技能学习的背景下。首先通过使用高斯流程(GPS)拟合相对技能来了解本地政策。然后,另一个GP决定了每个帧与每个时间步的相关性,它是从不同批次的演示中以自我监督的方式训练的。GP的不确定性定量能力被利用以稳定当地政策并以完全贝叶斯的方式训练框架相关性。我们通过在模拟中生成的多帧任务的数据集以及具有机器人操作的拾取和位置重新封闭任务的真实实验中生成的多帧任务。我们用两个指标评估了方法的性能:生成的轨迹与每个任务目标以及这些轨迹和测试专家轨迹之间的偏差有多近。根据这两个指标,所提出的方法始终优于最先进的基线,任务参数化的高斯混合模型(TPGMM)。
[1] Bui-Thanh,Tan等。“由PDE管辖的贝叶斯反问题的极端尺度UQ。”sc'12:高性能计算,网络,存储和分析国际会议论文集。IEEE,2012年。[2] Durrande,Nicolas,David Ginsbourger和Olivier Roustant。“用于高维高斯过程建模的添加剂协方差内核。”Annales de la cociences de Toulouse:Mathématiques。卷。21。编号3。2012。[3] Brown,D。W.等。在造成热处理期间,激光粉末床融合TI-6AL-4V的微观结构的演变。冶金和材料交易A 52(2021):5165-5181
为了最大限度地减少大范围无线光通信 (WOC) 应用中的发散并扩大潜在的链路范围,可以使用位于传输光纤端点焦距处的适当准直透镜对光束进行准直,以减少光束扩散的影响。使用靠近接收光纤端点的类似透镜将光束重新聚焦回光纤中。本报告深入探讨了与研究类似自由空间光通信系统相关的概念,并从理论上优化接收光束点尺寸以确保接收数据信号的最大效率。在研究真实系统时,考虑大气条件至关重要,因为它们具有重大影响。此外,本文还回顾并讨论了最近的进展和发展。
在海洋工程中,计算流体动力学(CFD)模型对于模拟时间敏感的情况至关重要,例如预测溢油以及在海上进行搜索和救援操作。因此,创建可以有效,准确模拟实时数据的CFD模型至关重要。当前的CFD模型分为两类:慢速且计算上昂贵但准确的细化高保真模型,并且速度快,便宜但通常不准确。为了开发一个平衡计算成本和准确性的模型,我们建议使用稀疏变分高斯工艺进行闭合建模。我们模拟了二维流体流的理想情况,并通过圆柱障碍物越过,并增强了具有三种高保真模型的三种不同离散化的低保真模型。在所有离散化中,我们的增强低保真度模型保留了与高保真模型的高度准确性和相似性,并且与标准的低保真模型相比,误差明显少得多。因此,我们发现高斯过程可以有效地用于闭合流体流量。
rlbench数据集。在本节中,我们提供了RL-Bench [4]数据集和我们的培训管道的简洁概述。表1是我们在实验中使用的10个选定任务的概述。我们的任务变化包括随机采样的颜色,大小,计数,位置和对象类别。我们有20种阴影的调色板,包括红色,栗色,绿色,蓝色,海军,黄色,青色,洋红色,银,灰色,橙色,橙色,橄榄,紫色,紫色,蓝绿色,蓝色,紫色,紫罗兰,玫瑰,黑色和白色。对象的大小分为两种类型:短和高。对象的数量可以为1、2或3。其他属性因特定任务而异。此外,对象在一定范围内随机排列在桌面上,增加了任务的多样性。在消融研究中,我们根据[3]的任务分类从表1的RLBench任务分组为6个类别,并根据其主要挑战。任务组包括:
摘要。在非结构化环境中执行语言条件的机器人操纵任务对于一般的智能机器人高度要求。常规的机器人操纵方法通常会学习对动作预测观察的单一表示,这忽略了人类目标组成的场景级时空动力学。在本文中,我们提出了一种动态的高斯分裂方法,名为Manigaussian多任务机器人操纵,该方法通过未来场景重建进行了场景动态。具体而言,我们首先要介绍动态的高斯脱落框架,该框架渗透了高斯嵌入空间中的半义传播,其中利用语义表示来预测最佳的机器人动作。然后,我们构建了一个高斯世界模型,以参数化我们动态的高斯脱落框架中的分布,该框架通过未来的场景重建在交互式环境中提供了信息性的范围。我们通过166个变体评估了10个RLBench任务的Manigussian,结果表明我们的框架可以比最先进的方法胜过13。平均成功率1%。
摘要。预先训练的扩散模型和3D一代的最新进展促使人们对创建4D含量促进了兴趣。然而,实现高保真4D代的时空一致性仍然是一个挑战。在这项工作中,我们提出了STAG4D,这是一个新颖的框架,将预训练的扩散模型与动态3D高斯式相结合,用于高保真4D代。从3D生成技术中汲取灵感,我们利用多视图扩散模型来初始化锚定在输入视频帧上的多视图图像,在该框架上可以通过视频扩散模型捕获或生成视频。为了确保多视图序列初始化的时间一致性,我们引入了一种简单而有效的融合策略,以利用第一个框架作为自我注意计算中的时间锚。使用几乎一致的多视图序列,我们应用得分蒸馏采样以优化4D高斯点云。4D高斯吐痰是专门为生成任务而设计的,其中提出了一种自适应致密化策略,以减轻不稳定的高斯疗程以进行强大的优化。值得注意的是,所提出的管道不需要对扩散网络进行任何预训练或微调,而为4D代任务提供了更容易且更实用的解决方案。的实验实验表明,我们的方法优于先前的4D代作品在呈现质量,时空的一致性和生成鲁棒性方面起作用,从而为4d代创造了新的最先进的产品,从不同的投入中,包括文本,图像和视频。
1。Kerbl,B.,Kopanas,G.,Leimkühler,T.,Drettakis,G。:3d高斯脱落,进行实时辐射场渲染。 图形上的ACM交易42(4)(2023)2。 Turki,H.,Ramanan,D.,Satyanarayanan,M。:Mega-nerf:可扩展的大规模nerfs nerfs,用于虚拟飞行。 in:IEEE/CVF会议论文集就计算机视觉和模式识别而言。 pp。 12922–12931(2022)3。 Xu,L.,Xiangli,Y.,Peng,S.,Pan,X.,Zhao,N.,Theobalt,C.,Dai,B.,Lin,D。:网格引导的大型城市场景的神经辐射场。 在:IEEE/CVF计算机视觉和模式识别会议论文集。 pp。 8296–8306(2023)4。 Zhenxing,M.,Xu,d。:Switch-nerf:与大规模神经辐射场的专家混合的学习场景分解。 in:第十一国际学习表征(2022)Kerbl,B.,Kopanas,G.,Leimkühler,T.,Drettakis,G。:3d高斯脱落,进行实时辐射场渲染。图形上的ACM交易42(4)(2023)2。Turki,H.,Ramanan,D.,Satyanarayanan,M。:Mega-nerf:可扩展的大规模nerfs nerfs,用于虚拟飞行。 in:IEEE/CVF会议论文集就计算机视觉和模式识别而言。 pp。 12922–12931(2022)3。 Xu,L.,Xiangli,Y.,Peng,S.,Pan,X.,Zhao,N.,Theobalt,C.,Dai,B.,Lin,D。:网格引导的大型城市场景的神经辐射场。 在:IEEE/CVF计算机视觉和模式识别会议论文集。 pp。 8296–8306(2023)4。 Zhenxing,M.,Xu,d。:Switch-nerf:与大规模神经辐射场的专家混合的学习场景分解。 in:第十一国际学习表征(2022)Turki,H.,Ramanan,D.,Satyanarayanan,M。:Mega-nerf:可扩展的大规模nerfs nerfs,用于虚拟飞行。in:IEEE/CVF会议论文集就计算机视觉和模式识别而言。pp。12922–12931(2022)3。Xu,L.,Xiangli,Y.,Peng,S.,Pan,X.,Zhao,N.,Theobalt,C.,Dai,B.,Lin,D。:网格引导的大型城市场景的神经辐射场。在:IEEE/CVF计算机视觉和模式识别会议论文集。pp。8296–8306(2023)4。Zhenxing,M.,Xu,d。:Switch-nerf:与大规模神经辐射场的专家混合的学习场景分解。in:第十一国际学习表征(2022)
摘要。3D高斯碎片在实时神经渲染中引起了广泛的关注和应用。同时,人们对这种技术在稀疏观点中的限制,绩效和鲁棒性等方面引起了人们的关注,从而导致了各种改进。然而,显然缺乏关注分裂本身固有的局部仿射近似引入的投影错误的基本问题,以及这些错误对照片真实渲染质量的结果影响。本文介绍了3D gaus-sian脱落的投影误差函数,从投影函数的一阶泰勒膨胀开始,从剩余的误差开始。分析建立了误差与高斯平均位置之间的相关性。subsemess,利用功能优化理论,本文分析了该函数的最小值,以提供最佳的投影策略,以涉及最佳的高斯分裂,这可以使各种摄像机模型可观。实验验证进一步提出了这种投影方法可以减少伪影,从而导致更令人信服的现实渲染。
摘要。在结直肠癌诊断中,常规结肠镜检查技术面临着临界局限性,包括有限的视野和缺乏深度信息,这可能会阻碍检测预癌病变。当前的方法很难为结肠表面提供全面和策划的3D重建,这可以帮助最大程度地减少缺失的区域并重新进行癌前息肉。解决这个问题,我们介绍了“高斯煎饼”,这种方法利用了3D高斯分裂(3D GS)与经常基于神经网络的同时定位和映射(RNNSLAM)系统相结合。通过将几何和深度正则化引入3D GS框架 - 我们的方法可确保高斯与结肠表面更准确地对齐,从而使3D重建更加顺畅,并对详细的纹理和结构进行了新颖的观看。在三个Di-verse数据集中进行的评估表明,高斯煎饼增强了新型视图的合成质量,超过了当前的领先方法,PSNR增长了18%,SSIM提高了16%。它还提供了超过100×的更快渲染和超过10倍的培训时间,使其成为实时应用程序的实践工具。因此,这有望实现临床翻译,以更好地检测和诊断结直肠癌。代码:https://github.com/smbonilla/gaussianpancakes。