摘要。预先训练的扩散模型和3D一代的最新进展促使人们对创建4D含量促进了兴趣。然而,实现高保真4D代的时空一致性仍然是一个挑战。在这项工作中,我们提出了STAG4D,这是一个新颖的框架,将预训练的扩散模型与动态3D高斯式相结合,用于高保真4D代。从3D生成技术中汲取灵感,我们利用多视图扩散模型来初始化锚定在输入视频帧上的多视图图像,在该框架上可以通过视频扩散模型捕获或生成视频。为了确保多视图序列初始化的时间一致性,我们引入了一种简单而有效的融合策略,以利用第一个框架作为自我注意计算中的时间锚。使用几乎一致的多视图序列,我们应用得分蒸馏采样以优化4D高斯点云。4D高斯吐痰是专门为生成任务而设计的,其中提出了一种自适应致密化策略,以减轻不稳定的高斯疗程以进行强大的优化。值得注意的是,所提出的管道不需要对扩散网络进行任何预训练或微调,而为4D代任务提供了更容易且更实用的解决方案。的实验实验表明,我们的方法优于先前的4D代作品在呈现质量,时空的一致性和生成鲁棒性方面起作用,从而为4d代创造了新的最先进的产品,从不同的投入中,包括文本,图像和视频。
摘要。3D高斯碎片在实时神经渲染中引起了广泛的关注和应用。同时,人们对这种技术在稀疏观点中的限制,绩效和鲁棒性等方面引起了人们的关注,从而导致了各种改进。然而,显然缺乏关注分裂本身固有的局部仿射近似引入的投影错误的基本问题,以及这些错误对照片真实渲染质量的结果影响。本文介绍了3D gaus-sian脱落的投影误差函数,从投影函数的一阶泰勒膨胀开始,从剩余的误差开始。分析建立了误差与高斯平均位置之间的相关性。subsemess,利用功能优化理论,本文分析了该函数的最小值,以提供最佳的投影策略,以涉及最佳的高斯分裂,这可以使各种摄像机模型可观。实验验证进一步提出了这种投影方法可以减少伪影,从而导致更令人信服的现实渲染。
摘要。在结直肠癌诊断中,常规结肠镜检查技术面临着临界局限性,包括有限的视野和缺乏深度信息,这可能会阻碍检测预癌病变。当前的方法很难为结肠表面提供全面和策划的3D重建,这可以帮助最大程度地减少缺失的区域并重新进行癌前息肉。解决这个问题,我们介绍了“高斯煎饼”,这种方法利用了3D高斯分裂(3D GS)与经常基于神经网络的同时定位和映射(RNNSLAM)系统相结合。通过将几何和深度正则化引入3D GS框架 - 我们的方法可确保高斯与结肠表面更准确地对齐,从而使3D重建更加顺畅,并对详细的纹理和结构进行了新颖的观看。在三个Di-verse数据集中进行的评估表明,高斯煎饼增强了新型视图的合成质量,超过了当前的领先方法,PSNR增长了18%,SSIM提高了16%。它还提供了超过100×的更快渲染和超过10倍的培训时间,使其成为实时应用程序的实践工具。因此,这有望实现临床翻译,以更好地检测和诊断结直肠癌。代码:https://github.com/smbonilla/gaussianpancakes。
准确确定电池状况是操作中的关键挑战。随着锂离子电池的性能随着时间的推移而降级,对健康状况的准确预测将提高整体效率和安全性。本文根据高斯过程回归提出了一种预测方法,并在单个模型中使用自动相关性确定内核,用于三种不同类型的电池电池。降低了问题的维度和对特征的灵敏度分析后,对模型进行了训练,验证并在看不见的数据上进行了进一步测试。最小测试误差的平均绝对误差为1.33%。结合了预测结果的低不确定性,这表明了使用数据驱动方法预测电池状况的适用性和巨大潜力。
摘要 - 行驶系统是自动驾驶汽车的必要系统,许多论文提出了轨迹跟踪和避免障碍物的技术。高斯潜在功能对于使用2D激光雷达避免障碍物的轨迹跟踪控制系统众所周知。缺点是它依赖于局部最小值,在某些情况下,车辆和目标正在朝着相同的方向移动,由于有吸引力的潜在领域的诱惑太高,因此车辆和目标正在朝着相同的方向移动。然后,已经引入了使用修改后的有吸引力功能避免障碍物的轨迹跟踪控制,该功能的常规吸引力功能被修改以改善导航系统。模拟是通过Carla模拟器进行的,并且使用修改功能的避免障碍物的运动在跟踪过程中的摇摆运动和横向运动过程中的安全性考虑,这是通过车辆的横向加速度来考虑的,其在模拟情况下的值比其他类型的有吸引力的功能少。同时,修改后的功能还保持了车辆和障碍物之间的安全距离差距,以免避免在障碍物范围内避免在非常接近的范围内,这可能会导致碰撞。关键字 - 三射跟踪控制系统,避免障碍物,高斯潜在功能,有吸引力的功能,Carla Simulator
有效控制线性高斯量子 (LGQ) 系统是基础量子理论研究和现代量子技术发展中的重要任务。在此,我们提出了一种基于梯度下降算法的通用量子学习控制方法,用于最佳控制 LGQ 系统。我们的方法利用完全描述 LGQ 系统量子态的一阶和二阶矩,灵活地设计用于不同任务的损失函数。我们使用这种方法展示了深度光机械冷却和大型光机械纠缠。我们的方法能够在短时间内对机械谐振器进行快速和深度基态冷却,超越了连续波驱动强耦合机制中边带冷却的限制。此外,即使热声子占有率达到一百,光机械纠缠也可以非常快地产生,并且超过相应稳态纠缠的几倍。这项工作不仅拓宽了量子学习控制的应用范围,而且为 LGQ 系统的最优控制开辟了一条途径。
摘要 - 在3D中了解我们世界的动态对于机器人应用的性能和稳健性至关重要。尽管最近的进度已与视觉模型和体积渲染结合起来提供语义3D表示形式,但大型模型的推理时间既不是实时机器人操作的所需更新速度。在这项工作中,我们建议将“对象”注入基于3D高斯人的语义表示[1]。具有相同语义标签的高斯人可以一起初始化和更新,从而导致快速更新,以响应机器人和对象运动。所有必要的语义信息都是从验证的基础模型的第一步中提取的,从而规避了大型模型的推理瓶颈,但仍获取语义信息。只有三个相机视图,我们提出的表示形式可以实时捕获30 Hz的动态场景,这对于大多数操纵任务就足够了。通过基于我们的对象感知的高斯分裂来利用表示形式,我们能够求解语言条件的动态握把,为此,机器人抓取了开放词汇查询指定的动态移动对象。我们还使用该表示形式通过行为克隆来训练视觉运动策略,并表明该策略通过预审计的编码者获得了基于图像的策略的可比结果。视频https://object-aware-gaussian.github.io
当结构冲击是独立的并遵循非高斯分歧时,结构向量自回旋(SVAR)模型中的所有参数都是局部识别的。不幸的是,当识别数据的此类特征的标准推理方法无法在模型参数的结构函数的范围内获得正确的覆盖范围。对此词,我们提出了一种局部可靠的半参数方法,以进行假设检验并为SVAR模型中的结构功能构建信心集。该方法在存在时完全利用非高斯性,但可以使局部至高斯密度正确的大小/覆盖率。从经验上讲,我们重新访问了两项宏观conomic SVAR研究,在该研究中,我们记录了混合的结果。对于Kilian和Murphy的石油价格模型(2012),我们发现非高斯性可以坚定地识别合理的承认集,而对于Baumeister和Hamilton(2015)的劳动力供应 - 按需模型(2015)并非如此。此外,这些练习强调了使用弱识别稳健方法来评估估计不确定性的重要性,当时使用非高斯性进行识别。
虽然新颖的视图合成(NVS)在3D计算机视觉中取得了进步,但通常需要从密集的视点对摄像机内在和外部设备进行初始估计。这种预处理通常是通过结构 - 运动(SFM)管道来进行的,这是一种可以缓慢且不可靠的操作,尤其是在稀疏视图方案中,匹配的功能不足,无法进行准确的重建。In this work, we integrate the strengths of point-based representations (e.g., 3D Gaus- sian Splatting, 3D-GS) with end-to-end dense stereo mod- els (DUSt3R) to tackle the complex yet unresolved is- sues in NVS under unconstrained settings, which encom- passes pose-free and sparse view challenges.我们的框架工作,InstantsPlat,用3D-GS统一了密集的立体声先验,以构建稀疏场景的3D高斯大型场景 -
摘要:越来越多的光学卫星任务对陆地地球系统的连续监测为植被和农田特征提供了宝贵的见解。卫星任务通常提供不同级别的数据,例如1级大气顶(TOA)辐射率和2级大气底(BOA)反射率产品。开发TOA辐射数据直接提供了绕过复杂大气校正步骤的优势,在该步骤中,错误可以在其中进行预测并损害随后的检索过程。因此,我们研究的目的是开发能够从成像光谱卫星任务中直接从TOA辐射数据中检索植被特征的模型。为了实现这一目标,我们基于辐射转移模型(RTM)模拟数据构建了混合模型,从而采用了植被范围RTM与大气libradtran RTM结合使用高斯工艺回归(GPR)。重点是植被冠层特征的重新评估,包括叶子面积指数(LAI),冠层叶绿素含量(CCC),冠层水含量(CWC),吸收的光合式活性辐射(FAPAR)的分数以及植被覆盖的分数(FVC)。使用即将到来的哥白尼高光成像任务(Chime)的带设置,评估了两种类型的混合GPR模型:(1)使用TOA辐射数据在1级(L1)培训的一种培训,并且(2)使用BOA反射率数据在2级(L2)训练。基于TOA和BOA的GPR模型均已针对原位数据验证,并具有从现场活动中获得的相应高光谱数据。基于TOA的混合GPR模型揭示了从中度到最佳结果的一系列性能,因此达到R 2 = 0.92(LAI),R 2 = 0.72(CCC)和0.68(CCC)和0.68(CWC),R 2 = 0.94(FAPAR)和R 2 = 0.95(FVC)。为了证明模型的适用性,随后将基于TOA和BOA的GPR模型应用于科学前体任务Prisma和Enmap的图像。所产生的性状图在基于TOA和BOA的模型之间显示出足够的一致性,相对误差在4%至16%之间(R 2在0.68和0.97之间)。总的来说,这些发现阐明了机器学习混合模型的开发和增强的路径,以估算直接在TOA水平下定制的植被特征。