各种方法开发了3D综合的深度神经网络架构[Chaudhuri等。2020; Patil等。2020; Shi等。2023; Xu等。2023]。尽管这些方法可以捕获各种宏观的外观,但它们很少明确地模型形状的结构或拓扑结构,而是依靠网络的代表力来生成可见的看起来可见的体素电网[Liu等。2017],点云[Achlioptas等。2018a],网格[Dai和Nießner2019]或隐式领域[Chen and Zhang 2019]。与2D图像生成网络相比,由于3D网络被额外维度所带来的其他资源开销所阻碍,因此它们通常很难建模精细的细节和连接性。某些方法模型零件布局[Li等。2017],但在它们可以产生的结构的复杂性上受到限制。同时,这些先前的3D合成方法很少使艺术家灵活,精确地控制。它们更充当非有条件生成的黑匣子,或者通过图像或3D扫描重建。最新方法基于文本提示引入合成[Lin等。2023; Poole等。2023],取得了显着的结果,但仅通过及时工程进行全球控制。3D角色艺术家长期以来一直习惯于摆姿势钻机以进行准确的角色配置。然而,这种直接的局部控制和通过直观的抽象的可解释性在一般3D形状合成中的成功限制。背面有特定板条配置的椅子。没有明确结构建模的方法缺乏指定特定所需拓扑的能力,例如另一方面,进行模型零件级结构的方法仅限于由一些粗制的拓扑定义的简单拓扑结构,并且无法对复杂的FRETWORK或装饰进行建模。我们对现实的3D形状生成感兴趣,该生成能够准确地模拟复杂的拓扑和几何细节,并支持对形状结构和几何形状的更可解释的控制。为实现这一目标,我们基于三个关键见解:(1)拓扑细节通常可以在“骨骼抽象”中捕获,就像内侧轴变换获得的那样[Tagliasacacchi等。2016],即使没有有意义的部分分解,它也可以作为形状的简化结构代理。 (2)这些抽象可以通过生成方法合成[Karras等。2022],由稀疏点云预测[Nie等。2020; Yin等。2018],或由艺术家手动创建,而不必是完美的,因为它们是模仿中间表示; (3)每个抽象可以通过另一个训练有素的模型将每个抽象解码为逼真的表面。我们的方法通过推出并组装了以骨骼抽象为条件的局部支持的神经隐式功能来实现表面生成步骤。我们从该领域的最新工作中汲取了证明,该研究将潜在代码与稀疏集中的每个3D点相关联,并从潜在网格中生成局部隐含[Zhang等。2022]。但是,先前工作中稀疏的点支持集往往是任意的,而不是很容易解释。与单个大隐含物相比,这些不合格的混合物定义了整体合成形状,并可以更好地生成细微的几何细节。基于3D神经场和跨注意的后续工作[Zhang等。2023]完全在潜在网格上滴显式空间接地。相比之下,我们的基于骨架的潜在网格更具结构感知,为3D空间中的潜在代码提供了可解释的支持,同时仍然能够代表复杂的,细粒度的拓扑结构。我们总结了我们的贡献如下:
主要关键词