摘要 — 近年来,随着人们对宠物保健的兴趣日益浓厚,兽医对计算机辅助诊断 (CAD) 系统的需求也随之增加。由于缺乏足够的放射学数据,兽医 CAD 的发展陷入停滞。为了克服这一挑战,我们提出了一种基于变分自动编码器的生成主动学习框架。此方法旨在缓解兽医 CAD 系统可靠数据的稀缺问题。本研究利用了包括心脏扩大放射图像数据和慢性肾病超声图像数据的数据集。在删除注释并标准化图像后,我们采用了一个数据增强框架,该框架包括数据生成阶段和用于过滤生成数据的查询阶段。实验结果表明,当通过该框架生成的数据添加到生成模型的训练数据中时,射线图像中的 frechet 起始距离从 84.14 减小到 50.75,超声图像中的 frechet 起始距离从 127.98 减小到 35.16。随后,当生成的数据被纳入分类模型的训练中时,混淆矩阵的真负数也从射线照片上的 0.16 提高到 0.66,超声图像上的真负数从 0.44 提高到 0.64。所提出的框架有可能解决医学 CAD 数据稀缺的挑战,从而促进其发展。
摘要 - 在这项工作中,我们提出了一种破坏性节俭的激光雷达感知数据流,该数据流产生而不是感知环境的一部分,这些部分是基于对环境的广泛培训,或者对整体预测准确性的影响有限的。因此,所提出的方法将传感能量与训练数据进行交易,以获取低功率机器人和自动导航,以便用传感器省将,从而在一次电池充电时延长了其寿命。我们提出的为此目的提出的生成预训练策略称为径向掩盖的自动编码(R-MAE),也可以在典型的激光雷达系统中很容易实施,通过选择性激活和控制在现场操作过程中随机生成的角区域的激光功率。我们的广泛评估表明,使用R-MAE进行预训练可以重点关注数据的径向段,从而比常规程序更有效地限制了空间关系和对象之间的距离。因此,所提出的方法不仅降低了传感能量,而且还提高了预测准确性。例如,我们对Waymo,Nuscenes和Kitti数据集进行了广泛的评估表明,该方法在跨数据集的检测任务的平均精度提高了5%,并且从Waymo和Nuscenes转移到Kitti的检测任务的平均精度提高了4%。在3D对象检测中,它在KITTI数据集中的中等难度水平下,在AP中最多可增强小对象检测。即使使用90%的径向掩蔽,它在Waymo数据集中所有对象类中的MAP/MAPH中都超过了基线模型。此外,我们的方法在Nuscenes数据集上分别获得了MAP和NDS的3.17%和2.31%的提高,这表明了其在单个和融合的LIDAR相机模态方面的有效性。代码可在https://github.com/sinatayebati/radial Mae上公开获取。索引项 - lidar预训练,掩盖自动编码器,超有效的3D传感,边缘自治。
我们开展了一项研究来评估梯度提升算法在岩爆评估中的潜力和稳健性,建立了一个变分自动编码器(VAE)来解决岩爆数据集的不平衡问题,并提出了一种针对基于树的集成学习的多级可解释人工智能(XAI)。我们从现实世界的岩爆记录中收集了537个数据,并选择了四个导致岩爆发生的关键特征。首先,我们使用数据可视化来深入了解数据的结构,并进行相关性分析以探索数据分布和特征关系。然后,我们建立了一个VAE模型来为由于类别分布不平衡而产生的少数类生成样本。结合VAE,我们比较和评估了六种最先进的集成模型,包括梯度提升算法和经典逻辑回归模型,用于岩爆预测。结果表明,梯度提升算法优于经典的单一模型,而 VAE 分类器优于原始分类器,其中 VAE-NGBoost 模型的结果最为理想。与针对不平衡数据集结合 NGBoost 的其他重采样方法(例如合成少数族群过采样技术 (SMOTE)、SMOTE 编辑最近邻 (SMOTE-ENN) 和 SMOTE-tomek 链接 (SMOTE-Tomek))相比,VAE-NGBoost 模型的效果最佳。最后,我们使用特征灵敏度分析、Tree Shapley 附加解释 (Tree SHAP) 和 Anchor 开发了一个多级 XAI 模型,以深入探索 VAE-NGBoost 的决策机制,进一步增强基于树的集成模型在预测岩爆发生方面的可靠性。
这项研究对在指数股票市场的背景下对变量自动编码器(VAE)的利用进行了深入探索,这是期权定价的关键方面。此外,我们的研究还研究了有关现货价格爆发的神经网络作品的预测能力,并具有专门的现场模型,以预测基于现货动态的波动性表面的变化。通过VAE的全面数据处理和结构化,我们创建了一个模型,该模型能够从仅10点信息点生成准确且几乎无套的无动力表面。该模型也证明了在生成以前看不见的基本资产的波动表面方面的促进效率。将现货价格变化作为条件变量,我们成功地创建了一个强大的风险管理工具,能够预测各种未来情况的波动表面。
推荐系统已成为将人们与信息联系起来的重要工具。稀疏,复杂且快速增长的数据为传统推荐算法带来了新的挑战。为了克服这些挑战,已经提出了各种基于深度学习的建议算法。其中,基于变异的自动编码器(VAE)的推荐方法脱颖而出。vae s基于一个可信的概率框架,该框架适用于数据稀疏性,并且与其他基于深度学习的模型兼容以处理多模式数据。此外,vae s的深刻生成结构有助于以良好的方式进行贝叶斯推断。基于VAE的推荐算法已经引起了许多新型图形模型,并实现了有希望的性能。在本文中,我们进行了一项调查,以系统地总结了最近的基于VAE的推荐算法。总结了基于VAE的推荐算法的四个常用特征,并提出了基于VAE的建议算法的分类法。我们还确定了未来的研究指示,对推荐算法中VAE S的高级观点以及应用的应用,以激发推荐系统的VAE上的未来工作。
我们介绍了内核弹性自动编码器(KAE),这是一种基于变压器架构的自我监管的生成模型,具有增强的分子设计性能。KAE采用了两个创新的损失函数:修改后的最大平均差异(M-MMD)和加权重建(L WCEL)。 与使用传统的kullback损失(vae的Leibler损失或标准的最大平均差异)相比,M-MMD损失显着改善了KAE的生成性能。 包括加权重建损失l wcel,Kae同时实现有效的生成和准确的重建,从而允许在现有生成方法中介于VAE和自动编码器之间中间的生成行为。 KAE的进一步进步包括与有条件生成的集成,在受限的优化中设定了新的最新基准测试。 此外, KAE已经证明了其在对接应用中产生具有良好结合亲密关系的分子的能力,如Autodock Vina和Glide分数所证明的那样,表现出优于培训数据集中所有现有的候选者。 除了分子设计之外,Kae还希望在广泛的应用中逐渐解决问题。KAE采用了两个创新的损失函数:修改后的最大平均差异(M-MMD)和加权重建(L WCEL)。与使用传统的kullback损失(vae的Leibler损失或标准的最大平均差异)相比,M-MMD损失显着改善了KAE的生成性能。包括加权重建损失l wcel,Kae同时实现有效的生成和准确的重建,从而允许在现有生成方法中介于VAE和自动编码器之间中间的生成行为。KAE的进一步进步包括与有条件生成的集成,在受限的优化中设定了新的最新基准测试。KAE已经证明了其在对接应用中产生具有良好结合亲密关系的分子的能力,如Autodock Vina和Glide分数所证明的那样,表现出优于培训数据集中所有现有的候选者。除了分子设计之外,Kae还希望在广泛的应用中逐渐解决问题。
摘要 - 多传感器对象检测是自动驾驶中的一个积极研究主题,但是这种检测模型的鲁棒性针对缺失的传感器输入(缺少模态)(例如,由于突然的传感器故障)是一个关键问题,这是一个关键问题,这仍然不足。在这项工作中,我们提出了Unibev,这是一种端到端的多模式3D对象检测框架,旨在稳健性,以防止缺失模式:Unibev可以在Lidar Plus相机输入上运行,但也可以在无激光镜或仅相机输入的情况下操作。为了促进其检测器头以处理不同的输入组合,Unibev旨在从每种可用方式中创建良好的鸟类视图(BEV)特征图。与以前的基于BEV的多模式检测方法不同,所有传感器模态都遵循统一的AP-prach,以从原始传感器坐标系统重新示例到BEV功能。我们还研究了各种融合策略W.R.T.的鲁棒性缺少模态:常用的特征串联,但也通过通道平均,以及对平均定期通道归一化权重的加权平均化的概括。为了验证其有效性,我们将Unibev与所有传感器输入组合的Nuscenes的最新bevfusion和Metabev进行了比较。在这种情况下,对于所有输入组合,Unibev的性能比这些基准更好。一项消融研究表明,通过对常规的con依的加权平均融合的鲁棒性优势,并在每种模态的BEV编码器之间共享查询。我们的代码将在纸上接受时发布。
抽象提取神经活动的高维记录与复杂行为之间的关系是系统神经科学中的无处不在问题。朝向这个目标,编码和解码模型试图推断出给定行为的神经活动的条件分布,反之亦然,而维度降低技术旨在提取可解释的低维表示。变化自动编码器(VAE)是易于推断神经或行为数据低维嵌入的富裕深度学习模型。然而,VAE准确地对任意的条件分布进行建模,例如在神经编码和解码中遇到的有条件分布,甚至是同时遇到的。在这里,我们提出了一种基于VAE的方法,用于准确计算此类条件分布。我们通过在掩盖行走环的掩盖身体部分上检索条件分布来验证具有已知地面真理的任务的方法,并证明了对高维行为时间序列的适用性。最后,我们概率地从猴子到达任务中的神经种群活动中解释运动轨迹,并查询同一VAE的编码神经活动的编码。我们的方法为神经和行为数据的关节维度降低和学习条件分布提供了统一的观点,这将允许将神经科学中的常见分析扩展到当今的高维多模式数据集。
扩散概率模型(DPM)已成为高质量图像生成中的最先进。但是,DPM具有任意的潜在空间,没有可预处或可控的语义。尽管已经进行了重大的研究工作来提高图像样本质量,但使用扩散模型的可控生成几乎没有工作。具体来说,使用DPM的可控制的反事实生成已成为一个不受欢迎的区域。在这项工作中,我们提出了Causaldiffae,这是一种基于扩散的因果表示学习框架,以根据规范的因果模型来实现反事实。我们将高维度编码为与因果相关语义因素相对应的低维表示。我们使用神经结构性因果模型在潜在变量之间建模因果关系,并通过对齐确保其分离。鉴于预先训练的Causaldiffae,我们提出了一种基于DDIM的反事实生成程序,但要进行干预。我们从经验上表明,Causaldif-fae学习了一个分离的潜在空间,并且能够产生高质量的反事实图像。