通过将自然语言纳入附加指导来实现单眼深度估计的最新进展。尽管产生了令人印象深刻的结果,但语言先验的影响,尤其是在发生和鲁棒性方面,仍未得到探索。在此过程中,我们通过量化此之前的影响来解决这一差距,并引入方法以在各种环境中基准其有效性。我们生成“低级”句子,传达以对象为中心的三维空间关系,将它们纳入其他语言先验,并评估其对深度估计的下游影响。我们的关键发现是,当前语言引导的深度估计仅通过场景级别的描述和违反直觉的效果最佳地发挥作用。尽管利用了其他数据,但这些方法对于对抗性攻击并随着分配变化的增加而对性攻击和绩效下降并不强大。fi-nally,为了为未来的研究提供基础,我们识别出失败点,并提供见解以更好地理解这些缺点。使用语言进行深度估算的越来越多的方法,我们的发现突出了需要仔细考虑在现实世界中有效部署的机会和陷阱。1
如何开发精简而准确的深度神经网络对于实际应用至关重要,尤其是对于嵌入式系统中的应用。尽管之前沿着该研究方向的工作已经显示出一些有希望的结果,但是大多数现有方法要么无法显著压缩训练有素的深度网络,要么需要对修剪后的深度网络进行大量再训练才能重新提高其预测性能。在本文中,我们提出了一种新的深度神经网络分层修剪方法。在我们提出的方法中,每个单独层的参数都基于相应参数的分层误差函数的二阶导数独立地进行修剪。我们证明,修剪后最终的预测性能下降受每层造成的重构误差的线性组合限制。通过适当控制分层误差,只需对修剪后的网络进行轻度再训练即可恢复其原始的预测性能。我们在基准数据集上进行了大量实验,以证明我们的修剪方法与几种最先进的基线方法相比的有效性。我们的工作代码发布在:https://github.com/csyhhu/L-OBS 。
背景:静息态功能性磁共振成像 fMRI (rs- fMRI) 已广泛用于研究精神疾病的大脑功能,从而深入了解大脑组织。然而,rs-fMRI 数据的高维性给数据分析带来了重大挑战。变分自动编码器 (VAE) 是一种神经网络,在提取静息态功能连接 (rsFC) 模式的低维潜在表示方面发挥了重要作用,从而解决了 rs-fMRI 数据的复杂非线性结构。尽管取得了这些进展,但解释这些潜在表示仍然是一个挑战。本文旨在通过开发可解释的 VAE 模型并使用 rs-fMRI 数据在自闭症谱系障碍 (ASD) 中测试其效用来解决这一差距。
医学是深度学习模型的重要应用领域。该领域的研究是医学专业知识和数据科学知识的结合。在本文中,我们引入了一个开放的三维颅内动脉瘤数据集 IntrA,而不是二维医学图像,这使得基于点和基于网格的分类和分割模型的应用成为可能。我们的数据集可用于诊断颅内动脉瘤和提取颈部以进行医学和深度学习其他领域(如正常估计和表面重建)的夹闭手术。我们通过测试最先进的网络提供了一个大规模分类和部分分割的基准。我们还讨论了每种方法的性能,并展示了我们数据集的挑战。发布的数据集可以在这里访问:https://github.com/intra3d2019/IntrA。
采用替代能源和电力系统将在DLODs 7中具有含义,这些含义的性质将根据所考虑的技术以及所考虑的能力的具体需求而有所不同。防御能力以及相关的设备,平台和系统,支持基础架构,操作概念,学说和物流管理继续发展。在上个世纪或更多世纪,基于碳氢化合物的能源和功率系统在国防应用中的普遍存在决定了当前的方法受碳氢化合物作为作为储能和分配的主要手段的作用的重大影响。对这种方法的任何偏差都将具有广泛的考虑因素,远远超出了替代方法的技术可行性。
深度神经网络是一种复杂的结构化系统,它以并行、分布式和上下文敏感的方式处理信息,而深度学习则是利用这些系统通过依赖经验的学习过程获得与智能相关的能力的努力。在人工智能领域,深度学习的工作通常旨在利用所有可用的工具和资源来创造和理解智能,而不考虑其生物学合理性。然而,深度学习的许多核心思想都从大脑和人类智能的特征中汲取灵感,我们认为这些受大脑启发的系统最能捕捉这些特征(Rumelhart、McClelland 和 PDP 研究小组,1986 年)。此外,深度学习研究中出现的想法可以帮助我们了解人类和动物的记忆和学习。因此,深度学习研究可以看作是研究人员之间相互交流的沃土,这些研究人员研究的相关问题对生物智能和机器智能都有影响。
目前的深度学习算法可能无法在大脑中运行,因为它们依赖于权重传输,即前向路径神经元将其突触权重传输到反馈路径,而这种方式在生物学上可能是不可能的。一种称为反馈对齐的算法通过使用随机反馈权重实现了没有权重传输的深度学习,但它在困难的视觉识别任务上表现不佳。在这里,我们描述了两种机制——一种称为权重镜像的神经回路和 1994 年 Kolen 和 Pollack 提出的算法的修改——这两种机制都允许反馈路径即使在大型网络中也快速准确地学习适当的突触权重,而无需权重传输或复杂的布线。在 ImageNet 视觉识别任务上进行测试,这些机制的学习效果几乎与反向传播(深度学习的标准算法,使用权重传输)一样好,并且它们优于反馈对齐和另一种较新的无传输算法符号对称方法。
随着人脸识别系统 (FRS) 的部署,人们开始担心这些系统容易受到各种攻击,包括变形攻击。变形人脸攻击涉及两张不同的人脸图像,以便通过变形过程获得一个与两个贡献数据主体足够相似的最终攻击图像。可以通过视觉(由人类专家)和商业 FRS 成功验证所获得的变形图像与两个主体的相似性。除非此类攻击能够被检测到并减轻,否则人脸变形攻击会对电子护照签发流程和边境管制等应用构成严重的安全风险。在这项工作中,我们提出了一种新方法,使用新设计的去噪框架来可靠地检测变形人脸攻击。为此,我们设计并引入了一种新的深度多尺度上下文聚合网络 (MS-CAN) 来获取去噪图像,然后将其用于确定图像是否变形。在三个不同的变形人脸图像数据集上进行了广泛的实验。还使用 ISO-IEC 30107-3 评估指标对所提出方法的变形攻击检测 (MAD) 性能进行了基准测试,并与 14 种不同的最新技术进行了比较。根据获得的定量结果,所提出的方法在所有三个数据集以及跨数据集实验中都表现出最佳性能。
摘要 - 质量自治有望彻底改变广泛的工程,服务和流动性行业。超密集的自主代理之间的协调复杂的沟通需要新的人工智能(AI)在第五代(5G)和第六代(6G)移动网络中实现无线通信服务的管弦乐队。在特定的安全和任务关键任务中,合法需要透明的AI决策过程,以及一系列人类最终用户(消费者,工程师,法律)的量化质量质量质量(QOT)指标。我们概述了6G的值得信赖的自主权的概念,包括基本要素,例如可解释的AI(XAI)如何产生信任的定性和定量方式。我们还提供了与无线电资源管理和相关的关键绩效指标(KPI)集成的XAI测试协议。提出的研究方向将使研究人员能够开始测试现有的AI优化算法,并开发新的算法,认为应该从设计到测试阶段内置信任和透明度。
摘要 - 该研究旨在实施能够自主检测绵羊目标并在2D占用图上代表它们的系统,其最终目标是促进在UXV平台上自主牧羊。本文详细介绍了Blackboard System的开发,Blackboard System是一种用于自动目标检测和映射的软件解决方案。使用Python和C编程语言,Blackboard系统将单眼深度感测与自主目标检测,以产生全面的深度和目标图。这些地图是合并的,以产生从高架相机的角度捕获的操作区域的详细的2D鸟视图。黑板系统的独特功能是其模块化框架,它允许无缝更新或更换其深度传感和目标检测模块。