我们介绍C ONTITION- WARE神经N ETWORK(CAN),这是一种将控制添加到图像生成模式中的新方法。与先前的条件控制方法并行,可以通过动态降低神经网络的重量来控制图像生成过程。这是通过引入条件感知的重量产生模式来实现的,该模块会根据输入条件为卷积/线性层生成条件重量。我们测试可以在Coco上的ImageNet和文本对图像生成上生成类别图像的生成。可以始终如一地为包括DIT和UVIT在内的扩散变压器模型提供显着改进。特别是,Ca n与有效的T(CAT)结合在Imagenet 512×512上达到2.78 FID,超过DIT-XL/2,同时每个采样步骤需要少52×MAC。
如今,空气和噪音污染的持续增加已成为一种长期的滋扰,同时也是一个令人担忧的问题。在本期刊中,我们将提供一个系统来测量和监控环境参数,并在空气质量和噪音水平超过安全水平时发出警报。该系统使用必要的传感器来检测大气中的气体以及特定区域的噪音水平,并将其传输到微控制器 NodeMCU。现在,通过 Wi-Fi 凭证连接到 Node MCU 的云平台 Blynk 会获取数据并通过与被视为安全水平的值进行比较来处理数据。当每个空气质量和噪音污染变量超过允许水平时,这个基于云的监控应用程序 Blynk 还会提供一个警报系统。它通过向 Android 设备发送电子邮件或消息来通知用户,甚至可以激活蜂鸣器作为警报。这些数据被连续传输,并被存储以供进一步解释。这种基于云的污染监测系统是最经济、最可靠、最具成本效益的,并且可以增强以应对即将到来的挑战。2021 Elsevier Ltd. 保留所有权利。由第二届国际创新技术和科学会议 (iCITES 2020) 的科学委员会负责选择和同行评审。
计算机视觉社区过去主要集中于视觉算法的开发,用于对象检测,跟踪和分类,并在白天和类似办公室的环境中使用可见的范围传感器。在过去的十年中,红外线(IR),深度,X射线和其他不可见名的成像传感器仅在医学和防御等特殊领域中使用。与传统的计算机视觉相比,在这些感觉领域的兴趣相对较低,部分原因是它们的高成本,低分辨率,图像质量差,缺乏广泛可用的数据集以及/或缺乏对频谱不可访问的部分的优势的考虑。随着传感器技术的迅速发展,传感器成本急剧下降,这些局限性正在克服。此外,对安全和可靠性是主要问题的自主系统的兴趣日益增强,强调了强大的感知系统的重要性。在此类关键系统中,在不同频谱中运行的传感器相互补充,以克服每个单独的传感器的局限性,以在各种照明和天气条件下提供强大而可靠的感知。
尽管最近的研究通过深度学习技术突破了极限,但从 3D 点云中进行物体检测仍然是一项具有挑战性的任务。由于严重的空间遮挡和点密度随到传感器距离的固有变化,同一物体在点云数据中的外观会有很大变化。因此,设计针对这种外观变化的鲁棒特征表示是 3D 物体检测方法的关键问题。在本文中,我们创新地提出了一种类似域自适应的方法来增强特征表示的鲁棒性。更具体地说,我们弥合了特征来自真实场景的感知域和特征从由富含详细信息的非遮挡点云组成的增强场景中提取的概念域之间的差距。这种领域自适应方法模仿了人脑在进行物体感知时的功能。大量实验表明,我们简单而有效的方法从根本上提高了 3D 点云物体检测的性能并取得了最先进的结果。
分割算法的疗效经常因拓扑错误,连接中断和空隙等拓扑错误而受到损害。为了解决这一问题,我们引入了一种新颖的损失函数,即拓扑 - 意识局灶性损失(TAFL),该功能将基于基于地面真实和预测段蒙版的持久性图表之间的拓扑结构术语与拓扑结构术语结合在一起。通过实施与地面真理相同的拓扑结构,拓扑的约束可以有效地解决拓扑结构,而焦点损失可以解决阶级失衡。我们首先是从地面真理和预测的分割掩模的过滤的立方复合物中构造持久图。随后,我们利用sindhorn-knopp算法来确定两个持久图之间的最佳运输计划。最终的运输计划最小化了将质量从一个分布到另一个分布的运输成本,并在两个持久图中的点之间提供了映射。然后,我们根据该旅行计划计算沃斯堡的距离,以测量地面真相和预测的面具之间的拓扑差异。我们通过训练3D U-NET与MICCAI脑肿瘤分割(BRATS)CHALLENE验证数据集来评估我们的方法,该数据需要准确地分割3D MRI扫描,从而整合各种方式,以精确鉴定和跟踪恶性脑肿瘤。然后,我们证明,通过添加拓扑约束作为惩罚项,通过将焦点损失正规化来提高分段性能的质量。
摘要 人类在感知方面表现出重力优势:我们能更精确地判断向下移动物体的速度,而不是向上移动物体的速度,这表明重力加速度是一种内在化的先验。然而,尚不清楚这种重力先验是完全基于感知线索,还是可以结合语义知识。先前的研究仅使用了已知服从重力的物体,可能混淆了语义和感知线索。在这里,我们通过要求参与者判断通常与重力(球)或逆重力(火箭)相干移动的物体的速度来解决这个问题。我们的结果显示,无论物体身份如何,下落刺激都具有感知优势,这表明重力先验是基于感知线索的。
实现强大而实时的3D感知是自动驾驶汽车的基础。虽然大多数现有的3D感知方法优先考虑检测准确性,但十个忽略了关键方面,例如计算效率,板载芯片部署友好性,对传感器安装偏差的韧性以及对各种VE-HILE类型的适应性。为了应对这些挑战,我们提出了nvautonet:一种专业的鸟类视图(BEV)感知网络 - 针对自动化车辆的明确量身定制。nvautonet将同步的相机图像作为输入,并预测3D信号(例如障碍物,自由空间和停车位)。NVAUTONET架构(图像和Bev Back-bones)的核心依赖于有效的卷积网络,该网络使用Tensorrt优化了高性能。我们的图像到BEV转换采用简单的线性层和BEV查找表,从而确保了快速推理速度。Nvautonet在广泛的专有数据集中受过培训,在NVIDIA DRIVE ORIN SOC上以每秒53帧的速度运行,始终达到升高的感知精度。值得注意的是,Nvautonet表现出对不同汽车模型产生的偏差偏差的韧性。此外,Nvautonet在适应各种车辆类型方面表现出色,这是通过廉价模型的微调程序来促进的,可以加快兼容性调整。
科学素养(Montecalvo & Larkin,2018)。然而,普通民众支持国家太空计划,美国(Pew,2019)和中国(Hines,2022)等国家的研究表明就是如此。此外,研究发现,人们大大高估了公共部门在太空探索方面的支出(ESA,2018)。另一个重要方面是学生的参与意愿。研究表明,学生普遍对学习太空的可能性持积极态度(Bergstrom 等人,2016)。学生认为物理等太空学科对他们未来的职业生涯很有趣,也很有用(Reid & Skryabina,2002),空间科学应该在一个人的整体常识中占有更重要的地位(Ottavianelli & Good,2002)。尽管如此,太空探索也被认为是奢侈和不必要的。太空研究被认为很困难,只适合最优秀和最聪明的人(Bergstrom 等人,2016)。关于空间科学的另一个经常被提及的误解是该学科的狭隘观点。它主要与天文学、物理学或机械工程有关,而这一领域涉及更多学科,例如生物学、地质学、信息学、电信、医学、心理学、法律等。人们认为空间领域以男性为主,由智力超群的人占据,大多数人无法进入。这种看法可能会造成一种同质环境,只有特定类型的人才能代表这一领域。为了使空间更具包容性、可及性和社会相关性,有必要对这一主题进行进一步研究。在本文中,我们希望展示我们在大学生中进行的混合方法研究的结果。这项研究旨在确定人们对太空探索和参与太空的总体态度。我们还调查了性别差异。
近年来,多层感知器 (MLP) 成为计算机视觉任务领域的研究热点。由于没有归纳偏差,MLP 在特征提取方面表现良好并取得了惊人的效果。然而,由于其结构简单,其性能高度依赖于局部特征通信机制。为了进一步提高 MLP 的性能,我们引入了脑启发神经网络的信息通信机制。脉冲神经网络 (SNN) 是最著名的脑启发神经网络,在处理稀疏数据方面取得了巨大成功。SNN 中的泄漏积分和触发 (LIF) 神经元用于在不同时间步骤之间进行通信。在本文中,我们将 LIF 神经元的机制合并到 MLP 模型中,以在不增加 FLOP 的情况下实现更好的准确率。我们提出了一种全精度 LIF 操作来在块之间进行通信,包括不同方向的水平 LIF 和垂直 LIF。我们还建议使用组 LIF 来提取更好的局部特征。借助 LIF 模块,我们的 SNN-MLP 模型在 ImageNet 数据集上分别仅使用 4.4G、8.5G 和 15.2G FLOP 就实现了 81.9%、83.3% 和 83.5% 的 top-1 准确率,据我们所知,这是最先进的结果。源代码将在 https://gitee.com/mindspore/models/tree/master/research/cv/snn mlp 上提供。