尽管最近的研究通过深度学习技术突破了极限,但从 3D 点云中进行物体检测仍然是一项具有挑战性的任务。由于严重的空间遮挡和点密度随到传感器距离的固有变化,同一物体在点云数据中的外观会有很大变化。因此,设计针对这种外观变化的鲁棒特征表示是 3D 物体检测方法的关键问题。在本文中,我们创新地提出了一种类似域自适应的方法来增强特征表示的鲁棒性。更具体地说,我们弥合了特征来自真实场景的感知域和特征从由富含详细信息的非遮挡点云组成的增强场景中提取的概念域之间的差距。这种领域自适应方法模仿了人脑在进行物体感知时的功能。大量实验表明,我们简单而有效的方法从根本上提高了 3D 点云物体检测的性能并取得了最先进的结果。
近年来,多层感知器 (MLP) 成为计算机视觉任务领域的研究热点。由于没有归纳偏差,MLP 在特征提取方面表现良好并取得了惊人的效果。然而,由于其结构简单,其性能高度依赖于局部特征通信机制。为了进一步提高 MLP 的性能,我们引入了脑启发神经网络的信息通信机制。脉冲神经网络 (SNN) 是最著名的脑启发神经网络,在处理稀疏数据方面取得了巨大成功。SNN 中的泄漏积分和触发 (LIF) 神经元用于在不同时间步骤之间进行通信。在本文中,我们将 LIF 神经元的机制合并到 MLP 模型中,以在不增加 FLOP 的情况下实现更好的准确率。我们提出了一种全精度 LIF 操作来在块之间进行通信,包括不同方向的水平 LIF 和垂直 LIF。我们还建议使用组 LIF 来提取更好的局部特征。借助 LIF 模块,我们的 SNN-MLP 模型在 ImageNet 数据集上分别仅使用 4.4G、8.5G 和 15.2G FLOP 就实现了 81.9%、83.3% 和 83.5% 的 top-1 准确率,据我们所知,这是最先进的结果。源代码将在 https://gitee.com/mindspore/models/tree/master/research/cv/snn mlp 上提供。
抽象课程推荐系统可以通过利用用户交互数据来帮助学生识别合适或有吸引力的课程,这显示了用户和课程之间以前的参与。但是,现有课程推荐系统的普遍问题是它们倾向于优先考虑准确性而不是解释性。这些复杂模型的“黑框”性质提出了一个挑战:准确表征和建模用户的偏好,同时还提供明确的,具有预性和可解释的用户配置文件。为了解决这种限制,我们为课程推荐提出了一个新颖的知识实体感知模型,该模型称为KEAM,该模型基于知识图的详细信息支持明确的用户个人资料生成,以增强学生对建议背后的理由的理解。具体来说,我们利用知识图中编码的信息,通过更换隐藏单元来使用神经网络之间建立单位之间的连接。接下来,对模型进行了培训,可以捕获学生的偏好并创建用户配置文件,以提供可解释的建议。在两个现实世界的在线数据集上进行了全面的实验,以评估所提出的模型的有效性和解释。
糖尿病管理中越来越多的证据使疾病感知与对病情的成功控制,并改善了成年人的健康结果(1,2)。青少年通常很难遵守糖尿病护理计划(3,4),以便更好地了解他们对疾病的看法可以帮助改善其控制和健康成果(5,6)。此外,在青春期还形成了疾病感知,这使得这是一个重要的时期,在其中考虑这种情况(7,8)。尽管有充分的证据表明疾病对成年人的重要性,但对于青少年来说,这是尚无定论的(9,10)。可用的研究主要集中于提供不一致结果的定量研究(6,11)。在本文中,在一项审查研究的支持下,三项研究的定性发现强调了疾病在青少年发展框架内的重要性,并建议未来的研究以操作这些发现。本文的独创性在于对患者声音的有效使用和反映,这在医学研究中通常不存在。
实现强大而实时的3D感知是自动驾驶汽车的基础。虽然大多数现有的3D感知方法优先考虑检测准确性,但十个忽略了关键方面,例如计算效率,板载芯片部署友好性,对传感器安装偏差的韧性以及对各种VE-HILE类型的适应性。为了应对这些挑战,我们提出了nvautonet:一种专业的鸟类视图(BEV)感知网络 - 针对自动化车辆的明确量身定制。nvautonet将同步的相机图像作为输入,并预测3D信号(例如障碍物,自由空间和停车位)。NVAUTONET架构(图像和Bev Back-bones)的核心依赖于有效的卷积网络,该网络使用Tensorrt优化了高性能。我们的图像到BEV转换采用简单的线性层和BEV查找表,从而确保了快速推理速度。Nvautonet在广泛的专有数据集中受过培训,在NVIDIA DRIVE ORIN SOC上以每秒53帧的速度运行,始终达到升高的感知精度。值得注意的是,Nvautonet表现出对不同汽车模型产生的偏差偏差的韧性。此外,Nvautonet在适应各种车辆类型方面表现出色,这是通过廉价模型的微调程序来促进的,可以加快兼容性调整。
摘要该研究确定了玉米农民对尼日利亚阿比亚州转基因作物的认识和感知。使用多阶段抽样程序选择了一百八十四名受访者进行调查。用结构化的查询范围收集数据,并以百分比,均值和回归分析进行分析。多数(67.4%)的农民不知道转基因的玉米作物,而农作物不在供应中(x̄= 1.5)。玉米农民对转基因作物的看法不是很喜欢(x̄= 2.4)。很难在市场上出售它们(x̄= 3.4),气候变化对预期产量的负面影响的威胁(x̄= 3.2)以及这些农作物可能需要大量投入的可能性,例如肥料和肉质(x̄= 2.8)。年龄(β= 1.023),以前具有改善的作物品种(β= 2.112)和Internet访问(β= 2.317)的经验对农民的看法有积极影响,但是高等学校学位的家庭成员人数(β= -0.721)具有负面影响。应该创建对转基因玉米作物的更多认识,以使农民能够根据对农作物的看法做出反对的决定。扩展服务应得到充分资金来实现这一目标。
计算机视觉社区过去主要集中于视觉算法的开发,用于对象检测,跟踪和分类,并在白天和类似办公室的环境中使用可见的范围传感器。在过去的十年中,红外线(IR),深度,X射线和其他不可见名的成像传感器仅在医学和防御等特殊领域中使用。与传统的计算机视觉相比,在这些感觉领域的兴趣相对较低,部分原因是它们的高成本,低分辨率,图像质量差,缺乏广泛可用的数据集以及/或缺乏对频谱不可访问的部分的优势的考虑。随着传感器技术的迅速发展,传感器成本急剧下降,这些局限性正在克服。此外,对安全和可靠性是主要问题的自主系统的兴趣日益增强,强调了强大的感知系统的重要性。在此类关键系统中,在不同频谱中运行的传感器相互补充,以克服每个单独的传感器的局限性,以在各种照明和天气条件下提供强大而可靠的感知。
尽管基于3D的GAN技术已成功地应用于具有各种属性的照片真实的3D图像,同时保持视图一致性,但很少有关于如何罚款3D impersimens的研究,而不会限制其属性特定对象的特定对象类别。为了填补此类研究空白,我们提出了一个基于3D的GAN代表的新型图像操纵模型,以对特定的自定义贡献进行细粒度控制。通过扩展最新的基于3D的GAN模型(例如,EG3D),我们的用户友好定量操作模型可以实现对3D操作多属性数量的精细而归一化的控制,同时实现了视图一致性。我们通过各种实验验证了我们提出的技术的有效性。
