车辆自动化是机器人技术领域中发展迅速的一个领域。这些自主机器有可能执行繁重而危险的任务,而这些任务过去都是由人类执行的,这也是该行业的长期目标。本论文旨在开发一种计算机视觉系统,以便对自动轮式装载机铲斗内的材料进行体积估算和材料分类。这些信息对于自动轮式装载机的决策至关重要。该系统旨在自我校准,以确保未来能够适应不同的铲斗尺寸。提出了一种基于卷积神经网络 (CNN) 的边缘检测网络,称为边缘检测密集极值初始网络 (DexiNed),既可以消除冗余信息,又可以增强所需信息。通过结合立体摄像机的深度感知和从 DexiNed 中提取的信息,提出了一种估计体积的解决方案。采用简单线性迭代聚类 (SLIC) 方法来提取材料,以便对材料进行分类。将估计的体积与带注释的真实基线进行比较以验证系统。论文介绍了体积估算的精度,并展示了使用 SLIC 的三种不同分段大小进行材料提取的结果。此外,论文还提出了有关材料分类的问题。
随着人们的物质生活水平继续提高,房屋的类型和数量 - 持有垃圾的类型和数量迅速增加。因此,迫切需要开发一种合理有效的垃圾分类方法。这对于资源回收和环境改进非常重要,并有助于生产和经济的可持续发展。但是,由于大量模型参数,现有的基于深度学习的垃圾图像分类模型通常会遭受低分类精度,鲁棒性不足和慢速检测速度的影响。为此,提出了一个新的垃圾图像分类模型,并以Resnet-50网络为核心架构。特别是,首先提出了一个冗余特征融合模块,使该模型能够充分利用有价值的功能信息,从而提高其性能。同时,该模块从多尺度功能中滤除了冗余信息,从而减少了模型参数的数量。第二,Resnet-50中的标准3×3卷积被替换为深度分离的卷积,从而显着提高了模式的计算效率,同时保留了原始卷积结构的特征提取能力。最后,为了解决阶级不平衡问题,加权因素被添加到焦点损失中,旨在减轻类不平衡对模型性能的负面影响并增强模型的鲁棒性。trashnet数据集的实验结果表明,所提出的模型有效地减少了大小的数量,提高检测速度并达到94.13%的准确性,超过了现有的基于深度学习的废物图像分类模型的绝大多数,表明其固定实用值。
摘要。作为视觉变压器(VIT)的核心,自我注意力在建模长期空间相互作用方面具有很高的多功能性,因为每个查询都聚集在所有空间位置。尽管VIT在视觉任务中实现了有希望的表现,但自我注意力的复杂性与令牌长度相关。将VIT模型适应需要高输入分辨率的下游任务时,这会导致挑战性问题。前瞻性艺术试图通过引入稀疏的注意力(例如空间减少关注和窗户注意力)来解决这个问题。这些方法的一个常见点是,在计算注意力重量的情况下,所有图像/窗口令牌都连接在一起。在本文中,我们发现注意力重量与造成的计算冗余之间存在很高的相似性。为了解决这个问题,本文引入了新的关注,称为部分注意力,该问题通过减少注意图中的冗余信息来更有效地学习空间相互作用。我们注意力中的每个查询只与一小部分相关令牌相互作用。基于部分关注,我们提出了一个高效而通用的视觉变压器,名为Partialformer,该变压器在视觉任务之间的准确性和计算成本之间达到了良好的权衡。例如,在Imagenet-1K上,PartialFormer-B3超过1.7%的TOP-1准确性,同时节省25%的GFLOPS,而焦点T则超过0.8%,同时节省了30%的GFLOPS。
作为第四次工业革命的一部分,物流流程通过联网信息系统得到增强,以提高其可靠性和可持续性。最重要的是,客户可以分析从联网物流操作中获得的过程数据,以降低成本并提高利润。由于严格的运输温度要求,管理液体货物的物流尤其具有挑战性,需要通过安装在集装箱上的传感器进行监控。然而,这些传感器传输了大量冗余信息,有时这些信息不会给客户带来额外的价值,同时消耗了传感器电池中存储的有限能量。本文旨在探索和研究液体货物物流背景下的位置跟踪和状态监控的替代方法。这个问题是通过使用数据驱动的感知和基于代理的建模技术的组合来解决的。模拟结果表明,当大多数传感器处于睡眠模式时,电池的使用寿命最长,在两种典型的路由场景中,电池寿命分别增加了 × 21.7 和 × 3.7。然而,为了应对需要高质量传感器数据来做出决策的情况,需要让代理了解单个容器的生命周期阶段。主要贡献包括(1)一种基于代理的方法,用于对液体货物物流动态进行建模,从而实现监控和检测效率低下;(2)开发和分析三种传感器使用策略,以降低能耗;(3)评估能耗与位置跟踪精度之间的权衡,以便在资源受限的监控系统中及时做出决策。
抽象磁共振成像(MRI)提供了多种方法来非侵入性地估算大脑中白质(WM)的特性。除了从扩散加权的MRI中得出的各种指标外,还可以估算从T1加权MRI,WM高强度的T2加权MRI,T1:T2比率的髓鞘化的总WM体积,或者是从磁力转移比率(MMTR)的。在这里,我们利用了650名健康成年人[Camcan Cohort]的基于人群的寿命队列中所有这些MR对比的存在,以确定11个常用WM指标的协方差的潜在因素。需要四个因素来解释89%的方差,这是我们用1)纤维密度 /髓鞘形式解释的,2)自由水 /组织损伤,3)3)纤维跨的复杂性和4)微结构复杂性。这些因素显示出年龄和性别的明显影响。为了测试这些因素的有效性,我们将其与心血管健康和认知表现的度量相关。具体来说,我们进行了路径分析1)将心血管措施与WM因素联系起来,鉴于WM健康与心血管健康有关,以及2)将WM因素与认知措施联系起来,鉴于WM健康对认知很重要。即使在适应年龄后,我们也发现与脉压压力相关的血管因子预测了WM因子捕获自由水 /组织损伤,并且几个WM因素为流体智能和加工速度提供了独特的预测。我们的结果表明,在WM的常见MR度量中既有互补的和冗余信息,并且它们的潜在因素可能有助于确定健康衰老中白质健康的差异原因和贡献。
摘要:人类机器人协作(HRC)组装结合了机器人操作10的优势与人类的认知能力和适应性,这为11个复杂的组装任务提供了一种有效而灵活的方式。在HRC组装过程中,机器人需要准确地了解操作员的意图12,以帮助协作组装任务。目前,考虑13个上下文信息(例如复杂环境中的汇编对象),操作员的意图识别仍然具有挑战性。在本文中,我们14提出了一种人为对立的综合方法,用于在HRC中进行上下文感知的组装意图识别,15,该方法集成了对组装行动和组装零件的识别,以提高16个操作员的意图识别的准确性。具体来说,考虑到HRC组件的实时要求,使用基于骨架功能的17个时空图卷积网络(ST-GCN)模型可用于18识别汇编操作,以减少不必要的冗余信息。考虑到这种疾病和19个组装部分的闭塞,提出了改进的Yolox模型,以提高20个网络结构对组装部分的聚焦能力,这些零件难以识别。之后,以减速器汇编21个任务为例,一种基于规则的推理方法包含汇编22个操作和组装零件的识别信息,旨在识别当前的组装意图。最后,验证了识别人类意图的拟议方法的可行性和23个有效性。2624个组装行动识别和组装部分识别的集成可以促进准确的操作员在复杂而灵活的HRC组装环境中的准确操作员的意图25识别。
摘要 - 大脑计算机接口(BCI)技术是人脑和外部设备之间通信的流行方法。BCI最受欢迎的方法之一是运动图像(MI)。在BCI应用中,电型图(EEG)是对脑动力学的非常流行的测量,因为其无创性质。尽管对BCI主题具有很高的兴趣,但由于在EEG信号中执行模式识别任务的困难,现有系统的性能仍然远非理想。这种困难在于选择正确的脑电图通道,这些信号的信号噪声比以及如何辨别它们之间的冗余信息。BCI系统由多种组件组成,这些组件可以执行信号预处理,特征提取和决策。在本文中,我们定义了一个新的BCI框架,称为增强的融合框架,我们提出了三种不同的想法来改善现有的基于MI的BCI框架。首先,我们包括信号的附加预处理步骤:EEG信号的差异化,使其具有时间不变。其次,我们添加了一个额外的频带作为系统的特征:感觉运动节奏频段,并显示了它对系统性能的影响。最后,我们对如何在系统中做出最终决定做出了深入的研究。我们提出了多达六种类型的不同分类器和广泛的聚合函数(包括经典聚合,Choquet和Sugeno积分及其扩展和重叠函数)的用法来融合所考虑的分类器给出的信息。我们已经在20名志愿者的数据集上测试了这一新系统,该数据集执行基于运动图像的脑部计算机接口实验。在此数据集上,新系统达到了88。精度的80%。我们还提出了一个最高可获得90%占76%的系统的优化版本。此外,我们发现这对choquet/sugeno积分和重叠功能是提供最佳结果的功能。