在协作机器人技术和智能系统中,人类姿势识别的准确性显着影响人机相互作用的自然性和安全性,将其确立为自动化系统的核心技术(Hernández等,2021; Liu and Wang和Wang,2021)。随着深度学习和计算机视觉的快速发展,姿势识别应用已超越机器人控制和监测,包括增强现实,体育分析和智能监视(Fan等,2022; Desmarais等,2021)。此外,人类姿势分析涵盖了外部传感技术,例如基于视觉的系统和内部传感技术,例如基于可穿戴传感器的方法。这两个范式具有互补的优势,并可以实现广泛的应用。
Methods: This paper aims at the problem of target detection of Yunnan Xiaomila under complex background environment, in order to reduce the impact caused by the small color gradient changes between xiaomila and background and the unclear feature information, an improved PAE-YOLO model is proposed, which combines the EMA attention mechanism and DCNv3 deformable convolution is integrated into the YOLOv8 model, which improves the model ' s feature extraction capability and小米在复杂环境中的推理速度,并实现了轻巧的模型。首先,EMA注意机制与Yolov8网络中的C2F模块结合使用。C2F模块可以很好地从输入图像中提取本地特征,而EMA注意机制可以控制全局关系。两者相互补充,从而增强了模型的表达能力;同时,在骨干网络和头网络中,引入了DCNV3卷积模块,该模块可以根据输入特征映射自适应地调整采样位置,从而有助于针对不同尺度和轻量级网络的目标目标更强的功能捕获功能。它还使用深度摄像头来估计小米的姿势,同时分析和优化不同的遮挡情况。通过消融实验,模型比较实验和态度估计实验验证了所提出的方法的有效性。
人工智能 (AI) 的兴起为各个领域开辟了新领域,包括自然语言处理。该领域最重要的进步之一是对话代理 (即聊天机器人) 的开发,它们是旨在通过消息传递界面与人类交互的计算机程序。大型语言模型(如 ChatGPT)的出现使得能够创建高度复杂的聊天机器人,这些聊天机器人可以以令人印象深刻的准确度模仿人类对话。但是,使用这些聊天机器人也带来了必须解决的重大网络风险。本研究论文旨在调查与使用 ChatGPT 和其他类似的基于 AI 的聊天机器人相关的网络风险,包括可能被恶意行为者利用的潜在漏洞。作为本研究的一部分,进行了一项调查,以探讨与基于 AI 的聊天机器人(如 ChatGPT)相关的网络安全风险。此外,本文还提出了可用于缓解这些网络风险和漏洞的缓解方法。
第三,鉴于目前技术不足,应考虑通过支持与外国公司建立技术伙伴关系,对该行业进行直接投资。一些公司已经采取措施,向工业发展公司 (IDC) 寻求资金。财政支持还可以采取为 IPP 和重点行业之间的合资企业提供融资的形式,这些合资企业可以共同开发和实施嵌入式发电项目,以实现工业可持续性。
摘要:本文提出了一种新型的分散式两层多传感器融合架构,用于建立一种新型的弹性姿态估计方案。正如将要介绍的那样,融合架构的第一层考虑一组分布式节点。来自不同传感器的所有可能的姿态信息组合被整合在一起,以获得通过涉及多个扩展卡尔曼滤波器获得的各种估计姿态可能性。基于从第一层获得的估计姿态,在第二层引入了故障弹性最佳信息融合 (FR-OIF) 范式以提供可信的姿态估计。第二层将每个节点(在第一层构建)的输出合并为加权线性组合形式,同时明确考虑最大似然融合标准。此外,在测量不准确的情况下,所提出的 FR-OIF 公式通过嵌入内置故障隔离机制实现了自我弹性。此外,FR-OIF 方案还能够在传感器故障或错误测量的情况下解决精确定位问题。为了证明所提出的融合架构的有效性,已经对微型飞行器进行了广泛的实验研究,该飞行器配备了各种机载姿态传感器,例如 3D 激光雷达、实感摄像头、超宽带节点和 IMU。所提出的新框架的效率是可扩展的
摘要 - 尽管最近在6D对象构成了机器人抓握的方法方面取得了进展,但在现有数据集中这些甲基多种多样的能力与现实世界中的握把和移动操作任务之间的功能之间存在很大的表现差距,尤其是当机器人完全依靠其单声学egocentric领域(Fov)。现有的现实世界数据集主要关注桌面抓地力方案,其中机器人臂放在固定位置,并且对象集中在固定外部相机的FOV中。评估此类数据集上的性能可能无法准确反映厨房环境中日常抓握和移动操作任务所面临的挑战,例如从较高的架子,水槽,洗碗机,烤箱,冰箱,冰箱或微波炉中检索物体。为了解决这一差距,我们提出了厨房,这是一种专门估算厨房环境中各个位置的物体的6D姿势的新颖基准测试。为此,我们录制了一个全面的数据集,该数据集包含约205K现实世界的RGBD图像,用于在两个不同的厨房中捕获的111个厨房对象,利用具有以自我为中心的人的人形机器人。随后,我们开发了一个半自动的注释管道,以简化此类数据集的标签过程,从而产生2D对象标签,2D对象分割掩码和6D对象,并以最少的人为努力构成。基准,数据集和注释管道可在https://kitchen-dataset.github.io/kitchen上公开获得。
大规模,手动注释的数据集的可用性在人类姿势估计中具有极大的先进研究,从2D单眼图像估计,这与诸如手势识别和动作识别之类的相关性密切相关。当前数据集(例如[1,16,20])主要包含来自我们所谓的轨道视图的图像,即侧面,前后视图,其中最重要的是,诸如对象或分裂的挑战,例如对象或分裂的挑战。他们专注于日常活动,例如站立,坐着和步行。因此,大部分研究都致力于解决遮挡和专业数据集([19,41]),以评估姿势估计模型在涉及封闭个体的情况下的有效性。不寻常的观点的问题受到了较少的关注。在我们所说的极端观点中(顶部和bot-
摘要:本文着重于用于使用车辆中安装的托盘处理机器人自动收集货运的电动货车的自主导航。除了自动驾驶汽车导航外,车辆自治的主要障碍是货运的自主集合,无论货运方向/位置如何。这项研究重点是为车辆产生停车位,而不论货运以其自主收集而定向。货运方向是通过通过板载传感器捕获货运来计算的。之后,此信息使用数学方程式以及对车辆和货运收集限制的知识创建停车位。根据装载舱的可用性,生成了单独的停车位,用于车辆的单独装载湾。最后,将结果捕获和验证,以确定货运的不同方向以结束研究。
准确实时地估计航天器或空间物体的姿态是航天器在轨维修和装配任务所必需的关键能力。由于空间图像包含变化很大的照明条件、高对比度和较差的分辨率,以及功率和质量限制,因此空间物体的姿态估计比地球上的物体更具挑战性。本文利用卷积神经网络来唯一地确定感兴趣物体相对于相机的平移和旋转。使用 CNN 模型的主要思想是协助空间装配任务中使用的物体跟踪器,而仅基于特征的方法总是不够的。为装配任务设计的模拟框架用于生成用于训练修改后的 CNN 模型的数据集,然后将不同模型的结果与模型预测姿态的准确度进行比较。与许多当前用于航天器或空间物体姿态估计的方法不同,该模型不依赖于手工制作的对象特定特征,这使得该模型更加稳健,更容易应用于其他类型的航天器。结果表明,该模型的性能与当前的特征选择方法相当,因此可以与它们结合使用以提供更可靠的估计。
摘要。机器人远程操作是执行复杂任务的重要工具,这些任务需要超出最先进算法能力的灵活性。现有的远程操作方法通常对人类操作员来说不直观,或者需要特殊的传感器和设备,这使得它们在许多情况下成本低且不切实际。在本文中,我们提出了一种依赖单目相机图像的机械臂远程操作框架。所提出的框架首先使用轻量级神经网络来估计人类操作员的身体姿势并识别他们的手势。然后,一种高效的逆运动学算法找到所需的机械臂配置,实现模仿操作员手腕运动的末端执行器运动。我们的远程操作框架可以在普通笔记本电脑上使用网络摄像头和任何具有 ROS 接口的机械臂执行。我们在 Kinova Jaco 机械臂的实际实验中验证了它的性能,展示了在环境中抓取和移动物体的能力。