基于无人机的运动目标跟踪技术被广泛应用于自动巡检、应急处置等诸多领域。现有的运动目标跟踪方法通常存在计算量大、跟踪效率低的问题。受限于无人机平台的算力,基于无人机平台采集的视频数据对多目标进行实时跟踪分析是一项艰巨的任务。本文提出了一种针对无人机实时跟踪任务的带记忆的特定目标滤波跟踪(TSFMTrack)方法,该方法包括用于捕捉目标外观特征的轨迹滤波模块(TFM)和用于每帧边界框关联的轨迹匹配模块(TMM)。通过在流行的MOT和UAV跟踪数据集上与其他SOTA方法的实验比较,TSFMTrack在准确性、计算效率和可靠性方面表现出明显的优势。并且将TSFMTrack部署在类脑芯片Lynchip KA200上,实验结果证明了TSFMTrack在边缘计算平台上的有效性以及适合无人机实时跟踪任务。
摘要 — 我们解决了以下问题:(a) 根据动作开始的几秒钟预测手臂伸展运动的轨迹;(b) 利用该预测器帮助操作员预测运动方向,从而减少操作员的认知负荷,从而促进共享控制操作任务。我们新颖的意图估计器称为 Robot Trajectron (RT),它根据机器人的近期位置、速度和加速度历史,生成机器人预期轨迹的概率表示。通过考虑手臂动力学,RT 可以比其他仅使用手臂位置的 SOTA 模型更好地捕捉操作员的意图,使其特别适合协助操作员意图易受变化的任务。我们推导出一种新颖的共享控制解决方案,将 RT 的预测能力与潜在到达目标位置的表示相结合。我们的实验证明了 RT 在意图估计和共享控制任务中的有效性。我们将在 https://gitlab.kuleuven.be/detry-lab/public/robot-trajectron 上公开提供支持我们实验的代码和数据
以视觉为中心的3D环境理解既是VILA的,又对自动驾驶系统充满挑战。依据,无对象的方法吸引了相当大的意义。通过预测离散体素电网的语义,但无法构建连续,准确的障碍物表面,就可以感知世界。为此,在本文中,我们提议围绕着axtingsdf,以隐式预测周围图像的连续感知的签名距离场(SDF)和语义场。具体来说,我们介绍了一种基于查询的方法,并利用了由Eikonal配方构成的SDF来准确描述障碍物的表面。此外,考虑到缺乏精确的SDF地面真相,我们提出了一个新颖的SDF监督范式,被称为三明治艾科尼尔配方,强调在表面的两边都适用于正确且密集的约束,从而增强了表面上的精度。实验表明,我们的方法可以在Nuscenes数据集上用于占用预测和3D场景重建任务的SOTA。
摘要。本文提出了一种利用预训练的视频扩散模型的新方法,用于构建可扩展的3D生成模型。开发基础3D生成模型的主要障碍是3D数据的可用性有限。与图像,文本或视频不同,3D数据不容易访问且难以获取。与大量其他类型的数据相比,这会导致规模差异显着。为了解决这个问题,我们建议使用视频扩散模型,该模型以大量文本,图像和视频培训,作为3D数据的知识源。通过通过微调解锁其多视图的能力,我们生成了一个大规模的合成多视图数据集,以训练一个馈送前进的3D生成模型。对近3M合成多视图数据进行训练的拟议模型Vfusion3D可以以秒的形式从单个图像中产生3D资产,并且与当前的SOTA Feed-Forward 3D生成模型相比,在90%以上的时间中,用户更喜欢我们的结果。
自主代理人与人的互动越来越集中于适应其不断变化的偏好,以改善现实世界任务中的援助。有效的代理必须学会准确地推断出通常隐藏的人类目标,才能很好地进行协作。但是,现有的多代理增强学习(MARL)环境缺乏严格评估这些代理人学习能力所需的必要属性。为此,我们介绍了Color G Rid,这是一种具有可定制的非平稳性,不对称性和奖励结构的新型MARL环境。我们调查了独立的近端政策选择(IPPO),一种最先进的(SOTA)MARL算法,在C olor G ride和通过广泛的消融中找到,尤其是在“人类和“人类较低”的“领导者”代理之间,尤其是在“领导者”中同时进行非平稳和不对称目标的助理代理人,由color color c olor is i i i i i i i i i i i i i i i i i i Is i i是。为了支持未来的MARL算法,我们在https://github.com/andreyrisukhin/colorgrid上发布了环境代码,模型检查点和轨迹可视化。
安东尼奥·维塔尔1.2†,巴斯克国家3的安东尼,吉列尔莫·阿图罗·巴桑3,皮耶罗·鲁西蒂4,塞浦路斯4,萨马尔·塔瓦特5,Esraa E. Othman 5,Alexander 7,Giancarlo Gimignani 7,Sukran Erten 8,Barone 9 9,Maissa Thaibet 10,Jurgen Sota 11,Ragab Gaafar 12,13,Amina Maher 12,Batu 14死亡,Perla Ayumi Kawakami-campos 15,Giram Torres-Red 3,Henrique A. Mayink Giardini 17,Guiga Ahmed 10,Stefano Gentiles 18,Ibrahim A. 22,蒙特罗索皇后23,贝林斯的丹妮拉24,soad hashad 25,梅格利奥2.26的索德,基督教2.26,ewa Szewczyk 28,Catarzyna Rybak 28,Alberto Bastrian 2.29,Claudia Fabiani 2.30,Maria Antonietta联盟报告)
南加州大学信息科学研究所运营 MOSIS(金属氧化物半导体实施服务),提供金属氧化物半导体 (MOS) 芯片设计工具和相关服务,使大学、政府机构、研究机构和企业能够高效且经济地制作芯片原型。 MOSIS 服务正在与英特尔公司合作,通过英特尔定制代工厂为微电子设计社区提供 22nm FinFET 低功耗 (22FFL) 工艺技术。为了鼓励参与英特尔多项目晶圆 (MPW) 制造运行的 MOSIS 服务产品,国防部研究与工程副部长办公室 (OUSD(R&E)) 可信和保证微电子 (T&AM) 计划旨在潜在地赞助政府财政年度 (GFY)-2020 和 GFY-2021 的 MPW 运行。如果这些设计和/或设计工作与 T&AM 增强美国微电子开发能力的目标相辅相成,那么符合 R&E 微电子路线图对最先进 (SOTA) 技术需求的项目将被考虑进行补贴制造。
最新的大型语言模型(LMS)越来越长的上下文。虽然这种趋势允许使用大量的SOTA LMS使用大量文本,但要求这些大的LMS处理潜在的冗余或无关紧要的数据,可以不必要地增加推理时间和成本。为了解决这个问题,我们提出了Blinder,该方法利用了一个小的易键率LM来采样最小的Inter功能集,从而最大程度地提高了下游LM的性能。Blinder训练具有价值头的LM,以估算下游LM的最佳输出的可能性。我们评估了盲目的盲目决策制定任务,该任务臭名昭著,臭名昭著的状态描述:nethack和机器人计划。Blinder在Nethack和Robot Planning中分别将LM Actor In-Actor In-In-Actor In-In-Actor In-In-Actor In-In-flongion降低了158%和54%,这分别代表了大量推断成本节省,同时又代表了绩效的提高。
结果:我们开发了一种基于指导的学习范式,该范式将生物医学NER从序列标记任务转换为一代任务。此范式是端到端的,并通过自动重新利用先前存在的生物医学NER数据集来简化培训和评估过程。,我们使用拟议的范式将llama-7b作为基础LLM进一步开发了Bioner-lalama。我们对三个公认的生物医学数据集进行了对Bioner-lalama的广泛测试,该数据集由与疾病,化学物质和基因有关的实体组成。结果表明,与具有不同生物医学实体的数据集中的GPT-4相比,Bioner-lalama始终达到的F1得分范围从5%到30%。我们表明,通用域LLM可以与严格微调的PubMedbert模型和PMC-llama(生物医学特异性语言模型)相匹配。我们的发现强调了我们提出的范式在开发一般域LLM中的范式,这些范式可以与生物医学和健康应用中的多任务,多域中的SOTA表现相媲美。
人群计数在现实世界中找到直接应用程序,从而使计算效率和性能至关重要。但是,以前的大多数方法都依赖于限制部署的重型主链和复杂的下游体系结构。为了应对这一挑战并实现了人群计数模型的多功能性,我们介绍了两个轻量级模型。这些模型在合并两个不同的骨架的同时保持了相同的下游体系结构:Mobilenet和MobileVit。我们利用辅助融合来从预训练模型(PTM)中提取不同的比例功能,然后随后将这些特征无缝地结合在一起。这种方法赋予我们的模型能够提高性能,同时保持紧凑,高效的设计。通过将我们提出的模型与先前可用的先前最先进的方法(SOTA)方法进行比较,在上海-A-A Shanghaitech-B和UCF-CC-50数据集上,它取得了可比的结果,同时是计算上最有效的模型。最后,我们提出了一项比较研究,这是一项广泛的消融研究,并修剪以显示模型的有效性。