在这项工作中,我们证明,由于现有评估协议和数据集中的不足,因此有必要重新审视并全面研究Mul-timodal零射击学习(MZSL)问题问题。具体来说,我们解决了MZSL方法面临的两个主要挑战。 (1)既定基线的情况通常是无与伦比的,而且有时甚至是有缺陷的,因为现有的评估数据集通常与培训数据集有一些重叠,因此违反了零照片范式; (2)大多数现有的方法都偏向可见的类,这在对可见和看不见的类别进行评估时会大大降低性能。为了应对这些挑战,我们首先引入了一个新的多模式数据集,用于零照片评估,称为MZSL-50,其中有4462个视频来自50个广泛多元化的类别,并且与培训数据没有重叠。此外,我们提出了一种新型的多模式零射击变压器(MZST)体系结构,该体系结构利用了吸引瓶颈进行多模式融合。我们的模型可以直接预测语义表示,并且在将偏见降低到可见的类别方面表现出色。我们进行了广泛的消融研究,并在三个基准数据集和我们的新型MZSL-50数据集上实现最先进的结果。具体来说,我们提高了传统的MZSL绩效2。1%,9。81%和8。 vgg-sound,UCF-101和ActivityNet的68%。 最后,我们希望引入MZSL-50数据集将促进对社区中多模式零射击的深入研究。 181%和8。vgg-sound,UCF-101和ActivityNet的68%。最后,我们希望引入MZSL-50数据集将促进对社区中多模式零射击的深入研究。1
摘要:我们提出了 BEHAVIOR-1K,一个以人为本的机器人综合模拟基准。BEHAVIOR-1K 包括两个部分,分别由“您希望机器人为您做什么?”这一广泛调查的结果指导和推动。第一个部分是定义 1,000 种日常活动,基于 50 个场景(房屋、花园、餐厅、办公室等),其中有 5,000 多个对象,并标注了丰富的物理和语义属性。第二个部分是 O MNI G IBSON,这是一个新颖的模拟环境,它通过逼真的物理模拟和刚体、可变形体和液体的渲染来支持这些活动。我们的实验表明,BEHAVIOR-1K 中的活动是长期的并且依赖于复杂的操作技能,这两者对于最先进的机器人学习解决方案来说仍然是一个挑战。为了校准 BEHAVIOR-1K 的模拟与现实之间的差距,我们提供了一项初步研究,研究如何在模拟公寓中使用移动机械手学到的解决方案转移到现实世界中。我们希望 BEHAVIOR-1K 的人性化本质、多样性和现实性能够使其对具身化 AI 和机器人学习研究有价值。项目网站:https://behavior.stanford.edu。
我们对一项名为动力电池检测(PBD)的新任务进行了全面的研究,该任务旨在从 X 射线图像中定位密集的阴极和阳极板端点,以评估动力电池的质量。现有制造商通常依靠人眼观察来完成 PBD,这使得很难平衡检测的准确性和效率。为了解决这个问题并让更多人关注这个有意义的任务,我们首先精心收集了一个称为 X 射线 PBD 的数据集,该数据集包含从 5 家制造商的数千个动力电池中选择的 1,500 张不同的 X 射线图像,具有 7 种不同的视觉干扰。然后,我们提出了一种基于分割的新型 PBD 解决方案,称为多维协作网络(MDCNet)。借助线和计数预测器,可以在语义和细节方面改进点分割分支的表示。此外,我们设计了一种有效的距离自适应掩模生成策略,可以缓解由板分布密度不一致引起的视觉挑战,从而为 MDCNet 提供稳定的监督。无需任何花哨的修饰,我们基于分割的 MDCNet 始终优于其他各种角点检测、人群计数和基于一般/微小物体检测的解决方案,使其成为有助于促进 PBD 未来研究的强大基础。最后,我们分享了一些潜在的困难和未来研究的工作。源代码和数据集将在 X-ray PBD 上公开提供。
文本到图像模型近年来已显示出进展。随着这一进展,从文本中生成向量图也已提出。svg是向量图形的流行效果,SVG代表带有XML文本的场景。因此,大型语言模型可以直接处理SVG代码。考虑到这一点,我们专注于使用LLMS编辑SVG。用于定量评估LLMS编辑SVG的能力,我们提出了SVGeditBench。svgeditBench是评估LLMS编辑SVG代码能力的基准。在提议的基准下进行评估时,我们还显示了GPT-4和GPT-3.5结果。在实验中,GPT-4在定量和质量上都显示出与GPT-3.5的优势。该数据集可在https://github.com/mti-lab/svgeditBench上找到。
零噪声外推 (ZNE) 是一种量子经典混合技术。它运行噪声水平不断增加的量子电路,提取每个电路的期望值,然后使用经典拟合外推无噪声环境中的理想期望值。在 Mitiq 的 ZNE 实现中,有两个相关的经典变量:(1) 用于查找 y 截距(理想期望值)的外推或拟合类型和 (2) 噪声缩放值,它们决定了噪声在运行的每个附加电路中如何增长 [3]。
发件人:海军记录修正委员会主席 收件人:海军部长 主题:审查美国海军 XXX-XX- 的海军记录 参考:(a)第 10 章 USC § 1552(b)DoD 7000.14-R FMR 第 7A 卷,第 1 章 附件:(1)DD 表格 149 及附件(2)当事人的海军记录 1. 根据参考(a)的规定,当事人(以下称为申请人)向海军记录修正委员会(委员会)提交了附件(1),要求更正她的海军记录,以显示申请人的薪资入职基准日期(PEBD)已调整为包括她在加入美国海军之前在陆军国民警卫队服役的可记名服役期。 2. 委员会由 、 和 组成,于 2023 年 1 月 5 日审查了请愿人的错误和不公正指控,并根据其规定,决定根据现有的记录证据采取以下纠正措施。委员会审议的文件材料包括附件、请愿人海军记录的相关部分以及适用的法规、条例和政策。 3. 委员会审查了与请愿人的错误和不公正指控有关的所有记录事实,发现如下:a. 2016 年 11 月 9 日,申请人加入国民警卫队,服役 8 年,服役期限为 2024 年 11 月 8 日。根据军事处理记录 - 美国武装部队(DD 表格 1966/1),申请人的退役日期为 2016 年 11 月 9 日。2019 年 1 月 18 日,申请人收到国民警卫队退役报告和服役记录(NGB 表格 22),入伍日期为 2016 年 11 月 9 日。此外,带薪服役总时间为 2 年 2 个月 10 天。申请人的预备役/军事服役义务终止日期被列为不适用。b. 2019 年 4 月 30 日,申请人加入海军预备役 8 年。根据 DD 表格 1966,请愿人的 PEBD 列为 2019 年 12 月 4 日,请愿人进行了以下记录:“我于 2016 年 11 月加入陆军国民警卫队。我于 2019 年 1 月退役。” 2019 年 12 月 4 日,请愿人开始服现役 4 年,现役义务服役结束 (EAOS) 为 2023 年 12 月 3 日,现役义务服役软结束 (SEAOS) 为 2024 年 12 月 3 日。
多年来,单板计算机 (SBC) 领域的发展一直在不断加快。它们在计算性能和功耗之间实现了良好的平衡,这通常是移动平台所必需的,例如用于高级驾驶辅助系统 (ADAS) 和自动驾驶 (AD) 的车辆应用。然而,对更强大、更高效的 SBC 的需求日益增长,这些 SBC 可以实时运行功耗密集型深度神经网络 (DNN),还可以满足必要的功能安全要求,例如汽车安全完整性等级 (ASIL)。ZF 正在开发“ProAI”,主要用于运行强大而高效的应用程序,例如多任务 DNN,此外,它还具有 AD 所需的安全认证。在这项工作中,我们基于功耗密集型多任务 DNN 架构 Multitask-CenterNet,就 FPS 和功率效率等性能指标比较和讨论了最先进的 SBC。作为一款汽车超级计算机,ProAI 实现了性能和效率的完美结合,其每瓦 FPS 数量几乎是现代工作站笔记本电脑的两倍,几乎是 Jetson Nano 的四倍。此外,根据基准测试期间的 CPU/GPU 利用率,还显示 ProAI 上仍有剩余电量用于执行进一步更复杂的任务。
Vector Institute)、Vijay Janapa Reddi(哈佛大学)、G Anthony Reina(在英特尔任职期间做出贡献)、
文献和多位专家指出了大型语言模型(LLM)的许多潜在风险,但对实际危害的直接测量仍然很少。AI风险评估到目前为止一直集中在衡量模型的功能上,但是模型的功能只是风险的指标,而不是衡量风险的指标。更好地建模和量化AI风险方案可以帮助桥接这种断开连接,并将LLM的功能与有形现实世界的危害联系起来。本文通过证明如何使用现有的AI基准来促进风险估计的创建,从而为该领域做出了早期贡献。我们描述了一项试点研究的结果,其中专家使用AI基准Cybench的信息来生成概率估计。我们表明,对于此目的,该方法似乎很有希望,同时指出可以进一步加强其在定量AI风险评估中的应用。