将驾驶行为适应新的环境,库斯和法律是自主驾驶中的一个长期问题,排除了澳大利亚车辆(AVS)的广泛部署。在本文中,我们提出了LLADA,这是一种简单而强大的工具,它使人类驾驶员和自动驾驶汽车都可以通过调整其任务和动作计划来在新的地方进行访问规则,从而在任何地方开车。llada通过利用大型语言模型(LLMS)在解释本地驾驶员手册中的流量规则方面的令人印象深刻的零弹性可推广性来实现这一目标。通过广泛的用户研究,我们表明LLADA的说明可用于消除野外野外未受的情况。我们还展示了LLADA在现实世界数据集中适应AV运动计划策略的能力; Llada优于我们所有指标的基线计划。请查看我们的网站以获取更多详细信息:Llada。
Qi Huang 1 Yangrui Chen 1 Zhi Zhang 1 Yanghua Peng 1 Xiang Li 1 Cong Xie 1 Shibiao Nong 1 Yulu Jia 1 Sun He 1 Hongmin Chen 1 Zhihao Bai 1 Qi Hou 1 Shipeng Yan 1 Ding Zhou 1 Yiyao Sheng 1 Zhuo Jiang 1 Haohan Xu 1 Haoran Wei 1 Zhang Zhang 1 Pengfei Nie 1 Leqi Zou 1 Sida Zhao 1 Liang Xiang 1 Zherui Liu 1 Zhe Li 1 Xiaoying Jia 1 Jianxi Ye 1 Xin Jin 2 , Xin Liu 1
开放式摄取的人类对象相互作用(HOI)的构图与检测以自然语言为指导的新型HOI的问题有关,这对于不认为以人为中心的场景至关重要。然而,先前的零射HOI检测器通常使用相同水平的图形图来模拟距离的HOI,从而在包含具有较大距离的人类对象对的场景中导致次优性能。此外,这些检测器主要依赖类别名称,并概述语言可以提供的丰富上下文信息,这对于捕获通常很少见的开放词汇概念至关重要,而单独使用类别名称的词汇量不佳。在本文中,我们引入了一种新型的端到端开放词汇HOI检测框架,该框架具有有条件的多级解码和细粒度的semantic增强(CMD-SE)(CMD-SE),从而利用了视觉语言模型(VLMS)的潜力。具体来说,我们建议通过在两部分匹配过程中结合软性结合来对具有不同特征图的不同距离的人类对象对进行建模。更重要的是,通过利用大型语言模型(LLM),例如GPT模型,我们利用了他们广泛的世界知识来生成人体部分状态的描述,以进行各种相互作用。然后,我们整合了人体部分的泛化和细粒语义,以证明相互作用的识别。在两个数据集(Swig-hoi和Hico-det)上进行的实验结果表明,我们提出的方法达到了最新的方法,可以实现开放的词汇HOI检测。代码和模型可在https://github.com/ltttpku/cmd-se-版本中使用。
随着大型语言模型(LLM)的成功,将视觉模型融入了LLM,以建立视觉语言基础模型最近引起了人们的兴趣。但是,现有的基于LLM的大型多模式模型(例如,视频播放,视频聊天)只能摄入有限数量的框架以进行简短的视频理解。在这项研究中,我们主要专注于设计一个有效有效的模型,以进行长期视频理解。我们建议以在线方式处理视频并将过去的视频信息存储在存储库中,而不是像大多数现有作品一样尝试同时进行更多框架。这使我们的模型可以参考历史视频内容以进行长期分析,而不会超过LLM的上下文长度约束或GPU内存限制。我们的内存库可以以现成的方式被缝制到当前的多模式LLMS中。我们在各种视频理解任务上进行了广泛的实验,例如长期介绍,视频问题答案和视频字幕,我们的模型可以在多个数据集中实现最新的性能。
感知在各种机器人应用中起着至关重要的作用。但是,现有的良好的数据集偏向自动驾驶场景,而未标记的SLAM数据集则很快过于拟合,并且通常缺乏环境和域变化。为了扩大这些领域的边界,我们介绍了一个名为MCD(Multi-campus数据集)的全面数据集,其中包含各种感应方式,高准确的地面真相以及在三个欧亚大学的欧亚大学校园内的挑战性环境。MCD包括CCS(经典的圆柱旋转)和NRE(非重复性环球)LIDAR,高质量的IMU(惯性测量单元),相机和UWB(URWB(Ultra-Wideband))传感器。更重要的是,在开创性的努力中,我们引入了29堂课的语义注释,超过59k稀疏的nre lidar扫描
OpenAI代表Stargate邀请合格方提交建议,以实现大规模AI数据中心的开发和建设。具体来说,Openai正在寻求地点(土地和权力)建议。目的是建立支持高级AI工作量,有助于经济发展并实现OpenAI的使命的多高夸瓦基础设施舰队。此RFP寻求提出的建议,以解决一套全面的要求,并具有确定地点和权力的特定意图,这使OpenAI的基础设施路线图能够。
1 名古屋大学材料与系统研究所,日本名古屋 2 名古屋大学电气工程系,日本名古屋 电子邮件:{imanaka; s.sugimoto; tkato}@imass.nagoya-u.ac.jp;t.bigssk@gmail.com 摘要 — 可再生能源对于向孤岛电力系统供电具有吸引力。当光伏系统 (PV) 的渗透率变大时,电力需求无法消耗所有的 PV 输出,但需要减少 PV 输出。热泵热水器和电池储能系统的需求响应 (DR) 可以减少弃电。自来水系统也适合 DR 资源,因为许多自来水系统都有大型水箱或水坝作为蓄水池。为了充分利用自来水系统的巨大灵活性,需要对 DR 资源进行多日协调控制。本文首先建立了包含多个需求响应资源的孤立电力系统优化模型,作为制定协调控制方法的第一步。对比了2周优化和1天优化下需求响应资源的运行情况,分析了5种光伏容量设置下长期规划的效果。仿真结果表明,需求响应协调控制的适用规则随季节和光伏安装容量的不同而不同。
朱利安·科尼格 1,2 |比尔吉特·阿布勒 3 |英格丽德·阿加茨 4,5,6 |托比约恩·阿克施泰特 7,8 |奥勒·安德烈亚斯森 4,9 |米娅·安东尼 10 |卡尔·尤尔根·贝尔 11 |卡佳·伯茨 12 |丽贝卡·C·布朗 13 |罗穆亚尔德·布伦纳 14 |卢卡嘉年华 15 |雨果·D·克里奇利 16 |凯瑟琳·R·卡伦 17 | Geus 18 的 Eco JC |十字架的费利伯特 11 |伊莎贝尔·吉奥贝克 19 |马克·D·费格 3 |哈坎·菲舍尔 20 |赫塔弗洛尔 21 |迈克尔·盖布勒 22,23 |彼得·J·吉安罗斯 24 | Melita J. Giummarra 25.26 |史蒂文·G·格林宁 27 |西蒙·根德尔曼 28 |詹姆斯·AJ·希瑟斯 29 |萨宾·J·赫珀茨 12 | Mandy X. 至 30 |塞巴斯蒂安·延奇克 31,32 |迈克尔·凯斯 1.33 |托拜厄斯·考夫曼 4.9 | Bonnie Klimes-Dougan 34 |斯特凡·科尔施 31.35 |玛琳·克劳奇 12 |丹尼斯·库姆拉尔 22.23 | Femke Lamers 30 |李泰浩 36 |马茨·亚历山大 7.8 |凤林10 |马丁洛策 37 |埃琳娜·马科瓦茨 38.39 |马泰奥·曼奇尼 40.41 |福尔克·曼克 12 | Kristoffer NT 价格 20,42 |斯蒂芬·B·马努克 24 |玛拉·马瑟 43 |弗朗西斯·米滕 44 |闵正元 45 |布莱恩·穆勒 17 |薇拉·穆恩奇 13 |弗劳克·尼斯 21.46 |林雅 45 |古斯塔夫·尼尔松内 8,20 |丹妮拉·奥尔多涅斯·阿库纳 31 |贝尔热·奥斯内斯 35.47 |克里斯蒂娜·奥塔维亚尼 39.48 |布伦达 WJH 彭尼克斯 30 |艾莉森·庞齐奥 45 |戈文达·R·普德尔 49 |詹尼斯·雷内尔特 22 |平忍10 |榊道子 50.51 |安迪舒曼 11 |林索伦森 35 |卡尔斯滕·施佩希特 35.52 |乔安娜·施特劳布 13 |桑德拉·塔姆 8,20,53 |米歇尔泰国 17 |朱利安·F·塞耶 54 |本杰明·乌巴尼 55 |丹尼斯·范德米 18 |劳拉·S·范维尔岑 56.57.58 |卡洛斯·文图拉-博特 59 |阿诺·维尔林格 22,23 |大卫·沃森 60 |魏鲁清 61 |朱莉娅·温特 59 |梅琳达·韦斯特伦德·施莱纳 34 |拉尔斯·T·韦斯特莱 4,9,62 |马蒂亚斯·威玛 59.63 |托拜厄斯·温克尔曼 21 |吴国荣 61 |刘贤珠 45 |丹尼尔·S·金塔纳 4.9
➢这是一个欺骗深神经网络(DNN)的实验:在第二和第四张图像中,工程师仅保留了系统用于识别吉他和企鹅的系统的元素,并更改了其余的所有内容,以使系统仍然像吉他和企鹅一样“看到”他们。➢Goodfellow等人的作品。(2014)从普遍的扰动开始打开了进一步发展的大门(Moosavi-Dezfooli等人。2017)最近的一个像素攻击,该攻击显示了如何通过在输入图像中更改一个像素来欺骗神经网络。笔记本在这里一张像素攻击原始纸
我们为不依赖于人类反馈的大型语言模型(LLMS)提出了一种新颖的增强学习(RL)框架。相反,我们的方法使用模型本身中的交叉注意信号来获得自我监督的奖励,从而指导对模型策略的迭代微调。通过分析模型在生成过程中如何“参加”输入提示,我们构建了及时的覆盖,重点和连贯性的度量。然后,我们使用这些措施来对候选响应进行排名或评分,提供了奖励信号,鼓励模型产生良好的一致,主题文本。在与标准策略梯度方法的经验比较和合成偏好模型的RL微调中,我们的方法在非RL基线的迅速相关性和一致性方面显示出显着的提高。虽然它尚未与完全监督的RLHF系统的性能相匹配,但它突出了使用最小的人类标记来扩展对齐的重要方向。我们提供了详细的分析,讨论潜在的局限性,并概述了将基于跨注意的信号与较少人类反馈相结合的未来工作。
