我们引入了 N ATURAL P LAN ,这是一个自然语言中的现实规划基准,包含 3 个关键任务:旅行规划、会议规划和日历安排。我们将评估重点放在 LLM 的规划能力上,并提供关于任务的完整信息,方法是将 Google 航班、Google 地图和 Google 日历等工具的输出作为模型的上下文。这样就无需使用工具使用环境来评估规划上的 LLM。我们观察到 N ATURAL P LAN 是针对最先进模型的具有挑战性的基准。例如,在旅行规划中,GPT-4 和 Gemini 1.5 Pro 分别只能实现 31.1% 和 34.8% 的解决率。我们发现,随着问题复杂性的增加,模型性能急剧下降:当有 10 个城市时,所有模型的性能都低于 5%,这凸显了 SoTA LLM 在自然语言规划方面存在巨大差距。我们还对 N ATURAL P LAN 进行了广泛的消融研究,以进一步阐明自我校正、少量泛化和具有长上下文的上下文规划等方法对改进 LLM 规划的 (不) 有效性。
当人类玩虚拟赛车游戏时,他们会使用游戏屏幕上的视觉环境信息来理解环境中的规则。相比之下,表现优于人类玩家的最先进的逼真赛车游戏 AI 代理不使用基于图像的环境信息,而是使用环境提供的紧凑而精确的测量值。本文提出了一种基于视觉的控制算法,并使用 Gran Turismo Sport (GTS)(一种高保真逼真赛车模拟器)将其与人类玩家在逼真赛车场景中相同条件下的表现进行了比较。在所提出的方法中,构成传统最先进方法中观察结果一部分的环境信息被从游戏屏幕图像中提取的特征表示所取代。我们证明,即使使用游戏屏幕图像作为高维输入,所提出的方法也能在高速驾驶场景下执行专家级的人类车辆控制。此外,它在计时赛任务中的表现优于 GTS 中的内置 AI,其得分使其在约 28,000 名人类玩家中排名前 10%。
11:00-11:45:计划,抽样和理解您的结果。 艾莉森·瓦茨(Alison Watts),新罕布什尔大学。 11:45-13:00:在您自己的13:00-13:30上午餐:使用环境DNA MetabarCoding评估Chesapeake湾的脊椎动物生物多样性。 劳伦·罗德里格斯(Lauren Rodriguez),因斯布鲁克大学。 13:30-14:00:使用Edna对底栖大型无脊椎动物进行采样的见解。 罗伯特·希尔德布兰德(Robert Hilderbrand),马里兰大学环境科学中心。 14:00-14:15:下午休息14:15-14:45:切萨皮克湾条形码倡议和无效的鱼监测。 Matthew Ogburn,史密森尼环境研究中心。 14:45-15:30:圆桌讨论和总结。 讨论以确定数据需求,方法论挑战,新应用程序,采购这些分析服务时要询问的问题。 15:30:休会11:00-11:45:计划,抽样和理解您的结果。艾莉森·瓦茨(Alison Watts),新罕布什尔大学。11:45-13:00:在您自己的13:00-13:30上午餐:使用环境DNA MetabarCoding评估Chesapeake湾的脊椎动物生物多样性。 劳伦·罗德里格斯(Lauren Rodriguez),因斯布鲁克大学。 13:30-14:00:使用Edna对底栖大型无脊椎动物进行采样的见解。 罗伯特·希尔德布兰德(Robert Hilderbrand),马里兰大学环境科学中心。 14:00-14:15:下午休息14:15-14:45:切萨皮克湾条形码倡议和无效的鱼监测。 Matthew Ogburn,史密森尼环境研究中心。 14:45-15:30:圆桌讨论和总结。 讨论以确定数据需求,方法论挑战,新应用程序,采购这些分析服务时要询问的问题。 15:30:休会11:45-13:00:在您自己的13:00-13:30上午餐:使用环境DNA MetabarCoding评估Chesapeake湾的脊椎动物生物多样性。劳伦·罗德里格斯(Lauren Rodriguez),因斯布鲁克大学。13:30-14:00:使用Edna对底栖大型无脊椎动物进行采样的见解。 罗伯特·希尔德布兰德(Robert Hilderbrand),马里兰大学环境科学中心。 14:00-14:15:下午休息14:15-14:45:切萨皮克湾条形码倡议和无效的鱼监测。 Matthew Ogburn,史密森尼环境研究中心。 14:45-15:30:圆桌讨论和总结。 讨论以确定数据需求,方法论挑战,新应用程序,采购这些分析服务时要询问的问题。 15:30:休会13:30-14:00:使用Edna对底栖大型无脊椎动物进行采样的见解。罗伯特·希尔德布兰德(Robert Hilderbrand),马里兰大学环境科学中心。14:00-14:15:下午休息14:15-14:45:切萨皮克湾条形码倡议和无效的鱼监测。 Matthew Ogburn,史密森尼环境研究中心。 14:45-15:30:圆桌讨论和总结。 讨论以确定数据需求,方法论挑战,新应用程序,采购这些分析服务时要询问的问题。 15:30:休会14:00-14:15:下午休息14:15-14:45:切萨皮克湾条形码倡议和无效的鱼监测。Matthew Ogburn,史密森尼环境研究中心。14:45-15:30:圆桌讨论和总结。讨论以确定数据需求,方法论挑战,新应用程序,采购这些分析服务时要询问的问题。15:30:休会
触摸技术有望取代客机驾驶舱中现有的飞行员系统界面。使用触摸屏为飞行员和制造商提供了许多优势。然而,它也给航空安全带来了重大潜在风险。在本文中,我们探索了未来飞行员触摸式飞行控制面板的设计空间。我们尝试设计在不稳定条件下更具物理性和鲁棒性的手势,并且需要更少的视觉焦点,这些手势基于利用空间和本体感受技能的方向性手势和布局。我们观察了在湍流条件下实际飞行过程中控制面板的使用情况。这让我们探索了触摸式交互技术在使用环境恶化的情况下的局限性,并探索了有形和具体交互中的有形属性如何帮助设计这些手势。这也让我们更好地理解了触摸式交互和有形交互之间模糊的边界,并通过迭代构建明确的设计空间来反思退化环境中的交互设计原则。© 2019 作者。由 Elsevier B.V. 出版。同行评审由第 8 届国际航空运输会议 – INAIR 2019、全球航空趋势科学委员会负责 关键词:触摸式交互;基于手势的交互;有形交互;有形交互设计方法;有形框架;退化环境;航空学
与计算机的各种可能的交互是一个不断发展的话题,计算机的使用比以往任何时候都更加普遍。在手头有常规用例和交互的情况下,从用户的角度进行设计并非易事。为军事环境中的用户进行设计可能更加困难,因为所述用户的工作环境要求很高。本论文旨在研究如何重新设计现有的 GUI 以减少在越野车和户外天气中操作软件的环境挑战性环境的影响。为了重新设计 GUI,我们执行了以用户为中心的设计过程。该过程通过使用情境访谈和亲和图的方法来收集和分析数据,从而更深入地了解用户的问题和需求。在定义了重新设计的不同关键元素后,开发了一个原型。第一个原型由军事环境之外的软件经验丰富的用户评估。根据用户的反馈,创建了该软件的另一个开发版本,并由该软件的当前用户在军事环境中进行访谈来评估。评估表明,用户认为 GUI 的重新设计将有助于缓解软件使用环境中的挑战性问题,并提高工作质量。
在纽约人因服药过量死亡人数连续四年增加之后,2023 年因服药过量死亡人数保持稳定,从 2022 年的 3,070 人死亡减少 1% 至 2023 年的 3,046 人死亡。尽管如此,服药过量仍然是纽约市 (NYC) 过早死亡的主要原因,也是纽约市卫生局健康纽约战略的核心重点,旨在提高预期寿命并为所有人打造更健康的城市。不受管制的阿片类药物供应中存在芬太尼(一种比海洛因强 30 到 50 倍的合成阿片类药物),这继续加剧了服药过量危机。服药过量风险也是影响健康和福祉的结构性条件的产物,以及获得优质医疗保健和服务的机会;潜在的心理和身体健康状况;以及使用环境和条件。纽约市卫生局按人口统计群体、地理位置和服药过量环境衡量和报告服药过量死亡人数。本报告提供了 2023 年纽约市意外药物中毒死亡(也称为过量死亡或过量死亡率)的临时数据。结果用于指导纽约市卫生局和全市的社区应对工作。主要发现
环境承诺 SDDOT 致力于保护环境,并使用环境承诺作为工程师和承包商的沟通工具,以确保注意避免、尽量减少和/或减轻环境影响。已向各机构和公众做出环境承诺,以确保该项目获得批准。如果未充分解决已确定的环境影响,具有许可权的机构可以推迟项目。除非另有指定,否则承包商在与这些承诺相关事宜上的主要联系人将是项目工程师。在施工期间,项目工程师将验证承包商是否已满足环境承诺要求。未经 SDDOT 环境办公室事先书面批准,这些环境承诺不得更改。可通过以下网址的《环境程序手册》获取有关 SDDOT 环境承诺的更多指导:< https://dot.sd.gov/media/documents/EnvironmentalProceduresManual.pdf > 对于可能对环境承诺产生影响的现场变更单的问题,项目工程师将联系环境工程师,电话为 605-773-3180 或 605-773-4336,以确定是否需要进行环境分析和/或资源机构协调。施工完成后,项目工程师将审查项目的所有环境承诺并记录其完成情况。承诺 B:联邦威胁、濒危和
环境承诺 SDDOT 致力于保护环境,并使用环境承诺作为工程师和承包商的沟通工具,以确保注意避免、尽量减少和/或减轻环境影响。已向各机构和公众做出环境承诺,以确保该项目获得批准。如果未充分解决已确定的环境影响,具有许可权的机构可以推迟项目。除非另有指定,否则承包商在与这些承诺相关事宜上的主要联系人将是项目工程师。在施工期间,项目工程师将验证承包商是否已满足环境承诺要求。未经 SDDOT 环境办公室事先书面批准,这些环境承诺不得更改。可通过以下网址的《环境程序手册》获取有关 SDDOT 环境承诺的更多指导:< https://dot.sd.gov/media/documents/EnvironmentalProceduresManual.pdf > 对于可能对环境承诺产生影响的现场变更单的问题,项目工程师将联系环境工程师,电话为 605-773-3180 或 605-773-4336,以确定是否需要进行环境分析和/或资源机构协调。施工完成后,项目工程师将审查项目的所有环境承诺并记录其完成情况。承诺 B:联邦威胁、濒危和
光场可视化技术已开始通过商用设备出现,虽然它在消费市场上的出现已经指日可待,但光场显示器融入我们日常活动的那一天仍未到来。然而,仅仅因为光场显示器尚未成为我们日常生活的一部分,并不意味着它们尚未为专业使用环境做出贡献。国防应用就是这样一种用例类别,这些设备令人望而生畏的开发和制造费用并没有真正吓倒可用的预算。事实上,现代战争正在大力投资于新颖的可视化技术和尖端创新,无论是为战场上服役的人,还是为制定战略机动和战术决策的人。后者本质上是基于大量数据做出决策的过程。这种过程的成功从根本上受到可用信息和投影信息的传递效率的影响。在本文中,我们介绍了我们在光场战场可视化方面的工作以及光场在国防和战争目的的其他相关应用。除了传统方法外,我们还提出了多种最适合所研究用例的替代解决方案。我们的工作优先考虑可视化质量和用户交互。关于系统属性,特别关注视野和角度分辨率
抽象铝是当今使用最广泛的材料,因为包括铝是一种轻质金属,具有相对较高的拉伸强度,良好的形式形式(形式),对腐蚀和非磁性性具有抗性和非磁性性,因此铝在包括飞机行业在内的工业世界中是一种选择。但是,在包括铝合金7075在内的腐蚀环境中,金属仍然会腐蚀,该铝合金通常用于飞机行业。控制腐蚀的努力之一是使用抑制剂。抑制剂是一种化学物质,将其添加到较小的腐蚀环境中时,可以有效地减慢或降低腐蚀速度。测试包括测试机械性能作为支持数据以测试组成(拉伸测试,硬度测试和微结构)和腐蚀速率测试。测试使用环境中潜在的极化方法(TAFEL图)进行的腐蚀速率3.5%NaCl。使用的抑制剂类型是Na 2 WO 4的无机抑制剂,其浓度变化为0.1%,0.3%,0.5%和0.7%。结果表明,浓度为0.1%的抑制剂是降低腐蚀速率的最佳抑制剂浓度。腐蚀速率抑制剂的浓度越高。关键字:铝7075,腐蚀,抑制剂,钨,飞机。简介