学习多个参与者之间的时空关系对于群体活动识别至关重要。不同的群体活动通常会展示视频中参与者之间的多样化互动。因此,从时空参与者演化的单一视角来建模复杂的群体活动往往很困难。为了解决这个问题,我们提出了一个独特的双路径参与者交互 (Dual-AI) 框架,它以两种互补的顺序灵活地排列空间和时间变换器,通过整合不同时空路径的优点来增强参与者关系。此外,我们在 Dual-AI 的两个交互路径之间引入了一种新颖的多尺度参与者对比损失 (MAC-Loss)。通过帧和视频级别的自监督参与者一致性,MAC-Loss 可以有效区分单个参与者表示,以减少不同参与者之间的动作混淆。因此,我们的 Dual-AI 可以通过融合不同参与者的这些判别特征来增强群体活动识别。为了评估所提出的方法,我们在广泛使用的基准上进行了大量实验,包括排球 [ 21 ]、集体活动 [ 11 ] 和 NBA 数据集 [ 49 ]。所提出的 Dual-AI 在所有这些数据集上都实现了最佳性能。值得注意的是,所提出的 Dual-AI 使用 50% 的训练数据,其性能优于许多近期使用 100% 训练数据的方法。这证实了 Dual-AI 在群体活动识别方面的泛化能力,即使在有限监督的具有挑战性的场景下也是如此。
随着机器学习方法越来越多地用于增强人类决策能力,可解释人工智能 (XAI) 研究探索了将系统行为传达给人类的方法。然而,这些方法往往无法解释人类在与解释互动时的情感反应。面部情感分析研究人类面部的情绪表达,是了解用户如何参与解释的一个有前途的视角。因此,在这项工作中,我们的目标是 (1) 确定人们与 XAI 界面交互时哪些面部情感特征会很明显,以及 (2) 开发一个多任务特征嵌入,将面部情感信号与参与者对解释的使用联系起来。我们的分析和结果表明,当参与者未能有效地使用解释时,面部 AU1 和 AU4 以及唤醒的发生和值会增加。这表明面部情感分析应该纳入 XAI,以根据个人的互动风格个性化解释,并根据执行任务的难度调整解释。
每篇论文的演讲时间不应超过 30 分钟,这样我们才能有足够的时间进行讨论。演讲应侧重于阐述论文的动机、相关工作、工具/研究设计、研究问题、发现、局限性和未来工作。为了使您的演讲更具洞察力,请尝试以文献为中心,并告诉观众为什么首先提出这项工作,它如何增进人们对某个主题的理解,以及它与过去其他相关工作有何不同。我们还鼓励您将指定论文与您自己的研究联系起来。您应该准备一组问题(您可以自己提出问题,也可以基于其他学生在 Piazza 上发布的问题),并在演讲后与讲师一起根据这些问题共同主持课堂讨论。
随着基于人工智能 (AI) 的产品和服务在各个行业中激增,一个最重要的问题浮出水面:这些系统应该包括人类还是应该自主运行?这个问题是我们现在认为理所当然的许多服务和产品的基础。例如,考虑使用谷歌地图。我们中的许多人现在都认为这种基于人工智能的服务是理所当然的,当它指引我们从一个地方到另一个地方时,我们几乎不用考虑它会带我们去哪里。这个工具背后没有人类向导或主持人;我们甚至不能像在银行那样打电话,要求找人谈谈走错路或被带到了目的地以外的地方。如果出了问题,没有人可以帮助我们,也没有人可以投诉。
用户控制图片(亮度、对比度、清晰度、背景级别、色调、颜色、降噪、伽玛选择、低蓝光、色温、颜色控制、过扫描、图片重置)、屏幕(缩放模式、自定义缩放、屏幕重置)、音频(平衡、高音、低音、音量、音频输出(线路输出)、最大。音量,最小。音量、静音、音频重置、音频输出同步、扬声器设置)、配置 1(Android 启动器、开启状态、触摸锁、触摸模式、鼠标模式、面板保存、RS232 路由、启动源、WOL、conf.1 重置、恢复出厂设置)、配置 2(OSD 超时、OSD H 位置、OSD V 位置、系统旋转、信息 OSD、徽标和动画、徽标设置、动画设置、显示器 ID、显示器信息、HDMI 版本、conf.2 重置)、高级选项(信息亭模式、侧边栏、无信号图像、电动支架、红外控制、电源 LED 灯、风扇、关闭定时器、时间表、单线 HDMI、单线 HDMI 关闭、故障转移、语言、OSD 透明度、省电、高级选项重置)
锂离子电池(LIB)已成为绿色经济过渡的重要技术,因为它们被广泛用于便携式电子,电动汽车和可再生能源系统中。固体电解质中相(SEI)是LIB的正确操作,性能和安全性的关键组成部分。SEI源于阳极 - 电解质界面的最初热量稳定性,所得的电解质还原产物通过形成电化学缓冲窗口稳定界面。本文旨在使第一个(但很重要)步骤,以增强广泛使用的反应力场(RAEXFF)的参数化,以确保对LIBS中SEI成分的精确分子动力学(MD)模拟。为此,我们专注于氟化锂(LIF),这是一种非常感兴趣的无机盐,这是由于其在钝化层中的有益特性。该协议在很大程度上依赖于各种python库,该库旨在与原子模拟一起使用,允许对所有重新聚体步骤进行强有力的自动化。所提出的配置集和所得数据集,允许新的Reaxff恢复无机盐的固体性质,并改善MD模拟中的质量传输属性预测。优化的REAXFF通过准确调节固体晶格中锂的扩散性,从而超过了先前可用的力场,从而在室温下预测的两阶提高了两阶数字。然而,我们对模拟的全面研究表明,Reaxff对训练集的敏感性很强,从而使其能够插入势能表面具有挑战性。因此,可以通过利用提出的互动重新聚体化协议来构建数据集,从而有效地利用RAEXFF的当前表述来建模特定且定义明确的现象。总体而言,这项工作代表了精确的反应性MD模拟迈克斯的重要第一步,阐明了Reaxff力场参数化的挑战和局限性。所证明的局限性强调了通过我们的交互式重新聚集协议开发更通用和先进的力场来提高仿真的潜力,从而实现了将来更准确,更全面的MD模拟。
图1:实验设置。一个带有多电极阵列的储罐,用于记录电信号,然后通过我们的自定义电控界面(EFI)进行放大并随后处理。坦克用月光下列的坦克照亮,以模拟夜间状况,并使用高架摄像头跟踪游泳行为。b代表性热图显示了活鱼对的运动模式。颜色梯度从深蓝色到黄色,指示较高的访问频率或延长的停留时间,偏爱储罐墙附近的位置。在分布中的圆形间隙概述了储罐弯曲的角和多电极阵列的位置,由八个测量电极组成,它们成对在水箱的相对侧面成对。c记录的EOD波形的出现取决于鱼对电极的相对位置。p =正,n =负。d的示例性电相互作用的时间表,垂直条代表了两条鱼的颜色编码的EOD。隔离间隔(IDI)表示同一个人连续信号之间的时间。可能会重叠。回声反应的特征是固定潜伏期(M. Rume中的15-22毫秒),一条鱼对另一种鱼的EOD做出反应。两种鱼的相互回声都会产生时间锁定的信号传导序列,称为EOD同步。
此外,在帕金森氏病,抑郁症,躁郁症,焦虑症和精神分裂症等精神病和神经系统疾病中观察到的时间感知的扭曲仍然知之甚少(Teixeira等,2013)。例如,患有抑郁症的人通常集中于过去的过去经历,并且经常报告时间似乎缓慢甚至感觉已经停止了(Ren等,2023)。同样,患有帕金森氏病的患者也倾向于感知时间更慢。另一方面,焦虑会引起时间的加速感知,尤其是在高压力和唤醒时期(Holman等,2023)。患有注意力缺陷多动障碍的人可能会感觉到时间比实际的时间更快或慢(Ptacek等,2019)。Stanghellini等。发现,精神分裂症患者可能将时间的看法描述为缺乏连续性,而感到彼此断裂的时刻(Stanghellini等,2016)。这可能表现为即时时间流的损失,使事件感到孤立和无关,这有助于组织日常活动和维持社交互动的困难。因此,时间感知的研究不仅是理解人类认知的基础,而且对实用应用具有巨大的潜力,这些应用可能会对个人和社会福祉产生积极影响,并且对于诊断和治疗各种精神病学和神经疾病具有实际意义。
(1)问题1:复杂组合中缺少特征(例如,左侧的字符x,使用工具y,右侧的字符z盯着x),尤其是当这些功能在训练集中从未出现在同一图像中时。部分解决方案,例如使用图像来调节新图像生成。但是,LDM不能轻易地“理解”图像足以将其用作起点。例如,一些用户提到:“我注意到肖像画,很多时候,人们出现了看起来不像图片的东西”。(2)第2期:由于培训集中的异常统计数据而引起的偏见:当一个人仅从听众面前公开知道一个人(例如,在培训数据集中,经常受到新闻工作者采访的人)时,很难获得自己做其他事情的图像。或,对于经常在圣经生物旁边描绘的著名歌手,用户报告说,牛和魔鬼之间的混合物。其他用户还报告未能复制一些模因,例如“为什么我不能握住所有这些柠檬”。但是,这种偏见的最著名的例子涉及在河里游泳的萨尔蒙人的要求,因为训练套装中有太多的鲑鱼食品图像,导致鲑鱼片在河里“游泳”,包括间歇泉,就像是鲸鱼一样,或者是熊试图抓住它们。(3)第3期:需要许多重新运行,要么是因为本地诉讼(例如,四臂的人,三眼的人,或者手指过多的人),要么是因为大规模错误(例如,不同角色的不良位置)。
新发布的机器人编程工具使最终用户可以通过将基于块的语言和直通式编程组合来编程工业机器人。要有效地使用这些系统,最终用户通常需要有限或没有程序经验的经验,就需要培训。要培训用户,辅导系统通常用于基于块的编程(即使是通过编程进行铅编程),但没有教程系统将这两种类型的编程结合在一起。我们提出了Coblox Interactive教程(CITS),这是一种新颖的辅导方法,它教授如何同时使用构成典型的最终用户机器人编程环境的硬件和软件组件。在用户切换两种编程样式之间,CIT为它们提供了宽敞的SCA旧,从而为用户提供了有关失误的立即反馈,并为下一步提供指导。为了评估CIT,我们使用ABB机器人技术发布的编程环境对79个工业最终用户进行了一项研究,将我们的培训方法与培训视频进行了比较,培训视频是行业中最常用的培训。这项研究是迄今为止最大的培训最终用户的研究之一,发现由CIT培训的用户比视频培训的用户更少的时间在更少的时间内撰写了更正确的程序。这表明硬件和软件概念的紧密整合是为培训最终用户编程工业机器人的范围。