每篇论文的演讲时间不应超过 30 分钟,这样我们才能有足够的时间进行讨论。演讲应侧重于阐述论文的动机、相关工作、工具/研究设计、研究问题、发现、局限性和未来工作。为了使您的演讲更具洞察力,请尝试以文献为中心,并告诉观众为什么首先提出这项工作,它如何增进人们对某个主题的理解,以及它与过去其他相关工作有何不同。我们还鼓励您将指定论文与您自己的研究联系起来。您应该准备一组问题(您可以自己提出问题,也可以基于其他学生在 Piazza 上发布的问题),并在演讲后与讲师一起根据这些问题共同主持课堂讨论。
但是现在,尽管文字处理尚未完成分析,但可用性的前沿已经因为新应用程序和新界面技术的开发和引入而不断向前推进。电子邮件和计算机会议支持等通信应用程序所带来的可用性挑战远比文字处理向非程序员扩展所带来的挑战更加多样化。在当前技术中,多个用户通过极其不同的工作站类型协作访问多个应用程序。就在这些新领域的可用性问题得到阐述和探索的同时,前沿原型正在引入手势(例如手写)和语音输入以及交互式视频输出。这些新发展正在整个行业中以更快的速度、更广泛地发生,并随着时间的推移影响更多的用户。
摘要 - 为了充分利用移动操纵机器人的功能,必须在大型未探索的环境中自主执行的长途任务。虽然大型语言模型(LLMS)已显示出关于任意任务的紧急推理技能,但现有的工作主要集中在探索的环境上,通常集中于孤立的导航或操纵任务。在这项工作中,我们提出了MOMA-LLM,这是一种新颖的方法,该方法将语言模型基于从开放式摄影场景图中得出的结构化表示形式,随着环境的探索而动态更新。我们将这些表示与以对象为中心的动作空间紧密地交织在一起。重要的是,我们证明了MOMA-LLM在大型现实室内环境中新型语义交互式搜索任务中的有效性。最终的方法是零拍摄,开放式摄影库,并且可以易于扩展到一系列移动操作和家用机器人任务。通过模拟和现实世界中的广泛实验,与传统的基线和最新方法相比,我们证明了搜索效率的显着提高。我们在http://moma-llm.cs.uni-freiburg.de上公开提供代码。
最近在操纵和运动领域取得了显着进展,但移动操作仍然是一个长期以来的挑战。与运动或静态操纵相比,移动系统必须在非结构化和动态环境中可行的多种长距离任务。尽管应用程序广泛且有趣,但在开发这些系统(例如基础和手臂之间的协调)时,有很多挑战,依靠在船上感知到感知和与环境互动,最重要的是,同时整合了所有这些部分。先前的作品使用模块化技能来解决问题,以使其动机和操纵被微不足道地捆绑在一起。这引起了多个限制
随着基于人工智能 (AI) 的产品和服务在各个行业中激增,一个最重要的问题浮出水面:这些系统应该包括人类还是应该自主运行?这个问题是我们现在认为理所当然的许多服务和产品的基础。例如,考虑使用谷歌地图。我们中的许多人现在都认为这种基于人工智能的服务是理所当然的,当它指引我们从一个地方到另一个地方时,我们几乎不用考虑它会带我们去哪里。这个工具背后没有人类向导或主持人;我们甚至不能像在银行那样打电话,要求找人谈谈走错路或被带到了目的地以外的地方。如果出了问题,没有人可以帮助我们,也没有人可以投诉。
学习多个参与者之间的时空关系对于群体活动识别至关重要。不同的群体活动通常会展示视频中参与者之间的多样化互动。因此,从时空参与者演化的单一视角来建模复杂的群体活动往往很困难。为了解决这个问题,我们提出了一个独特的双路径参与者交互 (Dual-AI) 框架,它以两种互补的顺序灵活地排列空间和时间变换器,通过整合不同时空路径的优点来增强参与者关系。此外,我们在 Dual-AI 的两个交互路径之间引入了一种新颖的多尺度参与者对比损失 (MAC-Loss)。通过帧和视频级别的自监督参与者一致性,MAC-Loss 可以有效区分单个参与者表示,以减少不同参与者之间的动作混淆。因此,我们的 Dual-AI 可以通过融合不同参与者的这些判别特征来增强群体活动识别。为了评估所提出的方法,我们在广泛使用的基准上进行了大量实验,包括排球 [ 21 ]、集体活动 [ 11 ] 和 NBA 数据集 [ 49 ]。所提出的 Dual-AI 在所有这些数据集上都实现了最佳性能。值得注意的是,所提出的 Dual-AI 使用 50% 的训练数据,其性能优于许多近期使用 100% 训练数据的方法。这证实了 Dual-AI 在群体活动识别方面的泛化能力,即使在有限监督的具有挑战性的场景下也是如此。
最近进步[20,29,30]中的2D图像结构,以方法为例,例如在广泛的文本图像配对数据集中受过训练的扩散模型(例如,Laion-series [31]),在与文本提示符的一致性图像中取得了显着的前进。尽管取得了成功,但实现对图像产生的精确控制以满足复杂的用户期望仍然是严重的挑战。ControlNET [38]通过在特定条件数据集上进行微调修改Foun-odation-2D扩散模型来解决此问题,从而提供由用户特异性输入引导的微妙控制机制。另一方面,尽管有希望的进展[27,35],但与2D图像生成中遇到的那些相比,3D对象的生成更为复杂。al-尽管从透视感中观察到了进步,包括直接3D数据集[10,25]上的3D扩散模型,以及将2D扩散率提升到3D复位(例如NERF [21])通过SDS损失的技术优化[27],没有完全对生成Ob-Ob-ob-ob-ob-jects的控制。对初始文本提示或2D参考图像的依赖严重限制了发电的可控性,并且通常会导致质量较低。文本提示缺乏准确传达复杂3D设计的特异性;尽管2D参考图像可以告知3D重建,但它们并没有捕获3D结构的完整深度,可能导致各种意外的人类。此外,基于2D图像的个性化缺乏直接3D操纵可以提供的灵活性。这些障碍表明需要采取不同的策略。实现可控制的3D发电的直接想法是将控制网络调整为3D生成。但是,该策略遇到了重大障碍:(i)3D的控制信号本质上更为复杂,这使得与2D范式相比,有条件的3D数据集对构成的3D数据集进行了挑战; (ii)3D域中没有强大的基础模型,例如2D [20]的稳定扩散,阻碍了此时开发微调技术的可能性。结果,我们倾向于
过去五年来呈现了一系列全球紧急情况,这对妇女的经济福祉产生了不成比例的影响。朝着增加妇女参与劳动力的进步已经停滞不前,在妇女赋予妇女经济能力的其他方面的进步也减慢甚至逆转。的回应尚未得到充分的保护并保留了近几十年来的性别平等增长,这些趋势在低收入国家中令人震惊,这些国家继续面临诸如高债务水平,缺乏财政空间,外国援助和停滞经济的挑战。
在过去的30年中,环境和气候灾难加剧,通过加剧性别不平等并威胁其权利,生计,健康和健康,对妇女和女孩产生了不成比例的影响。尽管在保护生物多样性,在土地上工作以及有效的环境和气候治理方面的作用至关重要,但在决策中,妇女的人数仍然不足。妇女和女孩,特别是来自土著社区和地方社区的妇女和女孩,通常没有充分的保护或资源,领导环境宣传。为了实现可持续发展,必须确保妇女平等参与绿色,蓝色和护理经济体,并显着增加对性别响应性的气候融资。
背景 ................................................................................................................................ 1 目标 ................................................................................................................................ 2 交互系统 .............................................................................................................................. 2 过去 .............................................................................................................................. 2 现在 .............................................................................................................................. 2 未来 .............................................................................................................................. 3 实用性和可用性 ............................................................................................................. 4 实用性 ............................................................................................................................. 4 可用性 ............................................................................................................................. 4 为什么 HCI 很重要? ............................................................................................................. 5 生产力 ............................................................................................................................. 5 生活质量 ............................................................................................................................. 5 安全关键系统