1. 明确定义的主题词汇或分类 2. 足够且高质量的培训和评估数据 3. 具备必要技能的员工 [下一张幻灯片] 4. 计算资源(有时从笔记本电脑到大型服务器)
资金:Jo Pierson 获得了 DELICIOS 项目(社会技术系统中的决策委托给自主代理)的支持,该项目由佛兰德斯研究基金会 (FWO)(拨款 G054919N)资助,Aphra Kerr 感谢 ADAPT 中心的支持,该中心由爱尔兰科学基金会研究中心计划(拨款 13/RC/2106_P2)资助。竞争利益:作者声明不存在影响文本的竞争利益。许可:这是一篇开放获取的文章,根据 Creative Commons Attribution 3.0 许可(德国)的条款分发,允许在任何媒体中不受限制地使用、分发和复制,前提是正确引用原始作品。https://creativecommons.org/licenses/by/3.0/de/deed.en 版权归作者所有。
学习多个参与者之间的时空关系对于群体活动识别至关重要。不同的群体活动通常会展示视频中参与者之间的多样化互动。因此,从时空参与者演化的单一视角来建模复杂的群体活动往往很困难。为了解决这个问题,我们提出了一个独特的双路径参与者交互 (Dual-AI) 框架,它以两种互补的顺序灵活地排列空间和时间变换器,通过整合不同时空路径的优点来增强参与者关系。此外,我们在 Dual-AI 的两个交互路径之间引入了一种新颖的多尺度参与者对比损失 (MAC-Loss)。通过帧和视频级别的自监督参与者一致性,MAC-Loss 可以有效区分单个参与者表示,以减少不同参与者之间的动作混淆。因此,我们的 Dual-AI 可以通过融合不同参与者的这些判别特征来增强群体活动识别。为了评估所提出的方法,我们在广泛使用的基准上进行了大量实验,包括排球 [ 21 ]、集体活动 [ 11 ] 和 NBA 数据集 [ 49 ]。所提出的 Dual-AI 在所有这些数据集上都实现了最佳性能。值得注意的是,所提出的 Dual-AI 使用 50% 的训练数据,其性能优于许多近期使用 100% 训练数据的方法。这证实了 Dual-AI 在群体活动识别方面的泛化能力,即使在有限监督的具有挑战性的场景下也是如此。
这些应用只是计算机视觉巨大潜力的冰山一角。随着机器学习、硬件功能和数据可用性的进步,该领域继续快速扩展。计算机视觉技术还在零售、游戏、增强现实、工业自动化、机器人技术和文化遗产保护等领域得到应用。随着计算机视觉的发展,我们可以期待在 3D 重建、对象跟踪、人体姿势估计、面部识别和视觉场景的语义理解等领域取得进一步突破。通过利用计算机视觉的力量,我们可以开拓视觉理解的新领域,彻底改变行业,并创造创新的解决方案,增强我们对视觉世界的感知和互动。
结论:创新 Adda 是促进创新和创造性解决问题的重要空间。通过团结来自不同背景的热情人士,该计划旨在创建一个支持性生态系统,不仅鼓励创新,还促进创新者与各个行业的关键利益相关者之间建立有意义的联系。这次讨论体现了通过人工智能和创造性创新解决国家和全球挑战的合作和知识交流潜力。
虽然基础模型有时被认为与“通用人工智能”(GPAI)完全相同,但实际上它们只是众多 GPAI 类型中的一种(尽管非常强大)。其他 GPAI 类型包括(通常非常基础的)用于一系列任务(例如模式检测或翻译)的 AI 系统。
气候变化对人类的可持续性构成了前所未有的风险。这一巨大挑战威胁着民用基础设施、农业、公共卫生、经济安全和国际和平,而世界上最缺乏服务的社区则面临着最大的负担。建造海堤等全球适应措施预计每年将花费 2800 亿至 5000 亿美元;及早适应将最大限度地提高效率、弹性和成本效益。科学的不确定性对公共和私人气候适应决策构成了两个关键挑战:1. 气候强迫因素(人口和经济增长、技术发展、土地使用)无法准确预测,导致情景不确定性。这些不确定性主导着未来约 40 年后的气候估计。2. 预测未来气候的气候模型过于不精确。例如,到 2055 年,对于中等排放路径,全球气温可能上升 0.9°C 至 2.0°C,全球平均海平面可能上升 0.19 米至 0.33 米。区域预测甚至更不准确。模型不确定性存在于所有时间尺度,但在短期(10 至 40 年)内占主导地位,因此阻碍了当今关于适应、投资、安全和弹性的决策。
药物发现是寻找治疗新疾病的药物的过程。它涉及靶标识别、靶标验证、先导化合物识别和先导化合物优化。识别对疾病有特定功能的蛋白质称为靶标识别。根据发明人的思维过程验证靶标称为靶标验证。针对靶标蛋白识别最佳化合物的过程称为先导化合物识别。先导化合物优化是确保化合物具有与药物相关的特性的过程。发明人必须确保所识别化合物的生物利用度、特异性和毒性。用动物测试化合物以检查化合物反应的过程称为临床前测试。图 1 解释了药物发现和开发时间表。