我们检验了以下假设:从机器人技术(Active Interonnect(AICON))中的算法MIC信息处理模式可以用作实现人类视力的有用表示。我们为两种视觉幻觉创建了基于AICON的计算模型:形状粘合颜色的后代和通过运动沉默。模型再现了人类中看到的效果,并产生了我们通过人类心理物理实验验证的新颖预测。模型预测与实验结果之间的不一致是通过迭代模型调整解决的。对于形状粘合颜色的后效应,该模型预测和例外证实了对概述形状操作的后效应较弱,并且在感知后的后效应中的个体差异。为了通过运动,该模型预测和实验验证了意外趋势以及个体差异。我们的发现表明了AICON捕获人类视觉信息处理相关方面的能力,包括个人的变异性。它突出了合成学科和生物学科之间新型合作的潜力。关键字:计算建模,vi-sual智能,跨学科,概念,视觉错觉
2.1 接口管理:定义和实施 8 2.1.1 什么是接口? 8 2.1.1.1 定义 8 2.1.1.2 接口的分类 10 2.1.2 如何管理接口? 13 2.1.2.1 界面管理的定义 13 2.1.2.2 界面管理的五大支柱 15 2.1.2.3 界面管理:精益建造支持工具 25 2.1.3 界面管理的常用工具 28 2.1.3.1 IDEF0 28 2.1.3.2 设计结构矩阵 30 2.2 工作分解结构 33 2.2.1 工作分解结构的定义 33 2.2.1.1 一般定义 33 2.2.1.2 表示 34 2.2.1.3 面向产品还是面向活动的分解? 35 2.2.1.4 WBS 矩阵 40 2.2.1.5 WBS 的详细程度 41 2.2.2 WBS 的功能 42 2.2.2.1 时间和成本控制 43 2.2.2.2 技术控制 45 2.2.2.3 未来项目评估和企业学习 46 2.2.2.4 信息管理和沟通 46 2.2.2.5 组织结构定义 47 2.2.3 与使用 WBS 相关的问题 47
近年来,人工智能产生的内容(AIGC)取得了显着进步,具有多种输入方式,例如,文本,图像,视频,音频和3D。3D是对现实世界3D环境的最亲密的模式,并具有巨大的知识。3D内容构成既显示学术和实践价值观,同时还展示了强大的技术挑战。本综述旨在巩固3D Content Generation的新兴领域内的发展。具体而言,提出了一种新的分类法,将现有方法分为三种类型:3D天然生成方法,基于2D先验的3D生成方法和混合3D生成方法。调查涵盖了跨越主要技术的60篇论文。此外,我们讨论了3D内容生成技术的局限性,并指出了开放的挑战以及有希望的未来工作的指导。伴随着这种情况,我们建立了一个项目网站,其中提供了3D内容生成研究的资源。项目页面可在https://github.com/hitcslj/awesome-aigc-3d上找到。
我们介绍了Physgaussian,这是一种新方法,将物理扎根的牛顿动力学无缝地集成在3D高斯人中,以实现高质量的新型运动合成。采用自定义材料方法(MPM),我们的方法丰富了3D高斯内核,具有物理意义的运动学变形和机械应力属性,所有这些都符合连续力学原理。我们方法的定义特征是物理模拟和vi-sual渲染之间的无缝集成:这两个组件都利用相同的3D gaus-sian内核作为离散表示。这否定了三角/四面体缝合,行进的立方体,“笼子网格”或任何其他几何嵌入的必要性,突出了“您所看到的就是您所见的原则(WS 2)。”我们的方法证明了各种材料(包括弹性实体,塑料金属,非牛顿液和颗粒状材料)的特殊效果,展示了其在创建具有新颖观点和运动的Di-Verse视觉内容方面的强大能力。我们的项目页面是:https://xpandora.github。io/ physgaussian/。
摘要。本文介绍了我们使用形式化方法开发符合 ARINC 661 规范标准的人机界面 (HMI) 的经验,该界面可用于交互式驾驶舱应用程序。此开发依赖于我们在 FORMEDICIS 1 项目中提出并正式定义的 FLUID 建模语言。FLUID 包含指定 HMI 所需的基本功能。为了开发多用途交互式应用程序 (MPIA) 用例,我们遵循以下步骤:使用 FLUID 语言编写 MPIA 的抽象模型;此 MPIA FLUID 模型用于生成 Event-B 模型,以检查功能行为、用户交互、安全属性以及与域属性相关的交互;Event-B 模型还用于使用 ProB 模型检查器检查时间属性和可能的情况;最后,使用 PetShop CASE 工具将 MPIA FLUID 模型转换为交互式协作对象 (ICO),以验证动态行为、视觉属性和任务分析。这些步骤依赖于不同的工具来检查内部一致性以及可能的 HMI 属性。最后,使用 FLUID 对 MPIA 案例研究进行正式开发并将其嵌入到其他正式技术中,证明了我们在 FORMEDICIS 项目中定义的方法的可靠性、可扩展性和可行性。
经过训练以执行视觉任务的深度神经网络 (DNN) 会学习与灵长类动物大脑中视觉区域层次结构相一致的表征。这一发现意味着灵长类动物的视觉系统通过将表征传递给大脑区域的层次序列来形成表征,就像 DNN 通过将表征传递给层的层次序列来形成表征一样。为了检验这一假设的有效性,我们优化了 DNN,使其不执行视觉任务,而是直接预测人类视觉区域 V1–V4 中的大脑活动。通过大量人类大脑活动样本,我们构建了针对大脑优化的网络,它比针对任务优化的网络更准确地预测大脑活动。我们表明,针对大脑优化的网络可以学习与严格层次结构中形成的表征不同的表征。针对大脑优化的网络不需要将 V1–V4 中的表征与层深度对齐;此外,它们能够准确地模拟前脑区域(例如 V4),而无需计算与后脑区域(例如 V1)相关的中间表示。我们的研究结果挑战了人类视觉区域 V1–V4(就像 DNN 的早期层)充当更高级区域的串行预处理序列的观点,并表明它们可能有助于它们自己的独立功能。
近年来,基于注意机制的图像分类越来越受欢迎。最先进的基于注意机制的分类方法通常需要大量的训练集,并且假设图像的标签仅取决于图像中的单个对象(即感兴趣区域)。然而,在许多实际应用中(例如医学成像),收集大型训练集的成本非常高。此外,每张图像的标签通常由多个感兴趣区域(ROI)共同确定。幸运的是,对于这类应用,通常可以收集每张训练图像中 ROI 的位置。在本文中,我们研究了引导式多注意分类问题,其目标是在(1)样本量小和(2)每张图像有多个 ROI 的双重约束下实现高精度。我们提出了一个用于多注意分类的模型,称为引导式注意循环网络(GARN)。与现有的基于注意力机制的方法不同,GARN 利用了多个 ROI 的引导信息,因此即使样本量较小,也能很好地发挥作用。对三种不同视觉任务的实证研究表明,我们的引导注意力方法可以有效提升多注意力图像分类的模型性能。
摘要。协作感知最近受到了广泛的关注,因为它通过跨性别信息共享增强了自动驾驶汽车的感知能力。但是,不可避免的协作噪声阻碍了存在系统的性能,这会导致功能级的空间虚构对合作者共享的信息。在本文中,我们提出了一个模型不稳定和轻巧的插件,以减轻功能级的未对准问题,称为动态功能对齐(NEAT)。整洁插件的优点为三倍。首先,我们引入了一项重要的引导查询建议,以通过太空通道语义和外观环境冗余来预测潜在的前景区域。在此基础上,提出了一个可变形的特征对齐方式,以通过查询意识的空间关联明确地对齐合作者共享的特征,从而汇总了具有纠正率不匹配属性的多层次的Vi-Sual线索。最终,我们执行了一个区域交叉发音强化,以促进对齐表示的扩散并实现全球特征语义增强。整洁可以轻松地插入现有的协作感知程序中,并显着提高了香草基线对姿势和传播延迟的鲁棒性。在嘈杂设置下的四个协作3D对象检测数据集上进行了广泛的实验,确认,整洁的大多数方法具有不同结构的方法。
人工智能中有许多研究领域已经为公众提供了实际应用。自然语言处理 (NLP) 是人工智能的一个子集,它构建了用于分析和建模人类文本的计算工具,例如机器翻译、摘要和问答。NLP 在我们的日常实用工具中占有重要地位,包括电子邮件过滤器、搜索结果和预测文本。机器视觉是人工智能的另一个子集,旨在模拟人类智能的视觉感知部分。通过结合硬件和软件工具,机器视觉旨在分析图像并为人类指导提供预测见解。机器视觉的一个流行应用是自动驾驶汽车:自动驾驶汽车使用多个摄像头、激光雷达、雷达和超声波传感器来处理汽车周围的视野,以便做出驾驶决策。机器视觉的另一个主要应用是医疗保健。从生物医学图像分析到手术指导,机器视觉使医疗保健提供者能够更早地发现疾病并制定预防措施以优化健康结果。与机器视觉重叠的人工智能的一个子集是机器人技术。虽然我们认为机器人技术领域涵盖了像索菲亚这样的人形机器人,但机器人领域中还有许多其他子领域。例如
摘要。本文介绍了我们使用形式化方法开发符合 ARINC 661 规范标准的人机界面 (HMI) 的经验,该界面可用于交互式驾驶舱应用程序。此开发依赖于我们在 FORMEDICIS 1 项目中提出并正式定义的 FLUID 建模语言。FLUID 包含指定 HMI 所需的基本功能。为了开发多用途交互式应用程序 (MPIA) 用例,我们遵循以下步骤:使用 FLUID 语言编写 MPIA 的抽象模型;此 MPIA FLUID 模型用于生成 Event-B 模型,以检查功能行为、用户交互、安全属性以及与域属性相关的交互;Event-B 模型还用于使用 ProB 模型检查器检查时间属性和可能的情况;最后,使用 PetShop CASE 工具将 MPIA FLUID 模型转换为交互式协作对象 (ICO),以验证动态行为、视觉属性和任务分析。这些步骤依赖于不同的工具来检查内部一致性以及可能的 HMI 属性。最后,使用 FLUID 对 MPIA 案例研究进行正式开发并将其嵌入到其他正式技术中,证明了我们在 FORMEDICIS 项目中定义的方法的可靠性、可扩展性和可行性。