尽管神经辐射场 (NeRF) 在图像新视图合成 (NVS) 方面取得了成功,但 LiDAR NVS 仍然基本上未被探索。以前的 LiDAR NVS 方法采用了与图像 NVS 方法的简单转变,同时忽略了 LiDAR 点云的动态特性和大规模重建问题。鉴于此,我们提出了 LiDAR4D,这是一个可微分的 LiDAR 专用框架,用于新颖的时空 LiDAR 视图合成。考虑到稀疏性和大规模特性,我们设计了一种结合多平面和网格特征的 4D 混合表示,以由粗到细的方式实现有效重建。此外,我们引入了从点云衍生的几何约束来提高时间一致性。对于 LiDAR 点云的真实合成,我们结合了光线丢弃概率的全局优化来保留跨区域模式。在 KITTI-360 和 NuScenes 数据集上进行的大量实验证明了我们的方法在实现几何感知和时间一致的动态重建方面具有优越性。代码可在 https://github.com/ispc-lab/LiDAR4D 获得。
其中b是包含v ∗的立方体,d是在ℝ3上所有概率度量的空间pℝ3上的合适距离函数。大多数现有的作品,很少有例外(请参见第2节)作为通常的L 2距离,(2)通过基于梯度的方法或在空间B×So3ðÞ上进行的一种详尽搜索来求解。然而,由于体积的不规则形状,f L 2的景观可能是高度非凸,基于梯度的方法将失败,初始化较差。基于详尽的基于搜索的方法可以返回更准确的结果,但如果实施天真实施,则具有巨大的成本。利用F L 2(8)的卷积结构的方法可以提高计算速度,但仍被认为是大容量的昂贵。是由这些问题激励的,在本文中,我们将基于1-Wasserstein距离的解决方案(2)提出一种对齐算法,该算法比欧几里得距离更好地反映了僵化的变换,而与欧几里得距离更好地反映了僵化的变换,从而创造了更好的损失景观。利用这一事实,我们使用贝叶斯优化的工具来最小化(2),它能够返回全局优化器,而对目标的评估比详尽的搜索要少得多。所产生的算法比现有算法提高了性能,因为我们将在真实蛋白质分子的比对上证明。
少量子比特量子逻辑门作为构造通用多量子比特门的基本单元,在量子计算和量子信息领域得到广泛应用。然而,传统的少量子比特门构造通常采用多脉冲协议,这不可避免地会在门执行过程中出现严重的内在错误。本文报告了一种通用二和三量子比特CNOT门的最优模型,该模型通过激发到具有易实现的范德华相互作用的里德堡态来实现。该门依赖于全局优化,通过遗传算法实现幅度和相位调制脉冲,从而可以用更少的光脉冲实现门操作。与传统的多脉冲分段方案相比,我们的门可以通过同时将原子激发到里德堡态来实现,从而节省了在不同空间位置进行多脉冲切换的时间。我们的数值模拟表明,当排除里德堡相互作用的涨落时,可以实现单脉冲两(三)量子比特CNOT门,对于相距7.10μm的两个量子比特,保真度可达99.23%(90.39%)。我们的工作有望在中性原子量子技术研究中实现快速便捷的多量子比特量子计算。
加州的目标是到 2030 年实现 500 万辆零排放汽车 (ZEV) 上路,到 2025 年建成 25 万个电动汽车 (EV) 充电站。为了减少这一过程中的障碍,研究团队开发了一个基于模拟的电动汽车充电基础设施设计和运营系统。电动汽车市场不断增长,电力需求不断增加,需要先进的充电基础设施和运营策略。这项研究将提供充电站设计和运营的两个模块,包括汽车充电时间表和太阳能充电站的基础设施规划模块。目标是提高客户满意度,减轻电网负担,并使用最先进的全局优化技术、基于机器学习的太阳能预测和模型预测控制 (MPC) 最大限度地提高充电站的盈利能力。这项拟议的研究具有广泛的社会影响和重大的智力价值。首先,它通过增加电动汽车用户数量并减少交通运输部门对气候变化的影响来满足绿色交通的需求。其次,优化调度工具可实现电动汽车快速充电,从而提高乘客的出行效率。第三,设计的规划工具可实现配备太阳能电池板和电池储能系统 (BESS) 的充电站的优化设计,从而有利于全国交通系统的发展。
最近的研究表明,社交辅助机器人 (SAR) 可用于各种操作环境,在这些环境中,促进人机交互和建立融洽关系取决于引发积极感觉。不同的人以不同的方式表达和感受情绪,这一事实造成了巨大的偏见,即使借助人工智能技术,也很难识别和区分情绪。这是最大的挑战之一。使用客观指标而非主观指标(如生物信号)作为情绪特征鉴别器可以缩小这一差距。先前的研究调查了使用 EEG 测量对 HRI 中的情绪进行分类,方法是查看一系列分类方法,例如使用 MLP 模型和全局优化算法应用于支持向量机、随机森林、决策树、K 最近邻和深度神经网络等方法,应用于原始和派生信号特征(例如,效价、唤醒、PSD 等)。本文介绍了一种新方法,该方法采用 3D 卷积神经网络 (3D-CNN) 来处理从 EEG 获得的地形图。据我们所知,该方法尚未在该领域进行研究。所提出的模型实现了令人印象深刻的 99.2% 的分类准确率,成功区分了积极和消极情绪,并表明将 EEG 数据转换为图像可能是一种可行的解决方案,因为它允许使用更准确的分类模型。所提出的模型的结果与最佳的最先进的模型一致。
摘要:我们提出了一种非侵入性识别心脏异位激活的方法。异位活动会触发致命的心律不齐。因此,异位灶或最早激活位点(EAS)的定位是心脏病专家决定最佳治疗方面的关键信息。在这项工作中,我们通过最大程度地减少心脏模型预测的ECG之间的不匹配(在给定的EAS上的节奏),而在异位活动期间观察到的ECG来最大程度地降低心脏模型预测的ECG之间的不匹配,从而提出识别问题作为全局优化问题。我们的心脏模型在求解躯干中的心脏激活和正向bidomain模型的各向异性核心方程方面的量具有用于计算ECG的铅方法方法。我们在心脏表面上构建了损失函数的高斯过程替代模型,以执行贝叶斯优化。在此过程中,我们迭代评估较低的置信结合标准后的损失函数,该标准结合了探索表面与最小区域的开发。我们还扩展了此框架以结合模型的多个级别。我们表明我们的过程仅在11后收敛到最低。7±10。4迭代(20个独立运行),用于单项实现案例和3个。5±1。7迭代次数。我们设想可以在临床环境中实时应用此工具,以识别潜在危险的EAS。
摘要:贝叶斯优化(BO)在大量控制应用程序中对昂贵的黑盒功能进行全局优化的数据效果表现出了巨大的希望。传统的BO是无衍生的,因为它仅依赖于性能函数的观察来找到其最佳。最近,已经提出了所谓的第一阶BO方法,该方法还将绩效函数的梯度信息进一步加速收敛。一阶BO方法主要利用标准采集功能,而间接使用内核结构中的梯度信息来学习性能功能的更准确的概率替代物。在这项工作中,我们提出了一种直接利用性能函数(Zeroth-order)及其相应梯度(第一阶)评估的梯度增强的BO方法。为此,提出了一个新型的基于梯度的采集功能,可以识别性能优化问题的固定点。然后,我们利用从多目标优化的想法来制定一种e显策略,以找到最佳贸易点的查询点,这些查询点是传统的Zeorth-rorder-rorde获取功能与拟议的基于梯度的采集函数之间的。我们展示了如何使用拟议的获取 - 增强梯度增强的BO(AEGEBO)方法来加速基于策略的增强型学习的收敛,通过将噪声观察结果结合到可以直接从闭环数据中估算的奖励函数及其梯度的噪声。将AEGBO的性能与传统的BO和基准LQR问题上众所周知的增强算法进行了比较,我们始终如一地观察到在有限的数据预算中显着提高了性能。
80 年代初期,D. Dilworth 就提出了他对人工智能在镜头设计中的看法 [1]。他谈到了当时他的公司采用的两种主要方法。第一种是“自然语言界面”,第二种是将人工智能用作专家系统。第一种方法与我们实际的人工智能概念相去甚远,但第二种方法在某种程度上是软件通过研究专家设计的镜头来制定规则,从而“学习”光学的一种手段。他认识到人工智能是所谓的“处女地”,因为没有人研究过人工智能在镜头设计中的潜力。90 年代,镜头设计的趋势是全局优化和遗传算法 [2,3,4]。Dilworth 改进了他的“专家系统”,今天我们可以将其看作是一种不同的人工智能应用 [5]。人工智能在镜头设计中的想法不再受到关注。在 2002 年的 IODC 会议上,香农做了一个关于“镜头设计五十年”的演讲;我们现在知道了什么是当时不知道的?’[6]。我从手稿中摘录了以下句子:“未来的进步可能需要在设计程序中构建更多基础知识。未来的镜头设计程序需要纳入学习和教学功能。设计程序应该成为知识的宝库,以及一套工具。”香农看到设计程序可以做更多的事情,这也许就是未来。因此在接下来的十年里,该领域出现了新的应用,第一个是计算成像 [7] ,其次是新型表面,包括泽尔尼克和自由曲面等等。这些新的镜头设计趋势需要镜头设计师尚未完全掌握的额外技能。因此,为了有效地使用它,镜头设计师需要一些帮助。这就是为什么 (也许) 最早的 AI 应用之一是关于自由曲面的 [8] 。这么多年来,我们可以肯定,从镜头设计的角度来看,如果 AI 能够做到以下几点,它就会很有用:
摘要:情绪识别是人类功能的重要组成部分。TextColorredit使个人能够对环境事件做出适当的反应并发展自我意识。大脑计算机接口(BCI)技术中的快节奏开发技术必须使未来的智能机器能够数字化和识别人类的情绪。为了实现这一目标,除其他视觉提示外,人类和机器都依赖面部表情。虽然面部表情有效地识别情绪,但它们可以人工复制,需要持续的监视。近年来,由于深度学习和机器学习技术的进步,脑电图(EEG)信号的使用已成为一种流行的情感识别方法。基于EEG识别情绪的系统涉及测量暴露于情绪刺激(例如图像,声音或视频)的受试者的大脑中的电活动。然后,使用机器学习算法来从与特定情绪状态相对应的电活动数据中提取特征。提取的脑电图信号的质量至关重要,因为它影响了系统的整体复杂性和机器学习算法的准确性。本文提出了一种方法,以提高基于脑电图的情绪识别系统的准确性,同时降低其复杂性。该方法涉及优化脑电图的数量,其放置在人头皮上以及测量信号的目标频带,以最大程度地提高高和低唤醒水平之间的差异。用于此目的的优化方法,称为简单同源性全局优化(SHGO)。实验结果表明,最佳地放置的六电极构造可以比14-电极构造获得更好的准确度,从而导致电极数量的复杂性降低了60%以上。这种方法会赋予有希望的结果,从而提高了基于脑电图的情感识别系统的效率和准确性,这可能会对各种领域产生影响,包括医疗保健,心理学和人类计算机接口。
摘要:随着人工视网膜的进步,神经形态计算在过去 20 年中已成为一个日益增长的研究领域。机器人、自动驾驶、医疗设备中的应用开始出现。然而,仍然存在一些主要问题,因为使用的方法过于频繁地模仿,甚至简单地适应为根本不同类型的数据而开发的标准基于帧的技术。这些技术通常处理批量数据,执行全局优化,同时忘记事件的基本性质。由于它们呈现场景的微小变化,我们认为在计算时应将其视为此类变化。本论文重点关注视觉里程计的案例,以开发完全基于事件的计算技术,利用现有的神经形态传感器的全部优势。使用无穷小更新,我们开发了低延迟算法,同时处理截然不同的场景动态。通过仔细分析事件流,我们相信可以在低计算成本下实现低延迟,这再次表明神经形态工程是减少计算机视觉能量足迹的一种方法。第一部分解决了屏幕跟踪问题。通过使用惯性模型,我们开发了一种高频跟踪解决方案,无需事先了解相关形状。第二组算法展示了如何从双目系统计算光流和深度,并以异步方式使用它们来计算视觉传感器自我运动估计。第三部分将前两个部分组合成一个虚拟模型,几乎不需要对场景进行任何假设即可恢复在线姿势。最后,最后一部分更深入地分析了基于事件的范式中时间的重要性,并描述了为实现正确和高效的时间处理而实施的开发框架解决方案。