摘要印度尼西亚具有明显的地热潜力,因为其地理位置位于三个主动构造板中。由于难以识别地热电位的确切位置领域,因此巨大的地热电位导致了一部分它的一部分。因此,需要勘探活动才能发现这些潜在的地热站点而没有直接探索。需要进一步发展的地热潜力位于贾瓦中部塞马朗地区的Gedongsongo地区,特别是在Ungaran山的南坡上。这项研究旨在使用Landsat 8卫星图像数据来绘制研究区域中的地热电位区域。使用归一化差异植被指数(NDVI)方法,地表温度(LST)方法和断层断裂密度(FFD)方法利用卫星数据的热图像来利用遥感的分析。这三个参数的覆盖结果在Candi Village和Kenteng Vilage地区产生了地热电位图,表明有几个预测地热势的领域。在坎迪村(Candi Village),鉴定出三个潜在的地热区域,其潜在水平高且非常高的水平,中等谱系密度范围为1.07至1.8 km2,地面地面
摘要 - 准确识别复杂的地形特征,例如土壤组成和摩擦系数,对于基于模型的计划和越野环境中移动机器人的控制至关重要。光谱特征利用光吸收和反射的不同模式来识别各种材料,从而可以精确地表征其固有特性。机器人技术的最新研究探索了光谱的采用,以增强与环境的感知和相互作用。但是,安装这些传感器所需的巨大成本和精致的设置存在着广泛采用的强大障碍。在这项研究中,我们将RS-NET(RGB引入光谱网络),这是一种深层神经网络体系结构,旨在将RGB图像映射到相应的光谱签名。我们说明了如何将RS-NET与共同学习技术协同结合,以进行地形性质估计。初始结果证明了这种方法在表征广泛的越野现实世界数据集中的光谱特征方面的有效性。这些发现仅使用RGB摄像机强调了地形性质估计的可行性。
摘要 本研究使用先进的深度学习架构全面探索了基于脑电图的运动想象分类。我们重点关注六种不同的运动想象类别,研究了卷积神经网络 (CNN)、具有长短期记忆的 CNN (CNN-LSTM) 和具有双向 LSTM 的 CNN (CNN-BILSTM) 模型的性能。CNN 架构表现出色,准确率高达 99.86%,而 CNN-LSTM 和 CNN-BILSTM 模型分别达到 98.39% 和 99.27%,展示了它们在解码与想象运动相关的脑电图信号方面的有效性。结果强调了这项研究在辅助机器人和自动化等领域的潜在应用,展示了将认知意图转化为机器人动作的能力。这项研究为脑电图分析的深度学习领域提供了宝贵的见解,为脑机接口和人机交互的进步奠定了基础。
自从 19 世纪末至 20 世纪中叶卡米洛·西特、凯文·林奇、鲁道夫·阿恩海姆和简·雅各布斯等学者的开创性工作以来,城市的视觉维度一直是城市研究的一个基本主题。几十年后,大数据和人工智能 (AI) 正在彻底改变人们移动、感知和与城市互动的方式。本文回顾了有关城市外观和功能的文献,以说明如何使用视觉信息来理解城市。引入一个概念框架——城市视觉智能,系统地阐述新的图像数据源和人工智能技术如何重塑研究人员感知和衡量城市的方式,从而能够研究物理环境及其与不同尺度的社会经济环境的相互作用。文章认为,这些新方法将使研究人员能够重新审视经典的城市理论和主题,并有可能帮助城市在当今人工智能驱动和以数据为中心的时代创造与人类行为和愿望相一致的环境。关键词:深度学习、人与环境的互动、地点、街道级图像、城市视觉智能。
oneatlas basemap是一个高度准确,精心策划的全球卫星图像参考层,可在现成。由空中客车专家策划的新鲜,高级质量图像确保一致,完整且几乎无云的覆盖范围,并在连续图像之间模仿雾度和季节性差异。Oneatlas BaseMap为任务/项目计划,更改检测,映射/路线更新和功能提取提供了灵活且具有成本效益的解决方案。它在基于位置的应用程序中也可以作为背景层运行良好。购买完整的全球层或仅感兴趣的领域,并通过流媒体,下载或API访问它。
训练高准确的3D检测器需要使用7个自由度的大规模3D注释,这是既易于且耗时的。因此,提出了点符号的形式,为3D检测中的实践应用提供了重要的前景,这不仅更容易且价格便宜,而且为对象定位提供了强大的空间信息。在本文中,我们从经验中发现,仅适应其3D形式并非遇到两个主要的瓶颈是不算气的:1)它未能在模型中编码强3D,而2)它由于极端的Spars sparsity而产生了低质量的pseudo pseudo Labels。为了克服这些挑战,我们引入了Point-Detr3D,这是一个弱小的半监督3D检测的教师学生框架,旨在在限制的实例注释预算中充分利用点的监督。与点 - dive不同,该点仅通过点编码器编码3D位置信息,我们提出了一个显式的位置查询初始化策略,以增强先验性。考虑到教师模型产生的遥远区域的伪标签质量低时,我们通过通过新型的跨模式可变形ROI融合(D-ROI)结合了密集的图像数据来增强探测器的感知。此外,提出了一种创新的点指导的自我监督学习技术,即使在学生模型中,也可以完全利用点的先验。与代表性的Nuscenes数据集进行了广泛的实验,证明了我们的观点 - DETR3D与前所未有的作品相比获得了显着改善。值得注意的是,只有5%的标记数据,Point-detr3d的完全超级可见的对应物的性能超过90%。
在全球范围内,中风幸存者的残疾率超过 80%,其中上肢运动障碍影响了 85% 以上的个人。为了应对这一挑战,基于运动想象 (MI) 的脑机接口 (BCI) 已成为一种有前途的方法,可将个人想象的运动意图转化为外部设备的控制信号。脑电图 (EEG) 信号因其非侵入性、便携性、高时间分辨率和价格实惠而常用于 MI-BCI。本研究利用了公开可用的脑电图运动/图像数据集 (EEGMMIDB),包括来自 109 名参与者的 64 通道 EEG 记录,采样率为 160 Hz。目的是直接使用长短期记忆 (LSTM) 网络在清理后的 EEG 信号上对手掌和脚的张开/闭合进行分类,从而绕过计算密集且耗时的传统特征提取方法。通过调整与时期和段长度相关的超参数,我们实现了 71.2% 的平均分类准确率。这项研究强调了深度学习方法在生成稳健的控制信号以使用 EEG 信号预测运动意图方面的有效性,从而无需使用费力的特征提取方法。通过利用深度学习模型,MI-BCI 设备可以促进神经康复,尤其是中风患者的神经康复,通过提供运动辅助,使患者能够仅通过想象力来执行动作。
使用主观问卷和心理计时测试参与研究和临床方案的受试者的 MI 能力的重要性。这将有助于首先深入了解 MI 的神经机制,其次,有助于根据患者的 IA 制定量身定制的物理治疗方案。尽管如此,我们知道 MI 是一项复杂的任务,除了主观问卷和计时表现之外,还应考虑其他几个方面,以更好地测量健康受试者的 MI 能力。因此,未来的研究需要证实我们的发现,并阐明 MI 能力与皮质激活之间的关系是否会受到参与者先前经验和运动任务类型的影响(例如,基于受试者运动曲目的任务等
33.2 一款低于 1 µ J/级的集成思维意象与控制 SoC,适用于 VR/MR 应用,具有师生 CNN 和通用指令集架构 Zhiwei Zhong*、Yijie Wei*、Lance Christopher Go、Jie Gu 西北大学,伊利诺伊州埃文斯顿 * 同等署名作者 (ECA) 虚拟现实 (VR) 和混合现实 (MR) 系统,例如 Meta Quest 和 Apple Vision Pro,最近在消费电子产品中引起了极大的兴趣,在游戏、社交网络、劳动力援助、在线购物等元宇宙中掀起了新一波发展浪潮。AI 计算和多模块人类活动跟踪和控制方面的强大技术创新已经产生了身临其境的虚拟现实用户体验。然而,大多数现有的 VR 耳机仅依靠传统的操纵杆或基于摄像头的用户手势进行输入控制和人体跟踪,缺少一个重要的信息来源,即大脑活动。因此,人们对将脑机接口 (BMI) 整合到 VR/MR 系统中以供消费者和临床应用的兴趣日益浓厚 [1]。如图 33.2.1 所示,现有的集成 EEG 通道的 VR/MR 系统通常由 VR 耳机、16/32 通道 EEG 帽、神经记录模拟前端和用于信号分类的 PC 组成。此类系统的主要缺点包括:(1)佩戴麻烦且用户外观不佳,(2)缺乏低延迟操作的现场计算支持,(3)无法根据大脑活动进行实时思维意象控制和反馈,(4)由于 AI 分类导致的功耗高。为了克服这些挑战,这项工作引入了一种思维意象设备,该设备集成到现有的 VR 耳机中,而无需为 VR/MR 系统的思维控制 BMI 增加额外的佩戴负担。本研究的贡献包括:(1)支持 VR/MR 系统现场心智意象控制的 SoC,(2)与现有 VR 耳机无缝集成并优化 EEG 通道选择,以提高用户接受度和体验,(3)具有灵活数据流的通用指令集架构 (ISA),支持广泛的心智意象操作,(4)混淆矩阵引导的师生 CNN 方案,可在 AI 操作期间节省电量,(5)EEG 信号的稀疏性增强以降低能耗。制造了 65nm SoC 测试芯片,并在各种基于心智意象的 VR 控制上进行了现场演示。虽然先前的研究涉及基于 EEG 的癫痫检测或类似的生物医学应用 [2-6],但本研究专注于 VR/MR 环境中的新兴 BMI。得益于低功耗特性和设计的系统级优化,SoC 的数字核心在计算密集型 CNN 操作中实现了 <1μJ/类的能耗。图 33.2.2 显示了 EEG 通道选择和集成到 Meta Quest 2 VR 耳机中,在准确性和用户便利性之间进行了权衡。为了支持各种思维意象任务,8 个 EEG 通道 T3、T5、O1、O2、T6、T4、PZ、和 CZ 被选中并巧妙地融入头带以保持用户的美感。不同的心理任务会激活八个选定通道的子集,例如用于心理意象的 T3/T5/CZ/T4/T6、用于情感(例如情绪)监测的 T5/CZ 或用于稳态视觉诱发电位 (SSVEP) 的 O1/O2/PZ。通道的减少导致三个主要任务的平均准确率略有下降(从 90.4% 下降到 85.2%),但显着提高了用户体验和可用性。带有生理盐水的商用 Hydro-link 电极用于通过头带上的预切孔捕获 EEG 信号。图 33.2.2 还显示了完全集成 SoC 的顶层图。多达 16 个可编程通道的 AFE 用于信号采集和数字化。 AFE 的每个通道包括一个增益为 45 至 72 dB、带宽为 0.05 至 400 Hz 的两级斩波放大器、一个转折频率为 60 Hz 的低通滤波器和一个工作频率为 128 Hz 至 10 kHz 的 8b SAR ADC。用于集成 AI 操作的数字核心包括一个 8×10 处理单元 (PE) 阵列、控制逻辑和相关存储库。带有专门开发的 ISA 的指令存储器为芯片的操作提供全局控制,以支持一系列思维意象任务。实时分类的大脑状态和思维控制命令通过外部蓝牙模块传输到 VR 耳机,以控制 VR 场景。虽然大多数现有研究仅关注固定数据流 [4] 和 CNN 模型 [2,3],但需要高度灵活的计算架构来支持各种思维意象任务。图 33.2.3 显示了专门开发的通用 ISA,用于数据流控制、模型配置、通道选择等。128b 的超宽 ISA 命令用于监督各种计算任务,例如 IIR 滤波器、卷积 (Conv) 层、离散傅里叶变换 (DFT) 和全连接 (FC) 层,具有很高的硬件效率。为了支持不断变化的 AI 模型,每个子任务的配置(例如内核数量、层数、分支目标地址 (BTA)、稀疏性设置等)也集成到 ISA 中,以便高效地调度和执行不同的任务。图 33.2.3 还显示了数字神经处理器的详细架构。8×10 PE 阵列可以灵活地按行或列打开或关闭。 CNN、FC、DFT 和 IIR 滤波操作可以通过在不同数据流中重复使用相同的 PE 阵列来执行,例如,Conv 层的权重固定,或 FC 层和 DFT 的输出固定。与使用大量流水线触发器的传统脉动阵列不同,此设计有意移除了大部分或 O1/O2/PZ 用于稳态视觉诱发电位 (SSVEP)。通道数的减少导致三个主要任务的平均准确度略有下降(从 90.4% 降至 85.2%),但显著提高了用户体验和可用性。使用带有生理盐水的商用 Hydro-link 电极通过头带上的预切孔捕获 EEG 信号。图 33.2.2 还显示了完全集成 SoC 的顶层图。最多 16 个可编程 AFE 通道用于信号采集和数字化。AFE 的每个通道包括一个增益为 45 至 72dB 和带宽为 0.05 至 400Hz 的两级斩波放大器、一个转折频率为 60Hz 的低通滤波器和一个工作频率为 128Hz 至 10kHz 的 8b SAR ADC。集成 AI 操作的数字核心包括 8×10 处理单元 (PE) 阵列、控制逻辑和相关存储库。带有专门开发的 ISA 的指令存储器为芯片的操作提供全局控制,以支持一系列思维想象任务。实时分类的大脑状态和思维控制命令通过外部蓝牙模块传输到 VR 耳机,以控制 VR 场景。虽然大多数现有工作仅关注固定数据流 [4] 和 CNN 模型 [2,3],但需要高度灵活的计算架构来支持各种思维想象任务。图 33.2.3 显示了专门开发的用于数据流控制、模型配置、通道选择等的通用 ISA。128b 的超宽 ISA 命令用于监督各种计算任务,例如 IIR 滤波器、卷积 (Conv) 层、离散傅里叶变换 (DFT) 和全连接 (FC) 层,具有高硬件效率。为了支持不断变化的 AI 模型,每个子任务的配置(例如内核数量、层数、分支目标地址 (BTA)、稀疏度设置等)也集成到 ISA 中,以便高效地调度和执行不同的任务。图 33.2.3 还显示了数字神经处理器的详细架构。8×10 PE 阵列可以灵活地按行或列打开或关闭。CNN、FC、DFT 和 IIR 滤波操作可以通过在不同数据流中重复使用相同的 PE 阵列来执行,例如,Conv 层的权重固定,或 FC 层和 DFT 的输出固定。与使用大量流水线触发器的传统收缩阵列不同,此设计有意消除了大部分或 O1/O2/PZ 用于稳态视觉诱发电位 (SSVEP)。通道数的减少导致三个主要任务的平均准确度略有下降(从 90.4% 降至 85.2%),但显著提高了用户体验和可用性。使用带有生理盐水的商用 Hydro-link 电极通过头带上的预切孔捕获 EEG 信号。图 33.2.2 还显示了完全集成 SoC 的顶层图。最多 16 个可编程 AFE 通道用于信号采集和数字化。AFE 的每个通道包括一个增益为 45 至 72dB 和带宽为 0.05 至 400Hz 的两级斩波放大器、一个转折频率为 60Hz 的低通滤波器和一个工作频率为 128Hz 至 10kHz 的 8b SAR ADC。集成 AI 操作的数字核心包括 8×10 处理单元 (PE) 阵列、控制逻辑和相关存储库。带有专门开发的 ISA 的指令存储器为芯片的操作提供全局控制,以支持一系列思维想象任务。实时分类的大脑状态和思维控制命令通过外部蓝牙模块传输到 VR 耳机,以控制 VR 场景。虽然大多数现有工作仅关注固定数据流 [4] 和 CNN 模型 [2,3],但需要高度灵活的计算架构来支持各种思维想象任务。图 33.2.3 显示了专门开发的用于数据流控制、模型配置、通道选择等的通用 ISA。128b 的超宽 ISA 命令用于监督各种计算任务,例如 IIR 滤波器、卷积 (Conv) 层、离散傅里叶变换 (DFT) 和全连接 (FC) 层,具有高硬件效率。为了支持不断变化的 AI 模型,每个子任务的配置(例如内核数量、层数、分支目标地址 (BTA)、稀疏度设置等)也集成到 ISA 中,以便高效地调度和执行不同的任务。图 33.2.3 还显示了数字神经处理器的详细架构。8×10 PE 阵列可以灵活地按行或列打开或关闭。CNN、FC、DFT 和 IIR 滤波操作可以通过在不同数据流中重复使用相同的 PE 阵列来执行,例如,Conv 层的权重固定,或 FC 层和 DFT 的输出固定。与使用大量流水线触发器的传统收缩阵列不同,此设计有意消除了大部分AFE 的每个通道包括一个增益为 45 至 72 dB、带宽为 0.05 至 400 Hz 的两级斩波放大器、一个转折频率为 60 Hz 的低通滤波器和一个工作频率为 128 Hz 至 10 kHz 的 8b SAR ADC。用于集成 AI 操作的数字核心包括一个 8×10 处理单元 (PE) 阵列、控制逻辑和相关存储库。带有专门开发的 ISA 的指令存储器为芯片的操作提供全局控制,以支持一系列思维意象任务。实时分类的大脑状态和思维控制命令通过外部蓝牙模块传输到 VR 耳机,以控制 VR 场景。虽然大多数现有研究仅关注固定数据流 [4] 和 CNN 模型 [2,3],但需要高度灵活的计算架构来支持各种思维意象任务。图 33.2.3 显示了专门开发的通用 ISA,用于数据流控制、模型配置、通道选择等。128b 的超宽 ISA 命令用于监督各种计算任务,例如 IIR 滤波器、卷积 (Conv) 层、离散傅里叶变换 (DFT) 和全连接 (FC) 层,具有很高的硬件效率。为了支持不断变化的 AI 模型,每个子任务的配置(例如内核数量、层数、分支目标地址 (BTA)、稀疏性设置等)也集成到 ISA 中,以便高效地调度和执行不同的任务。图 33.2.3 还显示了数字神经处理器的详细架构。8×10 PE 阵列可以灵活地按行或列打开或关闭。 CNN、FC、DFT 和 IIR 滤波操作可以通过在不同数据流中重复使用相同的 PE 阵列来执行,例如,Conv 层的权重固定,或 FC 层和 DFT 的输出固定。与使用大量流水线触发器的传统脉动阵列不同,此设计有意移除了大部分AFE 的每个通道包括一个增益为 45 至 72 dB、带宽为 0.05 至 400 Hz 的两级斩波放大器、一个转折频率为 60 Hz 的低通滤波器和一个工作频率为 128 Hz 至 10 kHz 的 8b SAR ADC。用于集成 AI 操作的数字核心包括一个 8×10 处理单元 (PE) 阵列、控制逻辑和相关存储库。带有专门开发的 ISA 的指令存储器为芯片的操作提供全局控制,以支持一系列思维意象任务。实时分类的大脑状态和思维控制命令通过外部蓝牙模块传输到 VR 耳机,以控制 VR 场景。虽然大多数现有研究仅关注固定数据流 [4] 和 CNN 模型 [2,3],但需要高度灵活的计算架构来支持各种思维意象任务。图 33.2.3 显示了专门开发的通用 ISA,用于数据流控制、模型配置、通道选择等。128b 的超宽 ISA 命令用于监督各种计算任务,例如 IIR 滤波器、卷积 (Conv) 层、离散傅里叶变换 (DFT) 和全连接 (FC) 层,具有很高的硬件效率。为了支持不断变化的 AI 模型,每个子任务的配置(例如内核数量、层数、分支目标地址 (BTA)、稀疏性设置等)也集成到 ISA 中,以便高效地调度和执行不同的任务。图 33.2.3 还显示了数字神经处理器的详细架构。8×10 PE 阵列可以灵活地按行或列打开或关闭。 CNN、FC、DFT 和 IIR 滤波操作可以通过在不同数据流中重复使用相同的 PE 阵列来执行,例如,Conv 层的权重固定,或 FC 层和 DFT 的输出固定。与使用大量流水线触发器的传统脉动阵列不同,此设计有意移除了大部分IIR 滤波器、卷积 (Conv) 层、离散傅里叶变换 (DFT) 和全连接 (FC) 层,具有很高的硬件效率。为了支持不断变化的 AI 模型,每个子任务的配置(例如内核数量、层数、分支目标地址 (BTA)、稀疏度设置等)也集成到 ISA 中,以便高效调度和执行不同的任务。图 33.2.3 还显示了数字神经处理器的详细架构。8×10 PE 阵列可以灵活地按行或列打开或关闭。可以通过在不同数据流中重用相同的 PE 阵列来专门执行 CNN、FC、DFT 和 IIR 滤波操作,例如,Conv 层的权重平稳,或 FC 层和 DFT 的输出平稳。与传统的脉动阵列不同,该设计特意移除了大部分IIR 滤波器、卷积 (Conv) 层、离散傅里叶变换 (DFT) 和全连接 (FC) 层,具有很高的硬件效率。为了支持不断变化的 AI 模型,每个子任务的配置(例如内核数量、层数、分支目标地址 (BTA)、稀疏度设置等)也集成到 ISA 中,以便高效调度和执行不同的任务。图 33.2.3 还显示了数字神经处理器的详细架构。8×10 PE 阵列可以灵活地按行或列打开或关闭。可以通过在不同数据流中重用相同的 PE 阵列来专门执行 CNN、FC、DFT 和 IIR 滤波操作,例如,Conv 层的权重平稳,或 FC 层和 DFT 的输出平稳。与传统的脉动阵列不同,该设计特意移除了大部分
摘要 — 在本文中,我们研究了从脑电图 (EEG) 数据中解码跨受试者运动想象 (MI) 的问题。由于各种个体间差异(例如大脑解剖结构、性格和认知特征),多受试者 EEG 数据集呈现出几种领域转变。这些领域转变使多受试者训练成为一项具有挑战性的任务,也阻碍了跨受试者的稳健泛化。受领域泛化技术对于解决此类问题的重要性的启发,我们提出了一种两阶段模型集成架构,该架构由多个特征提取器(第一阶段)和一个共享分类器(第二阶段)构建,我们使用两个新颖的损失项对其进行端到端训练。第一个损失应用课程学习,迫使每个特征提取器专门针对训练对象的子集并促进特征多样性。第二个损失是集成内蒸馏目标,允许集成模型之间协作交换知识。我们将我们的方法与几种最先进的技术进行了比较,在两个大型 MI 数据集(即 PhysioNet 和 OpenBMI)上进行了独立于受试者的实验。我们的算法在 5 倍交叉验证和留一受试者评估设置中均优于所有方法,并且使用的可训练参数数量要少得多。我们证明了我们的模型集成方法结合了课程学习和协作训练的力量,可实现高学习能力和稳健的性能。我们的工作解决了多受试者 EEG 数据集中的域转移问题,为无校准脑机接口铺平了道路。我们将代码公开发布在:https://github.com/gzoumpourlis/Ensemble-MI。索引术语——脑机接口、EEG、运动意象解码、模型集成、域泛化