摘要 — 集成学习是一种经典的学习方法,利用一组弱学习器组成一个强学习器,旨在提高模型的准确性。最近,受大脑启发的超维计算(HDC)成为一种新兴的计算范式,已在人类活动识别、语音识别和生物医学信号分类等各个领域取得成功。HDC 模仿大脑认知,利用具有完全分布式全息表示和(伪)随机性的高维向量(例如 10000 维)。本文首次尝试在 HDC 的背景下探索集成学习,并提出了第一个集成 HDC 模型,称为 EnHDC。EnHDC 使用基于多数投票的机制协同整合多个基础 HDC 分类器的预测结果。为了增强基分类器的多样性,我们改变了基分类器之间的编码机制、维度和数据宽度设置。通过将 EnHDC 应用于广泛的应用,结果表明,EnHDC 的准确率比单个 HDC 分类器平均提高 3.2%。此外,我们还表明,具有较低维度(例如 1000 维)的 EnHDC 可以实现与具有较高维度(例如 10000 维)的基线 HDC 相似甚至更高的准确率。这使得 HDC 模型的存储需求减少了 20%,这是在低功耗计算平台上实现 HDC 的关键。
摘要 - 脑启发的高维(HD)计算是一种新的计算范式,可以模仿高维空间中神经元的活性。HD计算中的第一个步骤是将每个数据点映射到高维空间(例如10,000)中,该空间需要计算原始域中每个数据元素的数千个操作。单独编码大约需要培训执行时间的80%。在本文中,我们提出,REHD,用于HD Computing中的编码,培训和推断的整个重做,以实现更硬件友好的实现。REHD包括用于HD计算的完全二进制编码模块,用于能量良好和高智能分类。我们基于随机投影的编码模块可以在硬件中有效地实现可预测的内存访问模式。REHD是第一个基于HD的方法,它提供了与原始数据1:1比率的数据投影,并启用使用二进制HyperVector进行所有培训/推理计算。在优化后,重新添加了编码过程,重新培训和推断成为HD计算的能源密集型部分。为解决此问题,我们还提出了模型量化。模型量化引入了一种新型的方法,该方法是使用n位存储类高量向量的方法,其中n范围为1至32,而不是以完整的32位精度,从而可以在能量效率和准确性之间进行折衷的细节调整。为了进一步提高REHD效率,我们开发了一种在线尺寸缩小方法,可以消除训练期间无效的高度向量维度。
一、问题和动机物联网 (IoT) 促进了许多利用基于边缘的机器学习 (ML) 方法来分析本地收集的数据的应用。不幸的是,流行的 ML 算法通常需要超出当今物联网设备能力的密集计算。受大脑启发的超维计算 (HDC) 已被引入以解决这个问题。然而,现有的 HDC 使用静态编码器,需要极高的维数和数百次训练迭代才能达到合理的准确度。这导致了巨大的效率损失,严重阻碍了 HDC 在物联网系统中的应用。我们观察到一个主要原因是现有 HDC 的编码模块缺乏利用和适应训练期间学习到的信息的能力。相比之下,如图 1(a) 所示,人类大脑中的神经元一直在动态再生,并在学习新信息时提供更有用的功能 [1]。虽然 HDC 的目标是利用随机生成的基础超向量的高维性来将信息表示为神经活动的模式,但现有的 HDC 仍然很难支持与大脑神经再生类似的行为。在这项工作中,我们提出了动态 HDC 学习框架,可以识别和再生不需要的维度,以在显著降低维数的情况下提供足够的准确性,从而加速训练和推理。 II. 背景和相关工作 A. 物联网和基于边缘的学习 许多新颖的框架和库已经开发出来,以在资源受限的计算平台上定制流行的 ML 算法,包括 TinyML [2]、TensorFlow Lite [3]、edge-ml [4]、X-Cube-AI [5] 等。然而,这些学习方法通常需要大量的训练样本和多个训练周期,超出了当今物联网设备的能力。同时,利用目标平台的学习结构和特性,研究人员提出了许多提高基于边缘的学习效率的技术,例如分割计算 [6]、联邦学习 [7]、[8]、知识蒸馏 [9]。这些技术与我们的方法正交,可以与我们的方法集成,以进一步提高学习性能。
摘要 受大脑启发的超维 (HD) 计算是一种新的机器学习方法,它利用简单且高度可并行化的操作。不幸的是,迄今为止已发布的 HD 计算算法都无法准确地对更复杂的图像数据集(例如 CIFAR100)进行分类。在这项工作中,我们提出了 HDnn-PIM,它通过使用内存处理实现复杂图像的特征提取和基于 HD 的分类。我们将 HDnn-PIM 与各种图像数据集的纯 HD 和 CNN 实现进行了比较。与纯 HD 计算相比,HDnn-PIM 的准确率提高了 52.4%。与最先进的 CNN 相比,它的准确率也提高了 1.2%,但内存占用减少了 3.63 倍,MAC 操作减少了 1.53 倍。此外,HDnn-PIM 比 RTX 3090 GPU 快 3.6 倍 –223 倍,比最先进的 FloatPIM 能效高 3.7 倍 [5]。
记忆是一项基本功能,它使当今的机器学习算法能够为每个预测提供高质量的学习和推理。记忆为算法提供了先验知识,以保持上下文并确定其决策的信心。不幸的是,现有的深度学习算法对记忆的概念很弱且不透明。大脑启发的超维计算 (HDC) 被引入作为人类记忆的模型。因此,它通过使用计算上可处理且在描述人类认知方面数学严谨的向量来模仿大脑记忆的几个重要功能。在本文中,我们介绍了一个大脑启发系统,该系统表示关系图上的 HDC 记忆能力。我们提出了 GrapHD,即表示高维空间中基于图的信息的超维记忆。GrapHD 定义了一种表示复杂图结构的编码方法,同时支持加权和非加权图。我们的编码器将所有节点和边的信息分散到完整的整体表示中,以便没有一个组件比另一个组件更负责存储任何信息。然后,GrapHD 在编码记忆图上定义了几个重要的认知功能。这些操作包括记忆重建、信息检索、图匹配和最短路径。我们的广泛评估表明,GrapHD:(1) 通过为学习算法提供短期/长期记忆的概念,显著提高了学习能力;(2) 支持基于记忆图的认知计算和推理;(3) 支持全息类脑计算,对噪声和故障具有很强的鲁棒性。
Cheraghian 等人 [ 21 – 23 ] 在零样本 3 维模型分类方 面提出了 3 维点云的零样本学习方法、缓解 3 维零样 本学习中枢纽点问题的方法和基于直推式零样本学 习的 3 维点云分类方法,并将它们封装进一个全新 的零样本 3 维点云方法 [ 24 ] 中。以上方法均是利用已 知类样本的点云表征及其词向量对未知类别进行分 类,开创了零样本 3 维模型分类方法。近年来, CLIP 在零样本图像分类上取得了良好的效果,因此有研 究者将 CLIP 应用到零样本 3 维模型分类方法中, Zhang 等人 [ 25 ] 提出了基于 CLIP 的 3 维点云理解 (Point cloud understanding by CLIP, PointCLIP) 模型, PointCLIP 首先将 3 维点云投影成多个深度图,然 后利用 CLIP 的预训练图像编码器提取深度图特 征,同时将类别名称通过 CLIP 预先训练的文本编 码器提取文本特征。但是 PointCLIP 的性能受到深 度图和图像之间的域差异以及深度分布的多样性限 制。为了解决这一问题,基于图像 - 深度图预训练 CLIP 的点云分类方法 (transfer CLIP to Point cloud classification with image-depth pre-training, CLIP2Point) [ 26 ] 将跨模态学习与模态内学习相结合 训练了一个深度图编码器。在分类时,冻结 CLIP 的图像编码器,使用深度图编码器提取深度图特 征,该方法缓解了深度图和图像间的模型差异。用 于 3 维理解的图像 - 文本 - 点云一致性表征学习方法 (learning Unified representation of Language, Im- age and Point cloud for 3D understanding, ULIP) [ 27 ] 构建了一个图像、文本和点云 3 种模态的 统一嵌入空间,该方法利用大规模图像 - 文本对预 训练的视觉语言模型,并将 3 维点云编码器的特征 空间与预先对齐的视觉 - 文本特征空间对齐,大幅 提高了 3 维模型的识别能力。与之相似的是,基于 提示文本微调的 3 维识别方法 (CLIP Goes 3D, CG3D) [ 28 ] 同样使用 3 元组形式确保同一类别的 3 维模 型特征和图像特征之间以及 3 维模型特征和文本特 征之间存在相似性,从而使点云编码器获得零样本 识别的能力。另外, PointCLIP V2 [ 29 ] 在 Point- CLIP 的基础之上,通过利用更先进的投影算法和 更详细的 3 维模型描述,显着提高了零样本 3 维模型 分类准确率。本文采用语义增强 CLIP 解决图像和文 本的语义鸿沟问题,通过在语义层面为图像和文本 提供更多相似的语义信息,使图像和文本对齐更具有 一致性,从而有效提高 3 维模型的零样本分类性能。 2.2 提示工程
受大脑启发的超维计算 (HDC) 在机器人、生物医学信号分析和自然语言处理等各种认知任务中表现出良好的能力。与深度神经网络相比,HDC 模型具有轻量级模型和一次性/少次学习能力等优势,使其成为传统资源密集型深度学习模型的有前途的替代范式,尤其是在资源有限的边缘设备中。尽管 HDC 越来越受欢迎,但尚未对 HDC 模型的鲁棒性和增强 HDC 鲁棒性的方法进行系统分析和充分研究。HDC 依靠称为超向量 (HV) 的高维数值向量来执行认知任务,HV 中的值对于 HDC 模型的鲁棒性至关重要。我们提出了 ScaleHD,一种自适应缩放方法,可以缩放 HDC 模型的联想记忆中的 HV 值,以增强 HDC 模型的鲁棒性。我们提出了三种不同的ScaleHD模式,包括Global-ScaleHD、Class-ScaleHD和(Class+Clip)-ScaleHD,它们基于不同的自适应缩放策略。结果表明,ScaleHD能够将HDC对内存错误的鲁棒性提高到10,000𝑋。此外,我们利用增强的HDC鲁棒性,通过电压缩放方法节省能源。实验结果表明,ScaleHD可以将HDC内存系统的能耗降低高达72.2%,而准确度损失不到1%。
摘要 生物信号由多个收集时间序列信息的传感器组成。由于时间序列包含时间依赖性,现有的机器学习算法很难处理它们。超维计算(HDC)作为一种受大脑启发的轻量级时间序列分类范例被引入。然而,现有的 HDC 算法存在以下缺点:(1)线性超维表示导致分类准确率低,(2)由于操作昂贵且不利于硬件而缺乏实时学习支持,以及(3)无法从部分标记数据建立强大的模型。在本文中,我们提出了 TempHD,一种用于高效和准确生物信号分类的新型超维计算方法。我们首先开发一种新型非线性超维编码,将数据点映射到高维空间。与使用昂贵数学进行编码的现有 HDC 解决方案不同,TempHD 在将数据映射到高维空间之前保留了原始空间中数据的时空信息。为了获得最具信息量的表示,我们的编码方法考虑了空间传感器和时间采样数据之间的非线性相互作用。我们的评估表明,TempHD 提供了更高的分类准确度、显著更高的计算效率,更重要的是,它能够从部分标记的数据中学习。我们评估了 TempHD 对用于脑机接口的嘈杂 EEG 数据的有效性。我们的结果表明,与最先进的 HDC 算法相比,TempHD 的分类准确度平均提高了 2.3%,训练和测试时间分别提高了 7.7 倍和 21.8 倍。
项目概要 该项目将构建一个数字平台和虚拟实验室(V-Lab),以便在数字空间中设计和测试利用聚变反应发电和其他各种用途的聚变能系统的性能。为了在数字空间中重现等离子体(电离气体)的状态以及聚变能系统中组件的复杂性和时空尺度(时间和空间范围),我们将定义一个新的“超维数据空间”(图 1),它结合了时间轴、空间(坐标)轴、速度轴、物理量等。我们将建立结合该空间独特属性的计算方法。此外,为了将这些计算方法应用于“超维状态工程”,我们将开发前所未有的创新型 AI/数据驱动科学技术。通过这样做,我们将构建一个 V-Lab,可以在数字空间中进行聚变能系统的实验,从而能够在数字空间中对下一代聚变能系统的元素和整个系统进行性能预测(未来预测)(图 2)。本项目旨在大幅减少现实空间中耗费大量时间和成本的试错过程(开发和测试原型)。通过这样做,我们寻求实现各种聚变能源系统的早期社会应用和降低成本,最终致力于实现由聚变能源驱动的社会。