1 北京信息科技大学仪器科学与光电工程学院,北京 摘要 :针对观察新对象、掌握新技能的问题,提出了一种新的机器学习框架——经验学习(EL),可应用于探索未知领域的人工智能机器人(AIR)。与传统方法不同,在模型训练之前不需要准备大量的训练样本集。而是通过不断观察或刺激研究对象并记录这些经验来建立经验链,这是受人类早期学习行为的启发。通过不断的观察和尝试,经验链不断更新,并逐渐收敛到研究对象的实际输出概率。当前经验单元作为EL判断的依据,过去的经验可以通过遗忘系数丢弃。通过两个简单的例子说明了该框架的应用方式。猫狗生成器实验代表了对新物体的自我探索。虚拟篮球机实验证明了该方法能够学习新技能并有效减轻随机干扰。通过比较,分析了所提方法与相关算法的异同。最终,该方法在使人工智能系统能够研究和探索未知领域方面具有价值。关键词:经验学习,自我探索算法,无先验数据算法,人工智能框架
在本文中,我们提出了一个自动细胞计数框架,用于刺激拉曼散布(SRS)图像,该框架可以帮助肿瘤组织特征分析,癌症诊断和手术计划过程。SRS显微镜通过绘制新鲜标本的脂质和蛋白质并进行了快速披露具有高分辨率的肿瘤的基本诊断标志,从而促进了肿瘤诊断和手术。然而,由于细胞和tis-sue的对比度有限,以及组织形态和生化组成的异质性,从无标记的SRS图像计数一直在挑战。为此,通过修改和应用U-NET(一种使用少量训练样本的有效的医学图像语义分割模型),提出了一种基于学习的细胞计数方案。还实施了距离变换和流域分割算法以产生细胞实例分割和细胞计数结果。通过对真实人脑肿瘤标本的SRS图像进行计数,在曲线下(AUC)的面积> 98%获得了有希望的细胞计数结果,而R = 0.97,就SRS和Hemoxoxylin和eosin(H&E)的组织学图像之间的细胞计数相关性而言。所提出的细胞计数方案说明了自动实时自动进行细胞计数的可能性和潜力,并鼓励研究将深度学习技术应用于生物医学和病理图像分析。
大型语言模型(LLMS)弥合了人类语言理解与复杂问题解决问题之间的差距,在几个NLP任务上实现了最先进的性能,尤其是在几次射击和零照片的设置中。尽管LLMS具有明显的功效,但由于对计算资源的限制,用户必须使用开源语言模型或将整个培训过程外包给第三方平台。但是,研究表明,语言模型容易受到潜在的安全漏洞的影响,尤其是在后门攻击中。后门攻击旨在通过中毒训练样本或模型权重,将目标漏洞引入语言模型中,从而使攻击者能够通过恶意触发器来操纵模型响应。尽管对后门攻击的现有调查提供了全面的概述,但他们缺乏对专门针对LLM的后门攻击的深入检查。为了弥合这一差距并掌握该领域的最新趋势,本文通过专注于微调方法,介绍了对LLM的后门攻击的新观点。具体来说,我们将后门攻击系统地分类为三类:全参数微调,参数效率微调和没有微调1。基于大量审查的见解,我们还讨论了未来关于后门攻击的研究的关键问题,例如进一步探索不需要微调或开发更多秘密攻击算法的攻击算法。
摘要 — 定期监测住院患者的营养摄入量对于降低疾病相关营养不良风险起着至关重要的作用。尽管已经开发出多种估算营养摄入量的方法,但显然仍然需要一种更可靠、完全自动化的技术,因为这可以提高数据准确性并减轻参与者的负担和医疗成本。在本文中,我们提出了一种基于人工智能 (AI) 的新型系统,通过简单处理餐前和餐后捕获的 RGB 深度 (RGB-D) 图像对来准确估算营养摄入量。该系统包括一个用于食物分割的新型多任务上下文网络、一个由有限训练样本构建的用于食物识别的基于少量学习的分类器,以及一个用于 3D 表面构建的算法。这允许对食物进行顺序分割、识别和估计消耗的食物量,从而可以全自动估计每餐的营养摄入量。为了开发和评估该系统,我们组建了一个专用的新数据库,其中包含 322 份膳食的图像和营养食谱,并使用创新策略结合数据注释。实验结果表明,估计的营养摄入量与基本事实高度相关(> 0.91),平均相对误差非常小(< 20%),优于现有的营养摄入量评估技术。
摘要 — 我们考虑一个依赖于在欺骗者存在的情况下运行的飞机的航空自组织网络。如果合法飞机发送信号并且没有欺骗攻击,则地面基站接收到的聚合信号被视为“干净”或“正常”。相反,面对欺骗信号,接收信号被视为“虚假”或“异常”。自动编码器 (AE) 经过训练以从训练数据集中学习特征/特性,该训练数据集仅包含与没有欺骗攻击相关的正常样本。AE 将原始样本作为其输入样本并在其输出中重建它们。基于训练后的 AE,我们定义了欺骗发现算法的检测阈值。更具体地说,将 AE 的输出与其输入进行对比,将为我们提供曲线峰值方面的几何波形相似性/不相似性的度量。为了量化未知测试样本与给定训练样本(包括正常样本)之间的相似性,我们首先提出一种所谓的基于偏差的算法。此外,我们估计每架合法飞机的到达角(AoA),并提出一种所谓的基于 AoA 的算法。然后,基于这两种算法的复杂融合,我们形成了最终的检测算法,用于在严格的测试条件下区分虚假异常样本和正常样本。总之,我们的数值结果表明,只要仔细选择检测阈值,AE 就可以改善正确的欺骗检测率和误报率之间的权衡。
摘要 — 缺乏足够的训练样本和嘈杂的高维特征是基于脑电图 (EEG) 的脑机接口 (BCI) 的运动想象 (MI) 解码算法面临的主要挑战。为了应对这些挑战,受 MI 的神经生理特征的启发,本文提出了一种用于 MI 分类的新型滤波器组卷积网络 (FBCNet)。FBCNet 采用多视图数据表示,然后进行空间滤波以提取光谱空间判别特征。这种多阶段方法即使在训练数据有限的情况下也能有效地训练网络。更重要的是,在 FBCNet 中,我们提出了一种新的方差层,可以有效地聚合 EEG 时域信息。通过这种设计,我们在四个 MI 数据集上将 FBCNet 与最先进的 (SOTA) BCI 算法进行了比较:BCI 竞赛 IV 数据集 2a (BCIC-IV-2a)、OpenBMI 数据集和两个来自慢性中风患者的大型数据集。结果表明,通过实现 76.20% 的 4 类分类准确率,FBCNet 为 BCIC-IV-2a 数据集设定了新的 SOTA。在其他三个数据集上,FBCNet 的二分类准确率提高了 8%。此外,我们使用可解释的 AI 技术提供了第一份关于健康受试者和中风患者之间判别性 EEG 特征差异的报告。此外,FBCNet 源代码可在 https://github.com/ravikiran-mane/FBCNet 上找到。
摘要 — 深度学习领域的最新进展尚未充分利用来解码想象语音,主要是因为没有足够的训练样本来训练深度网络。在本文中,我们提出了一种新颖的架构,该架构使用深度神经网络 (DNN) 对 ASU 想象语音数据集中相应 EEG 信号中的单词“in”和“cooperate”进行分类。使用公共空间模式 (CSP) 选择最能捕捉底层皮质活动的九个 EEG 通道,并将其视为独立的数据向量。离散小波变换 (DWT) 用于特征提取。据我们所知,到目前为止,DNN 尚未被用作解码想象语音的分类器。将与每个想象词相对应的选定 EEG 通道视为独立的数据向量有助于提供足够数量的样本来训练 DNN。对于每次测试试验,最终的类别标签是通过对试验中考虑的各个通道的分类结果进行多数投票来获得的。我们已经取得了与最先进结果相当的准确度。通过使用更高密度的 EEG 采集系统结合其他深度学习技术(如长短期记忆),可以进一步改善结果。索引术语 — 脑机接口、空间滤波器、深度学习、想象语音、常见空间模式
人工智能 (AI) 和机器学习 (ML) 在许多应用领域都取得了巨大成功。然而,许多成功案例都是在固定不变的基准数据集或模拟环境中取得的。从这些基准环境转移到真实系统时,还需要考虑许多其他因素。可以观察到,人工智能在工业系统中的许多应用在概念验证实施中取得了良好的结果,但并没有转变为长期的生产用途。无论是在科学领域还是在国际标准化领域,都没有一个普遍认可的人工智能定义。然而,[12] 将人工智能系统定义为“为给定的一组人类定义的目标生成内容、预测、建议或决策等输出的工程系统”。我们认为,这样的人工智能系统通常是更大的整体系统的元素(或子系统),人工智能在定义的约束下协助实现其目的。我们假设的系统模型如图 1 所示。整个系统最终投入使用并交付生产。整个系统分解为子系统层次结构,通过接口链接,其中一些子系统可能应用人工智能方法。整个系统的其他子系统示例包括机械和电气部件、传感器、执行器、数据管理和人机界面。此外,基于人工智能的支持系统可以是开发环境的一部分(不作为整个系统的一部分部署到运行中)。这方面的例子是包含机器学习方法、训练算法和模拟环境的训练样本的数据库。根据 Simon Ramo 的说法,系统工程考虑“整体设计与部分设计的区别” [5]。我们认为这种整体方法尚未应用于人工智能工程
摘要 网络神经科学的图形信号处理方面的进步为整合大脑结构和功能提供了一条独特的途径,目的是揭示大脑在系统层面的一些组织原则。在这个方向上,我们开发了一个监督图形表示学习框架,通过图形编码器-解码器系统对大脑结构连接 (SC) 和功能连接 (FC) 之间的关系进行建模。具体来说,我们提出了一种配备图形卷积编码器的暹罗网络架构,以学习图形(即主题)级嵌入,以保留大脑网络之间与应用相关的相似性度量。这样,我们有效地增加了训练样本的数量,并通过规定的目标图形级距离带来了灵活性,可以合并额外的先验信息。虽然有关大脑结构-功能耦合的信息是通过从 SC 重建大脑 FC 隐式提取的,但我们的模型还设法学习保留输入图之间相似性的表示。学习到的表示的卓越判别能力在包括主题分类和可视化在内的下游任务中得到了证明。总而言之,这项工作通过利用度量数据分析的标准工具,倡导利用学习到的图形级、相似性保留嵌入进行脑网络分析的前景。索引术语 Ð脑连接组学、图形表示学习、孪生网络、图形卷积网络。
摘要。对于脑肿瘤治疗计划,医生和放射科医生的诊断和预测取决于医学成像。从各种成像方式(例如计算机断层扫描 (CT)、正电子发射断层扫描 (PET) 和磁共振 (MR) 扫描)获取具有临床意义的信息是放射科医生使用的软件和高级筛查的核心方法。在本文中,介绍了一个通用而复杂的框架,用于剂量控制过程的两个部分:从医学图像中检测肿瘤和分割肿瘤区域。该框架形成了从 CT 和 PET 扫描中检测神经胶质瘤的方法的实现。研究了两个深度学习预训练模型:VGG19 和 VGG19-BN,并将其用于融合 CT 和 PET 检查结果。Mask R-CNN(基于区域的卷积神经网络)用于肿瘤检测——该模型的输出是图像中每个对象(肿瘤)的边界框坐标。 U-Net 用于执行语义分割:分割恶性细胞和肿瘤区域。迁移学习技术用于在数据集有限的情况下提高模型的准确性。应用数据增强方法来生成和增加训练样本的数量。实施的框架可用于结合灰度和 RGB 图像中的对象检测和区域分割的其他用例,尤其是塑造医疗保健行业的计算机辅助诊断 (CADx) 和计算机辅助检测 (CADe) 系统,以方便和协助医生和医疗保健提供者。