摘要 - 深度学习模型最近在许多分类任务上表现出色。深度神经网络的出色表现取决于大量的训练数据,同时必须具有相等的类别分布才能有效。但是,在大多数现实世界中,标记的数据可能受到类别之间高不平衡比率的限制,因此,大多数分类算法的学习过程受到不利影响,从而导致预测和性能较低。三种主要方法解决了不平衡学习的问题,即数据级,算法级别和混合方法,这些方法结合了上述两种方法。数据生成方法通常基于生成的对抗网络,这些网络需要大量的数据,而模型级别的方法需要广泛的领域专家知识来制定学习目标,从而在没有此类知识的情况下对用户访问较差。此外,这些方法中的绝大多数被设计和应用于成像应用,更少的时间序列,并且对它们都极为罕见。为了解决上述问题,我们介绍了Genda,Genda是一种基于生成邻域的Deep AutoCoder,它在设计方面既简单又有效,并且可以成功地应用于图像和时间序列数据。genda基于学习潜在
摘要。与视觉信号相比,放置在人体四肢上的惯性测量单元(IMU)可以捕获准确的运动信号,同时对照明变化和遮挡具有鲁棒性。尽管这些角色 - 在帮助以以上为中心的行动识别方面是有价值的,但IMU的潜力仍然不足。在这项工作中,我们提出了一种新颖的动作识别方法,该方法将来自人体磨损的IMU的运动数据与以自我为中心的视频相结合。由于标记的多模式数据的稀缺性,我们设计了一种基于MAE的自我监管预处理方法,通过对视觉和运动信号之间的自然相关性进行建模,从而获得了强大的多模式表示。为了建模整个体内的多个IMU设备的复合关系,我们利用了多个IMU设备中的协作动力学,并建议将人类关节的相对运动特征置入图形结构中。实验表明我们的方法可以在多个公共数据集上实现最新性能。在更具挑战性的场景中,我们的基于MAE的预培训和基于图的IMU建模的有效性得到了进一步的验证,包括部分缺少IMU设备和视频质量损坏,从而促进现实世界中更灵活的用法。
与年龄相关的形态学大脑变化在健康和疾病的衰老中是不同的。MRI扫描中的生物脑年龄估计是量化这种效果的一种常见方法,而生物和年代年龄之间的差异表示脱胶过程。直接可视化和分析图像空间中与形态年龄相关的变化的能力对于提高对脑衰老的理解至关重要。在这项工作中,我们提出了一种基于深度学习的新方法,以在单个一致的模型中统一生物脑年龄估计和年龄条件的模板创建。我们通过开发确定性的自动编码器来实现这一目标,该自动编码器成功地解散了与年龄相关的形态变化和主体特定的变化。这允许其用作脑年龄回归和生成性脑老化模型。提出的方法表明,当应用于2000多个受试者的数据库时,将年龄条件的脑模板和模拟年龄的大脑图像的现实产生以及模拟年龄的大脑图像进行了现实。关键字:大脑老化,深度学习,生成模型
摘要近年来,多室模型被广泛用于尝试从扩散磁共振成像 (dMRI) 数据中表征脑组织微观结构。这种方法的主要缺点之一是需要先验决定微观结构特征的数量,并将其嵌入模型定义中。然而,在给定采集方案的情况下可以从 dMRI 数据中获得的微观结构特征数量仍然不清楚。在这项工作中,我们旨在使用自动编码器神经网络结合旋转不变特征来表征脑组织。通过改变自动编码器潜在空间中的神经元数量,我们可以有效地控制从数据中获得的微观结构特征的数量。通过将自动编码器重建误差绘制到特征数量,我们能够找到数据保真度和微观结构特征数量之间的最佳权衡。我们的结果显示了该数字如何受到壳层数量和用于采样 dMRI 信号的 b 值的影响。我们还展示了我们的技术如何为更丰富地表征体内脑组织微观结构铺平道路。
摘要 - 随着多模式融合技术的快速发展,病理图像与基因组学数据的整合已在癌症生存预测中取得了令人鼓舞的结果。但是,大多数现有的多模型模型不是通过结合病理学和基因组学模态来预训练的,而忽略了不同模态之间固有的任务无关联的关联。尽管某些自我监督的方法通过预训练的目标(例如相关性和均方误差)来对齐多模式信息,但它们缺乏深入的多模式相互作用。为了解决这些问题,我们提出了Contramae,这是一种对比度对齐的掩盖自动编码器框架,以融合病理学图像和基因组学数据,以进行癌症存活预测。具体而言,我们引入了一个对比目标,以使多形态保持一致并构建其内在的一致性。此外,我们设计了两个重建目标,以通过互补偿双方所缺乏的信息来捕获多模式之间的复杂关系。在生存预测中,将Contramae编码器的病理和基因组学编码串联为产生生存风险评分的最终表示。实验结果表明,在五个癌症基因组图集(TCGA)中,CONTORAMA的表现优于五个癌症数据集的现有最新方法。该代码可从https://github.com/suixuewang/contramae获得。
摘要:映射有助于功能的蛋白质构象的整体,可以用小分子药物来靶向,这仍然是一个重大的挑战。在这里,我们探讨了变异自动编码器的使用来减少蛋白质结构合奏生成问题中维度的挑战。我们将高维蛋白质结构数据转换为连续的,低维的表示,在以结构质量度量为导向的空间中进行搜索,然后使用由采样的结构信息引导的Rosettafold来生成3D结构。我们使用这种方法为癌症相关的蛋白质K-RAS生成合奏,在可用的K-Ras晶体结构的子集上训练VAE和MD模拟快照,并评估接近与训练中与晶体结构接近的取样程度。我们发现,我们的潜在空间采样程序迅速生成具有高结构质量的合奏,并且能够在固定晶体结构的1Å内进行采样,其一致性高于MD模拟或Alphafold2预测。采样结构充分概括了固定的K-RAS结构中的隐性口袋,以允许小分子对接。
摘要。大规模对结构的手动检查和评估是劳动密集型的,而且通常是不可行的,而数据驱动的机器学习技术可能无法识别相关的失败机制,并且对以前看不见的条件的概括不佳,尤其是在有限的信息中遇到的。我们提出了一个物理知识的变异自动编码器公式,以在测量中删除混杂源的图表学习,以计算基于物理模型的潜在参数的后验分布,并在有限测量值时预测结构的响应。自动编码器的潜在空间通过一组基于物理的潜在变量进行增强,这些变量可解释,并以先验分布和基于物理模型的形式允许域知识包含在自动编码器公式中。为了防止模型的数据驱动的组件覆盖已知的物理学,训练目标中包括一个正则化项,该术语对潜在空间和生成模型预测施加约束。在合成案例研究中评估了所提出的方法的可行性。
基于大脑计算机界面(BCI)系统的情绪分类是一个吸引人的研究主题。最近,已经对BCI系统的情绪分类进行了深入学习,并与传统的分类方法进行了比较。在本文中,提出了一种新型的深层神经网络,用于使用脑电图系统进行情绪分类,该系统结合了卷积神经网络(CNN),稀疏自动编码器(SAE)和深神经网络(DNN)。在拟议的网络中,CNN提取的功能首先发送到SAE进行编码和解码。然后将冗余降低的数据用作分类任务的DNN的输入特征。使用DEAP和种子的公共数据集用于测试。实验结果表明,所提出的网络比情绪识别的常规CNN方法更有效。对于DEAP数据集,价值和唤醒的最高识别精度分别达到了89.49%和92.86%。但是,对于种子数据集,最佳识别精度达到96.77%。通过组合CNN,SAE和DNN并分别训练它们,提出的网络被显示为具有比常规CNN更快的收敛速度的有效方法。
摘要 — 近年来,随着人们对宠物保健的兴趣日益浓厚,兽医对计算机辅助诊断 (CAD) 系统的需求也随之增加。由于缺乏足够的放射学数据,兽医 CAD 的发展陷入停滞。为了克服这一挑战,我们提出了一种基于变分自动编码器的生成主动学习框架。此方法旨在缓解兽医 CAD 系统可靠数据的稀缺问题。本研究利用了包括心脏扩大放射图像数据和慢性肾病超声图像数据的数据集。在删除注释并标准化图像后,我们采用了一个数据增强框架,该框架包括数据生成阶段和用于过滤生成数据的查询阶段。实验结果表明,当通过该框架生成的数据添加到生成模型的训练数据中时,射线图像中的 frechet 起始距离从 84.14 减小到 50.75,超声图像中的 frechet 起始距离从 127.98 减小到 35.16。随后,当生成的数据被纳入分类模型的训练中时,混淆矩阵的真负数也从射线照片上的 0.16 提高到 0.66,超声图像上的真负数从 0.44 提高到 0.64。所提出的框架有可能解决医学 CAD 数据稀缺的挑战,从而促进其发展。
由于带注释的样本稀缺,病理性脑损伤在图像数据中的复杂表现对监督检测方法提出了挑战。为了克服这个困难,我们将重点转移到无监督异常检测。在这项工作中,我们专门使用健康数据训练所提出的模型,以识别测试期间未见的异常。这项研究需要调查基于三元组的变分自动编码器,以同时学习健康脑数据的分布和去噪能力。重要的是,我们纠正了先前基于投影的方法中固有的一个误解,该误解依赖于这样的假设:图像内的健康区域在重建输出中将保持不变。这无意中暗示了病变图像和无病变图像在潜在空间表示上存在相当大的相似性。然而,这种假设可能并不成立,特别是由于病变区域强度对投影过程的潜在重大影响,特别是对于具有单一信息瓶颈的自动编码器。为了克服这个限制,我们将度量学习与潜在采样分离。这种方法确保病变和无病变输入图像都投影到相同的分布中,特别是无病变投影。此外,我们引入了一个语义引导的门控交叉跳过模块来增强空间细节检索,同时抑制异常,利用解码器更深层中存在的健壮健康大脑表示语义。我们还发现,将结构相似性指数测量作为额外的训练目标可以增强所提模型的异常检测能力。