张逸君 yijzhang@sjtu.edu.cn 上海交通大学计算机科学与工程系,中国; 北京大学计算机科学与技术系,中国 卜同 putong30@pku.edu.cn 北京大学计算机科学与技术系,中国 张继元 jyzhang@stu.pku.edu.cn 北京大学计算机科学与技术系,中国 唐世明 tangshm@pku.edu.cn 北京大学生命科学学院和北大-清华生命科学中心,中国 余兆飞 yuzf12@pku.edu.cn 北京大学计算机科学与技术系,中国; 北京大学人工智能研究所,中国 刘建凯 j.liu9@leeds.ac.uk 利兹大学计算学院,英国 黄铁军 tjhuang@pku.edu.cn 北京大学计算机科学与技术系,中国;北京大学人工智能研究所,中国;北京人工智能研究院,中国
张逸君 yijzhang@sjtu.edu.cn 上海交通大学计算机科学与工程系,中国; 北京大学计算机科学与技术系,中国 卜同 putong30@pku.edu.cn 北京大学计算机科学与技术系,中国 张继元 jyzhang@stu.pku.edu.cn 北京大学计算机科学与技术系,中国 唐世明 tangshm@pku.edu.cn 北京大学生命科学学院和北大-清华生命科学中心,中国 余兆飞 yuzf12@pku.edu.cn 北京大学计算机科学与技术系,中国; 北京大学人工智能研究所,中国 刘建凯 j.liu9@leeds.ac.uk 利兹大学计算学院,英国 黄铁军 tjhuang@pku.edu.cn 北京大学计算机科学与技术系,中国;北京大学人工智能研究所,中国;北京人工智能研究院,中国
已经对用于调整磁共振成像(MRI)参数的技术进行了研究,以获取具有更好特征的图像。在这项研究中,我们旨在通过使用用户友好的MRILAB模拟程序来调整翻转角度,激发次数(NEX)和带宽(BW)来确认人脑T2加权图像的最佳参数值。我们还考虑了噪声水平和相似性评估参数。根据结果,随着NEX的增加和BW的降低为90°,噪声水平和相似性评估得到了改善,而它们的最佳状态不太最佳,而不是90°的翻转角度。发现过多的参数变化会在此类图像中引起额外的噪声和伪影,从而导致图像清晰度恶化。因此,我们确认设置适当的参数在磁共振图像采集中至关重要。
最近预估计的视觉语言(VLP)模型已成为许多下游任务的骨干,但它们被用作冷冻模型而无需学习。提示学习是一种通过在文本编码器的输入中添加可学习的上下文向量来改善预训练的VLP模型的方法。在下游任务的几次学习方案中,MLE训练可以导致上下文向量在训练数据中拟合占主导地位的图像特征。这种过度适应的可能会损害概括能力,尤其是在训练和测试数据集之间的分布变化的情况下。本文介绍了基于贝叶斯的迅速学习的框架,这可以减轻几乎没有射击的学习应用程序中的过度问题,并提高提示在看不见的情况下的适应性。具体来说,建模与数据相关的先验增强了文本特征的适应性,可用于可见的和看不见的图像特征,并在其之间取决于它们之间的折衷。基于贝叶斯框架,我们在估计目标后分布中利用了Wasserstein等级流,这使我们的提示可以灵活地捕获图像特征的复杂模式。我们通过与现有方法相比显示出统计学上显着的性能改善,证明了在基准数据集上的方法的有效性。该代码可在https://github.com/youngjae-cho/app上找到。
摘要。可变形图像配准是医学图像分析中的关键步骤,用于找到一对固定图像和运动图像之间的非线性空间变换。基于卷积神经网络 (CNN) 的深度配准方法已被广泛使用,因为它们可以快速、端到端地执行图像配准。然而,这些方法通常对具有较大变形的图像对性能有限。最近,迭代深度配准方法已被用来缓解这一限制,其中变换以由粗到细的方式迭代学习。然而,迭代方法不可避免地延长了配准运行时间,并且倾向于在每次迭代中学习单独的图像特征,这阻碍了利用这些特征来促进以后的迭代配准。在本研究中,我们提出了一种用于可变形图像配准的非迭代由粗到细配准网络 (NICE-Net)。在 NICE-Net 中,我们提出了:(i) 单次深度累积学习 (SDCL) 解码器,可以在网络的单次(迭代)中累积学习从粗到细的转换;(ii) 选择性传播特征学习 (SFL) 编码器,可以学习整个从粗到细配准过程的常见图像特征并根据需要选择性传播这些特征。在 3D 脑磁共振成像 (MRI) 的六个公共数据集上进行的大量实验表明,我们提出的 NICE-Net 可以胜过最先进的迭代深度配准方法,而只需要与非迭代方法类似的运行时间。
摘要 背景 神经影像技术提供了丰富而准确的脑结构和功能测量方法,已成为心理健康和神经科学研究中最流行的方法之一。快速发展的神经影像学研究产生了大量的数据,为数据收集、大规模数据管理、高效的计算要求以及数据挖掘和分析带来了新的挑战。 目的 为应对挑战并推动神经影像技术在临床实践中的应用,我们开发了一体化神经影像云(INCloud)。INCloud 为大规模神经影像数据收集、管理、分析和临床应用的整个过程提供了全栈解决方案。 方法 INCloud 由数据采集系统、数据仓库、自动多模态图像质量检查和处理系统、脑特征库、高性能计算集群和精神障碍计算机辅助诊断系统(CADS)组成。INCloud 的独特设计是脑特征库,它将数据管理的单位从图像转换为海马体积等图像特征。通过将 CADS 连接到科学数据库,INCloud 可以积累科学数据,不断提高精神障碍客观诊断的准确性。结果 用户可以在INCloud上管理和分析神经影像数据,无需将数据下载到本地设备。INCloud用户可以根据自定义标准查询、管理、分析和共享图像特征。文中展示了基于脑特征库的“大分析”示例。结论与传统的神经影像采集和分析工作流程相比,INCloud具有数据管理和共享安全便捷、对研究人员的技术要求低、计算和数据挖掘效率高、可直接应用于临床等特点。该系统的设计和实现也适用于其他领域的影像研究平台。
在本课程结束时,学生将能够: 1. 评估适合解决人工智能问题的图像处理技术。 2. 评估给定人工智能场景下图像处理方法的性能。 3. 在人工智能领域设计和开发图像处理系统 课程内容概要 本课程探讨解决人工智能问题的图像处理技术。图像形成和图像模型是涉及的初始步骤,它涵盖像素和对象级操作,包括直方图、边缘和片段。比较了图像增强和恢复。包括图像配准和图像变换操作。最后,给出图像特征和识别过程。包括计算机视觉的深度学习方法 评估和加权
摘要:高热流密度微器件的散热问题已成为迫切需要解决的问题,微通道内的沸腾传热是消除微器件高热负荷的有效方法之一。将图像技术与机器学习技术相结合,为微通道内流型与传热识别提供了一种新方法,利用纹理特征的支持向量机方法成功实现流型识别。为探究微器件内气泡动力学行为与流型,将图像特征与机器学习算法相结合,应用于沸腾流型识别,建立了流型演变与沸腾传热之间的关系,揭示了沸腾传热的机理。
在本文中,我们提出了一种新颖的多模态对比学习框架,利用量子编码器整合脑电图 (EEG) 和图像数据。这一开创性的尝试探索了将量子编码器整合到传统的多模态学习框架中。通过利用量子计算的独特属性,我们的方法增强了表征学习能力,为同时分析时间序列和视觉信息提供了一个强大的框架。我们证明量子编码器可以有效捕捉脑电图信号和图像特征中的复杂模式,从而促进跨模态的对比学习。这项工作为将量子计算与多模态数据分析相结合开辟了新途径,特别是在需要同时解释时间和视觉数据的应用中。
本研究重点关注从移植烧伤标本中进行医学图像检索时烧伤评估这一重大困难,特别是在资源受限的情况下,需要快速而准确的诊断。我们的解决方案将复杂的机器学习技术(即人工神经网络 (ANN))与图像修复系统中的对比度限制自适应直方图均衡化 (CLAHE) 算法相结合。与查询图像 (𝐾 query = 131 . 17 ) 相比,峰度值 (𝐾 CLAHE = 144 . 83 ) 的统计评估表明,CLAHE 图像中的分布具有更明显的尾部,从而增强了特定的图像特征。此外,CLAHE 图像中偏度的增加 (𝑆 CLAHE = 5 . 92 ) 表明与查询图像 (𝑆 query = 4 . 47 ) 相比,强度水平向更高强度的转变,进一步增强了可辨别的图像特征。通过这种结合,我们可以小心地保留图片边界,增强局部对比度,并最大限度地降低噪音,从而提高烧伤诊断的准确性。统计分析(例如峰度和偏度分析)验证了可见图片方面的改进,为基本纹理属性提供了重要的见解。我们使用 Bhattacharya 系数和独特的 bin 分析提高了图片检索效率,从而显著提高了匹配图像的检索分数。ANN 成功区分了需要移植的照片和不需要移植的照片,为急性烧伤提供了快速准确的诊断。这种综合技术大大提高了烧伤诊断水平,尤其是在紧急情况下,并有望改善医疗程序。我们的研究通过结合自动评估工具、强大的图像处理方法和机器学习,有助于提高困难医疗情况下的患者护理标准。