摘要 - 医学成像应用在人体解剖学,病理学和成像领域方面高度专业。因此,用于培训医学成像中深度学习应用的注释培训数据集不仅需要高度准确,而且还需要多样化,并且足够大,以涵盖与这些规格有关的大多数合理示例。我们认为,实现此目标可以通过带有注释的合成图像的受控生成框架来促进,需要多个条件规格作为输入才能提供控制。我们采用denoising扩散概率模型(DDPM)来训练肺CT域中的大规模生成模型,并根据无分类器采样策略进行扩展,以展示一个这样的生成框架。我们表明,我们的方法可以产生带注释的肺CT图像,这些图像可以忠实地代表解剖学,令人信服地愚弄专家将其视为真实。我们的实验表明,这种性质的受控生成框架几乎可以超过几乎所有最新的图像生成模型,而在接受类似的大型医疗数据集接受培训时,在生成的医学图像中实现了解剖学一致性。
图2.1:带有手动注释的三种成像方式上的肿瘤外观(a = t2-flair,b = t2,c = t1c),以及右侧三个标签的融合(d)。从左到右:全肿瘤(黄色),肿瘤核(红色),增强肿瘤结构(浅蓝色),周围围绕核心的囊性/坏死成分(绿色)。(从[12]复制。)
摘要。切除手术可能治愈药物抵抗性局灶性癫痫,但只有 40% 至 70% 的患者在手术后实现无癫痫发作。回顾性定量分析可以阐明切除结构和患者结果的模式,以改善切除手术。然而,必须首先在术后 MRI 图像上分割切除腔。卷积神经网络 (CNN) 是最先进的图像分割技术,但需要大量带注释的数据进行训练。医学图像的注释是一个耗时的过程,需要训练有素的评估者,并且通常存在较高的评估者间差异。自监督学习可用于从未标记的数据中生成训练实例。我们开发了一种算法来模拟术前 MRI 图像上的切除术。我们整理了一个新的数据集 EPISURG,其中包含 431 名接受切除手术的患者的 431 张术后 MRI 图像和 269 张术前 MRI 图像。除了 EPISURG,我们还使用了三个公共数据集(包含 1813 张术前 MRI 图像)进行训练。我们在训练期间动态创建的人工切除图像上训练了一个 3D CNN,使用的图像来自 1) EPISURG、2) 公共数据集和 3) 两者。为了评估训练好的模型,我们计算了模型分割和三位人工评估者执行的 200 个手动注释之间的 Dice 分数 (DSC)。使用带有手动注释的数据训练的模型获得的中位数(四分位距)DSC 为 65.3(30.6)。我们表现最好的模型的 DSC 是在没有手动注释的情况下训练的,为 81.7(14.2)。相比之下,人类注释者之间的评级者间一致性为 84.0 (9.9)。我们展示了一种使用模拟切除腔的 CNN 训练方法,该方法可以准确地分割真实的切除腔,而无需手动注释。
我们提出了一个半监督域自适应框架,用于从不同的图像模态中分割脑血管。尽管可用的脑血管成像技术范围很广,但现有的最先进的方法只关注单一模态。这可能导致显著的分布变化,从而对跨模态的泛化产生负面影响。通过依赖带注释的血管造影和有限数量带注释的静脉造影,我们的框架完成了图像到图像的转换和语义分割,利用解开的、语义丰富的潜在空间来表示异构数据并执行从源域到目标域的图像级自适应。此外,我们降低了基于循环的架构的典型复杂性并最大限度地减少了对抗训练的使用,这使我们能够构建一个具有稳定训练的高效、直观的模型。我们在磁共振血管造影和静脉造影上评估了我们的方法。在源域中实现最佳性能的同时,我们的方法在目标域中的 Dice 得分系数仅低 8.9%,凸显了其在不同模态下进行稳健脑血管图像分割的巨大潜力。
在3D医学图像中对感兴趣的器官进行分割是准确诊断和纵向研究的必要条件。尽管使用深度学习的最新进展已显示出许多细分任务的成功,但是高性能需要大的数据集,而注释过程既耗时又耗时。在本文中,我们提出了一个3D少数射击分割框架,以使用目标器官注释的有限训练样本进行准确的器官序列。为了实现这一目标,像U-NET一样的网络旨在通过了解支持数据的2D片与查询图像之间的关系,包括辅助门控复发单元(GRU),该单元(GRU)了解相邻切片之间编码特征的一致性。此外,我们会介绍一种传输学习方法,以通过在支持数据中采样的任意支持和查询数据进行测试之前对模型进行更新,以适应目标图像和器官的特征。我们使用带有不同器官注释的三个3D CT数据集评估了我们提出的模型。我们的模型比最先进的射击分段模型产生了显着提高的性能,并且与经过更多目标培训数据训练的完全监督模型相当。
胶质母细胞瘤(GBM)是中枢神经系统的高度血管生成恶性肿瘤,抗拒标准的抗血管生成疗法,部分原因是称为血管生成的替代过程称为血管生成。与GBM杂乱无章的联系,河马信号通路的失调导致YAP/ TEAD的过表达,以及涉及治疗耐药性的几个下游效应子。对GBM化学耐药表型中的血管生成模拟和河马途径是否相交知之甚少。本研究旨在研究临床注释的GBM样品中河马途径调节剂的表达模式,研究其在体外参与有关血管生成模拟的介入。此外,它旨在评估该途径的药理靶向的潜力。对河马信号构件YAP1,TEAD1,AXL,NF2,CTGF和CYR61转录水平在低度GBM和GBM肿瘤组织中的转录水平。通过人U87,U118,U138和U251脑癌细胞系以及临床注释的脑肿瘤cDNA阵列中的实时定量PCR分析基因表达。使用特定的小干扰RNA进行瞬时基因沉默。血管生成模仿,三维
摘要:目前,在数以百万计的 Android 应用程序中,存在着许多恶意程序,对人们的安全和隐私构成重大威胁。因此,开发检测 Android 恶意软件的方法势在必行。最近开发的恶意软件检测方法通常依赖于各种功能,例如应用程序编程接口 (API) 序列、图像和权限,从而忽略了源代码和相关注释的重要性,而这些注释通常不包含在恶意软件中。因此,我们提出了 Android-SEM,这是一种基于迁移学习的 Android 源代码语义增强模型。我们提出的模型建立在 Transformer 架构之上,以实现从恶意软件源代码生成代码注释的预训练框架。使用生成对抗网络优化预训练框架的性能。我们提出的模型依赖于一种新颖的基于回归模型的过滤器来保留高质量的注释和源代码,以进行与语义增强相关的特征融合。与传统方法相反,我们创造性地结合了量子支持向量机 (QSVM) 来对恶意 Android 代码进行分类,结合了量子机器学习和经典深度学习模型。结果证明,Android-SEM 在恶意软件检测和恶意软件分类方面的准确率分别达到 99.55% 和 99.01%。
抽象聚合物被广泛用于不同的领域,并且对提取和组织信息的有效方法的需求正在增加。使用机器学习的自动化方法可以准确地从科学论文中提取相关信息,从而为使用带注释的培训数据提供了一种有希望的解决方案,以自动化信息提取。在本文中,我们引入了一个与聚合物相关的本体论,该本体论具有至关重要的实体和关系,以增强聚合物科学领域的信息提取。我们的本体论是可以自定义的,以适应特定的研究需求。我们提出了Polynere,一种高品质的命名实体识别(NER)和关系提取(RE)语料库,其中包括使用我们的本体学注释的750个聚合物摘要。Polynere的独特特征包括多种实体类型,关系类别,对各种NER设置的支持以及在不同层面上主张实体和关系的能力。Polynere还通过支持证据来促进RE任务中的推理。我们的最新高级方法实验取得了令人有希望的结果,但挑战持续将NER和RE从摘要调整为全文段落。这强调了在聚合物域中需要强大的信息提取系统的需求,这使我们的语料库成为未来发展的宝贵基准。
Arboretum是一个13460万样本数据集,旨在通过为生物多样性应用推进AI,并通过提供一个大规模,准确注释的多模式数据集,其中包含图像和相应的文本描述,用于多样化的物种。植物园旨在促进用于物种鉴定,生态监测和农业研究的AI模型的开发。补充 - 我们介绍了三个新的基准数据集:Arboretum-Unseen,Arboretum-Lifestages和Arboretum均衡。
人们越来越需要将无人机系统 (UAS) 用于一系列目前超出书面法规范围的新应用,包括出租车服务、包裹递送、农作物喷洒等等。现行《联邦法规法典》第 14 章第 107 部分限制了 UAS 的航空公司应用。特别是,14 CFR 第 107 部分法规没有明确涉及 14 CFR 第 121 部分(即航空公司运营)和 14 CFR 第 135 部分(即通勤航空运营)。无人驾驶操作中的机组人员和人员配备要求已得到广泛研究,对此进行注释是本文档的重点,但 UAS 应用和 UAS 自动化的近期和持续发展已导致机组人员的角色和职责发生变化。本带注释的参考书目将有助于为未来从最后一英里到高空长航时操作的法规提供信息,以便这些 UAS 的新应用可以安全地集成到国家空域系统 (NAS) 中。本带注释的参考书目旨在综合机组人员和人员配备文献,为未来有关航空公司运营中 UAS 运营商的法规提供信息。它涵盖了有关机组人员和人员配备、自动化、培训、测试以及值班和休息要求的一系列文献。通过搜索与无人驾驶操作和机组人员和人员配备要求相关的关键字,从 PsycINFO、Google Scholar 和联邦航空管理局 (FAA) 技术图书馆数据库中收集了文章。确定有 76 篇文章与本文献综述相关。文章包括实证研究、荟萃分析、文献综述和组织指南。本带注释的参考书目分为两个主要部分:无人机系统和载人操作,并附有相关小标题。这些小标题是根据以下一般发现生成的:机组人员和人员配备需求应由运营需求决定,而 UAS 自动化的快速发展导致机组人员的角色发生变化。标准化 UAS 操作员机组人员和人员配备要求将支持 UAS 安全有效地融入 NAS。这仍然是 FAA 和行业利益相关者的一项重要举措。