(未通过同行评审认证)是作者/资助者。保留所有权利。未经许可就不允许重复使用。此预印本版的版权持有人于2024年8月1日发布。 https://doi.org/10.1101/2024.08.01.606235 doi:biorxiv preprint
摘要。缺乏有关乳腺癌检测的计算机辅助诊断(CAD)的大量培训数据一直是阻碍系统采用的问题之一。最近,通过视觉模型(VLM)(例如,剪辑)对大规模图像文本数据集进行预训练,部分解决了计算机视觉(CV)中鲁棒性和数据效率的问题。本文提出了Mammo-CLIP,这是第一个通过大量筛选乳房X线图 - 报告对的VLM,以解决数据集多样性和大小的挑战。我们在两个公共数据集上进行的实验表明,在对乳腺癌检测至关重要的各种乳腺X线学属性时表现出强烈的表现,表明数据效率和鲁棒性与CV中的剪辑相似。我们还提出了一种新型特征归因方法Mammo-Factor,以在乳房X线摄影报告中使用句子级粒度来提供表示表示的空间解释。代码可公开使用:https://github.com/batmanlab/mammo-clip。
。cc-by-nc-nd 4.0国际许可证(未获得同行评审证书)获得的是作者/资助者,他已授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是该版本的版权所有,该版本发布于2024年6月27日。 https://doi.org/10.1101/2023.12.20.572522 doi:Biorxiv Preprint
增强子或顺式调控元件可确保在发育过程中对基因表达进行精确的时空控制。该过程由转录因子 (TF) 和辅激活因子介导,它们将调控信息从增强子传递到其目标启动子,跨越的距离可能超过一兆碱基 1-4 。这种增强子-启动子 (E-P) 通讯被认为发生在所谓的拓扑相关结构域 (TAD) 内,拓扑相关结构域是通过黏连蛋白和 CCCTC 结合因子 (CTCF) 的环挤压过程形成的基因组基本组织单位 5-7 。TAD 或 TAD 内染色质相互作用的破坏可能导致基因表达或基因激活的错误下调,并可能导致人类疾病,这表明正确的 E-P 通讯对基因激活的重要性 8-10 。
抽象分类3D MRI图像以早期检测阿尔茨海默氏病是医学成像中的关键任务。使用卷积神经网络(CNN)和变形金刚在该领域面临重大挑战的传统方法。cnns虽然有效地捕获本地空间特征,但要与远程依赖关系挣扎,并且通常需要大量的计算资源来获得高分辨率3D数据。变形金刚在捕获全局上下文方面表现出色,但在推理时间的二次复杂性却需要大量记忆,因此对于大规模的3D MRI数据而言,它们的效率降低了。为了解决这些局限性,我们建议使用Vision Mamba(一种基于状态空间模型(SSM)的高级模型(SSM),以对3D MRI图像进行分类以检测阿尔茨海默氏病。Vision Mamba利用动态状态表示和选择性扫描算法,从而使其能够有效地捕获和保留3D卷的重要空间信息。通过基于输入特征动态调整状态过渡,Vision Mamba可以选择性保留相关信息,从而导致3D MRI数据的更准确和计算有效的处理。我们的方法结合了培训期间卷积操作的可行性质,并在推断过程中进行了有效的,经常性的处理。此体系结构不仅提高了计算效率,而且还提高了模型处理3D医学图像中长期依赖关系的能力。实验结果表明,Vision Mamba的表现优于传统的CNN和变压器模型的准确性,这使其成为使用3D MRI数据早期检测阿尔茨海默氏病的有前途的工具。
最近,具有效率的硬件感知设计的状态空间模型(SSM),即Mamba深度学习模型,已显示出长序列建模的巨大计算。同时,纯粹在SSM上建立有效和通用的视力骨干是一个吸引人的方向。,由于视觉数据的位置敏感性以及全球上下文对视觉理解的要求,代表视觉数据对SSM的挑战。在本文中,我们表明,对自我注意力的依赖无需进行视觉代表学习,并提出了带有双向Mamba块(VIM)的新的通用视觉主链,该主块(VIM)标记了带有位置嵌入的图像序列,并用Bidirectiact态态空间模型将视觉表示。Imagenet分类,可可对象检测和ADE20K
摘要植物生长促进根瘤菌(PGPR)是在根际,土壤Sur圆形植物根中发现的一组有益细菌。这些细菌通过各种机制为增强植物生长提供了巨大的潜力。对PGPR至关重要的是具有不仅支持植物生长,而且保持生态友好的特定特征。考虑到农业中化学投入的使用增加,这一点尤其重要,这导致土壤中有害物质的积累,导致随着时间的推移生育率降低。在PGPR群中的各种细菌物种中,假单胞菌荧光症是众所周知且经过广泛研究的一种。研究人员已经对PGPR对植物生长的影响进行了研究,从实验室实验到延伸到温室试验。这些研究表明,PGPR作为生物肥料和生物农药的积极影响。已经探索了具有特定载体的PGPR菌株的配方,以有效地将细菌递送到土壤,然后将细菌传递给植物。这种制剂有可能减少农业实践中对化肥的依赖。一旦开发了PGPR的配方,它便可以用于市场,并容易为农场提供。这可以促进在农业地区促进有机或可持续的农业实践,从而减少对合成化学品的依赖并促进可持续的农业实践。
摘要 - Mamba是一种具有RNN样的状态空间模型(SSM)的架构,最近引入了以解决注意机制的二次复杂性,随后应用于视觉任务1。尽管如此,与卷积和基于注意力的模型相比,Mamba的视力表现通常令人难以置信。在本文中,我们深入研究了Mamba的本质,并从概念上得出结论,Mamba非常适合具有长期序列和自回归特征的任务。对于视觉任务,由于图像分类不与任何一个特征保持一致,因此我们假设Mamba对于此任务不是必需的;检测和细分任务也不是自动回归的,但它们遵守了长期的特征,因此我们认为仍然值得探索Mamba的这些任务潜力。为了凭经验验证我们的假设,我们通过堆叠Mamba块构建了一系列名为Mambaout的模型,同时删除其核心令牌混合器SSM。实验结果强烈支持我们的假设。具体来说,我们的Mambaout模型超过了ImageNet图像分类上的所有视觉Mamba模型,表明Mamba确实不需要执行此任务。对于检测和分割,Mambaout不能匹配最先进的视觉Mamba模型的性能,这证明了Mamba在长期的视觉任务中的潜力。
摘要:近二十年来,人乳微生物组的存在已被广泛认可,许多研究研究了其与母亲和婴儿健康的组成以及关系。但是,人乳微生物群的丰富性和生存能力令人惊讶地低。鉴于哺乳动物的乳腺容纳温暖而营养丰富的环境并与外部环境接触,可能会预计哺乳动物的乳腺会含有高生物质微生物组。这种差异提出了一个问题,即牛奶中的细菌是否来自乳腺中真正的微生物定植(“居民”),还是仅仅是其他细菌来源不断涌入的结果(“游客”)。通过将动物,体外和人类研究的数据汇总在一起,本综述将研究乳腺乳腺是否被住宅微生物组定殖的问题。
医疗保健中自然语言处理(NLP)系统的进步在语言模型的能力上解释临床注释中包含的信息信息。此过程通常需要在病史的病史中从各个时间点整合信息。但是,大多数较早的临床语言模型都经过了上下文长度的审议,仅限于大约一个临床文件。在这项研究中,我们介绍了ClinicalMamba,这是Mamba语言模型的专门版本,并在大量的纵向临床注释中预审到,以满足医疗Do-Main的独特语言特征和信息处理需求。具有130万个公元和28亿个参数的临床曼巴模型在对较长的文本长度上建模临床语言方面表现出卓越的性能,与MAMBA和其他基于Longformer和Llama的临床模型相比。经过少量学习,ClinicalMamba在速度和性能方面取得了显着的基准,在纵向临床任务中表现优于临床语言模型和诸如GPT-4(例如GPT-4)的大型语言模型。