动机:测序技术的最新进展强调了序列分析算法和工具在基因组学和医疗保健研究中的关键作用。尤其是,序列对齐是许多序列分析管道中的基本构建块,并且在执行时间和内存使用方面经常是性能瓶颈。经典序列比对算法基于动态编程,通常需要相对于序列长度进行二次时间和内存。结果,经典序列比对算法无法随着序列长度的增加而扩展,并且由于数据移动惩罚而迅速成为内存结合。结果:内存处理(PIM)是一种新兴的体系结构范式,试图通过使计算更接近数据来减轻数据移动惩罚来加速内存结合的算法。这项工作介绍了BIMSA(双向内存序列对齐),这是最先进的序列对齐算法BIWFA(双向波前对齐)的PIM设计和实现,该算法biwfa(双向波前对齐),为生产的PIM Architection(Upmem)结合了新的硬件功能优化。bimsa支持对齐序列最多100K基础,超过了状态PIM实现的局限性。首先,与序列比对算法的最先进的PIM实现相比,BIMSA达到高达22.24×(平均为11.95×)的加速度。第二,与BIWFA的最高表现多核CPU实现相比,达到高达5.84×(平均为2.83×)的加速度。联系人:Alejandro.alonso1@bsc.es第三,BIMSA具有内存中计算单元数量的线性可伸缩性,可以通过配备更多计算单元的PIM体系结构进行进一步的性能改进,并实现高达9.56×x(平均4.7倍)的速度。可用性:代码和文档可在https://github.com/ alejandroamarin/bimsa上公开获得。
单细胞RNA-Seq以前所未有的规模和细节来表征生物样品,但数据解释仍然具有挑战性。在这里,我们介绍了Cellwhisperer,这是一种多模式的机器学习模型和软件,该模型和软件连接转录组和文本,用于交互式单细胞RNA-seq数据分析。Cell Whisperer启用25英语中基于聊天的转录组数据的询问。为了培训我们的模型,我们创建了一个具有超过一百万对RNA-seq配置文件和匹配的文本注释的A-Ai-Cunip策划数据集,并在广泛的人类生物学上进行了匹配,我们建立了使用对比学习的匹配转录组和文本的多模式嵌入。我们的模型启用了按单元类型,状态和其他属性以零摄像的方式启用转录组数据集的自由文本搜索和注释,而无需参考数据集。此外,细胞-30个耳语者回答了关于自然语言聊天中细胞和基因的问题,使用生物学流利的大语言模型,我们对我们进行了微调,以分析各种生物应用中的批量和单细胞转录组数据。我们将Cell Whisperer与广泛使用的CellXgene浏览器集成在一起,使用户可以通过集成的图形和聊天接口进行遗传探索RNA-Seq数据。我们的方法展示了一种使用转录组数据的新方法,利用自然语言进行单细胞数据35分析,并为未来的基于AI的生物信息学研究助理建立重要的基础。
此外,在帕金森氏病,抑郁症,躁郁症,焦虑症和精神分裂症等精神病和神经系统疾病中观察到的时间感知的扭曲仍然知之甚少(Teixeira等,2013)。例如,患有抑郁症的人通常集中于过去的过去经历,并且经常报告时间似乎缓慢甚至感觉已经停止了(Ren等,2023)。同样,患有帕金森氏病的患者也倾向于感知时间更慢。另一方面,焦虑会引起时间的加速感知,尤其是在高压力和唤醒时期(Holman等,2023)。患有注意力缺陷多动障碍的人可能会感觉到时间比实际的时间更快或慢(Ptacek等,2019)。Stanghellini等。发现,精神分裂症患者可能将时间的看法描述为缺乏连续性,而感到彼此断裂的时刻(Stanghellini等,2016)。这可能表现为即时时间流的损失,使事件感到孤立和无关,这有助于组织日常活动和维持社交互动的困难。因此,时间感知的研究不仅是理解人类认知的基础,而且对实用应用具有巨大的潜力,这些应用可能会对个人和社会福祉产生积极影响,并且对于诊断和治疗各种精神病学和神经疾病具有实际意义。
