。CC-BY 4.0国际许可证。根据作者/资助人提供了预印本(未经同行评审的认证)提供的,他已授予Biorxiv的许可证,以在2025年2月25日发布的此版本中在版权所有者中显示预印本。 https://doi.org/10.1101/2025.01.30.635633 doi:biorxiv preprint
目的:本研究的目的是在初次诊断脑肿瘤时确定癫痫发作的相关风险因素,并开发和验证基于机器学习的预测,以允许基于风险的抗癫痫疗法进行量身定制。方法:临床,电生理和高分辨率成像数据是从1051例新诊断的脑肿瘤的连续队列中获得的。与因子相关的癫痫发作风险差异允许确定特定地形,人口统计学和组织病理学变量在诊断时可用的癫痫发作风险时可用的相关性。数据以70/30的比例分为培训和测试集。在选择高性能的同时选择其可追溯性的广义添加剂模型(GAM)之前,对基于机器学习的不同预测模型进行了评估。基于风险因素的临床分层,对三个不同的GAM进行了培训和内部验证。结果:总共923名患者有完整的数据并包括在内。可以确定驱动癫痫发作风险的特定地形解剖模式。脑肿瘤的异质,介质或原发性运动/s骨或躯体的新染色性结构导致癫痫发作风险的显着且临床上相关的增加。虽然地形输入与GAM最相关,但最好的预测是通过形态,人口统计学和组织病理学信息的组合来实现的(验证:AUC:0.79,准确性:0.72,灵敏度:0.81,特异性:0.66)。结论:本研究将特定的系统发育解剖模式鉴定为癫痫驱动因素。GAM允许使用地形,人口统计学和组织病理学数据预测癫痫发作风险,从而在保持透明度的同时实现了公平的表现。
准确预测硅中的药物目标亲和力(DTA)对于现代药物发现至关重要。在药物开发的早期阶段应用的DTA预测的计算方法,能够大大降低其成本。最近提出了基于机器学习的广泛方法进行DTA评估。它们最有前途的是基于深度学习技术和图形神经网络来编码分子结构。Alphafold做出的蛋白质结构预测的最新突破使得无前前数量的蛋白质,而没有实验定义的结构可用于计算DTA预测。在这项工作中,我们提出了一种新的深度学习DTA模型3DPROTDTA,该模型与蛋白质的图表结合使用了Alphafold结构预测。该模型优于其在通用基准数据集上的竞争对手,并且具有进一步改进的潜力。
摘要 BrainAge(根据神经影像数据预测受试者的表观年龄)是大脑衰老的重要生物标志物。BrainAge 与真实年龄的偏差与精神和神经疾病有关,并且已被证明可有效预测轻度认知障碍 (MCI) 转化为痴呆症。传统上,3D 卷积神经网络及其变体用于预测大脑年龄。然而,这些网络比 2D 网络具有更多参数并且训练时间更长。在这里,我们提出了一种基于 2D 切片的循环神经网络模型,该模型以有序的矢状切片序列作为输入来预测大脑年龄。该模型由两部分组成:一个 2D 卷积神经网络 (CNN),它对切片中的相关特征进行编码,以及一个循环神经网络 (RNN),它学习切片之间的关系。我们将我们的方法与其他最近提出的方法进行了比较,包括 3D 深度卷积回归网络、信息论模型和特征包 (BoF) 模型(例如 BagNet)——其中分类基于局部特征的出现,而不考虑它们的全局空间顺序。在我们的实验中,我们提出的模型的表现与当前最先进的模型相当甚至更好,参数数量几乎减少了一半,收敛时间也更短。关键词:深度学习、循环神经网络、卷积神经网络、大脑年龄、结构磁共振成像
Optimizing transcriptome-based synthetic lethality predictions to improve precision oncology in early-stage breast cancer: BC-SELECT Yewon Kim 1 , Matthew Nagy 2 , Rebecca Pollard 1 , *Padma Sheila Rajagopal 1,3 1 Cancer and Data Science Laboratory, Center for Cancer Research, National Cancer Institute, Bethesda, MD 2 Boston Children's Hospital, Boston, MD 3 Women's恶性分支,癌症研究中心,国家癌症研究所,贝塞斯达,医学博士摘要单词计数:246个单词单词计数:3,649个单词参考文献:75参考图 /表计数:图:4表:2表:2补充图:2补充表:2补充表:3个补充表:3个通信作者:PADMA SHEILA RAJAGOPAL,MD MSC MSSC MSSC PORDICAIN 4B PRODENATIAN:10贝塞斯达,医学博士20892电子邮件:sheila.rajagopal@nih.gov电话:240-858-3169跑步标题:BC-SELECT:早期乳腺癌的治疗反应预测
上下文。濒临灭绝的临时草药单曲霉(Euphorbiaceae)在澳大利亚东部已知的范围内有限(〜211)记录(〜211)。在新南威尔士州(新南威尔士州),这127起事件分布在该州的一半以上,出于监管目的,这导致262种植物社区类型(PCT)被预测为Bionet威胁性生物多样性数据收集(TBDC)中该物种的合适栖息地。在新南威尔士州目前正在使用的生物多样性评估方法下,对于发生262个PCT中一个或多个的任何开发地点,都应针对单调大叶叶。目标。与TBDC相比,评估如何预测栖息地的单体大叶藻。方法。进行了所有可用的凭证收集,观察记录和澳大利亚东部文献的检查,并对新南威尔士州PCT分类进行了审查。关键结果。单调大叶状会在新南威尔士州只有15个PCT填充,但目前仅包含10个PCT列表,该物种的预测PCT列表中。现有存在数据的证据的重量清楚地表明,新南威尔士州的单调大型叶子鉴定出的10次Heath和Rocky Scrub pcts构成了所有新南威尔士州记录中的121(95%)。对昆士兰州对区域生态系统的记录的分析并未确定额外的PCT提出的植被,这些植被也可能支持新南威尔士州其他地方的物种。结论。含义。已知或预期支持单调的15个PCT的修订套件仅占该州的14,660 km 2或1.8%(如果删除低置信性PCT,则可能少于27,000 km 2或3.4%,而预测的262 pcts的27,000 km 2或3.4%。目前,如果在土地内提出了任何发展,该开发支持与单调大叶鼠有关的262个PCT中的一个或多个,则需要适当定时的目标调查以折现其存在,否则必须假定它存在。本综述强调,预测的栖息地应通过使用已知存在数据,而不是使用对可能栖息地的广泛理解,并建议对所有受威胁物种进行监管框架内预测的栖息地进行定期修订。
一旦生成了合适的参考序列,通常会通过重新测试来评估种类内的变化。变体通话过程可以揭示菌株,加收,基因型或个体之间的所有差异。这些变体可以根据可用的结构注释(即基因模型)的功能含义来丰富它们的功能含义。尽管这些功能影响预测以每个变化的基础是准确的,但是一些具有挑战性的案例需要同时将多个PLE相邻变体纳入此预测过程。示例包括相邻的变体,这些变体会改变彼此的功能影响。在预测效果时,邻里感知的变体影响预测变量(NAVIP)考虑给定蛋白质编码序列中的所有变体。作为概念的证明,拟南芥加收哥伦比亚-0和Niederzenz-1之间的变体被注释。Navip可在GitHub(https://github.com/bpucker/navip)上免费获得,并可以通过Web服务器(https:// pbb-tools.de)访问。
随机性的功能理论是在Vovk [2020]中以非算力的随机性理论的名义提出的。Ran-Domness的算法理论是由Kolmogorov于1960年代启动的[Kolmogorov,1968年],并已在许多论文和书籍中开发(例如,参见Shen等人。2017)。它一直是直觉的强大来源,但其弱点是对特定通用部分可计算函数的选择的依赖性,这导致其数学结果中存在未指定的加性(有时是乘法)常数。Kolmogorov [1965,Sect。 3] speculated that for natural universal partial computable functions the additive constants will be in hun- dreds rather than in tens of thousands of bits, but this accuracy is very far from being sufficient in machine-learning and statistical applications (an addi- tive constant of 100 in the definition of Kolmogorov complexity leads to the astronomical multiplicative constant of 2 100 in the corresponding p-value). 与VOVK [2020]中提出的未指定常数打交道的方式是表达有关随机性算法作为各种函数类之间关系的算法。 它将在教派中引入。 2。 在本文中,我们将这种方法称为随机性的功能理论。 虽然它在直观的简单性方面失去了一定的损失,但它越来越接近实用的机器学习和统计数据。 读者将不会假设对随机性算法理论的形式知识。 在本文中,我们有兴趣将随机性的功能理论应用于预测。 3。Kolmogorov [1965,Sect。3] speculated that for natural universal partial computable functions the additive constants will be in hun- dreds rather than in tens of thousands of bits, but this accuracy is very far from being sufficient in machine-learning and statistical applications (an addi- tive constant of 100 in the definition of Kolmogorov complexity leads to the astronomical multiplicative constant of 2 100 in the corresponding p-value).与VOVK [2020]中提出的未指定常数打交道的方式是表达有关随机性算法作为各种函数类之间关系的算法。它将在教派中引入。2。在本文中,我们将这种方法称为随机性的功能理论。虽然它在直观的简单性方面失去了一定的损失,但它越来越接近实用的机器学习和统计数据。读者将不会假设对随机性算法理论的形式知识。在本文中,我们有兴趣将随机性的功能理论应用于预测。3。机器学习中最标准的假设是随机性:我们假设观察值是以IID方式生成的(独立且分布相同)。先验弱的假设是交换性的假设,尽管对于无限的数据序列而言,随机性和交换性证明与著名的de Finetti代表定理本质上是等效的。对于有限序列,差异是重要的,这将是我们教派的主题。我们开始讨论在教派中预测的随机性功能理论的应用。2。在其中介绍了置信度预言的概念(稍微修改和推广Vovk等人的术语。2022,Sect。2.1.6)。然后,我们根据三个二分法确定八种置信预测因素: