使用编码Rubisco大型亚基,小亚基rDNA和组合数据矩阵的基因的系统发育分析,对ULVACEAE的系统假设进行了测试。使用最大放线和最大似然标准的分析中包括了来自Ulvophyceae和Trebouxio-Phyceae的八个推定的杜斯属和十二个添加物分类单元的代表。分子数据支持ulvaceae的假设,这些假设是基于营养性thalli和Motile Cell Ultrocureture的早期发展。Ulvaceae Sensu Floyd和O'Kelly,包括Percursaria bory de Saint-Vincent,Ulvaria Ruprecht和叶绿体Tanner的密切相关物种,Enteromorpha Link和Ulva L.但是,不支持肠孢和Ulva的单一属。Ulvales和Ulotrichales Sensu Floyd和O'Kelly是单一的。Blidingia Kylin和Kornmannia Bliding与前者和Capsosiphon Gobi结合了后者,尽管这些命令中的关系和其他分类单元之间的关系仍然没有。ULVALES的特征是同构的生命史模式,Gametangia和Sporangia,它们在结构和发育中相同,具有双重末端盖的运动细胞以及由两个相等亚基组成的近端鞘。流动细胞释放和营养性thalli的总形态不是系统上可靠的特征。
基因组分析通常无法预测癌症的治疗结果。这种失败在一定程度上是由于大量的基因改变和癌症信号网络的可塑性。功能分析可以确定信号动力学,是预测药物反应的另一种方法。目前尚不清楚整合实体肿瘤的基因组和功能特征是否可以提供对治疗脆弱性的独特见解。我们通过对内在凋亡机制的 BH3 分析,在胶质瘤患者样本和衍生模型中进行分子和功能联合表征。我们发现,标准治疗以基因型特异性的方式快速重新连接凋亡信号,揭示了具有特定分子特征(例如 TP53 WT)的胶质瘤中可靶向的凋亡脆弱性。然而,BH3 分析的整合表明,高线粒体启动也是诱导胶质瘤凋亡所必需的。因此,机器学习方法可以识别出一种复合分子和功能特征,该特征可以最好地预测各种颅内胶质瘤模型对标准治疗疗法与 ABBV-155(一种针对内在凋亡的临床药物)的反应。这项研究表明,互补的功能和分子数据可以稳健地预测治疗引起的细胞死亡。
精确医学是一种考虑和预防疾病的新兴方法,考虑到基因,环境和生活方式的个体变化。目的是更精确地预测治疗和预防策略,这将适用于一群特定疾病的人。在肿瘤学中,精密医学意味着每个人收集的数据的大幅增加,其特征是多种数据源。例如,除临床分析和病理图像外,接受晚期癌症接受治疗的患者通常还需要完全分子分析。因此,多模型数据整合方法(图像,临床,分子数据)对于允许单个预测模型的定义至关重要。本论文开发了整合和分析复杂且高维数据的计算方法,以创建对癌症进展,亚型分类和患者存活的个性化预测。关键贡献包括用于整合多模型数据的新策略,这些策略改善了基于人工智能的预测的解释性,从而确保它们在临床上相关且对从业者来说是可以理解的。通过应对数据复杂性和解释性的双重挑战,这项工作奠定了在临床决策中应用高级分析的基础知识,从而支持肿瘤学中更精确有效的治疗路径。
人工智能辅助药物发现 (AIDD) 因其能够使新药搜索更快、更便宜、更有效而越来越受欢迎。尽管它广泛应用于众多领域(例如 ADMET 预测、虚拟筛选),但对带噪声的分布外 (OOD) 学习问题的研究却很少。我们提出了 DrugOOD,一个系统的 OOD 数据集管理和 AIDD 基准。具体来说,我们专注于药物-靶标结合亲和力预测问题,其中涉及大分子(蛋白质靶标)和小分子(药物化合物)。DrugOOD 提供了一个自动化的数据集管理者,具有用户友好的自定义脚本、与生物化学知识一致的丰富领域注释、逼真的噪声水平注释以及 SOTA OOD 算法的严格基准测试,而不是仅提供固定数据集。由于分子数据通常使用图神经网络 (GNN) 主干建模为不规则图,因此 DrugOOD 还可作为图 OOD 学习问题的宝贵试验台。大量的实证研究表明,分布内和分布外实验之间存在显著的性能差距,这强调了需要开发更有效的方案,以允许 AIDD 在噪声下进行 OOD 泛化。
stelliferinae是Sciaenidae的第三大特定亚科,有51种公认的物种排列在五个属中。从形态学和分子数据中得出的系统发育支持该亚科的单性别,尽管对该群体的属间关系或物种多样性尚无一般共识。我们使用了细胞色素氧化酶C亚基I(COI)基因的条形码区域来验证基于自动条形码间隙发现(ABGD),广义混合Yule Yule ColeScence(GMYC)和Bayesian Poisson Tree Process(BPTP)方法的基于自动条形码间隙发现(ABGD)的界定物种的界定。在一般中,这些不同方法的结果是一致的,划定了30-32个分子操作分类单元(MOTUS),其中大多数与有效物种相吻合。标志性的Menezesi和Stellifer Gomezi的标本归因于一种物种,这与该属的最新评论不同意。证据还表明,odon-toscion xanthops和corvula宏观属于单个MOTU。相比之下,证据还表明在牙肠牙本质和Bairdiella Chrysoura中都存在明显的谱系。这种结果与神秘物种的存在兼容,这是由遗传差异和单倍型谱系支持的。因此,本研究的结果表明,标志性的存在中未描述的多样性,这加剧了对这种亚科中鱼类的大量分类学复习的需求。
COVID-19 疫情正在影响全球数十亿人的生命。与此同时,全球各地的实验室都在加紧开发小分子药物、抗体和疫苗,以对抗 SARS-CoV-2 病毒。虽然针对该病毒的抗体可能会相对较快地问世,但疫苗可能需要更长的时间,而且小分子药物的可用性也更加不确定。然而,大多数人都认为,解决病毒问题最经济实惠的长期解决方案是开发一种安全有效的疫苗。这种疫苗的开发可能很简单,可能仅基于抗体,只需要将表面 S 蛋白作为重组分子、遗传构建体或从合适的病毒载体表达来呈现,即可诱导长效保护性抗体反应。开发也可能会遇到障碍,要求在免疫原和免疫策略的设计上更加复杂。作为可能遇到的障碍的一个例子,呼吸道合胞病毒 (RSV) 疫苗的开发已经推迟了 50 多年,根本原因是缺乏对呈现给免疫系统的表面 F 糖蛋白的适当构象的了解,这一问题直到最近才从详细的分子数据中得到解决。即使一种简单的方法对 SARS-CoV-2 疫苗有效,理想情况下,我们希望开发一种能够包含多种 betacoronaviruses 或至少 sarbecoviruses 的疫苗(即“泛冠状病毒”疫苗)。
抗肿瘤坏死因子 (TNF) 等生物制剂治疗克罗恩病 (CD) 安全有效,但患者中原发性和继发性无反应率很高。在本研究中,我们应用计算方法通过计算机模拟发现抗 TNF 难治性 CD 的新型药物疗法。我们使用来自 NCBI GEO 的抗 TNF 难治性 CD 患者的转录组数据集 (GSE100833)。共表达分析后,我们基于蛋白质-蛋白质相互作用数据库 STRING 专门研究了簇中基因间蛋白质-蛋白质相互作用的程度。使用基于 KEGG 基因集的 clEnrich 函数进行通路分析。簇 1、2、3、4 中的共表达基因、上调或下调基因以及所有差异表达基因都高度相关。其中,趋化因子信号传导高度富集的簇 1 也显示出细胞因子-细胞因子受体相互作用的富集,并确定了几种已知对 CD 有效的药物,包括环孢菌素。还确定了伏立诺他、组蛋白去乙酰化酶抑制剂和已知对 NF-κB 活性有抑制作用的荜茇酰胺。一些生物碱也被选为潜在的治疗药物。这些发现表明它们可能成为抗 TNF 难治性 CD 的新型治疗选择,并支持使用公共分子数据和计算方法来发现 CD 的新型治疗选择。
计算双学学的最新研究趋势越来越集中于整合文本和生物实体建模,尤其是在分子和蛋白质的背景下。,以前的努力(例如Biot5)在跨越各种任务的概括方面面临着挑战,并且缺乏对分子结构的细微理解,尤其是在其文本代表中(例如,IUPAC)。本文介绍了Biot5+,这是Biot5框架的扩展,该框架是为了增强生物学研究和药物发现而定制的。biot5+结合了几种新颖特征:IUPAC名称的集成,用于分子理解,包括Biorxiv和PubChem等来源的扩展生物文本和分子数据,用于跨任务的多任务中的多任务指定调整,以及用于数值的数字处理的数值数据。这些增强功能允许Biot5+弥合分子表示之间的差距及其文本描述,从而提供了对生物实体的更全面的理解,并在很大程度上改善了对生物质量和生物序列的基础推理。该模型经过预先训练和微调,并通过大量实验,包括3种类型的问题(分类,回归,一代),15种任务和21种基准数据集,在大多数情况下表现出了显着的性能和现状的结果。biot5+因其在生物学数据中捕获复杂的关系船的能力而脱颖而出,从而有助于生物信息学和计算生物学。我们的代码可从https://github.com/qizhipei/biot5获得。
我的论文重点关注生成模型及其在离散数据中的应用。我们提出了新颖的算法,将最先进的生成模型的见解与离散数据类型的领域特定知识相结合。这些算法旨在增强与训练数据的属性相似性,提高数据有效性,并提高生成输出的整体质量。我的论文的第一部分研究了使用上下文无关语法将几何图像转换为离散表示。我们讨论了在大型搜索空间中识别合适表示的有效且可扩展的技术。我的论文的第二部分研究了变分自动编码器 (VAE) 在恢复嵌入在低维流形中的高维数据时的行为,评估了它们恢复流形及其上的数据密度的能力。将我们对 VAE 的探索扩展到离散数据领域,特别是在分子数据生成中,我们发现一种增强 VAE 对连续数据的流形恢复的方法也显著改善了离散数据生成。我们使用 ChEMBL 数据集和两个较小的蛋白质靶标活性分子数据集研究了它的优点和局限性。最后,为了解决生成稳定三维分子的难题,该论文将不可微分化学预言机 GFN2-xTB 融入去噪过程,以改善几何形状和稳定性。该方法已在 QM9 和 GEOM 等数据集上得到验证,表明生成的分子具有更高的稳定率。
人们发现了许多具有典型遗传模式的单基因肾病基因,以及与环境因素相结合的复杂肾病基因。遗传学发现越来越多地用于指导肾病的临床管理,并改善了诊断、疾病监测、治疗选择和家庭咨询。所有这些步骤都依赖于对遗传数据的准确解释,而目前的数据收集速度可能已经赶不上这种解释的速度。2021 年 3 月,肾脏疾病:改善全球结果 (KDIGO) 举办了一场关于“慢性肾脏病 (CKD) 遗传学”的争议会议,以回顾目前对单基因和复杂(多基因)肾脏疾病的理解状态、将遗传学发现应用于临床医学的过程以及基因组学在定义和分层 CKD 中的应用。鉴于遗传变异对 CKD 的重要影响,建议 CKD 患者的从业者“考虑遗传因素”,具体包括了解家族史、收集 CKD 发病年龄的详细信息、进行肾外症状的临床检查以及考虑进行基因检测。为了改善遗传学在肾脏病学中的应用,与会人员建议为肾脏病学家制定高级培训或亚专科课程,制定检测和治疗指南,并对患者、学生和从业者进行教育。会议还确定了未来研究的关键领域,包括基因组变异的临床解释、电子表型分析、全球代表性、肾脏特异性分子数据、多基因评分、转化流行病学和开放数据资源。