摘要:机器学习 (ML) 识别共价配位位点可能会加速靶向共价抑制剂的设计,并有助于扩大可用药的蛋白质组空间。本文我们报告了基于树的模型和卷积神经网络 (CNN) 的严格开发和验证,这些模型和神经网络是在新近整理的数据库 (LigCys3D) 上训练的,该数据库包含近 800 种蛋白质中的 1,000 多个配位半胱氨酸,由蛋白质数据库中的 10,000 多个三维结构代表。树模型和 CNN 的未见测试分别产生了 94% 和 93% 的 AUC(受试者工作特征曲线下面积)。基于 AlphaFold2 预测的结构,ML 模型以超过 90% 的召回率重现了 PDB 中新配位的半胱氨酸。为了协助共价药物发现社区,我们报告了 392 种人类激酶中预测的可配体半胱氨酸及其在序列比对激酶结构(包括 PH 和 SH2 结构域)中的位置。此外,我们还发布了可搜索的在线数据库 LigCys3D(https://ligcys.computchem.org/)和网络预测服务器 DeepCys(https://deepcys.computchem.org/),这两个数据库都将通过包含新发布的实验数据不断更新和改进。本研究代表了迈向由机器学习主导的大型基因组数据和结构模型集成的第一步,旨在为下一代共价药物发现注释人类蛋白质组空间。
摘要。拉曼光谱对分子水平上物质化学成分的高灵敏度使其成为通过分析血清诊断慢性心力衰竭(CHF)的宝贵工具。拉曼光谱法提供了一种无标签,快速检测方法,与机器学习(ML)技术结合使用时具有高度特异性和准确的结果。但是,必须仔细选择适当的ML算法,以分析高维光谱数据,以获得可靠和正确的结果,这些结果主要基于所研究的样品,标本或结构的真实化学特征以及并非所有算法都可以提供高性能。在这项研究中,我们比较了四种方法:(1)多变量曲线分辨率与逻辑回归(MCR-LR)结合使用,(2)与线性内核支持向量机(MCR-SVM),(3)在潜在结构上的投影与歧视分析(PLS-DA)的投射(4)投影(4) (PLS-SVM)。这些方法适用于CHF患者的193例拉曼光谱,对照病例的78例。我们发现,PLS-DA和PLS-SVM证明了最佳的ROC AUC,平均值为0.950(0.91-0.97,0.95 CI)和0.99(0.94 - 1.00,0.95 CI),而MCR-LR和MCR-SVM仅实现了0.50(0.46- 0.53-0.95 CI),以及0.53,0.95 CI),并实现CI),分别。©2024生物医学光子学与工程杂志。
背景。预测抑郁症的过程对于个性化治疗是必要的。受损的葡萄糖代谢(IGM)是作为有希望的抑郁生物标志物引入的,但未达成共识。这项研究旨在在抑郁诊断时预测IgM,并检查长期预后与预测结果之间的关系。方法。从韩国的四个电子健康记录中提取临床数据。研究人群包括抑郁症患者,结果在1年内为IgM。一个数据库用于使用三种算法来开发模型。使用三个数据库中的最佳算法进行外部验证。计算曲线下的面积(AUC)以确定模型的性能。kaplan - 作为长期预后,Meier和Cox的抑郁症风险的生存分析。在四个数据库中对长期结局进行了元分析。结果。使用3,668人的数据开发了一个预测模型,AUC为0.781,绝对收缩和选择运算符(LASSO)逻辑回归。在外部验证中,AUC为0.643、0.610和0.515。通过预测的结果,进行了生存分析和荟萃分析。预计患有IGM的患者抑郁症的危险比为1.20(95%置信区间[CI] 1.02 - 1.41,P = 0.027),在3年的随访中。结论。我们在一年内开发了IgM发生的预测模型。预测的结果与抑郁症的长期预后有关,这是与抑郁症的预后有关的有希望的IGM生物标志物。
心电图(ECG)是最常执行的心血管诊断测试,但尚不清楚有关长期心血管风险所包含多少信息的信息。在这里,我们报告说,仅基于休息的心电图,深层卷积神经网络可以准确预测心血管死亡率和疾病的长期风险。使用在斯坦福大学医学中心收集的大量静止的12铅ECG数据集,我们开发了斯坦福大学心电图风险估计器Seer。SEER在斯坦福大学的持有测试集中预测,接收器操作员特征曲线(AUC)下的面积为0.83,而在锡达尔斯西尼阿莱医学中心和哥伦比亚大学欧文大学欧文大学欧文中心进行独立评估时,AUC分别为0.78和0.83。SEER预测5年动脉粥样硬化疾病(ASCVD)为0.67,类似于ASCVD风险的合并队列方程,而仅适度相关。与合并的队列方程式结合使用时,SEER会准确地将16%的患者从低风险中重新分类,从而发现一组为9.9%的10年ASCVD风险的群体,这些风险否则不会以其他方式指示他汀类药物治疗。seer还可以预测其他几种心血管疾病,例如心力衰竭和心房。仅使用ECG的铅I,它可以预测5年心血管死亡率,AUC为0.80。seer与汇总队列方程式和其他风险工具一起使用,可以大大改善心血管风险层面的策略,并有助于医疗决策。
背景:一种非侵入性子宫内膜癌检测工具,可以准确地有症状的女性进行定义测试,这将改善患者护理。尿液是一种吸引人的生物流体,用于癌症检测,因为它的简单性和易于收集性。这项研究的目的是确定可以区分子宫内膜癌患者与症状对照的基于尿液的蛋白质组学特征。方法:这是一个前瞻性案例 - 对症状的绝经后妇女的控制研究(50个癌症,54例对照)。无效的自我收集的尿液样品进行质谱法处理,并使用所有理论质谱(Swath-MS)的顺序窗口采集进行运行。机器学习技术用于识别重要的歧视性蛋白质,随后使用逻辑回归将其合并在多标记面板中。结果:用于子宫内膜癌症检测的最高歧视性蛋白单独表现出适度的准确性(AUC> 0.70)。但是,结合最歧视性蛋白的算法在AUC> 0.90中表现良好。表现最好的诊断模型是一个10标记的面板,将SPRR1B,CRNN,CALML3,TXN,FABP5,C1RL,MMP9,ECM1,S100A7和CFI结合在一起,并预测子宫内膜癌的AUC为0.92(0.96 - 0.96 - 0.97)。基于尿液的蛋白质特征显示出早期癌症检测的良好精度(AUC 0.92(0.86 - 0.9))。结论:一种患者友好的,基于尿液的测试可以在有症状的女性中提供非侵入性子宫内膜癌检测工具。有必要在较大的独立队列中进行验证。
抽象目标尽管新辅助免疫化学疗法已被广泛应用于非小细胞肺癌(NSCLC),但预测治疗反应仍然是一个挑战。我们使用预处理多模式CT来探索基于深度学习的免疫化学疗法反应图像生物标志物。方法这项研究回顾性地获得了非对比度增强和对比度增强的NSCLC患者的CT扫描,他们在2019年8月至2023年2月之间在多个中心接受了新辅助免疫化学疗法后接受了手术。深度学习特征是从非对比度增强和对比度增强的CT扫描中提取的,分别构建了预测模型(Lunai-uct Model和Lunai-Ect模型)。在这两种特征的特征融合后,构建了融合模型(Lunai-FCT模型)。使用接收器操作特征曲线(AUC),准确性,灵敏度,特异性,正预测值和负预测值下的区域评估模型的性能。Shapley添加说明分析用于量化CT成像特征对模型预测的影响。为了了解我们的模型如何做出预测,我们采用了梯度加权的类激活映射来产生显着热图。结果培训和验证数据集包括在8:2的中心A的113名患者,测试数据集包括112名患者(中心B n = 73,中心C n = 20,中心D n = 19)。在测试数据集,Lunai-uct,Lunai-ect和Lunai-FCT模型中的AUCS为0.762(95%CI 0.654至0.791),0.797(95%CI 0.724至0.844),和0.866(95%CI 0.866)(95%CI 0.821至0.821至0.821至0.8883)。结论通过从增强对比和非对比度增强的CT中提取深度学习特征,我们构建了Lunai-FCT模型作为成像生物标志物,该标志物可以非侵入性地预测NSCLC新辅助免疫化学治疗中的病理完全反应。
术后谵妄(POD)是老年髋部骨折患者常见且严重的并发症。识别出POD的高危患者有助于改善髋部骨折患者的预后。我们对2014年1月至2019年8月期间接受骨科手术治疗髋部骨折的老年患者(≥65岁)进行了回顾性研究。采用常规逻辑回归和五种机器学习算法建立POD的预测模型。采用逻辑回归方法构建POD预测列线图。计算受试者工作特征曲线下面积(AUC-ROC)、准确度、灵敏度和精确度来评估不同的模型。使用Shapley加性解释(SHAP)解释个体的特征重要性。约797名患者参加了该研究,POD的发生率为9.28%(74/797)。年龄、肾功能不全、慢性阻塞性肺病 (COPD)、抗精神病药物的使用、乳酸脱氢酶 (LDH) 和 C 反应蛋白用于构建 POD 的列线图,AUC 为 0.71。五种机器学习模型的 AUC 分别为 0.81(随机森林)、0.80(GBM)、0.68(AdaBoost)、0.77(XGBoost)和 0.70(SVM)。六种模型的敏感度范围从 68.8%(逻辑回归和 SVM)到 91.9%(随机森林)。六种机器学习模型的精确度范围从 18.3%(逻辑回归)到 67.8%(SVM)。使用逻辑回归和五种机器学习算法构建了髋部骨折患者 POD 的六种预测模型。机器学习算法的应用可以提供便捷的 POD 风险分层,使老年髋部骨折患者受益。
新辅助化学免疫性疗法已彻底改变了非小细胞肺癌(NSCLC)的治疗策略,并确定可能对这种先进治疗的候选者具有重要的临床意义。目前的多机构研究旨在开发一种深度学习模型,以预测基于计算机断层扫描(CT)成像的NSCLC中对新辅助免疫疗法的病理完全反应(PCR),并进一步探讨了拟议的深度学习签名的生物学基础。在2019年1月至2023年9月,总共有248名接受新辅助免疫疗法的参与者在Ruijin医院,Ningbo Hwamei医院接受NSCLC的手术,然后在Ruijin医院进行NSCLC手术和Zunyi医科大学的后医院。在新辅助化学免疫性疗法之前的2周内进行了成像数据。鲁伊因医院的患者被分为培训集(n = 104)和6:4比率的验证集(n = 69),而宁波·霍马伊医院(Ningbo Hwamei Hospital)和祖尼医科大学(Zunyi)医科大学的其他参与者则是外部队列(n = 75)。在整个人群中,在29.4%(n = 73)的病例中获得了PCR。我们对PCR预测深度学习签名曲线下的区域(AUC)为0.775(95%的置信间隔[CI]:0.649-0.901)和0.743(95%CI:0.618-0.869)的验证集和外部队列中的0.5%(95%)(95%)(95%)(95%)(95%)。临床模型的0.689)和0.569(95%CI:0.454-0.683)。此外,较高的深度学习评分与微环境中细胞代谢途径和更多抗肿瘤免疫的上调相关。我们开发的深度学习模型能够预测NSCLC患者的新辅助化学免疫性疗法。
摘要的高血压患者,血浆同型半胱氨酸水平升高很常见。当这些方面合并时,冠状动脉疾病(CHD)的风险很高。在此,我们开发了并验证了易于使用的列图,以预测呼吸升高血浆同型半胱氨酸的高血压患者的高风险冠心病。呼吸患者(n = 1,962),患有高脑结膜血症和高血压分为训练(n = 1,373,70%)和验证(n = 589,30%)。我们使用多元COX恢复分析提取了CHD预测变量,然后构建了一个nom图模型。使用1,000个自举重采样的内部验证,以评估使用接收器操作特征曲线(AUC)和校准图下的区域和校准图的一致性和歧视。我们使用提取的预测因子构建了一个nom图模型,包括年龄,腰围比率,烟雾和低密度脂蛋白胆固醇水平。80个月时培训和验证队列的AUC分别为0.735(95%CI:0.678-0.792)和0.646(95%CI:0.547-0.746)。基于校准图,观察到的CHD存活率与训练和验证集中的CHD存活率之间的一致性是可以接受的。在命名图中总共可以使用超过151点,以鉴定高血压升高的血浆同性恋蛋白的高血压患者中的高危患者。我们开发了一种CHD风险预测模型,用于呼吸高血压患者的高血压疗法患者。我们的发现为早期阶段快速鉴定高风险冠心病提供了有用的临床工具。(Int Heart J Advance出版)关键词:心脏病,高血压,打nor,超同类状态状态,预测模型
摘要 目的 预测冠状动脉疾病 (CAD) 的存在与否具有临床重要性。指南中使用的预测概率 (PTP) 和 CAD 联盟临床 (CAD2) 模型和风险评分作为应用侵入性检测或让患者出院的唯一指导不够准确。不需要额外非侵入性测试的人工智能尚未在这种情况下使用,因为该模型的先前结果很有希望,但仅适用于高风险人群。然而,仍然缺乏对临床最相关的低风险患者的验证。设计回顾性队列研究。设置荷兰一家学术医院的二级门诊护理。参与者我们纳入了 696 名从初级保健转诊的患者,以进一步检测是否存在 CAD。使用接收者操作特性 (ROC) 曲线(曲线下面积 (AUC))将结果与 PTP 和 CAD2 进行比较。 CAD 的定义为侵入性冠状动脉或 CT 血管造影中至少一根冠状动脉狭窄 >50%,或 6 个月内发生冠状动脉事件。结果测量第一个队列验证了在低风险到中等风险队列中的两个高风险人群中开发的基于模因模式的算法 (MPA) 模型,以改善风险分层,从而非侵入性地诊断是否存在 CAD。结果人群中 49% 为男性,平均年龄为 65.6±12.6 岁。16.2% 患有 CAD。MPA 模型、PTP 和 CAD2 的 AUC 分别为 0.87、0.80 和 0.82。应用 MPA 模型导致 67.7% 的患者可能出院,可接受的 CAD 率为 4.2%。结论 在低风险至中等风险人群中,MPA 模型可以很好地对 CAD 的存在与否进行风险分层,并且与传统风险评分相比,ROC 更好。结果令人鼓舞,但需要前瞻性验证。