摘要引言产后出血(PPH)是分娩的最严重的临床问题,它在全球范围内对孕产妇死亡产生了重大贡献。该系统评价旨在根据机器学习(ML)方法来识别PPH的预测因子。方法和分析本评论遵守了系统评价和荟萃分析协议的首选报告项目的指南。该评论定于2023年1月10日开始,并于2023年3月20日结束。主要目的是识别和总结与PPH相关的预测因素,并提出基于ML的预测算法。从成立到2022年12月,将对经过同行评审的期刊文章和在线搜索记录进行以下电子数据库的系统搜索:Cochrane Central Register,PubMed,Embase,Embase(通过OVID),Scopus,Wos,Wos,Ieee Xplore,IEEE Xplore和Google Scholar搜索引擎。将考虑所有符合以下标准的研究:(1)它们包括对PPH诊断的明确定义的一般人群; (2)它们包括用于预测PPH的ML模型,并清楚地描述了ML模型; (3)他们证明了具有指标的ML模型的性能,包括接收器操作特征曲线下的区域,准确性,精度,灵敏度和特异性。非英语语言论文将被排除在外。数据提取将由两个研究者独立执行。总共包括20个信号,将用作评估每个纳入研究的偏见和适用性的工具。道德和传播道德批准不需要,因为我们的审查将包括已发布和公开访问的数据。本评论中的发现将通过同行评审期刊中的出版物传播。Prospero注册号本审查的协议在Prospero提交,ID编号CRD42022354896。
背景:与机器学习集成(ML)集成的量子计算在包括医疗保健在内的各个领域都提供了新颖的解决方案。分类中量子计算与ML之间的协同作用利用了唯一的数据模式。尽管有理论的优势,但量子计算在小型医学数据集上的经验应用和有效性仍未得到充分影响。方法:这项来自高等医院的回顾性研究使用了有关早期结直肠癌的数据,从2008年到2020年,具有93个特征和1501例患者,以预测死亡率。我们将量子支持向量机(QSVM)模型与经典的SVM模型进行了比较,就特征数量,训练集数量和结果比进行了比较。我们根据接收器操作特征曲线(AUROC)中曲线下的区域(AUROC)评估了模型。结果:我们观察到死亡率为7.6%(1253名受试者中的96个)。我们使用11个临床变量(包括癌症阶段和化学疗法史)生成了死亡率预测模型。我们发现,常规方法和量子方法之间的AUROC差异是前11个变量的最大值。我们还显示了QSVM中的AUROC(平均[标准偏差],0.863 [0.102])的表现优于常规SVM中的所有试验次数(0.723 [0.231])。与常规SVM相比,QSVM即使在不平衡的情况下,QSVM也与AUROC一致。结论:我们的研究强调了量子计算改善医疗保健中预测性建模的潜力,尤其是对于有限的可用数据的稀有疾病。与常规方法相比,量子计算的优势,例如希尔伯特空间的探索,促进了优越的预测性能。
白质不饱和度通常在接受新生儿重症监护病房(NICU)的早产儿中出现。动物研究表明,主动睡眠对于早期大脑可塑性至关重要。这项研究旨在确定活跃睡眠作为早期婴儿随后的白质发育的早期预测因子的潜力。使用NICU经常监测的心脏和呼吸率,我们在一个组成的25位早产儿(12名女性)中开发了基于机器学习的自动睡眠阶段分类。随后将自动分类器应用于58名早产儿(31名女性)的研究队列中,以在月经后29 - 32周内连续5 - 7天提取活跃的睡眠百分比。58名婴儿中的每一个都在学期等效年龄进行高质量的T2加权磁共振脑成像,用于测量总白质体积。使用针对潜在混杂因素调整的多个线性回归模型检查了主动睡眠百分比与白质体积之间的关联。使用具有较高睡眠分类性能的自动分类器[接收器操作特征曲线下的平均面积(AUROC)= 0.87,95%CI 0.83 - 0.92],我们发现在早产期间,在预期量增加的情况下,在期限范围内增加了较高的活性睡眠百分比,与期限的白色量增加了0.5%0.35%0.5%0.35%0.35%[3.35%=β=β=β=β=β=β=β=β=β=β。发现率(FDR)调整后的P值= 0.021]。我们的结果扩展了动物研究中活跃睡眠与早期大脑发育之间的正相关,并强调了NICU环境中睡眠保存的潜在受益。
创伤性脑损伤 (TBI) 和中风是毁灭性的神经系统疾病,每天影响数百人。不幸的是,如果没有特定的成像技术或无法去医院,检测 TBI 和中风通常很困难。我们之前的研究使用机器学习对脑电图 (EEG) 进行选择重要特征,并在来自公共存储库的独立数据集上对正常、TBI 和中风进行分类,准确率为 0.71。在这项研究中,我们扩展了范围,探索无特征和深度学习模型是否可以通过纳入更全面的数据提取工具来大幅增加训练数据集的大小,从而提供更好的性能来区分 TBI、中风和正常 EEG。我们将使用线性判别分析和 ReliefF 基于选定特征构建的模型的性能与几种无特征深度学习模型进行了比较。我们使用基于特征的模型实现了 0.85 的受试者工作特征曲线 (ROC) 下面积 (AUC),使用无特征模型实现了 0.84 的 AUC。此外,我们证明了梯度加权类激活映射 (Grad-CAM) 可以通过在临床检查期间突出显示有问题的 EEG 片段来深入了解特定患者的 EEG 分类。总体而言,我们的研究表明,机器学习和深度学习 EEG 或其预计算特征可以成为 TBI 和中风检测和分类的有用工具。虽然没有超越基于特征的模型的性能,但无特征模型在没有事先计算大量特征集的情况下达到了类似的水平,从而可以更快、更经济高效地部署、分析和分类。
摘要。心肌梗塞(MI)是世界上最常见的死亡原因之一。基于图像的生物标志物通常在诊所中使用,例如射血分数,无法在心脏的3D解剖结构中捕获更复杂的模式,因此限制了诊断精度。在这项工作中,我们基于心脏解剖学和功能的多级3D点云表示,将多目标云自动编码器作为一种新型的几何深度学习方法,用于可解释的梗塞预测。它的架构由多个由低维的潜在空间连接的多个特定于任务的分支组成,可以有效地对重建和MI预测进行多客观学习,而在可解释的潜在空间中限制了特定于病理学的3D形状信息。此外,其层次分支设计具有基于点云的深度学习操作,可以在高分辨率的解剖点云上进行有效的多尺度特征学习。在我们在大型UK Biobank数据集上进行的实验中,多目标云自动构造器能够准确地重建多个快速的3D形状,并在基础图像的像素分辨率下方的预测解剖和输入解剖学之间具有弯腰距离。我们的方法在接收器操作特征曲线下的面积方面优于事件MI预测的任务的多个机器学习和深度学习基准。此外,其特定于任务的紧凑型潜在空间表现出易于分离的控制和MI簇,并在受试者编码和相应的3D形状之间具有临床上合理的关联,从而证明了预测的解释性。
摘要:在药物发现范式中,新化学实体的吸收,分布,代谢和排泄物(ADME)和毒性特性的评估是最关键的问题之一,这是一个耗时的过程,非常昂贵,并且在药品R&d中构成了非常昂贵的挑战。近年来,人工智能(AI),大数据和云技术等新兴技术引起了人们的极大关注,以预测分子的ADME和毒性。目前,量子计算和机器学习的混合物几乎在从化学到生物医学和几个工程学科的几乎每个领域都引起了人们的关注。量子计算机有可能通过降低与药物发现过程相关的开发成本和时间来实现高通量实验技术和筛选数十亿分子的进步。是出于量子内核方法的效率,我们提出了一个量子机学习(QML)框架,该框架由具有基于内核的量子分类器的经典支持向量分类器算法组成。为了证明所提出的QML框架的可行性,简化的分子输入线进入系统(Smiles)基于符号的字符串螺丝核与量子支持矢量分类器结合使用,用于评估化学/药物ADME ADME ADME-TOX特性。建议的量子机学习框架将通过大规模模拟进行验证和评估。在制药行业所提出的框架的部署对于做出最佳决策将非常有价值。基于我们来自数值模拟的结果,与经典同行相比,量子模型在接收器操作特征曲线(AUC ROC; 0.80-0.95)的曲线下获得了最佳性能,以预测针对小分子的ADME-TOX数据集的结果,具有不同的特征。
摘要:在药物发现过程中,确定最佳候选药物非常重要。生物学和计算科学领域的研究人员一直试图利用机器学习 (ML) 来有效预测药物-靶标相互作用 (DTI)。近年来,根据预训练模型在自然语言处理 (NLP) 中的新兴用途,人们正在为化合物和靶蛋白开发预训练模型。本研究试图使用 Transformers (BERT) 预训练模型 ChemBERTa 来改进化合物的 DTI 预测模型。预训练的特点是使用简化的分子输入线路输入系统 (SMILES)。我们还使用预训练的 ProBERT 来预测靶蛋白(预训练使用氨基酸序列)。BIOSNAP、DAVIS 和 BindingDB 数据库 (DB) 被用于(单独或一起)学习。最终模型由 ChemBERTa 和 ProtBert 以及集成的 DB 共同教授,与之前的模型相比,根据受试者工作特征曲线下面积 (AUC) 和精确召回率-AUC 值,提供了迄今为止最佳的 DTI 预测性能。使用对 13 对底物和代谢酶细胞色素 P450 (CYP) 的特定案例研究验证了最终模型的性能。最终模型提供了出色的 DTI 预测。由于药物和靶蛋白之间的现实世界相互作用预计会表现出特定的模式,因此使用 ChemBERTa 和 ProtBert 进行预训练可以教授此类模式。如果学习采用涵盖药物和靶蛋白之间所有关系的大型、均衡的数据集,学习此类相互作用的模式将提高 DTI 准确性。
肺癌是全球癌症死亡的主要原因,而肺腺癌 (LUAD) 是最常见的肺癌类型。基因失调在 LUAD 的发展中起着至关重要的作用。基于药物靶基因和 LUAD 靶基因之间的关联进行药物重新定位有助于发现用于治疗 LUAD 的潜在新药,同时还可以降低新药发现和开发的金钱和时间成本。在这里,我们开发了一个基于机器学习的流程,通过已建立的图注意力网络 (GAT) 来预测潜在的 LUAD 相关靶基因。然后,我们通过基于基因巧合和基于基因网络距离的方法预测了用于治疗 LUAD 的潜在药物。使用来自 Cancer Genome Atlas 的 535 个 LUAD 组织样本和 59 个癌前组织样本的数据,鉴定出 48,597 个基因并用于构建 GAT 的预测模型。GAT 模型实现了良好的预测性能,受试者工作特征曲线下面积为 0.90。从GAT模型中识别出1597个潜在的LUAD相关基因。然后利用这些LUAD相关基因进行药物重新定位。计算了美国食品药品监督管理局批准的3070种药物和672种临床前化合物与靶基因的基因重叠和网络距离。其中,溴乙胺被预测为治疗LUAD的新型潜在临床前化合物,西咪替丁和苯溴马隆被预测为LUAD的潜在治疗药物。本研究建立的管线为开发LUAD的靶向疗法提供了新方法。
药物-靶标相互作用 (DTI) 的发现是一个非常有前途的研究领域,具有巨大的潜力。通过计算方法准确识别药物和蛋白质之间的可靠相互作用,通常利用从不同数据源检索到的异构信息,可以促进有效药物的开发。尽管随机游走和矩阵分解技术在 DTI 预测中被广泛使用,但它们有几个局限性。基于随机游走的嵌入生成通常以无监督的方式进行,而矩阵分解中的线性相似性组合会扭曲不同观点提供的个体见解。为了解决这些问题,我们采用多层网络方法来处理不同的药物和靶标相似性,并提出了一种新的优化框架,称为基于多相似性 DeepWalk 的矩阵分解 (MDMF),用于 DTI 预测。该框架统一了嵌入生成和交互预测,学习药物和靶标的向量表示,不仅可以在所有超层中保持高阶接近度和层特定的局部不变性,还可以近似其内积的相互作用。此外,我们开发了一种集成方法 (MDMF2A),该方法集成了 MDMF 模型的两个实例,分别优化了精确召回曲线下面积 (AUPR) 和受试者工作特征曲线下面积 (AUC)。对现实世界 DTI 数据集的实证研究表明,我们的方法在四种不同设置中实现了比当前最先进的方法具有统计显著改进。此外,对高排名非相互作用对的验证也证明了 MDMF2A 发现新型 DTI 的潜力。
在寻找针对急性冠状病毒疾病的免疫学相关性2019(COVID-19),需要对严重急性呼吸综合症冠状动脉综合征2(SARS-COV-2)感染进行高透射测定法(CMI)。我们建立了基于干扰素释放测定的测试,用于检测CMI对SARS-COV-2尖峰(S)或Nucleocapsid(NC)肽的检测。使用证书的化学发光免疫测定法测量了从549个健康或康复个体获得的干扰素G(IFN-G)产生的干扰素G(IFN-G)产生的血液样本。测试性能是在接收器操作特征曲线分析中应用最高YouDen指数的截止值,并将其与市售的血清学测试进行了比较。对所有测试系统评估了潜在的混杂因素和临床相关性。522个样品在PCR固定的SARS-COV-2感染后298天从378个康复中获得,并包括144个健康对照者。CMI测试的敏感性和特异性为S肽的敏感性和74%的敏感性和74%的敏感性和74%的敏感性和74%的敏感性和89%和91%的NC肽。高白细胞计数与IFN-G反应负相关,但在恢复后长达一年的样品中没有CMI衰减。急性感染时的严重临床症状与较高的适应性免疫度量和检查时脱发有关。该实验室开发的CMI测试SARS-COV-2 NC肽表现出色,适用于高渗透常规诊断,应评估前瞻性病原体重新暴露的临床结果预测。
