白质不饱和度通常在接受新生儿重症监护病房(NICU)的早产儿中出现。动物研究表明,主动睡眠对于早期大脑可塑性至关重要。这项研究旨在确定活跃睡眠作为早期婴儿随后的白质发育的早期预测因子的潜力。使用NICU经常监测的心脏和呼吸率,我们在一个组成的25位早产儿(12名女性)中开发了基于机器学习的自动睡眠阶段分类。随后将自动分类器应用于58名早产儿(31名女性)的研究队列中,以在月经后29 - 32周内连续5 - 7天提取活跃的睡眠百分比。58名婴儿中的每一个都在学期等效年龄进行高质量的T2加权磁共振脑成像,用于测量总白质体积。使用针对潜在混杂因素调整的多个线性回归模型检查了主动睡眠百分比与白质体积之间的关联。使用具有较高睡眠分类性能的自动分类器[接收器操作特征曲线下的平均面积(AUROC)= 0.87,95%CI 0.83 - 0.92],我们发现在早产期间,在预期量增加的情况下,在期限范围内增加了较高的活性睡眠百分比,与期限的白色量增加了0.5%0.35%0.5%0.35%0.35%[3.35%=β=β=β=β=β=β=β=β=β=β。发现率(FDR)调整后的P值= 0.021]。我们的结果扩展了动物研究中活跃睡眠与早期大脑发育之间的正相关,并强调了NICU环境中睡眠保存的潜在受益。
分布式学习是机器学习 (ML) 模型训练中中心学习的一种有前途的替代方案,它解决了医疗保健中的数据共享问题。先前研究探索了用于基于医学图像的疾病分类的联邦学习 (FL) 或旅行模型 (TM) 设置,这些研究通常依赖于具有有限数量中心或模拟人工中心的大型数据库,这使人们对其在现实世界的适用性产生了怀疑。这项研究使用从世界各地 83 个不同的真实中心获取的数据(主要贡献小型训练样本)开发并评估了一种用于帕金森病分类的卷积神经网络 (CNN)。我们的方法特别利用了 TM 设置,该设置已被证明在数据可用性有限的场景中是有效的,但从未用于基于图像的疾病分类。我们的研究结果表明,即使在具有可变数据分布的复杂现实场景中,TM 也可有效训练 CNN 模型。经过足够的训练周期后,TM 训练的 CNN 的性能与集中训练的 CNN 相当或略胜一筹(AUROC 分别为 83% 和 80%)。我们的研究首次强调了 TM 在 3D 医学图像分类中的有效性,尤其是在训练样本有限和异构分布式数据的情况下。这些见解适用于使用来自小型或远程医疗中心的数据训练 ML 模型的情况,以及病例稀少的罕见疾病。这种方法简单易用,可广泛应用于许多深度学习任务,增强其在各种环境和医疗机构中的临床实用性。
摘要:传统的高通量筛选 (HTS) 药物发现效率低下。具有临床治疗潜力的化合物的命中率通常为 0.5%,最多只有 2%。深度学习模型将筛选率提高到 28%;然而,这些结果包括与治疗无关浓度的命中、训练集的新颖性不足以及遍历有限的化学空间。这项研究介绍了一种新型人工智能 (AI) 驱动平台 GALILEO 和分子几何深度学习 (Mol-GDL) 模型 ChemPrint。该模型部署了 t 分布随机邻域嵌入 (t-SNE) 数据分割,以在训练期间最大化化学差异,并部署了自适应分子嵌入,以增强预测能力并探索未知的分子领域。回顾性测试时,ChemPrint 的表现优于一组五个模型难以用药的肿瘤靶点 AXL 和 BRD4,使用 t-SNEsplit 实现平均 AUROC 得分 AXL 为 0.897,BRD4 为 0.876,相比之下,基准模型得分范围为 AXL 为 0.826 至 0.885,BRD4 为 0.801 至 0.852。在一项零样本前瞻性研究中,体外测试表明,ChemPrint 提名的 41 种化合物中有 19 种在浓度≤20µM 时表现出抑制活性,命中率为 46%。这 19 个命中报告的平均-最大 Tanimoto 相似度得分相对于其训练集为 0.36,得分为 0.13 (AXL)和 0.10(BRD4)相对于这些目标的临床阶段化合物。我们的研究结果表明,通过在具有最大差异性的数据集上训练和测试 ChemPrint 来增加测试集难度可以增强模型的预测能力。这导致发现具有低治疗浓度和高化学新颖性的高命中率的化合物库。综上所述,所提出的平台设定了新的性能标准。
2型糖尿病(T2D)和糖尿病前期是由空腹葡萄糖或替代物(例如血红蛋白HBA1C)的水平来定义的。此分类未考虑葡萄糖失调的病理生理学的异质性,葡萄糖失调的鉴定可以为糖尿病治疗和预防和/或预测临床结果的有针对性方法提供信息。我们在早期葡萄糖失调的个体中进行了金色标准的代谢检测,并量化了四种已知有助于葡萄糖失调和T2D的独特代谢亚表格:肌肉胰岛素抵抗,β细胞功能障碍,β细胞功能障碍,抑制型尿布蛋白动作和尿布胰岛素的耐药性。我们揭示了实质性的异质性,其中34%的个体在肌肉和/或肝脏IR中表现出优势或共同占主导地位,而40%的人在β细胞和/或君型肠缺乏症中表现出优势或共同率。此外,通过经常采样的口服葡萄糖耐量测试(OGTT),我们开发了一种新型的机器学习框架,以使用来自葡萄糖时序的动态模式(“葡萄糖曲线的形状”)的特征来预测代谢亚表现型。葡萄糖时序的特征鉴定出胰岛素抵抗,β细胞缺乏症和肠降低素缺陷,AUROCS分别为95%,89%和88%。这些数字优于当前使用的估计。使用独立队列验证了肌肉胰岛素抵抗和β细胞缺乏症的预测。然后,我们测试了由居住OGTT期间连续葡萄糖监测仪(CGM)产生的葡萄糖曲线的能力,以预测胰岛素抵抗和β细胞缺乏症,分别产生88%和84%的AUROC。因此,我们证明了糖尿病前期的特征是代谢异质性,可以通过使用CGM在临床研究单元或居住环境中执行的标准化OGTT期间的葡萄糖曲线形状来定义。使用室内CGM来鉴定肌肉胰岛素抵抗和β细胞缺乏症构成了一种实用且可扩展的方法,通过该方法,通过该方法将早期葡萄糖失调的个体分层分层,并为靶向治疗提供了导致的治疗方法,以防止T2D。
将数据驱动的机器学习与先验知识结合起来具有明显的先进的医学图像处理和分析。深度学习,由大型数据集和强大的GPU驱动,在图像重建,分割和疾病分类等任务中表现出色。但是,这些模型面临着诸如高资源需求,有限的概括和缺乏解释性之类的挑战。相比之下,模型驱动的方法可以更好地概括,可解释性和鲁棒性,但可能缺乏准确性和效率。结合这些范式可以利用其优势,有望提高性能并提高诊断准确性。该研究主题展示了这种整合如何增强医学成像,包括准确的中风发作估计,改进了COVID-19的诊断和恢复评估以及增强的心脏成像技术。这些进步突出了提高诊断准确性,治疗计划和医学成像中临床决策的潜力。Gao等人开发了卷积神经网络(CNN)。使用计算机断层扫描和灌注加权成像,在6小时内识别6小时内的急性缺血性中风患者进行血管血栓切除术。该CNN优于支撑载体机和随机森林,证明了其使用CT和MR成像的准确中风发作时间估计的潜力。Huang等人的另一项研究。利用深度学习和CT扫描来评估6个月内Covid-19 Delta变体幸存者中的肺恢复。与原始的COVID-19菌株相比,在大多数情况下,发现地面玻璃的不透明性消失和轻度纤维化,以及肺预后的改善。在类似的脉中,Bridge等人创建了混合效应的深度学习模型。从CT扫描中诊断COVID-19,可实现高准确性和鲁棒性。在外部验证中具有0.930的AUROC,此模型
2型糖尿病(T2D)和糖尿病前期是由空腹葡萄糖或替代物(例如血红蛋白HBA1C)的水平来定义的。此分类未考虑葡萄糖失调的病理生理学的异质性,葡萄糖失调的鉴定可以为糖尿病治疗和预防和/或预测临床结果的有针对性方法提供信息。我们在早期葡萄糖失调的个体中进行了金色标准的代谢检测,并量化了四种已知有助于葡萄糖失调和T2D的独特代谢亚表格:肌肉胰岛素抵抗,β细胞功能障碍,β细胞功能障碍,抑制型尿布蛋白动作和尿布胰岛素的耐药性。我们揭示了实质性的异质性,其中34%的个体在肌肉和/或肝脏IR中表现出优势或共同占主导地位,而40%的人在β细胞和/或君型肠缺乏症中表现出优势或共同率。此外,通过经常采样的口服葡萄糖耐量测试(OGTT),我们开发了一种新型的机器学习框架,以使用来自葡萄糖时序的动态模式(“葡萄糖曲线的形状”)的特征来预测代谢亚表现型。葡萄糖时序的特征鉴定出胰岛素抵抗,β细胞缺乏症和肠降低素缺陷,AUROCS分别为95%,89%和88%。这些数字优于当前使用的估计。使用独立队列验证了肌肉胰岛素抵抗和β细胞缺乏症的预测。然后,我们测试了由居住OGTT期间连续葡萄糖监测仪(CGM)产生的葡萄糖曲线的能力,以预测胰岛素抵抗和β细胞缺乏症,分别产生88%和84%的AUROC。因此,我们证明了糖尿病前期的特征是代谢异质性,可以通过使用CGM在临床研究单元或居住环境中执行的标准化OGTT期间的葡萄糖曲线形状来定义。使用室内CGM来鉴定肌肉胰岛素抵抗和β细胞缺乏症构成了一种实用且可扩展的方法,通过该方法,通过该方法将早期葡萄糖失调的个体分层分层,并为靶向治疗提供了导致的治疗方法,以防止T2D。
冠状动脉疾病(CAD)是发达和发展中的死亡的主要原因。这项研究的目的是通过机器学习和评估该方法来确定冠状动脉疾病的危险因素。使用公开可用的国家健康和营养检查调查(NHANES)进行了回顾性,横断面研究(NHANES),该研究完成了人口,饮食,运动和心理健康问卷并拥有实验室和体格检查数据的患者。单变量逻辑模型(以CAD为结果)用于识别与CAD相关的协变量。在最终的机器学习模型中包括在单变量分析中具有P <0.0001的协变量。机器学习模型XGBoost由于文献中的普遍性以及其在医疗保健术前的预测准确性提高而使用。模型协变量根据覆盖统计量进行排名,以识别CAD的危险因素。构造的加性解释(SHAP)解释被用来可视化这些潜在危险因素与CAD之间的关系。在这项研究中符合纳入标准的7,929名患者中,女性为4,055(51%),男性为2,874(49%)。平均年龄为49.2(SD = 18.4),有2,885名(36%)白人患者,2,144名(27%)黑人患者,1,639名(21%)西班牙裔患者和1,261例(16%)其他种族患者。总共338例(4.5%)患有冠状动脉疾病。将它们拟合到XGBoost模型中,AUROC = 0.89,灵敏度= 0.85,特异性= 0.87(图1)。按覆盖范围排名前四的最高特征,这是协变量对整体模型预测的百分比贡献的度量,是年龄(覆盖率= 21.1%),血小板计数(覆盖= 5.1%),心脏病的家族史(覆盖率= 4.8%)和胆固醇总胆固醇(覆盖率= 4.1%)。机器学习模型可以使用人口统计学,实验室,体格检查和生活方式协变量有效预测冠状动脉疾病,并确定关键的危险因素。
医学概念的有效表示对于电子健康记录的次要分析至关重要。神经语言模型在自动从临床数据中得出医学概念表示方面已显示出希望。但是,尚未对不同语言模型的比较性能,用于创建这些经验表示形式及其编码医学语义的程度,尚未得到广泛的研究。本研究旨在通过评估三种流行语言模型的有效性 - word2vec,fastText和手套 - 在创建捕获其语义含义的医学概念嵌入中的有效性。通过使用大量的数字健康记录数据集,我们创建了患者轨迹,并用它们来训练语言模型。然后,我们通过与生物医学术语进行明确比较来评估学到的嵌入式编码语义的能力,并通过预测具有不同级别可用信息的患者结果和轨迹来隐含。我们的定性分析表明,FastText学到的嵌入的经验簇与从生物医学术语获得的理论聚类模式表现出最高的相似性,分别在0.88、0.80和0.92的经验簇和0.92之间的诊断,过程和医疗代码分别为0.88、0.80和0.92之间。相反,为了预测,Word2Vec和Glove倾向于优于快速文本,而前者的AUROC分别高达0.78、0.62和0.85,分别用于现场长度,再入院和死亡率预测。在预测患者轨迹中的医疗法规时,手套在诊断和药物代码(分别为0.45和0.81)的最高级别上达到了语义层次结构的最高性能(AUPRC分别为0.45和0.81),而FastText优于其他模型的过程代码(AUPRC为0.66)。我们的研究表明,子词信息对于学习医学概念表示至关重要,但是全球嵌入向量更适合于更高级别的下游任务,例如轨迹预测。因此,可以利用这些模型来学习传达临床意义的表示形式,而我们的见解突出了使用机器学习技术来编码医学数据的潜力。
背景:性障碍性贫血是一种严重的血液学疾病,其标志是全年症和骨髓衰竭。ICU的入院通常反映了需要重症监护的疾病进展或并发症。预测这些患者的短期生存对于个性化治疗和资源优化至关重要。编号图为整合临床参数提供了一种实用的工具,提供了准确的可视化生存预测,以指导ICU中性贫血患者的决策。方法:使用模拟IV数据库,我们确定了被诊断为性贫血的ICU患者。从数千个可用的变量中,我们从五个维度上提取数据:人口统计学,合成指标,实验室事件,合并症和药物使用情况。基于现有的性质贫血研究,进一步完善了400多个变量,并应用了机器学习技术来确定建模的七个最有效的预测指标。使用机器学习方法进行预处理,这些预测因素的可行性通过其他分类和回归模型验证,验证方法是AUROC。此外,使用来自EICU协作研究数据库的数据进行了外部验证,以评估我们的模型的普遍性。使用逻辑回归(LR)构建了互动命名图,以预测患有同性血症患者的7天,14天和28天的死亡率。结果:这项研究中总共包括了1,662名被诊断为性贫血的患者,其中7:3的比例分为训练和测试队列。逻辑回归模型表现出强烈的预测性能,分别为7天,14天和28天死亡率预测的AUC值分别达到0.8227、0.8311和0.8298。使用EICU数据库的外部验证进一步证实了该模型的通用性,AUC值为0.7391、0.7119和0.7093。这些结果突出了该模型在预测性障碍性贫血患者短期生存方面的稳定性和有效性。结论:APS III领导的一组七个预测因子被证明可有效地建模性质贫血患者的短期生存。使用这些预测因素,COX和Logistic回归模型生成了列线图,这些图可以准确预测7天,14天和28天的死亡率。这些工具可以支持临床医生进行个性化的风险评估和决策。