摘要:传统的高通量筛选 (HTS) 药物发现效率低下。具有临床治疗潜力的化合物的命中率通常为 0.5%,最多只有 2%。深度学习模型将筛选率提高到 28%;然而,这些结果包括与治疗无关浓度的命中、训练集的新颖性不足以及遍历有限的化学空间。这项研究介绍了一种新型人工智能 (AI) 驱动平台 GALILEO 和分子几何深度学习 (Mol-GDL) 模型 ChemPrint。该模型部署了 t 分布随机邻域嵌入 (t-SNE) 数据分割,以在训练期间最大化化学差异,并部署了自适应分子嵌入,以增强预测能力并探索未知的分子领域。回顾性测试时,ChemPrint 的表现优于一组五个模型难以用药的肿瘤靶点 AXL 和 BRD4,使用 t-SNEsplit 实现平均 AUROC 得分 AXL 为 0.897,BRD4 为 0.876,相比之下,基准模型得分范围为 AXL 为 0.826 至 0.885,BRD4 为 0.801 至 0.852。在一项零样本前瞻性研究中,体外测试表明,ChemPrint 提名的 41 种化合物中有 19 种在浓度≤20µM 时表现出抑制活性,命中率为 46%。这 19 个命中报告的平均-最大 Tanimoto 相似度得分相对于其训练集为 0.36,得分为 0.13 (AXL)和 0.10(BRD4)相对于这些目标的临床阶段化合物。我们的研究结果表明,通过在具有最大差异性的数据集上训练和测试 ChemPrint 来增加测试集难度可以增强模型的预测能力。这导致发现具有低治疗浓度和高化学新颖性的高命中率的化合物库。综上所述,所提出的平台设定了新的性能标准。
摘要背景:对于延时摄影技术(TLT)与胚胎倍性状态之间的关联,目前尚未完全阐明。TLT具有数据量大、非侵入性的特点。如果想从TLT准确预测胚胎倍性状态,人工智能(AI)技术是一个不错的选择。但目前AI在该领域的工作需要加强。方法:研究共纳入2018年4月至2019年11月的469个植入前遗传学检测(PGT)周期和1803个囊胚。所有胚胎图像均在受精后5或6天内通过延时显微镜系统捕获,然后进行活检。所有整倍体胚胎或非整倍体胚胎均用作数据集。数据集分为训练集、验证集和测试集。训练集主要用于模型训练,验证集主要用于调整模型的超参数和对模型进行初步评估,测试集用于评估模型的泛化能力。为了更好的验证,我们使用了训练数据之外的数据进行外部验证。从2019年12月至2020年12月共155个PGT周期,523个囊胚被纳入验证过程。结果:整倍体预测算法(EPA)能够在测试数据集上预测整倍体,曲线下面积(AUC)为0.80。结论:TLT孵化器已逐渐成为生殖中心的选择。我们的AI模型EPA可以根据TLT数据很好地预测胚胎的倍性。我们希望该系统将来可以服务于所有体外受精和胚胎移植(IVF-ET)患者,让胚胎学家在选择最佳胚胎进行移植时拥有更多非侵入性辅助手段。关键词:AI,倍性状态,延时,PGT,预测
量子计算起源于托马斯·杨于 1802 年进行的所谓双缝实验。在该实验中,一个小实体(例如光子或电子)被导向两个平行狭缝,并观察到由此产生的干涉图案。观察表明,该实体表现得像波,这表明它同时穿过两个狭缝。从计算的角度来看,这种波粒二象性意味着单个信息比特可以编码为量子比特,量子比特是两种不同状态的叠加。量子计算的这一独特特性在计算时间和结果方面比传统计算具有显着优势,例如对于模式识别或使用有限的训练集(Rebentrost 等人 2014 年、Blance 和 Spannowsky 2021 年)。
反复试验在机器学习中起着重要作用。当模型发现其预测与实际数据集之间存在错误或差异时,它会尝试纠正其思维,使其预测接近实际情况。这个过程通常称为“训练模型”。实际数据集被分成训练集和验证集,通常按 90/10 的比例分配,其中 90% 用于训练,10% 用于验证其预测或错误率。这时,数据科学家可能会更改模型应该从中学习的特征,例如价格、产品、位置和/或模型的参数;这些是训练期间学习的训练数据集的属性。通常,参数是模型自行学习并在试图降低其预测错误率时自动调整的东西。
分子动力学反应力场已使众多材料类别的研究成为可能。与电子结构计算相比,这些力场的计算成本低,并且可以模拟数百万个原子。然而,传统力场的准确性受到其功能形式的限制,阻碍了持续改进和完善。因此,我们开发了一种基于神经网络的反应原子间势,用于预测含能材料在极端条件下的机械、热和化学响应。训练集以自动迭代方法扩展,包括各种 CHNO 材料及其在环境和冲击载荷条件下的反应。这种新势在环境和冲击载荷条件下的爆炸性能、分解产物形成和振动光谱等各种特性方面,比目前最先进的力场具有更高的准确性。
背景:围绝经期是具有卵巢衰竭迹象的女性生理变化的时期,包括绝经期和更年期后的1年。卵巢功能在上绝经妇女中下降,雌激素水平降低会导致各种器官功能的变化,这可能导致心血管疾病。重大的不良心血管事件(MACE)是临床事件的组合,包括心力衰竭,心肌梗塞和其他心血管疾病。因此,本研究探讨了影响围绝经内膜妇女中MACE发生的因素,并使用三种算法为MACE风险因素建立了预测模型,从而比较了其预测性能。患者和方法:总共411名被诊断为Binzhou医科大学医院诊断为MACE的绝经妇女被随机分为训练集和7:3之后的测试组。根据每个变量10个事件的原理,训练集样本量就足够了。在训练集中,随机森林(RF)算法,反向传播神经网络(BPNN)和逻辑回归(LR)用于构建半绝经期妇女的MACE风险预测模型,并使用了测试集来验证该模型。根据主题操作特征曲线(AUC)下的准确性,灵敏度,特异性和面积(AUC)评估了模型的预测性能。结果:总共包括26个候选变量。RF模型,BPNN模型和逻辑回归模型下ROC曲线下的面积为0.948、0.921和0.866。对逻辑回归和预测MACE风险的ROC曲线AUC的比较显示出统计学上的显着差异(z = 2.278,p = 0.023)。结论:RF模型在预测围绝经内苏联妇女的狼牙棒风险方面表现出良好的表现,该妇女提供了早期识别高危患者和有针对性干预策略的发展的参考。关键字:主要的不良心血管事件,机器学习,围绝经期,风险因素
什么是计算机视觉?图像分析和计算机视觉的应用。常见的图像和视频格式(非常简短的描述 .jpeg、.tiff、.bmp、.mp4、.avi)、颜色模型:RGB、计算机中的图像表示、图像二值化(基于阈值)、图像特征 - 像素特征、灰度值作为特征、通道的平均像素值、边缘特征(Prewitt 核、Sobel 核)、纹理特征、用例:使用动物数据集进行图像分类(三类 - 狗、猫和熊猫)、带有示例的图像表示、动物数据集的描述、使用 k-NN 或其他 ML 工具进行分类(步骤的简要描述:数据收集、数据表示、将数据集拆分为训练集和测试集、训练分类器、使用 Scikit 学习工具进行评估)。