队列(n = 21031)总负性性别女性9971 8120 1851男性11060 8978 2082总计21031 17098 3933#招生2.07(2.88)1.98(2.44)1.98(2.44)2.52(4.28)住宿时间7.83(8.57)7.53(8.04)9.11(10.48)索引入院时年龄73.36(13.55)73.39(13.55)73.2(13.56)
摘要 — 准确预测药物-蛋白质相互作用 (DPI) 对于药物发现和推进精准医疗至关重要。该领域的一个重大挑战是表征药物和蛋白质属性及其复杂相互作用的高维和异构数据。在我们的研究中,我们引入了一种新颖的深度学习架构:嵌入级联深度森林 (MVAE-DFDPnet) 的多视图变分自动编码器。该框架熟练地学习药物和蛋白质的超低维嵌入。值得注意的是,我们的 t-SNE 分析表明,二维嵌入可以清楚地定义与不同药物类别和蛋白质家族相对应的聚类。这些超低维嵌入可能有助于增强我们的 MVAE-DFDPnet 的稳健性和通用性。令人印象深刻的是,我们的模型在基准数据集上超越了当前领先的方法,在显着降低的维数空间中发挥作用。该模型的弹性进一步体现在它在预测涉及新型药物、蛋白质和药物类别的相互作用方面的持续准确性。此外,我们还用科学文献中的实验证据证实了几种新发现的 DPI。用于生成和分析这些结果的代码可以从 https://github.com/Macau-LYXia/MVAE-DFDPnet-V2 访问。
蛇毒含有许多有毒蛋白,可破坏循环系统或神经猎物的神经系统。研究发现,这些蛇毒蛋白具有治疗心血管和神经系统疾病的潜力。因此,蛇毒蛋白的研究有利于相关药物的开发。基于传统生物化学的研究技术可以准确地识别这些蛋白质,但是实验成本很高,时间很长。人工智能技术从计算的角度从大规模筛选蛇毒蛋白提供了一种新的手段和策略。在本文中,我们开发了一种基于序列的计算方法来识别蛇毒素蛋白。特别是,我们利用了三个不同的特征描述符,即G-GAP,天然矢量和Word 2载体,编码蛇毒素蛋白序列。方差分析(ANOVA),梯度提高决策树算法(GBDT)与增量特征选择(IFS)相结合(IFS)来优化特征,然后将优化的特征输入了用于模型训练的深度学习模型中。结果表明,我们的模型可以在10倍的交叉验证中以82.00%的精度实现预测性能。该模型在独立数据上得到了进一步验证,精度率达到81.14%,这表明我们的模型具有出色的预测性能和鲁棒性。
摘要:开发非侵入性且经济有效的阿尔茨海默病 (AD) 检测方法对于早期预防和缓解该病至关重要。我们通过使用音频增强技术和新颖的转录方法来优化使用自然语言处理 (NLP) 对自发语音的 AD 检测。具体来说,我们利用 Boll 谱减法来提高音频保真度,并使用最先进的 AI 服务(基于本地的 Wav2Vec 和 Whisper,以及基于云的 IBM Cloud 和 Rev AI)创建转录,并评估它们与传统手动转录方法的性能。然后使用基于 GPT 的转录嵌入对支持向量机 (SVM) 分类器进行训练和测试。我们的研究结果表明,基于 AI 的转录大大优于传统的手动转录,其中 Wav2Vec(增强音频)在本地系统中实现了最佳准确度和 F-1 分数(两个指标均为 0.99),而 Rev AI(标准音频)在基于云的系统中表现最佳(两个指标均为 0.96)。此外,除了音频增强的微小影响外,这项研究还揭示了采访者讲话对模型性能的不利影响。根据我们的研究结果,当前的 AI 转录和 NLP 技术在利用现有数据准确检测 AD 方面非常有效,但由于缺乏训练数据,难以对可能的 AD 和轻度认知障碍 (MCI)(AD 的前驱阶段)进行分类,为未来实施自动 AD 检测系统奠定了基础。
这项研究采用深度学习技术来提出一种令人信服的方法,用于通过图形嵌入来建模EEG运动成像分类中的大脑连接性。这项研究的引人入胜的方面在于其图形嵌入,深度学习和不同大脑连接性类型的结合,这不仅增强了分类精度,而且还丰富了对大脑功能的理解。该方法具有很高的精度,为大脑连接提供了宝贵的见解,并在理解神经系统状况方面具有潜在的应用。所提出的模型由两个不同的基于图的卷积神经网络组成,每种都利用不同类型的脑连接性,以增强分类性能并获得对大脑连接的更深入的了解。基于邻接的卷积神经网络模型(ADJ-CNNM),基于结构性大脑连接到嵌入空间信息,将其与先前的空间过滤方法区分开来,利用图表表示图表。在基准数据集-IV-2A上进行的广泛测试表明,ADJ-CNNM可以实现72.77%的精度,超过基线和最新方法。第二个模型是相位锁定值卷积神经网络模型(PLV-CNNM),它结合了功能连接性,以克服结构连通性限制,并确定不同大脑区域之间的连接。PLV-CNNM在1-51 Hz频率范围内达到75.10%的总体精度。此外,在考虑整个8-30 Hz频段时,该模型的精度为84.3%。在首选的8–30 Hz频带中,分别以α,µ和β为α,90.2%和85.8%的个人精度,为91.9%,90.2%和85.8%的单个精确度,分别为91.9%,90.2%和85.8%。值得注意的是,PLV-CNNM在运动成像任务期间揭示了不同的大脑区域之间的牢固连接,包括额叶和中央皮层以及中央和顶叶皮层。这些发现为大脑连接模式提供了宝贵的见解,从而丰富了对大脑功能的理解。此外,该研究还对各种大脑连通性建模方法进行了全面的比较分析。
多年来,抑制导致癌症的蛋白激酶 (PK) 一直是癌症治疗的重要课题。到目前为止,FDA 批准的药物已经针对了 530 多种 PK 中的近 8%,大约 150 种蛋白激酶抑制剂 (PKI) 已经在临床试验中进行了测试。我们提出了一种基于自然语言处理和机器学习的方法来研究 PK 和癌症之间的关系,预测抑制哪些 PK 可以有效治疗某种癌症。我们的方法根据 PubMed 摘要中的单词和概念邻域将 PK 和癌症表示为具有语义意义的 100 维向量。我们使用 ClinicalTrials.gov 中有关 I-IV 期试验的信息来构建随机森林分类的训练集。我们使用历史数据的结果显示,可以提前数年准确预测 PK 与特定癌症之间的关联。我们的工具可用于预测抑制 PK 对特定癌症的相关性,并支持设计有针对性的临床试验,以发现用于癌症治疗的新型 PKI。
顾名思义,语言的上下文表示语言表示通常是由于其编码上下文的能力而动机。这些表示形式捕获了上下文的哪些方面?我们采用了一种使用代表性相似性分析(RSA)来解决这个问题的方法。作为案例研究,我们研究了动词嵌入动词的主题的程度,代词嵌入的代词编码代词的前提,并且一个全句子表示编码句子的头部单词(由依赖性parse确定)。在所有情况下,我们都表明,伯特的上下文化嵌入反映了所研究的语言依赖性,而伯特的依赖性比编码语言较低的偏见对照的程度更大。这些结果证明了我们的方法在假设之间裁定上下文的哪个方面在语言表示中编码的能力。
本研究采用深度学习技术,提出了一种通过图嵌入对 EEG 运动意象分类中的大脑连接进行建模的引人注目的方法。本研究引人注目的地方在于它结合了图嵌入、深度学习和不同的大脑连接类型,不仅提高了分类准确性,而且丰富了对大脑功能的理解。该方法具有很高的准确性,为了解大脑连接提供了宝贵的见解,并在理解神经系统疾病方面具有潜在的应用价值。所提出的模型由两个不同的基于图的卷积神经网络组成,每个模型都利用不同类型的大脑连接来提高分类性能并更深入地了解大脑连接。第一个模型是基于邻接的卷积神经网络模型 (Adj-CNNM),它利用基于结构性大脑连接的图形表示来嵌入空间信息,使其有别于以前依赖于受试者和任务的空间过滤方法。在基准数据集 IV-2a 上进行的大量测试表明,Adj-CNNM 的准确率达到 72.77%,超越了基线和最先进的方法。第二个模型是锁相值卷积神经网络模型(PLV-CNNM),它结合功能连接来克服结构连接限制,并识别不同大脑区域之间的连接。PLV-CNNM 在 1-51 Hz 频率范围内的总体准确率达到 75.10%。在以运动图像数据分类(包括 α 、µ 和 β 波)而闻名的 8-30 Hz 频带中,α 、µ 和 β 的个体准确率分别达到 91.9%、90.2% 和 85.8%。此外,当考虑整个 8-30 Hz 频带时,该模型的表现令人钦佩,准确率达到 84.3%。值得注意的是,PLV-CNNM 揭示了运动想象任务期间不同大脑区域之间的稳健连接,包括额叶和中央皮质以及中央和顶叶皮质。这些发现为大脑连接模式提供了宝贵的见解,丰富了对大脑功能的理解。此外,该研究还对各种大脑连接建模方法进行了全面的比较分析。
。cc-by 4.0国际许可(未经Peer Review尚未获得认证)是作者/资助者,他已授予Biorxiv的许可证,以永久显示预印本。这是该版本的版权所有,该版本发布于2024年2月12日。 https://doi.org/10.1101/2023.07.26.550718 doi:biorxiv Preprint
图2:用硫酰基反应性烷基化碘乙酰氨酰胺(IAA)以7个不同的浓度(范围为0至1,000 µM)处理八种癌细胞系,以阻断肽映射的抑制半胱氨酸残基。IAA与半胱氨酸结合Desthiobiotin iodoacetamide(DBIA)化学探针之间的竞争反应使DBIA标记的肽以剂量反应的方式富集。样品进行准备并在质谱仪(MS)上运行,其中肽信号的损失表明成功的IAA竞争。我们将四参数对数模型模型拟合到每个半胱氨酸的剂量响应数据。当模型在溶液上收敛(有剂量反应)时,我们将半胱氨酸标记为反应性,当没有剂量反应时,我们将其标记为无反应性。