摘要。本文提出了一条新的长尾(LT)认可的管道。我们利用长尾数据集本身来生成可以通过跨凝集(CE)进行优化的平衡代理,而不是重新降采样或重新采样。具体来说,仅在长尾数据集上训练的随机初始化扩散模型,用于与代表性不足的类合并新样本。然后,我们利用原始数据集中的信息信息来滤除有害的样品并保留有用的信息。我们的策略,l ongt ail识别(diffult)的差异模型代表了长尾识别中生成模型的开创性利用。diffult在CIFAR10-LT,CIFAR100-LT和Imagenet-LT上实现了最新的效果,超过了具有非平凡余量的最佳竞争对手。丰富的消融也使我们的管道也可以解释。整个生成管道都可以使用任何外部数据或预训练的模型权重,使其高度推广到现实世界的长尾设置。
蛋白质语言模型是通过对庞大蛋白质序列数据集进行预训练来学习蛋白质表示的强大工具。然而,尽管传统的蛋白质语言模型与蛋白质功能相关,但仍缺乏明确的结构监督。为了解决此问题,我们将远程同源性检测的集成到不需要明确的蛋白质结构作为输入而将结构信息整合到蛋白质语言模型中。我们评估了这种结构信息训练对下游蛋白质功能预测任务的影响。实验结果揭示了EC数量和GO期限预测的功能注释精度的一致提高。在突变数据集上的性能根据目标性质和蛋白质结构之间的关系而变化。这强调了在将结构感知训练应用于蛋白质功能预测任务时考虑这种关系的重要性。代码和模型权重可在https://github.com/ deepgraphlearning/esm-s上找到。
失业保险 (UI) 决策中的行政错误导致效率与效益之间的公共价值冲突。我们分析人工智能 (AI)(尤其是机器学习 (ML) 方法)是否可用于检测 UI 索赔决策中的行政错误,包括准确性和规范权衡。我们使用美国劳工部 16 年的 UI 索赔审计和政策数据来分析 7 种不同的随机森林和深度学习模型的准确性。我们进一步测试加权方案和合成数据方法来纠正训练数据中的不平衡。使用梯度下降增强的随机森林模型在几个方面比每个测试的深度学习模型更准确,并且在公共价值方面更可取。调整模型权重会显著提高低 n 结果的召回率,但会以牺牲准确率为代价。相对于权重,合成数据会降低改进效果,但存在缺点。
机器学习和基于深度学习 (DL) 的神经解码器的最新进展显著提高了使用头皮脑电图 (EEG) 的解码能力。然而,DL 模型的可解释性仍然是一个未被充分探索的领域。在本研究中,我们比较了多种模型解释方法,以确定最适合 EEG 的方法,并了解这些方法中的一些方法何时可能失败。我们开发了一个模拟框架,通过与地面真实特征进行比较来评估十二种基于反向传播的可视化方法的稳健性和灵敏度。这里测试的多种方法在随机化模型权重或标签后显示出可靠性问题:例如,显着性方法是 EEG 中最常用的可视化技术,它不是特定于类或模型的。我们发现 DeepLift 始终准确且稳健,可以检测这里测试的三个关键属性(时间、空间和频谱精度)。总体而言,本研究回顾了基于 DL 的神经解码器的模型解释方法,并提出了建议,以了解这些方法中的一些何时会失败以及它们可以在 EEG 中捕获什么。
在应用深度学习模型方面,最近的研究表明,可以从生物体的调控 DNA 预测内表型,例如 RNA 转录丰度。然而,由于训练以前类型的深度学习模型需要大量标记数据,这项工作仅限于具有大量标记数据用于特定任务的物种。在这里,我们介绍了 FloraBERT,这是一种基于迁移学习的深度学习模型,它能够改善对单个目标物种基因表达的预测,它通过利用来自所有植物的基因组组装形式的跨物种基因组信息来实现这一点。FloraBERT 的表现明显优于简单的 k 聚体袋基线模型,并且实现了与涉及不太复杂物种的先前工作相当的性能。此外,对 FloraBERT 学习参数的研究表明,训练过程编码了生物学上显着的信息,例如物种之间的分类相似性和启动子内核苷酸的位置相关性。为了方便未来的研究,我们在 GitHub 上公开了源代码和模型权重,网址为 https://github.com/benlevyx/florabert 。
用生成模型代表一系列非常高维数据在实践中已显示出非常有效的计算。但是,这要求数据歧管允许全局参数化。为了代表任意拓扑的多种流形,我们建议学习变分自动编码器的混合模型。在这里,每个编码器对代表一个歧管的一个图表。我们提出了一个模型权重估计的最大似然估计的损失函数,并选择一个为我们提供图表及其倒置的分析表达的体系结构。一旦学习了流形,我们就将其用于解决逆问题,通过最大程度地减少到学习歧管的数据实现项。为了解决最小化的问题,我们提出了在学习歧管上的riemannian梯度下降算法。我们证明了用于低维玩具示例的方法,以及某些图像歧管上的脱张和电阻抗层造影。关键字:多种学习,混合模型,变异自动编码器,Riemannian优化,反问题
* 除 A.G. 外,所有作者的排序均使用根据其名称预测的蛋白质结构的平均置信度得分 [1,2] 人工智能 (AI) 工具在科学研究中的受欢迎程度和使用率在各个领域都在增加 [3],但出版标准松懈导致论文“像稻草搭的豪宅,而不是坚固的砖房” [4]。在生物医学领域,AI 方法涵盖从基础生物学到临床应用 [5–8],例如优先考虑化学药品作为候选药物 [9]、破译转录因子-DNA 结合偏好 [10]、检测 RNA 修饰 [11]、学习细胞治疗的效果 [12],以及将医学图像与文本注释关联 [13]。尽管专家一再坚持共享 AI 训练数据、代码和模型权重(进行新预测所需的已保存参数)是必要的最佳实践 [14–16],但它们并不是作者或出版商的普遍做法。接受调查的生物学期刊中,仅有 10% 要求共享分析代码 [17]。这种糟糕的现状需要改变。实验生物学界表明有一条道路可走
Elaine Schaertl Short Elaine.short@tufts.edu工程学院塔夫茨大学抽象基础模型是通往通用和用户友好机器人的有前途的途径。普遍的方法涉及培训“通才政策”,该政策像强化学习政策一样,使用观察结果来输出动作。尽管这种方法取得了很大的成功,但是在考虑与这些系统的部署和最终用户互动时,出现了一些问题。特别是,任务之间缺乏模块化意味着,当更新模型权重(例如,当用户提供反馈时)时,其他无关任务的行为可能会受到影响。这可能会对系统的解释性和USABIL产生负面影响。我们提供了一种替代方法,用于设计机器人基础模型的设计,策略参数的扩散(DPP),该方法生成独立的,特定于任务的策略。由于这些策略与基础模型分离,因此仅在用户想要通过反馈或个性化的情况下更新它们,从而使他们能够高度熟悉该策略。我们在模拟中证明了DPP的概念概念证明,然后讨论其局限性以及可解释的基础模型的未来。
基于mRNA的疫苗已成为药物工业的主要重点。mRNA的编码顺序以及未翻译区域(UTRS)可以强烈影响翻译效率,稳定性,降解和其他共同确定疫苗有效性的因素。但是,这些特性的光学mRNA序列仍然是一个复杂的挑战。逐步学习深度学习模型通常仅专注于编码区域优化,忽略UTR。我们提出了Helix-MRNA,这是一种基于结构化的状态空间和注意力混合模型,可应对这些挑战。除了第一次预训练外,第二个预训练阶段还使我们能够使用高质量的数据来专业。我们使用密码子分离对mRNA序列进行单核苷酸令牌化,从而确保了原始mRNA序列的先前生物学和结构信息不会丢失。我们的模型Helix-MRNA在分析UTR和编码区域属性方面优于现有方法。它可以比当前方法长6倍,同时仅使用现有基础模型的10%参数。其预测能力扩展到所有mRNA区域。我们开放码(https://github.com/ helicalai/helical)和模型权重(https://huggingface.co/ helical-ai helical-ai/helix-mrna)。
摘要 — 早期诊断阿尔茨海默病及其前驱期(也称为轻度认知障碍 (MCI))至关重要,因为一些患有进行性 MCI 的患者会患上这种疾病。我们提出了一种多流深度卷积神经网络,该网络以基于块的图像数据为输入,以对稳定性 MCI 和进行性 MCI 进行分类。首先,我们将阿尔茨海默病的 MRI 图像与认知正常受试者的 MRI 图像进行比较,以使用多元统计检验识别不同的解剖标志。然后使用这些标志提取块,并将其输入到所提出的多流卷积神经网络中以对 MRI 图像进行分类。接下来,我们使用来自阿尔茨海默病图像的样本在单独的场景中训练架构,这些样本在解剖学上与进行性 MCI 图像和认知正常图像相似,以弥补进行性 MCI 训练数据的不足。最后,我们将训练好的模型权重转移到所提出的架构,以便使用进行性 MCI 和稳定 MCI 数据对模型进行微调。在 ADNI-1 数据集上的实验结果表明,我们的方法优于现有的 MCI 分类方法,F1 分数为 85.96%。