临床前扰动筛选,其中在疾病模型上系统地测试了遗传,化学或环境扰动的影响,由于其规模和因果性质,对机器学习增强的药物发现具有巨大的希望。预测模型可以根据分子特征来推断以前未经测试的疾病模型的扰动反应。这些在计算机标签中可以扩展数据库并指导实验优先级。但是,对扰动特异性效应进行建模并在各种生物环境中产生健壮的预测性能仍然难以捉摸。我们介绍了LEAP(自动编码器和预测变量的分层集合),这是一个新颖的集合框架,可改善稳健性和概括。LEAP利用多个Damae(数据增强蒙版的自动编码器)表示和套索回归器。通过结合从不同随机初始化中学到的多种基因表达表示模型,在预测未见细胞系,组织和疾病模型中基因本质或药物反应方面始终胜过最先进的方法。值得注意的是,我们的结果表明,结合表示模型而不是仅预测模型会产生出色的预测性能。超出其性能增长,LEAP在计算上是有效的,需要最小的高参数调整,因此很容易将其纳入药物发现管道中,以优先考虑有希望的目标并支持生物标志物驱动的分层。这项工作中使用的代码和数据集可公开使用。
储存器计算 (RC) [1, 2] 是一种循环神经网络,近年来因其训练成本低、可通过专用电路 [3, 4] 和物理 RC [5, 6] 在硬件上实现而备受关注。RC 由储存器部分和读出部分组成,储存器部分接收时间序列输入并将其非线性转换为高维空间以表示输入的时空模式,读出部分从储存器部分拾取一些模式来分析输入并生成输出。RC 的主要优势是除读出部分之外的权重连接都是固定的。因此,与深度神经网络相比,其训练所需的数据量更少,计算成本更低。因此,RC 适用于计算资源有限且无需云计算即可执行训练的边缘 AI 系统。 RC 的读出大多由线性模型(单层感知器)实现,因此,读出的适应训练数据的能力有限。为了增强 RC 的训练能力,我们提出了一个具有多个读出的 RC 模型,该模型将一个读出的训练分散,以便每个读出可以专注于特定类型的训练数据。该方法可以看作是一种集成学习,用于增强 RC 泛化性能。简单地增加读出的数量对于边缘 AI 系统来说是低效的,因为它会消耗系统中有限的内存资源。本研究引入了一种自组织函数,它能够使用
基于Leith(1964),Mintz(1965)和Smagorinsky(1963)的数值实验,确定大气的确定性可预测性极限被确定为大约2周。
机器学习方法是集合学习,其中许多分类器被用于预测单个输出。它也称为多分类器系统。为了胜过其他机器学习算法,Ensemble Learne结合了用于机器学习的Multiple算法,以根据从数据和各种投票过程中推断出数据和结果的属性提供弱预测性结果。合奏学习涉及将多个单个模型的预测结合在一起,以做出最终的预测或决策。合奏分类器比许多情况下的单个分类器更准确。合奏学习的概念可以与实际生活环境相匹配。在做出关键决定时,而不是仅仅依靠一种意见时,就会考虑多个专家。在许多情况下,合奏被证明比每个分类器都更精确,但是,整合模型永远不会成功。具有提高准确性的分类器与可行性构成最佳集合的不同之处。如果每个分类器都会产生不同的错误,则总误差将减少。
研究人员正在探索人类在识别和区分计算机化目的的情绪方面的出色技能。尽管面部情绪预测具有广泛的实际应用,但由于其对主观因素的依赖,它仍然是一个充满挑战的研究领域。尽管年龄和阻塞,但在本研究中提出了平衡所有基本面部情绪的预测方法。利用合奏分类器的实时面部情感预测的方法,将深CNN模型纳入了主要的基本分类器,同时解决了不平衡数据集的问题。通过图像扩展方法,CK+和JAFFE数据集可以合成增强。在2级使用多数和相对投票技术组合的元分类剂,以提高单个情绪的精度。使用Internet随机选择的面部表达图像对所提出的方法进行了测试,证明了总体准确性提高。此外,使用拟议的集合融合方法,对FER2013数据集进行了交叉验证。
摘要:及时发现并采取积极措施避免中风至关重要,因为这种疾病很可能导致严重残疾或致命后果。对于缺血性和出血性中风,必须及时使用适当的溶栓或抗凝药物。关键的初始阶段围绕及时识别中风的初始指标(个体之间可能有所不同)并在规定的治疗窗口内及时寻求医疗干预。本研究介绍了一种基于机器学习的系统,该系统采用实时测量心电图 (ECG) 和光电容积描记法 (PPG) 数据来以有意义的方式预测和解释中风预后症状。为了实现实时中风预测,我们开发并实施了一种集成结构投票分类器,该分类器结合了 SVM、随机森林和决策树分类器。这种方法可以准确预测患者的中风诊断,并且可以通过利用患者的 ECG 和 PPG 属性数据轻松实施。关键词:深度学习、机器学习、心电图(ECG)、光电容积描记法(PPG)、实时脑卒中预测
算法在我们的私人和公共生活中扮演着许多重要角色。他们产生搜索引擎结果,在社交媒体上组织新闻源,并确定有希望的浪漫伴侣。他们为司法,贷款,社会福利和大学录取决定提供了信息。他们还提出了紧迫和烦恼的道德挑战。例如,美国刑事司法系统中使用的一些算法预测个人是否会累进。著名的是,已经发现这种算法表现出明显的种族和性别偏见,例如将黑人非累犯者评级为比白人非养育者更喜欢重新审判(Angwin等人(Angwin等),2016a,b)。在某种程度上对这种发现的反应中,算法公平的研究在计算机科学,哲学和其他领域中扮演着重要的作用。从这些研究中得出的理论上有趣且在道德上显着发现的是,实施明智的公平概念可以兑现,以付出代价(Corbett-Davies et al。,2017年; Menon和Williamson,2018年; Kearns and Roth,2019年)。
hal是一个多学科的开放访问档案,用于存款和传播科学研究文件,无论它们是否已发表。这些文件可能来自法国或国外的教学和研究机构,也可能来自公共或私人研究中心。
本质上无序的蛋白质和区域(IDP/IDR)利用其结构性挠性来实现必要的细胞功能,并且功能障碍通常与严重疾病有关。然而,它们的序列,结构动力学和功能角色之间的关系仍然很少理解。将这些复杂关系熟悉的对于特性的发展至关重要,强调了对产生质量IDP/IDR构象异构体的方法的需求。 虽然Alphafold(AF)在建模结构域中表现出色,但它无法准确地代表无序区域,而蛋白质组织的很大一部分不准确。 我们提出了Afflecto,这是一种用户友好的Web服务器,用于生成蛋白质的大构象合奏,其中包括AF结构模型的结构化域和IDR。 通过分析其结构上下文,将IDR识别为尾部,接头或循环。 此外,它结合了一种方法来识别有条件折叠的IDR,AF可能错误地预测为本质上折叠的元素。 使用有效的随机采样算法在全球探索构象空间。 AffLecto的Web界面允许用户通过修改有序区域和分配区域之间的边界以及在几种采样策略之间进行选择来自定义建模。 Web服务器可在https://moma.laas.fr/applications/afflecto/免费获得。对于特性的发展至关重要,强调了对产生质量IDP/IDR构象异构体的方法的需求。虽然Alphafold(AF)在建模结构域中表现出色,但它无法准确地代表无序区域,而蛋白质组织的很大一部分不准确。我们提出了Afflecto,这是一种用户友好的Web服务器,用于生成蛋白质的大构象合奏,其中包括AF结构模型的结构化域和IDR。通过分析其结构上下文,将IDR识别为尾部,接头或循环。此外,它结合了一种方法来识别有条件折叠的IDR,AF可能错误地预测为本质上折叠的元素。使用有效的随机采样算法在全球探索构象空间。AffLecto的Web界面允许用户通过修改有序区域和分配区域之间的边界以及在几种采样策略之间进行选择来自定义建模。Web服务器可在https://moma.laas.fr/applications/afflecto/免费获得。
摘要。患者分层通过基于其分子和/或临床特征鉴定出不同的亚组,在个性化医学中起着至关重要的作用。但是,许多基于机器学习的分层技术无法识别与每个患者组相关的本质生物标志物特征。在本文中,我们提出了一种使用分层集合聚类来解释的患者分层的新方法。我们的方法利用具有与主成分分析(PCA)结合的采样,以捕获最重要的模式和贡献生物标志物。我们使用机器学习基准数据集和来自癌症基因组地图集(TCGA)的现实世界数据的方法的有效性,展示了检测到的患者簇的可解释性。