摘要 - 糖尿病(DM)是一个全球健康问题,必须尽早诊断出来,并得到很好的管理。本研究提出了使用机器学习(ML)模型进行糖尿病预测的框架,并配有可解释的人工智能(XAI)工具,以投资ML模型的预测的预测准确性和解释性。数据预处理基于糖尿病二进制健康指标数据集中使用的合成少数群体过采样技术(SMOTE)和特征缩放数据集,以处理临床特征的类别失衡和可变性。整体模型提供了高精度,测试精度为92.50%,ROC-AUC为0.975。BMI,年龄,一般健康,收入和体育锻炼是从模型解释中获得的最有影响力的预测因素。这项研究的结果表明,与XAI结合的ML是开发用于医疗保健系统中使用的准确和计算透明工具的一种有希望的方法。
抽象工业系统资源能够生成大量数据。这些数据通常采用异质格式并分发,但它们表示可以挖掘可以允许部署智能管理工具进行生产活动的信息。为此,有必要使用人工智能(AI)模型来实施知识提取和预测过程,但是对于非专家用户而言,对预期AI模型的选择和配置往往越来越复杂。在本文中,我们提出了一种方法和一个软件平台,该方法可能允许不熟悉AI的工业参与者选择和配置算法,以最佳地适应他们的需求。因此,该方法基本上是基于自动化的机器学习。产生的平台有效地可以在AI算法和超参数配置的组合之间做出更好的选择。也可以提供重新塑造算法和模型的解释性的功能,从而提高这些模型在实践用户社区中的可占用性。所提出的方法已应用于预测维护的领域。当前测试是
摘要。AI模型被批评为黑匣子,这可能会使气候科学更加不确定性。已提出了可解释的人工智能(XAI)来探测AI模型并增加信任。在这篇评论和观点论文中,我们建议,除了使用XAI方法外,气候科学领域的AI研究人员还可以从过去的成功发展中学习基于物理学的动态气候模型的成功。动力学模型很复杂,但获得了信任,因为它们的成功和失败可以在某些时候归因于特定的组件或子模型,例如,当指向细胞参数化来解释模型偏差时。我们提出了三种类型的理解作为评估动力学和AI模型的信任的基础:(1)工具理解,当模型通过功能测试时,这是对此进行的; (2)在研究人员可以使用统计技术识别输入输入关系的建模结果时获得的坚定理解; (3)组件级的理解是指建模者指向模型架构中特定模型组件或部分的特定模型组件的能力,作为不稳定的模型行为的罪魁祸首,或者是模型的原因。我们演示了过去几十年来通过气候模型对比项目进行的组件级别的理解和实现。这种组件级别的理解通常会导致模型改进,也可以作为思考AI驱动气候SCI-
深度学习 (DL) 和可解释人工智能 (XAI) 已成为强大的机器学习工具,可用于识别空间或时间域中的复杂预测数据模式。在这里,我们考虑将 DL 和 XAI 应用于大型组学数据集,以便在分子水平上研究生物衰老。我们开发了一种先进的多视图图级表示学习 (MGRL) 框架,该框架整合了先前的生物网络信息,以细胞类型分辨率构建分子衰老时钟,随后我们使用 XAI 对其进行解释。我们将该框架应用于最大的单细胞转录组数据集之一,该数据集包含来自 981 名捐赠者的一百万多个免疫细胞,揭示了一个核糖体基因子网络,其表达与年龄无关,与细胞类型无关。将相同的 DL-XAI 框架应用于分类单核细胞的 DNA 甲基化数据,揭示了一种表观遗传失调的炎症反应途径,其活性随着年龄的增长而增加。我们表明,如果我们使用更标准的机器学习方法,就不会发现核糖体模块和炎症途径。总之,这里介绍的计算深度学习框架说明了深度学习与可解释的人工智能工具相结合如何揭示对复杂衰老过程的新颖生物学见解。
本文提出了一种解决能源圈内通常称为鸭曲线问题的电力负荷分配问题的新方法。鸭曲线问题是一条曲线,显示公用事业公司为其消费者提供的总电力负荷(来自火力发电厂的能源)与风能和太阳能发电(或本地发电)满足部分负荷(可再生资源或绿色能源)后的负荷之间的差异。这种方法基于无监督学习长短期记忆(LSTM)和注意力机制,旨在对鸭曲线预测做出清晰的解释,并了解这种差异的明确原因,从而帮助决策者更好地解释曲线并有效地解决问题。信息和通信技术(ICT)和物联网(IoT)对于绿色能源的部署是必不可少的。因此,可以利用不同传感器的数据作为支撑,验证本地生产层面的信息,以有效、有针对性的方式解决“鸭子曲线”问题。
由于依赖时间密集型且不可扩展的专家评估,脑瘫(CP)的早期鉴定仍然是一个重大挑战。因此,一系列研究旨在通过机器学习来预测基于运动跟踪的CP分数,例如从视频数据中。这些研究通常可以预测临床评分,这是CP风险的替代。但是,临床医生并不想估计分数,他们想估计患者患临床症状的风险。在这里,我们提出了一个数据驱动的机器学习(ML)管道,该管道从基于婴儿视频的运动跟踪中提取运动功能,并估算使用自动符号的CP风险。使用AutoSklearn,我们的框架通过抽象研究人员 - 驱动器超参数优化来最大程度地拟合过度适应的风险。接受了从3至4个月大的婴儿进行运动数据的培训,我们的分类器预测在持有的测试集中,ROC-AUC的高度指示性临床评分(General运动评估[GMA]),表明运动学运动特征临床相关的可变性。没有再培训,相同的模型可以预测在后来的临床随访中,ROC-AUC为0.74,脑瘫结局的风险,表明早期运动表现形式概括为长期神经发育风险。我们采用预注册的锁定箱验证来确保索具性能评估。本研究强调了自动驱动运动分析对神经发育筛查的潜力,这表明数据驱动的运动轨迹提取的特征可以为早期风险评估提供可解释且可扩展的方法。通过整合预先训练的视频变压器,自动驱动的模型选择和严格的验证协议,这项工作可以推进使用视频衍生的运动功能来用于可扩展的,数据驱动的临床评估,从而证明基于可用的数据(如婴儿)(如婴儿)的计算方法如何增强神经发育障碍的早期风险检测。
摘要。患者分层通过基于其分子和/或临床特征鉴定出不同的亚组,在个性化医学中起着至关重要的作用。但是,许多基于机器学习的分层技术无法识别与每个患者组相关的本质生物标志物特征。在本文中,我们提出了一种使用分层集合聚类来解释的患者分层的新方法。我们的方法利用具有与主成分分析(PCA)结合的采样,以捕获最重要的模式和贡献生物标志物。我们使用机器学习基准数据集和来自癌症基因组地图集(TCGA)的现实世界数据的方法的有效性,展示了检测到的患者簇的可解释性。
HAL 是一个多学科开放存取档案库,用于存放和传播科学研究文献,无论这些文献是否已出版。这些文献可能来自法国或国外的教学和研究机构,也可能来自公共或私人研究中心。
RUI MAO 是新加坡南洋理工大学的研究员、首席研究员。他获得了阿伯丁大学的计算机科学博士学位。他的研究兴趣包括计算隐喻处理、情感计算和认知计算。他和他创立的公司开发了第一个使用现代语言搜索中国古诗词的神经网络搜索引擎 (haps://wensousou.com),以及一个用于语言和概念隐喻理解的系统 (haps://metapro.ruimao.tech)。他以第一作者的身份在顶级会议和期刊上发表了多篇关于情感计算的论文,例如 ACL、AAAI、IEEE ICDM、InformaRon Fusion 和 IEEE TransacRons。他曾担任 COLING 和 EMNLP 的领域主席以及 Expert Systems、InformaRon Fusion 和 NeurocompuRng 的副主编。
美国专利US-6609117-B2和US-6349292-B1,“通过公共网络分配邮资的系统和方法,可以有效地打印邮政指示,并在要邮寄的项目上进行邮寄并进行身份验证,” A.V.Sutherland,M.R。Klugerman,F.M。 d'ippolito,2002和2003。Klugerman,F.M。d'ippolito,2002和2003。