深度学习 (DL) 凭借其令人印象深刻的性能对遗传学研究产生了重大影响;然而,由于其复杂的性质,它通常被视为“黑匣子”。随着越来越多以低成本生成的数据和硬件的互补进步,新形式的人工智能 (AI) 正在实现各种预测任务,从调控基因组的注释到单细胞数据的分类 1 – 4 。通过了解作为此类成功预测基础的大规模数据属性,我们有望对正在研究的生物过程获得更深入的了解。在过去的几年中,可解释人工智能 (xAI) 领域迅速涌现出可提供此类见解的新型模型解释技术 5 。深度学习模型可以学习复杂的模式。例如,在确定人类基因组中的哪些 DNA 序列指导特定细胞类型中的基因转录时,模型可能正在学习序列组成(例如,GC 含量)、特定基序模式(转录因子 (TF) 结合位点)的存在或不存在、染色质的局部可及性、DNA 的生物物理特性(例如,可弯曲性)、序列特性之间的位置差异(即在区域边缘或中间发现的特征)、特征之间的正或负相互作用,或超出我们当前知识状态的属性。为了学习庞大而复杂的特征集,此类模型需要学习数百万个参数,这些参数共同决定模型预测,但不提供
脑部缺氧会导致细胞死亡,脑细胞控制的身体部位就会失去功能。脑部血管受损或破裂就是人们所熟知的中风。影响中风的因素有很多,这些因素当然需要观察和警惕,以防止中风人数的增加。因此,本研究旨在使用统计分析(相关性)分析影响病历中中风的变量,并使用XAI算法进行中风预测。分析的因素包括性别、年龄、高血压、心脏病、婚姻状况、居住类型、职业、血糖水平、BMI和吸烟。根据研究结果,我们发现女性中风的风险高于男性,即使没有高血压和心脏病的人(高血压和心脏病没有及早发现)中风的风险仍然很高。已婚人士中风的风险也高于未婚人士。此外,吸烟、工作时思维和活动非常激烈、居住环境不利等不良习惯也可能会引发中风。年龄、BMI 和血糖水平的增加肯定会影响一个人的中风风险。我们还成功地使用 EMR 数据预测了中风,准确度、灵敏度和精确度都很高。基于性能矩阵,与其他算法(如 RF、NB、SVM 和 KNN)相比,PNN 的准确度、灵敏度和 F 测量值最高,分别为 95%、100% 和 97%。1. 简介
心血管疾病是死亡的主要原因,并严重威胁了日常生活的人类健康。临床实践和智能家庭应用程序的需求急剧增加,以监测患有慢性心血管疾病的人的心脏状况。但是,在数量方面仍然缺乏经验丰富的医生。自动心脏声音分类利用高级信号处理和深度学习技术的功能显示出令人鼓舞的结果。然而,缺乏对深神经网络的解释是自动心脏声音分类应用的限制。为此,我们提出了通过注意机制来解释深层神经网络,以进行心脏声音分类。我们评估了心脏听起来深圳语料库的拟议方法。我们的方法可实现三种心脏声音分类的未加权平均召回率为51.2%。例如,正常,轻度和中度/重度。实验结果还表明,通过估计每个单元在高级特征中的贡献,全球注意力集合层可以提高学习表示的性能。我们通过可视化注意力张量进一步分析了深层神经网络。
人工智能 (AI) 系统的准确性和灵活性通常以降低对其预测提供直观解释的能力为代价。这阻碍了人们对 AI 的信任,并阻碍了其在医疗保健领域的应用,而对误诊造成的责任和患者健康风险的担忧加剧了这种担忧。由于可解释机器学习领域的最新进展,为模型的预测提供解释是可能的。我们考虑了一组与抗生素处方记录和细菌分离株敏感性相关的医院入院数据。经过适当训练的梯度增强决策树算法,辅以 Shapley 解释模型,可预测可能的抗菌药物耐药性,耐药性的几率取决于患者的特征、入院数据、历史药物治疗和培养测试结果。应用这个基于 AI 的系统,我们发现与观察到的处方相比,它大大降低了治疗不匹配的风险。Shapley 值提供了观察/数据与结果之间的直观关联;所确定的关联与基于健康专家的先验知识的预期大致一致。研究结果以及归因信心和解释的能力支持人工智能在医疗保健领域的更广泛应用。
1 计算和预测生物学,生物科学,橡树岭国家实验室,美国田纳西州橡树岭 2 田纳西大学诺克斯维尔分校布雷迪森跨学科研究与研究生教育中心,美国田纳西州橡树岭 3 合成生物学,橡树岭国家实验室,美国田纳西州橡树岭 4 计算科学与工程,橡树岭国家实验室,美国田纳西州橡树岭 本稿件由 UT-Battelle, LLC 根据与美国能源部签订的合同编号 DE-AC05- 00OR22725 撰写。美国政府保留;并且出版商在接受文章发表时,承认美国政府保留非独占的、已付费的、不可撤销的全球许可,可以为美国政府的目的出版或复制本稿件的已出版形式,或允许他人这样做。能源部将根据能源部公共访问计划 ( http://energy.gov/downloads/doe-public-access-plan ) 向公众开放这些联邦资助研究的成果。摘要:CRISPR-Cas9 工具已经彻底改变了实验室的基因操作能力。经验法则仅针对少数模型生物建立,而 sgRNA 效率的机制基础仍然知之甚少。这项工作建立了一个使用量子化学张量生成的新特征集和新公共资源,用于解释和预测 sgRNA 效率。sgRNA 效率的特征工程是使用可解释的人工智能模型;迭代随机森林 (iRF) 执行的。通过对大肠杆菌 sgRNA 的位置特异性序列的定量属性进行编码,我们确定了细菌物种中 sgRNA 设计的重要性状。此外,我们还表明,将位置编码扩展到碱基对、二聚体、三聚体和四聚体序列的量子描述符可以捕获目标 DNA 局部和邻近核苷酸中复杂的相互作用。这些特征凸显了大肠杆菌和智人基因组之间 CRISPR-Cas9 sgRNA 动力学的差异。这些新颖的 sgRNA 编码极大地增强了我们对 CRISPR-Cas9 机制中涉及的复杂量子生物过程的理解。
高,任务专家也有可能从查看注释中获益,但天花板效应掩盖了这些好处。通过查看个别患者病例,我们发现任务专家在审查更具挑战性的病例时确实从视觉注释中获益更多。因此,未来的研究应包括更复杂的案例以进一步研究这一点。另一方面,任务专家在已经收到发现和初步诊断时也有可能不需要对 X 射线进行视觉解释,因为这些信息足以引导他们注意图像上的关键区域。同样,对于非任务专家来说,书面发现和诊断可能比简单的视觉注释更难理解。记录
由爱达荷大学图书馆用户于 2022 年 5 月 27 日从 http://direct.mit.edu/dint/article-pdf/doi/10.1162/dint_a_00119/1987143/dint_a_00119.pdf 下载
* 通讯作者:takashia@okayama-u.ac.jp † 资深作者 T.Ak.、KM 和 EK 对本研究的贡献相同。T.Ak. 和 SU 构思了这项研究。T.Ak.、TK 和 T.Ar. 设计了实验。T.Ak.、KM、EK 和 TK 进行了实验。T.Ak.、KM、EK 和 KT 分析了数据。T.Ak.、YK 和 KU 建造并维护了设施。T.Ak.、KT 和 SU 开发了程序和分析代码。T.Ak.、KM、EK、TK、T.Ar. 和 SU 起草了手稿。所有作者均认可了手稿。根据作者须知 (https://academic.oup.com/plcell) 中所述的政策,负责分发与本文所述研究结果相关的材料的作者是:Takashi Akagi (takashia@okayama-u.ac.jp)。
摘要 - 已经开发了越来越多的机器学习(ML)工具和原型,以协助空中交通管制员(ATCO)的决策过程。这些ML工具可以促进更快,更一致的决策,以进行流量监控和管理。但是,其中许多工具都使用了模型,在这些模型中,机器做出的决策不容易被ATCO组成。因此,有必要为ATCO开发可解释的基于ML模型的工具,以管理使用基于ML模型的决策的固有风险。这项研究调查了视觉上解释的ML模型,用于跑道出口预测,以实现更好的跑道管理。具体来说,这项研究采用了XGBoost上的局部可解释的模型解释(LIME),在该解释中,可以看到机器做出的跑道退出预测的决策。XGBoost在这里研究的三种飞机分别达到了94.35%,94.17%和80.87%的分类精度。分析石灰参数时,石灰显示了与特定跑道出口相对应的每个飞机的特征的贡献。此外,视觉分析可以将跑道退出预测中不确定性的来源告知决策者。因此,这项工作为基于ML的跑道出口预测铺平了道路,视觉上可解释的机器决策可以为ATCO提供见解,以提供有效的跑道管理以及到达和出发的计划。交互式接口可视化跑道退出预测的机器决策的交互式界面也是本文的原型。
摘要 目前存在一场争论,即在医学背景下使用的机器学习系统是否需要可解释,以及在何种意义上需要可解释。赞成者认为,这些系统需要对每个个人决策进行事后解释,以增加信任并确保诊断准确。反对者则认为,系统的高准确性和可靠性足以提供认知上合理的信念,而无需解释每个个人决策。但是,正如我们所表明的,这两种解决方案都有局限性——而且目前还不清楚它们是否能解决使用这些系统的医疗专业人员的认知担忧。我们认为这些系统确实需要解释,但需要制度上的解释。这些类型的解释提供了医疗专业人员在实践中应该依赖该系统的原因——也就是说,它们专注于试图解决那些在特定环境和特定场合使用该系统的人的认知担忧。但确保这些制度解释符合目的意味着确保设计和部署这些系统的机构对系统中的假设是透明的。这需要与专家和最终用户协调,了解该系统在现场如何发挥作用、用于评估其准确性的指标以及审核系统的程序,以防止出现偏差和故障。我们认为,这种更广泛的解释是必要的,因为事后解释或准确性分数对医疗专业人员具有认识论意义,使他们能够依赖这些系统作为实践中有效和有用的工具。