摘要:具有较大,无特征和高度亲脂性或高度极性和/或可透明的结合位点的繁殖靶标的潜在客户产生的产物是高度挑战性的。在这里,我们描述了大环天然产物的核心如何在计算机筛选文库中充当高质量的核心,该库为繁殖力范围的目标提供了潜在客户。一组经过精心选择的自然产物衍生的核心的两个迭代回合,导致发现了KEAP1-NRF2蛋白 - 蛋白质 - 蛋白质相互作用的未充电的大环抑制剂,这是由于其高极极性结合位点,这是一个特别具有挑战性的靶标。抑制剂显示出细胞的效率,并且基于其与Keap1和合成通道的络合物结构进行了良好的优化。我们认为,我们的工作将激发利用在基于计算机的潜在客户生成中使用大环核的兴趣,并激发未来大环筛查集合的设计。■简介
动机:由于药物与药物相互作用(DDI)数据集和大型生物医学知识图(kgs)的可用性不断提高,因此使用机器学习模型可以准确检测不良DDI。然而,这在很大程度上仍然是一个开放的问题,如何有效利用大型和嘈杂的生物医学kg进行DDI检测。由于其巨大的大小和公斤的噪音量,将KG与其他较小但较高质量的数据直接整合在一起通常是不那么好处(例如实验数据)。大多数现有方法完全忽略了kgs。有些试图通过图形神经网络将KG与其他数据直接集成在一起,成功有限。此外,大多数预先的作品都集中在二进制DDI预测上,而多型DDI药理学效应预测更有意义但更艰巨的任务。结果:要填补空白,我们提出了一种新方法sumgnn:知识汇总图形神经网络,该网络可以通过子图提取模块来启用,该模块可以有效地锚定在kg的相关子图上的基于自我意见的基于子分类的知识中的相关子图中的相关范围,以生成多个元素的知识和数据集成的多个频道和数据集成的频道和数据。 significant- ly improved multi-typed DDI predictions.sumgnn的表现优于最佳基线高达5.54%,而在低数据关系类型中,绩效增长尤为重要。此外,SUMGNN通过每个预测的生成的推理路径提供了可解释的预测。可用性和实施:该代码可在补充材料中找到。联系人:cao.xiao@iqvia.com补充信息:补充数据可在Online Bioinformatics获得。
摘要 — 人工智能 (AI),尤其是机器学习 (ML),在考古学中的应用正在蓬勃发展,开辟了文物分类、遗址位置预测和遗迹分析等新的可能性。这方面的主要挑战之一是缺乏精通机器学习的合格考古学家。在本研究中,我们介绍了 IArch,这是一种无需特定编程技能即可让考古学家进行可解释人工智能 (XAI) 数据分析的工具。它特别允许执行数据分析以验证现有的数据支持假设或生成新假设。该工具涵盖了应用 ML 的整个工作流程,从数据处理到解释最终结果。该工具允许使用监督和无监督 ML 算法,以及 SHapley Additive exPlanations (SHAP) 技术为考古学家提供对预测的整体和个体解释。我们通过蒙古草原上的匈奴墓地(公元前 100 年 / 公元 100 年)的数据证明了它的应用。
技术创新是向循环实践转移的催化剂。技术不仅应对技术挑战,从而促进了向更循环经济的过渡,而且还提高了业务效率和盈利能力。此外,它们具有包容性并创造就业机会,最终产生了积极的社会影响。该领域的研究倾向于集中于数字技术,忽略其他技术领域。此外,它在很大程度上依赖文献评论和专家意见,可能引入偏见。在本文中,我们通过自然语言处理(NLP)研究了循环经济的技术格局,研究了该领域中使用的关键技术以及管理这些技术的主要挑战。该方法适用于45,000多个科学出版物,旨在在NLP的科学文章中提取技术。我们的分析结果表明,非常重视新兴的数字,生命周期评估和生物材料技术。此外,我们确定了CE领域内的七个不同的技术领域。最后,我们提供了在工业环境中采用和实施这些技术时产生的优势和问题。
摘要 - 从网络攻击中扣除要求从业人员对高级对手行为进行操作。网络智能智能(CTI)关于过去的网络攻击事件的报告描述了随时间的恶意行动链。要避免重复网络攻击事件,从业人员必须主动识别并防御反复出现的行动链,我们称这是时间攻击模式。在动作之间自动挖掘模式提供了有关过去网络攻击的对抗行为的结构化和可行的信息。本文的目的是通过从网络威胁情报报告中挖掘时间攻击模式来帮助安全从业人员对网络攻击的优先级和主动防御。为此,我们提出了Chronocti,这是一种自动化管道,用于开采过去网络攻击的网络智能智能(CTI)报告的时间攻击模式。要构建Chronocti,我们构建了时间攻击模式的地面真相数据集,并应用最先进的大语模型,自然语言处理和机器学习技术。我们将ChronoCTI应用于一组713个CTI报告,在其中我们确定了124个时间攻击模式 - 我们将其分为9个模式类别。我们确定最普遍的模式类别是欺骗受害者用户执行恶意代码来发起攻击,然后绕过受害者网络中的反恶意软件系统。基于观察到的模式,我们主张组织培训用户有关网络安全最佳实践,引入功能有限的不变操作系统以及执行多用户身份验证。此外,我们提倡从业人员利用Chronocti和设计对策的自动化矿化能力,以应对重复的攻击模式。
BTS的明星吸引力是,它为在我们正常批次之外的学生提供了一个机会,可以与辉煌的宝石竞争。这无疑将为他们提供评估其优势和劣势的平台。bts肯定会发展学生的考试写作技巧,从而使他们能够与美国最佳持有人竞争。也将增强学生的优势和竞争精神。每次测试后,将有实时的怀疑清除量概念加强每个主题的会话。考试中心选定的中心
是否有不同的神经网络,接受过各种视觉任务的培训,共享一些共同的表示?在本文中,我们证明了我们在具有不同体系结构,不同任务(生成和歧视本地)以及不同类型的监督(班级监督,私人文本,文本监督,自学,自我求职,自我求助)的一系列模型中称为“ Rosetta神经元”的存在。我们提出了一种用于挖掘跨多种流行视觉模型的Rosetta神经元词典的算法:类监督 - Resnet50,Dino-Resnet50,Dino-Vit,Mae,Mae,Clip-Resnet50,Big-Gan,Big- Gan,stylegan-gangan-2,stylegan-xl。我们的发现表明,某些视觉概念和结构在自然世界中固有地植根于自然界,并且可以通过不同的模型来学习,而不论特定的任务或体系结构,并且不使用语义标签。,由于我们的分析中包含的生成模型,我们可以直接可视化共享概念。Rosetta神经元促进了模型对模型翻译,实现了各种基于反转的操作,包括跨级比对,变化,放大等,而无需进行专业培训。
摘要:干旱是对全球玉米产量的严重负面影响的主要非生物压力之一。了解玉米中干旱耐受性的遗传结构是朝着繁殖耐旱的品种和针对性的遗传资源剥削的关键步骤。在这项研究中,与谷物产量成分,开花时间和植物形态有关的511定量性状基因座(QTL)在干旱条件下以及干旱耐受性指数是从27项发表的研究中收集的,然后预测在IBM2 2008年的IBM2 2008年邻居参考图中的荟萃分析。总共确定了与玉米干旱耐受性相关的83个元QTL(MQTL),其中20个确定为核心MQTL。与先前发布的QTL相比,MQTL的平均置信区间大大降低。通过来自基因组关联研究的共定位标记 - 特性关联证实了几乎一半的MQTL。基于与干旱耐受性有关的水稻蛋白的比对,在玉米MQTL附近发现了63个直系同源基因。此外,在20个核心MQTL区域和玉米与同源基因中发现了583个候选基因。基于候选基因的KEGG分析,发现植物激素信号通路显着富集。信号通路可以对干旱耐受性产生直接或间接影响,并与其他途径相互作用。总而言之,这项研究提供了对玉米干旱耐受性的遗传和分子机制的新见解,以对繁殖中这种重要特征的更具针对性的改善。
在过去的几年中,人们已经使用几种不同的方法对幽默识别进行了研究。然而,现有的幽默识别研究并没有理解产生幽默的机制。本文受不协调理论的启发,任何笑话都可以分为两个部分(设置和妙语)。这两个部分都有多种可能的语义,并且它们之间存在不协调的关系。我们分别使用密度矩阵来表示设置和妙语的语义不确定性,并借助量子熵设计量子熵不确定性(QE-Uncertainty)和量子熵不协调性(QE-Incongruity)作为幽默识别的特征。在 SemEval2021 Task 7 数据集上的实验结果表明,所提出的特征比基线更有效,可用于识别幽默和非幽默文本。
摘要:微生物和植物产生的天然产物 (NP) 是药物、除草剂和杀菌剂的主要来源。得益于 DNA 测序、生物信息学和基因组挖掘工具的最新进展,多年来已经生成了大量有关 NP 生物合成的数据,这些数据越来越多地被利用来开发用于 NP 发现的机器学习 (ML) 工具。在这篇综述中,我们讨论了开发和应用 ML 工具的最新进展,这些工具用于探索可以用基因组语言编码的潜在 NP 并预测 NP 的生物活性类型。我们还研究了与 NP 研究的 ML 工具的开发和应用相关的技术挑战。关键词:机器学习、天然产物、基因组挖掘、生物合成基因簇、生物活性预测、模型构建■介绍数千年来,天然产物 (NP) 对人类健康和福祉至关重要。1 DNA 测序、生物信息学和基因组挖掘的最新进展使得 NP 的发现更加高效。然而,随着越来越多的化合物被发现,避免发现先前已鉴定的 NPs 变得越来越具有挑战性。此外,探索 NPs 的生物学功能仍然很困难,特别是因为一些 NPs 的数量非常少,阻碍了对其生物活性的广泛筛选。为了帮助发现 NPs 并表征其生物活性,研究人员开发了各种策略,例如高通量生物合成基因簇 (BGC) 发现、2、3 通过 CRISPR/Cas9 介导的基因组编辑激活 BGC、4、5