多年来,抑制导致癌症的蛋白激酶 (PK) 一直是癌症治疗的重要课题。到目前为止,FDA 批准的药物已经针对了 530 多种 PK 中的近 8%,大约 150 种蛋白激酶抑制剂 (PKI) 已经在临床试验中进行了测试。我们提出了一种基于自然语言处理和机器学习的方法来研究 PK 和癌症之间的关系,预测抑制哪些 PK 可以有效治疗某种癌症。我们的方法根据 PubMed 摘要中的单词和概念邻域将 PK 和癌症表示为具有语义意义的 100 维向量。我们使用 ClinicalTrials.gov 中有关 I-IV 期试验的信息来构建随机森林分类的训练集。我们使用历史数据的结果显示,可以提前数年准确预测 PK 与特定癌症之间的关联。我们的工具可用于预测抑制 PK 对特定癌症的相关性,并支持设计有针对性的临床试验,以发现用于癌症治疗的新型 PKI。
在这里,我们设计了一个独特的药物相似性模型来重新利用现有的抗 SARS-CoV-2 药物,使用地塞米松、巴瑞替尼和瑞德西韦的抗 Covid 特性作为参考。参考药物的已知化学-化学相互作用有助于提取具有改进的抗 SARS-CoV-2 特性的相互作用化合物。在这里,我们利用参考药物的相互作用化合物与 SARS-CoV-2 靶基因之间的化学-蛋白质相互作用来计算这些药物化合物治疗 SARS-CoV-2 相关症状的可能性。具体而言,我们采用了两层聚类方法来生成药物相似性模型,以最终选择潜在的抗 SARS-CoV-2 药物分子。第 1 层聚类基于 t 分布随机邻域嵌入 (t-SNE),旨在过滤和丢弃异常药物。二级分析结合了使用排序点识别聚类结构 (OPTICS) 和层次凝聚聚类 (HAC) 并行执行的两项聚类分析。结果,它识别出具有相似作用的药物簇。此外,我们还进行了对接研究,以对顶级候选药物进行计算机验证。
在当前时代,量子资源非常有限,这使得量子机学习(QML)模型的使用困难。涉及监督任务,通过量子局部性技术的引入,该方法允许模型仅专注于所考虑元素的邻域。一种众所周知的位置技术是k -neart最邻居(K -NN)算法,其中已经提出了几种量子变体。然而,它们尚未被用作其他QML模型的初步步骤。相反,对于经典的对应物,已经证明了基本模型的性能提高。在本文中,我们提出并评估利用量子位置技术以降低尺寸并改善QML模型的性能的想法。详细说明,我们提供(i)在python中实施了QML管道的本地分类和(ii)其广泛的经验评估。关于量子管道,它是使用Qiskit开发的,它由量子k -nn和量子二进制分类器组成,两者都在文献中已经可用。结果表明,在理想情况下,量子管道的等效性(就精度而言)与其经典对应物的等效性,即局部对QML领域的应用的有效性,但所选量子k -nn对概率波动的强烈敏感性以及诸如随机基线森林之类的经典基线方法的较好性能。
1 mfa47@cam.ac.uk, 2 ib340@cam.ac.uk 摘要 利用数字孪生概念,即现有铁路基础设施的物理资产虚拟副本,有可能彻底改变该领域的资产管理。但是,只有存在能够经济高效地生成铁路资产数字孪生的方法,这种利用才有可能。此“孪生”过程的第一步是捕获资产的原始几何形状并将其转换为适合进一步丰富设计、施工、运营和维护数据的高级几何形状。本文研究了第一步孪生的最新进展,即生成现有铁路基础设施的几何精确模型,重点关注轨道资产。本文首先定义数字孪生,然后解释真实虚拟同步的好处以及充分利用数字孪生的挑战。随后的部分提供了纵向文献,表明当前的研究对不同的铁路几何形状、邻域结构、扫描几何形状和输入数据强度很敏感。这些因素使得为数字孪生设计的方法对于包含不同水平和垂直高度的任何轨道结构都无效。这种差异相当常见;因此,我们得出结论,自动生成轨道结构几何数字孪生的问题尚未解决。
1 mfa47@cam.ac.uk, 2 ib340@cam.ac.uk 摘要 利用数字孪生概念,即现有铁路基础设施的物理资产虚拟副本,有可能彻底改变该领域的资产管理。但是,只有存在能够经济高效地生成铁路资产数字孪生的方法,这种利用才有可能。此“孪生”过程的第一步是捕获资产的原始几何形状并将其转换为适合进一步丰富设计、施工、运营和维护数据的高级几何形状。本文研究了第一步孪生的最新进展,即生成现有铁路基础设施的几何精确模型,重点关注轨道资产。本文首先定义数字孪生,然后解释真实虚拟同步的好处以及充分利用数字孪生的挑战。随后的部分提供了纵向文献,表明当前的研究对不同的铁路几何形状、邻域结构、扫描几何形状和输入数据强度很敏感。这些因素使得为数字孪生设计的方法对于包含不同水平和垂直高度的任何轨道结构都无效。这种差异相当常见;因此,我们得出结论,自动生成轨道结构几何数字孪生的问题尚未解决。
心脏是心血管系统的一部分,负责泵送含氧和缺氧血液。它不像节拍器那样运作,通常每次心跳之间的间隔时间会有所不同,称为心率变异性 (HRV)。在患病或衰老过程中,由于自主神经系统功能障碍,HRV 会降低。这项工作的目的是利用机器学习技术表明,这些技术能够直接将心脏的变异性与疾病的程度联系起来。作为实际结果,这些技术可用于仅通过分析其时间序列来预测不同类型的疾病。我们工作中使用的第一种技术是无监督学习算法 (t-随机邻域嵌入)。我们表明,该算法仅通过分析时间序列就能区分疾病的类型和程度,我们表明可以设计一种能够学习这些特征的神经网络架构,将心脏变异性和疾病联系起来。在补充分析中,我们检查心脏变异性与置换熵直接相关,证明一个人越健康,他的心脏时间序列就越随机。我们使用深度学习从混淆矩阵和 ROC 曲线构建分类算法。该算法可以作为通过测量患者的 HRV 来诊断患者的切入点。
神经形态计算具有多种特性,使其成为后摩尔计算中极具吸引力的计算范式。这些特性包括内在并行性、固有可扩展性、共置处理和内存以及事件驱动计算。虽然这些特性为神经形态系统带来了能源效率,但它们也带来了一系列挑战。神经形态计算的最大挑战之一是建立神经形态算法计算复杂性的理论基础。在本文中,我们迈出了定义神经形态算法的空间和时间复杂性的第一步。具体来说,我们描述了一种神经形态计算模型,并陈述了控制神经形态算法计算复杂性的假设。接下来,我们提出了一个理论框架来定义神经形态算法的计算复杂性。我们根据我们的神经形态计算模型,明确定义了神经形态算法中的空间和时间复杂性。最后,我们利用我们的方法并定义了六种神经形态算法的计算复杂性:常量函数、后继函数、前驱函数、投影函数、神经形态排序算法和邻域子图提取算法。
蛋白质序列相似性搜索是基因组学研究的基础,但是当前方法通常无法考虑可以指示蛋白质功能的关键基因组环境信息,尤其是在微生物系统中。在这里,我们提出了Gaia(基因组AI注释器),这是一个序列注释平台,可在基因组数据集跨基因组数据集进行快速,上下文感知的蛋白质序列搜索。Gaia利用GLM2是一种在氨基酸序列及其基因组邻域训练的混合模式基因组语言模型,以生成整合序列结构 - 膜片信息的嵌入。这种方法允许识别在保守的地理环境中发现的功能相关基因,仅传统序列或基于结构的搜索可能会错过。GAIA可以实时搜索来自131,744个微生物基因组的超过8500万蛋白簇(定义为90%序列身份)的策划数据库。我们将基于GLM2嵌入的搜索的序列,结构和上下文灵敏度与MMSEQS2和FOLDSEEK等现有工具的序列,上下文灵敏度进行了比较。我们展示了噬菌体尾蛋白和铁载体合成基因座的基本发现,这些发现以前很难用传统工具注释。Gaia搜索可在https://gaia.tatta.bio上免费获得。
摘要: - 在数字图像处理中,中位过滤器用于减少图像中的噪声。中间过滤器考虑了图像中的每个像素,并用邻域像素的中位数代替嘈杂的像素。中值是通过对像素进行排序计算的。排序依次由比较器组成,该比较器包括加法器和乘数。乘法是算术计算系统中的基本操作,用于许多DSP应用程序(例如FIR滤波器)。加法电路用作乘数电路中的主要组件。随身携带阵列(CSA)乘数是通过基于多重逻辑的建议的加法单元格设计的。提出的加法电路是通过使用香农定理设计的。将乘数电路进行了示意图,并使用VLSI CAD工具生成它们的布局。模拟了所提出的基于加法器的乘数电路,并将结果与CPL和其他基于Shannon的加法器细胞设计的电路进行了比较。通过使用90nm特征大小和各种电源电压来模拟所提出的基于加法器的乘数电路。Shannon Full Adder Cource的乘数电路比其他已发表的结果在功率耗散和面积方面提供了更好的性能,这是由于Shannon Adder电路中使用的晶体管数量较少。
基于图的模型已广泛应用于欺诈检测任务。由于图神经网络 (GNN) 的发展,最近的研究提出了许多基于同构或异构图的 GNN 欺诈检测器。这些工作利用现有的 GNN 并汇总邻域信息来学习节点嵌入,这依赖于邻居共享相似的上下文、特征和关系的假设。然而,欺诈者造成的不一致性问题很少被研究,即上下文不一致、特征不一致和关系不一致。在本文中,我们介绍了这些不一致性并设计了一个新的 GNN 框架 GraphConsis 来解决不一致问题:(1)对于上下文不一致,我们建议将上下文嵌入与节点特征相结合; (2) 针对特征不一致,我们设计了一个一致性评分来过滤不一致的邻居并生成相应的采样概率;(3) 针对关系不一致,我们学习与采样节点相关的关系注意权重。对四个数据集的实证分析表明,不一致问题在欺诈检测任务中至关重要。大量实验证明了 GraphConsis 的有效性。我们还发布了一个基于 GNN 的欺诈检测工具箱,其中包含 SOTA 模型的实现。代码可在 https://github.com/safe-graph/DGFraud 获得。