1 马克斯普朗克研究组 NeuroCode,马克斯普朗克人类发展研究所,柏林,德国;2 马克斯普朗克 UCL 计算精神病学和老龄化研究中心,柏林,德国;3 汉堡大学心理学研究所,汉堡,德国;4 高等师范学院物理实验室,法国国家科学研究院,ENS,PSL 大学,索邦大学,巴黎西岱大学,法国巴黎;5 牛津大学实验心理学系,牛津,英国;6 伯明翰大学心理学学院,伯明翰,英国;7 伯明翰大学人类大脑健康中心,伯明翰,英国;8 伦敦大学学院盖茨比计算神经科学部,伦敦,英国;9 伦敦大学学院 Sainsbury Wellcome 中心,伦敦,英国;10 CIFAR Azrieli Global加拿大多伦多 CIFAR 学者
计算和实验能力的提高正在迅速增加日常生成的科学数据量。在受内存和计算强度限制的应用中,过大的数据集可能会阻碍科学发现,因此数据缩减成为数据驱动方法的关键组成部分。数据集在两个方向上增长:数据点的数量和维数。降维通常旨在在低维空间中描述每个数据样本,而这里的重点是减少数据点的数量。提出了一种选择数据点的策略,使它们均匀地跨越数据的相空间。所提出的算法依赖于估计数据的概率图并使用它来构建接受概率。当仅使用数据集的一小部分来构建概率图时,使用迭代方法来准确估计稀有数据点的概率。不是对相空间进行分组来估计概率图,而是用正则化流来近似其函数形式。因此,该方法自然可以扩展到高维数据集。所提出的框架被证明是在拥有大量数据时实现数据高效机器学习的可行途径。
现有的对象检测模型主要在大型标记的数据集上进行培训。但是,新型航空对象类的注释数据很昂贵,因为它耗时,可能需要专家知识。因此,希望研究航空效率上的标签有效对象检测方法。在这项工作中,我们提出了一种零拍方法,用于空中对象检测名为“视觉描述正则化”或“下降”。具体而言,我们确定了空中物体的弱语义 - 视觉相关性,并旨在通过先前描述其视觉外观来解决Challenge。否则将描述直接编码为具有差距概率的类嵌入空间,我们建议在描述中传达的先前的阶层间视觉模拟,以将描述传达到嵌入学习中。通过新签名的相似性感知的三重损失完成输注过程,该损失在表示空间上结合了结构的正则化。我们使用三个具有挑战性的空中对象进行数据集进行了广泛的实验,包括Dior,Xview和Dota。恢复表明,下降的表现明显优于具有复杂投影的最先进的ZSD方法,例如,discreg胜过discreg优于未看到类别的dior上的ZSD方法最佳报道的ZSD方法,而HM在HM中是8.1。我们通过将下降集成到生成ZSD方法以及改变检测体系结构中进一步显示了降落的概括性。代码将在https://github.com/zq-zang/descreg上进行重新租赁。
在制药科学中,识别药物和靶标蛋白之间的潜在相互作用至关重要。在基因组药物发现中,相互作用的实验验证费力且昂贵;因此,需要高效、准确的计算机模拟技术来预测潜在的药物-靶标相互作用,以缩小实验验证的搜索空间。在这项工作中,我们提出了一个新框架,即多图正则化核范数最小化,它从三个输入预测药物和靶标蛋白之间的相互作用:已知的药物-靶标相互作用网络、药物之间的相似性以及靶标之间的相似性。所提出的方法侧重于寻找一个低秩相互作用矩阵,该矩阵由图编码的药物和靶标的接近度构成。先前关于药物靶标相互作用 (DTI) 预测的研究表明,结合药物和靶标的相似性有助于通过保留原始数据的局部几何形状更好地学习数据流形。但是,对于哪种相似性以及哪种组合最能帮助完成预测任务,目前还没有明确的共识。因此,我们建议使用各种药物间相似性和靶标间相似性作为多图拉普拉斯(药物/靶标)正则化项,以详尽地捕获近似值。使用标准评估指标(AUPR 和 AUC)对四个基准数据集进行的大量交叉验证实验表明,所提出的算法提高了预测性能,并且大大优于最近最先进的计算方法。软件可在 https://github.com/aanchalMongia/ MGRNNMforDTI 上公开获取。
在制药科学中,药物发现的一个关键步骤是识别药物-靶标相互作用 (DTI)。然而,只有一小部分 DTI 经过了实验验证。此外,通过传统的生化实验来捕捉药物和靶标之间的新相互作用是一个极其费力、昂贵且耗时的过程。因此,设计用于预测潜在相互作用的计算方法来指导实验验证具有实际意义,特别是对于从头情况。在本文中,我们提出了一种新算法,即拉普拉斯正则化的 Schatten p 范数最小化 (LRSpNM),用于预测新药物的潜在靶标蛋白和没有已知相互作用的新靶标的潜在药物。具体而言,我们首先利用药物和靶标相似性信息来动态地预填充部分未知的相互作用。然后基于相互作用矩阵低秩的假设,我们使用 Schatten p 范数最小化模型结合拉普拉斯正则化项来提高新药/新靶点案例的预测性能。最后,我们通过一种高效的交替方向乘子算法对 LRSpNM 模型进行数值求解。我们在五个数据集上评估了 LRSpNM,大量的数值实验表明 LRSpNM 比五种最先进的 DTI 预测算法具有更好、更稳健的性能。此外,我们对新药和新靶点预测进行了两个案例研究,这表明 LRSpNM 可以成功预测大多数经过实验验证的 DTI。
人工智能 (AI) 在精准肿瘤学中的应用通常涉及根据之前的训练细胞样本对这些药物的反应来预测患者的癌细胞(之前 AI 模型未见过)是否会对一组现有的抗癌药物中的任何一种产生反应。为了扩大抗癌药物的范围,AI 还被用于重新利用尚未在抗癌环境中测试过的药物,即从头预测新药对以前未见过的癌细胞的抗癌作用。在这里,我们报告了一个在统一的 AI 框架中解决上述两个任务的计算模型。我们的模型称为基于深度学习的图正则化矩阵分解 (DeepGRMF),它集成了神经网络、图模型和矩阵分解技术,利用来自药物化学结构、它们对细胞信号系统的影响和癌细胞细胞状态的各种信息来预测细胞对药物的反应。 DeepGRMF 学习药物的嵌入,以便具有相似结构和作用机制 (MOA) 的药物在嵌入空间中紧密相关。同样,DeepGRMF 还学习细胞的表示嵌入,使得具有相似细胞状态和药物反应的细胞紧密相关。在癌症药物敏感性基因组学 (GDSC) 和癌细胞系百科全书 (CCLE) 数据集上对 DeepGRMF 和竞争模型的评估显示了其在预测性能方面的优势。最后,我们表明该模型能够预测化疗方案对癌症基因组图谱 (TCGA) 数据集中肺癌患者患者结果的有效性。⇤
加拿大金斯敦皇后大学癌症研究所的生物医学和分子科学系; B宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州宾夕法尼亚州佩雷尔曼高级医学中心泌尿外科系; c不列颠哥伦比亚大学泌尿科科学系,不列颠哥伦比亚省温哥华,加拿大; D德国弗莱堡大学医学与医学中心的输血医学和基因治疗研究所; E分司血液学/肿瘤学,Tisch Cancer Institute,伊坎医学院,美国纽约州纽约州西奈山; F美国医学博士NCI,NIH,NIH,NIH,美国马里兰州癌症研究中心免疫肿瘤中心; G.UniversitéParisCité,Institut Cochin,Inserm U1016,CNRS UMR 8104,巴黎,75014,法国; h粘膜炎症和免疫力,法国巴黎75015 Institut Pasteur学院,法国巴黎; I美国德克萨斯州休斯顿市德克萨斯大学医学博士安德森癌症中心外科泌尿外科系;加拿大QC蒙特利尔麦吉尔大学卫生中心泌尿外科J泌尿外科; k加拿大金斯敦皇后大学医学院泌尿外科系; l德克萨斯大学医学博士安德森癌症中心,美国德克萨斯州休斯敦的杰纳特里医学肿瘤学系
在各种下游应用中,稀疏正则化的优化问题无处不在,例如深层神经网络(DNNS)的特征选择和压缩。尽管如此,当将这种正则化与随机损耗函数结合使用时,文献中现有的方法并不能很好地执行。,设计具有转换保证的计算有效算法并可以计算组较高的解决方案是一项挑战。最近,提出了一种半空间的预测梯度(HSPG)方法,部分解决了这些挑战。本文介绍了我们称之为ADAHSPG+的HSPG的大大增强版本,这取得了两个明显的进步。首先,与HSPG所要求的假设相比,ADAHSPG+在明显较宽的假设下具有更强的收敛结果。通过将差异技术与新的自适应策略整合在一起,以迭代预测解决方案的支持来实现这种改善。第二,与HSPG相比,ADAHSPG+的参数调整要少得多,从而使其更实用和用户友好。通过设计自动和自适应策略来选择每次迭代中采用的步骤类型并更新关键的HyperParam-eters来实现这一进步。我们提出的ADAHSPG+算法的数值有效性在凸面和非凸基准问题上都证明了。源代码可在https://github.com/tianyic/adahspg上找到。
多模态异构数据,如结构磁共振成像 (MRI)、正电子发射断层扫描 (PET) 和脑脊液 (CSF),可通过提供有关退化脑部疾病(如阿尔茨海默病前驱期,即轻度认知障碍)的互补信息,有效提高痴呆症自动诊断的性能。有效地整合多模态数据仍然是一个具有挑战性的问题,尤其是当这些异构数据由于数据质量差和患者退出而不完整时。此外,多模态数据通常包含由不同扫描仪或成像协议引起的噪声信息。现有方法通常无法很好地处理这些异构且嘈杂的多模态数据以进行脑痴呆症自动诊断。为此,我们提出了一种高阶拉普拉斯正则化低秩表示方法,使用逐块缺失的多模态数据进行痴呆症诊断。对来自真实阿尔茨海默病神经影像学计划 (ADNI) 队列的 805 名受试者(具有不完整的 MRI、PET 和 CSF 数据)对所提出的方法进行了评估。实验结果表明,与最先进的方法相比,我们的方法在脑疾病分类的三个任务中是有效的。
是出于实际应用的动机,最近的作品考虑了子模函数g和线性函数的总和的最大化。迄今为止,几乎所有此类工作仅研究了此问题的特殊情况,其中G也保证为单调。因此,在本文中,我们系统地研究了该问题的最简单版本,其中允许g是非单调的,即无约束的变体,我们将其称为正则不受约束的非约束下义最大化(正则化usizusm)。我们的主要算法结果是通用正则化usem的首个非平凡保证。对于线性函数ℓ是非阳性的正则uSM的特殊情况,我们证明了两个不Xibibibity的结果,表明先前的作品对这种情况暗示的算法结果远非最佳。最后,我们重新分析了已知的双重贪婪算法,以获得改进的正则化usemized use的特殊情况的保证,其中线性函数是非负的;我们通过表明无法获得(1 / 2,1)对这种情况的APPROXIMATION(尽管有直觉的论点表明这种近似保证是自然的)来补充这些保证。