天然化合物是潜在小分子治疗药物的丰富资源。尽管由于其多样性和系统纯化的困难,这种资源的实验性访问受到限制,但计算评估与已知治疗分子的结构相似性提供了一种可扩展的方法。在这里,我们使用机器学习方法结合多种化学相似性指标和物理化学性质来评估天然化合物与已批准药物之间的功能相似性。我们计算了 1410 种药物之间的成对相似性以训练分类模型,并使用药物共享的蛋白质靶标作为类标签。表现最好的模型是随机森林,其平均 ROC 下面积为 0.9,马修斯相关系数为 0.35,F1 得分为 0.33,表明它很好地捕捉了结构-活性关系。然后使用这些模型通过将大约 11k 种天然化合物与药物进行比较来预测其蛋白质靶标。这揭示了几种天然化合物的治疗潜力,包括那些有以前发表的资料支持的化合物以及迄今为止尚未开发的化合物。我们通过实验验证了预测对之一的活性,即 5-甲氧基水杨酸对 Cox-1 的抑制作用,5-甲氧基水杨酸是一种常见于茶、草药和香料中的分子。相比之下,另一种天然化合物 4-异丙基苯甲酸在考虑最大加权相似度指标时具有最高相似度得分,但未被我们的模型挑选出来,它没有抑制 Cox-1。我们的结果证明了结合多种化学特征的机器学习方法在揭示天然化合物的蛋白质结合潜力方面的实用性。
药物发现通常需要识别脱靶,因为化合物与预期靶标以外的靶标的结合在某些情况下可能是有益的,而在其他情况下可能是有害的(例如,与反靶标结合)。此类调查在项目的早期阶段也很重要,例如当靶标未知时(例如,表型筛选)。靶标识别可以在体外进行,但近年来也开发了各种计算机模拟方法,以促进靶标识别并帮助产生想法。FastTargetPred 就是这样一种方法,它是一个免费的 Python/C 程序,它尝试使用已建立的化学相似性搜索方法预测单个输入小分子查询或整个化合物集合的假定大分子靶标(即靶标钓鱼)。事实上,小化合物的假定大分子靶标可以通过识别来预测。
用于查找相关文献的文档推荐系统大多依赖于十年前开发的方法。这主要是因为缺乏一个涵盖各种研究领域的大型离线黄金标准相关文献基准,以便可以比较、改进新开发的文献检索技术并将其转化为实践。为了克服这个瓶颈,我们成立了 RE 相关文献搜索联盟,该联盟由来自 84 个国家的 1500 多名科学家组成,他们共同注释了超过 180,000 篇 PubMed 收录文章与其各自的种子(输入)文章的相关性。大多数注释都是由经验丰富的种子文章原作者提供的。收集到的数据涵盖了 76% 的所有唯一 PubMed 医学主题词描述符。在不同经验水平、研究领域或注释时间之间未观察到系统性偏差。更重要的是,不同科学家对相同文档对的注释高度一致。我们进一步表明,用于生成推荐文章以供评估的三种代表性基线方法(Okapi Best Matching 25、词频 - 逆文档频率和 PubMed 相关文章)具有相似的总体性能。此外,我们发现这些方法各自倾向于生成不同的推荐文章集合,这表明可能需要一种混合方法来完全捕获所有相关文章。位于 https://relishdb.ict.griffith.edu.au 的已建立数据库服务器可免费下载注释数据和盲测新方法。我们预计,该基准将有助于促进开发新的强大技术,用于生物医学研究中的相关文章的标题和基于标题/摘要的搜索引擎。
用于查找相关文献的文档推荐系统大多依赖于十年前开发的方法。这主要是因为缺乏一个涵盖各种研究领域的大型离线黄金标准相关文献基准,以便可以比较、改进新开发的文献检索技术并将其转化为实践。为了克服这个瓶颈,我们成立了 RE 相关文献搜索联盟,该联盟由来自 84 个国家的 1500 多名科学家组成,他们共同注释了超过 180,000 篇 PubMed 收录文章与其各自的种子(输入)文章的相关性。大多数注释都是由经验丰富的种子文章原作者提供的。收集到的数据涵盖了 76% 的所有唯一 PubMed 医学主题词描述符。在不同经验水平、研究领域或注释时间之间未观察到系统性偏差。更重要的是,不同科学家对相同文档对的注释高度一致。我们进一步表明,用于生成推荐文章以供评估的三种代表性基线方法(Okapi Best Matching 25、词频 - 逆文档频率和 PubMed 相关文章)具有相似的总体性能。此外,我们发现这些方法各自倾向于生成不同的推荐文章集合,这表明可能需要一种混合方法来完全捕获所有相关文章。位于 https://relishdb.ict.griffith.edu.au 的已建立数据库服务器可免费下载注释数据和盲测新方法。我们预计,该基准将有助于促进开发新的强大技术,用于生物医学研究中的相关文章的标题和基于标题/摘要的搜索引擎。
用于查找相关文献的文档推荐系统主要依赖于十年前开发的方法。这主要是由于缺乏涵盖各种研究领域的大量离线相关文档黄金标准基准,因此无法比较、改进新开发的文献检索技术并将其转化为实践。为了克服这一瓶颈,我们成立了 RE 相关文献文献搜索联盟,该联盟由来自 84 个国家的 1500 多名科学家组成,他们共同注释了超过 180,000 篇 PubMed 列出的文章与其各自的种子(输入)文章的相关性。大多数注释均由经验丰富的种子文章原作者提供。收集的数据涵盖了所有唯一 PubMed 医学主题词描述符的 76%。在不同经验水平、研究领域或注释时间上均未观察到系统性偏差。更重要的是,不同科学家对同一文档对的注释高度一致。我们进一步表明,用于生成推荐文章以供评估的三种代表性基线方法(Okapi Best Matching 25、词频 - 逆文档频率和 PubMed 相关文章)具有相似的总体性能。此外,我们发现这些方法各自倾向于生成不同的推荐文章集合,这表明可能需要混合方法来完全捕获所有相关文章。位于 https://relishdb.ict.griffith.edu.au 的已建立数据库服务器可免费下载注释数据和盲测新方法。我们期望该基准将有助于促进开发用于生物医学研究相关文章的标题和基于标题/摘要的搜索引擎的新型强大技术。
用于查找相关文献的文档推荐系统大多依赖于十年前开发的方法。这主要是因为缺乏一个涵盖各种研究领域的大型离线黄金标准相关文献基准,以便可以比较、改进新开发的文献检索技术并将其转化为实践。为了克服这个瓶颈,我们成立了 RE 相关文献搜索联盟,该联盟由来自 84 个国家的 1500 多名科学家组成,他们共同注释了超过 180,000 篇 PubMed 收录文章与其各自的种子(输入)文章的相关性。大多数注释都是由经验丰富的种子文章原作者提供的。收集到的数据涵盖了 76% 的所有唯一 PubMed 医学主题词描述符。在不同经验水平、研究领域或注释时间之间未观察到系统性偏差。更重要的是,不同科学家对相同文档对的注释高度一致。我们进一步表明,用于生成推荐文章以供评估的三种代表性基线方法(Okapi Best Matching 25、词频 - 逆文档频率和 PubMed 相关文章)具有相似的总体性能。此外,我们发现这些方法各自倾向于生成不同的推荐文章集合,这表明可能需要一种混合方法来完全捕获所有相关文章。位于 https://relishdb.ict.griffith.edu.au 的已建立数据库服务器可免费下载注释数据和盲测新方法。我们预计,该基准将有助于促进开发新的强大技术,用于生物医学研究中的相关文章的标题和基于标题/摘要的搜索引擎。
analyse topics, plan responses and organise research for academic writing and other assessment tasks effectively and efficiently find appropriate information sources and evaluate relevance to your needs use and manage information effectively to accomplish a specific purpose better manage your time understand your rights and responsibilities as a student at UNSW be aware of plagiarism, copyright, UNSW Student Code of Conduct and Acceptable Use of UNSW ICT Resources Policy be aware of UNSW社区中每个人期望的行为标准找到有关UNSW和UNSW Library
摘要背景:中药由数百种天然药物分子组成,在数千年的传统中医药中发挥着重要作用。因此,研究天然药物分子的靶点对探索中医药治疗疾病的机制具有重要意义。然而,由于药物分子与靶点相互作用的复杂性,确定一个新鲜的天然药物分子的靶点非常困难。与传统的生物实验相比,计算方法具有时间少、成本低的优势,但仍面临许多巨大的挑战,尤其是对于没有社会联系的分子。方法:本研究提出了一种基于余弦相关和局部网络相似性比较(CSLN)的新方法,对新鲜的天然药物分子进行靶点的初步筛选,并通过训练参数为它们分配权重。结果:在以药物分子为训练和测试对象的情况下,CSLN在金标准数据上的表现优于流行的药物-靶点相互作用(DTI)预测模型GRGMF。此外,CSLN 在 TCMSP 上对新鲜天然药物分子靶点筛选性能(情景模拟)的检测表现出色(top20 中有 13 个阳性样本),同时 Western-Blot 也进一步验证了 CSLN 的准确性。结论:综上所述,结果表明 CSLN 可以作为新鲜天然药物分子靶点筛选的替代策略。关键词:靶点筛选,新鲜天然药物分子,余弦相关,相似性比较,Western-Blot
深度神经网络作为小鼠视觉皮层模型的表现如何?迄今为止,大多数研究表明,结果远比灵长类动物视觉皮层建模的结果复杂得多。在这里,我们利用表征相似性分析和神经回归对小鼠视觉皮层中的数十个深度神经网络模型进行了大规模基准测试。利用艾伦大脑观测站的 2 光子钙成像数据集,记录了超过 6,000 个可靠的啮齿动物视觉皮层神经元对自然场景的反应,我们复制了以前的发现并解决了以前的差异,最终证明现代神经网络实际上可以比以前更合理地解释小鼠视觉皮层的活动。使用我们的基准作为图集,我们为有关分析水平的总体问题、有关最能预测整体视觉系统的模型属性的问题以及有关生物和人工表征之间映射的问题提供了初步答案。我们的研究结果为未来小鼠视觉皮层的深度神经网络建模提供了参考点,暗示了映射方法、架构和任务的新组合,以更全面地描述对神经科学如此重要的物种的视觉表征的计算主题,但其感知生理学和生态学与我们在灵长类动物中研究的有显著不同。
3,4-亚甲基二氧基甲基苯丙胺 (MDMA) 和苯丙胺是常用的精神兴奋剂。这些物质的非法制造主要位于荷兰和比利时,产生大量的化学废物,这些废物被处置在环境中或排放到下水道系统中。对高分辨率质谱 (HRMS) 数据进行了回顾性分析,以检测废水样品中 MDMA 和苯丙胺生产的合成标记物。具体而言,实施了可疑和非目标筛选,并结合基于检测到的特征与 MDMA 和苯丙胺质量负荷之间的相似性度量的优先级方法。2016 年至 2018 年期间,采用液相色谱-高分辨率质谱联用技术分析了从荷兰一家处理厂采集的 235 个 24 小时复合废水样品。样本最初根据 MDMA 和苯丙胺的每日摄入量分为两组(即基线消费组与倾倒组)。使用显著性检验和倍数变化来查找两组中特征之间的差异。然后,使用各种测量方法(欧几里得距离、皮尔逊相关系数、斯皮尔曼等级相关系数、距离相关和最大信息系数)调查整个时间序列中所有特征的峰面积与 MDMA 或苯丙胺摄入量之间的关联。这种无监督、无偏见的方法用于对特征进行优先排序,并允许选择 28 种假定的 MDMA 和苯丙胺生产标记。这些标记可能用于检测下水道系统中的倾倒处,有助于确定合成路线并追踪环境中的废物。