欢迎阅读 Pharmaprojects 对 2024 年制药研发趋势的回顾。30 多年来,我每年都会关注制药研发的发展,在本文中,我将在 2024 年初了解该行业的状况。我们将通过检查公司、治疗领域、疾病、目标和药物类型的产品线来评估行业趋势,主要使用来自 Pharmaprojects 的数据,Pharmaprojects 是 Citeline 产品套件的一部分,自 1980 年以来一直在跟踪全球药物开发。本报告将发布我们的年度补充报告,回顾刚刚过去的一年推出的新活性物质 (NAS)。但在这里,我们将研究制药研发环境是如何变化的,看看压力在哪里上升和下降,并试图确定哪里前景光明,哪里乌云密布。希望它能帮助您了解行业的温度并预测其前景。
背景:黑色素瘤是起源于黑色素细胞的皮肤恶性肿瘤,主要通过手术、化疗、靶向治疗、免疫治疗、放射治疗等治疗。靶向治疗是治疗晚期黑色素瘤的一种有前途的方法,但总是会发生耐药性。本研究旨在利用计算方法有效地识别耐药黑色素瘤的潜在靶基因和候选药物。方法:使用文本挖掘工具 pubmed2ensembl 识别与耐药黑色素瘤相关的基因。通过 GO 和 KEGG 通路富集分析进行进一步的基因筛选。使用 STRING 数据库和 Cytoscape 构建 PPI 网络。使用 GEPIA 进行生存分析并绘制 Kaplan-Meier 曲线。在 Pharmaprojects 中筛选出针对这些基因的药物。利用 DeepPurpose 预测了药物-靶标相互作用的结合亲和力得分。结果:通过文本挖掘共发现 433 个与耐药黑色素瘤相关的基因。 GO和KEGG分析中统计学差异最大的功能富集通路包含348个基因,通过Cytoscape中的MCODE进一步筛选出27个枢纽基因。经过生存分析和文献综述,鉴定出6个具有统计学差异的基因。在限制条件下,利用Pharmaprojects找到了16个针对枢纽基因的候选药物。最终,利用DeepPurpose预测出11个亲和力得分最高的ERBB2靶向药物,包括10个ERBB2激酶抑制剂和1个抗体-药物偶联物。结论:文本挖掘和生物信息学是药物发现中基因识别的有效方法。DeepPurpose是一种高效、可操作的深度学习工具,可用于预测DTI和选择候选药物。
继我们对 2024 年当前制药研发渠道趋势的回顾(点击此处免费下载报告)之后,本补充报告着眼于 2023 年该行业的成功案例——当年首次上市的药物。我们的调查仅关注新活性物质 (NAS):活性成分未获得人类使用批准的新化学或生物实体。这还包括具有新型抗原成分的疫苗。因此,此列表代表了 Pharmaprojects 在 2023 年报告的所有首次上市药物的子集,不包括另外 68 种重新配制或非 NAS 部分、生物仿制药和成像剂的首次上市药物。因此,为了继续我们今年制药研发报告的气象主题,本补充报告将重点关注那些在刚刚过去的一年里经受住临床试验和监管部门批准风暴,一闪而过、进入市场的药物。
*Other/unknown vector type used to generate the cell therapy **Other/unknown includes immune cells such as dendritic cells and natural killer cells, CAR-M, CAR-B and other cells such as skin, tumor and muscle cells ***Stem cells primarily includes hemopoietic stem cells, mesenchymal stem cells and induced pluripotent stem cells ^Other therapeutic areas include cardiology, dermatology, hematology, infectious disease and没有特定治疗区域的资产^^主要五只血都是B-NHL,AML,多发性骨髓瘤和慢性淋巴细胞性白血病:CAR-M = CAR-M =嵌合抗原受体巨噬细胞; CAR-B =嵌合抗原受体B细胞; til =肿瘤浸润淋巴细胞; TCR = T细胞受体; CAR-T =嵌合抗原受体T细胞; gi =胃肠道;全部=急性淋巴细胞性白血病; B-NHL = B细胞非霍奇金淋巴瘤; AML =急性髓细胞性白血病来源:L.E.K.分析Citeline的药物数据库
药物发现和开发过程漫长而昂贵,平均每种药物花费超过 10 亿美元,耗时 10 至 15 年。为了减少整个过程中的高损耗,近十年来,人们对将机器学习方法应用于药物发现和开发的各个阶段的兴趣日益浓厚,尤其是在最早的阶段——识别可用药的疾病基因。在本文中,我们开发了一种新的张量分解模型来预测治疗疾病的潜在药物靶标(基因或蛋白质)。我们使用从 Open Targets 和 PharmaProjects 数据库中提取的数据,创建了一个三维数据张量,包含 1,048 个基因靶标、860 种疾病和 230,011 个证据属性以及将它们联系起来的临床结果。我们利用从面向药物发现的知识图谱中学习到的基因靶标表示丰富了数据,并应用我们提出的方法来预测未知基因靶标和疾病对的临床结果。我们设计了三种评估策略来衡量预测性能,并对几种常用的机器学习分类器以及贝叶斯矩阵和张量分解方法进行了基准测试。结果表明,结合知识图谱嵌入可显著提高预测准确性,并且训练张量分解和密集神经网络的效果优于所有其他基线。总之,我们的框架结合了两种积极研究的机器学习方法来识别疾病目标,即张量分解和知识图谱表示学习,这可能是进一步探索数据驱动药物发现的有希望的途径。
数据和分析我们将NewDigs焦点焦点分析模型(PAM)1的临床试验成功率以及持久细胞和基因疗法(DCGT)的总体可能性与所有治疗领域的临床试验成功率与所有治疗领域的临床试验成功率,这些临床试验的临床试验成功率与某些方面的某些领域以及与某些方面的某些临床模态相关。PAM模型分析了1988年至2023年底在ClinicalTrials.gov中报道的所有DCGT试验,其中包括使用或修改DNA或RNA的产品,并旨在提供持续持续的单个管理的持久效果。我们广泛应用了FDA生物制剂评估与研究中心(CBER)的定义,并具有进一步的标准,即预计产品将产生至少18个月的持久临床益处。4合格耐用的疗法是属于以下方式的方法:(i)使用病毒载体的体内和Ex Vivo的基因替代疗法; (ii)T细胞受体(TCR)和免疫细胞设计,旨在掺入嵌合抗原受体(CAR),(iii)基因编辑疗法(基于锌指核酸酶(ZFN),转录激活剂样效应子核酸酸盐(TALENS),且属于Spracted Spress Sprace Sprace Sprace Spracted Palindromic repoins(Caspr)(CRIS)(CRIS)(CRIS)(CRIS) - (iv)长效DNA质粒。首先使用Pharmaprojects®数据库5中的治疗类别和模态搜索标准鉴定临床试验,然后使用临床研究确认。GOV数据库6使用自然语言处理,手动搜索和提取的组合。我们还仅从ClinicalTrials.gov中确定了其他临床试验。仅包括具有以下状态的数据库(包括I/II阶段II/II阶段,包括II/II期;包括II/II期和III期试验,包括II/II期;包括II/II期;包括II/II期;包括II阶段I/II阶段II/II期)的主动介入试验:招募,主动,不通过邀请招募,招募,招募,并完成)。在临床试验研究多个潜在指示的情况下,我们单独跟踪并投影了每个产品指示组合。同样,我们跟踪了一个具有多个临床试验的药物,以单独进行不同的适应症。在存在特定产品指示的并发主动试验的情况下,选择最高阶段以表示分析的产品指示。我们排除了由中国开发商注册的临床临床试验,所有注册的试验地点都位于中国,没有国际商业合作伙伴的记录,因为我们认为这些产品是为当地市场开发的,不可能向美国FDA批准提交这些产品。我们的数据集包括从2023年12月31日开始或之前进行的所有确定的合格疗法,并进行了主动临床试验。还包括注册,启动和完整的响应信。然后,我们将所有确定的试验的数据加载到含宏观的Excel纸上,将数据解析为药物,疾病,试验,相位,模态,以及时间开始和结束每个阶段的时间。在一个阶段的成功是在试验开始阶段,完成该阶段的时候,然后继续进行新阶段或注册/启动步骤。Excel宏可评估每个阶段的每个药物指示的开始和结束日期,标记是否正在进行或完成阶段试验,或者是否启动了新阶段。失败是具有开始,完整的阶段的试验,然后在11年内不会发展到新阶段,或者被公开宣布为停产的指示或计划。我们没有将试验仍在进行中作为成功或失败,并且直到阶段结束并转移到进展或不进行之前,我们才将它们包括在分母中。为了进行此分析,我们将所有数据保存到2023年12月31日的截止点;尚未计算此截止后的任何新阶段或现有阶段完成的任何进展。应该注意的是,鉴于可用于DCGT的临床试验的非常小的患者人群,通常会合并临床试验阶段。例如,有67%的孤儿基因治疗试验从I/II期开始。 血液学汽车 - 始于30%的程序I/II阶段。 并非所有试验都线性进展(例如,第一阶段,第二阶段,第三阶段,注册,批准)。 虽然很少见,但试验可以跳过阶段,如果它们发展到更高的水平,仍然可以被认为是成功的。 通过将进展到下一个临床试验阶段的试验数(包括NDA或BLA的提交和/或接受市场批准)的试验数量除以每个阶段的总计试验,从而计算了临床试验进度的每个阶段的成功率。 例如,如果有一百个I期试验的完整状态,我们将研究下一个状态,以确定试验是否发展为I/II期或II期。例如,有67%的孤儿基因治疗试验从I/II期开始。血液学汽车 - 始于30%的程序I/II阶段。并非所有试验都线性进展(例如,第一阶段,第二阶段,第三阶段,注册,批准)。虽然很少见,但试验可以跳过阶段,如果它们发展到更高的水平,仍然可以被认为是成功的。通过将进展到下一个临床试验阶段的试验数(包括NDA或BLA的提交和/或接受市场批准)的试验数量除以每个阶段的总计试验,从而计算了临床试验进度的每个阶段的成功率。例如,如果有一百个I期试验的完整状态,我们将研究下一个状态,以确定试验是否发展为I/II期或II期。在此示例中,如果三十五阶段试验随后转移到下一阶段,我们将其视为“成功”。在此示例中,第一阶段的成功率将为35%。由于开发人员有时会停滞不前或以其他方式延迟试验,因此我们从完整身份之日起多达11年