现代治疗方案中药物组合的增加需要可靠的方法来预测药物相互作用(DDIS)。虽然大型语言模型(LLMS)已重新提到了各个领域,但它们在药物研究中的潜力,尤其是在DDI预测中,仍然在很大程度上没有探索。这项研究通过唯一处理分子结构(微笑),靶生物和基因相互作用数据作为最新药品库数据集的原始文本输入来彻底研究LLMS在预测DDI方面的能力。我们评估了18种不同的LLM,包括专有模型(GPT-4,Claude,Gemini)和开源变体(从1.5B到72B参数),首先评估其在DDI预测中的零击功能。然后我们微调选定的模型(GPT-4,PHI-3.5 2.7b,QWEN-2.5 3B,GEMMA-2 9B和DEEPSEEK R1蒸馏QWEN 1.5B),以优化其性能。我们的全面评估框架包括对13个外部DDI数据集进行验证,并与传统方法(例如L2登记的逻辑回归)进行了比较。微型LLMS表现出卓越的性能,PHI-3.5 2.7b在DDI预测中达到0.978的灵敏度,在平衡数据集中的准确性为0.919(50%正,50%负案例)。此结果代表了用于DDI预测的零射击预测和最新的机器学习方法的改进。我们的分析表明,LLM可以有效地捕获复杂的分子相互作用模式和药物对以共同基因为目标的情况,从而使其成为药物研究和临床环境中实际应用的宝贵工具。
主要关键词