现代治疗方案中药物组合的增加需要可靠的方法来预测药物相互作用(DDIS)。虽然大型语言模型(LLMS)已重新提到了各个领域,但它们在药物研究中的潜力,尤其是在DDI预测中,仍然在很大程度上没有探索。这项研究通过唯一处理分子结构(微笑),靶生物和基因相互作用数据作为最新药品库数据集的原始文本输入来彻底研究LLMS在预测DDI方面的能力。我们评估了18种不同的LLM,包括专有模型(GPT-4,Claude,Gemini)和开源变体(从1.5B到72B参数),首先评估其在DDI预测中的零击功能。然后我们微调选定的模型(GPT-4,PHI-3.5 2.7b,QWEN-2.5 3B,GEMMA-2 9B和DEEPSEEK R1蒸馏QWEN 1.5B),以优化其性能。我们的全面评估框架包括对13个外部DDI数据集进行验证,并与传统方法(例如L2登记的逻辑回归)进行了比较。微型LLMS表现出卓越的性能,PHI-3.5 2.7b在DDI预测中达到0.978的灵敏度,在平衡数据集中的准确性为0.919(50%正,50%负案例)。此结果代表了用于DDI预测的零射击预测和最新的机器学习方法的改进。我们的分析表明,LLM可以有效地捕获复杂的分子相互作用模式和药物对以共同基因为目标的情况,从而使其成为药物研究和临床环境中实际应用的宝贵工具。
摘要:人们提倡智能制造系统利用技术进步,通过快速诊断提高故障抵御能力,从而保证性能。在本文中,我们提出了一种用于设计数字孪生(DT)的协同仿真方法,该方法用于训练贝叶斯网络(BN),以便在设备和工厂层面进行故障诊断。具体而言,协同仿真模型是使用由联网传感器、每台设备的高保真仿真模型和工厂的详细离散事件仿真(DES)模型组成的信息物理系统(CPS)设计的。所提出的 DT 方法能够在虚拟系统中注入故障,从而减轻了昂贵的工厂车间实验的需要。应该强调的是,这种注入故障的方法消除了获取包括故障和正常工厂操作的平衡数据的需要。我们在本文中提出了一种结构干预算法 (SIA),首先检测所有可能的有向边,然后区分 BN 的父节点和祖先节点。我们在实验室中设计了一个 DT 研究测试台,由配置成装配单元的四个工业机器人组成,每个机器人都有一个可以监测双轴振动的工业物联网传感器。这些机器人的详细设备级模拟器与机器人装配单元的详细 DES 模型集成在一起。生成的 DT 用于进行干预,以学习用于故障诊断的 BN 模型结构。实验室实验通过准确学习 BN 结构验证了所提方法的有效性,并且在实验中,发现所提方法获得的准确性(使用结构汉明距离测量)明显优于传统方法。此外,发现的BN结构对参数的变化是可靠的,例如平均失败时间(MTTF)
摘要 目的比较基于机器学习理论的6种模型的预测效果,为预测2型糖尿病(T2DM)风险提供方法学参考。 研究地点与对象 本研究基于2016—2018年东莞市居民慢性病危险因素监测数据。各监测点采用多阶段整群随机抽样的方法,最终抽取4157人。在初始人群中剔除缺失数据超过20%的个体,最终纳入4106人。采用设计K最近邻算法和合成少数过抽样技术对数据进行处理。采用单因素分析对变量进行初步筛选。采用10倍交叉验证对部分模型参数进行优化。以准确度、精确度、召回率和受试者工作特征曲线下面积(AUC)评价模型的预测效果,采用Delong检验分析各模型AUC值的差异。结果平衡数据后样本量增加至8013例,其中2型糖尿病患者4023例,对照组3990例。六种模型的比较结果显示,反向传播神经网络模型的预测效果最好,准确率、准确度、召回率分别为93.7%、94.6%、92.8%,AUC值为0.977,其次是logistic模型、支持向量机模型、CART决策树模型和C4.5决策树模型。深度神经网络的预测性能最差,准确率、准确度、召回率分别为84.5%、86.1%、82.9%,AUC值为0.845。结论本研究构建了6类2型糖尿病风险预测模型,并基于各项指标比较了这6种模型的预测效果,结果显示,基于所选数据集的反向传播神经网络的预测效果最好。
有效的矿物前景映射(MPM)依赖于机器学习(ML)模型从地球物理数据中提取有意义模式的能力。然而,在矿物探索中,与整体地质景观相比,鉴定矿藏的存在通常是罕见的事件。这种稀有性导致了高度不平衡的数据集,其中积极实例(矿化样品)的频率大大低于负面实例(非矿化样品)。不平衡的数据可能会使ML模型偏向多数类,从而导致对主要兴趣的少数类别(矿化样本)的预测不准确。为了应对这一挑战,我们在这项研究中提出了两级方法。在数据级别上,我们采用了在培训数据集上运行的不平衡数据处理技术并更改类分布。在算法级别上,我们调整了模型的决策阈值,以平衡误报和假否定性之间的交易。实验结果是根据芬兰拉普兰的地球物理数据收集的。数据集表现出明显的类别不平衡,包括17个正样本与1个。84×10 6负样本。我们研究了处理不平衡数据对四个ML模型的性能的影响,包括多层感知器(MLP),随机森林(RF),决策树(DT)和逻辑回归(LR)。从结果来看,我们发现MLP模型实现了最佳的总体表现,使用合成少数民族过采样方法,平衡数据的总准确度为97.13%。随机森林和DT也表现良好,精度分别为88.34%和89.35%。这项工作的实施方法是在QGI中集成为新工具包,称为MPM的EIS工具包1。
在卫生部门实施人工智能(AI)是卫生专业人员,患者,政策制定者和其他利益相关者提高运营效率和医疗保健成果的主要机会。AI在卫生系统中的许多应用已经被使用,并且越来越多的证据表明,AI系统能够显着影响诊断和治疗策略,包括卫生专业人员的决策方法,医师治疗关系以及预防疾病和卫生促进策略。这些需要强大的治理来解决相关的科学,技术,基础设施,法规,法律,安全,道德考虑以及文化障碍和挑战,以安全,安全和可信赖的方式实现AI的全部潜力。公平地访问数字技术,包括解决性别和年龄数字鸿沟,以及解决AI系统中的道德问题和潜在偏见,必须优先考虑,以避免增加不平等。这些努力必须包括确保对卫生专业人员,患者和卫生系统的其他利益相关者的支持,以获取所需的知识,技能和基础设施,以完全受益于这些最近的进步。还需要平衡数据安全性和隐私与促进创新。患者和医疗保健专业人员必须保持医疗决策的核心,并确保法规不会过于复杂,并且与可行的相关领域的现有方法保持一致。o ai可以赋予个人权力,并通过AI使用大量数据和临床证据的能力可以帮助卫生专业人员有效,有效地改善诊断,从个性化医学的角度优化护理途径和治疗,减少医疗误差,改善服务质量,包括疾病预防和健康促进服务,从而通过循证健康促进健康的方法来促进基于证据的健康方法,这些方法尊重国际标准和指南。存在简化工作流程并减轻医疗保健专业人员的行政负担,并为患者互动提供更多时间的机会。
联合学习是一种分散的方法,用于训练Glo-Bal机器学习模型而无需在参与者之间共享数据,并且它已成为必须保护有关各方数据的情况下存在的关键解决方案。这在数据驱动的预后,健康管理和异常检测系统中非常重要,因为关键数据所有权在几个原始设备制造商和运营商之间划分。但是,对这项技术的适当提出需要在基础架构上进行大量的前期投资,因为计算,能源和网络能力必须支持边缘上的增加负载,这代表了从集中式范式转移。尽管有这些要求,但汽车行业对这项技术作为协作推动者的潜力表现出了极大的兴趣。该技术的隐私益处得到了充分的认可,但是通常不加区分地使用它,而无需透彻考虑其适当性。为了使这一详细的系统映射进行了详细的系统文献映射,通过分析,我们就联合框架的使用方面的有效性提供了对预测性维护和自动行业中异常检测应用的特定挑战的见解。此外,我们通过确定对该技术实施确实有意义的汽车行业的现实世界应用来做出贡献。我们的研究测试了每个人如何响应不同的数据方案。这些发现突出了对量身定制方法的需求,以满足每个应用程序的独特需求。在此基础上,我们使用广泛采用的模型和聚合策略进行了实验分析,以评估在模拟现实世界条件的各种数据拆分配置下,在各种数据拆分配置下评估了Fedeed Learning的性能。结果表明,FedAvg在平衡数据方面的表现最佳,而FedProx在IMBA分布中表现出色,其正则化技术解决了问题。虽然联邦学习持有承诺,但其实施可能并不总是证明成本是合理的,尤其是如果FraMework仅解决了一些关键挑战时。裁缝联合配置可以优化汽车行业的预测性维护和异常检测,但是要仔细考虑有用性和基础设施成本,这对于长期成功而言是限制的。
摘要 准确识别可从有希望的治疗方法中受益的患者非常困难,这使得证明创伤性脑损伤 (TBI) 新疗法的有效性变得具有挑战性。尽管机器学习越来越多地应用于这项任务,但现有的二元结果预测模型不足以对 TBI 患者进行有效分层。本研究的目的是开发一个准确的三类结果预测模型,以便对患者进行适当的分层。为此,使用自 2018 年 1 月以来日本六家医院收治的 1200 名钝性 TBI 患者(每家机构 200 例连续病例)的回顾性平衡数据进行模型训练和验证。我们纳入了在急诊科获得的 21 个预测因子,包括年龄、性别、六项临床发现、四个实验室参数、八个计算机断层扫描结果和一项紧急开颅手术。我们开发了两种机器学习模型(XGBoost 和密集神经网络)和逻辑回归模型,以根据出院时的格拉斯哥预后量表扩展版 (GOSE) 预测三类结果。使用 n = 1000 的训练数据集开发预测模型,并使用引导法在验证数据集(n = 80)和测试数据集(n = 120)上进行两轮验证,评估其预测性能。在总共 1200 名患者中,患者年龄中位数为 71 岁,199 名(16.7%)患有严重 TBI,104 名患者(8.7%)接受了紧急开颅手术。住院时间中位数为 13.0 天。三级结果为 709 例患者(59.1%)恢复良好/中度残疾,416 例患者(34.7%)严重残疾/植物状态,75 例患者(6.2%)死亡。XGBoost 模型在最终验证中表现良好,灵敏度为 69.5%,准确率为 82.5%,受试者工作特征曲线下面积为 0.901。在受试者工作特征曲线分析方面,XGBoost 略胜于基于神经网络和逻辑回归的模型。特别是,XGBoost