摘要:最近的研究强调,人类Interactome中的大部分可毒蛋白靶标仍无法探索各种疾病。这可能会导致药物重新利用的研究,并有助于对新药 - 人类蛋白靶靶相互作用的内在预测。在全球健康问题中,Covid-19疾病的当前大流行也是如此。非常需要使用机器学习方法来确定Covid-19的潜在人类药物靶标,因为与传统的实验方法相比,它可以节省时间和劳动。基于结构的药物发现,其中通过分子对接确定可药物的性能仅适用于可获得三维结构的蛋白质。使用机器学习算法,可以将相关特征用于预测目标和非目标的相关特征,以用于其3-D结构不可用的蛋白质。在这项研究中,提出了一种基于机器学习的药物目标发现(ML-DTD)方法,其中最初在策划的数据集上建立和测试了机器学习模型,该模型由COVID-199的策划数据集组成,该模型由COVID-19S组成,由COVID的人类药物目标和非目标是使用治疗性数据库(TTD)和人类Interactome使用几个分类的X核构成X核构成的X粒子列表,而不是使用治疗性数据库(TTD)形成的非目标。回归,支持矢量分类,决策树分类,随机森林分类,天真的贝叶斯分类和k-neart的邻居分类(KNN)。在这种方法中,蛋白质特征包括基因集富集分析(GSEA)排名,源自蛋白质序列的特性以及基于蛋白质网络中心性的测量方法。在所有这些中,XGBBoost,KNN和随机森林模型是令人满意且一致的。该模型进一步用于预测新型的COVID-19人类药物靶标,该靶标通过目标途径分析,盟军重新塑造药物的出现以及随后的对接研究进一步验证。
背景:中风的患者的康复需要精确的个性化治疗计划。自然语言处理(NLP)提供了从临床笔记中提取有价值的锻炼信息的潜力,有助于制定更有效的康复策略。目的:本研究旨在开发和评估各种NLP算法,以从匹兹堡医学中心接受中风的患者的临床注释中提取和分类体育康复运动信息。方法:确定了13,605例被诊断为中风的患者的队列,并检索了含有康复治疗笔记的临床笔记。创建了一个全面的临床本体论,以代表身体康复运动的各个方面。最新的NLP算法,包括基于规则的基于机器学习的算法(支持向量机器,逻辑回归,梯度增强和ADABOOST)和大型语言模型(LLM)基于基于基于的算法(LLM)算法(CANTGPT [openai])。这项研究的重点是关键性能指标,尤其是F 1分钟,以评估算法有效性。结果:对包含23,724个注释的数据集进行了分析,并具有详细的人口统计学和临床特征。基于规则的NLP算法在大多数领域都表现出卓越的性能,尤其是在检测F 1秒为0.975的“右侧”位置时,表现优于0.063的梯度提升。梯度提升在“下肢”位置检测中表现出色(F 1 -SCORE:0.978),基于规则的NLP超过0.023。它在“被动运动范围”检测中还显示出显着的性能,F 1次0.970,比基于规则的NLP提高0.032。基于规则的算法有效地处理了“持续时间”,“ sets”和“ reps”,f 1得分高达0.65。基于LLM的NLP,尤其是少量提示的Chatgpt,获得了很高的召回率,但通常较低的精度和F 1分。然而,在“向后平面”运动检测中,它表现出色,达到0.846的F 1次,超过了基于规则的算法的0.720。
有人-无人协同 (MUM-T) 可定义为空中机器人 (人工智能体) 与人类飞行员 (自然智能体) 的协同,其中人类智能体不是权威控制者,而是合作的团队成员。据我们所知,尚无研究使用神经人体工程学方法 (即使用生理测量) 评估 MUM-T 场景对操作员心理工作量 (MW) 的影响,也未通过对这些测量进行分类来提供 MW 估计。此外,分类流程中很少考虑生理信号的非平稳性的影响,特别是在验证设计中。因此,本研究有两个目标:(i) 基于生理信号表征和估计 MUM-T 设置中的 MW;(ii) 评估验证程序对分类准确性的影响。在此背景下,开发了一个搜索和救援 (S&R) 场景,其中 14 名参与者扮演飞行员的角色,与三架 UAV(无人驾驶飞行器)合作。任务旨在诱发高和低 MW 水平,使用自我报告、行为和生理指标(即大脑、心脏和眼球运动特征)进行评估。基于这些生理特征的各种组合的监督分类管道进行了基准测试,并比较了两种验证程序(即不考虑时间的传统程序与考虑时间的生态程序
摘要:电子,认知计算和传感的大规模现代技术革命为当今物联网(IoT)的开发提供了关键的基础架构,以用于广泛的应用。但是,由于端点设备的计算,存储和通信功能有限,因此物联网基础架构暴露于广泛的网络攻击中。因此,darknet或黑洞(污水坑)攻击很大,并且最近针对多种物联网通信服务发射的攻击向量。由于DarkNet地址空间是作为保留的Internet地址空间演变而来的,在全球合法的主机上不考虑使用,因此任何通信运输IC都被推测为未经请求的,并且独特地认为是探测器,反向散射或错误概括。因此,在本文中,我们在物联网网络中开发,调查和评估基于机器学习的DarkNet流量检测系统(DTD)的性能。主要是,我们使用六种监督的机器学习技术,包括行李决策树的合奏(BAG-DT),ADABOOST决策树共制(ADA-DT),RUSBOOSTED决策树组合(RUS-DT),可优化的决策树(O-DT),可优化的k-nearest k-nearest Inloes noest(O-nearest ofignize k-nearest nearp-egrigheat(o-o-knn)和Optim optig optig optim difcs和optigs ivciminant(Outigizigriminant(O-DSC))和DSC。我们在最近且全面的数据集上评估了已实施的DTD模型,称为CIC-Darknet-2020数据集,该数据集由当代实际的实际IoT通信流量组成,其中涉及四个差异类别,这些类别在一个数据集中结合了VPN和Tor Trapl IC,其中涵盖了涵盖广泛捕获的Cyber-Attacts和Deampersshide Serpect Service的单个数据集。我们的经验绩效分析表明,与其他实施的监督学习技术相比,Bagging集成技术(BAG-DT)更高的准确性和更低的错误率,得分为99.50%的分类精度,低推断开销为9.09 µ秒。最后,我们还与其他现有的DTDS型号进行了对比,并证明我们的最佳结果比以前的最新模型改善了(1.9〜27%)。
多发性硬化症 (MS) 以不可预测的速度发展,但预测每位患者的病程对于根据个人需求制定治疗方案极为有用。我们探索了不同的机器学习 (ML) 方法来预测患者是否会从最初的复发缓解型 (RR) 转变为继发进行型 (SP) 疾病,这种方法仅使用临床常规中可用的“真实世界”数据。使用了 1624 名门诊患者(SP 阶段为 207 名)的临床记录,这些患者就诊于意大利罗马圣安德烈亚医院的 MS 服务中心。考虑最后一次可用就诊的数据(面向就诊设置),比较四种经典 ML 方法(随机森林、支持向量机、K 最近邻和 AdaBoost)或每位患者的整个临床病史(面向历史设置),使用专为历史数据设计的循环神经网络模型,获得了距离上次就诊 180、360 或 720 天的预测结果。缺失值的处理方式是删除所有至少有一个缺失参数的临床记录(特征保存方法)或包含缺失值的 3 个临床参数(记录保存方法)。分类器的性能使用常见指标进行评估,例如召回率(或敏感度)和精确度(或阳性预测值)。在面向访问的设置中,记录保存方法产生的召回率为 70% 到 100%,但精确度较低(5% 到 10%),然而,当仅考虑模型返回概率高于给定“置信阈值”的预测时,精确度会增加到 50%。对于面向历史的设置,这两个指标都会随着预测时间的延长而增加,在 720 天时达到 67%(召回率)和 42%(精确度)。我们展示了如何有效地使用“真实世界”数据来预测 MS 的发展,从而获得高召回率,并提出了创新方法来提高精确度以获得临床有用的值。
抽象有效的维护预测对于确保工业机械的运行连续性和寿命至关重要。本文对机器维护预测的任务进行了对机器学习算法的比较分析。通过严格的实验和评估,我们评估了包括Adaboost,随机森林,梯度增强和Sup-Port Vector Machines(SVM)在内的算法的性能。此外,为了提高预测精度,我们将优化器算法(杜鹃搜索)集成到我们的框架中。此优化技术微调算法参数,进一步提高了准确性。我们的发现为优化机器维护预测提供了宝贵的见解,通过积极的维护策略赋予行业能力,以减轻停机时间并提高生产率。关键字:机器学习模型,随机森林,克雷鱼,优化器,维护。简介小节样本预测维护已成为希望优化其操作,最小化停机时间并降低维护成本的行业的关键策略。通过利用高级数据分析和Ma-Chine学习技术,公司可以预测何时可能发生设备故障,从而实现主动维护干预措施。开发的预测维护软件利用了从计算机数据集派生的四个选定功能的实时数据。这些功能是机器健康和性能的指标。此优化技术有助于微调模型参数,以证明其预测精度和整体性能。通过实时连续监视这些功能,软件可以评估机器的当前状态并预测是否需要维护。为了确保准确的预测,比较和评估了各种分类技术,以确定最有效的模型。这涉及分析不同算法的性能,例如神经网络,决策树,SVM和随机森林等。通过严格的测试和验证,选择了最高表现的模型以在预测维护应用中实现。除了选择最佳分类技术外,使用小龙虾优化器进一步提高了模型的效率。通过利用小龙虾运算层的功能,该软件可以在预测维护需求方面获得更高的精度和可靠性。
背景:产后出血(PPH)是一种严重的并发症,是孕产妇死亡率后的原因。这项研究使用机器学习算法和新功能选择方法来构建有效的PPH风险预测模型,并为PPH风险管理提供了新的想法和参考方法。方法:从2021年1月1日至2022年3月30日在温州人民医院分娩的妇女的临床数据进行了追溯分析,并根据失血量将妇女分为一个高血病组(337例患者)和低血病组(431例)。使用特征选择方法,例如递归功能消除(RFE),交叉验证(RFECV)(RFECV)和SelectkBest,以及以建立预测模型,使用特征选择方法,例如递归功能消除(RFE),递归功能消除,并识别来自多个临床变量中与产后出血相关的特征。结果:对于所有女性,与产后出血相关的特征是“年龄”,“新生体重”,“妊娠周”,“围产裂缝”和“剖腹产”。由随机森林分类器建立的预测模型表现最佳,F1得分为0.73,曲线下的面积为0.84。对于接受剖腹产或阴道分娩的妇女,与产后出血风险相关的特征不同。接受剖腹产的妇女产后出血的危险因素是“年龄”,“平等”,“早产”和“ Placenta Previa”。由随机森林分类器建立的预测模型表现最佳,F1值为0.96,AUC为0.95。阴道分娩女性产后出血的危险因素是“年龄”,“奇偶校验”,“妊娠周”,“糖尿病”,“辅助繁殖”,“高血压(前宾夕法尼亚)”和“多重怀孕”。由Adaboost分类器建立的预测模型表现最佳,F1值为0.65,AUC为0.76。结论:机器学习算法可以有效地识别与临床变量产后出血风险相关的特征,并建立准确的预测模型,为临床医生提供一种新颖的方法,以评估和预防产后出血的风险并防止产后出血。
面对不育的发生率的增加,这十年在全球辅助生殖技术的应用中急剧上升[1,2]。体外受精(IVF)是艺术中最常见和广泛使用的程序,是在体外繁殖胚胎的过程,如果成功,则会导致妊娠。自1978年第一个IVF婴儿诞生以来[3],已经努力改善IVF的成功。然而,成功率在约30%[4,5]的情况下保持了大约恒定的恒定,这加上严重的副作用[6,7]和经济负担[8,9],使父母成为不育夫妇的漫长道路。IVF失败也会带来情绪困扰,例如焦虑和压力,这可能会影响生活质量,甚至导致婚姻失败[10,11]。这使得“我的IVF成功有多大的可能性?”成为寻求治疗的推论夫妇最重要的问题。通常,要回答这个问题,IVF临床医生需要考虑与男性和男性相关的所有人口和临床变量。具有各种变量及其复杂关系,提供了对成功机会的准确估计是具有挑战性的。因此,需要准确的模型来准确预测IVF成功[12,13]。机器学习(ML)作为人工智能的一个子集可以通过基于这些促成因素开发预测模型来预测临床结果。强大的预测模型可以使IVF临床医生更准确地估计IVF成功结果。至关重要的是要认识到,任何预测模型的鲁棒性主要取决于两个关键因素:机器学习算法的选择以及选择最有助于和信息的特征[14,15]。特征选择通过识别最重要的特征在增强模型性能中起着关键作用。但是,将正确的特征集与正确的ML算法相结合[16,17]仍然是一种挑战。虽然各种研究应用了机器学习技术来开发IVF预测模型,但许多研究依赖于特征选择的滤波器方法[18-22],这些方法通常忽略了变量之间的复杂相互作用,并且无法捕获IVF数据中固有的复杂关系[23,24]。在这项研究中,我们介绍了遗传算法,作为一种可探索整个溶液空间的强大包装算法,动态识别有助于IVF成功预测的最佳子集。这种方法比传统的过滤方法更灵活,更有效,因为它解释了功能之间的复杂交互。我们从系统地比较了五个知名机器学习算法的性能 - 兰多森森林(RF),人工神经网络(ANN),支持向量机(SVM),递归分区和回归树(RPART)和ADABOOST - 预测IVF的表现。通过应用基于GA的功能选择来增强此比较。通过将GA选择功能选择与上述机器学习技术相结合,我们试图为IVF成功开发一个可靠的预测模型,从而比依赖传统特征选择方法的现有模型提供了潜在的改进。