方法:我们选择了越南中部地区疾病负担较重的七种传染病类别:蚊媒疾病、急性胃肠炎、呼吸道感染、肺结核、败血症、原发性神经系统感染和病毒性肝炎。我们开发了一套问卷,收集疑似传染病患者的当前症状和病史信息。我们使用从 1,129 名患者收集的数据来开发和测试诊断模型。我们使用 XGBoost、LightGBM 和 CatBoost 算法来创建用于临床决策支持的人工智能。我们使用 4 倍交叉验证方法来验证人工智能模型。经过 4 倍交叉验证后,我们在单独的测试数据集上测试了人工智能模型,并估计了每个模型的诊断准确性。
结果:基于临床数据的模型包含年龄,性别和IL-6,而RandomForest算法则达到了最佳学习模型。确定了CT图像的两个关键放射线特征,然后用于建立放射线模型,发现Logistic算法的模型是最佳的。多模型模型包含年龄,IL-6和2个放射线特征,最佳模型来自LightGBM算法。与最佳的临床或放射线学模型相比,最佳的多模型模型具有最高的AUC值,准确性,灵敏度和负预测值,并且在外部测试数据集中还验证了其“优惠性能”(准确性= 0.745,敏感性= 0.900)。此外,多模型模型的性能优于放射科医生,NGS检测和现有机器学习模型的性能,其精度分别为26%,4和6%。
MACHINE LEARNING ALGORITHM • Training set: HCUP data from 2017 to 2018 • Test set: HCUP data in 2019 • Algorithm: Tree-based gradient boost framework (LightGBM) • Feature selection: L1 penalty • Hyperparameter tuning: Learning rate, number of leaves, minimum sum of instance weight (Hessian), frequency of subsample, subsample ratio of columns, L1 penalty, and the scale of positive and negative weight.•首先对超参数进行筛选,并使用贝叶斯搜索进行优化。•不平衡分类:成本敏感的学习•交叉验证:5倍分层的交叉验证•阈值:Youden的J统计量•分类性能指标:平衡精度; F2分数;接收器操作曲线(AUROC)下方; Precision-Recall曲线(AUPRC)下的区域
摘要这篇全面的评论探讨了集合机器学习技术在定量结构 - 活性关系(QSAR)建模中的关键作用。它强调了准确的QSAR模型在简化候选化合物选择方面的重要性,并突出了合奏方法,包括Adaboost,梯度增强,随机森林,额外树木,XGBoost,LightGBM和Catboost的重要性,有效地解决了诸如过度拟合和噪声数据的挑战。该评论介绍了集合学习在QSAR内的分类和回归任务中的最新应用,从而在不同的数据集和目标属性中展示了这些技术的出色预测准确性。它还讨论了整体QSAR建模中的关键挑战和考虑因素,包括数据质量,模型选择,计算资源和过度拟合。审查概述了集成QSAR建模的未来方向,包括多模式数据的集成,解释性,处理不平衡的数据,自动化和个性化医学应用,同时强调了在此演变领域中对伦理和监管指南的需求。
13方法:本研究使用模仿IV数据库分析重症监护患者的结果,14个重点是成人败血症病例。采用最新的数据提取工具,例如Google Big-15查询,并且按照严格的选择标准,我们在本研究中选择了38个功能。此选择16还通过全面的文献综述和临床专业知识来告知。数据预处理17包括处理丢失值,重组分类变量以及使用合成Mi-18诺元过采样技术(SMOTE)来平衡数据。我们评估了几种机器19学习模型:决策树,梯度提升,XGBOOST,LIGHTGBM,多层观察者20 TRON(MLP),支持向量机(SVM)和随机森林。使用了顺序减半和21个分类(SHAC)算法进行高参数调整,并且使用了火车测试拆分22和交叉验证方法来进行性能和计算效率。23
背景:血管内治疗(EVT)被建议作为治疗颅内动脉瘤的优越方式。然而,患有EVT的动脉瘤性蛛网膜下腔出血(ASAH)患者的功能结果较差仍然存在。因此,迫切需要研究风险因素并在此类患者的亚型中开发关键的决策模型。方法:我们从正在进行的注册表队列研究Prosah-MPC中提取了目标变量,该研究是在中国多个中心进行的。我们将这些患者随机分配给培训和验证队列,比为7:3。单变量和多元逻辑回归以找到潜在因素,然后开发了具有优化变量的九个机器学习模型和堆栈集合模型。通过多个指标评估了这些模型的性能,包括接收器操作特征曲线(AUC-ROC)下的区域。我们进一步使用Shapley添加说明(SHAP)方法,基于最佳模型的特征可视化分布。结果:总共招募了226名经历EVT的较差ASAH的合格患者,而89(39.4%)的12个月结果较差。年龄(调整或[AOR],1.08; 95%CI:1.03–1.13; P = 0.002),蛛网膜下腔出血体积(AOR,1.02; 95%CI:1.00-1.05; P = 0.033; P = 0.033; P = 0.033),神经外神经社会级联盟,Wornurosurgical Societies等级(wfns)(W ffns)(w ffns)(w ffns)(w ffns)(2.03)(aor c)(2.03); 1.05–3.93; p = 0.035)和狩猎级别(AOR,2.36; 95%CI:1.13–4.93; p = 0.022)被确定为不良结果的独立风险因素。NCT05738083。然后,开发的预测模型表明,LightGBM算法在验证队列中的AUC-ROC值为0.842,而Shap结果表明年龄是影响功能结果的最重要的风险因素。结论:LightGBM模型在促进患有不良后果风险的贫困级ASAH患者的风险分层方面具有巨大的潜力,从而增强了临床决策过程。试用注册:Prosah-MPC。2022年11月16日注册 - 回顾性注册,https:// clinical trials.gov/study/nct05738083。关键词:颅内动脉瘤,蛛网膜下腔出血,血管内手术,机器学习,预后
摘要:本研究深入研究了机器学习技术以分析蒸汽平台上的游戏受欢迎程度。Utilizing a diverse array of algorithms such as logistic regression, Support Vector Machine (SVM) , decision tree, Gradient Boosting (XGBoost) , Light Gradient Boosting Machine (LightGBM or LGBM), Deep Neural Networks (DNNs), and Convolutional Neural Networks (CNN), the research focuses on predicting game popularity through a thorough analysis of the Steam game dataset.该报告精心概述了数据准备的阶段,包括数据清洁和功能工程,然后构建各种预测模型及其后续的性能评估。值得注意的是,LGBM具有明显的优势,其精度为88.17%,AUC为80.36%。对Steam游戏的调查不仅在战略规划和减轻风险中艾滋病游戏开发人员和公司,而且还为玩家社区管理员增强社区管理提供了宝贵的见解。全面的方法强调了机器学习在解释游戏行业内的市场趋势和玩家偏好方面的重要潜力。
1。Alexandre Gramfort,Martin Luessi,Eric Larson,Deni A. Engemann,Strohmeier Daniel,Christian Brodbeck,Roman Goj,Mainak Jas,Brooks,Lauri和Matti S.任何Python的Mne-Python。神经科学的前线,7(267):1-13,2013。2。Cabanero-Gome,L.,Hervas,R.,Constance,I。和Rodrig-Benite,L。(2021)。eglib:用于EEG提取的Python模块。3。 Head,T.,Mechcoder,G。L.,&Shcherbatyi,I。 (2018)。 skikit-optimize:v0。 5.2。 版本V0,5 4。 Joel,D。,Berman,Z (2015)。 人脑。 112(50),15468-15473。 5。 Go,G.,Meng,Q.,Finy,T.,T.,Chen,W.,W.,W.,... Liu,T.-Y. (2017)。 LightGBM:高速公路激动人心的梯度。 神经信息系统的进步,30,3146–3154 6。 Phillips,Opery,A。K.,Hsu,V.,Ollila,H。M.,Hillary,R。P.,R.,R。,J。,J.&Singh,M。K.(2019)。 超越二元类别的性别:对不同差异,心理病理学和基因型的检查。 Sychiatry Academy,58(8),787-798。 7。 TOOLE,JM和BOYLAN,G。B. (2017)。 neral:新生儿脑电图的定量特征使用matlab。3。Head,T.,Mechcoder,G。L.,&Shcherbatyi,I。(2018)。skikit-optimize:v0。5.2。版本V0,5 4。Joel,D。,Berman,Z (2015)。 人脑。 112(50),15468-15473。 5。 Go,G.,Meng,Q.,Finy,T.,T.,Chen,W.,W.,W.,... Liu,T.-Y. (2017)。 LightGBM:高速公路激动人心的梯度。 神经信息系统的进步,30,3146–3154 6。 Phillips,Opery,A。K.,Hsu,V.,Ollila,H。M.,Hillary,R。P.,R.,R。,J。,J.&Singh,M。K.(2019)。 超越二元类别的性别:对不同差异,心理病理学和基因型的检查。 Sychiatry Academy,58(8),787-798。 7。 TOOLE,JM和BOYLAN,G。B. (2017)。 neral:新生儿脑电图的定量特征使用matlab。Joel,D。,Berman,Z(2015)。人脑。112(50),15468-15473。5。Go,G.,Meng,Q.,Finy,T.,T.,Chen,W.,W.,W.,... Liu,T.-Y. (2017)。 LightGBM:高速公路激动人心的梯度。 神经信息系统的进步,30,3146–3154 6。 Phillips,Opery,A。K.,Hsu,V.,Ollila,H。M.,Hillary,R。P.,R.,R。,J。,J.&Singh,M。K.(2019)。 超越二元类别的性别:对不同差异,心理病理学和基因型的检查。 Sychiatry Academy,58(8),787-798。 7。 TOOLE,JM和BOYLAN,G。B. (2017)。 neral:新生儿脑电图的定量特征使用matlab。Go,G.,Meng,Q.,Finy,T.,T.,Chen,W.,W.,W.,... Liu,T.-Y.(2017)。LightGBM:高速公路激动人心的梯度。神经信息系统的进步,30,3146–3154 6。Phillips,Opery,A。K.,Hsu,V.,Ollila,H。M.,Hillary,R。P.,R.,R。,J。,J.&Singh,M。K.(2019)。 超越二元类别的性别:对不同差异,心理病理学和基因型的检查。 Sychiatry Academy,58(8),787-798。 7。 TOOLE,JM和BOYLAN,G。B. (2017)。 neral:新生儿脑电图的定量特征使用matlab。Phillips,Opery,A。K.,Hsu,V.,Ollila,H。M.,Hillary,R。P.,R.,R。,J。,J.&Singh,M。K.(2019)。超越二元类别的性别:对不同差异,心理病理学和基因型的检查。Sychiatry Academy,58(8),787-798。 7。 TOOLE,JM和BOYLAN,G。B. (2017)。 neral:新生儿脑电图的定量特征使用matlab。Sychiatry Academy,58(8),787-798。7。TOOLE,JM和BOYLAN,G。B.(2017)。neral:新生儿脑电图的定量特征使用matlab。ARXIV预印型ARXIV:1704.05694。Vinck,M.,Oostenveld,R.,Van Wingerden,M.,Battaglia,F。,&Pennartz,C。M.(2011)。 在存在体积传导,噪声和样品大小偏置的情况下,改进了相结合的相同步指数。 Neuroimage,55(4),1548-1565。 8。 Zhang,C.,Dougherty,C.C.,Baum,S.A.,White,T。,&Michael,A。M.(2018)。 功能连通性预测性别:静止大脑连通性中性别差异的证据。 人类脑图,39(4),1765-1776。Vinck,M.,Oostenveld,R.,Van Wingerden,M.,Battaglia,F。,&Pennartz,C。M.(2011)。在存在体积传导,噪声和样品大小偏置的情况下,改进了相结合的相同步指数。Neuroimage,55(4),1548-1565。8。Zhang,C.,Dougherty,C.C.,Baum,S.A.,White,T。,&Michael,A。M.(2018)。 功能连通性预测性别:静止大脑连通性中性别差异的证据。 人类脑图,39(4),1765-1776。Zhang,C.,Dougherty,C.C.,Baum,S.A.,White,T。,&Michael,A。M.(2018)。功能连通性预测性别:静止大脑连通性中性别差异的证据。人类脑图,39(4),1765-1776。
摘要 - 医疗保险欺诈是一个重大问题,对医疗保险系统的完整性构成威胁,从而导致了大量的财务损失并可能损害患者的护理。应对这一挑战,机器学习模型的利用已成为检测和防止Medicare内部欺诈活动的有前途的方法。本研究论文提出了一种用于检测医疗保健提供者欺诈的机器学习方法。该方法涉及利用机器学习算法来分析包含有关计费模式,患者人口统计学,服务类型和地理位置的信息的不同数据集。通过在标有欺诈实例的标签数据上训练模型,它学习识别指示欺诈行为的模式和异常。这项研究的主要发现包括能够准确检测医疗保健提供者欺诈的机器学习模型的成功开发。在训练和看不见的数据上测试时,模型表明了高精度,回忆和准确性率,表明其稳健性和有效性。索引术语 - 医疗保险欺诈,机器学习,欺诈检测,支持向量机,逻辑回归,LightGBM,幼稚的贝叶斯。
投资组合优化可能是具有挑战性的。随着机器学习的最新发展,可以将可用的重要预测工具应用于投资组合选择。金融市场既动态又复杂,但算法旨在捕获数据中的模式。在本文中,七个机器学习技术用于股票价格预测:局部回归,支持向量机,随机森林,经常性神经网络,长期短期记忆,双向长期短期记忆和LightGBM。此外,将两种混合机器学习方法用于预测:CNN-LSTM和Bilstmbo-lightGBM。训练模型后,该算法在模拟的交易中创建了最佳资产投资组合。在看不见的数据上,算法的对称平均绝对百分比误差评估了预测能力。生成的alpha和Sharpe比率评估了在均值方差优化下构建的最佳投资组合的质量。使用2019年1月2日至2023年12月29日美国50个美国公司的数据,结果表明,混合模型的性能优于各个模型,而CNN-LSTM模型的表现优于基准市场指数。