摘要:随着时间的流逝,已为模式分类生成了无数的应用。几个案例研究包括参数分类器,例如多层感知器(MLP)分类器,这是当今使用最广泛的分类器之一。其他人使用非参数分类器,支持向量机(SVM),K-Nearest邻居(K-NN),幼稚的贝叶斯(NB),Adaboost和Random Forest(RF)。但是,仍然几乎没有针对人工智能(AI)的新趋势的工作,该趋势被称为可解释的人工智能(X-AI)。这种新趋势旨在使机器学习(ML)算法越来越简单且易于理解用户。因此,在这项工作中,在这项工作中,作者基于新型极简主义机器学习(MML)范式的实现以及更高的相关性属性选择算法,开发了一种新的模式分类方法,我们称之为DMeans。我们检查并比较了该方法的性能与MLP,NB,KNN,SVM,ADABOOST和RF分类器,以执行计算机断层扫描(CT)脑图像的分类任务。这些灰度图像的面积为128×128像素,并且数据集中有两个类别可用:CT无出血和CT,具有室内出血(IVH)的CT,使用剩余的交叉验证方法对它们进行了分类。大多数通过一对一的交叉验证测试的模型的精度在50%至75%之间,而灵敏度和灵敏度在58%至86%之间。使用我们的方法进行的实验与观察到的最佳分类器相匹配,其精度为86.50%,并且它们的表现优于特定的所有最先进的算法,而91.60%的算法的表现。这种性能是通过简单且实用的方法齐头并进的,这些方法与这种易于解释的算法的趋势并驾齐驱。
下面列出的是主要的医学内容类别,它们定义了内分泌,糖尿病和代谢传统的10年MOC考试和LKA的领域。内容的相对分布表示为总评估的百分比。为了确定内容分布,ABIM考虑了主题频率和重要性的平均受访者评分。为了交叉验证这些自我报告的评级,Abim还考虑了由认证的内分泌学家队列中医疗保险患者看到的相对频率。通过这些数据告知,内分泌学,糖尿病和代谢委员会批准委员会和董事会确定了以下所示的内容类别目标。
目的:脑硫在前婴儿中的分割对于监测其发育至关重要。虽然已将磁共振成像用于此目的,但颅内超声(CUS)是临床实践中使用的主要成像技术。在这里,我们介绍了第一项研究,旨在使用超声图像在前婴儿中自动化脑硫酸分割。方法:我们的研究集中于单个CUS平面中的Sylvian填充段(C3),尽管该方法可以扩展到其他硫和平面。我们在两种情况下评估了深度学习模型的性能,即特定于U-NET和RESU-NET,并在分割过程中自动化。首先,我们对从同一超声机获得的图像进行了交叉验证。第二,我们应用了调整技术来使模型适应从不同供应商中获取的图像。结果:在交叉验证实验中,RESU-NET方法分别达到了骰子和0.777和0.784的灵敏度得分。应用于外部数据集时,结果会根据与训练图像的相似性而变化。相似的图像产生了可比的结果,而不同的图像显示性能下降。另外,这项研究强调了Resu-net比U-NET的优势,这表明残留连接增强了模型学习和表示复杂的解剖结构的能力。结论:这项研究证明了使用深度学习模型自动分割CUS图像中的Sylvian finsure的可行性。脑硫的准确超声表征可以改善脑发育的不足,并有助于识别具有不同发育轨迹的婴儿,从而可能影响以后的功能结果。
摘要:小麦(Triticum aestivum)在全球粮食安全中起着至关重要的作用。巴西的历史平均收益率低于潜在的潜力,而巴西的小麦产量的提高将要求对基本植物开发过程有透彻的了解,这可以使用基于过程的作物模拟模型来实现。这项研究的目的是校准和评估We Treck模型的性能,以模拟巴西亚热带和热带地区春季小麦品种的叶片出现。在四年(2021、2022、2023和2024)中进行了现场实验,分别在四个地点进行了13个小麦品种,分别在里奥格兰德·杜尔(Rio Grande do Sul)和一个在巴西南部和西南部的圣保罗州。每周使用haun尺度确定主骨上的叶子数,直到旗叶。使用了最初用于冬小麦开发的叶片外观的非线性WE触发模型。使用交叉验证方法在4月,5月和2021年6月在圣玛丽亚市使用交叉验证方法校准了该模型,模型评估与来自所有其他位置和播种日期的独立数据。We-Treck Leaf的出现模型在模拟具有不同发育周期(从超早期到晚期)的春季小麦品种中的霍恩阶段表现出色,在不同的环境(亚热带和热带热带)中生长,并具有不同的N敷料管理(时机和来源),其均无方面的误差范围从0.10到0.10落在0.71 cul上。
图1描绘了使用标记数据训练以预测材料特性的典型监督ML模型。此类ML模型的主要组成部分是(a)定义问题(b)数据采集并选择适当的特征空间,(c)数据处理或探索性数据分析(EDA)和(d)使用合适的算法培训和验证该模型。尽管有许多开源材料数据库,但与数据科学的其他领域相比,数据由不同的类别组成,每个类别的数据相对有限。在大多数实验数据中,研究是在不同的实验条件下进行的,因此数据取决于温度,时间,湿度,原始化学物质等各种对照参数。选择数据后,下一个关键挑战是选择材料的适当功能集(指纹),以用目标属性映射。诸如Pymatgen [12],Matminer [13],原子模拟环境(ASE)[14],DSCRIBE [15]等的开源库[13]等。对于分子和材料的不同位点,键和全局(晶格)特征非常有用。EDA包括验证任何异常值,将丢失的数据推出,将对象类型参数编码为数字类型,检查数据中的任何重复副本等。一旦数据准备就绪,为给定问题选择特定算法是另一个挑战,它应该考虑不同的因素,例如数据的大小,特征空间,问题的复杂性等。如果选择有限的数据点(例如深度学习算法)(高方差)模型(高方差)模型,则可能导致过度拟合。训练模型的解释性是了解最归因于总体预测的特征的另一个重要因素[16]。可以使用超参数调谐方法(如随机搜索交叉验证和网格搜索交叉验证)进一步调整模型的精度。
对于三种学习设置如图 B 所示。D – 新药预测的 ROC AUC 得分与 TC 距离截止值的关系。颜色标度表示与五种最相似药物的平均距离,圆圈大小表示每个交叉验证训练集中包含的平均药物数量。E – 留一法微生物模型的 ROC AUC 得分与系统发育距离的关系(皮尔逊相关性 -0.574,p< 5*10 -4)。颜色表示菌株的门。F – 当从训练集中删除同一门的所有菌株时,ROC AUC 得分下降。Verrucomicrobia 门和 Fusobacteria 门被从此分析中丢弃,因为每个门只包含一个菌株。
摘要 — 提高心脏病检测方法的精确度对于减少与诊断过程相关的昂贵医疗费用至关重要。从医疗数据中提取模式可以解开关联以改进心脏病诊断技术。本研究旨在构建一个高效的机器学习模型,作为医疗决策支持系统的可靠组成部分。研究了七种不同的机器学习模型,包括逻辑回归、支持向量分类器、K 最近邻 (KNN)、随机森林、决策树、朴素贝叶斯和梯度提升分类器,这些模型被全面探索用于心脏病分类。这些算法的超参数优化涉及三种技术:网格搜索、随机搜索和贝叶斯搜索。对每个模型性能的评估包括测量特异性、敏感性和 F1 分数,利用来自三个医疗诊所(克利夫兰、Statlog、匈牙利)的具有 12 个属性和 1189 个观测值的数据集。特征选择方法包括包装方法、嵌入方法卡方和方差分析,用于识别高度相关的特征,最终将数据的维度降低到 7 个特征。评估过程采用 10 倍交叉验证,表明随机森林模型实现了最高平均准确率 92.85%,超过了之前报告的 86.9%。此外,10 倍交叉验证确保了模型的可靠性和对数据不平衡的弹性。基于集成的方法再次证明了随机森林在诊断心脏病方面的卓越性能,准确率高达 94.96%。总之,这种开发的模型在心脏病分类中表现出可靠性,并为医疗应用提供了一种有前途的解决方案,可以有效地降低诊断成本和时间限制。关键词——应用机器学习、冠心病、随机森林
各种建模技术用于预测锂离子电池的容量褪色。代数还原模型本质上可以解释且计算快速,非常适合用于电池控制器,技术经济模型和多目标优化。用于用石墨阳极的锂离子电池,石墨表面上的固体电解质插入(SEI)生长占主导地位。这种褪色通常是使用物理知情方程式建模的,例如预测溶剂扩散限制SEI生长的时间根 - 根源,以及Arrhenius和Tafel类似方程,预测温度和最新电量率依赖性。在某些情况下,提出了完全的经验关系。但是,很少进行统计验证以评估模型最佳性,并且通常只研究了少数可能的模型。本文展示了一种新的程序,可以自动通过双级优化和符号回归从数百万算法生成的方程中自动识别降级降解模型。使用交叉验证,敏感性分析和通过自举通过交叉验证,敏感性分析和不确定性定量在统计上验证。在LifePo 4 /石墨细胞日历老化数据集中,自动识别了使用方形 - 根,功率法,拉伸指数和sigmoidal功能的模型,与人类专家确定的模型相比,具有更高的准确性和更低的不确定性,并证明先前已知的物理关系可以使用“重新验证的机器学习”。©2021作者。[doi:10.1149/1945-7111/abdde1]由IOP Publishing Limited代表电化学学会出版。这是根据Creative Commons Attribution 4.0许可(CC by,http://creativecommons.org/licenses/ by/4.0/)分发的开放式访问文章,如果原始工作适当地引用了原始作品,则可以在任何媒介中不受限制地重复使用工作。
摘要。心脏病的发病率和死亡率正在增加,这对公共卫生和全球经济产生了负面影响。心脏病的早期发现降低了心脏死亡率和发病率的发生率。最近的研究利用量子计算方法来预测5个以上的心脏病,并且在计算中进行了密集。尽管量子数数量较高,但较早的工作报告说,预测心脏病的准确性较低,没有考虑到异常效应,并且需要更多的计算时间和记忆来预测心脏病。为了克服这些局限性,我们建议使用几个量子位(2至4个)(2至4)提出混合随机森林量子神经网络(HQRF),并考虑了数据集中异常值的影响。在本研究中使用了两个开源数据集Cleveland和Statlog应用量子网络。所提出的算法已应用于两个开源数据集,并利用了两种不同类型的测试策略,例如10倍的交叉验证和70-30列车/测试率。我们将我们提出的方法论的性能与较早的算法(称为杂交量子神经网络(HQNN))的算法进行了比较。HQNN和HQRF在10倍的交叉验证和70/30列车/测试拆分率中的表现均优胜。结果表明,HQNN需要大型培训数据集,而HQRF更适合大型和小型培训数据集。根据实验结果,与HQNN相比,提出的HQRF对异常数据不敏感。与较早的作品相比,拟议的HQRF在使用Cleveland和Statlog数据集的预测心脏病方面的曲线(AUC)下达到了96.43%和97.78%的最大面积,使用HQNN。所提出的HQRF在早期检测心脏病方面非常有效,并将加快临床诊断。
摘要:脑电图 (EEG) 信号分类在开发残疾人辅助康复设备中起着重要作用。在此背景下,从 20 名健康人身上获取脑电图数据,然后进行预处理和特征提取过程。提取 12 个时间域特征后,采用两个著名的分类器,即 K 最近邻 (KNN) 和多层感知器 (MLP)。采用五重交叉验证方法将数据分为训练和测试目的。结果表明,MLP 分类器的性能优于 KNN 分类器。MLP 分类器实现了 95% 的分类器准确率,这是最好的。本研究的结果对于在线开发脑电图分类模型以及设计基于脑电图的轮椅非常有用。关键词:运动想象,脑电图信号,KNN,MLP,ICA。介绍