摘要:缺少值的存在减少了机器学习模型在训练阶段学习的知识量,从而对分类精度产生了负面影响。为了应对这一挑战,我们介绍了支持向量机(SVM)回归的使用来推出丢失值。此外,我们提出了一个两级分类过程,以减少错误的分类数量。我们对提出方法的评估是使用PIMA印度数据集进行糖尿病分类的。我们比较了五种不同的机器学习模型的性能:天真的贝叶斯(NB),支持向量机(SVM),K-Nearest邻居(KNN),随机森林(RF)和线性回归(LR)。我们的实验结果表明,SVM分类器的精度最高为94.89%。RF分类器的精度最高(98.80%),而SVM分类器的召回率最高(85.48%)。NB模型的F1得分最高(95.59%)。我们提出的方法通过解决数据集中缺失值的问题来在早期阶段检测糖尿病提供了有希望的解决方案。我们的结果表明,使用SVM回归和两级分类过程可以显着提高糖尿病分类的机器学习模型的性能。这项工作为糖尿病研究领域提供了宝贵的贡献,并突出了解决机器学习应用中缺失值的重要性。
摘要:早期检测糖尿病对于预防患者严重并发症至关重要。这项工作的目的是使用机器学习(ML)模型在患者中检测和分类2型糖尿病,并选择最佳模型来预测糖尿病的风险。在本文中,研究了五个ML模型,包括K-Nearest邻居(K-NN),Bernoulli幼稚的贝叶斯(BNB),决策树(DT),逻辑回归(LR)和支持向量机(SVM),以预测糖尿病患者。使用了一个含有和不含糖尿病患者的患者的Kaggle托管印度数据集,包括患者患有血糖浓度,血压浓度,舒张压,皮肤血压,皮肤厚度,身体胰岛素胰岛素水平,体重指数(BMI),遗传,糖尿病,糖尿病(糖尿病)的变量,糖尿病,糖尿病,糖尿病(不含家谱)。结果表明,K-NN和BNB模型的表现优于其他模型。K-NN模型在检测糖尿病方面获得了最佳准确性,精度为79.6%,而BNB模型在检测糖尿病方面获得了77.2%的精度。最后,可以说,使用ML模型早期检测糖尿病非常有前途。
1计算机科学与系统工程系,1安得拉大学工程学院妇女工程学院,印度维萨卡帕特南摘要:一种慢性代谢障碍糖尿病梅利图斯,需要仔细管理血糖水平(BGLS),以减轻严重的长期复杂性风险。尽管采取了传统的预防措施,例如维持健康的饮食和定期运动,但许多糖尿病患者仍在努力有效控制其BGL。适当的胰岛素剂量在管理这种情况中起着至关重要的作用。我们的项目旨在利用机器学习技术来帮助糖尿病预测和胰岛素剂量估计。我们利用PIMA糖尿病数据集和UCI胰岛素剂量数据集来培训我们的模型。使用梯度提升分类器用于预测糖尿病的存在,而线性回归算法用于估计诊断为糖尿病患者的胰岛素剂量。培训后,我们将在缺乏类标签的测试数据集上评估模型的性能。梯度提升分类器将识别糖尿病病例,对于被诊断的人,线性回归模型将预测适当的胰岛素剂量。通过整合这些预测模型,我们旨在为改善糖尿病管理策略做出贡献。
摘要:2型糖尿病(T2DM)的早期诊断将提供早期的治疗干预措施,以控制疾病进展并最大程度地减少过早死亡。本文提出了人工智能和机器学习预测模型,用于更准确地诊断阿曼人口中的T2DM,并且使用特殊创建的数据集进行了更少的处理时间。六种机器学习算法:K-Nearest邻居(K-NN),支持向量机(SVM),幼稚贝叶斯(NB),决策树,随机森林(RF),线性判别分析(LDA)和人工神经网络(ANN)(ANN)。所有使用的数据都是从糖尿病前期寄存器手动收集的临床数据和阿曼南阿尔·巴蒂纳省的Al SHIFA卫生系统。将结果与最广泛使用的PIMA印度糖尿病数据集进行了比较。考虑到预测T2DM的11个临床特征。随机森林和决策树模型的性能要比所有其他算法都更好,而阿曼数据的准确性为98.38%。使用相同的模型和功能数量时,阿曼数据集获得的精度超过了PID 9.1%。分析表明,T2DM诊断效率提高了更多的特征,这在许多缺失值的情况下有助于。
1. 执行摘要 a. 概述 1 b. 全州重点 1 c. 县级重点 2 2. 亚利桑那州概况 a. 概述 3 b. 农场 4 c. 生产与营销 5 d. 州经济中的农业 5 e. 灌溉用水 6 3. 科奇斯县概况 a. 概述 7 b. 农场 8 c. 生产与营销 9 d. 科奇斯县不断发展的农业产业 9 e. 灌溉用水 10 4. 格雷厄姆县概况 a. 概述 11 b. 农场 12 c. 生产与营销 13 d. 部落农业 13 e. 特色农业生产 13 f. 灌溉用水 14 5. 格林利县概况 a. 概述 15 b. 农场 16 c. 生产与营销 17 d. 农业与公共土地 17 e. 灌溉用水 18 6. 皮马县概况 a. 概述 19 b.农场 20 c. 生产与营销 21 d. 部落农业 21 e. 特色农业生产 21 f. 灌溉用水 22 7. 皮纳尔县概况 a. 概述 23 b. 农场 24
ADFIP:太平洋开发金融机构协会 BBNJ:国家管辖范围以外区域海洋生物多样性 CROP:太平洋区域组织理事会 ESCAP:亚洲及太平洋经济社会委员会 FAO:粮食及农业组织 FEMM:论坛经济部长会议 FFA:论坛渔业局 GDP:国内生产总值 GGGI:全球绿色增长研究所 IP:实施计划 MSME:中小微型企业 MVI:多重脆弱性指数 PACER:太平洋更紧密经济关系协定 PAFTS:太平洋贸易援助战略 PEFA:公共支出和财务问责 PFM:公共财政管理 PICTA:太平洋岛屿贸易协定 PIFS:太平洋岛屿论坛秘书处 PIMA:公共投资和管理评估 PLGED:太平洋领导人性别平等宣言 PRED:太平洋经济发展路线图 PRF:太平洋复原力基金 PRISE:太平洋区域一体化支持计划 RCAs:区域集体行动 RED:资源与经济发展 RPAs:区域优先事项行动 SDG:战略发展目标 SFAs:战略重点领域 SIS:小岛屿国家 SOE:国有企业 SPC:太平洋共同体秘书处 SPIRIT:加强太平洋区域内和国际贸易 SPTO:南太平洋旅游组织 UN:联合国 术语表
摘要:近年来,随着技术的发展,机器学习已广泛应用于医学领域。机器学习也是一个用于诊断糖尿病并帮助专家做出决策的领域。糖尿病是一种终身疾病,在世界各地和我国都很常见。本研究的主要目的是使用不同的机器学习分类算法进行早期诊断糖尿病。本研究的另一个目的是比较所使用的机器学习模型的成功率。早期诊断糖尿病可以过上健康正常的生活。在此背景下,人们尝试在皮马印第安人糖尿病数据集上使用机器学习技术决策树、随机森林、K-最近邻和支持向量机分类器进行早期诊断糖尿病。该数据集包括 9 个特征和 768 个样本。使用准确度、精确度、召回率、F1 分数和 AUC 指标对分类器的成功率进行评估。随机森林的准确率为 80%,效果最好。本文旨在研究不同机器学习技术的使用、糖尿病数据诊断能力、女性糖尿病患者的糖尿病诊断以及机器学习技术性能比较之间的关联。讨论了理论和实践的意义。在本研究中,使用与文献中使用的分类算法不同的算法进行了比较,并为该领域的文献做出了贡献。关键词:糖尿病疾病;机器学习;分类;随机森林
作者要感谢 SolarAPP+ 辖区为实施和数据收集投入的时间和精力:加利福尼亚州博蒙特市;加利福尼亚州贝尼西亚市;加利福尼亚州梅尼菲市;加利福尼亚州莫德斯托市;加利福尼亚州普莱森特希尔市;亚利桑那州皮马县;加利福尼亚州圣拉蒙市;加利福尼亚州西米谷市;加利福尼亚州索诺玛县;加利福尼亚州斯托克顿市;以及亚利桑那州图森市。作者非常感谢报告初稿审阅者提供的反馈:Lynne Birkinbine(图森市)、Thomas Cirimele(索诺玛县)、Benjamin Davis(加州太阳能和储能协会)、Oscar Diaz(莫德斯托市)、Andrew Graves(美国能源部)、Vance Phillips(圣拉蒙市)、Nathan Quarles(索诺玛县)、Abigail Randall(美国能源部)、Jonathan Schellin(贝尼西亚市)、John Schweigerdt(斯托克顿市)、Larry Sherwood(州际可再生能源委员会)、Janet Solis(永远自由)、Anne Sorensen(西米谷市)、Tennis Wick(索诺玛县)以及国家可再生能源实验室的 Jesse Cruce、Emily Fekete 和 Juliana Williams。我们还要感谢 Harrison Dreves 和 Susannah Shoemaker 的编辑支持。该项目是在美国能源部能源效率和可再生能源办公室 Andrew Graves 的支持和指导下进行的。
糖尿病在世界范围内变得越来越普遍。人们患有糖尿病或与这种疾病有关的风险。有必要防止由糖尿病引起的健康问题,降低糖尿病的风险并减少卫生系统上糖尿病的负荷。因此,尽早诊断和治疗糖尿病患者很重要。在这项研究中,使用PIMA印度糖尿病(PID)数据库来预测糖尿病。 将PID数据库分为培训数据集的2/3,测试数据集分为1/3。 然后,使用五倍的交叉验证将测试和培训数据集喂入机器学习模型中。 随机森林分类器,额外的树分类器和高斯过程分类器机器学习方法用于预测个人是否患有糖尿病。 在这项研究中,确定具有最高预测准确性的建议方法是随机森林分类器。 提出的方法的准确性为81.71%,精度为88.79%,召回率为84.83%,F-评分为86.76%,ROC AUC为88.03%。 提出的方法是为了帮助临床医生预测糖尿病患者的诊断。 使用COLAB笔记本使用Google云计算服务应用了本研究中开发的机器学习方法。 1。 引言胰岛素是一种调节人体血糖的激素。 糖尿病是一种慢性疾病,当胰腺无法产生必要的胰岛素或人体无法有效使用胰岛素时发生。 糖尿病不仅会影响生病的人。在这项研究中,使用PIMA印度糖尿病(PID)数据库来预测糖尿病。将PID数据库分为培训数据集的2/3,测试数据集分为1/3。然后,使用五倍的交叉验证将测试和培训数据集喂入机器学习模型中。随机森林分类器,额外的树分类器和高斯过程分类器机器学习方法用于预测个人是否患有糖尿病。在这项研究中,确定具有最高预测准确性的建议方法是随机森林分类器。提出的方法的准确性为81.71%,精度为88.79%,召回率为84.83%,F-评分为86.76%,ROC AUC为88.03%。提出的方法是为了帮助临床医生预测糖尿病患者的诊断。使用COLAB笔记本使用Google云计算服务应用了本研究中开发的机器学习方法。1。引言胰岛素是一种调节人体血糖的激素。糖尿病是一种慢性疾病,当胰腺无法产生必要的胰岛素或人体无法有效使用胰岛素时发生。糖尿病不仅会影响生病的人。随着时间的流逝,糖尿病会严重损害心血管系统,眼睛,肾脏和神经[1]。这也是一种影响病人和整个社会家庭的疾病。护理和治疗费用由于糖尿病及其引起的并发症而迅速增加,并承受了卫生系统的负担。此外,患者的生活质量降低了,这种情况对患者的家庭产生了负面影响。糖尿病已成为一个全球问题。大约有4.22亿人患有糖尿病。这些人中的大多数生活在低收入和中等收入国家。每年由于糖尿病而死亡[2]。使用机器学习方法预测患有糖尿病的人将使临床医生的工作更加容易。临床医生将确保在早期诊断和治疗糖尿病患者。
糖尿病是一种慢性代谢性疾病,其特征是血糖升高,可导致眼睛和重要器官受损。2 型糖尿病是糖尿病的一种变体,最常影响 18 岁以上的成年人,这种变体引起的症状并不明显,识别它需要很长的测试过程。使用分类算法预测糖尿病,有助于在疾病早期阶段将风险降至最低,并帮助健康从业者控制糖尿病的影响。在本研究中,作者在 Pima Indian Diabetes 数据集上比较了决策树和 K-Nearest Neighbor 算法在预测糖尿病方面的表现。两种算法模型均使用 3 个数据集共享比率进行训练,分别为 80:20、70:30 和 65:35。此外,作者还实施了 GridSearchCV 超参数调整,以找到两种模型的最佳参数。两种模型的准确率、精确度、召回率和 F-1 分数用于确定哪种模型具有最佳性能。结果表明,未进行超参数调优的决策树算法在 70:40 的比例下效果最佳,准确率为 83.33%;KNN 算法中 K=7 为最优 K 值,准确率为 77.65%;进行超参数调优的 GridSearchCV 在 80:20 和 65:35 的比例下效果最佳,能够找到决策算法中的最佳参数。但决策树算法仍然存在过拟合的问题。