自 2019 年 12 月在中国武汉爆发以来,新型冠状病毒(即 Covid-19)在全球范围内迅速蔓延,已达到大流行的程度。当世界仍在努力弄清楚如何遏制新型冠状病毒的快速蔓延时,这场大流行已经在世界各地夺走了数千人的生命。然而,病毒在人类中传播的诊断已被证明是复杂的。计算机断层扫描成像、全基因组测序和电子显微镜的结合最初被用于筛查和识别 Covid-19 的病毒病因 SARS-CoV-2。由于每天的病例都在增加,医院可用的 Covid-19 检测试剂盒数量减少。因此,需要使用自我暴露框架作为快速替代分析,以遏制 Covid-19 在全世界范围内的个体间传播。在目前的工作中,我们制定了一种审慎的方法,该方法通过使用人工智能 (AI) 的 CT 扫描和胸部 X 光图像,帮助在正常人中识别 Covid-19 感染者。该策略适用于 Covid-19 和正常胸部 X 光图像的数据集。图像诊断工具利用决策树分类器来查找新型冠状病毒感染者。从精度、召回率和 F1 分数方面分析图像的百分比准确度。结果取决于 Kaggle 和 Open-I 商店根据其批准的胸部 X 光和 CT 扫描图像提供的信息。有趣的是,测试方法表明预期算法是稳健、准确和精确的。我们的技术实现了以人工智能创新为中心的准确性,可在训练和推理过程中提供更快的结果。
论文评分和反馈是教育评估过程的基本组成部分。手动论文评估的最大挑战之一是它需要大量的时间和精力,这往往会导致不一致和延迟。此外,语言固有的复杂性和某些评分标准的主观性继续对一致性构成障碍。这项研究考察了三种先进的大型语言模型 (LLM) - Mistral-7B-Instruct、Llama-2-13b 和 Llama-2-13b-finetuned - 在论文评估自动化中的有效性。该研究根据六项基本熟练程度标准(包括衔接性、句法、词汇、措辞、语法和惯例)比较了这些模型在 Kaggle 的 1,500 篇议论文数据集上的表现。它采用四个统计指标进行评估:平均绝对误差 (MAE)、均方误差 (MSE)、均方根误差 (RMSE) 和平均绝对百分比误差 (MAPE)。研究结果显示,不同评估标准下的模型性能存在显著差异。Mistral-7B-Instruct 在大多数类别中的表现始终优于 Llama 模型。Llama-2-13B 微调模型在多个标准上都比其基础模型有显著改进,这表明微调基础模型可以用于论文评估等特定任务。研究结果对教育和技术领域都具有重要意义,因为他们可以利用这些进步来提高大规模论文评估的效率。未来的工作可以集中在通过微调更广泛的 Transformer 模型来扩大分析范围,以更好地了解各种架构如何影响自动论文评估的性能。
摘要:准确确定粒子径迹重建参数将成为高亮度大型强子对撞机 (HL-LHC) 实验面临的主要挑战。HL-LHC 同时发生的碰撞数量预计会增加,探测器占用率也会随之提高,这将使径迹重建算法对时间和计算资源的要求极高。命中次数的增加将增加径迹重建算法的复杂性。此外,由于探测器的分辨率有限以及命中的物理“接近度”,将命中分配给粒子径迹的模糊性也会增加。因此,带电粒子径迹的重建将成为正确解释 HL-LHC 数据的主要挑战。目前使用的大多数方法都基于卡尔曼滤波器,这些滤波器被证明是稳健的,并提供良好的物理性能。但是,它们的扩展性预计会比二次方差。设计一种能够在命中级别减少组合背景的算法,将为卡尔曼滤波器提供更“干净”的初始种子,从而大大减少总处理时间。量子计算机的显着特征之一是能够同时评估大量状态,使其成为在大型参数空间中进行搜索的理想工具。事实上,不同的研发计划正在探索量子跟踪算法如何利用这些功能。在本文中,我们介绍了我们在实现基于量子的轨迹查找算法方面的工作,该算法旨在减少初始播种阶段的组合背景。我们使用为 kaggle TrackML 挑战设计的公开数据集。
摘要:准确确定粒子径迹重建参数将成为高亮度大型强子对撞机 (HL-LHC) 实验面临的主要挑战。HL-LHC 同时发生的碰撞数量预计会增加,探测器占用率也会随之提高,这将使径迹重建算法对时间和计算资源的要求变得极为苛刻。撞击数量的增加将增加径迹重建算法的复杂性。此外,由于探测器的分辨率有限以及撞击的物理“接近度”,将撞击分配给粒子径迹的模糊性也会增加。因此,带电粒子径迹的重建将成为正确解释 HL-LHC 数据的主要挑战。目前使用的大多数方法都基于卡尔曼滤波器,这些滤波器被证明是稳健的,并能提供良好的物理性能。然而,它们的扩展性预计会比二次方差。设计一种能够在命中级别减少组合背景的算法,将为卡尔曼滤波器提供更“干净”的初始种子,从而大大减少总处理时间。量子计算机的显着特征之一是能够同时评估大量状态,使其成为在大型参数空间中进行搜索的理想工具。事实上,不同的研发计划正在探索量子跟踪算法如何利用这些功能。在本文中,我们介绍了我们在实现基于量子的轨迹查找算法方面的工作,该算法旨在减少初始播种阶段的组合背景。我们使用为 kaggle TrackML 挑战设计的公开数据集。
*通讯作者:Zeba Khanam,z.khanam@seu.edu.edu.sa摘要视网膜病是对眼睛的视网膜的损害,这是严重的糖尿病微血管并发症。通常使用机器学习和深度学习算法等AI方法开发用于DR管理的CAD工具。最近,使用深度学习模型开发了用于DR的诊断工具。由于这一事实,这些模型的培训需要大量数据。数据集中的实例较少,因此大量数据不均匀。这项研究引入了一种称为Modified LDA的新范式,该范式使用少量培训数据成功培训模型,从而避免了使用此类有限数据时出现的过度拟合和近似错误的常见问题。通过我们的研究,我们提出了一种新的方法(一种修改的线性判别算法),用于对糖尿病患者进行分类和诊断。从Kaggle收集的信息。准确性(97.92%),曲线下的面积(0.9999)和Gini指数(0.998)都是数字上升的。通过分析客观绩效指标和解释模型,我们发现建议的模型优于识别糖尿病患者的最新方法,并在存在缺失值时对疾病的严重程度进行排名。因此,眼科医生可能能够在该工具的帮助下就糖尿病疾病的严重性获得第二意见。关键字糖尿病预测,线性判别算法,修改算法,机器学习,预测建模,分类,特征选择,数据分析
糖尿病性视网膜病(DR)是糖尿病患者普遍存在的并发症,可能会导致视力障碍,这是由于视网膜上形成的病变。在高级阶段检测DR通常会导致不可逆的失明。通过眼科医生通过视网膜底面图像诊断DR的传统过程不仅是耗时的,而且还很昂贵。虽然经典的转移学习模型已被广泛用于计算机辅助检测DR,但其高维护成本可能会阻碍其检测EFFI效率。相比之下,量子传递学习对这一挑战的更有效解决方案。这种方法非常有利,因为它以启发式原则运作,使其对任务进行了高度优化。我们提出的方法利用这种混合量子传递学习技术来检测DR。为了构建我们的模型,我们利用Kaggle上可用的Aptos 2019失明检测数据集。我们采用RESNET-18,RESNET34,RESNET50,RESNET101,RESNET152和INCEPTION V3(预训练的经典神经网络)进行初始特征提取。在分类阶段,我们使用变分量子分类器。我们的混合量子模型显示出了显着的结果,RESNET-18的精度为97%。这表明,与量子机学习集成时,量子计算可以单独使用经典计算机来执行一定程度的功率和EFFI的任务。通过利用这些先进的技术,我们可以显着改善糖尿病性视网膜病的检测和诊断,从而使许多人免于失明的风险。
这项全面的基准测试研究探讨了三个著名的机器学习库的性能:Pytorch,带有Tensorflow后端的Keras和具有相同标准,软件和硬件的Scikit-Learn。评估包括两个不同的数据集:“学生表现”和“大学参加计划分类”,由Kaggle平台支持使用前馈神经网络(FNNS)作为建模技术。调查结果表明,Pytorch和Keras凭借Tensorflow Backend Excel在“大学参加计划分类”数据集中,Pytorch在这两个类别中都能达到无可挑剔的精度,召回和F1得分。虽然Scikit-Learn表现出值得称赞的性能,但在这种情况下,它落后于这些库。在“学生表现”数据集中,所有三个库都提供了可比的结果,而Scikit-Learn的精度最低为16%。带有Tensorflow后端的Keras和Pytorch的精度分别为23%。此外,当面对各种数据集类型时,本研究为每个图书馆的独特优势和缺点提供了宝贵的见解。pytorch成为要求需要高性能的任务的首选选择,而Scikit-Learn对于具有适度的计算需求的简单任务证明是有利的。带有张力的后端的凯拉斯在性能和用户友好之间取得平衡。这项基准测试努力为机器学习从业人员提供了宝贵的指导,以选择根据其项目要求量身定制的最合适的图书馆或框架。关键字 - 机器学习,Pytorch,Tensorflow,Scikit-Learn,神经网络它强调了图书馆选择在获得机器学习努力中的最佳结果中的关键作用。
4印度班加罗尔Surana学院助理教授摘要:2021年之后,生产了超过9000万辆客车,这标志着汽车生产的大幅增长。 这种增长导致了繁荣的二手车市场,该市场已成为一个极具利益的行业。 该市场中最关键,最迷人的研究领域之一是汽车价格预测。 准确的价格预测模型可以极大地使二手车行业的买家,卖方和企业受益。 本文介绍了两个监督机器学习模型的详细比较分析:K-Nearest邻居和支持向量机回归技术,以预测二手车价格。 我们利用了从Kaggle网站采购的二手车的全面数据集来培训和测试我们的模型。 K最近的邻居算法以其在回归任务中的简单性和有效性而闻名。 另一方面,支持向量机回归技术采用不同的方法,找到最适合数据的最佳超平面。 这两种方法都有其优势和劣势,我们在这项研究中探讨了这一点。 我们的结果表明,KNN和SVM模型在预测二手车价格方面都表现良好,但准确性的差异很小。 因此,建议的模型拟合为最佳模型,KNN的精度约为83%,SVM的精度为80%。 结果表明,KNN模型在预测二手车价格方面略高于SVM模型。 关键字:K最近的邻居,机器学习,预测,支持向量机,二手车精度。4印度班加罗尔Surana学院助理教授摘要:2021年之后,生产了超过9000万辆客车,这标志着汽车生产的大幅增长。这种增长导致了繁荣的二手车市场,该市场已成为一个极具利益的行业。该市场中最关键,最迷人的研究领域之一是汽车价格预测。准确的价格预测模型可以极大地使二手车行业的买家,卖方和企业受益。本文介绍了两个监督机器学习模型的详细比较分析:K-Nearest邻居和支持向量机回归技术,以预测二手车价格。我们利用了从Kaggle网站采购的二手车的全面数据集来培训和测试我们的模型。K最近的邻居算法以其在回归任务中的简单性和有效性而闻名。另一方面,支持向量机回归技术采用不同的方法,找到最适合数据的最佳超平面。这两种方法都有其优势和劣势,我们在这项研究中探讨了这一点。我们的结果表明,KNN和SVM模型在预测二手车价格方面都表现良好,但准确性的差异很小。因此,建议的模型拟合为最佳模型,KNN的精度约为83%,SVM的精度为80%。结果表明,KNN模型在预测二手车价格方面略高于SVM模型。关键字:K最近的邻居,机器学习,预测,支持向量机,二手车精度。简介汽车行业在过去十年中经历了令人震惊的改善,仅2021年就在超过7000万辆旅行车的时代就在整个圈子中遍布。这种激增导致了新的汽车市场,但也导致了增长,但还引起了充满活力和不断扩大的助手促进使用的汽车。随着使用的汽车促进蓬勃发展,准确地预期车辆成本已成为对买家和商人感兴趣的重要地方。一般而言,车辆提取的欲望取决于直接的后滑动模型,尽管坐标,但经常为捕获评估数据时的复杂的非线性关联特征。这些模型以善意为基础的模型以及与复杂和宽的数据集相关联时,按照行驶里程,年龄和状况的基本亮点(例如里程,年龄和状况)进行了基本亮点。随后很长时间以来,该领域已经朝着应用机器学习策略的应用迈出了至关重要的举动,这可以通过使用非线性计划和更合适的大规模数据来进行大修的准确性。在这些方法中,k-near最邻居的计算和增强矢量机后滑动已经积累了值得注意的思想。knn毫无轻松和增强性,根据数据中心的区域预测了车辆成本,而SVM专注于识别完美的超平面,最能将数据最佳分为不同的类别,随后通过照顾非线性关联来推进数字的执行。以下是使用的变量:这项研究探讨了K-Nearest邻居的比较执行,并支持向量机器预测使用的汽车成本。利用来自Kaggle商店的信息,我们评估了这些模型在不同的准备和测试方案下的精确性。我们的发现表明,尽管这两种模型都表现出了有希望的出现,但SVM表明了与KNN相比的精确性略有优势。此询问的观点是为了促进汽车部门内有先见之明的建模的持续讨论,强调了进步的机器学习方法的好处,以提高所使用的汽车成本估算的精度。
尽管磁共振成像 (MRI) 等诊断成像技术的进步使人们对阿尔茨海默病 (AD) 的诊断和治疗有了更深入的了解,但医疗专业人员仍然需要分析图像,这是一个耗时且容易出错的过程。借助神经网络模型,可以更准确、更有效地做出诊断。在本研究中,我们比较了三种著名的基于 CNN 的算法(AlexNet、Faster R-CNN 和 YOLOv4)的性能,以确定哪一种算法在对 AD 患者的脑部 MRI 扫描进行多类分类时最准确。所使用的数据集来自 Kaggle,包含 6400 个训练和测试 MRI 图像,分为四个类别(非痴呆、非常轻度痴呆、轻度痴呆和中度痴呆)。中度痴呆类别的代表性极低。为了获得更准确的结果,通过数据增强将图像添加到该类别中。实验是使用 Google Colab 的 Tesla P100 GPU 进行的。迁移学习应用于所有三个预训练模型,并根据各自的参数调整数据集。增强后,AlexNet 具有最高的 mAP(平均准确率),100% 的时间检测到感兴趣的对象,而 YOLOv4 和 Faster R-CNN 的 mAP 分别为 84% 和 99%。然而,YOLOv4 在混淆矩阵上表现最佳,尤其是对于 ModerateDemented 图像。正如我们的实验所揭示的,像 YOLOv4 这样的单阶段检测器比像 Faster R-CNN 这样的两阶段检测器更快、更准确。我们的研究成功实现了这些模型,并为医学图像诊断做出了宝贵贡献,为未来的研究和开发开辟了道路。
在较早阶段对脑肿瘤类型的准确诊断对于治疗过程至关重要,并有助于挽救全球大量人的生命。因为他们是无创和备用的患者,因此经常使用磁共振成像(MRI)扫描来识别肿瘤。肿瘤的手动识别很困难,由于大量的三二次图像,需要大量时间,这是一个患者大脑从各个角度产生的MRI扫描。进一步,脑肿瘤的位置,大小和形状的变化也使检测和对不同类型的肿瘤进行分类的挑战。因此,已经提出了计算机辅助诊断系统(CAD)系统以检测脑肿瘤。在本文中,我们提出了一种新型的统一端到端深度学习模型,称为肿瘤肿瘤检测和分类。我们的Tumordetnet框架采用了48个带有漏水(LRELU)和RELU激活功能的卷积层来计算最独特的深度特征图。此外,平均合并和辍学层也用于学习区分模式并减少过度拟合。最后,使用一个完全连接的和软层层来检测并将脑肿瘤分为多种类型。我们在六个标准的kaggle脑肿瘤MRI数据集上评估了我们方法的表现,以将脑肿瘤检测和分类为(恶性和良性),以及(神经胶质瘤,垂体和脑膜瘤)。我们的模型成功地鉴定出了99.83%的明显精度,分类的良性和恶性脑肿瘤,理想的精度为100%,而脑膜化,垂体和胶质瘤肿瘤的精度为99.27%。这些结果揭示了对可靠鉴定和分类脑肿瘤的建议方法的效力。