回归是预测连续价值的过程。我们可以使用回归方法来预测使用其他一些变量的连续值,例如CAR模型的CO2发射。例如,让我们假设我们可以访问包含与来自不同汽车的CO2排放相关的数据的数据集。数据集包含诸如汽车发动机尺寸,气缸数,燃油消耗量和来自各种汽车型号的CO2排放之类的属性。现在,我们有兴趣估计其生产后新车模型的近似CO2发射。使用机器学习回归模型这是可能的。在回归中,有两种类型的变量:一个因变量和一个或多个自变量。因变量是我们研究和尝试预测的“状态”,“目标”或“最终目标”,而自变量(也称为解释变量)是这些“状态”的“原因”。自变量通常通过x显示,并且因变量用y表示。回归模型将y或因变量与x的函数相关联,即自变量。回归的关键点是因变量值应该是连续的,而不是离散值。但是,可以在分类或连续测量量表上测量自变量或变量。回归的类型:基本上,回归模型有两种类型:简单回归和多重回归。简单回归是当使用一个自变量来估计因变量时。它可以在非线性上是线性的。例如,使用“汽车的发动机尺寸”预测CO2排放。回归的线性基于自变量和因变量之间关系的性质。存在多个自变量时,该过程称为多个线性回归。例如,使用变量“汽车的发动机尺寸”和“汽车中存在的气缸数”来预测CO2排放。再次取决于因变量和自变量之间的关系,多个线性回归可以是线性或非线性回归。
●计算机视觉和机器学习应用在Heliophysics中的应用,包括:太阳能磁性太阳能活动(耀斑,CMES,颗粒)太阳能风太空空间天气和空间气候气候地机无线电循环无线电射击
评估 ML 算法的性能 UNIT - I:简介:AI 问题、代理和环境、代理结构、问题解决代理基本搜索策略:问题空间、无信息搜索(广度优先、深度优先搜索、深度优先与迭代深化)、启发式搜索(爬山法、通用最佳优先、A*)、约束满足(回溯、局部搜索) UNIT - II:高级搜索:构建搜索树、随机搜索、AO* 搜索实现、极小极大搜索、Alpha-Beta 剪枝基本知识表示和推理:命题逻辑、一阶逻辑、前向链接和后向链接、概率推理简介、贝叶斯定理 UNIT - III:机器学习:简介。机器学习系统,学习形式:监督学习和无监督学习,强化 – 学习理论 – 学习可行性 – 数据准备 – 训练与测试和拆分。第四单元:监督学习:回归:线性回归、多元线性回归、多项式回归、逻辑回归、非线性回归、模型评估方法。分类:支持向量机 (SVM)、朴素贝叶斯分类
人们越来越多地与诸如可穿戴传感器,VR/AR耳机或其他数据收集系统等技术相互作用,并成功地模糊了物理和数字之间的界限;身体及其与环境的互动。同时,这些传感技术的非自愿数据收集和机器主导的决策加剧了历史上的不平等,尤其是影响边缘化群体。通过新技术解决人类运动,思想和经验是一项持续的挑战,需要新型的创造性和想象力的艺术实践。
抽象教育是改变知识的一种方式,以便人类能够发展潜力。教育鼓励每个人发展并适应不断变化的时代,例如技术领域的进步。学生的学习成绩是成功管理学习计划的关键指标。学术绩效检测可以帮助研究计划经理监视并对有可能遇到困难的学生采取积极行动。机器学习可以是通过帮助分类和检测学生学术能力来克服这一挑战的解决方案。机器学习技术已被证明非常有效地分析复杂的数据并揭示了人们难以检测的隐藏模式。本研究旨在探索在检测学生学业表现的机器学习算法的实施,尤其是在NIAS大学数学教育研究计划中。随着技术进步,机器学习已被证明在分类数据和检测传统方法无法识别的隐藏模式方面有效。本研究使用支持向量机(SVM)算法根据从学生主要数据中收集的数据集来预测学生的学习成绩。数据集包括各种因素,例如GPA值,出勤,参与和学习资源的使用。在要使用的方法中,将使用调查表收集数据,其中有许多受访者多达193人。已收集的数据将使用SVM处理,以在预测学生的学习成绩中获得结果。分析结果表明,使用的SVM模型的精度为77.59%,在学业表现良好的学生班级中的偏见更加倾向。这项研究的结果有望在开发更有效的学习方法和对三级机构的学术干预的个性化方面做出实际贡献。关键字:机器学习,学业表现和支持向量机
课程目标: 1. 认识机器学习的基本术语和基本概念。 2. 理解监督学习模型的概念,重点关注最新进展。 3. 关联监督学习的神经网络模型概念 4. 发现机器学习的无监督学习范式 5. 理解强化学习和集成方法的概念。 UNIT-I 简介:机器学习、监督学习、无监督学习、强化学习简介。深度学习。 特征选择:过滤器、包装器、嵌入式方法。 特征规范化:最小-最大规范化、z 分数规范化和常数因子规范化 降维简介:主成分分析(PCA)、线性判别分析(LDA) UNIT-II 监督学习 - I(回归/分类) 回归模型:简单线性回归、多元线性回归。成本函数、梯度下降、性能指标:平均绝对误差(MAE)、均方误差(MSE)R 平方误差、调整 R 平方。分类模型:决策树 - ID3、CART、朴素贝叶斯、K 最近邻(KNN)、逻辑回归、多项逻辑回归支持向量机 (SVM) - 非线性和核方法 UNIT – III 监督学习 – II(神经网络)神经网络表示 – 问题 – 感知器、激活函数、人工神经网络 (ANN)、反向传播算法。分类指标:混淆矩阵、精度、召回率、准确度、F 分数、ROC 曲线。UNIT – IV 分类中的模型验证:交叉验证 - 保留方法、K 折、分层 K 折、留一交叉验证。偏差-方差权衡、正则化、过拟合、欠拟合。集成方法:Boosting、Bagging、随机森林。UNIT – V 无监督学习:聚类-K-均值、K-模式、K-原型、高斯混合模型、期望最大化。强化学习:探索和利用权衡、非关联学习、马尔可夫决策过程、Q 学习
机器学习的快速增长已大大改变了各种行业,包括健康,金融和自治系统。了解这个动态领域的趋势对于指导研究,分配资源和预期未来的发展至关重要。本研究通过研究科学文章的标题和摘要来解决2014年至2024年机器学习研究中进行全面趋势分析的必要性。通过提取描述性限定词,我们将文章分类为特定的主题,并随着时间的推移分析了它们的演变。我们的方法包括对预选赛的详细研究,对这些资格符与关联规则的共同存在的研究,文章的主题分类以及每个主题的趋势预测。关键发现突出了“人工神经网络和深度学习”等主题的持续突出以及“生成模型”等新领域的出现。分析显示研究重点的重大转变,并确定了一致的趋势,为该领域的发展提供了宝贵的见解。这项研究证明了文本挖掘技术在跟踪和预测研究趋势中的有效性。
地球科学中标记的培训数据的可用性反映在监督分析中使用的训练数据数量中。除了上述10年的分析外,我们还从2018 - 2019年的AGU论文中手动提取了其他相关信息,包括应用的ML算法,标记的培训数据的数量和数据类型(模型输出,卫星,原位,原位,重新分析等)。在我们调查的论文中,大多数ML算法是使用数百个标记样品培训的。但是,对于使用模型输出或大型,已建立的数据集的某些应用程序,培训数据的数量范围更大。缺乏训练数据在生物学科学和陆地水圈(水文)研究中尤其急切。