摘要:目的:本研究旨在评估各种降维方法(包括主成分分析 (PCA)、拉普拉斯评分和卡方特征选择)对脑电图 (EEG) 数据集分类性能的影响。方法:我们应用了降维技术,包括 PCA、拉普拉斯评分和卡方特征选择,并使用线性回归、K 最近邻 (KNN) 和朴素贝叶斯分类器评估了它们对 EEG 数据分类性能的影响。对模型的分类准确性和计算效率进行了评估。结果:我们的研究结果表明,所有降维策略通常都能提高或保持分类准确性,同时减少计算负荷。值得注意的是,PCA 和 Autofeat 技术可提高模型的准确性。结论:使用降维技术可以通过减少计算需求而不影响准确性来增强 EEG 数据分类。这些结果表明,这些技术有可能应用于既需要计算效率又需要高精度的场景。本研究中使用的代码可在https://github.com/movahedso/Emotion-analysis找到。
单元 1 人工智能与机器学习简介 06 小时人工智能的历史、人工智能与数据科学的比较、机械工程中人工智能的需求、机器学习简介。基础知识:推理、问题解决、知识表示、规划、学习、感知、运动和操纵。人工智能方法:控制论和大脑模拟、符号、亚符号、统计。机器学习方法:监督学习、无监督学习、强化学习。单元 2 特征提取与选择 08 小时特征提取:统计特征、主成分分析。特征选择:排名、决策树 - 熵减少和信息增益、穷举、最佳优先、贪婪前向和后向、特征提取和选择算法在机械工程中的应用。单元 3 分类与回归 08 小时分类:决策树、随机森林、朴素贝叶斯、支持向量机。回归:逻辑回归、支持向量回归。回归树:决策树、随机森林、K-Means、K-最近邻(KNN)。分类和回归算法在机械工程中的应用。
方法:本研究分析了马来西亚卫生信息中心 2017 年 1 月至 2022 年 6 月的死亡记录,这些记录已编入 ICD-10。数据匿名化符合道德标准,经过质量检查后,共纳入 387,650 份死亡登记。数据集仅限于三位数的 ICD-10 代码,经过清理和 80:20 的训练测试分割。预处理涉及 HTML 标签删除和标记化。ML 方法,包括 BERT(来自 Transformer 的双向编码器表示)、Gzip+KNN(K 最近邻)、XGBoost(极端梯度提升)、TensorFlow、SVM(支持向量机)和朴素贝叶斯,都已针对自动 ICD-10 编码进行了评估。使用 Amazon SageMaker(亚马逊网络服务,华盛顿州西雅图)对模型的准确度、F1 分数、精确度、召回率、特异性和精确度-召回率曲线进行了微调和评估。敏感性分析解决了不平衡数据场景,增强了模型稳健性。
摘要:经过人类数千年的努力,产生了大量的音乐流派。因此,寻找能够自动对音乐流派进行分类的算法已成为现代数字音乐产业发展的关键问题。此外,找出哪种算法可以更准确地完成任务可以大大提高实际应用中的效率,例如根据用户最常听的音乐发送用户感兴趣的音乐。本研究比较了几种音乐流派分类算法的使用,并证明了音乐流派分类在现代数字应用中的重要性,并确定了不同算法的优缺点。本研究主要集中在使用 GTZAN 数据集的 K-最近邻 (KNN) 和卷积神经网络 (CNN) 上。本研究讨论了 CNN 捕捉复杂时间和频谱模式的能力,以及 KNN 在基于特征接近度进行流派识别的有效性。结果证明了 KNN 的可靠性、准确性和适应性。为算法在技术驱动的音乐产业中的实际应用提供了见解。
1. 简介 10900 1.1. 什么是人工智能? 10901 1.2. 关于数据的重要性和良好实践 10902 1.3. 监督和无监督方法 10903 1.4. 超参数 10903 1.5. 最常用的机器学习方法 10904 1.5.1. 神经网络 10904 1.5.2. 决策树、随机森林、Boosting 和 Bagging 方法 10905 1.5.3. 支持向量机 10905 1.5.4. k-最近邻 10905 1.5.5. 基于概率的方法 10905 1.5.6. 生成模型和逆向设计 10906 1.6. 编程语言和平台 10907 1.7.提纲/范围 10907 2. 材料设计与合成应用 10908 2.1. 材料发现 10908 2.1.1. 活性电极材料 10909 2.1.2. 固体电解质 10911 2.1.3. 液体电解质 10912 2.2. 材料的加速多尺度建模 10913 2.3. 实验规划、材料筛选与合成 10915 2.4. 前景与挑战 10916 3. 电极与电池制造应用 10917
最近的研究通过周期性地驱动门定义量子点阵列中的最近邻交换相互作用,展示了量子自旋链中离散时间晶体物理的新途径 [H. Qiao 等人,Nat. Commun. 12,2142 (2021)]。在这里,我们对 GaAs 量子点小阵列中交换驱动的 Floquet 物理进行了详细分析,包括相图和其他诊断。我们还表明,新兴的时间晶体行为有利于多自旋态的保护和操纵。对于 GaAs 中典型的核自旋噪声水平,驱动和相互作用的结合将纠缠态的相干时间增加了几个数量级。对于其他量子点系统(例如 Si),也可以获得类似的结果。我们进一步展示了如何在单重态-三重态量子比特之间构建具有高保真度的时间晶体启发的 CZ 门。这些结果表明,周期性驱动交换耦合可以增强量子点自旋系统在量子信息应用中的性能。
摘要:机器学习和深度学习都是人工智能的一部分,对全球的市场营销和消费者产生了巨大的影响。然而,从神经网络发展而来的深度学习算法通常被视为黑箱,因为它们的网络结构和权重无法被人类用户解释。一般来说,银行业的客户有权知道他们的申请为何被黑箱算法的决策拒绝。本文提出了一种实用的嫁接方法,将全局模型和局部模型结合成可解释人工智能的混合模型。两个基于决策树的模型被用作全局模型,因为它们具有高度的可解释性,可以作为混合模型的骨架或蓝图。另外两个模型,包括深度神经网络和 k-最近邻模型,被用作局部模型,分别提高准确性和可解释性。实施了一个财务困境预测系统,以评估混合模型的性能和所提出的嫁接方法的有效性。实验结果表明,基于终端节点嫁接的混合模型可能会提高准确性和可解释性,具体取决于所选择的局部模型。
• 在第二种方法中,利用了著名的生理信号处理和情绪分析数据集 DREAMER。为了减少噪音和伪影,对数据进行了预处理,并提取了特征。然后,使用支持向量机 (SVM) 和 K-最近邻 (KNN) 分类方法根据个体的 EEG 数据对个体的效价和唤醒度进行分类。在确定用户的情绪状态后,将每首音乐分配到不同的情绪类别,以提供音乐推荐。这使系统能够做出与用户情绪状态相匹配的个性化音乐推荐。该策略旨在利用机器学习技术和 EEG 数据分析来提供更精确和定制的音乐推荐系统。该策略具有广泛的潜在应用,因为它可能会提高音乐流媒体服务的效率并改善整体聆听体验。这种方法还可能对心理健康产生影响,因为它可以通过建议个性化的音乐选择来帮助治疗悲伤和焦虑等疾病,从而提升情绪。
摘要. 在本研究中,我们研究了随机环境中的定向聚合物 (DPRE) 的情况,此时随机游走的增量是重尾的,尾部指数等于零(P [ | X 1 | ≥ n ] 的衰减速度比 n 的任何幂都慢)。这种情况还没有在定向聚合物的背景下进行研究,并且与简单对称随机游动情况以及增量属于 α 稳定定律的吸引域的情况(其中 α ∈ (0, 2))存在关键区别。我们建立了对每个无序分布都不存在非常强的无序区域 - 即自由能在每个温度下都等于零。我们还证明了强无序区域(分配函数在低温下收敛到零)可能存在或不存在取决于随机游动的更精细性质:我们建立了从弱无序到强无序的相变的非匹配必要充分条件。特别是我们的结果意味着对于这种定向聚合物模型,非常强的无序并不等同于强无序,这为关于原始最近邻 DPRE 的长期猜想提供了新的见解。
人工智能 (AI) 革命已成事实。经过多年开发机器学习 (ML) 和深度学习 (DL) 方法,几乎所有科学和生活分支都将采用或已经采用 AI 方法。为了澄清术语,机器学习算法历来是创建处理数据的系统的第一步,使用专家规则、模糊逻辑、启发式算法或决策规则等技术,以推理的形式提供输出,以模拟人类的决策过程。这是一个广阔的领域,机器学习和深度学习方法就是从这个领域发展而来的。机器学习算法使用统计技术,例如线性回归、多项式回归、逻辑回归、决策树、支持向量机 (SVM)、k-最近邻 (KNN) 和人工神经网络。借助这些方法,计算机系统可以从分析的数据中学习,执行分类和预测。深度学习算法在数据处理和分析中使用人工神经网络和大数据数据集。深度学习模型使用先进的多层神经网络模型,例如循环神经网络 (RNN) 或卷积神经网络 (CNN)。