摘要 — 本项目尝试对亚马逊的短评论和长评论进行情绪分析,并报告其对监督学习支持向量机 (SVM) 模型的影响,以此作为虚假评论分类的桥梁。首先,通过与朴素贝叶斯、逻辑回归和随机森林模型进行比较来评估 SVM 模型,并证明其在准确率 (70%)、精确率 (63%)、召回率 (70%) 和 F1 分数 (62%) 方面更胜一筹(第二个假设)。超参数调整提高了 SVM 模型的情绪分析准确率(准确率为 93%),然后改变评论长度会影响模型的性能,这验证了评论长度会影响分类器(第一个假设)。其次,在虚假评论数据集上进行虚假评论分类,准确率为 88%,而两个数据集的合并子集的准确率为 84%。关键词 — 虚假评论检测、情绪分析、自然语言处理、机器学习 (ML) 监督学习
摘要:从 MRI 扫描中对肿瘤进行分类是一项关键的医学成像和诊断任务。传统的基于特征的方法和传统的机器学习算法用于肿瘤分类,这限制了它们的性能和泛化。本文实现了一个混合框架,用于使用 MRI 对脑肿瘤进行分类。该框架包含三个基本组件,即特征提取、特征融合和分类。特征提取模块使用卷积神经网络 (CNN) 自动从 MRI 图像中提取高级特征。高级特征通过特征融合模块与临床和人口统计特征相结合,以获得更好的判别能力。分类模块使用支持向量机 (SVM) 将融合特征分类为类标签肿瘤。所提出的模型获得了 90.67% 的准确率、94.67% 的精确率、83.82% 的召回率和 83.71% 的 f1 分数。实验结果证明了我们的框架优于现有解决方案,并且与所有其他常用模型相比获得了出色的准确率。这种混合深度学习框架在脑部 MRI 扫描中高效且可重复的肿瘤分类方面具有良好的表现。
摘要:在当今的信息时代,我们通常以远程信息处理的方式访问个人和专业信息,例如银行帐户数据或私人文件。为了确保这些信息的隐私,应准确开发用户身份验证系统。在这项工作中,我们专注于生物特征认证,因为它取决于用户的固有特征,因此可以提供个性化的身份验证系统。具体而言,我们提出了一种基于心电图 (EEG) 的用户身份验证系统,该系统采用单类和多类机器学习分类器。从这个意义上讲,本文的主要创新之处在于引入了孤立森林和局部异常因子分类器作为用户身份验证的新工具,并研究了它们与 EEG 数据的适用性。此外,我们确定了对身份验证贡献较大的 EEG 通道和脑电波,并将它们与传统的降维技术、主成分分析和 χ 2 统计检验进行了比较。在我们的最终提案中,我们详细阐述了一种使用孤立森林和随机森林分类器的抵抗随机伪造攻击的混合系统,最终获得 82.3% 的准确率、91.1% 的精确率和 75.3% 的召回率。
摘要 — 本研究探讨了将检索增强生成 (RAG) 集成到已使用混合专家 (MoE) 的 Mistral 8x7B 大型语言模型 (LLM) 中,以解决其在复杂信息检索和推理任务中现有的局限性。通过利用 Google BIG-Bench 数据集,我们进行了广泛的定量和定性分析,以评估增强模型的性能。结果显示准确率、精确率、召回率和 F1 分数均有显著提高,凸显了增强模型在生成语境丰富、准确且细致入微的响应方面的卓越能力。这种集成展示了一种克服传统 LLM 固有局限性的有希望的方法,标志着人工智能研究的关键进展。我们的研究结果有助于持续开发更具适应性、更高效、更智能的人工智能系统,为人工智能在各个领域的应用开辟新的途径。该研究承认与数据集范围和计算需求相关的限制,并为未来的研究提出了进一步完善和扩展模型适用性的方向。
摘要 — 癫痫是一种以反复发作、无诱因癫痫发作为特征的神经系统疾病,早期诊断对于有效的管理和治疗至关重要。然而,由于癫痫发作的微妙性质和大脑活动模式的复杂性,癫痫的诊断,特别是在早期阶段,仍然具有挑战性。在本研究中,我们引入了医学信息视觉转换器 (MIVT),这是一种深度学习架构,专门设计用于从多模态神经影像数据中改善早期癫痫诊断。我们的模型整合了医学知识和最先进的视觉转换器 (ViT) 的见解,以提高癫痫发作检测和定位的准确性和可解释性。MIVT 利用脑电图 (EEG) 丰富的空间和时间特征,使系统能够学习与早期癫痫发作前兆和生物标志物相对应的判别特征。我们在大型多模态癫痫数据集上证明了 MIVT 的有效性,其性能优于传统深度学习模型,即 Inception V3、ResNet-50、VGG-16 和 AlexNet,优势高达 17%。我们的结果表明,MIVT 模型的表现优于现有技术,诊断准确率为 93.55%,特异性为 88.89%,AUC 为 98.72%,精确率为 86.67%,召回率为 100%。它显示出弥合机器学习模型与临床实践之间差距的潜力。
脑肿瘤检测和监测对于任何指示系统都至关重要,多年的研究和诊断技术的稳步改进就是明证。因此,治疗计划对于提高患者的生活质量至关重要。有一种观点认为,深度学习可以帮助解决诊断和治疗脑肿瘤的困难。在这项工作中,我们引入了一种混合深度神经网络,它将最先进的图像增强方法(如对比度拉伸、直方图均衡化和对数变换)与迁移学习相结合,类似于 DenseNet169 和 ResNet149。这项工作深入探讨了如何提高 DCNN 预测的准确性和效率。对于数据选择,我们创建了自定义数据,这些数据来自 Br35H 和 Fig 共享存储库,其中包含增强后的良性、恶性和正常图像 (596,928,364)。性能分析了不同的场景,例如所有三种增强算法的数据都与每个神经网络一起训练并评估性能。性能结果表明,本文提出的研究成果对使用 DenseNet169 进行直方图均衡化的数据有显著的改进,准确率为 93.29%,精确率为 94%,召回率为 88%,得分率为 93%,损失率为 20.37%,是本文提出的所有训练神经网络中最高的矩阵。
摘要 - 数字医疗保健的新兴领域揭示了一种新颖的诊断工具:一款用于早期发现心脏病的数字听诊器,如本研究中所阐明。通过利用Phonocartiography的细微功能,该设备捕获了错综复杂的心脏声音,随后通过先进的机器学习算法处理。传统的听诊器虽然必不可少,但可能会错过微妙的异常 - 通过精心分析Phonocartiographic数据来解决这种数字对应物的问题,以表明心脏异常的丝毫偏差。随着数字听诊器深入研究听觉提示,机器学习组件辨别出人类审计师通常无法察觉的模式和不规则性。这些数字声学和计算分析的汇合不仅增强了早期心脏病诊断的准确性,而且还促进了这些数据的档案,从而实现了对心脏健康的持续纵向评估。最初涉足现实世界申请的企业登记了令人鼓舞的精确率,巩固了其作为先发制人心脏护理中宝贵的资产的潜力。通过这项创新,我们站在心脏病的诊断方式上的范式转移的风口浪尖上,迈向及时干预措施并改善患者的结果。
心理负荷在认知障碍中起着至关重要的作用。这种障碍指的是一个人在记忆、接受新信息、学习新事物、集中注意力或做出严重影响日常生活的决策方面存在困难。本文提出了基于同步容量 (SIMKAP) 实验的脑电图负荷分析,使用 45 名受试者进行多任务心理负荷估计,并计算受试者的注意力损失以及短期记忆损失测量。使用开放获取的预处理脑电图数据集,利用离散小波变换 (DWT) 进行特征提取,并使用最小冗余和最大相关性 (MRMR) 技术来选择最相关的特征。小波分解技术也用于将脑电图信号分解为五个子带。从每个子带信号计算出十四个统计特征以形成 5×14 的窗口大小。神经网络(窄)分类算法用于对低和高负荷条件的数据集进行分类,并使用一些其他机器学习模型进行比较。结果显示,分类器的准确率为 86.7%,精确率为 84.4%,F1 得分为 86.33%,召回率为 88.37%,与文献中最先进的方法相符。这一预测有望极大地促进记忆和注意力丧失障碍评估方法的改进。
摘要 - 数字领域中假新闻的扩散对公共话语构成了重大威胁,因此需要开发有效的检测机制。因此,本文介绍了针对检测假新闻的复发性神经网络(RNN)模型的经验分析,对其在测试数据集上的性能进行了深入的检查。RNN模型表现出非凡的准确性,在准确区分假新闻和真实新闻文章时达到了98.94%的成功率,低损失值为0.0372,表明分类任务的精度很高。关键性能指标进一步阐明了模型的功能:大约98.73%的精确率强调了该模型在识别假新闻方面的准确性。相比,大约99.07%的召回率强调了其在正确对数据集中的大多数假新闻实例进行分类方面的熟练程度。这些结果的综合(准确性,精度和回忆)证明了RNN模型的鲁棒性,作为歧视真正和捏造新闻内容的高度可靠的工具。这些发现不仅增强了模型在现实情况下的适用性,对于过滤错误信息至关重要,而且强调了其在维持信息完整性方面的潜力。这项研究为未来的研究和应用中的应用铺平了道路,这表明对该领域做出了重大贡献。
摘要:本研究论文全面介绍了使用先进图像处理和深度学习技术开发和评估脑肿瘤分类模型的研究。本研究的主要目标是利用原始数据集和增强数据集创建一个准确而强大的系统,用于区分脑肿瘤和正常脑图像。该研究以改善医学诊断为重点,旨在利用最先进的机器学习方法来提高脑肿瘤检测的性能。模型流程包括各种图像预处理步骤,包括裁剪、调整大小、去噪和规范化,然后使用 DenseNet121 架构进行特征提取,并使用 S 形激活进行分类。数据集被精心划分为训练、验证和测试集,重点是实现高召回率、精确度、F1 分数和准确度作为主要研究目标。结果表明,该模型取得了令人印象深刻的表现,训练召回率为 92.87%,精确率为 93.82%,F1 得分为 93.15%,准确率为 94.83%。这些发现凸显了深度学习和数据增强在增强脑肿瘤检测系统方面的潜力,支持了该研究的核心目标,即推动医学图像分析在临床应用中的发展。