Chat-GPT-4、AMBOSS 用户和 Chat-GPT-3.5 的准确率分别为 71.33%、54.38% 和 46.23%。在比较模型时,GPT-4 有了显着的改进,与 GPT-3 相比,准确率提高了 25%,试验间一致性提高了 8%(p<.001)。GPT 模型在第 1 步和第 2 步内容之间的性能相似。GPT-3.5 和 GPT-4 的表现因医学主题而异(p=.027,p=.002)。但是,没有明显的变化模式。随着问题难度的增加,GPT 模型和 AMBOSS 用户的性能均下降(p<.001)。但是,GPT-4 的准确率下降不太明显。与 AMBOSS 用户相比,GPT 模型的准确率随问题难度的变化较小,从最简单问题到最难问题的准确率平均分别下降 45% 和 62%。
对农业实验站田间采集的3,203幅病害数据图像进行了诊断,准确率较高,为79~99%,但对于导致叶片表面出现褐变症状的白粉病,由于数据量较少,准确率较低,仅为25%(表2)。对2,275张虫害图像数据进行了诊断。结果显示,蓟马(果实)、蚜虫(果实)、粉虱(叶背)在图像中拍摄到健康区域时诊断结果为健康的可能性较大,准确率较低。但其他虫害的准确率较高,在81%~100%之间(表3)。现场诊断结果与农业实验站现场诊断结果的准确率相似(未显示数据)。当检查使用智能手机诊断应用程序在现场拍摄的 632 张病害照片和 179 张虫害照片时,准确率大致相同(表 4,图 1)。对于推广讲师对诊断应用程序的可用性,应用程序的评价普遍良好,具有操作流程简单易懂、图标大且易于使用等特点。
对于其他机器学习模型,朴素贝叶斯的准确率达到 68.62%,而 SVM(支持向量机)的准确率达到 60.78%。同样,决策树模型的准确率也达到 68.62%。另一种集成技术 Bagging 的准确率达到 66.66%。有趣的是,结合预训练的 VGG-16 和 InceptionV3 模型的混合模型的准确率达到 68.92%。结果表明,卷积神经网络 (CNN) 是最成功的方法,在 MRI 扫描中实现脑肿瘤检测的最高准确率(86.27%)。这表明 CNN 特别擅长学习隐藏在 MRI 图像数据中的关键模式。关键词:磁共振成像 (MRI)、深度学习、卷积神经网络 (CNN)、多层感知器 (MLP)、迁移学习、InceptionV3、特征提取、主成分分析 (PCA)、准确度、VGG16、逻辑回归、随机森林、Ada Boosting、朴素贝叶斯、SVM、决策树、Bagging
本研究探讨了如何使用基于 Transformer 的模型(例如 BERT 和 DistilBERT)对 IMDb 电影评论进行情感分析。实验的目的是找到准确率和计算效率之间的平衡,评估两种模型在不同训练参数下的表现。BERT 在三个时期内达到了 91.39% 的峰值准确率,总共需要 54 分钟进行训练。另一方面,DistilBERT 仅用 38 分 25 秒就达到了 91.80% 的类似准确率。尽管准确率略有差异,但 DistilBERT 被证明是一种更高效的训练选择,因此成为资源有限环境的可行替代品。该研究结果与 R. Talibzade (2023) 的研究形成了对比,后者使用 BERT 获得了 98% 的准确率,但需要 12 小时的训练,说明了准确率和训练时间之间的平衡。未来可能的任务包括进一步完善、使用更大的数据集进行测试、研究替代的 Transformer 模型,以及利用更高效的训练方法来提高性能而不牺牲效率。这是一篇 CC BY-NC 许可下的开放获取文章
结果:对于三向分类,基于树的管道优化工具的自动机器学习的放射组学模型实现了 0.91 的测试微平均曲线下面积,准确率为 0.83,而基于特征选择方法 x 2 分数和广义线性模型分类器的最优化模型实现了 0.92 的测试微平均曲线下面积,准确率为 0.74。基于树的管道优化工具模型的准确率明显高于平均定性专家 MRI 成像审查(0.83 比 0.54,P,.001)。对于二元分类,基于树的管道优化工具模型对髓母细胞瘤与非髓母细胞瘤的曲线下面积为 0.94,准确率为 0.85,对室管膜瘤与非室管膜瘤的曲线下面积为 0.84,准确率为 0.80,对毛细胞星形细胞瘤与非毛细胞星形细胞瘤的曲线下面积为 0.94,准确率为 0.88。
近年来,语音机器人已成为人与机器之间流行的交流工具。在本文中,我们将介绍我们的语音机器人,它集成了 FPT.AI 提供的文本转语音 (TTS) 和语音转文本 (STT) 模块。这个语音机器人可以看作是对典型聊天机器人的重大改进,因为它可以通过文本和语音响应人类的查询。FPT Open Speech、LibriSpeech 数据集和音乐文件用于测试 STT 模块的准确性和性能。对于 TTS 模块,使用越南语和英语新闻页面上的文本进行测试。为了测试语音机器人,将寄宿家庭服务主题问题和非主题消息输入系统。TTS 模块在越南语文本测试中的准确率为 100%,在英文文本测试中的准确率为 72.66%。在 STT 模块测试中,FPT 开放语音数据集(越南语)的准确率为 90.51%,LibriSpeech 数据集(英语)的准确率为 0%,而音乐文件测试的准确率为 0%。语音机器人在测试中实现了 100% 的准确率。由于 FPT.AI STT 和 TTS 模块仅支持越南语以占据越南市场,因此使用 LibriSpeech 数据集进行测试的准确率为 0% 是合理的。
目的刺激初级躯体感觉皮层 (S1) 已成功在人类和动物身上唤起人工躯体感觉,但对于产生稳健躯体感觉感知所需的最佳刺激参数仍知之甚少。在本研究中,作者研究了频率作为闭环脑机接口 (BCI) 系统中人工躯体感觉的可调刺激参数。方法三名癫痫患者的 S1 手部区域上装有硬膜下微型皮层电图网格,要求他们比较不同刺激频率引起的感知。幅度、脉冲宽度和持续时间在所有试验中保持不变。在每次试验中,受试者体验 2 次刺激,并报告他们认为哪个刺激频率较高。我们使用了两种范例:首先,比较50 Hz 和 100 Hz 以确定比较频率的效用,然后伪随机比较 2、5、10、20、50 或 100 Hz。结果随着刺激频率的幅度增加,受试者描述的感觉“更强烈”或“更快”。总体而言,参与者在比较 50 Hz 和 100 Hz 的刺激时达到了 98.0% 的准确率。在第二种范例中,相应的总体准确率是 73.3%。如果两个测试频率都小于或等于 10 Hz,准确率是 41.7%,当一个频率大于 10 Hz 时,准确率上升到 79.4%(p = 0.01)。当两个刺激频率均为 20 Hz 或更低时,准确率是 40.7%,而当一个频率大于 20 Hz 时,准确率是 91.7%(p < 0.001)。在 50 Hz 为较高刺激频率的试验中,准确率为 85%。因此,检测的下限出现在 20 Hz,当测试较低频率时,准确率显著下降。在测试 10 Hz 和 20 Hz 的试验中,准确率为 16.7%,而测试 20 Hz 和 50 Hz 的试验中准确率为 85.7% (p < 0.05)。当频率差异大于或等于 30 Hz 时,准确率高于偶然性。结论大于 20 Hz 的频率可用作可调参数以引起可区分的感知。这些发现可能有助于告知未来 BCI 系统的设置和可实现的自由度。
摘要:风力涡轮机叶片 (WTB) 是由复合多层材料结构组成的关键子系统。WTB 检查是一个复杂且劳动密集型的过程,其失败会给资产所有者带来巨大的能源和经济损失。在本文中,我们提出了一种用于叶片复合材料的新型无损评估方法,该方法采用调频连续波 (FMCW) 雷达、机器人和机器学习 (ML) 分析。我们表明,使用 FMCW 光栅扫描数据,我们的 ML 算法(SVM、BP、决策树和朴素贝叶斯)可以区分不同类型的复合材料,准确率超过 97.5%。SVM 算法的性能最佳,准确率为 94.3%。此外,所提出的方法还可以获得检测表面缺陷的可靠结果:层间孔隙率,总体准确率为 80%。特别是,SVM 分类器的最高准确率达到 92.5% 至 98.9%。我们还展示了检测复合材料 WT 结构中 1 毫米差异的气孔的能力,使用 SVM 的准确率为 94.1%,使用 Naïve Bayes 的准确率为 84.5%。最后,我们创建了物理复合材料样品的数字孪生,以支持 FMCW 数据相对于复合材料样品特性的集成和定性分析。所提出的方法探索了一种用于复合材料非接触表面和地下的新型传感方式,并为开发替代的、更具成本效益的检测方法提供了见解
摘要 — 本项目尝试对亚马逊的短评论和长评论进行情绪分析,并报告其对监督学习支持向量机 (SVM) 模型的影响,以此作为虚假评论分类的桥梁。首先,通过与朴素贝叶斯、逻辑回归和随机森林模型进行比较来评估 SVM 模型,并证明其在准确率 (70%)、精确率 (63%)、召回率 (70%) 和 F1 分数 (62%) 方面更胜一筹(第二个假设)。超参数调整提高了 SVM 模型的情绪分析准确率(准确率为 93%),然后改变评论长度会影响模型的性能,这验证了评论长度会影响分类器(第一个假设)。其次,在虚假评论数据集上进行虚假评论分类,准确率为 88%,而两个数据集的合并子集的准确率为 84%。关键词 — 虚假评论检测、情绪分析、自然语言处理、机器学习 (ML) 监督学习
主要结果和偶然性的作用:生命耳语 AI 模型对可行胚胎的敏感性为 70.1%,而对来自不同诊所的三个独立盲测集的非可行胚胎的特异性为 60.5%。每个盲测集的加权总体准确率 > 63%,可行胚胎和不可行胚胎的综合准确率为 64.3%,表明模型的稳健性和普遍性超出了偶然性预期的结果。预测分布显示正确和错误分类的胚胎明显分离。可行/不可行胚胎分类的二元比较显示胚胎学家的准确率提高了 24.7%(P = 0.047,n = 2,学生 t 检验),5 波段排名比较显示胚胎学家的准确率提高了 42.0%(P = 0.028,n = 2,学生 t 检验)。