摘要:沥青路面裂缝构成了表面材料的普遍和严重的困扰,在选择适当的维修策略之前,必须对劣化的类型进行分类以识别根本原因。有效的检测和分类最大程度地减少伴随成本,并同时增加路面服务寿命。这项研究采用了使用Crack500数据集和GitHub提供的其他数据集可用的辅助数据,采用卷积神经网络(CNN)进行沥青路面裂纹检测。此数据集具有四种类型的裂纹。:水平,垂直,对角线和鳄鱼。还对ImageNet训练的五个预训练的CNN模型也接受了培训和评估以进行转移学习。紧急结果表明,有效网络B3是最可靠的模型,并获得了94%F1_SCORE和94%精度的结果。通过对ImageNet预先训练的权重进行转移学习和对CNN进行微调,通过在同一数据集上进行了培训。结果表明,修改模型以96%的F1_SCORE和96%的精度显示出更好的分类性能。通过将ImageNet重量的有效传输和对有效网络B3架构的顶层进行微调以满足分类要求的有效转移,可以实现这种高分类的精度。最后,混乱矩阵表明,某些类别的裂纹在概括方面的性能要比其他裂纹更好。因此,需要进一步的进一步进步,以微调的预训练模型。这项研究表明,高分类结果是由于使用ImageNet权重的成功转移学习和微调而产生的。
ChatGPT 模型使用预训练过程,该过程涉及预测缺失单词或单词序列中的下一个单词。此过程允许模型学习自然文本中单词之间的底层结构和关系,从而使其能够对提示生成连贯且像人类一样的响应。为了对 GPT 进行微调以用于像 ChatGPT 这样的对话聊天机器人任务,该模型随后在大量对话文本数据集上进行训练,其中输入输出对代表常见的对话轮次。该模型经过微调,可根据其对训练数据中的模式和关系的理解来预测对给定输入提示的最可能响应。
供应链网络对于行业的运营效率至关重要,但其日益复杂的特性给映射关系和识别各种实体的角色带来了巨大挑战。构建供应链网络的传统方法严重依赖结构化数据集和手动数据收集,限制了其范围和效率。相比之下,自然语言处理 (NLP) 和大型语言模型 (LLM) 的最新进展为使用非结构化文本数据发现和分析供应链网络提供了新的机会。本文提出了一种新方法,利用 LLM 从公开来源提取和处理原始文本信息以构建全面的供应链图。我们以土木工程领域为例,展示了 LLM 如何揭示公司、项目和其他实体之间的隐藏关系。此外,我们对 LLM 进行了微调,以对供应链图中的实体进行分类,从而提供有关其角色和关系的详细见解。结果表明,特定领域的微调提高了分类准确性,凸显了 LLM 在行业特定供应链分析中的潜力。我们的贡献包括为土木工程领域开发供应链图,以及增强实体分类和供应链网络理解的微调 LLM 模型。
摘要全球诊断出的医疗状况最少的是抑郁症。已经证明,当前的抑郁症早期检测的经典程序不足,这强调了寻求更有效的方法克服这一挑战的重要性。最有希望的机会之一是在人工智能领域中引起的,因为基于AI的模型可能有能力提供快速,广泛访问,无偏见和有效的方法来解决此问题。在本文中,我们比较了三个不同数据集上的三种自然语言过程模型,即Bert,GPT-3.5和GPT-4。我们的发现表明,通过微调的BERT,GPT-3.5和GPT-4在从文本数据中识别抑郁症方面显示了不同水平的功效。通过比较诸如准确性,精确度和回忆等指标的模型,我们的结果表明,即使没有以前的微调,GPT-4都优于BERT和GPT-3.5模型,即使没有以前的微调,也可以在文本数据上使用其巨大的潜力来用于自动抑郁症检测。在本文中,我们介绍了新介绍的数据集,微调和模型测试过程,同时还解决了局限性并讨论了未来研究的进一步考虑。
摘要:以心电图 (ECG) 的形式获取有关心脏电活动的信息已成为监测患者心律和功能的标准方法。它用于诊断各种心脏异常,如心律失常和其他心脏病。然而,解释心电图需要训练有素的医生的专业知识,因此需要自动对此类信号进行分类的工具。在本研究中,我们训练深度卷积神经网络 (CNN) 对心电图搏动进行正常和异常的二元分类。在对从 MIT-BIH 心律失常数据库中选择的一组不同心电图进行通用网络预训练后,我们使用迁移学习来构建针对特定患者数据进行微调的模型。然后,我们将微调网络的性能与仅对单个患者的心电图数据进行训练的单个网络的性能进行比较,以评估迁移学习对给定问题的整体效果。我们在两种情况下都取得了不错的结果,因为单个分类器在测试集上的平均平衡准确率为 94.6%,而微调模型的准确率略差,为 93.5%。关键词:心电图分类、CNN、医学成像、迁移学习
• 多模态大型语言模型。 • 由 OpenAI 创建 • 经过预训练以预测下一个标记。 • 通过强化学习进行微调。 • 可以将图像和文本作为输入。
目前,在公司专有代码库上微调商业生成 AI 模型所需的工作量,以及这种微调对特定商用生成模型的有效性仍不得而知。至少在不久的将来,这项工作和相关成本可能会超出某些组织的能力范围。但潜在价值如此巨大,以至于我们认为,任何拥有大量开发人员的大型组织如果不紧急探索这一机会,就会损害其利益相关者的利益。任何拥有大量遗留代码库的大型公司的概念验证都将在很大程度上展示该技术的潜力——并可能使该组织在竞争中占据优势。