随着深度伪造技术的快速发展,深度伪造语音的检测变得越来越具有挑战性。在本文中,我们提出了一种用于深度伪造语音检测的混合架构,将用于特征提取的自监督学习框架与分类器头相结合,形成端到端模型。我们的方法结合了音频级和特征级增强技术。具体而言,我们介绍并分析了用于增强原始音频频谱图和在训练期间增强特征表示的各种掩蔽策略。我们在特征提取器的预训练阶段加入了压缩增强,以解决小型单语言数据集的局限性。我们在 ASVSpoof5(ASVSpoof 2024)挑战赛上对该模型进行了评估,在封闭条件下在 Track 1 中取得了最佳结果,等错误率为 4.37%。通过使用不同的预训练特征提取器,该模型实现了 3.39% 的增强 EER。我们的模型表现出了抵御未知深度伪造攻击的强大性能,并在不同的编解码器中表现出了强大的泛化能力。
作为供应链的复杂性和动态挑战传统管理方法,集成大型语言模型(LLM)和知识图(KGS)是推进供应链分析的有前途的方法。本文提出了一种方法,该方法旨在利用LLMS和KGS之间的协同作用,特别着眼于增强供应商发现实践。主要目标是将大量的非结构化供应商能力数据转换为统一的KG,从而改善供应商的发现过程并增强制造商的可访问性和发现性。通过本体驱动的图形构建过程,提出的方法将KGS和基于LLM的先进的自然语言处理技术整合在一起。借助详细的案例研究,我们展示了这种综合方法不仅如何提高答案质量并提高中小型制造商的可见性,还可以增强敏捷性,并为供应链管理提供战略见解。[doi:10.1115/1.4067389]
引言人类专业知识和人工智能的融合正在彻底改变云本地和虚拟化的电信解决方案,到2026年,全球电信AI市场预计将达到167亿美元,从2021年起的复合年增长率为38.4%[1]。这种变革性的合作伙伴关系表现出了显着的结果,组织报告网络停机时间降低了47%,在实施网络管理的混合人类AI系统时,运营效率提高了35%。来自国际电信联盟(ITU)的最新研究表明,使用AI-增强人类运营的电信提供者平均达到了42%的事件响应时间,而与传统人类只有人类手术相比,伪造正警报的降低了56%[2]。这些混合系统的实施也导致了大量成本节省,主要电信提供商报告说,在部署的第一年内,平均降低了31%的运营费用。人类专业知识与AI功能之间的协同作用已被证明在网络优化方面特别有效,在该网络优化中,与人类运营商一起工作的AI算法平均提高了28%的网络吞吐量,而将延迟降低了45%。这项合作使电信提供商能够在过去五年中处理数据流量增加300%,而基础架构成本的比例增加。这种增强的安全姿势已经变得越来越关键,因为自2019年以来,网络攻击每年增长了89%。在安全行动领域中,人类AI合作伙伴关系表现出了非凡的结果,组织报告的威胁检测准确性提高了73%,而安全事件的平均分辨率(MTTR)降低了62%。
本文介绍了一种创新的检索增强生成方法,以进行相似性搜索。所提出的方法使用生成模型来捕获细微的语义信息并基于高级上下文理解检索相似性分数。该研究重点介绍了包含从生物医学领域提取的100对句子的生物群数据集,并引入了相似性搜索相关结果,这些结果优于先前在该数据集上获得的句子。通过对模型敏感性的深入分析,研究确定了最佳条件,导致最高相似性搜索准确性:结果揭示了较高的Pearson相关评分,在0.5的温度下达到0.905,并且提示中提供的20个示例的样本大小为20个示例。这些发现强调了生成模型进行语义信息检索的潜力,并强调了相似性搜索的有希望的研究方向。
摘要 目的:本文回顾了现有的定性研究文献,这些文献涉及人们使用辅助和替代沟通 (AAC) 进行交流的经验。进行这次回顾的目的是更多地了解人们使用 AAC 进行交流时所重视的价值观和结果。进行这次回顾是为了更深入地了解这些经验,为制定患者报告结果测量 (PROM) 提供参考。材料和方法:对现有的定性研究文献进行定性证据综合,以探索和评估有关使用 AAC 的人的经验的当前知识。结果:从 115 份定性研究报告中,确定了 19 篇论文直接回答了研究问题和回顾的目的。确定了可以在由价值观、结果和背景结构组成的先验框架内组织的数据。结论:这次回顾使人们对需要 AAC 的人的经历有了更深入的分析理解。结果表明,一组概念可用于指导 PROM 的开发。 PROM 可用于帮助临床医生和研究人员更好地了解需要 AAC 的人的观点并评估干预措施。结果还鼓励专业人员重新考虑与需要 AAC 的人一起工作时使用的术语和方法,并反思影响人们沟通体验的多维因素。
由肢体损失,衰老,中风和其他运动缺陷造成的移动性障碍是全球数百万个人面临的重大挑战。先进的辅助技术,例如假肢和矫形器,有可能大大改善此类个人的生活质量。这些技术设计中的关键组成部分是对肢体受损的参考联合运动的准确预测,这受到这些患者可用的关节运动数据的稀缺性的阻碍。为了解决这个问题,我们提出了一种新型的模型,重新利用了深度学习的重新编程属性,结合了网络反转原理和检索绘制的映射。我们的方法适应了最初为健全的个体设计的模型,以预测肢体受损患者的关节运动,而不会改变模型参数。我们通过广泛的经验研究对低于膝盖挑战的患者的数据进行了广泛的经验研究,证明了重新映射的功效,从而证明了对传统转移学习和微调方法的显着改善。这些发现对截肢,中风或衰老的患者的辅助技术和流动性具有显着影响。
摘要:裂纹表征是工业部件和结构的 NDT&E(无损检测与评估)的核心任务之一。如今,执行此任务所需的数据通常使用超声相控阵收集。许多超声相控阵检查都是自动化的,但对其产生的数据的解释却不是。本文提供了一种设计可解释的 AI(增强智能)以应对这一挑战的方法。它描述了一个名为 AutoNDE 的 C 代码,它包括一个基于改进的全聚焦方法的信号处理模块,该方法可创建被评估样本的一系列二维图像;一个图像处理模块,用于过滤和增强这些图像;以及一个可解释的 AI 模块 - 决策树,它选择可能存在裂纹的图像,将那些看起来代表相同裂纹的图像分组,并为每个组生成一份可能的检查报告,供人工检查员审阅。AutoNDE 已在实验室收集的 16 个数据集上进行了训练,这些数据集通过对带有大型光滑平面缺口(包括嵌入式和表面破损)的钢样本进行成像而收集。它已在另外两个类似的数据集上进行了测试。本文介绍了此次训练和测试的结果,并详细描述了一种处理超声波数据中主要误差源(样本表面的起伏)的方法。
∗ 通讯作者电子邮件地址:hugo.bruneliere@imt-atlantique.fr(Hugo Bruneliere)、{vittoriano.muttillo,romina.eramo}@univaq.it(Vittoriano Muttillo、Romina Eramo)、luca.berardinelli@jku。 (Luca Berardinelli)、agomezlla@uoc.edu (Abel G´omez)、{alessandra.bagnato,andrey.sadovykh}@softame.fr (Alessandra Bagnato、Andrey Sadovykh)、antonio.cicchetti@mdu.se (Antonio Cicchetti)
以最近出版的三本关于人工智能 (AI) 的商业书籍为起点,我们探讨了管理领域的自动化和增强概念。自动化意味着机器接管人类的任务,而增强则意味着人类与机器密切合作完成任务。从规范立场来看,这三本书建议组织优先考虑增强,因为它们与卓越绩效有关。我们使用更全面的悖论理论视角,认为在管理领域,增强不能与自动化截然分开。这两种人工智能应用在时间和空间上相互依赖,产生了一种矛盾的紧张关系。过分强调增强或自动化会加剧强化循环,对组织和社会产生负面影响。但是,如果组织采用包括自动化和增强的更广泛视角,它们就可以应对这种紧张关系,实现有益于企业和社会的互补性。根据我们的见解,我们得出结论,管理学者需要参与组织中人工智能的使用研究。我们还认为,需要对当前开展人工智能研究的方式进行重大改变,以便开发有意义的理论并为实践提供合理的建议。
在物理治疗,理解和分析患者运动(尤其是步态模式受损)方面的摘要对于有效的康复至关重要。传统上,实习治疗师通过与真实患者和教科书的动手经验获得这些技能。但是,这些方法受到患者的可用性以及治疗师可以观察到的动作的可变性的限制。为了解决这些局限性,我们提出了一个新型系统,该系统使治疗师可以从步态运动受损的广泛障碍中学习,而不会受到时间,位置或患者的可用性的限制。该系统利用HumanML3D数据集和组合Text2Length采样和Text2Motion生成的两步框架。在第一步中,分类模型根据输入文本描述预测运动长度。在第二步中,我们使用时间变异自动编码器(VAE)来生成各种且一致的3D运动序列。我们方法的关键组成部分是从Momask框架中利用残留矢量量化(RVQ),该框架可最大程度地减少误差并增强运动的精度。此外,蒙版的变压器确保合成的运动令牌在时间上是一致的,并且在上下文上是准确的。通过HumanML3D数据集进行了验证,我们的系统为物理治疗师提供了沉浸式和交互式工具,在混合现实环境中启用了动态的,特定于患者的运动模拟。通过弥合常规方法和MR辅助培训之间的差距,该方法使用交互式3D表示来改变治疗师的学习方式。它旨在彻底改变治疗培训,使康复策略更加有效和个性化。