第六代(6G)网络中的抽象进步,再加上车辆到所有设施(V2X)网络中多模式传感的演变,为转化性研究开放了用于多模式的人工智能(AI)应用程序的无线通信和网络管理和网络管理的途径。但是,这个有希望的研究方向通常受到合适数据集的有限可用性的限制。在响应中,本文介绍了一个综合的可配置共模拟框架,该框架集成了最先进的Carla和Sionna模拟器,以生成多模式多视图V2X(MVX)数据集。我们提出了基于AI的新型模型,以预测未来的视线(LOS)阻塞和最佳光束方向以及创新的天线位置优化(APO)解决方案,所有这些解决方案都是由多模式数据集MVX支撑的。我们的框架利用了协作感知,并通过集成激光雷达和无线数据来大大增强V2X通信。彻底的评估表明,我们的协作感知方法在准确性和效率方面优于梁和阻塞预测的传统方法。此外,我们评估了V2X系统中基础结构元素的重要性,并进行了一项计算研究,以说明我们的框架适用于各种操作方案,并且可以用作数字双胞胎解决方案。这项工作不仅通过为网络管理提供多功能框架来为V2X无线通信的领域做出了贡献,还为V2X无线通信环境中的AI应用程序中的多传感器融合的未来研究奠定了基础,以提高未来6G网络的效率和弹性。
糖尿病的全球患病率正在升级,估计表明,到2021年,超过5.366亿个人遭受了折磨,约占全球人口的10.5%。由于与不准确性的严重健康风险(例如低血糖和高血糖)相关的严重健康风险,糖尿病的有效管理,特别是对血糖水平的监测和预测,仍然是一个重大挑战。本研究通过采用混合变压器LSTM(长期短期内存)模型来解决这一关键问题,旨在根据连续葡萄糖监测(CGM)系统的数据增强未来葡萄糖水平预测的准确性。这种创新的方法旨在减少糖尿病并发症的风险并改善患者预后。我们使用了一个数据集,该数据集包含32000多个数据点,其中包括来自中国江苏省苏州市医院收集的八名患者的CGM数据。此数据集包括历史葡萄糖读数和设备校准值,因此由于其丰富性和实时适用性,它非常适合开发预测模型。我们的发现表明,混合变压器LSTM模型显着胜过标准LSTM模型,在预测间隔分别达到1.18、1.70和2.00的均方根误差(MSE)值分别为15、30和45分钟。这项研究强调了先进的机器学习技术在主动管理中的潜力,这是减轻其影响的关键一步。
摘要 - 关于基于相机和LIDAR的语义对象细分的批判性研究,用于自动驾驶的批判性研究显着受益于深度学习的发展。具体来说,视觉变压器是一种新型的突破性,将多头注意机制成功地带入了计算机视觉应用。因此,我们提出了一个基于视觉变压器的网络,以进行摄像机范围融合,以应用于自动驾驶的语义分割。我们的提案在双向网络上使用视觉变压器的新型渐进式策略,然后将结果集成到变压器解码器层上的交叉融合策略中。与文献中的其他作品不同,我们的摄像头融合变压器在诸如雨水和低照明之类的挑战性条件下进行了评估,表现出良好的性能。本文以不同的方式报告了对车辆和人类类别的分割结果:仅相机,仅LIDAR-和摄像头融合。我们对也用于语义分割的其他网络执行相机融合式传输(CLFT)的相干控制的基准实验。实验旨在从两个角度独立地评估CLFT的能力:多模态传感器融合和骨干架构。定量评估表明,与完全跨跨性神经网络网络(FCN)摄像头 - LIDAR-LIDAR融合神经网络相比,我们的CLFT网络可在具有挑战性的暗湿条件下获得高达10%的改善。我们的完整代码可在线提供交互式演示和应用程序1。与变压器主链与网络形成鲜明对比,但使用单一模态输入,全周围的改进为5-10%。
本研究探讨了如何使用基于 Transformer 的模型(例如 BERT 和 DistilBERT)对 IMDb 电影评论进行情感分析。实验的目的是找到准确率和计算效率之间的平衡,评估两种模型在不同训练参数下的表现。BERT 在三个时期内达到了 91.39% 的峰值准确率,总共需要 54 分钟进行训练。另一方面,DistilBERT 仅用 38 分 25 秒就达到了 91.80% 的类似准确率。尽管准确率略有差异,但 DistilBERT 被证明是一种更高效的训练选择,因此成为资源有限环境的可行替代品。该研究结果与 R. Talibzade (2023) 的研究形成了对比,后者使用 BERT 获得了 98% 的准确率,但需要 12 小时的训练,说明了准确率和训练时间之间的平衡。未来可能的任务包括进一步完善、使用更大的数据集进行测试、研究替代的 Transformer 模型,以及利用更高效的训练方法来提高性能而不牺牲效率。这是一篇 CC BY-NC 许可下的开放获取文章
组合优化在多样化的物流,制造,基因组学和合成生物学等多样化的领域中的许多现实应用中都起着至关重要的作用。这些问题及其复杂的变化的NP坚硬性质使它们难以解决。传统方法通常依赖于数十年研究的确切算法和启发式方法。但是,他们在可伸缩性和对其他问题的适应性方面挣扎。为了克服这些局限性,深度学习的成功导致了神经组合优化(NCO)的出现,后者从传统方法偏离了传统方法,以利用神经网络的概括能力。在这里,通过从数据中学习无需手动制定算法规则的数据,对神经网络进行了培训,从而生成了近乎最佳的解决方案。
音频denoising,尤其是在鸟类声音的背景下,由于持续的残留噪声,这仍然是一项具有挑战性的任务。传统和深度学习方法通常在人工或低频噪声中挣扎。在这项工作中,我们提出了VITV,这是一种新型的方法,利用了视觉变形(VIT)架构的力量。vitvs熟练地结合了分段技术,从而将清洁音频与复杂的信号混合物中解脱出来。我们的主要贡献涵盖了VITV的发展,引入了全面,远程和多规模的表示。这些贡献直接解决了常规方法固有的局限性。广泛的例子表明,VITV的表现要优于最先进的方法,将其定位为现实世界中鸟类声音降解应用的基准解决方案。源代码可用:https://github.com/aiai-4/vivts。索引术语:音频denoising,变压器,分段
近年来,深度学习方法因其解决复杂任务的能力而变得无处不在。然而,这些模型需要庞大的数据集才能进行适当的训练和良好的泛化。这意味着需要很长的训练和微调时间,对于最复杂的模型和大型数据集,甚至需要几天的时间。在这项工作中,我们提出了一种新颖的量子实例选择 (IS) 方法,该方法可以显着减少训练数据集的大小(最多 28%),同时保持模型的有效性,从而提高(训练)速度和可扩展性。我们的解决方案具有创新性,因为它利用了一种不同的计算范式——量子退火 (QA)——一种可用于解决优化问题的特定量子计算范式。据我们所知,之前还没有尝试使用 QA 解决 IS 问题。此外,我们针对 IS 问题提出了一种新的二次无约束二元优化公式,这本身就是一项贡献。通过对多个文本分类基准进行大量实验,我们通过经验证明了我们的量子解决方案的可行性和与当前最先进的 IS 解决方案的竞争力。
•科学发现:ASTS可用于分析和理解复杂的音频信号,从而在声学,神经科学和语言学等领域引起新的科学发现。•医疗应用:AST可以应用于医学研究,例如根据心脏,肺部或其他器官的音频信号诊断疾病。•教育工具:ASTS可用于开发教育音乐理论,语音疗法和其他与音频相关的学科的教育工具。总而言之,迅速训练的音频谱图变压器系统的开发有可能彻底改变音频处理和分析领域,并在各个行业和研究领域之间产生深远的影响
在生物医学领域中监督的命名实体识别(NER)取决于带有命名实体的大量带注释的文本。创建此类数据集可能是耗时且昂贵的,而新实体的提取需要其他注释任务并重新训练模型。本文提出了一种在生物医学领域中零和少量NER解决这些挑战的方法。该方法基于将多类令牌分类的任务转换为二进制令牌分类,并在大量数据集和生物医学实体上进行预训练,这使该模型可以学习给定和潜在的新颖命名实体标签之间的语义关系。,我们的零拍摄NER的平均F1得分为35.44%,单发NER为50.10%,10-Shot NER的平均F1得分为69.94%,在9种不同的具有基于微调PubMedbert模型的生物医学实体上,100-SHOT NER的平均F1得分为79.51%。结果证明了所提出的方法在识别没有或有限示例的新生物医学实体,优于先前的变压器方法,并且使用少于1000倍的参数的模型与基于GPT3的模型相媲美。我们公开制作模型并开发了代码。
摘要 - 采用人工智力来创建高度逼真的合成媒体,对隐私,安全性和错误信息传播构成了重大威胁。传统的深层检测方法,主要基于电流神经网络(CNN),通常在有效地识别这些复杂的伪造方面掉落。本项目探讨了平行视觉变压器(PVIT)用于深泡探测器的使用,利用其高级功能在建模复杂模式和视觉数据中的长距离依赖性中进行建模。我们使用NVIDIA A100 GPU的Google Colab培训了由140K真实和假面的数据集培训了PVIT模型。我们的结果表明,PVIT可显着提高检测准确性,精度,召回和鲁棒性,提供有希望的解决方案,以打击达到91.92精度的DeepFake技术所带来的挑战。索引术语 - 深层检测,平行视觉变形,以前,AI生成的,伪造的内容识别,变换,网络安全,数字取证,机器学习,深度学习。
