摘要 - 截止性的进步使产生的音乐更接近人类创造的作品,但是评估这些模型仍然具有挑战性。虽然人类的偏好是评估质量,将这些主观判断转化为客观指标的黄金规模,尤其是对于文本审计和音乐质量,但事实证明很困难。在这项工作中,我们使用12种最先进的模型生成了6K歌曲,并对15K成对音频比较与2.5k人类参与者进行了调查,以评估人类偏好与广泛使用的指标之间的相关性。据我们所知,这项工作是第一个基于人类偏好对当前最新音乐生成模型和指标进行排名的工作。为了进一步的主观度量评估领域,我们提供了对生成的音乐和人类评估数据集的开放访问。索引术语 - 音乐生成,评估指标,音频数据集,人类评估调查
无需进行物理(机械)接触,主要通过传输信号和由此产生的反射来了解表面、物体或现象。特别是,基于激光雷达(光检测和测距)和飞行时间信号处理的光学扫描已成为一种无处不在的技术,目前已提出了许多变体。这项技术最近受到学术界和工业生物力学界的广泛关注,这得益于人体扫描仪的不断发展。应用范围从可以快速捕获整个人体的 3D 人体扫描仪,例如用于假肢设计、生物力学运动分析、肿瘤表面扫描、健身扫描、法医分析、异常检测、数值生物力学模型生成(网格划分)和虚拟现实化身的创建。这种技术基于扫描激光雷达,它每秒产生数千个窄带宽脉冲并扫描一个域,使用信号飞行时间分析来确定表面轮廓。本质上,生成了立体 3D 图像。这
摘要 - 锂离子细胞可能会在以后的生活中经历快速降解,尤其是使用更多极端使用方案。快速降解的发作称为“膝盖点”,预测对电池的安全且经济上可行的用途很重要。我们提出了一种数据驱动的方法,该方法使用自动化特征选择为高斯工艺回归模型生成输入,该模型估计电池健康的变化,可以预测整个容量淡出轨迹,膝盖点和寿命。特征选择过程富有效地适应不同的输入,并优先考虑那些影响降解的输入。对于所考虑的数据集,发现在特定电压区域所花费的日历时间和时间对降解率的影响很大。该方法对1%以下的容量估计产生了中位根平方错误,并且还产生了膝关节中值和终止预测误差分别为2.6%和1.3%。
摘要。分析建筑模型的可用面积、建筑安全性或能源分析需要空间和相关对象的功能分类数据。自动化空间功能分类有助于减少输入模型准备工作量和错误。现有的空间功能分类器使用空间特征向量或空间连通性图作为输入。深度学习 (DL) 图像分割方法在空间功能分类中的应用尚未被研究。作为解决这一差距的第一步,我们提出了一个数据集 SFS-A68,它由 68 个公寓楼空间布局的数字 3D 模型生成的输入和地面真实图像组成。该数据集适用于开发用于空间功能分割的 DL 模型。我们使用该数据集训练和评估基于迁移学习和从头开始训练的实验空间功能分割网络。测试结果证实了 DL 图像分割对空间功能分类的适用性。
学习建模字符串之间的关系的学习是什么教授大型语言模型(LLMS)关于Vi-Sual世界的?我们系统地评估了LLMS生成和识别出增加复杂性的各种视觉概念的能力,然后演示如何使用文本模型来培训预先的视觉表示学习系统。由于语言模型缺乏将视觉信息作为像素消耗或输出视觉信息的能力,因此我们使用代码来表示研究中的图像。尽管LLM生成的图像看起来不像自然图像,但图像产生的结果以及模型校正这些固定图像的能力表明,字符串的精确建模可以教授有关Vi-Sual World的许多方面的语言模型。此外,使用文本模型生成的图像进行了自我监督的视觉表示学习的实验,突出了能够训练能够使用LLMS对自然IM的语义评估进行训练视觉模型的潜力。
尽管最近大语言模型(LLM)的扩散,但他们的培训配方 - 模型架构,培训数据和优化算法 - 通常非常相似。这自然提出了所得模型之间相似性的问题。在此过程中,我们提出了一个新颖的设置,虚构的问题回答(IQA),以更好地理解模型相似性。在IQA中,我们要求一个模型生成纯粹的虚构问题(例如,在物理学中的完全构成概念上),并促使另一个模型回答。令人惊讶的是,尽管这些问题完全是虚构的,但所有模型都可以以显着的一致性来回答彼此的问题,这表明了这些模型在此类幻觉中运行的“共同想象空间”。我们对这种现象进行了一系列研究,并讨论了这种模型均匀性对幻觉检测和计算创造力的含义。我们将在公共网站上发布并维护代码和数据。
摘要在收成期间缺乏遥感图像在估计农作物产量方面构成了重大挑战。这项研究通过使用条件生成对抗网络的基于病例的推理框架(CGANA-CBR)来克服这一挑战,以在收获期间生成农田的遥感图像。具体来说,该研究使用CGANA-CBR模型生成农田的遥感图像,然后使用这些生成的图像来补充缺乏收获周期数据的真实遥感图像,从而实现了数据增强。随后,训练了卷积神经网络(CNN)模型,以提高平均产量预测的准确性。结果表明,与仅在实际远程感应数据中训练的基线CNN模型相比,RMSE的CNN模型同时结合了实际数据和CGANA-CBR生成的数据,其平均降低为6.3%。研究还发现,训练持续时间和使用的数据量显着影响模型性能,这表明需要在该领域进行进一步研究。
当前的感知模型在很大程度上取决于资源密集型数据集,从而促使需要创新。通过从各种注释中构造图像输入来利用综合数据的最新进展,证明对下游任务有益。虽然先前的方法已单独解决了生成和感知模型,但首次降低了两者的谐调,从而解决了为感知模型生成有效数据的挑战。通过感知模型增强图像发生,我们引入了感知感知损失(P.A.损失)通过细分,提高质量和可控性。为了提高特定感知模型的性能,我们的方法通过提取和利用感知意识来定制数据(P.A.attr)在一代中。对象检测任务的实验结果突出显示了detDiffusion的统治性能,建立了布局引导的新最新作品。此外,降低的图像合成可以有效地增强训练数据,从而显着增强下游检测性能。
摘要 — 单独增强单个深度学习模型的鲁棒性只能提供有限的安全保障,尤其是在面对对抗性示例时。在本文中,我们提出了 DeSVig,这是一个去中心化的 Swift Vigilance 框架,用于识别工业人工智能系统 (IAIS) 中的对抗性攻击,使 IAIS 能够在几秒钟内纠正错误。DeSVig 高度去中心化,提高了识别异常输入的有效性。我们尝试使用特殊指定的移动边缘计算和生成对抗网络 (GAN) 来克服由行业动态引起的超低延迟挑战。我们工作最重要的优势是它可以显着降低被对抗性示例欺骗的失败风险,这对于安全优先和延迟敏感的环境至关重要。在我们的实验中,工业电子元件的对抗样本由几种经典的攻击模型生成。实验结果表明,DeSVig 比一些最先进的防御方法更强大、更高效、更具可扩展性。
2020 年 1 月 13 日至 17 日,在维也纳国际原子能机构总部,日本原子能机构、洛斯阿拉莫斯国家实验室和国际原子能机构核数据部门共同召开了一次特别会议,重点讨论了 Hauser-Feshbach 理论在裂变产物产量 (FPY) 评估和裂变建模中的应用。这次会议是为各研究所计划建立新的 FPY 数据库所做的准备工作。我们讨论了 Hauser-Feshbach 统计衰变模型的实施情况,以计算裂变碎片的去激发,并对各研究所可用的三个代码进行了相互比较——CCONE(日本原子能机构)、CoH/BeoH(洛斯阿拉莫斯国家实验室)和 TALYS(国际原子能机构)。讨论包括我们可以通过模型生成的裂变可观测量类型、初始碎片配置的估计(裂变后和瞬时粒子发射前),以及这些代码的未来开发,以使其适用于 FPY 数据评估。