鉴于通过扩散模型在图像生成中取得的显着成就,研究界表明,对将这些模型扩展到视频生成的兴趣越来越大。视频生成的最新扩散模型主要利用注意层提取时间特征。但是,注意层受其记忆消耗的限制,这随序列的长度四倍增加。在尝试使用扩散模型生成更长的视频序列时,这一限制提出了重大挑战。为了克服这一挑战,我们提出了利用状态空间模型(SSM)。SSM最近由于其线性记忆消耗相对于序列长度而成为可行的替代方案。在实验中,我们首先使用UCF101(视频生成的标准基准)评估了基于SSM的模型。此外,为了调查SSM对更长的视频生成的潜力,我们使用Minerl导航数据集执行了一个实验,将帧数变化为64、200和400。在这些设置中,我们的基于SSM的模型可以为更长的序列节省内存消耗,同时将竞争性的FVD分数保持在基于注意力的模型中。
多年来,人类已经对周围的世界形成了一定的认知。根据这种认知,通过简短的解释很容易描述复杂的结构。例如,告诉一个人“想象一艘黄色潜水艇在天空中飞行”,这个人就会对你所说的机器有一个准确的印象,尽管他以前从未见过它。与此同时,人工智能成为一个快速发展的研究领域,人工智能有可能让计算机获得对世界的感知。人工智能可以用来解决问题,而不需要指定如何解决已确定的任务。本文概述了二维图像识别的特点和三维模型的创建,并相应地使用了人工智能和机器学习。因此,这将使设计师的工作变得更加轻松,平面设计师和建筑师将能够只关注特定的特征,而不必在实际绘图上花费大量时间。此外,如果模型是通过计算生成的,开发过程将变得更加简单,并且可以提高开发人员的性能率。这项工作的主要目的是定义 CNN 用于 3D 模型生成的可能限制,同时考虑输出分辨率和生成速度。
摘要:如果说人工智能通常被表示为一种非物质的、去领土化的机构,那么本文则试图将这项技术的发展重新物质化,使人工智能模型生成中的水消耗变得可见。借鉴后人类中心设计研究和超人类相互依存的概念,我们描述了“混合生态”,这是一个将人工智能与水这种超人类机构之间的关系问题化的装置。该装置是一种克服自然与技术之间二分法的设计探索,证明了人工智能如何栖息在由人类机构和陆地生态系统之间相互依存的关系构成的混合生态系统中。我们试图将对人工智能的思考从以人为本的设计方法转移到以地球为中心的设计,这种设计基于相互依存和超人类未来的理念。混合生态是一种实验性的努力,旨在开启关于人工智能的陆地条件的讨论,敦促设计利用其能力与我们居住的超人类世界建立更好的联盟。
摘要 - 脑启发的超维度计算(HDC),也称为矢量符号结构(VSA),是一种急剧的“非von neumann”计算方案,该方案模仿人脑功能以处理信息或使用抽象和高维模式来处理信息或执行学习任务。与深神经网络(DNN)相比,HDC显示出诸如紧凑的模型大小,能量效率和少量学习的优势。尽管有这些优势,但HDC的一个不足的区域是对抗性的鲁棒性。现有的作品表明,HDC容易受到对抗性攻击的攻击,在这种攻击中,攻击者可以在原始输入中添加少量扰动到“傻瓜” HDC模型,从而产生错误的预测。在本文中,我们通过开发一种系统的方法来测试和增强HDC对对抗性攻击的鲁棒性,系统地研究HDC的对抗性鲁棒性,并具有两个主要成分:(1)TestHD,这是一种可以为给定的HDC模型生成高素质高素质的测试工具,该工具可以为给定的HDC模型生成高素质的高素质数据; (2)GuardHD,它利用TestHD生成的对抗数据来增强HDC模型的对抗性鲁棒性。testHD的核心思想建立在模糊测试方法之上。我们通过提出基于相似性的覆盖率度量来定制模糊方法,以指导TestHD连续突变原始输入,以生成可能触发HDC模型不正确行为的新输入。由于使用差异测试,TestHD不需要事先知道样品的标签。为了增强对抗性鲁棒性,我们设计,实施和评估GuardHD以捍卫HDC模型免受对抗数据的影响。GuardHD的核心思想是一种对抗探测器,可以通过测试HDD生成的对抗样本训练。在推断期间,一旦检测到对抗样本,GuardHD将用“无效”信号覆盖词典结果。我们评估了4个数据集和5个对抗性攻击方案的提议方法,具有6种对抗生成策略和2种防御机制,并相应地比较了性能。GuardHD能够区分精度超过90%的良性和对抗性输入,比基于对抗性训练的基线高达55%。据我们所知,本文在系统地测试和增强对这种新兴脑启发的计算模型的对抗数据的鲁棒性方面提出了第一个全面的努力。索引术语 - 远程计算,差异绒毛测试,对抗攻击,强大的计算
通过分析主要火灾因素来确定森林火灾概率水平,可以为森林经理提供对诸如防火策略,燃油管理,消防安全措施,紧急计划以及消防团队安置等问题做出关键决策的基础。主要影响火灾因素,包括植被因素,地形因素,气候因素以及与某些特征(如道路和住宅区)的邻近性,被认为是产生森林火灾概率图。机器学习(ML)算法已成为预测森林射击概率的有效工具。这项研究旨在通过使用与地理信息系统(GIS)Tech Niques集成的两个常用ML模型(LR)和支持向量机(SVM)来生成森林火灾概率图。这项研究是在位于Türkiye的地中海城市安塔利亚市的Elale Forest Enterprise Enterprise(FEC)实施的。在研究中,影响火灾的因素是树种,冠状,树阶段,坡度,方面以及通往道路的距离。 在模型的训练阶段考虑了从2001年至2021年在FEC中发生的森林大火。 使用曲线(AUC)值的区域(AUC)值验证了火灾概率图的精度。 由于执行ML模型,在地图上进行了47 086点的估计,该估计分为五个火灾概率水平(非常高,高,中,中,低和非常低)。 根据概率图,超过一半的森林在研究区域具有很高/高的火灾概率水平。在研究中,影响火灾的因素是树种,冠状,树阶段,坡度,方面以及通往道路的距离。在模型的训练阶段考虑了从2001年至2021年在FEC中发生的森林大火。使用曲线(AUC)值的区域(AUC)值验证了火灾概率图的精度。由于执行ML模型,在地图上进行了47 086点的估计,该估计分为五个火灾概率水平(非常高,高,中,中,低和非常低)。根据概率图,超过一半的森林在研究区域具有很高/高的火灾概率水平。结果表明,LR模型生成的火概率图的准确性更好(AUC = 0.845),比SVM模型生成的MAP的准确性(AUC = 0.748)。
本文研究了人工智能对创新的影响,利用一种新材料发现技术随机引入一家大型美国公司研发实验室的 1,018 名科学家。人工智能辅助的研究人员发现了 44% 以上的材料,从而使专利申请量增加了 39%,下游产品创新量增加了 17%。这些化合物具有更新颖的化学结构,并带来了更激进的发明。然而,这项技术对生产力分布的影响截然不同:虽然底层三分之一的科学家几乎没有看到任何好处,但顶尖研究人员的产出几乎翻了一番。通过研究这些结果背后的机制,我发现人工智能使 57% 的“创意生成”任务自动化,将研究人员重新分配到评估模型生成的候选材料的新任务上。顶尖科学家利用他们的领域知识优先考虑有希望的人工智能建议,而其他人则浪费大量资源测试误报。总之,这些发现展示了人工智能增强研究的潜力,并强调了算法和专业知识在创新过程中的互补性。然而,调查证据表明,这些收益是有代价的,82% 的科学家表示,由于创造力下降和技能利用不足,他们对工作的满意度降低。
摘要 - 报告了持续努力对定制数字化采样器的失真行为进行建模,以准确测量动态信号。这项工作是美国国家标准与技术研究所 (NIST) 正在进行的努力的一部分,旨在推动波形采样计量的最新发展。本文介绍了具有 -3-dB 6-GHz 带宽的采样器的分析误差模型。该模型源于对相平面中采样器误差行为的检查。该模型将信号幅度、一阶导数和二阶导数的每次采样估计值作为输入,其中导数与时间有关。该模型的解析形式由这些项中的多项式组成,这些多项式是从考虑数字化器输入电容的电压依赖性和先前研究的前代数字化器中的误差行为而选择的。在 1 GHz 时,当将模型生成的样本校正应用于波形时,总谐波失真可从 -32 dB 改善至 -46 dB。还考虑并校正了采样系统中的时间基失真的影响。在模型中加入二阶导数依赖性可通过对拟合波形进行精细的时间调整来改善模型与测量数据的拟合。
摘要。自从 CRISPR-Cas9 问世以来,这项突破性的基因编辑技术可以通过短 RNA 引导序列实现精确的基因组修饰,该技术在各个领域的可及性和应用显著增加。CRISPR-Cas9 的成功刺激了进一步的投资,并导致了更多 CRISPR 系统的发现,包括 CRISPR-Cas13。与针对 DNA 的 Cas9 不同,Cas13 针对 RNA,为基因调控提供了独特的优势。我们专注于 Cas13d,这是一种以其附带活性而闻名的变体,它在激活后会非特异性地切割相邻的 RNA 分子,这是对其功能至关重要的特征。我们介绍了 DeepFM-Crispr,这是一种新型深度学习模型,旨在预测 Cas13d 的靶向效率并评估其脱靶效应。该模型利用大型语言模型生成富含进化和结构数据的综合表示,从而增强对 RNA 二级结构和整体 sgRNA 功效的预测。基于转换器的架构处理这些输入以产生预测功效分数。对比实验表明,DeepFM-Crispr 不仅超越了传统模型,而且在预测准确性和可靠性方面也优于最近最先进的深度学习方法。
摘要:近几年,无人驾驶飞行器 (UAV) 受到越来越多的关注,以执行各种应用,如军事、农业和医疗领域。众所周知,无人机不仅容易受到软件意外故障的影响,而且容易受到环境的影响。因此,安全性应在设计时被视为主要要求,因为飞行器的任何意外行为或任何危险都会导致潜在风险。为了在任务期间保持其安全运行,提出了一种基于网络条件事件系统 (NCES) 的故障安全机制。故障安全机制是一种控制逻辑,用于指导在发生危险时执行的风险降低措施。为了使用形式化模型生成这样的控制器,所提出的过程分为三个阶段:(1)第一阶段包括根据文献中的反应方法进行危险识别和分析,(2)第二阶段允许使用标准 ISO 13849 进行风险评估,以及(3)第三阶段包括执行重新配置场景以在分析安全要求的同时降低风险。使用形式化方法的动机是,事实证明,它们有助于在早期设计阶段确保开发过程的可靠性。我们以一个医疗无人机为例,展示了我们提案的适用性和可行性。
摘要。我们提出了4DIFF,这是一个解决Exo-to-ego视图转换任务的3D引起的扩散模型 - 从相应的第三人称(Exentric)图像中生成第一人称(Ego-go-Imentric)查看图像。建立扩散模型生成光地式图像的能力,我们提出了一个基于变压器的扩散模型,该模型通过两种机制对几何学进行了评分:(i)Egocentric Point Cloud Rasterization和(II)3D意识到的旋转旋转交叉注意。以中心的点云栅格化将输入外向图像转换为以自我为中心的布局,后者随后被扩散图像变压器使用。作为扩散变压器的DeNoiser块的组成部分,3D感知的旋转跨注意事件进一步结合了从源exentric视图中的3D信息和半出现特征。我们的4DIFF在挑战性和多样化的自我exo4d多视图数据集上实现了状态的结果,并展示了对训练期间未遇到的新型环境的强大概括。我们的代码,处理过的数据和预处理的模型可在https://klauscc.github.io/4diff上公开获取。