变异自动编码器(VAE)[19,41]是一个人口,深,潜伏的模型(DLVM),这是由于其简单而有效的数据用于建模数据分布。优化VAE目标函数比其他DLVM更易于管理。VAE的瓶颈维度是一个至关重要的设计选择,并且对模型的性能具有很强的冲突,例如使用VAE学到的代表来找到数据集的隐藏解释因素。但是,VAE的潜在维度的大小通常被视为通过反复试验和误差经验估计的高参数。为此,我们提出了一个统计公式,以发现建模数据集所需的潜在因素。在这项工作中,我们在潜在空间中使用层次先验,使用编码数据估算潜在轴的方差,该数据标识了相关的潜在维度。为此,我们用层次的先验代替了VAE客观功能中的固定先验,使剩余的配方保持不变。我们将所提出的方法称为变异自动编码器(ARD-VAE)1中的自动相关性检测。我们证明了ARD-VAE在多个基准数据集中找到相关的LATENT尺寸及其对不同评估的效果(例如FID得分和分离分析分析)的疗效。
资产管理计划(AMP)的目的是提供一个框架,以支持安理会公司土地和财产资产的开发和管理,以实现理事会公司战略中规定的优先事项。该计划概述了理事会对所有公司资产有效管理资源计划的方法。如RIC(皇家特许测量师)公共部门资产管理指南所述,AMP阐明了关键目标,并确定了优先的活动和资源以实现目标。AMP主要关注普通基金(GF)中的土地和建筑物(固定资产)和特殊费用(SE)预算。这不包括住房收入帐户(HRA)中的资产。它还通过环境维护(EMT)服务(例如开放空间,乡村公园,游乐区和公墓)进行每日运营管理和维护的项目。它还排除了理事会拥有的街头家具和其他可移动资产。自从先前的管理计划于2015年达成协议以来,当局内部发生了重大变化,要求理事会就如何管理普通基金中的财产和资产进行新的商业观点。
本文将DSBA提示提示大型语言模型作为可解释的指标共享任务,在其中将系统提交给两个曲目:小和大型摘要轨道。具有高级大语言模型(LLM),例如GPT-4,评估自然语言生成(NLG)的质量已变得越来越重要。传统的基于相似性的会议(例如BLEU和Rouge)已证明与人类评估不一致,并且不适合开放式的一代任务。为了结束这个问题,我们探讨了基于LLM的指标,尤其是杠杆开源LLM的潜在性能。在这项研究中,采用三种方法对广泛的提示和提示技术进行了系统的分析:提示策略,得分聚集和可显而易见。我们的研究着重于配置有效的及时模板,确定NLG质量得分的粒度以及评估中文示例对基于LLM的评估的影响。此外,将三种聚合策略进行比较,以鉴于汇总NLG质量得分的最可靠方法。为了检查解释性,我们制定了一种策略,该策略生成了分数的比例,并分析了开源LLMS产生的解释的特征。广泛的实验提供了有关开源LLM的评估功能的见解,并提出了有效的提示策略。1
混合现实 ( MR ) 技术的最新进展为各个领域带来了新的研究方法和干预措施,并使得高度沉浸式的用户体验设计成为可能。由此,虚拟现实 ( VR ) 和增强现实 ( AR ) 研究已成为人机交互的核心主题。为了衡量这些体验,研究人员采用了多种研究方法,使用客观或主观指标 [ 2 ]。客观指标包括行为指标(如注视方向、运动幅度)、生理指标(如 EEG、EDA、ECG)和表现指标(如时间记录、成功率)。通过标准化或定制问卷进行主观自我报告仍然是一种广泛应用于中期和后期体验衡量的方法,例如存在感 [ 30 ] 或使用虚拟化身体现自我 [ 29 ]。另外,VR 为用户体验的非阻碍性评估方法提供了广泛的机会,例如使用生物信号进行客观测量 [ 26 , 27 ] 或行为测量 [ 32 , 36 ]。许多这些测量方法都是从 MR 之外的用例改编而来的,其中交互通常不太具有沉浸感,并且它们在 MR 实验中的使用有效性尚未得到验证。然而,研究人员面临着各种挑战和
基于概念的解释方法,例如Conept瓶颈模型(CBMS),旨在通过将这些概念准确地归因于Net-Net Work的特征空间的关键假设,旨在通过将其决策与人为理解的概念联系起来,以提高机器学习模型的可解释性。但是,这种基本假设尚未得到严格验证,主要是因为该领域缺乏标准化的群众和基准来评估此类概念的存在和空间对齐。为了解决这个问题,我们提出了三个指标:概念全球重要性指标,概念存在和概念位置指标,包括一种可视化概念激活的技术,即概念激活映射。我们基准了事后CBM,以说明其能力和挑战。通过定性和定量实验,我们证明,在许多情况下,即使是由事后CBMS确定的最重要的概念也不存在于输入图像中。此外,当它们存在时,其显着性图无法通过在整个对象上激活或误导相关概念特异性区域来与预期区域保持一致。我们分析了这些局限性的根本原因,例如概念的自然相关性。我们的发现不需要更仔细地应用基于概念的解释技术,尤其是在空间解释性至关重要的环境中。
摘要 热失控及其传播是集装箱式锂离子电池储能系统中的主要安全问题。虽然传导驱动的传播受到了广泛关注,但与通过故障电池排出的热气体传播相关的热危害仍未完全了解。排出的气体会通过向系统其他部分传热并造成潜在的燃烧危险,从而导致集装箱系统的整体安全问题。在这项工作中,我们在热传播模型 LIM1TR(带有一维热失控的锂离子建模)中验证了热失控电池排出气体的特性。特别是,我们根据 Archibald 等人(消防技术,2020 年)进行的实验,评估了单个电池和多电池阵列的排出气体的演变、排出时间和温度曲线。虽然评估了几种用于估计排气时间的指标,但基于 CO 2 生成的指标得出的预测结果一致。模拟预测的排气气体释放和排气时间与实验期间估计的一致。模拟分辨率和其他模型参数,尤其是使用颗粒内扩散限制器,在预测排气时间方面发挥着重要作用。
摘要 — 本文总结了里诺市太阳能加储能系统的弹性评估指标的开发和实施情况。拟议的弹性评估指标旨在帮助地方政府、政策制定者和建筑业主做出明智的决策和计划,以增强电力供应的弹性。评估指标是根据极端事件的历史数据、历史停电数据、停电成本和关键负载的分类制定的,以确定停电的可能性、预期持续时间和平均成本。持续时间少于 24 小时的事件不属于弹性评估指标的制定范围。所提出的方法可以根据选定的参数(例如地点、关键负载的类型和特征以及太阳能和储能系统的规模)进行弹性评估。美国大陆的十个地区和联邦紧急事务管理局 (FEMA) 确定的领土用于对不同地点的极端事件类型进行分类。尽管仅凭太阳能和储能的弹性价值可能无法证明对某些弹性增强项目的投资是合理的,但太阳能和储能在其生命周期内的累积价值(弹性价值、收入、避免成本等)将成为衡量不同投资方案的重要指标。建议的弹性评估方法在里诺市的公共安全中心进行了演示。索引术语 — 能源存储、极端事件、弹性指标、弹性评估、太阳能
随着业界和学术界的研究界继续塑造第六代 (6G) 无线网络的范围,显然许多新颖的应用和服务将在其初期出现,包括扩展现实、沉浸式多媒体、全息通信、网络和计算融合、多维感知、普适智能、工业 4.0 及以后的连接 [1]。基于人工智能 (AI)/机器学习 (ML) 的无线接入网络 (RAN) 自动化、管理、编排和优化技术是 O-RAN 架构基础的关键因素,也是未来 6G 演进的关键支持技术之一。事实上,非实时 (Non-RT) 和近实时 (Near-RT) RAN 智能控制器 (RIC) 目前是这些支持 RAN 智能的技术的两个主要主机。然而,在 AI/ML 驱动的解决方案能够大规模商业部署并开始在未来创造真正的商业价值之前,整个行业仍有许多问题和挑战需要解决。要实现如此广泛的用例,需要满足一系列不同的要求,而前几代无线网络很难满足这些要求。为此,各种最先进的技术已成为 6G 用例的关键推动因素,其中数字孪生 (DT) 脱颖而出,成为促进 6G 无线网络设计、分析、操作、自动化和智能化的极有希望的候选技术 [2]。
摘要 中国古典诗歌的自动生成一直是人工智能领域的难题。近年来,编码器-解码器模型为诗歌生成提供了一些可行的方法。但回顾以往的方法,仍存在两个主要问题:1)大多数都是单阶段生成方法,没有进一步的润色;2)它们很少考虑诗歌本身的限制,如声调、韵律。直观地看,一些中国古代诗人倾向于先写一首粗诗,然后再考虑其语义;而另一些人则先写一首语义诗,然后再细化其美学。在此基础上,为了更好地模仿人类的诗歌创作过程,我们提出了一种两阶段方法(即受限润色生成方法),其中每个阶段关注诗歌的不同方面(即语义和美学),从而可以生成更高质量的诗歌。这样,两阶段方法就发展成为两种对称的生成方法,即美学到语义的方法和语义到美学的方法。具体来说,我们设计了一种采样方法和一个门来制定声调和韵律的限制,这可以进一步改善生成的诗歌的节奏。实验结果表明,我们提出的两阶段方法在自动评估指标和人工评估指标方面都优于基线,特别是在声调和韵律方面取得了持续的改进。
摘要:受信息理论与高能物理之间日益密切的联系的启发,特别是在 AdS/CFT 对应的背景下,我们探索了与各种简单系统相关的信息几何。通过研究它们的 Fisher 度量,我们得出了一些普遍的教训,这些教训可能对信息几何在全息术中的应用具有重要意义。我们首先证明所研究的物理理论的对称性在最终的几何中起着重要作用,而 AdS 度量的出现是一个相对普遍的特征。然后,我们通过研究经典 2d Ising 模型和相应的 1d 自由费米子理论的几何形状,研究 Fisher 度量保留了有关底层理论物理的哪些信息,并发现曲率在两侧的相变处恰好发散。我们以相干自由费米子态为例,讨论了将度量置于理论空间与状态空间所产生的差异。我们还澄清了文献中关于度量和非度量连接的不同平坦度概念的一些误解,这对如何解释几何曲率具有启示意义。我们的结果表明,一般来说,在将某些模型中产生的 AdS 几何与 AdS/CFT 对应联系起来时需要谨慎,并寻求为这一激动人心的领域的未来发展提供一套有用的指导方针。