随着建筑、工程和施工行业拥抱数字化时代,建筑资产的设计、施工和运营过程中涉及的流程越来越多地受到处理传感器网络数据的增值监控、在以语义模型为基础的安全弹性存储系统中管理这些数据以及工程系统的模拟和优化的技术的影响。除了提高价值链的效率外,此类信息密集型模型和相关技术在最大限度地减少建筑物生命周期影响方面发挥着决定性作用。虽然建筑信息模型提供了程序、技术和数据模式,可以实现建筑组件和系统的标准化语义表示,但数字孪生的概念通过利用网络物理双向数据流的同步性,传达了涉及复杂工件的更全面的社会技术和面向过程的特征。此外,BIM 在控制系统(包括传感器网络、社会系统和建筑物范围之外的城市文物)等领域缺乏语义完整性,因此需要一种整体的、可扩展的语义方法,将不同级别的动态数据考虑在内。本文回顾了 BIM 在施工阶段的多方面应用,并强调了限制和要求,为建筑数字孪生的概念铺平了道路。然后给出了这种概念的定义,并从基础研究主题的角度进行了描述,同时阐述了未来的研究领域。
随着建筑、工程和建设行业正在拥抱数字化时代,建筑资产的设计、建造和运营所涉及的流程越来越多地受到以下技术的影响:对来自传感器网络的数据进行增值监控,在以语义模型为基础的安全有弹性的存储系统中管理这些数据,以及对工程系统进行模拟和优化。除了提高价值链的效率之外,这些信息密集型模型和相关技术在最大限度地减少建筑的生命周期影响方面还发挥着决定性的作用。建筑信息模型提供了实现建筑组件和系统标准化语义表示的程序、技术和数据模式,而数字孪生的概念则通过利用信息物理双向数据流的同步性,对所涉及的复杂工件进行更全面的社会技术和面向过程的特征描述。此外,BIM 在控制系统(包括传感器网络、社会系统和建筑物范围以外的城市文物)等领域缺乏语义完整性,因此需要一种整体的、可扩展的语义方法,将不同级别的动态数据考虑在内。本文回顾了 BIM 在施工阶段的多方面应用,并强调了限制和要求,为建筑数字孪生的概念铺平了道路。
许多研究表明,情节记忆是一种生成性,但是大多数计算模型都采用存储视图。在这一文献中,我们提出了一个情节记忆的生成方面的模型。是基于中心假设,即海马商店和回复发作的方面作为记忆痕迹,这是不完整的。在召回中,新皮层在我们称为半完整的过程中根据一般语义信息合理地填充了缺失的零件。该模型结合了从机器学习,矢量定量的变异自动编码器(VQ-VAE)和像素卷积神经网络(PixelCNN)中知道的两个神经网络体系结构。作为情节,我们使用代表上下文的不同背景的数字和时尚项目(MNIST)的图像。该模型能够以语义上合理的方式完成内存跟踪的丢失部分,直到可以从头开始生成合理的图像,并且可以很好地概括为未经训练的图像。压缩也
(未经同行评审认证)是作者/资助者。保留所有权利。未经许可不得重复使用。此预印本的版权所有者此版本于 2022 年 9 月 29 日发布。;https://doi.org/10.1101/2022.09.29.509744 doi:bioRxiv preprint
词嵌入是使用计数或预测技术构建的矢量语义表示,旨在从词语共现中捕捉含义的细微差别。自从它们被引入以来,这些表示就因缺乏可解释的维度而受到批评。词嵌入的这种特性限制了我们对它们实际编码的语义特征的理解。此外,它导致了它们所用于任务的“黑箱”性质,因为词嵌入性能的原因通常对人类来说仍然是模糊的。在本文中,我们探索了词嵌入中编码的语义属性,将它们映射到可解释的向量上,由明确的和神经生物学驱动的语义特征组成(Binder 等人,2016 年)。我们的探索考虑了不同类型的嵌入,包括分解计数向量和预测模型(Skip-Gram、GloVe 等),以及最新的情境化表示(即 ELMo 和 BERT)。
词嵌入是使用计数或预测技术构建的矢量语义表示,旨在从词语共现中捕捉含义的细微差别。自从它们被引入以来,这些表示就因缺乏可解释的维度而受到批评。词嵌入的这种特性限制了我们对它们实际编码的语义特征的理解。此外,它导致了它们所用于任务的“黑箱”性质,因为词嵌入性能的原因通常对人类来说仍然是模糊的。在本文中,我们探索了词嵌入中编码的语义属性,将它们映射到可解释的向量上,由明确的和神经生物学驱动的语义特征组成(Binder 等人,2016 年)。我们的探索考虑了不同类型的嵌入,包括分解计数向量和预测模型(Skip-Gram、GloVe 等),以及最新的情境化表示(即 ELMo 和 BERT)。
摘要。随着机器学习(ML)场的迅速发展,ML管道的数量,复杂性和组件不断增长。在线平台(例如OpenML,Kaggle)旨在收集和传播ML实验。但是,可用知识的分散,每个平台代表ML过程的不同组成部分或相互区域的组件,但以不同的方式。为了解决这个问题,我们利用语义Web技术来建模和集成ML数据集,实验,软件和科学作品纳入MLSEA,这是一种资源:(i)MLSO,一种模拟ML数据集,管道和实现的本体论; (ii)MLST,分类法,其中包含ML知识的收集为受控词汇; (iii)MLSEA-kg,一个RDF图,其中包含来自不同来源的ML数据集,管道,实现和科学作品。MLSEA为改善ML管道的搜索,解释性和可重复性铺平了道路。
解释摄像机数据是自主行动系统(例如自动驾驶汽车)的关键。在现实世界环境中运行的视觉系统必须能够解释其周围环境,并需要能够处理新型情况。本文解决了开放世界的分段,即解释训练过程中未见对象的图像数据的变体。我们提出了一种新的方法,该方法可以执行确定性封闭世界的语义分割,同时可以识别新类别,而无需任何适当的培训数据。我们的方法1另外,为图像中的每个新发现的类与已知类别提供了相似性度量,这在下游任务(例如计划或映射)中可能是有用的信息。通过广泛的实验,我们表明我们的模型在已知的训练数据以及异常分割的类别上实现了最新的结果,并且可以区分不同的未知类别。
摘要 — 语义文本相似性是估计两个文本含义之间的相似性的任务。在本文中,我们通过部分调整模型然后端到端调整,在语义文本相似性基准上对 Transformer 架构进行微调,以实现语义文本相似性。我们通过将问题作为二分类任务或回归任务来尝试 BERT、RoBERTa 和 DeBERTaV3 交叉编码器。我们结合 Transformer 模型的输出,并使用手工制作的特征作为增强算法的输入。由于测试集结果较差,加上验证集的改进,我们尝试使用不同的数据集拆分来进一步调查这种情况。我们还提供了错误分析,重点关注预测范围的边缘。索引术语 — 语义文本相似性、Transformer、增强算法、自然语言处理
语义技术有助于创建和管理概念模型(也称为本体),并将概念模型应用于大规模和分散的信息系统,以促进对数据和元数据的共同理解。语义数据容器管理是一种基于本体的方法,用于组织数据集并自动发现满足特定信息需求的数据集 [8]。语义数据容器方法目前正在空中交通管理 (ATM) 领域的合作研究项目 BEST (http://project-best.eu) 中开发。语义容器由数据项和元数据组成,它们提供了数据项要成为语义容器的一部分所要满足的成员条件的高级描述。成员条件通常描述数据项的地理空间和时间范围,