4.1 相关文献 ........................................................................................................................... 82 4.1.1 标准 ................................................................................................................................ 82
©版权Microai™,Inc2024 Microai™徽标以及与Microai™产品和服务相关的任何其他商标是Microai™的独家属性,Inc。本文档的内容可以随时并由Microai自行决定更改。
考虑不同的场景,例如全球石油和天然气行业的工业方面。当混合数据(例如来自油井、地震数据、运输数据或钻井生产数据)没有统一标记时,可能会给资本项目带来昂贵的复杂性。对于运营数千口气井的公司,当需要升级其监控和数据采集系统(基于专有数据通信格式)时,新聘请的供应商必须重新创建数据通信格式,从而花费公司 180,000 美元。2 标准化数据标记将消除此类情况。
考虑另一种情况,例如全球石油和天然气行业的工业方面。当混合数据(例如来自油井的数据、地震数据、运输数据或钻井生产数据)没有统一标记时,可能会给资本项目带来高昂的复杂性。以一家运营数千口天然气井的公司为例,当需要升级其监控和数据采集系统(基于专有数据通信格式)时,新聘请的供应商必须重新创建数据通信格式,从而花费该公司 180,000 美元。2 标准化数据标记将消除此类情况。
N 元关系知识库 (KB) 嵌入旨在将二进制和超二进制事实同时映射到低维向量空间中。现有方法通常将 n 元关系事实分解为子元组,并且通常在欧几里得空间中对 n 元关系知识库进行建模。然而,n 元关系事实在语义和结构上是完整的;分解会破坏语义和结构的完整性。此外,与二进制关系知识库相比,n 元知识库具有更丰富和复杂的层次结构,这些结构无法在欧几里得空间中很好地表达。针对这些问题,我们提出了一个陀螺多边形嵌入框架来实现 n 元事实完整性保持和层次结构捕获,称为 PolygonE。具体而言,n 元关系事实被建模为双曲空间中的陀螺多边形,其中我们将事实中的实体表示为陀螺多边形的顶点,将关系表示为实体移位操作。重要的是,我们设计了一种基于顶点陀螺中心测地线的事实可信度测量策略,以优化关系调整后的陀螺多边形。实验结果表明,PolygonE 在所有基准数据集上都表现出 SOTA 性能,并且在二进制数据上具有良好的泛化能力。最后,我们还可视化了嵌入,以帮助理解 PolygonE 对层次结构的认识。
摘要 - 传统数据驱动的质量预测方法主要是由静态模型构建的,使用慢速采样率的清洁数据,使得dynamics未使用。为了充分利用以快速采样率收集的动态过程数据,本文提出了一种新型的基于深度学习的鲁棒双率动态数据建模方法,以质量预测动态非线性过程。首先提出了一种新的动态数据降级性对抗归因网络,以解决动态过程数据之间缺少的价值插补。然后,建立了一个新的提示卷积神经网络(HCNN),用于基于双速率数据的质量预测。提出的HCNN将通道扩展的信息提示机理纳入卷积神经网络中,以使用明确的时间和可变信息提取动态特征。最后,使用DOW蒸馏过程数据集和北京多站点空气质量数据集对所提出的方法进行了验证。
对抗性学习类通过训练生成器 - 分歧仪对进行数据建模,其中生成器的作业是输出看起来像培训数据集中的数据示例,而歧视器的作业是尽力不信任生成器的输出。另一方面,GenerativeDiffusion类通过将训练图像逐渐弥补,直到被散布的Markov过渡来进行数据建模,直到它变成纯粹的噪声。此过程称为正向过程,与反向过程相互作用,该过程以纯粹的各向同性高斯噪声开头,然后逐渐降解以恢复训练图像。DeNoiser的可学习参数成为您正在寻找的概率数据模型。
我们断言,在企业级工作的数据建模人员面临的问题也是一个与标准相关的问题,尽管这可能不太明显。这些信息系统中捕获的信息必须对企业中不同但相关的群体的成员有意义。这些群体所做的分析工作通常是在标准的背景下完成的,其中包括标准化的术语和实践。我们在这里指的是比系统工程师通常遇到的纯技术类型的标准更广泛的标准 - 其中包括疾病的标准化名称,例如国际疾病分类 (ICD)(世界卫生组织,2010 年)或动物的标准化名称(国际动物命名委员会,1999 年)。这种类型的标准早于信息系统和用于定义信息系统的正式标准。例如,ICD 的历史至少可以追溯到 19 世纪 50 年代(世界卫生组织,2010 年)。我们将此类标准称为以人为本的标准,因为它们的目的是支持协调的人类分析工作。正是在这里,数据建模者面临的问题与这些以人为本的标准交织在一起。只要数据建模者设计的信息系统支持企业内不同团队的人类所做的分析工作,它们就必须对反映或基于以下信息进行编码:
图 3. 调查投标模式。改编自 S. Zimmermann 的《利用数据和透明度打击公共采购中的腐败》 - 使用 WBG 和国家数据进行数据建模