摘要。知识图完成(KGC,也称为链接预测)旨在预测知识图中的缺失实体和关系(kgs)。知识图嵌入(KGE)技术已被证明对链接预测有效。术语,一系列基于卷积的神经网络(CNN)基于模型(例如,凸出及其扩展模型)已获得了极好的链接预测。但是,尚未同时考虑和增强使用CNN的链接预测重要的几个方面,这显着限制了这些模型的性能。在本文中,我们探讨了一个基于CNN的有效KGE模型。我们调查并发现了四个极大的方面,这些方面对引体具有强大的影响:实体和嵌入式,实体与 - 关系相互作用方法,CNN结构和损失函数。基于上述四个方面的优化,我们提出了一种称为CONVEICF的新型KGE方法。通过广泛的实验,我们发现传达的FB15K-237和WN18RR数据集优于先前的最新链接预测基准。尤其是,ConveICF获得@10分别比FB15K-237和WN18RR数据集的10分的10分和6.5%。此外,通过深入的典范,我们观察到一种有趣的现象,并且重要的是,只要添加掉落操作,就可以在KGE中非常常见的1-N评分技术得到改善。我们的代码可在https://github.com/neu-idke/conveicf上找到。
知识图嵌入(KGE)是用于知识图完成的有效且可扩展的方法。但是,大多数现有的KGE方法都遭受了多种关系语义的挑战,这常常会降低其性能。这是因为大多数KGE方法都学习实体(关系)的固定连续向量,并做出确定性实体预测以完成知识图,这几乎无法捕获多个关系语义。为了解决这个问题,预先的作品试图学习复杂的概率嵌入,而不是固定的嵌入,但遭受了严重的计算复杂性。相比之下,本文提出了一个简单而有效的框架,即知识图扩散模型(KGDM)以捕获预测中的多个关系语义。它的关键思想是将实体问题的问题投入到条件实体生成中。具体而言,KGDM通过降级扩散概率模型(DDPM)来估计目标实体在预测中的概率分布。为了弥合连续扩散模型和离散kg之间的间隙,将两个可学习的嵌入功能定义为映射实体和与连续向量的关系。为了考虑KGS的连通性模式,引入了条件实体Denoiser模型,以生成针对给定实体和关系的目标实体。广泛的实验表明,KGDM在三个基准数据集中的现有最新方法明显优于现有的最新方法。
[研究兴趣] 知识图谱嵌入 (KGE) 是大型知识图谱的流行表示,因为它们的潜在特性使其适合现代机器学习算法。尽管 KGE 很受欢迎,但它们并非没有局限性:它们通常是黑匣子,并且不能简单地扩展到处理其他数据模式,例如文本、视频或图像。这两个观察结果限制了它们对任意知识图谱和用例的适用性。在这个项目中,我们旨在解决这两个限制。我们设想利用 LLM 的语义能力,使知识图谱更易于与任意文本内容和助手配合使用。我们希望将相同的技术推广到其他数据模式。为了使嵌入可解释,我们设想在嵌入中嵌入“推理方案”,例如路径或规则,这将指导训练并作为解释。作为初始用例,我们计划在引文网络上测试我们的技术,以回答专业和科学资料中的复杂查询。将在途中确定进一步的用例。[团队名称] LACODAM
抽象知识图(kgs)自然能够捕获数据和知识的收敛性,从而使它们成为高度表达的框架,用于以连贯和互连的方式描述和集成异质数据。然而,基于开放世界假设(OWA),kgs中没有信息并不表示虚假或不存在;它仅反映了不完整。使用数值或符号学习模型,基于KG中现有的事实陈述来预测基于现有的事实陈述的新关系。最近,知识图嵌入(KGE)和符号学习在各种下游任务(包括链接预测(LP))中受到了相当大的关注。LP技术采用实体及其关系的潜在矢量代表来推断缺失的链接。此外,随着KGS产生的数据数量的不断增加,进行额外质量评估和验证工作的必要性变得更加明显。尽管如此,最新的kg完成方法在产生预测的同时未能考虑质量约束,从而导致建立有错误关系的kg。在医疗保健决策的背景下,准确的数据和见解的产生至关重要,包括诊断过程,治疗策略的制定以及实施预防措施。我们提出了一种混合方法,即Vise,该方法采用了符号学习,约束验证和数值学习技术的整合。Vise利用KGE捕获隐式知识并表示kg中的否定,从而增强了数值模型的预测性能。我们的实验结果证明了这种混合策略的有效性,该策略结合了符号,数值和约束验证范式的优势。VISE实施是在GitHub(https://github.com/sdm-tib/vise)上公开访问的。
摘要。为链接预测而开发的知识图谱嵌入模型 (KGEM) 学习知识图谱中实体的向量表示,称为嵌入。一个常见的默认假设是 KGE 实体相似性假设,该假设指出这些 KGEM 在其嵌入空间内保留了图的结构,即将图中的相似实体彼此靠近。这一理想特性使 KGEM 广泛应用于下游任务,如推荐系统或药物再利用。然而,实体相似性和嵌入空间相似性的关系很少得到正式评估。通常,KGEM 是根据其唯一的链接预测能力进行评估的,使用基于排名的指标,如 Hits@K 或平均排名。本文挑战了流行的假设,即图中的实体相似性本质上反映在嵌入空间中。因此,我们进行了大量实验来衡量 KGEM 将相似实体聚类在一起的能力,并研究了潜在因素的性质。此外,我们研究不同的 KGEM 是否表现出不同的相似性概念。数据集、预训练嵌入和代码可在以下位置获取:https://github.com/nicolas-hbt/similar-embeddings/ 。
水文模型已成为研究解决各种环境和水资源问题的复杂流域的水文过程的重要工具。本研究的重点是使用土壤和水评估工具(SWAT)在突尼斯中部的Merguellil流域进行建模。SWAT模型是一种物理建模工具,开发了用于预测水文过程的物理建模工具,并有充分记录是资源水管理的有效工具。这项研究的主要目的是评估SWAT模型在模拟中央半干旱突尼斯梅尔基利尔流域内的每月水文过程时的表现。该模型的校准是从2002年到2011年进行的,随后进行了2012年至2017年的验证。灵敏度分析确定了关键参数,包括曲线数,坡度长度和有效的水力传导率,是最敏感的。研究结果表明,该模型在校准和验证阶段期间根据拟合优度标准表现出令人满意的性能。在校准和验证期内,NASH – utcliffe效率(NSE)分别为0.65和0.41。确定系数(R²)和克林格 - 古普塔效率(KGE)均等于0.7,用于校准的标准偏差比(RSR)小于或等于0.6。偏差百分比(PBIA)表明该模型在校准期间高估了排放量 +23.5%。此外,Merguellil流域中的径流表现出显着的时空变异性,受到其环境的复杂性和异质性的显着影响。
摘要。流域水文学的最新进步(例如了解集水区相似性,访问新数据源以及对参数约束的重新发现方法)使得在大型域上为Ungaig的盆地应用集水模型成为可能。在这里,我们提出了一项尖端的案例研究,该案例研究第一次使用集水区模型技术,并在全球范围内对河流进行评估。建模过程具有挑战性,但可行,甚至第一个模型版本都比传统的河流流动模型显示出更好的性能。我们使用了炒作模型的开源代码,并将其应用于> 130 000个集水区(平均分辨率为1000 km 2),并划定了覆盖地球的陆地(Expept Antarctica)。使用20个关于生理变量的开放数据库对流域进行了表征,以根据与大气的交流来解释全球淡水资源的空间和时间变异性(例如土地所有隔间中的预言和蒸散量)及其相关预算(例如,土壤,河流,湖泊,冰川和浮游物),包括水分,住宿时间以及各个隔间之间的途径。使用逐步方法的参数组估算了全局pa-rameter值,该参数群体调节了代表性测量的捕获物中的特定过程和集水特征。每天和每月的时间序列(> 10年),用于全球5338次河流流量,用于模型评估(一半进行校准,一半用于独立阀门),导致每月的中位数为0.4。但是,
使用高级机器学习(ML)的物理信息建模(PIM)代表混凝土技术领域的范式转变,提供了科学严谨和计算效率的有效融合。通过利用基于物理原理和数据驱动算法之间的协同作用,PIM-ML不仅简化了设计过程,还可以增强混凝土结构的可靠性和可持续性。随着研究继续完善这些模型并验证其性能,他们的采用有望彻底改变整个全球建筑项目中混凝土材料的设计,测试和利用。在这项研究工作中,一项广泛的文献综述,生成了一个全球代表性数据库,用于沉迷于可回收骨料混凝土的裂纹拉伸强度(FSP)。测量并列出了研究的混凝土组件,例如C,W,NCAG,PL,RCAG_D,RCAG_P,RCAG_WA,VF和F_TYPE。将收集的257个记录分为200个记录(80%)的培训集和57个记录(20%)的验证集(20%),以与数据库的更可靠分区相符。使用“ WEKA数据挖掘” 3.8.6版创建的五种高级机器学习技术用于预测FSP,并且还使用了Hoffman&Gardinger方法和性能指标分别评估变量和ML模型的灵敏度和性能。结果表明,KSTAR模型证明了模型之间的性能和可靠性水平最高,以0.96的r 2为0.96,精度为94%。其RMSE和MAE在0.15 MPa时均较低,表明预测和实际值之间的偏差很小。其他指标,例如WI(0.99),NSE(0.96)和KGE(0.96),进一步证实了该模型的效率和一致性,使其成为实用应用的最可靠工具。的灵敏度分析还表明,水含量(W)在40%处发挥了最大的影响,这表明混合物中的水量是实现最佳拉伸强度的关键因素。这强调了需要仔细的水管理以平衡可持续混凝土生产中的可行性和力量。粗大的天然聚集物(NCAG)具有38%的实质影响,表明其在维持混凝土混合物的结构完整性中的重要作用。