原子建模通常分为两种不同类型的模拟。一方面,包括Hartree -Fock和密度功能理论(DFT)方法在内的量子方法被认为是最准确的,几乎用于任何类型的化学物种[1,2]。另一方面,经典力场用于执行精度较低的大规模和长期模拟[3,4]。但是,仍然很难连接这两种方法,直到现在,人们几乎无法执行涉及数百万个原子的纳秒原子的模拟,同时保留量子方法的准确性。在这种情况下,近年来已经提出了机器学习互动电位(MLIP),并显示出实现此类模拟的巨大潜力[5-7]。目前考虑了许多方法,包括人工神经网络[8],高斯近似方法[9],线性电位[10,11],频谱邻域分析电位[12],对称梯度域机器学习[13,14]和矩张量张量的电位[15]。这些技术的成功得到了成功解决的各种材料的认可:纯属金属[16-20],有机分子[21-24],氧化物[25,26],水[27 - 31],无定形材料[32 - 37]和HYBRIDPEROVSKITES [32 - 37]和HYBRIDERIDPEROVSKITES [38]。对于所有这些技术,主要过程包括对力场使用非常通用的分析公式,然后将其进行参数化以匹配DFT计算数据库,包括总能量,力和应力张量。但是,人们承认MLIP有时会显示出对学习数据库中未包含的系统的可传递性。在最坏的情况下,MLIP SO-WELL拟合到其学习数据库中,可以在其外观察到非物理行为。为了解决此问题,主要建议是定期检查电位的准确性,因为进行了机器学习分子动力学模拟并改善MLIP“ fly the Fly” [38 - 40]。,据我们所知,这种方法的这种缺陷从未经过定量调查,而在被用户和开发人员承认的同时。
成对比较数据在统计学和机器学习中受到了广泛关注,并在各个领域有着广泛的应用。这类数据通常来自锦标赛,其中每个成对比较结果都来自两个选手或队伍之间的比赛,或来自众包环境,其中个人负责比较两个项目,例如图像、电影或产品。具体而言,著名的瑟斯顿 (Thurstone, 1927) 和布拉德利-特里 (BT; Bradley and Terry, 1952) 模型为该领域奠定了基石,随后进行了许多扩展,包括 Shah 等人 (2016a) 提出的参数序数模型,拓宽了参数模型的类别。Oliveira 等人 (2018) 放宽了已知链接函数的假设,并提出了允许链接函数属于广泛函数家族的模型。非参数方法也已出现,例如 Shah 和 Wainwright (2018) 中基于 Borda 计数算法介绍的工作,以及 Chatterjee (2015) 和 Chatterjee 和 Mukherjee (2019) 研究的非参数 Bradley-Terry 模型。此外,还开发了用于众包环境的成对比较模型,如 Chen 等人 (2013) 和 Chen 等人 (2016) 等所讨论的。成对比较模型已获得广泛的应用,包括排名聚合(Chen and Suh,2015;Chen 等人,2019;Heckel 等人,2019;Chen 等人,2022b)、预测比赛 / 锦标赛(Cattelan 等人,2013;Tsokos 等人,2019;Macr`ı Demartino 等人,2024)、测试博彩市场的效率(McHale and Morton,2011;Ly´ocsa and V`yrost,2018;Ramirez 等人,2023)以及基于人工评估改进大型语言模型(Christiano 等人,2017;Ouyang 等人,2022;Zhu 等人,2023)。虽然上述模型对该领域做出了重大贡献,但它们依赖于随机传递性的假设,这意味着球员/球队/项目之间存在严格的排名。然而,这种假设可能不切实际,特别是在涉及多种技能或策略的环境中,不传递性自然会出现。尽管它具有实际重要性,但对允许不传递性的模型的研究仍然有限。一些值得注意的例外包括 Chen 和 Joachims (2016) 和 Spearing 等人 (2023) 的工作,他们通过引入额外参数来描述不传递性以及基于 Bradley-Terry 概率指定绝对优势的参数,扩展了 Bradley-Terry 模型。Spearing 等人 (2023) 提出了一种在完整贝叶斯框架下进行参数估计的马尔可夫链蒙特卡罗算法。然而,他们的贝叶斯程序计算量大,对于涉及许多球员或相对较高潜在维度的高维设置不切实际。 Chen 和 Joachims (2016) 将参数视为固定量,并通过优化正则化目标函数来估计它们。然而,它们的目标函数是非凸的,并且它们的模型高度过度
无监督的域适应性在将知识从标记的源域转移到未标记的目标域,在时间序列应用中起关键作用。现有的时间序列域适应方法要么忽略频率特征,要么平等地处理时间和频率特征,这使得充分利用这两种功能的优势变得具有挑战性。在本文中,我们深入研究了可传递性和可区分性,这是传递表示学习中的两个至关重要的特性。可以洞悉频率特征在特定域内更具歧视性,而时间特征则在跨域上显示出更好的可传递性。基于发现,我们提出了一个dversarial co-co-co-n n etworks(acon),以通过协作学习方式在三个方面通过协作学习方式来增强可转移的表示:(1)考虑到时代的多个过度差异,提出了多个频率频率特征学习,以增强频率特征的辨别能力; (2)提出了时间域互助学习,以增强源域中时间特征的可区分性,并提高目标域中频率特征的可传递性; (3)域对抗学习是在时间频率特征的相关子空间中进行的,而不是原始特征空间,以进一步增强这两个特征的可传递性。在广泛的时间序列数据集和五个常见范围内进行的广泛实验证明了ACON的最新性能。代码可从https://github.com/mingyangliu1124/acon获得。
对有针对性表示的有向图建模是在图形结构数据上执行机器学习的基本要求。几何嵌入模型(例如双曲线,锥体和盒子嵌入)在此任务中出色,表现出有针对性图的有用的电感偏差。然而,对包含周期和某些传递性元素的定向图进行建模,这是现实世界中常见的两种属性,这是具有挑战性的。框嵌入可以被认为是将图表示作为某些学到的超图上的交点,具有自然的感应性偏置,以建模传递性,但是(正如我们证明的)无法对周期进行建模。为此,我们提出了二进制代码框嵌入,其中博学的二进制代码选择了一个相交的图表。我们探索了几种变体,包括全局二元代码(相当于交叉点的联合)和每个vertex二进制代码(允许更大的灵活性)以及正则化方法。理论和经验结果表明,所提出的模型不仅保留了有用的传递性电感偏见,而且还具有足够的代表能力来模拟任意图,包括带有周期的图形。
预期杂合性(HE)值范围从0.031(Marker MBO56)到0.571(Marker MBO35)。使用这些标记,对遗传多样性的分析(表4)表明,在微卫星基因座检测到的多态性标记数量从8个(togbin and Malanville的地点)到10(Savè,Agoua,Pendjari,Pendjari,Pingou和TroisRivières),并具有9±0.865的范围。除了Savè,Hounviatouin和Malanville之外,在大多数采样位置都观察到目标微卫星基因座的1至3个私人等位基因。关于遗传参数,有效等位基因(NE)的数量范围为1.447至2.069,平均数为1.761。从0.263(Hounviatouin)到0.451(SAVè),平均值为0.354,而观察到的杂合性(HO)的平均值为0.234(togbin)到0.405(pingou),平均值为0.335。 固定指数(F)的负值为从0.263(Hounviatouin)到0.451(SAVè),平均值为0.354,而观察到的杂合性(HO)的平均值为0.234(togbin)到0.405(pingou),平均值为0.335。固定指数(F)的负值为