成对比较数据在统计学和机器学习中受到了广泛关注,并在各个领域有着广泛的应用。这类数据通常来自锦标赛,其中每个成对比较结果都来自两个选手或队伍之间的比赛,或来自众包环境,其中个人负责比较两个项目,例如图像、电影或产品。具体而言,著名的瑟斯顿 (Thurstone, 1927) 和布拉德利-特里 (BT; Bradley and Terry, 1952) 模型为该领域奠定了基石,随后进行了许多扩展,包括 Shah 等人 (2016a) 提出的参数序数模型,拓宽了参数模型的类别。Oliveira 等人 (2018) 放宽了已知链接函数的假设,并提出了允许链接函数属于广泛函数家族的模型。非参数方法也已出现,例如 Shah 和 Wainwright (2018) 中基于 Borda 计数算法介绍的工作,以及 Chatterjee (2015) 和 Chatterjee 和 Mukherjee (2019) 研究的非参数 Bradley-Terry 模型。此外,还开发了用于众包环境的成对比较模型,如 Chen 等人 (2013) 和 Chen 等人 (2016) 等所讨论的。成对比较模型已获得广泛的应用,包括排名聚合(Chen and Suh,2015;Chen 等人,2019;Heckel 等人,2019;Chen 等人,2022b)、预测比赛 / 锦标赛(Cattelan 等人,2013;Tsokos 等人,2019;Macr`ı Demartino 等人,2024)、测试博彩市场的效率(McHale and Morton,2011;Ly´ocsa and V`yrost,2018;Ramirez 等人,2023)以及基于人工评估改进大型语言模型(Christiano 等人,2017;Ouyang 等人,2022;Zhu 等人,2023)。虽然上述模型对该领域做出了重大贡献,但它们依赖于随机传递性的假设,这意味着球员/球队/项目之间存在严格的排名。然而,这种假设可能不切实际,特别是在涉及多种技能或策略的环境中,不传递性自然会出现。尽管它具有实际重要性,但对允许不传递性的模型的研究仍然有限。一些值得注意的例外包括 Chen 和 Joachims (2016) 和 Spearing 等人 (2023) 的工作,他们通过引入额外参数来描述不传递性以及基于 Bradley-Terry 概率指定绝对优势的参数,扩展了 Bradley-Terry 模型。Spearing 等人 (2023) 提出了一种在完整贝叶斯框架下进行参数估计的马尔可夫链蒙特卡罗算法。然而,他们的贝叶斯程序计算量大,对于涉及许多球员或相对较高潜在维度的高维设置不切实际。 Chen 和 Joachims (2016) 将参数视为固定量,并通过优化正则化目标函数来估计它们。然而,它们的目标函数是非凸的,并且它们的模型高度过度
预期杂合性(HE)值范围从0.031(Marker MBO56)到0.571(Marker MBO35)。使用这些标记,对遗传多样性的分析(表4)表明,在微卫星基因座检测到的多态性标记数量从8个(togbin and Malanville的地点)到10(Savè,Agoua,Pendjari,Pendjari,Pingou和TroisRivières),并具有9±0.865的范围。除了Savè,Hounviatouin和Malanville之外,在大多数采样位置都观察到目标微卫星基因座的1至3个私人等位基因。关于遗传参数,有效等位基因(NE)的数量范围为1.447至2.069,平均数为1.761。从0.263(Hounviatouin)到0.451(SAVè),平均值为0.354,而观察到的杂合性(HO)的平均值为0.234(togbin)到0.405(pingou),平均值为0.335。 固定指数(F)的负值为从0.263(Hounviatouin)到0.451(SAVè),平均值为0.354,而观察到的杂合性(HO)的平均值为0.234(togbin)到0.405(pingou),平均值为0.335。固定指数(F)的负值为
无监督的域适应性在将知识从标记的源域转移到未标记的目标域,在时间序列应用中起关键作用。现有的时间序列域适应方法要么忽略频率特征,要么平等地处理时间和频率特征,这使得充分利用这两种功能的优势变得具有挑战性。在本文中,我们深入研究了可传递性和可区分性,这是传递表示学习中的两个至关重要的特性。可以洞悉频率特征在特定域内更具歧视性,而时间特征则在跨域上显示出更好的可传递性。基于发现,我们提出了一个dversarial co-co-co-n n etworks(acon),以通过协作学习方式在三个方面通过协作学习方式来增强可转移的表示:(1)考虑到时代的多个过度差异,提出了多个频率频率特征学习,以增强频率特征的辨别能力; (2)提出了时间域互助学习,以增强源域中时间特征的可区分性,并提高目标域中频率特征的可传递性; (3)域对抗学习是在时间频率特征的相关子空间中进行的,而不是原始特征空间,以进一步增强这两个特征的可传递性。在广泛的时间序列数据集和五个常见范围内进行的广泛实验证明了ACON的最新性能。代码可从https://github.com/mingyangliu1124/acon获得。
对有针对性表示的有向图建模是在图形结构数据上执行机器学习的基本要求。几何嵌入模型(例如双曲线,锥体和盒子嵌入)在此任务中出色,表现出有针对性图的有用的电感偏差。然而,对包含周期和某些传递性元素的定向图进行建模,这是现实世界中常见的两种属性,这是具有挑战性的。框嵌入可以被认为是将图表示作为某些学到的超图上的交点,具有自然的感应性偏置,以建模传递性,但是(正如我们证明的)无法对周期进行建模。为此,我们提出了二进制代码框嵌入,其中博学的二进制代码选择了一个相交的图表。我们探索了几种变体,包括全局二元代码(相当于交叉点的联合)和每个vertex二进制代码(允许更大的灵活性)以及正则化方法。理论和经验结果表明,所提出的模型不仅保留了有用的传递性电感偏见,而且还具有足够的代表能力来模拟任意图,包括带有周期的图形。
抽象的气候降低降级,这是从低分辨率模拟中生成高分辨率气候数据的过程,对于理解和适应区域和本地规模的气候变化至关重要。深度学习方法已被证明在解决此问题方面很有用。但是,存在研究通常集中在一个特定任务,位置和变量的培训模型上,因此它们的可推广性和可传递性受到限制。在本文中,我们评估了培训深度学习对多种气候数据集的深度学习模式的效果,以了解更多可靠和可转移的表示形式。我们使用CNN,傅立叶核电运算符(FNOS)和视觉变压器(VIT)评估体系结构零射击传递性的有效性。我们以实质性地评估了降尺度模型的空间,可变和产物的可传递性,以了解这些不同体系结构类型的普遍性。
斯蒂芬森或 Q 在麦克卢汉出版的作品中被提及,包括他的信件。在斯蒂芬森未发表的论文中,几页关于麦克卢汉的《机械新娘:工业人的民间传说》(1951 年)以及麦克卢汉的背景、书籍和概念的手写笔记提供了描述性评论,但没有对他的理论进行评价。此外,在密苏里大学的研究生课程讲座(1987b 年)中,斯蒂芬森讨论了麦克卢汉和他的导师哈罗德·伊尼斯与 Q 的关系,他的录像采访(1988 年)包括关于意识的评论,这些评论与麦克卢汉的个人观念产生了共鸣。然而,在《广告量子理论》中,斯蒂芬森大大扩展了麦克卢汉与量子理论、互补性原则、传递性和实质性思维、传播和意识以及游戏理论的相关性,特别是通过麦克卢汉的“热”和“冷”媒体概念、他的三种不同的媒体文化——口头、印刷和电子——以及标题所暗示的他在广告方面的工作。本文将从斯蒂芬森发表的关于麦克卢汉的评论、他的私人笔记、他的演讲和录像采访中推断,以探索麦克卢汉和斯蒂芬森的传播理论在以下四个领域的融合:(1)探索与事实;(2)自我与媒介;(3)量子理论、互补性和实质性思维与传递性思维;(4)大众传播中的传播乐趣和游戏。根据斯蒂芬森 (1986) 的说法,麦克卢汉探索了传递性思维的起源,为传播方法论蒙上了一层阴影,而其余的传播研究则以实质性思维进行。麦克卢汉和他的导师哈罗德·伊尼斯是“传播研究最深刻的两位先驱”,他们探索了口头、印刷和电子媒体的影响。在证明了口头、印刷和电子媒体在我们的文化中的普遍性之后,斯蒂芬森的核心问题是如何继续进行传递性思维而不是印刷中的实质性表达。斯蒂芬森将麦克卢汉的新认识论等同于尼尔斯·玻尔的量子理论概念,斯蒂芬森认为 Q 方法论的“核心主观性”为麦克卢汉和玻尔的认识论提供了一种新的量子力学方法论。在他的号召中,斯蒂芬森认为 Q 方法论是“麦克卢汉和尼尔斯·玻尔认识论必将迎来的第一股风”。本文将比较斯蒂芬森和麦克卢汉传播理论的核心概念,希望
摘要。尽管使用机器学习(ML)模型来预测浮球,但尚未探索其用于未示例数据的可传递性。本文开发了一种基于ML的模型,用于在沿海流域的重大事件中最大程度地介绍最大河水深度,并评估其在其他事件(样本外)中的可传递性。该模型考虑了侵入因子的空间分布,这些因素解释了基本的物理过程,从而使最大的河水深度最大。我们的模型评估在美国东北部的六位数水文统一代码(HUC6)中显示,该模型在一个重大漏斗事件中,在116个河流仪表仪上令人满意的最大后播在116个河流仪表中,飓风IDA(r 2 of 0.94 of 0.94)。预先训练的,经过验证的模型已成功转移到其他三个主要的浮动事件,飓风以赛亚,桑迪和艾琳(r 2>0。70)。我们的结果表明,当由相关特征的空间分布,它们的相互作用以及沿海流域的基本物理过程的空间分布告知时,基于ML的模块可以转移最大河水深度。
摘要 - 尽管许多研究已成功地将转移学习应用于医学图像分割,但是当有多个源任务可转移时,很少有人研究了选择策略。在本文中,我们提出了一个基于知识的知识和基于可传递性的框架,以在大脑图像分割任务集合中选择最佳的源任务,以提高给定目标任务上的转移学习绩效。该框架包括模态分析,ROI(感兴趣的区域)分析和可传递性效率,以便可以逐步对源任务选择进行。特别是,我们将最先进的分析转移能力估计指标调整为医学图像分割任务,并进一步表明,基于模态和ROI特征的候选源任务可以显着提高其性能。我们关于脑物质,脑肿瘤和白质超强度分割数据集的实验表明,从同一模式下的不同任务转移通常比在不同方式下从同一任务转移的实验更成功。此外,在相同的方式中,从具有更强的ROI形状相似性与目标任务的源任务转移可以显着提高最终传输性能。可以使用标签空间中的结构相似性指数捕获这种相似性。索引术语 - 转移学习,医学图像分析,来源选择I。
本质上无序的蛋白质具有动态结构,它们扮演着关键的生物学作用。阐明其构象合奏是一个具有挑战性的问题,需要综合使用计算和实验方法。分子仿真是用于构建无序蛋白质结构集合但资源密集型的有价值的计算策略。最近,基于深层生成模型的机器学习方法已成为生成结构合奏的有效替代方法。但是,当训练数据中缺乏建模序列和构象时,此类方法当前的可传递性有限。在这里,我们开发了一种新型的生成模型,该模型可实现固有无序蛋白质集合的高水平可传递性。该方法称为IDPSAM,是基于变压器神经网络的潜在扩散模型。它结合了自动编码器,以学习蛋白质几何形状的表示和扩散模型,以在编码空间中采样新型构象。iDPSAM在使用Absinth隐式溶剂模型进行的大型模拟蛋白质区域的模拟数据集上进行了训练。由于其神经网络的表现力及其训练稳定性,Idpsam忠实地捕获了测试序列的3D结构集合,在培训集中没有相似之处。我们的研究还证明了从数据集中产生完全构象合奏的潜力,并强调了训练集大小对概括的重要性。我们认为,IDPSAM通过机器学习代表了可转移蛋白质集合建模的重大进展。
方法:纳入 19 名健康对照者 (HC)、17 名 EM 患者和 12 名 CM 患者。计算皮质厚度和皮质下体积,并使用图论分析框架和基于网络的统计数据分析拓扑结构。我们进一步使用支持向量机回归 (SVR) 来确定这些网络测量是否能够预测临床参数。结果:基于网络的统计数据显示,与 HC 相比,EM 和 CM 中包括额颞区、顶叶和视觉区在内的解剖区段之间的区域间连接强度明显较低。两组患者均观察到更高的分类性,其中 CM 的模块性高于 HC,EM 的传递性高于 HC。对于皮质下网络,两组患者均观察到更高的分类性和传递性,CM 的模块性高于 HC。SVR 显示,网络测量可以稳健地预测偏头痛患者的临床参数。结论:我们发现与 HC 相比,偏头痛患者的网络高度分离,这表明 EM 和 CM 的整体网络中断。 CM 的模块性较高但聚类系数较低,表明该组与 EM 相比存在更多隔离。隔离网络的存在可能是头痛相关脑回路适应不良重组的征兆,从而导致偏头痛发作或疼痛的继发性改变。