Soup-of-Experts: Pretraining Specialist Models via Parameters Averaging
大规模模型经常在不同的数据源的混合物上进行培训。不同的数据混合物产生了非常不同的下游性能。我们提出了一种新型架构,可以为每个数据混合物实例化一个模型,而不必重新培训模型,而不必重新培训该模型,而不必构成一系列专家的构造,这些构造是一种可实用的组合型组合。直方图。要训练此体系结构,我们采样了随机直方图,实例化相应的模型,然后通过一批数据进行反向处理…
欢迎来到我的190thgems帖子。这是我分享一些最新新闻,想法和资源的数学教师的地方。1。使用AII创建的资源在去年我的帖子AI数学资源中发布了有关 @dgraimaths的资源。他的网站aimaths.weebly.com现在已更新一套新的资源,涵盖了直方图,累积频率图,框图和线路图。Duncan使用
Private and Personalized Frequency Estimation in a Federated Setting
受用户设备上的下一个单词预测问题的启发,我们引入并研究了联合设置中的个性化频率直方图估计问题。在此问题中,在某些领域,每个用户都会从特定于该用户的分布中观察多个样本。目标是为所有用户计算用户分布的个性化估计,误差以 KL 散度来衡量。我们专注于解决两个核心挑战:统计异质性和用户隐私保护。我们解决问题的方法依赖于发现和利用类似的……
Evolving Systems, Volume 15, Issue 4, August 2024
1) 通过基于聚类的表示进行时间序列异常检测作者:Elham Enayati、Reza Mortazavi……Mahmoud Moallem页数:1115 - 11362) 自适应单位分割网络 (APUNet):一种用于解决 PDE 的局部深度学习方法作者:Idriss Barbara、Tawfik Masrour、Mohammed Hadda页数:1137 - 11583) 使用自适应对强化技术增强黑猩猩优化算法以发展用于会计利润预测的深度 LSTM 作者:Chengchen Yang、Tong Wu、Lingzhuo Zeng页数:1159 - 11784) 用于支持普适边缘应用的同质迁移
How Far Can Transformers Reason? The Locality Barrier and Inductive Scratchpad
Transformers 能否通过组合已建立的三段论来预测新的三段论?更一般地说,这些模型可以从头开始学习什么类型的目标?最近的研究表明,Transformers 在表达能力方面可以是图灵完备的,但这并没有解决可学习性目标。本文提出了分布局部性的概念,以捕捉常规 Transformers 何时可以有效实现弱学习,其中局部性除了标记直方图之外还测量与目标非平凡相关的所需最少标记数。如实验所示……
Statistical models of radar cross section fluctuations of small-sized unmanned aerial vehicles
本文介绍了描述各种小型无人机雷达截面波动的统计模型研究。结果通过对雷达后向散射图进行全尺寸测量和统计分析获得。确定伽马、威布尔、对数正态和指数分布可确保最准确地近似无人机雷达后向散射图的直方图。给出了近似概率密度函数的参数值及其物理解释。