通过压缩___XiaoMi-AI 助力科研平台

通过压缩

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

通过压缩

¥ 1.0

热度

本文研究了最小描述长度（MDL）与神经网络中Grokking现象之间的关系，提供了有关突然泛化的信息理论观点。Grokking，在扩展培训后突然概括了模型，它挑战了神经网络学习动态的常规理解。我们假设由MDL量化的内部表示形式的组合是此过程的关键因素。为了测试这一点，我们引入了一种基于权重修剪的新型MDL估计技术，并将其应用于不同的数据集，包括模块化算术和置换任务。由于神经网络的复杂，高维质以及缺乏量化内部代表性的明确指标，这种方法是具有挑战性的。我们的实验揭示了MDL还原与改善的概括之间存在很强的相关性，而MDL过渡点通常在或与Grokking事件相吻合。我们观察到Grokking与非怪异场景中不同的MDL演化模式，其特征是快速减少MDL，然后在前者中持续概括。这些发现提供了有关Grokking信息理论基础的见解，并建议在训练过程中进行MDL监测可以预测即将泛化。我们的工作有助于更深入地了解神经网络中的学习动态，并为预测机器学习模型中的概括提供了新的工具。

添加pdf代下载 VIP点击下载文件

通过压缩

主要关键词

神经网络量化不同的数据集模块化信息理论有关过渡点机器学习 MDL 模型特征量化的动态泛化 Grokking 理论基础预测机概括基础的动态的信息过程相关性学习提供

通过压缩PDF文件第1页

通过压缩PDF文件第2页

通过压缩PDF文件第3页

通过压缩PDF文件第4页

通过压缩PDF文件第5页

可下载资源数量

已经购买

下载数量：1

通过压缩

通过压缩

相关文件推荐

图像数据压缩

图像数据压缩

可压缩墙的物理建模的进展 -

可压缩流量的大涡模拟

通过系统发育压缩

Oracle 混合列压缩

雷达脉冲压缩研究

多模单程时空压缩

复合结构的压缩响应

压缩碳相的异常热传输

压缩超快摄影的教程

通过多变态可压缩湍流的对流

无焊接压缩连接器技术

SFRC的应变率压缩行为

SFRC的应变率压缩行为

压缩和液化气体储能技术

压缩最终住房计划

压缩认证量子测量

压缩热环境中高斯熵不协的时间演化

模型压缩 - CS@Cornell

2021 年年度报告 - Burckhardt 压缩

2021 年年度报告 - Burckhardt 压缩

模型压缩 - CS@Cornell

使用块压缩功能的实时神经材料

Jansz-io压缩水下声音

固体碳化物 - 抗质量压缩 - 螺旋形 -

点云属性压缩带有神经隐式表示

神经法律结果预测和部分最小二乘压缩

新生儿复苏期间的胸部压缩

可扩展的密文压缩技术...

XiaoMi-AI