摘要:我们引入了脑启发的模块化训练(BIMT),这是一种使神经网络起作用的方法更模块化和可解释。受到大脑的启发,BIMT将神经元嵌入几何空间中,并以与每个神经元连接长度成正比的成本增强损失函数。这是受到进化生物学中最低连接成本的想法的启发,但我们是首先将这一想法与培训神经网络结合起来的,具有梯度下降以供解释性。我们证明,BIMT发现了许多简单任务的有用的模块化神经网络,以符号公式,可解释的决策边界和分类特征以及算法数据集中的数学结构揭示了组成结构。在定性上,受BIMT训练的网络具有肉眼容易识别的模块,但经常训练的网络似乎更为复杂。定量,我们使用纽曼的方法来计算网络图的模块化; BIMT在我们所有的测试问题上都达到了最高的模块化。一个有前途且雄心勃勃的未来方向是应用提出的方法来了解视力,语言和科学的大型模型。
主要关键词