其中,k B 为玻尔兹曼常数,X 为相关相空间体积,是微观状态数量的量度。注意,上述定义中需要使用对数,以使玻尔兹曼统计熵具有与热力学熵相同的加性。后来,克劳德·香农发现,可以使用与玻尔兹曼公式类似的公式(尽管符号相反)来量化信号的信息内容。继香农之后,人们通常将熵等同于系统的(缺乏)信息或“无序”。由于信息是一个渗透到许多自然科学中的概念,熵的概念很快传播到其他领域,例如生物学和遗传学。约翰·冯·诺依曼将玻尔兹曼熵推广到量子物理学。这实际上不仅仅是一种概括。事实上,方程 (1) 有点问题,因为 X 具有相空间体积的维度,而对数的参数应该是无量纲的——更不用说 SB 可以变为负值。但考虑到量子力学引入了由普朗克常数 h 给出的最小作用量,玻尔兹曼公式可以改写为:SB = k ln( X / hd )(其中 d 是系统的维数),只要 X hd ,它就始终为非负,并且只有当等号成立时它才为零。就离散量子
图 1. 具有连接权重 𝑤𝑤 𝑖𝑖𝑖𝑖 的 𝑁𝑁 二进制节点(0 或 1)的循环网络。(左)Hopfield 模型。(中)玻尔兹曼机。节点分为两组,可见节点(空心圆)和隐藏节点(灰色)。网络经过训练可以近似给定一组可见模式的概率分布。训练完成后,网络可用于从学习到的分布中生成新实例。(右)受限玻尔兹曼机 (RBM)。与玻尔兹曼机相同,但可见层内或隐藏节点之间没有任何耦合。此变体可用于深度网络的逐层预训练。
图 1. 具有连接权重 𝑤𝑤 𝑖𝑖𝑖𝑖 的 𝑁𝑁 二进制节点(0 或 1)的循环网络。(左)Hopfield 模型。(中)玻尔兹曼机。节点分为两组,可见节点(空心圆)和隐藏节点(灰色)。网络经过训练可以近似给定一组可见模式的概率分布。训练完成后,网络可用于从学习到的分布中生成新实例。(右)受限玻尔兹曼机 (RBM)。与玻尔兹曼机相同,但可见层内或隐藏节点之间没有任何耦合。此变体可用于深度网络的逐层预训练。
图 1. 具有连接权重 𝑤𝑤 𝑖𝑖𝑖𝑖 的 𝑁𝑁 二进制节点(0 或 1)的循环网络。(左)Hopfield 模型。(中)玻尔兹曼机。节点分为两组,可见节点(空心圆)和隐藏节点(灰色)。网络经过训练可以近似给定一组可见模式的概率分布。训练完成后,网络可用于从学习到的分布中生成新实例。(右)受限玻尔兹曼机 (RBM)。与玻尔兹曼机相同,但可见层内或隐藏节点之间没有任何耦合。此变体可用于深度网络的逐层预训练。
在给定的真空中,boltzmann脑成核速率γbb I与该真空γi的总衰减速率的比率大致给出。这里γbb i是玻尔兹曼大脑的速度
我主张一种将问题置于标题中心位置的《物理学基础》方法,而不是问“世界上的情况是什么?”。这种方法,即算法理想主义,试图在通常的经验物理学领域和更奇特的宇宙学、哲学和科幻小说(但可能很快就会成为现实)技术领域中,对这个问题给出一个数学上严格的原则性答案。我首先要说的是,量子理论在实际实践和某些解释中,应该被理解为告诉代理人他们接下来应该观察到什么(而不是情况是什么),而从通常的“外部”视角回答前一个问题的困难是玻尔兹曼大脑问题、扩展的维格纳朋友场景、帕菲特的远程传输悖论或我们对模拟假设的理解等持续存在的谜团的核心。算法理想主义是一个概念框架,基于两个假设,允许几种可能的数学形式化,以算法信息理论的语言表达。在这里,我对这种观点进行了非技术性的描述,并展示了它如何解决前面提到的谜团:例如,它声称无论有多少个玻尔兹曼大脑,你都不应该打赌自己是一个玻尔兹曼大脑,关闭计算机模拟通常并不会终止其中的居民,并且它预测明显嵌入客观外部世界是一种近似的描述。
根据宇宙学家们认真对待的一些理论(称之为“大宇宙学”),宇宙在时空上如此之大,以至于几乎任何有限的物质结构都会重复形成,这仅仅是由于随机波动。玻尔兹曼大脑(缩写:“BB”)就是这样一种随机形成的具有意识的结构(至少在短时间内)。如果大宇宙学是正确的,那么 BB 数量众多且多种多样,以至于处于你的主观状态(处于相同的现象状态并拥有与你相同的明显记忆)的绝大多数实体都是 BB,而不是人类。这似乎意味着你应该对自己是 BB 有很强的信心——与你对大宇宙学是正确的信心差不多。但是,对自己是随机形成的物质结构有很强的信心似乎也很疯狂。这就是玻尔兹曼大脑的问题。我的计划是评估不稳定性和自我破坏的考虑是否以及如何帮助我们解决这个问题。
通过固相反应制备了 Nd 3 + 掺杂的 Y 3 Al 2 Ga 3 O 12 石榴石陶瓷颗粒,并以此为原型研究 Nd 3 + 激活石榴石荧光粉作为低温和高温范围玻尔兹曼温度计的潜力。尽管近红外发射 Nd 3 + 激活荧光粉通常用于生物应用,但它们的实际用途受到生理温度范围内低灵敏度的阻碍。相反,100 800 K 范围内的光致发光分析在低温和高温范围内都表现出有趣的性能。事实上,通过利用 4 F 3 / 2 的斯塔克能级(Z 能级)以及 4 F 5 / 2 和 4 F 3 / 2 激发态的发射率,可以在同一材料中构建两个可靠的玻尔兹曼温度计,分别在低温范围(100 220 K)和高温(300 800 K)下工作。
图 1:(a) 受限玻尔兹曼机 (RBM) 架构由一个可见输入层和一个二进制值隐藏层组成;对于给定的配置 (v, h),参数 (a, b, W) 用于定义能量函数 E 和相关的类玻尔兹曼概率密度 P。(b) 例如,RBM 可以在一组手写数字上进行训练,然后用于生成新的真实数字;为此,数字图像被展平为一维二进制向量 v(k),其中 1 和 0 分别对应数字和背景像素。(c) 配置相互作用 (CI) 方法将分子的波函数展开为激发斯莱特行列式的线性组合,可以表示为一种一维二进制图像。 (d) 本研究中提出的 CIgen 算法以迭代方式训练 RBM 在波函数当前近似中的行列式分布上,然后通过生成新的贡献来扩展它。
在阅读本书之前,你可能已经阅读过一些深度学习的经典论文。如果你这样做了,你可能会意识到作者们所说的语言与你所理解的不同;他们使用物理语言。让我们举个例子。以下摘录自该领域的经典论文之一;Salakhutdinov 和 Hinton 2012 年的著作,题为深度玻尔兹曼机的有效学习程序 [1]。这是深度学习领域最重要的论文之一。出版于我们将在后续章节中查看同一著作的较长摘录,现在我们只想确定一个关键术语。为了清晰和重点,作者在以下摘录中以粗体斜体形式显示了关键术语:摘自 Salkakhutdinov 和 Hinton (2012) [1]:无向图模型,例如玻尔兹曼机,在最大似然梯度中有一个额外的、与数据无关的项。该项是对数配分函数的导数,与数据相关项不同,它带有负号。这意味着,如果使用变分近似来估计与数据无关的统计数据,则所得的梯度将倾向于改变参数,从而使近似值变得更糟。这可能解释了使用变分近似来学习玻尔兹曼机缺乏成功的原因。这里的关键术语是对数配分函数,或者更简单、更具体来说,是配分函数。配分函数的概念是统计力学的核心和唯一性。如果我们能够理解这一点,我们就有一个切入点来开拓和理解深度学习的全部工作领域。