Loading...
机构名称:
¥ 1.0

摘要 区块链本质上是一个分布式数据库,记录参与方之间的所有交易或数字事件。记录中的每笔交易都由系统参与者协商一致批准和验证,这需要解决一个困难的数学难题,即工作量证明。为了使已批准的记录不可变,解决数学难题并不容易,因此会消耗大量的计算资源。然而,在区块链中安装许多计算节点,仅通过解决一个毫无意义的难题来竞争批准记录,这是非常浪费能源的。在这里,我们将工作量证明作为一个强化学习问题,将区块链的增长建模为一个马尔可夫决策过程,在这个过程中,学习代理对环境状态做出最佳决策,而新的区块则被添加和验证。具体而言,我们将区块验证和共识机制设计为一个深度强化学习迭代过程。因此,我们的方法利用马尔可夫决策过程的状态转换确定性和动作选择的随机性,以及深度神经网络的计算复杂性,使区块不易重新计算并保持交易的顺序,同时利用区块链节点并行训练具有不同数据样本(状态-动作对)的相同深度神经网络,使模型能够同时在计算节点上经历多个情节。我们的方法用于设计下一代公共区块链网络,这不仅可以为工业应用节省计算资源,还可以鼓励针对常见问题的数据共享和 AI 模型设计。

机器学习与人工智能的进步

机器学习与人工智能的进步PDF文件第1页

机器学习与人工智能的进步PDF文件第2页

机器学习与人工智能的进步PDF文件第3页

机器学习与人工智能的进步PDF文件第4页

机器学习与人工智能的进步PDF文件第5页