2005 年,红十字国际委员会 (ICRC) 出版了两卷本的习惯国际人道主义法 (IHL) 研究。1 第一卷包含 161 条简明规则的列表,每条规则后面都附有评论,其中包含大量对第二卷 (两部分) 中所含支持实践的交叉引用。该研究是红十字与红新月国际大会授权的近十年过程的成果,需要红十字国际委员会律师和外部专家付出大量工作。2 此后几年,该研究已迁移到网上,成为一个用户友好的数据库。3 此外,研究项目实际上并未结束,一支位于剑桥的律师团队不断更新该研究数据库的实践部分(但不更新规则)。虽然该研究一经发表便广受好评,但也招致批评(下文将对此进行进一步探讨),但如今它已成为实践者和学者的标准参考文献;事实上,就学术界而言,它可能是被引用次数最多的国际人道法研究著作。4 但该研究在实践中到底有多权威?我们希望在本文中回答这个问题。这个问题可以从许多不同的角度来构建和探讨。我们选择了一种实证方法,即收集和分析包含国家立场表达的文件、国际和国内法院和法庭的判决以及其他有影响力的行为者的成果中对该研究的引用。我们的分析表明,该研究越来越被视为一种高度权威的文书,因此,仅凭该研究的陈述,就会发现某一特定主张反映了习惯国际法。在没有任何一致反对的情况下,特别是各国的反对——今天似乎没有出现这种反对,即使最初情况并非如此,而且仍然存在一些不满——该研究的
预测性编码是皮质神经活动的影响模型。它提出,通过依次最大程度地减少“预测误差”(预测数据和观察到的数据之间的差异)来提供感知信念。该提案中隐含的是成功感知需要多个神经活动的循环。这与证据表明,视觉感知的几个方面(包括对象识别的复杂形式)来自于在快速时间标准上出现的初始“ feedforward扫描”,该快速时间表排除了实质性的重复活动。在这里,我们建议可以将馈电扫描理解为摊销推断(应用直接从数据映射到信念的学习函数),并且可以将经常处理的处理理解为执行迭代推理(依次更新神经活动以提高信念的准确性))。我们建立了一个混合预测编码网络,该网络以原则性的方式结合了迭代和摊销的推论,通过描述单个目标函数的双重优化。我们表明,可以在生物学上合理的神经体系结构中实现了结果方案,该神经体系结构近似使用本地HEBBIAN更新规则,近似于贝叶斯的推理。我们证明,混合预测性编码模型结合了摊销和迭代推断的好处 - 对熟悉数据的快速和计算廉价的感知推断,同时保持上下文敏感性,精度和迭代推理方案的样品效率。此外,我们展示了我们的模型如何固有地敏感其不确定性和适应性地平衡迭代和摊销的推论,以使用最低计算费用获得准确的信念。混合预测编码为视觉感知期间观察到的前馈活动和经常性活动的功能相关性提供了新的观点,并提供了对视觉现象学不同方面的新见解。
此类任务同样可以先离线学习状态转移预测模 型再使用 MPC 计算控制输入 [28-29] ,或直接使用强 化学习方法 [68-69] ,但需要大量训练数据且泛化性较 差。在准静态的局部形变控制中,更常用的方法是 在线估计局部线性模型。该模型假设线状柔性体形 状变化速度与机器人末端运动速度在局部由一个雅 可比矩阵 JJJ 线性地联系起来,即 ˙ xxx ( t ) = JJJ ( t ) ˙ rrr ( t ) ,其 中 ˙ xxx 为柔性体形变速度, ˙ rrr 为机器人末端运动速度。 由于使用高频率的闭环反馈来补偿模型误差,因此 完成任务不需要非常精确的雅可比矩阵。 Berenson 等 [70-71] 提出了刚度衰减( diminishing rigidity )的概 念,即离抓取点越远的位置与抓取点之间呈现越弱 的刚性关系,并据此给出了雅可比矩阵的近似数学 表示。此外,常用的方法是根据实时操作数据在线 估计雅可比矩阵,即基于少量实际操作中实时收集 的局部运动数据 ˙ xxx 和 ˙ rrr ,使用 Broyden 更新规则 [72] 、 梯度下降法 [73] 、(加权)最小二乘法 [33-34,74] 或卡尔 曼滤波 [75] 等方法在线地对雅可比矩阵进行估计。 该模型的线性形式给在线估计提供了便利。然而, 雅可比矩阵的值与柔性体形状相关,因此在操作 过程中具有时变性,这使得在线更新结果具有滞 后性,即利用过往数据更新雅可比矩阵后,柔性体 已经移动至新的形状,而新形状对应的雅可比矩阵 与过往数据可能并不一致。同时,完整估计雅可比 矩阵的全部元素需要机器人在所有自由度上的运 动数据,这在实际操作过程中难以实现,为此一些 工作提出根据数据的奇异值进行选择性更新或加 权更新 [74] 。此外,此类方法需要雅可比矩阵的初 值,一般在操作前控制机器人沿所有自由度依次运 动,收集数据估计初始位置的雅可比矩阵。受上述 问题影响,在线估计方法往往仅适用于局部小形变 的定点控制,难以用于长距离大形变的轨迹跟踪。 Yu 等 [31] 提出 ˙ xxx = JJJ ( xxx , rrr ) ˙ rrr 的模型形式,其中 JJJ ( · ) 为 当前状态至雅可比矩阵的非线性映射,待估计参数 为时不变形式。基于该模型,该方法将离线学习与 在线更新无缝结合,实现了稳定、平滑的大变形控 制。 Yang 等 [76-77] 使用模态分析方法建立柔性体模