给定分布关键词检索结果

证明自己正确性的模型

Models That Prove Their Own Correctness

我们如何才能相信学习模型对特定感兴趣输入的正确性?模型精度通常是根据输入分布的平均值来衡量的,不保证任何固定输入。本文针对这个问题提出了一个有理论基础的解决方案:训练自我证明模型,通过交互式证明向验证算法 V 证明其输出的正确性。自证明模型满足以下条件:对于从给定分布采样的输入,模型以高概率生成正确的输出并成功证明其对 V 的正确性。...