老实说不确定

道德问题,当被问及您对某种信念有多确定时,您是否应该诚实?当然,这取决于。在这篇博客文章中,您将了解什么。一款概率测验游戏David Spiegelhalter的新(截至2025年)出色的书《不确定性的艺术》(The Art of Nefrantistion) - 对于每个处理概率及其交流的人来说,这是必读的[…]诚实不确定的帖子首先出现在数据科学方面。

来源:走向数据科学

道德问题,当被问及您对某种信念有多确定时,您是否应该诚实?当然,这取决于。在这篇博客文章中,您将了解什么。

道德问题,当被问及您对某种信念有多确定时,您是否应该诚实?当然,这取决于。在这篇博客文章中,您将了解什么。 这取决于
    评估概率预测的不同方式具有截然不同的“最佳诚实”程度。也许令人惊讶的是,将+1分配给真实和完全自信的语句的线性函数,为0,以-1允许-1对错误,但完全自信的语句激励夸张的,不诚实的大胆。如果您对这样的预测进行评分,那么您将被自以为是的傻瓜包围,并受到严格校准的机器预报的困扰。如果您希望人(或机器)能够给予他们真正无偏见和诚实的评估,那么您的评分功能应该会惩罚自信,但错误信念比奖励自信的正确的信念。
  • 评估概率预测的不同方式具有“最佳诚实”的截然不同的程度。
  • 也许令人惊讶的是,将+1分配给真实和完全自信的语句的线性函数为0允许无知和-1对错误但充分自信的语句激励夸张,不诚实的大胆。如果您对这样的预测进行评分,那么您将被自以为是的傻瓜所包围,并受到严格校准的机器预测的困扰。
  • 如果您希望人们(或机器)给予他们真正公正和诚实的评估,那么您的评分功能应该对自信但错误的信念进行惩罚,而不是奖励自信的正确的信念。
  • 概率测验游戏

    概率测验游戏 不确定性的艺术 法国地区比西班牙地区大?玛丽·居里(Marie Curie)出生于阿尔伯特·爱因斯坦(Albert Einstein)吗?蒙特利尔的人口比京都大吗? 最佳猜测 p(a) p(a) a a a a q(a) q q 也许是

    线性评分规则

    q(a)= p(a)= 1 q(a)= p(a) a q(a)= p(a)= 0 q(a)= p(a) a a a a a a a