Loading...
机构名称:
¥ 2.0

文献和多位专家指出了大型语言模型(LLM)的许多潜在风险,但对实际危害的直接测量仍然很少。AI风险评估到目前为止一直集中在衡量模型的功能上,但是模型的功能只是风险的指标,而不是衡量风险的指标。更好地建模和量化AI风险方案可以帮助桥接这种断开连接,并将LLM的功能与有形现实世界的危害联系起来。本文通过证明如何使用现有的AI基准来促进风险估计的创建,从而为该领域做出了早期贡献。我们描述了一项试点研究的结果,其中专家使用AI基准Cybench的信息来生成概率估计。我们表明,对于此目的,该方法似乎很有希望,同时指出可以进一步加强其在定量AI风险评估中的应用。

将AI基准数据映射到通过专家启发的定量风险估计

将AI基准数据映射到通过专家启发的定量风险估计PDF文件第1页

将AI基准数据映射到通过专家启发的定量风险估计PDF文件第2页

将AI基准数据映射到通过专家启发的定量风险估计PDF文件第3页

将AI基准数据映射到通过专家启发的定量风险估计PDF文件第4页

将AI基准数据映射到通过专家启发的定量风险估计PDF文件第5页

相关文件推荐