详细内容或原文请订阅后点击阅览
CDAO 推出首个 DOD AI 偏见赏金计划,重点关注法学硕士中的未知风险
国防部首席数字和人工智能办公室启动了两次人工智能偏见赏金演习中的第一次。
来源:美国国防部发行美国国防部 (DoD) 首席数字和人工智能办公室 (CDAO) 启动了两项 AI 偏见赏金演习中的首项。偏见赏金是新的众包努力,旨在帮助检测 AI 系统中的偏见。CDAO 赞助了两项演习:第一项演习今天向公众开放,第二项演习即将推出。
CDAO 负责任 AI (RAI) 部门正在牵头两项 AI 偏见赏金,通过与 ConductorAI-Bugcrowd 和 BiasBounty.AI 合作开发和执行,并由 CDAO 国防数字服务局提供建议。进行这些演习是为了生成算法审计和红队 AI 模型的新方法,促进解决已识别风险的实验,并确保系统在特定部署环境下不带偏见。 “RAI 团队很高兴领导这些 AI 偏见悬赏计划,因为我们坚定地致力于确保国防部的 AI 支持系统及其运行环境是安全、可靠和无偏见的,”国防部 RAI 部门代理负责人 Matthew Johnson 博士表示。
第一个赏金计划的目标就是明确识别大型语言模型 (LLM) 中未知的风险领域,从开源聊天机器人开始,因此这项工作可以支持深思熟虑地缓解和控制此类风险。这项计划鼓励公众参与(无需编码经验)来检测偏见,参与者可以根据国防部资助的 ConductorAI-Bugcrowd 的评分和评估获得金钱奖励。
关于 CDAO