Loading...
机构名称:
¥ 3.0

红色团队者根据他们根据自己的专业知识和判断力如何看待其安全性,对三代人进行了评分。他们用他们认为会导致有害输出的提示来查询模型。他们的对话跨越类别,例如网络应用的查询(13.8%),生物恐怖主义(14.2%),武器创造(8.5%),攻击计划(4.1%),网络钓鱼 /骗子(4.6%),违法行为(8.9%),促进了非法行为(8.9%),辩解或仇恨(5.9%)和其他(5%),以及(2.5%),2。5%(2.5%),2。5%(2.5%),2。5%。在计算中只包括至少产生一个不安全产生的对话。这使我们能够在执行开放式红色小组的同时测试O3-Mini的先验模型的安全基线。此外,这使我们能够更轻松地解析并评估提示,而在某些情况下,O3-Mini安全性可能比先前模型的安全性差。

OpenAI O3-Mini系统卡

OpenAI O3-Mini系统卡PDF文件第1页

OpenAI O3-Mini系统卡PDF文件第2页

OpenAI O3-Mini系统卡PDF文件第3页

OpenAI O3-Mini系统卡PDF文件第4页

OpenAI O3-Mini系统卡PDF文件第5页

相关文件推荐

2025 年
¥1.0
2024 年
¥3.0
2025 年
¥1.0
2023 年
¥6.0
2024 年
¥1.0
2004 年
¥7.0
2024 年
¥1.0