Loading...
机构名称:
¥ 1.0

此图显示了根据众包工作者的模型比较计算出的无害性与有用性 Elo 分数(分数越高越好)。它显示了帕累托改进(即双赢局面),其中宪法 RL 比标准 RLHF 更有帮助,也更无害。

宪法人工智能:人工智能反馈带来的无害性

宪法人工智能:人工智能反馈带来的无害性PDF文件第1页

宪法人工智能:人工智能反馈带来的无害性PDF文件第2页

相关文件推荐

2024 年
¥1.0
2020 年
¥1.0
2020 年
¥1.0
2020 年
¥1.0
2023 年
¥3.0
2024 年
¥4.0
2023 年
¥1.0
2013 年
¥3.0
2024 年
¥1.0
2023 年
¥5.0
2023 年
¥2.0
2020 年
¥9.0
2024 年
¥4.0
2022 年
¥3.0
2021 年
¥6.0
2023 年
¥1.0
2024 年
¥3.0
2024 年
¥1.0
2021 年
¥1.0
2023 年
¥1.0
2020 年
¥3.0
2024 年
¥1.0
2024 年
¥1.0
2023 年
¥11.0