偏好对人对齐的优化优化___XiaoMi-AI 助力科研平台

偏好对人对齐的优化优化

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

偏好对人对齐的优化优化

¥ 1.0

热度

大型语言模型（LLMS）通常包含误导性内容，强调需要使它们与人类价值观保持一致以确保安全的AI系统。从人类反馈（RLHF）中学习的强化已被用来实现这一路线。然而，它包括两个主要的抽签：（1）RLHF表现出与SFT相反的对超参数的复杂性，不稳定和对超参数的现象。（2）尽管进行了大规模的反复试验，但多次抽样却降低为配对的对比度，因此缺乏宏观角度的对比度。在本文中，我们提出优先排名优化（PRO）作为有效的SFT算法，以直接对人类对齐进行微调。pro扩展了逐对的骗局，以适应任何长度的偏好排名。通过迭代对比候选人，Pro指示LLM优先考虑最佳响应，同时逐步对其余响应进行排名。以这种方式，Pro有效地将Human对齐方式转换为LLM产生的N重点的概率排名与Humans对这些响应的偏好排名。实验表明，Pro的表现优于基线算法，通过基于自动的，基于奖励的GPT-4和人类评估，与CHATGPT和人类反应取得了可比的结果。

添加pdf代下载 VIP点击下载文件

偏好对人对齐的优化优化

主要关键词

安全的自动的表现大规模响应相反的参数的不稳定复杂性重点的 Pro 进行反复试验方式配对的对比度参数排名确保安全对齐大规模的 LLM 优先算法角度的学习的抽样人类候选人强化价值观 RLHF 主要的有效的响应的 SFT

偏好对人对齐的优化优化PDF文件第1页

偏好对人对齐的优化优化PDF文件第2页

偏好对人对齐的优化优化PDF文件第3页

偏好对人对齐的优化优化PDF文件第4页

偏好对人对齐的优化优化PDF文件第5页

可下载资源数量

已经购买

下载数量：1

偏好对人对齐的优化优化

偏好对人对齐的优化优化

相关文件推荐

优化

优化

优化高

优化

停车优化

优化由...

优化储能：

通过二元优化镜头

碳足迹优化

优化简介

优化Aceh

操作优化

优化...

优化|安全

优化...

优化QuickieIris®

电网优化

竞价优化软件

“AI+R”树：实例优化的 R 树

优化的Vesta充电器

基于AI的太阳能优化

投资组合优化

C3 AI采购优化

关于我们的燃料资产优化

我们的使命是优化您的物流

网络安全平台优化

高级优化讲义。

优化和不确定性分析

优化儿童和...

采购和供应链优化

XiaoMi-AI