1.我们遵循 OECD 最近修订的“AI 系统”定义 (2023):一种基于机器的系统,出于明确或隐含的目的,从其收到的输入中得出如何生成输出(例如可能影响物理或虚拟环境的预测、内容、建议或决策)。不同的 AI 系统在实施/部署后的自主性和适应性程度各不相同。2.在 RLHF 的情况下,人类反馈被纳入 AI 算法的训练过程,以指导或改进 AI 算法的学习。有人认为这种反馈可能有助于算法以更快、更有效的速度学习。目的通常是利用人类的专业知识来引导 AI 算法朝着特定的期望方向发展。3.生成式人工智能吸引了各种各样的用户,他们的专业知识和目标各不相同。