Loading...
机构名称:
¥ 10.0

近年来,大型语言模型的能力大大提高,因此提高我们对其产出的控制能力非常重要。在本论文中,我讨论了我制定的几种此类控制方案,从纯推理时间控制到基于填充的对准方法。i将首先讨论适用于非结构化自然语言生成的高度通用方法,包括称为Fudge [164]的推理时间控制方案以及基于加强学习的基于加强学习的鉴定AP-称为RLCD [169]。i接下来将讨论可以在更结构化的域(例如分子设计,程序合成和语义解析)中用于控制的更多专业方法[167,163]。最后,我将通过提示将我们的控制扩展到更长的输出(在数千个单词的范围内)在自动故事生成应用程序中,通过提示将我们的控制扩展到更长的输出[168,166]。

控制长格式大语模型输出

控制长格式大语模型输出PDF文件第1页

控制长格式大语模型输出PDF文件第2页

控制长格式大语模型输出PDF文件第3页

控制长格式大语模型输出PDF文件第4页

控制长格式大语模型输出PDF文件第5页

相关文件推荐

2023 年
¥1.0