近年来,大型语言模型的能力大大提高,因此提高我们对其产出的控制能力非常重要。在本论文中,我讨论了我制定的几种此类控制方案,从纯推理时间控制到基于填充的对准方法。i将首先讨论适用于非结构化自然语言生成的高度通用方法,包括称为Fudge [164]的推理时间控制方案以及基于加强学习的基于加强学习的鉴定AP-称为RLCD [169]。i接下来将讨论可以在更结构化的域(例如分子设计,程序合成和语义解析)中用于控制的更多专业方法[167,163]。最后,我将通过提示将我们的控制扩展到更长的输出(在数千个单词的范围内)在自动故事生成应用程序中,通过提示将我们的控制扩展到更长的输出[168,166]。