控制语言模型生成的文本并定制内容一直是一个长期存在的挑战。现有的为提供控制而提出的提示技术都是针对特定任务的,缺乏通用性;这为非专家用户提供了太多选择,无法找到适合其任务的方法。与这些技术相关的工作(例如编写示例、解释、说明等)进一步限制了非专家用户的采用。在本文中,我们提出了一种简单的提示策略 H ELP ME T HINK,我们鼓励大型语言模型(如 GPT3 和 ChatGPT)通过提出一系列相关问题并利用用户答案来执行任务来帮助非专家用户。我们在各种任务上证明了我们的技术 H ELP ME T HINK 的有效性。具体来说,我们专注于那些对普通人来说很难、需要大量思考才能完成的任务。我们希望我们的工作能够鼓励开发非常规方法来利用大型语言模型的强大功能。
基于调整的迅速研究,由于其效率和有希望的能力,近年来引起了人们的关注。只需几个样本即可实现自然语言处理(NLP)任务的最佳性能,至关重要的是要包含尽可能多的信息样本并避免误导性的样本。但是,在迅速调整文献方面没有工作解决了与模型培训中错误样本不同的硬性样本的问题,这是由于缺乏有关样品质量来培训训练良好模型的质量的监督信号所致。我们提出了一个名为“硬性样本意识到及时调查”(硬)的框架,以通过重新学习在硬样品识别中解决非差异的概率,并通过适应性对比学习方法加强了特征空间的折衷,而无需更改原始数据分布。对一系列NLP任务的广泛研究,在几次射击场景中表现出了硬化的能力。HardPT obtains new state-of-the-art results on all evaluated NLP tasks, including pushing the SST-5 accuracy to 49.5% (1.1% point absolute improvement), QNLI accuracy to 74.6% (1.9% absolute improvement), NMLI accuracy to 71.5 (0.7% absolute improvement), TACREV F 1 -score to 28.2 (1.0 absolute im- provement), and I2B2/VA F 1-分为41.2(1.3绝对改进)。
大型语言模型 (LLM) 最近已被证明在各种 NLP 任务中表现出色。为了解决多步骤推理任务,少样本思维链 (CoT) 提示包括一些手工制作的分步推理演示,使 LLM 能够明确生成推理步骤并提高其推理任务准确性。为了消除人工工作,零样本思维链 (CoT) 将目标问题陈述与“让我们一步一步思考”连接起来作为 LLM 的输入提示。尽管零样本思维链 (CoT) 取得了成功,但它仍然存在三个缺陷:计算错误、缺步错误和语义误解错误。为了解决缺步错误,我们提出了计划和解决 (PS) 提示。它由两个部分组成:首先,制定计划将整个任务分成更小的子任务,然后根据计划执行子任务。为了解决计算错误并提高生成的推理步骤的质量,我们扩展了 PS 提示,增加了更详细的说明,并衍生出 PS+ 提示。我们在三个推理问题的十个数据集上评估了我们提出的提示策略。在 GPT-3 上的实验结果表明,我们提出的零样本提示在所有数据集上的表现始终远超零样本 CoT,与零样本思维程序提示相当或超过零样本思维程序提示,并且在数学推理问题上具有与 8 样本 CoT 提示相当的性能。代码可以在 https://github.com/AGI-Edgerunners/Plan-and-Solve-Prompting 找到。
人工智能工具融入学术工作,给学生和教授提出了重要的问题。学生应该如何使用这些工具?教授应该如何应对这些工具的出现?可以实施哪些政策,以在保持学术诚信的同时充分利用颠覆性技术?为了探讨这些问题,我们最近与 ESCP 商学院柏林校区的学生组织了一场名为 Prompt-o-thon 的活动。该活动展示了人工智能的潜力,并讨论了其在学术工作中的应用。讨论包括在学术工作中使用法学硕士和其他人工智能工具的好处和挑战,以及探索确保合乎道德和负责任地使用法学硕士的潜在政策。鉴于这些工具的不断发展,大学将需要调整其教学和评估方法,以跟上学术工作不断变化的形势。
思路链提示等策略通过将输入示例分解为中间步骤来提高大型语言模型 (LLM) 在复杂推理任务上的性能。然而,如何将这些方法应用于长输入文档的推理仍不清楚,因为获得每个中间步骤的分解和输出都不容易。在这项工作中,我们提出了 P EARL,一个用于改进长文档推理的提示框架,它包括三个阶段:动作挖掘、计划制定和计划执行。更具体地说,给定一个关于长文档的问题,P EARL 将问题分解为一系列动作(例如,SUMMARIZE、FIND_EVENT、FIND_RELATION),然后在文档上执行这些动作以获得答案。P EARL 的每个阶段都是通过零样本或少样本提示 LLM(在我们的工作中为 GPT-4)来实现的,需要最少的人工输入。我们在 QuALITY 数据集的一个具有挑战性的子集上评估了 P EARL,其中包含需要对长篇叙述文本进行复杂推理的问题。P EARL 在这个数据集上的表现优于零样本和思维链提示,消融实验表明 P EARL 的每个阶段对其性能都至关重要。总的来说,P EARL 是利用 LLM 推理长文档的第一步。1
摘要:航运业在对脱碳挑战的认识和意识方面已经达到了更高的成熟度。无碳或碳中和的绿色燃料,如绿色氢、绿色氨和绿色甲醇,正在被广泛讨论。然而,很少有人关注从可再生能源到航运的绿色燃料途径。因此,本文回顾了绿色能源(绿色氢、绿色氨和绿色甲醇)的生产方法,并分析了绿色燃料在航运中的应用潜力。综述表明,航运业生产绿色氢、绿色氨和绿色甲醇的潜在方法是(1)利用绿色能源通过海水电解生产氢气;(2)利用绿色氢+哈伯-博施法生产氨;(3)利用绿色能源从二氧化碳生产甲醇。虽然绿色燃料的前景光明,但短期内,其成本预计会高于传统燃料。因此,我们的建议如下:改进绿色能源生产技术以降低生产成本;开发电化学燃料生产技术以提高绿色燃料生产的效率;探索新技术。加强可再生能源和绿色燃油生产技术的研发,扩大燃油生产能力,确保低排放、零排放船用燃油的充足供应,是实现航运减碳的重要因素。
图像描述提示是艺术家与 AI 艺术系统“对话”的方式,编写好的提示是创作 AI 图像的关键技能。提示可以简单到“一只快乐的狗”,也可以复杂到“一只非常可爱的毛茸茸的狗,带着喜悦和希望的表情,具有蒸汽朋克风格,就像塞尚的画作一样,照片般逼真且细节丰富”。以下是一些要组合的示例术语。
摘要:风险管理和安全是经常被提及的主导话题,尤其是在这个时期。安全管理系统 (SMS) 基于风险管理,航空运输以及其他运输方式都需要实施风险管理。事实上,乘客和工作人员的安全是每家航空公司的首要任务,这些人会面临一些常见的风险。风险识别对于成功的风险管理至关重要,因为只有识别出的风险才能得到管理。根据对已发布的框架和标准的研究,设计了一种风险识别方法,使用了一份按逻辑顺序排列的风险清单,这些风险与典型的航空活动以及该方法所处的特定环境有关。提示列表是根据背景分析编制的,该分析侧重于内部和外部背景,并以此为基础确定提示列表的结构,以便可以根据各种标准将风险从列表转移到风险登记册,以便进一步处理。该清单包含来自多个领域(经济、生态、社会、个人、商业、营销等)的风险。提示列表本身的设计还包括对其编制、使用和更新方法的提议。
摘要:肥胖和手机使用同时在全球蔓延。手机发射的射频调制电磁场 (RF-EMF) 大部分被使用者的头部吸收,影响大脑葡萄糖代谢,并调节神经元兴奋性。反过来,体重调节是大脑的主要功能之一,因为食物摄入行为和食欲感知是下丘脑调节的基础。在此背景下,我们质疑手机辐射和食物摄入量是否相关。在一项单盲、假对照、随机交叉比较中,15 名体重正常的年轻男性 (23.47 ± 0.68 岁) 在禁食条件下暴露于两种不同类型的手机发射的 RF-EMF 和假辐射 25 分钟。通过随意标准自助餐测试评估自发食物摄入量,并通过 31 次磷磁共振波谱测量监测大脑能量稳态。与假暴露相比,暴露于两部手机的受试者总热量摄入量显著增加了 22-27%。对常量营养素摄入的差异分析显示,热量摄入增加主要是由于碳水化合物摄入增加。脑能量含量的测量结果(即三磷酸腺苷和磷酸肌酸与无机磷酸盐的比率)显示,手机辐射会增加。我们的研究结果表明,射频电磁场是导致暴饮暴食的潜在因素,而暴饮暴食是肥胖流行的根源。除此之外,观察到的射频电磁场引起的脑能量稳态改变可能将我们的数据放在更广泛的背景下,因为平衡的脑能量稳态对所有脑功能都至关重要。因此,电磁场的潜在干扰可能会产生一些目前尚不可预见的普遍神经生物学效应。
虽然在线视频学习已成为各种学习者广泛采用的方法,但大多数在线视频学习环境为所有学习者提供的都是相同的讲座视频。在千篇一律的设计中,由于学习者先前的知识不同,他们可能会对讲座内容的不同部分感到困难。找到另一个能更好地解释学习者困难点的视频可能是一个解决方案,但这需要学习者搜索这样的视频,从而产生额外的努力。此外,由于学习者是新手,他们可能没有足够的知识来辨别哪个视频可以帮助他们克服困难。缓解学习者因千篇一律的视频设计而产生的各种痛点的一种方法是利用不同的支架提示,这些提示提供提示并向学习者询问学习内容。例如,如果视频对某个概念的解释对学习者来说不够详细,那么学习者就会很难理解内容。有了多样化的提示,如果学习者向在线学习系统寻求有关概念的帮助,那么系统可以提供合适的支架提示,让学习者有机会促进他们对该概念的理解。提示可以让学习者检查他们的理解,保持他们的参与度,并让他们将该概念与他们已经知道的其他概念联系起来[11,12]。最终,对概念的理解将拓宽学习者组织和感知新信息的方案,让学习者全面理解讲座。为了成功提供这种支持,必须准备各种各样的支架提示来应对学习者的各种痛点。然而,由于创作成本高昂,手动创建多样化的支架提示可能是不切实际的,如果没有这种多样性,提示往往无法全面解决讲座中涉及的各种概念。在这项工作中,我们介绍了 Promptiverse,这是一种支架提示生成方法,它使用知识图谱以较低的创作成本大规模创建多样化的提示。 Promptiverse 借助讲座内容的知识图谱,遍历知识实体和关系,同时考虑 Ausubel 理论 [ 4, 6 ] 中有意义的学习模式,这为设计有效的教学提示提供了深刻见解。Promptiverse 不仅从遍历的路径中生成大量提示,而且还通过改变哪些知识元素作为提示提供以及哪些知识元素从学习者那里引出,使提示的内容多样化。例如,在图 1 中,Promptiverse 通过改变遍历的路径生成了两个不同的支架提示(绿色框)。这些不同内容的提示可以为那些可能无法理解视频解释的学习者提供不同的解释。尽管 Promptiverse 有望实现提示的可扩展创建,但构建底层知识图谱需要课程设计人员的手动操作。因此,我们设计了 Grannotate,一款人机混合系统,用于协助课程设计人员