探索大语模型(LLM)在解决难题中的能力(LLM)宣传对AI中潜在和挑战的洞察力,这标志着将其适用于复杂的重新执行任务迈出的重要一步。这项调查利用了独特的分类法 - 将难题分为基于规则和规则的类别 - 通过各种方法进行了严格的评估LLM,包括提示技术,神经符号符号和微调。通过对相关数据集和基准测试的批判性审查,我们评估了LLMS的性能,并在复杂的难题场景中确定了重大挑战。我们的发现突出了LLM功能和类似人类的推理之间的差异,尤其是在需要先进逻辑推断的推理的情况下。该调查强调了新型策略和更丰富的数据集的必要性,以提高LLMS的拼图解决能力,并有助于AI的逻辑推理和解决问题的问题。
主要关键词