详细内容或原文请订阅后点击阅览
我们应该使用LLM,就好像它们是瑞士刀吗?
流行的LLM和定制算法之间的逻辑游戏性能比较我们是否应该使用LLM,就好像它们是瑞士刀一样吗?首先出现在数据科学上。
来源:走向数据科学左右,不可能否认炒作水平的提高,尤其是随着生成的AI和代理AI的兴起。作为一名在咨询公司工作的数据科学家,我注意到有关如何利用这些新技术来使流程更有效或自动化的询问的数量大幅增长。尽管这种兴趣可能会使美国的数据科学家倾斜,但有时人们似乎会从AI模型中期望魔术,仿佛他们可以解决所有问题,而只不过是提示。另一方面,尽管我个人认为生成和代理AI已经改变(并将继续改变)我们的工作和生活方式,当我们进行业务过程修改时,我们必须考虑其局限性和挑战,并看到它被证明是一个好工具(例如,我们不会使用叉子来切割食物)。
我是一个书呆子,并且了解LLM的工作原理,所以我想在逻辑游戏中测试他们的性能,例如西班牙语版本的Wordle对我几个小时前建造的逻辑(可以在此处找到更多详细信息)。具体来说,我有以下问题:
Wordle 在这里- 我的算法会比LLM模型好吗?LLM模型中的推理能力将如何影响其性能?
构建基于LLM的解决方案
为了通过LLM模型获得解决方案,我构建了三个主要提示。第一个是针对性的:
让我们假设我在玩Wordle,但用西班牙语。这是一个游戏,您必须在6次尝试中猜出一个5个字母的单词,只有5个字母。另外,可以在最后一个单词中重复一封信。
但是,如果您将一个字母两次放置,一个字母出现绿色,另一个是黄色的,则意味着字母出现两次:一次是绿色位置,一次是另一个不是黄色的位置。
“披萨” “面板” “ p” “ a” “ n” “ e” “ L” 披萨 面板