摘要:目的:本文提出的研究的目的是评估LLM模型了解法律的语言和法律推理的能力。税法的选择是由其应用的普遍性(易于访问的大型测试语料库)决定的,事实是,在欧盟成员国(例如波兰)的情况下,该法律是部分协调的。这些情况使减少法律应用LLM的指示障碍之一(法律的多语言和多元文化性质)。该研究使用了OpenAI的最新GPT O1-预览模型。该模型的首映式于12.09.2024举行。这是一种具有通用而不是专业性质的多语言模型,将明确培训用于税法的使用。设计/方法论/方法:研究使用了一种实验方法,其中选定的GPT模型模拟了税法专家的响应。该研究使用了OpenAI:GPT -4(可用14.03.2023)和GPT O1 -Preview(可用12.09.2024)的两种GPT模型。所使用的方法是图灵测试概念(Turing,1950)的扩展,其中AI模型旨在通过评估逻辑上思考,创造性并理解背景的能力来模仿人类的交流。进行了四个研究实验。第一个实验评估了LLM对法律语言的理解,第二和第三实验评估了LLM对法律语言的理解,第四次评估了LLM的法律推理技能。实际含义:研究结果具有重大的实际含义。调查结果:有关LLM模型的进行的研究结果允许为波兰税法制定以下结论:1)GPT模型的理解质量和法律推理的质量是,这些模型有助于支持专业税务顾问的工作; 2)GPT O1-预览模型提供的法律建议的准确性太低,无法使用该模型自行提供法律建议; 3)GPT O1-预览模型可以预测具有很高可能性的给定事实情况的NRAIC的位置; 4)GPT O1-预览模型具有专业律师级别的法律推理技能,除了能够分析法院裁决和PTR的能力; 5)对于法院的判决和PTR分析,进行的研究产生了坚实的幻觉作用,该研究影响了50%的分析案件。; 6)LLM的理解和推理的质量受到训练集的规模以及所提出的领域特定问题的数量的显着影响。他们指示GPT模型对税务律师的适用性,并确定其实际应用的主要障碍。本文还显示了如何提高模型的准确性
主要关键词