计算机证明助手(如 Agda、Coq、HOL Light、Isabelle、Lean 等)是一种软件程序,可检查这些逻辑语言中数学论证的正确性,并可提供自动化功能来帮助构建此类论证。9 除了人工智能的发展之外,研究人员在过去几十年中一直致力于使此类计算机证明助手更加强大和用户友好,数学家也越来越多地采用它们来正式验证他们自己领域的工作。大型语言模型 (LLM) 可以开发用对话语言编写的文本,也可以开发用编程语言编写的文本,尤其是用计算机证明助手的逻辑语言编写的文本。一个可行的流程是,LLM 可以通过结合证明助手提供的逐行正确性的反馈来迭代开发此类证明。