AI 可以编写你的代码吗?

最近关于 ChatGPT、Python、R 和 Stata 的研究告诉我们有关因果推理的 AI 辅助编码的信息The post Can AI Write Your Code?首先出现在《走向数据科学》上。

来源:走向数据科学

不再是AI能否写代码,而是我们是否可以信任它写的代码?

在过去的几年里,ChatGPT 和其他大型语言模型在学生、分析师、研究人员和数据科学家的日常工作流程中变得越来越常见。我们中的许多人已经使用人工智能工具来生成 Python 函数、调试错误消息、自动执行重复任务或快速将代码从一种语言翻译为另一种语言。

但是要求 ChatGPT 编写一个小辅助函数和要求它实现一个复杂的计量经济学方法之间存在重大区别。

ChatGPT 能否正确编码双重差分模型?能否实现逆概率处理加权?它可以重现回归不连续性分析吗?不仅在Python中可以做到这一点,而且在R和Stata中也可以做到这一点吗?

这就是 Winberg 等人发表文章“AI 可以写你的代码吗?ChatGPT 用于定量研究的统计编码能力的案例研究”的原因。立即引起了我的注意。该论文于 2026 年 1 月 22 日在线发表在《健康经济学评论》上。作者使用来自 Scott Cunningham 的《Causal Inference: The Mixtape》的基准解决方案,评估了 ChatGPT-4.0 Pro 在 Python、R 和 Stata 中生成因果推理任务代码的能力。

我之前读过的有关该主题的大多数文章都集中在相对简单的编程任务:小型自动化、描述性统计、数据清理、基本数据分析或使用 Python、R 和 SAS 等语言生成代码。这项研究更进一步。它询问 ChatGPT 是否可以支持要求更高的环境中的定量研究,其中代码不仅是技术性的,而且是方法性的。

作者重点介绍了三种广泛使用的因果推理方法:

  • 差分中的差分,也称为 Diff-in-Diff;
  • 逆概率处理加权,或 IPTW;
  • 不连续性回归,或 RD。
  • 这项研究有何不同?

    另一个重要贡献是该研究包含了 Stata。

    研究发现了什么?