检验的关键词检索结果

计量经济学 — 网下打网球

Econometrics — playing tennis with the nets down

在讨论计量经济学及其缺点时,你确实经常得到计量经济学家的回应:“好吧,也许计量经济学并不完美,但你必须承认它是对经济假设进行实证检验的一项伟大技术。”但计量经济学真的是一个很好的测试工具吗?计量经济学应该能够检验经济理论。但是[...]

识别法学硕士的大规模互动

Identifying Interactions at Scale for LLMs

了解复杂机器学习系统的行为,特别是大型语言模型 (LLM),是现代人工智能的一项关键挑战。可解释性研究旨在使决策过程对模型构建者和受影响的人类更加透明,这是迈向更安全、更值得信赖的人工智能的一步。为了获得全面的理解,我们可以通过不同的视角来分析这些系统:特征归因,它隔离驱动预测的特定输入特征(Lundberg & Lee,2017;Ribeiro et al.,2022);数据归因,将模型行为与有影响力的训练示例联系起来(Koh&Liang,2017;Ilyas 等人,2022);以及机械可解释性,它剖析了内部组件的功能(Conmy 等人,2023;Sharkey 等人,2025)。在这些观点