新方法提高了统计估计的可靠性

该技术可以帮助经济学、公共卫生和其他领域的科学家了解是否值得信任他们的实验结果。

来源:MIT新闻 - 人工智能

假设一位环境科学家正在研究暴露于空气污染是否与特定县的低出生体重有关。

他们可能会训练机器学习模型来估计这种关联的程度,因为机器学习方法特别擅长学习复杂的关系。

标准机器学习方法擅长进行预测,有时会为这些预测提供不确定性,例如置信区间。然而,在确定两个变量是否相关时,它们通常不提供估计值或置信区间。已经专门开发了其他方法来解决此关联问题并提供置信区间。但是,在空间环境中,麻省理工学院的研究人员发现这些置信区间可能完全不符合标准。

当空气污染水平或降水量等变量在不同地点发生变化时,生成置信区间的常用方法可能会声称具有高置信度,而事实上,估计完全无法捕获实际值。这些错误的置信区间可能会误导用户相信失败的模型。

在发现这一缺陷后,研究人员开发了一种新方法,旨在为涉及跨空间数据的问题生成有效的置信区间。在使用真实数据进行的模拟和实验中,他们的方法是唯一能够始终生成准确置信区间的技术。

这项工作可以帮助环境科学、经济学和流行病学等领域的研究人员更好地了解何时信任某些实验的结果。

Broderick 与共同主要作者 David R. Burt(博士后)和 Renato Berlinghieri(EECS 研究生)共同撰写了该论文; Stephen Bates 是 EECS 助理教授和 LIDS 成员。该研究最近在神经信息处理系统会议上发表。

无效假设

顺利的解决方案