数据包络分析教程

数据包络分析,也称为 DEA,是一种执行前沿分析的非参数方法。它使用线性规划来估计多个决策单元的效率,通常用于生产、管理和经济。该技术最初由 Charnes、Cooper 和 Rhodes 于 1978 年提出,从那时起它就成为 […]

来源:DatumBox - 机器学习、统计和软件开发博客

数据包络分析,也称为 DEA,是一种执行边界分析的非参数方法。它使用线性规划来估计多个决策单元的效率,并且通常用于生产、管理和经济学。该技术最初由 Charnes、Cooper 和 Rhodes 于 1978 年提出,从那时起它就成为估计生产边界的宝贵工具。

Charnes、Cooper 和 Rhodes 于 1978 年

更新:Datumbox 机器学习框架现已开源并可免费下载。查看包 com.datumbox.framework.algorithms.dea 以查看 Java 中数据包络分析的实现。

更新:Datumbox 机器学习框架现已开源并可免费下载。查看包 com.datumbox.framework.algorithms.dea 以查看 Java 中数据包络分析的实现。 下载

5-6 年前,当我第一次接触该方法时,我惊讶于该算法的独创性、简单性和所用思想的巧妙性。更让我惊讶的是,该技术在其常见应用(金融、运筹学等)之外也发挥了很好的作用,因为它可以成功应用于在线营销、搜索引擎排名和创建综合指标。尽管如此,如今 DEA 几乎完全是在商业背景下讨论的。这就是为什么在本文中,我将介绍 DEA 背后的基本思想和数学框架,并在下一篇文章中向您展示该算法在 Web 应用程序上的一些新应用。

为什么数据包络分析很有趣?

数据包络分析的描述和假设

DEA背后的巧妙思想

DEA选择权重的方式如下:我们通过选择适当的特征权重,试图最大化每条记录的比率;但同时我们必须确保,如果我们使用相同的权重来计算所有其他记录的比率,则它们都不会大于1。