使用 JAVA 中的 DEA 测量页面的社交媒体流行度

在上一篇文章中,我们讨论了数据包络分析技术,并了解了如何将其用作有效的非参数排名算法。在这篇博文中,我们将用 JAVA 开发数据包络分析的实现,并使用它来评估社交媒体的流行度 […]

来源:DatumBox - 机器学习、统计和软件开发博客

在上一篇文章中,我们讨论了数据包络分析技术,并了解了如何将其用作有效的非参数排名算法。在这篇博文中,我们将用 JAVA 开发数据包络分析的实现,并使用它来评估网络上网页和文章的社交媒体流行度。代码是开源的(根据 GPL v3 许可),您可以从 Github 免费下载。

数据包络分析 Github

更新:Datumbox 机器学习框架现在是开源的,可以免费下载。查看包 com.datumbox.framework.algorithms.dea 以查看 Java 中数据包络分析的实现。

更新:Datumbox 机器学习框架现在是开源的,可以免费下载。查看 com.datumbox.framework.algorithms.dea 包,了解数据包络分析在 Java 中的实现。 下载

JAVA 中的数据包络分析实现

代码用 JAVA 编写,可直接从 Github 下载。它已获得 GPLv3 许可,因此您可以自由使用、修改和重新分发它。

Github

代码实现了数据包络分析算法,使用 lp_solve 库解决线性规划问题,并使用从 Web SEO Analytics 索引中提取的数据,根据网页在 Facebook、Google Plus 和 Twitter 上的分享情况构建网页的综合社交媒体流行度指标。上一篇文章介绍了算法的所有理论部分,在源代码中,您可以找到有关实现的详细 javadoc 注释。

数据包络分析 lp_solve 库 Web SEO 分析

下面我们提供了实现架构的高级描述:

1. lp_solve 5.5 库

Linux 和 Windows lp_solve 文档 在尝试运行 JAVA 代码之前,请确保您的系统上安装了特定的库。

2. DataEnvelopmentAnalysis 类

3. DeaRecord 对象

DEAzone.com