详细内容或原文请订阅后点击阅览
用 Java 编写的新型开源机器学习框架
我很高兴地宣布,Datumbox 机器学习框架现在在 GPL 3.0 下开源,您可以从 Github 下载其代码!这个框架是什么? Datumbox 机器学习框架是一个用 Java 编写的开源框架,可以快速开发机器学习模型和统计应用程序。它 […]
来源:DatumBox - 机器学习、统计和软件开发博客我很高兴地宣布,Datumbox 机器学习框架现在在 GPL 3.0 下开源,您可以从 Github 下载其代码!
Github这是什么框架?
Datumbox 机器学习框架是一个用 Java 编写的开源框架,可以快速开发机器学习模型和统计应用程序。它是当前支持 Datumbox API 的代码。该框架的主要重点是包含大量机器学习算法和统计方法,并能够处理中小型数据集。尽管该框架旨在协助开发各个领域的模型,但它也提供了在自然语言处理和文本分析应用程序中特别有用的工具。
Datumbox 机器学习框架支持哪些类型的模型/算法?
该框架分为几个层,例如机器学习、统计、数学、算法和实用程序。每个层都提供了一系列用于训练机器学习模型的类。两个最重要的层是统计层和机器学习层。
统计层提供用于计算描述性统计数据、执行各种类型的抽样、从常用概率分布估计 CDF 和 PDF 以及执行超过 35 个参数和非参数测试的类。在执行解释性数据分析、抽样和特征选择时,此类类通常是必需的。
Datumbox 框架 VS Mahout VS Scikit-Learn
它有多稳定?
我为什么要写它以及为什么要开源它?
现在,几行代码之后,我开源了这个项目。为什么?诚实的回答是,目前,我还没有计划踏上“让我们建立一个新的创业公司”的征程。同时,我觉得将代码保存在硬盘上以备将来需要是没有意义的。所以唯一合乎逻辑的做法就是将其开源。🙂
MapDB rd :