详细内容或原文请订阅后点击阅览
Yandex 公开了一个新的机器学习库(+视频)
Yandex 开发了一种新的机器学习方法 CatBoost。它允许您有效地在异构数据上训练模型,例如用户位置、交易历史记录和设备类型。 CatBoost 机器学习库是公开可用的,任何人都可以使用。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)Yandex 开发了一种新的机器学习方法 CatBoost。它允许您有效地在异构数据上训练模型,例如用户位置、交易历史记录和设备类型。 CatBoost 机器学习库是公开可用的,任何人都可以使用。
CatBoost 是 Matrixnet 机器学习方法的继承者,几乎所有 Yandex 服务都使用该方法。与 Matrixnet 一样,CatBoost 使用梯度提升机制:它非常适合处理异构数据。但如果 Matrixnet 在数值数据上训练模型,那么 CatBoost 也会考虑非数值数据,例如云的类型或建筑物的类型。以前,此类数据必须转换为数字,这可能会改变其本质并影响模型的准确性。现在它们可以以其原始形式使用。因此,与处理异构数据的类似方法相比,CatBoost 显示出更高的训练质量。它可用于从银行到工业的各种领域。
“Yandex 涉足机器学习领域多年,而 CatBoost 是由该领域最优秀的专家创建的。通过公开 CatBoost 库,我们希望为机器学习的发展做出贡献。”Yandex 机器智能和研究部门负责人 Mikhail Bilenko 说道。 — 我必须说 CatBoost 是第一个开源的俄罗斯机器学习方法。我们希望专家们能够欣赏它并帮助它变得更好。”
要使用 CatBoost,只需将其安装到您的计算机上即可。该库支持 Linux、Windows 和 macOS 操作系统,并提供 Python 和 R 编程语言版本。Yandex 还开发了一个名为 CatBoost Viewer 的可视化程序,可让您监控图形上的学习过程。您可以在 GitHub 上下载 CatBoost 和 CatBoost Viewer。
GitHub