torch、tidymodels 和高能物理

今天我们介绍 tabnet,这是“TabNet:专注可解释表格学习”的 torch 实现,与 tidymodels 框架完全集成。从本质上讲,tabnet 的设计只需要很少的数据预处理;多亏了 tidymodels,超参数调整(在深度学习中通常很麻烦)变得方便甚至有趣!

来源:RStudio AI博客

那么点击诱饵(高能物理)是怎么回事?好吧,这不仅仅是点击诱饵。为了展示 TabNet,我们将使用 UCI 机器学习存储库中提供的 Higgs 数据集(Baldi、Sadowski 和 Whiteson (2014))。我不知道你是怎么想的,但我总是喜欢使用能激励我学习更多事物的数据集。但首先,让我们熟悉一下这篇文章的主要角色!

高能物理 希格斯 Baldi、Sadowski 和 Whiteson (2014) Baldi、Sadowski 和 Whiteson 2014

TabNet

TabNet 是在 Arik 和 Pfister (2020) 中引入的。它之所以有趣有三个原因:

Arik 和 Pfister (2020) Arik 和 Pfister 2020
    它声称在表格数据上具有高度竞争力的表现,而深度学习在这个领域还没有获得太多的声誉。TabNet 在设计上包含可解释性功能。据称它可以从自我监督的预训练中获益匪浅,同样在这个领域,这一点也不值得一提。
  • 它声称在表格数据上具有高度竞争力的表现,而深度学习在这个领域还没有获得太多的声誉。
  • TabNet 在设计上包含可解释性功能。

  • TabNet 在设计上包含可解释性功能。
  • 据称,它从自我监督预训练中获得了显著的收益,同样,在这个领域,这一点也值得一提。

  • 据称,它从自我监督预训练中获得了显著的收益,同样,在这个领域,这一点也值得一提。
  • 在这篇文章中,我们不会深入讨论 (3),但我们会扩展 (2),即 TabNet 允许访问其内部工作原理的方式。

    我们如何从 R 使用 TabNet?torch 生态系统包括一个包 - tabnet - 它不仅实现了同名的模型,还允许您将其用作 tidymodels 工作流程的一部分。

    torch

    tabnet tidymodels tidymodels

    tidymodels

    tidymodels tabnet torch tidymodels 将 tabnet 与 tidymodels 结合使用

    tabnet

    <-