引入 R...和 ​​Python 的商城

我们很自豪地推出 {mall}。借助 {mall},您可以使用本地 LLM 在数据框架中运行 NLP 操作。(情绪、摘要、翻译等)。{mall} 已同时发布到 CRAN 和 PyPi(作为 Polars 的扩展)。

来源:RStudio AI博客

开始

几个月前,在参加 Databricks with R 研讨会时,我遇到了他们的一些自定义 SQL 函数。这些特定函数以“ai_”为前缀,它们通过简单的 SQL 调用运行 NLP:

> SELECT ai_analyze_sentiment('I am happy'); positive> SELECT ai_analyze_sentiment('I am sad'); negative
> SELECT ai_analyze_sentiment('I am happy'); positive> SELECT ai_analyze_sentiment('I am sad'); negative > SELECT ai_analyze_sentiment('I am happy'); > SELECT '我很高兴' 积极 > SELECT ai_analyze_sentiment('我很伤心'); > SELECT '我很伤心' 消极

这对我来说是一个启示。它展示了一种在我们作为分析师的日常工作中使用 LLM 的新方法。到目前为止,我主要使用 LLM 来完成代码完成和开发任务。然而,这种新方法专注于直接将 LLM 用于我们的数据。

我的第一反应是尝试通过 R 访问自定义函数。使用 dbplyr,我们可以访问 R 中的 SQL 函数,看到它们工作真是太好了:

dbplyr dbplyr
orders |> mutate( sentiment = ai_analyze_sentiment(o_comment) )#> # Source: SQL [6 x 2]#> o_comment sentiment#>   #> 1 ", 等待经纬仪 ... 中性 #> 2 " uriously special foxes ... 中性 #> 3 " 睡觉。courtesy after the ... 中性 #> 4 " ess foxes may sleep ... 中性 #> 5 " ts wake blithely unusual ... 混合 #> 6 " hins sleep.蓬松地……中性
订单 |> 突变(情绪 = ai_analyze_sentiment(o_comment))#> # 来源:SQL [6 x 2]#> o_comment 情绪#> #> 1“,待经纬仪……中性#> 2“奇怪的特殊狐狸……中性#> 3“睡觉。法院后……中性#> 4“ess 狐狸可能睡觉……中性#> 5“ts 醒来愉快地不寻常……混合#> 6“hins 睡觉。蓬松地……中性 订单 |> |> 突变( 突变 情绪 = ai_analyze_sentiment(o_comment) 情绪 = ai_analyze_sentiment ) #> # 来源:SQL [6 x 2] #> # 来源:SQL [6 x 2] %>% |>