详细内容或原文请订阅后点击阅览
引入 R...和 Python 的商城
我们很自豪地推出 {mall}。借助 {mall},您可以使用本地 LLM 在数据框架中运行 NLP 操作。(情绪、摘要、翻译等)。{mall} 已同时发布到 CRAN 和 PyPi(作为 Polars 的扩展)。
来源:RStudio AI博客开始
几个月前,在参加 Databricks with R 研讨会时,我遇到了他们的一些自定义 SQL 函数。这些特定函数以“ai_”为前缀,它们通过简单的 SQL 调用运行 NLP:
> SELECT ai_analyze_sentiment('I am happy'); positive> SELECT ai_analyze_sentiment('I am sad'); negative
> SELECT ai_analyze_sentiment('I am happy'); positive> SELECT ai_analyze_sentiment('I am sad'); negative
> SELECT ai_analyze_sentiment('I am happy');
>
SELECT
'我很高兴'
积极
> SELECT ai_analyze_sentiment('我很伤心');
>
SELECT
'我很伤心'
消极
这对我来说是一个启示。它展示了一种在我们作为分析师的日常工作中使用 LLM 的新方法。到目前为止,我主要使用 LLM 来完成代码完成和开发任务。然而,这种新方法专注于直接将 LLM 用于我们的数据。
我的第一反应是尝试通过 R 访问自定义函数。使用 dbplyr,我们可以访问 R 中的 SQL 函数,看到它们工作真是太好了:
dbplyrdbplyr
orders |> mutate( sentiment = ai_analyze_sentiment(o_comment) )#> # Source: SQL [6 x 2]#> o_comment sentiment#> #> 1 ", 等待经纬仪 ... 中性 #> 2 " uriously special foxes ... 中性 #> 3 " 睡觉。courtesy after the ... 中性 #> 4 " ess foxes may sleep ... 中性 #> 5 " ts wake blithely unusual ... 混合 #> 6 " hins sleep.蓬松地……中性
订单 |> 突变(情绪 = ai_analyze_sentiment(o_comment))#> # 来源:SQL [6 x 2]#> o_comment 情绪#> #> 1“,待经纬仪……中性#> 2“奇怪的特殊狐狸……中性#> 3“睡觉。法院后……中性#> 4“ess 狐狸可能睡觉……中性#> 5“ts 醒来愉快地不寻常……混合#> 6“hins 睡觉。蓬松地……中性
订单 |>
|>
突变(
突变
情绪 = ai_analyze_sentiment(o_comment)
情绪 =
ai_analyze_sentiment
)
#> # 来源:SQL [6 x 2]
#> # 来源:SQL [6 x 2]
%>%
|>